Professional Documents
Culture Documents
5.olasilik Ve Olasilik Dağilimlari
5.olasilik Ve Olasilik Dağilimlari
DEĞİŞKEN VE OLASILIK
5 DAĞILIMLARI
Bernoulli’ye göre olasılık, gelecekteki bir olay hakkındaki beklentinin kuvvetinin bir
ölçüsüdür. Keynes ise olasılığın olaylarla ilgili değil, düşüncelerle tanımlanmasının doğru
olacağını savunmuştur (Parzen, 1960). Fakat olasılığın tam olarak anlamı nedir? Daima
kullanılabilecek temel bir tanımı var mıdır? Maalesef bu sorular kolay bir şekilde
cevaplanamamaktadır. Olasılık kavramı hakkında 3 temel yaklaşım mevcuttur:
P A
f
n
Nispi frekansın olasılığın kendisi değil de, olasılığa bir yaklaşım olduğu
unutulmamalıdır. Bu yaklaşımın geçerli olması deneme sayısının yeteri kadar fazla olmasına
bağlıdır. Zira deneme sayısı artırıldıkça nispi frekans yaklaşımıyla bulunan olasılık, gerçek
olasılığa yaklaşmaktadır. İstatistikte bu “çok fazla sayıda deneme yasası” olarak
bilinmektedir. Ayrıca, denemelerin her birinin bağımsız olması gerekmektedir. Yani bir
denemenin sonucu diğerini etkilememelidir.
Örnek:
Bir otomobil fabrikasından tesadüfi olarak seçilmiş 500 otomobilden 10 tanesi imalat
hatalıdır. İmalat hatası olan otomobillerin tesadüfi olarak üretildiğini varsayarsak, bundan
sonra üretilecek ilk otomobilin imalat hatalı olma ihtimali kaçtır?
Çözüm:
n = 500 ve f = 10
PİH
10
0.02
500
Çözüm:
Bu olayın muhtemel iki sonucu vardır; (i) ev sahibi olanlar, (ii) ev sahibi olmayanlar.
Burada her iki sonucun meydana gelme olasılığı eşit değildir. Zira Samsun’da yaşayanların
yarısı ev sahibi, yarısı da değildir diyemeyiz. Bunun için “klasik olasılık yaklaşımı”
kullanılamaz. Nispi frekans yaklaşımı bu durumda daha uygundur.
n=1000
f=670 (ev sahibi olanlar)
PESO
670
0.67
1000
Yani, Samsun’da incelenen 1000 kişiden alınan verilere göre ev sahibi olma olasılığı 0.67’dir.
Subjektif olasılık yaklaşımı: Bu yaklaşıma göre olasılığın temeli “sezgiler” dir. Objektif
yaklaşımlar olan “klasik ve nispi frekans” yaklaşımlarında geçerli olan sınırlamalar bu
yaklaşımda gereksiz bulunmaktadır. Bu görüşü savunanlar doktorun “tekrar düzelme olasılığı
%80’dir” veya uzmanın “ilk teklif ikincisine göre daha kabul edilebilir” şeklindeki
cümlelerinde yer alan sezgilerin doğal olasılık olarak kullanılabileceğini savunmuşlardır.
Gerçek hayatta benzer olaylar tekerrür sayısı gibi modellenemeyen birçok problem
vardır. Subjektif olasılık 0 ile 1 arasında değişmekte olup, belirsiz olayın sonucu hakkında
bireysel inanç derecelerini yansıtmaktadır. “0” gerçekleşmesi mümkün olmayan bir olayı, “1”
ise kesin inançları ifade etmektedir. Objektif yaklaşımları savunanlar olasılıkları fiziksel
işlemlerin karakteristikleri gibi tahmin ederken, subjektif olasılık yaklaşımını savunanlar
bireylerin verdiği cümleleri olasılık olarak kabul etmektedirler.
Subjektif olasılıklar doğrudan doğruya kişilerin verdiği ifadelerden elde edilebildiği
gibi, referans kumarı adı verilen dolaylı bir yöntemle de elde edilebilmektedir. Subjektif
olasılıkların dolaylı olarak elde edilme yöntemleri hakkında detaylı bilgi Hardaker et al
(1997) ve Ceyhan (1995) tarafından yazılan eserlerde bulunmaktadır.
3.1. Olasılık Dağılımı ve Tesadüfi Değişken Kavramları
Bilinen olasılık yaklaşımlarının yardımıyla, olayların değişik kombinasyonlarının
olasılıkları belirlenebilmektedir. Bu olasılıklar karar aşamasında çok yararlı olmaktadır. Her
ne kadar olasılık belirlenebilmekte ise de, olasılık dağılımı kavramı sadece
tanımlanabilmektedir. Yani olasılık dağılımları olasılık değerlerinin sunumunu sağlamakta ve
dağılımın genel formunun belirlenmesinde kullanılmaktadır. Bir olayın olasılık dağılımı
mümkün olan her bir çıktının olasılıklarının belirlenmesi suretiyle elde edilebilmektedir.
Olasılık dağılımlarının ortalama, varyans, eğrilik katsayısı ve diklik katsayısı olmak üzere 4
temel karakteristiği bulunmaktadır (Brennan, 1965). Olasılık dağılımını; tablo formunda,
grafik formunda veya matematiksel eşitlik şeklinde vermek mümkündür.
Belirli bir değeri, belirli bir olasılıkla alan değişkene “tesadüfi değişken”
denilmektedir. Yani, bu değişkenlerin alabileceği değerler belirli bir risk taşımaktadır
(Brennan, 1965; Doll, Rhodes and West, 1968). Günlük hayatımızda karşılaştığımız bir çok
olay tesadüfi değişken konumundadır. Tarımsal üretimde kullanılan girdilerden bir kısmı
çiftçinin kontrolü altında iken, diğerleri kontrolü dışındadır. Çiftçinin kontrolü dışında olan,
tesadüfi değişken konumundaki bu girdiler tabiat şartlarına, hükümet politikalarına ve işletme
dışındaki güçlere bağlı olmaktadır. Tarımdaki tesadüfi değişkenlerin en güzel örneğini iklim
faktörleri oluşturmaktadır. Ürün verimleri, yağışa bağlı olduğu için tesadüfi bir değişkendir.
Gelir, verime bağlı olduğu için gelir de tesadüfi bir değişkendir. Kritik hasat periyodunda don
veya rüzgar gelmesi, yetiştiricilik açısından çalışılabilir gün sayısı birer tesadüfi değişkendir.
Hayvancılıkta ölümlerden kaynaklanan kayıplar veya yumurta kayıpları da tesadüf
değişkenlerdir.
Tesadüfi değişkenleri “kesikli” ve “sürekli” olmak üzere iki grupta incelemek
mümkündür. Şimdi kesikli ve sürekli tesadüfi değişkenler ile bunların olasılık dağılımlarını
inceleyelim.
Olasılık [P(X)]
1
0.8
0.6
0.4
0.2
0
1 2 3 4 5
Otomobil sayısı (X)
Örnek:
Aşağıda bir makinenin bir haftada arıza yapma sayısı ve buna ait olasılıklar
verilmiştir. Bu makine için haftalık ortalama arıza sayısını bulunuz?
xPx 1.80
Bu sorunun cevabını vermek için arıza sayısını kendine ait olasılık ile çarpıp, toplamlarını
almamız gerekmektedir. Buna göre haftalık ortalama arıza sayısı
E x xP x 1.80 ’dir.
Kesikli olasılık dağılımlarının standart sapması ise gözlemlerin kendilerine ait
olasılıklarla çarpımlarının toplamından gözlemlere ait ortalamanın karesinin çıkartılıp,
bulunan değerin karekökünün alınması ile hesaplanmaktadır. Standart sapma değerinin küçük
olması gözlemlerin ortalama etrafında toplandığını gösterirken, büyük standart sapma değeri
ise gözlemlerin ortalamadan uzakta olduğunu göstermektedir. Standart sapmanın
hesaplanmasında kullanılan formül aşağıda verilmiştir.
x 2
P( x) 2
Örnek:
Elektronik devre üreten bir firmanın hatalı ürettiği devre sayısı ve buna ait olasılıklar
her 400 parçalık üretim için verilmiştir. Acaba hatalı devre sayısı için standart sapma kaçtır?
Çözüm:
Hatalı devre Olasılıklar
x P(x) xP(x) x2 x 2 P( x)
xP( x) 2.50 x 2
P( x) 7.70
Örneğe ait standart sapmayı bulmak için öncelikle ortalama değer yada diğer bir ifade ile
beklenen değer bulunur (2.50). Daha sonra gözlemlerinin kareleri ile olasılıkların
çarpımlarının toplamı 7.70 olarak bulunur. Elde edilen veriler ışığında standart sapma
x 2
P ( x) 2 formülü ile 7.70 (2.50 ) 2 1.20 olarak hesaplanır. Yani
ortalama olarak 2.50 parça hatalı olarak üretilmektedir ve buna ait standart sapma 1.20
parçadır.
Kesikli olasılık dağılımları normal dağılıma uygunluk göstermediğinden, standart
sapmanın yorumlanmasında Chebyshev teoremi kullanılmaktadır. Bu teoreme göre ortalama
değere eşit mesafede bulunan iki nokta arasında kalan alan 1 (1 / k 2 ) .100 formülü ile
belirlenmektedir. Ancak burada k parametresinin 2 ve 2’den büyük değerler alması
zorunludur. Örneğimizde elektronik devre üretiminde ortalama hatalı üretimin 2.50 ve buna
ait standart sapmanın 1.20 olduğunu tespit etmiştik. Buna göre üretilip satılacak her 400
parçalık partinin %75’i 0.10 ile 4.90 adet hatalı elektronik devreye sahip olacaktır.
1. Binomiyal dağılım: Bu dağılım, bir olayla ilgili sonuçlara ilişkin olasılıkları hesaplama da
işe yaramaktadır. Söz konusu olayın iki sonucu olup, bunlardan biri istenen diğeri ise
istenmeyen olaydır. Binomiyal dağılıma, Bernoulli tarafından önerilen binomiyal denemesi
sonuçları iyi bir örnek teşkil etmektedir. Binomiyal bir denemenin bilinen üç temel özelliği
vardır: (i) her bir denem bir birinden bağımsızdır, (ii) her denemenin muhtemel sadece iki
tane sonucu vardır ve (iii) sonuçların meydana gelem olasılıkları sabittir yani değişmez. Hile
içermeyen bir paranın 10 kez atıldığını varsayalım. Böyle bir deneme tamamen binomiyal
denemeye uygunluk göstermektedir. Zira olayın yazı ve tura olmak üzere iki sonucu vardır ve
bunların olasılıkları eşit ve sabittir.* Ayrıca her bir para atışı birbirinden bağımsızdır.
Binomiyal dağılıma göre “n” kez tekrar eden olayda istenen olayın meydana gelme
ihtimali “binomiyal formül” yardımıyla bulunabilmektedir. Binomiyal formül aşağıda
verilmiştir:
P( x) n p x q n x
x
Çözüm:
n 10
p 0.02
q 0.98
a)
x 1
n x 10 1 9
P( x 1) (0.02) (0.98)
10
1
1 9
10!
1!(10 1)!
(0.02)1 (0.98) 9 0.1667
P( x 1) P( x 0) P( x 1)
P( x 1) (0.02)
10
0
0
(0.98)10 (0.02) (0.98)
10
1
1 9
10 paketten 1 ve 1’den daha azının zamanında ulaşmama ihtimali 0.9838 olarak bulunmuştur.
Binomiyal olasılık dağılımı p q 0.5 olduğunda simetrik bir dağılım
göstermektedir. Ancak p 0.5 olduğunda binomiyal dağılım sağa çarpık ve
p 0.5 olduğunda ise sola çarpık bir şekle sahip olmaktadır.
Örnek:
1991 yılında ABD’de yapılan bir araştırmaya göre satılan toplam kişisel
bilgisayarların %18.6’sının IBM tarafından üretildiği belirlenmiştir. Buna göre seçilen 25
kişisel bilgisayar sahibinin sahip olduğu bilgisayarların IBM olma ve olmama ihtimallerini
belirleyin ve söz konusu binomiyal dağılımın ortalama ve standart sapmasını hesaplayın?
Çözüm.
n 25
p 0.186
q 1 p 0.814
np 25(0.186) 4.65
npq (25)(0.186)(0.814) 1.95
Söz konusu binomiyal dağılımın ortalaması 1.95 ve standart sapması 1.95’dir. Yani
bilgisayar sahibi olan her 25 kişiden 4.65 kişisi IBM marka bilgisayara sahiptir ve ortalamaya
ait standart sapma 1.95’dir.
r N r
x nx
P ( x)
N
n
Çözüm:
N 25
r 20
N r 5
n4
x3
n x 1
20 5 20! 5!
.
3!(20 3)! 1!(5 1)!
P( x 3)
3 1
0.4506
25 25!
4 4!(25 4)!
Böylece satılan 4 parçadan 3’ünün iyi ve bir tanesinin arızalı olma olasılığı 0.4506 olarak
bulunmuştur.
xe
P( x)
x!
Formülde belirli bir zaman aralığında beklenen olay sayısını ve e doğal logaritma tabanını
(2.71828) ifade etmektedir. Poisson dağılımının tek parametresi vardır oda ’dır. Bu değer
bilindiğinde x’in olasılığını hesaplamak mümkün olabilmektedir.
Örnek:
Bir banka önünde bulunan ATM makinesine 1 saatte ortalama 5 kişi gelmektedir.
Banka bu ATM makinesini 1 saatlik tamirat için kapatırsa, 8 müşterinin bu ATM makinesine
gelme ihtimali kaçtır?
Çözüm:
Burada ATM makinesini ziyaret eden ortalama müşteri sayısıdır. Yani 5 ’dir.
Araştırılan sekiz müşterinin gelme ihtimalidir P(x=8).
(5) 8 e 5 (390625)(0.006738)
P( x 8) 0.0653
8! 40320
Böylece, ATM makinesinin tamir edildiği 1 saat içinde 8 müşterinin gelme olasılığı 0.0653
olarak bulunmuştur.
Poisson dağılımının ortalama ve varyansı birbirine eşittir. Bu dağılım için ortalama ve
standart sapma aşağıdaki formüller yardımıyla hesaplanabilmektedir.
2
2
5 2.24 ’dür.
x=a x=b
P( x 61) 0
1 (1 / 2)( x ) 2 / 2
Y e
2
10
16
50
Şekil 5.2. Aynı ortalamaya fakat farklı standart sapmaya sahip normal dağılım eğrileri
5 5 5
20 30 40
Şekil 5.3. Aynı standart sapmaya fakat farklı ortalamaya sahip normal dağılım eğrileri
Normal dağılımı ortak bir birim olan “standart sapma” ile ifade ederek veri setlerini
karşılaştırmak kolaylaşmaktadır. Zira artık verilerin birimleri ortadan kalkmaktadır. Bu
amaçla normal dağılımın özel bir hali olan “standart normal dağılım” kullanılmaktadır.
Standart normal dağılımın ortalaması ( ) sıfır ve standart sapması ( ) 1’dir. Bu dağılımda
değerler, sürekli tesadüfi değişkenin değerinin temsil eden “z” değerleridir. “z” değeri aynı
zamanda “standart birim” veya “standart skor” olarak da isimlendirilmektedir. “z” değerleri,
tesadüfi değişkenlerin ortalamadan standart sapma olarak uzaklıkları ifade etmektedir.
Örneğin z=2 ise, bu değer ortalamanın 2 standart sapma sağındaki değeri ifade etmektedir.
“z” değerleri 0 ile 3.09 arasında değişen değerler almaktadır (Şekil 5.4).
0
1
-3 -2 -1 0 1 2 3 z
Şekil 5.4. Standart normal dağılım eğrisi
Standart normal dağılımdan yararlanarak iki değer arasında kalan alanı bulmak için
hazırlanmış olan “z” tablosundan yararlanılmaktadır. “z” tablosunda satırlar virgülden sonra
bir duyarlılığa sahip “z” değerlerini sütunlar ise virgülden sonraki duyarlılıkları ifade
etmektedir. Bu tablo kullanılırken ilgili z değerinin karşısında bulunan değer 0 ile ilgilenilen
“z” değeri arasında kalan alanı vermektedir.
Örnek:
z=0 ile z=1.95 arasında kalan alanı hesaplayınız.
Çözüm: 0.4744
0 1.95 z
Tablo: Standart Normal Dağılım Tablosunda Eğri Altında Kalan Alan
z .00 .01 .... .05 .... .09
0.0 0.0000 0.0040 .. 0.0199 .. 0.0359
0.1 0.0398 0.0438 .. 0.0596 .. 0.0753
0.2 0.0793 0.0832 .. 0.0987 .. 0.1141
. . . .. . .. .
. . . .. . .. .
. . . .. . .. .
1.9 0.4713 0.4719 .. 0.4744 .. 0.4767
. . . .. . .. .
. . . .. . .. .
. . . .. . .. .
3.0 0.4987 0.4987 .. 0.4989 .. 0.4990
Çözüm: 0.4850
-2.17 0 z
Tablo: Standart Normal Dağılım Tablosunda Eğri Altında Kalan Alan
z .00 .01 .... .05 .... .09
0.0 0.0000 0.0040 .. 0.0199 .. 0.0359
0.1 0.0398 0.0438 .. 0.0596 .. 0.0753
0.2 0.0793 0.0832 .. 0.0987 .. 0.1141
. . . .. . .. .
. . . .. . .. .
. . . .. . .. .
2.1 0.4821 0.4826 .. 0.4850 .. 0.4857
. . . .. . .. .
. . . .. . .. .
. . . .. . .. .
3.0 0.4987 0.4987 .. 0.4989 .. 0.4990
Belirli bir “z” değerinin sağında veya solunda kalan alan bulunurken, öncelikle ilgili
“z” değeri ile sıfır (ortalama) arasında kalan alan bulunmakta ve daha sonra bulunan bu alan
0.5’ten çıkartılmaktadır.
Örnek:
a) z=-1.54’ün solunda kalan alanı hesaplayınız.
b) z=2.32’nin sağında kalan alanı hesaplayınız.
Çözüm: a) 0.5000-0.4832=0.0618
-1.54 0
b) 0.5000-0.4898=0.0102
0 2.32 z
Standart normal dağılımdan yararlanarak pozitif iki veya negatif iki “z” değeri
arasında kalan alanı bulmak için, önce z=0 ile diğer iki z değeri arasında kalan alanlar tespit
edilir. Daha sonra büyük alandan küçük alan çıkartılarak iki “z” değeri arasında kalan alan
bulunur.
0.3830
0.4830
0 1.19 2.32 z
P(0<z<1.19)=0.3830
P((0<z<2.12)=0.4830
P(1.19<z<2.12)= P(0<z<1.19)- P((0<z<2.12)=0.4830-0.3830=0.10
Standart normal dağılımdan yararlanarak pozitif “z” değeri ile negatif “z” değeri
arasında kalan alanı bulmak için, önce negatif ve pozitif yönde z=0 ile iki “z” değeri arasında
kalan alanlar tespit edilir. Daha sonra bu alanlar toplanarak negatif “z” değeri ile pozitif “z”
değeri arasında kalan alan bulunur.
0.4406 0.4896
-1.56 0 2.31 z
P(-1.56<z<2.31)=0.4406+0.4896=0.9302
Negatif bir “z” değerinin sağ tarafında veya pozitif bir “z” değerinin sol tarafında
kalan alan bulunurken, önce ortalama ile ilgilenilen “z” değeri arasında kalan alan bulunur ve
bu değer üzerine 0.5 ilave edilir.
0.2734 0.5
-0.75 0 z
x
z
x 35 50
z 1.5
10
-1.5 0 z
x 55 50
z 0.5
10
0 0.5 z
Örnek:
Bir paketleme tesisinde tasnifi yapılan portakalların çapları 8 cm ve standart sapması
0.5 cm’dir. Derecelendirme yaparken çapları ortalamayı ±0.6 cm’yi geçen portakallar derece
dışı kalacaklardır. Bu durumda portakalların yüzde kaçı derecelendirme dışı kalacaktır?
Çözüm:
x1 8 0.6 8.6
x 2 8 0.6 7.4
8.6 8 7.4 8
z1 1.2 ve z 2 1.2
0.5 0.5
7.4 8 8.6 x
-1.2 0 1.2 z
Örneğin ortalaması 54 ve standart sapması 8 olan normal dağılımda, 0 ile belirli bir
“z” değeri arasında kalan alanın 0.4251 olduğunu varsayalım. Acaba bu “z” değeri kaçtır? Bu
sorunun cevabını verebilmek için “z” tablosundan yaralanmalıyız.
Zaman zaman iki nokta arasında kalan alan değil de, bir noktanın sağında kalan alan
bilinip, “z” ve “x” değerleri bilinememektedir. Bu gibi durumlarda bilinen alan 0.5’ten
çıkartılıp elde edilen alanı temsil eden “z” değeri bulunmakta ve daha sonra bu “z” değerine
bağlı olarak “x” değeri hesaplanmaktadır.
Örnek:
Ortalaması 50 ve standart sapması 10 olan normal dağılımda belirli bir “z”
değerinin sağında kalan alan 0.005’e eşittir. Acaba “x” ve “z” değeri nedir?
Çözüm:
Eğer belirli bir “z” değerinin sağında kalan alan 0.005’e eşitse, 0 ile bu “z” değeri
arasında kalan alan 0.50 – 0.005 = 0.4950’ye eşittir. “z” tablosundan yararlanarak bu alanın
z = 2.58’e ait olduğu rahatlıkla tespit edilmektedir. Daha sonra bu “z” değeri formülde yerine
konularak “x” değeri x z 50 (2.58)(10) 75.8 olarak hesaplanır.
2.Binomiyal dağılıma normal yaklaşım: Daha önce binomiyal dağılımın kesikli tesadüfi
değişkenler için geçerli olduğunu belirtmiştik. Ancak deneme sayısı (n) çok arttığında ve
istenen olayın meydana gelme ihtimali (p) 0.5’e yaklaştığında normal dağılım ile binomiyal
dağılım birbirine çok yaklaşmaktadır. Normal dağılım daima simetrik olduğundan p=0.5
olduğunda ve deneme sayısı (n) çok fazla olduğunda binomiyal dağılım normal dağılıma
dönüşmektedir. Genellikle np ve nq 5’ten büyük olduğunda yada diğer bir ifade ile deneme
sayısı (n) 10’dan fazla ve p=0.5 olduğunda “binomiyal dağılıma normal yaklaşım”
kullanılmaktadır. Bu koşullarda binomiyal dağılım bu yaklaşım sayesinde sürekli tesadüfi
değişkenler için de kullanılabilmektedir.
Örnek:
ABD’de yaşayan insanların %50’sinin kredi kartına sahip olduğu tahmin edilmektedir.
Tesadüfen seçilmiş 30 ABD vatandaşının 19 tanesinin en azından 1 adet kredi kartına sahip
olma olasılığı kaçtır?
Çözüm:
n 30
p 0.5
q 1 p 0.5
x 19
n x 11
15 18.5 19.5
15 19
3. adım. Normal dağılım kullanılarak olasılık hesaplanır
Normal dağılım özelliğinden yararlanarak olasılıklar hesaplanır.
18.5 15
x 18.5 z 1.28
2.74
19.5 15
x 19.5 z 1.64
2.74
“z” tablosu kullanılarak, önce 0 ile z=1.28 arasında kalan alan 0.3997 olarak bulunur. Daha
sonra 0 ile z=1.64 arasında kalan alan 0.4495 olarak tespit edilir. Bu iki alan arasındaki fark
bize seçilen 30 kişiden 19 kişinin en azından bir adet kredi kartına sahip olma olasılığını
verecektir ki bu 0.0498’dir.
Dikkat edilecek olursa aynı olasılık binomiyal dağılımdan yararlanarak 0.0509 olarak
bulunmuştu. Normal dağılım yaklaşımı ile bu olasılık 0.0498 olarak hesaplandı. Aralarındaki
fark normal dağılım yaklaşımı kullanılmasından kaynaklanmaktadır.
3.Üniform dağılım: Eğer sürekli tesadüfi değişkenlerin sahip olduğu olasılık bütün
aralıklarda eşit ise bu değişkene “üniform tesadüfi değişken” ve bunların gösterdiği dağılıma
da “üniform olasılık dağılımı” adı verilmektedir. Bu dağılım dikdörtgen şeklinde bir
dağılımdır (Şekil 5.5).
f (x)
1
ba
a b x
Şekil 5.5. Üniform olasılık dağılımının şekli
Dikdörtgenin alanı, eni ile boyunun çarpımına eşittir ( Alan en. yükseklik) . Bu
dağılımda a ve b değerleri arasında kalan alan bire eşit kabul edilmektedir. Bu durumda
1
yükseklik, genişliğin 1’e bölümüne eşit olmaktadır ( yükseklik ) . Üniform dağılımının
ba
fonksiyonu bize dikdörtgenin yüksekliğini vermektedir. a ve b değerleri arasında yer alan x
değerleri için üniform olasılık dağılımının fonksiyonu aşağıda verilmiştir.
1
f ( x) a xb
ba
ab
2
(b a ) 2
12
d c
P (c x d )
ba
f (x)
P(c x d )
1
ba
a c d b x
Şekil 5.6. Üniform olasılık dağılımında iki nokta arasında kalan alan
Örnek:
OYSA isimli bir firma oyuncak üretmektedir. Firmada oyuncak üretiminde çalışacak
olan yeni bir işçinin bir oyuncağı monte etme süresi 20 ile 27 saat arasında değişmektedir ve
üniform bir dağılım göstermektedir.
a) Yeni işçilerin oyuncak monte etme zamanının olasılık dağılımını çizerek gösteriniz?
b)Ortalama ve standart sapmayı hesaplayınız?
c) Yeni bir işçinin oyuncak montajını öğrenme süresinin 22-24 saat olma olasılığını
hesaplayınız?
d)Yeni bir işçinin oyuncak montajını öğrenme süresinin 26 saat e daha fazla olma
olasılığını hesaplayınız?
e) Yeni bir işçinin oyuncak montajını öğrenme süresinin 23 saatten daha az olma
olasılığını hesaplayınız?
Çözüm:
a) f (x)
1
27 20
20 27 x
b)
a b 20 27
23.50
2 2
(b a) 2 (27 20) 2
2.021
12 12
c) f (x)
0.2857
1
27 20
20 22 24 27 x
24 22
P(22 x 24) 0.2857
27 20
d) f (x)
0.1429
1
27 20
20 26 27 x
27 26
P(26 x 27) P( x 26) 0.1429
27 20
e) f (x)
0.4286
1
27 20
20 23 27 x
23 20
P(20 x 23) P( x 23) 0.4286
27 20
3.Üstel (exponential) dağılım: Üstel dağılım, daha önce açıklanan poisson dağılımına çok
benzemektedir. Poisson dağılımında belirli bir zaman aralığında başarılı olayın meydana
gelme ihtimali önemli iken, bu dağılımda iki başarılı olayın gerçekleşmesi arasında geçen
süre önem kazanmaktadır. Üstel dağılımın tek bir parametresi vardır. Bu parametre ’dır ve
birim zamanda gerçekleşen ortalama olay sayısını ifade etmektedir. Üstel dağılımın
fonksiyonu ve olasılığı aşağıdaki gibidir:
f ( x ) e x
P( x a) e a
P( x a) 1 e a burada 0 ve a 0
P(a x b) e a e b
birim zamanda meydana gelen olay sayısını göstermektedir. Örneğin bir bankaya 5
dakikada 10 müşteri geldiğini varsayalım. Birim zaman olarak dakikayı seçtiğimizi
düşünürsek bankaya ortalama olarak her iki dakikada bir müşteri gelmektedir( 10 2 ).
5
Aşağıda 3 farklı değeri için üstel dağılımın şekli verilmiştir (Şekil 5.7).
f (x)
3 3
2 2
1 1
x
Şekil 5.7. Üç farklı değeri için üstel olasılık dağılımı
Örnek:
Bir fabrikada imalatta kullanılan bir makinenin 4 haftada bir kez arızalandığı
bilinmektedir. Arızalanmalar arasında geçen sürenin üstel dağıldığı varsayımı altında
makinenin son kez arızalandığı günden itibaren ilk 6 hafta içinde makinenin bir kez daha
arızalanma ihtimali nedir?
Çözüm:
1
0.25
4
0.25(6)
P( x 6) e e 1.5 0.2231
f (x)
0.2231
6 x
1. Karekök dönüşümü: Genellikle “poisson dağılımı” gösteren belirli bir alandaki yabancı ot
ve zararlı sayısı, 1000 tanedeki yabancı ot tohumu sayısı gibi değişkenler üzerinde, bu
dağılımın ortalama ve varyansı birbirine eşit olduğu için normal dağılım gerektiren “varyans
analizi” uygulanamamaktadır. Bu dağılıma varyans analizi uygulayabilmek için, verilerin
dönüştürülerek normal dağılıma yaklaştırılması gerekmektedir. Bu gibi durumlarda en uygun
dönüştürme gözlemlerin karekökünü almaktır.
Veri setinde 10 ve 10’dan daha küçük gözlemler versa ve aralarında sıfır da varsa, bu
gibi durumlarda gözlemlerin karekökünü almadan önce gözlemlere 1 ilave edilip daha sonra
karekökü xi 1 alınmalıdır.
Örnek:
Aşağıda poisson dağılımı gösteren değerler ve bunların frekans dağılımı verilmiştir. Bu
rakamların dönüşüm öncesi ortalama ve varyansı 364/300=1.213’dür. Karekökleri alınan
gözlemlerin ortalaması 433.46/300=1.445, varyansı ise 0.12’dir.
xi xi 1 fi f i xi f i xi 1
0 1.00 83 0 83
1 1.41 115 115 162.15
2 1.73 66 132 114.18
3 2.00 28 84 56.00
4 2.24 7 28 15.68
5 2.45 1 5 2.45
300 364 433.46
Şekil 5.8 ve 5.9’da dönüşüm öncesi dağılım ile dönüşüm sonrası dağılım grafik formunda
verilmiştir. Görüldüğü gibi dönüşüm öncesinde poisson dağılımı gösteren seri,
dönüştürüldükten sonra normal dağılıma yaklaşmıştır.
Frek ans
100.00
75.00
50.00
25.00
0.00
100.00
75.00
50.00
25.00
0.00
Dönüştürülmüş x
2. Logaritmik dönüşüm: Bu dönüşüm daha çok çarpık dağılım gösteren dağılımlara uygulanır.
Tarım ekonomisi alanında yaygın olarak kullanılan bir dönüşümdür. Örneğin belirli bir
yörede yer alan işletmelerin arazi büyüklüklerinin gösterdiği dağılım genellikle çarpıktır. Bu
dağılımın normale dönüştürülmesi için logaritmik dönüşüm kullanılmalıdır. Bu dönüşüm
genellikle büyük pozitif değerlere uygulanmaktadır. Eğer veri setinde sıfır ve 10’dan daha
küçük değerler varsa, gözlemlerin doğrudan doğruya logaritmasını almak yerine bun
gözlemlere 1 ilave ederek logaritması alınmalıdır. Aynı zamanda 10’dan daha küçük değerler
için karekök dönüşümü, büyük değerler için logaritmik dönüşüm uygulamak da mümkündür.
Örnek:
Çorum İli Kızılırmak havzası tarım işletmelerinin sahip olduğu mülk arazi büyüklükleri
çarpık dağılım göstermektedir. Bu seriyi normal dağılıma yaklaştırmak için logaritmik
dönüşüm uygulandığında serinin dağılımının normale yaklaştığı görülmektedir. Şekil 5.10’da
dönüşüm öncesi dağılım ve Şekil 5.11’de dönüşüm sonrası dağılım gösterilmiştir.
40
30
Frekans
20
10
Std. Dev = 18.41
Mean = 26.4
0 N = 94.00
0. 10 20 30 40 50 60 70 80
0 .0 .0 .0 .0 .0 .0 .0 .0
Şekil 5.10. Çorum İli Kızılırmak havzası tarım işletmelerinin mülk arazi büyüklükleri
40
30
Frekans
20
10
Std. Dev = .83
Mean = 3.00
0 N = 94.00
.50
0.00
1.00
1.50
2.00
2.50
3.00
3.50
4.00
4.50
ln mülk arazi
Şekil 5.10. Dönüşüm sonrası Çorum İli Kızılırmak havzası tarım işletmelerinin mülk arazi
büyüklükleri
3. Arcsin dönüşümü: Binomiyal dağılımların normal dağılıma dönüştürülmesinde kullanılır.
Gözlem değerlerinin kareköklerinin arcsinüs değerleri bulunarak dönüşüm tamamlanmış olur.
Bu dönüşüm, tarım ekonomisi alanında sık karşılaşılan bir dönüşüm değildir.
Dönüşüm sonucunda elde edilen veriler orijinal haliyle sunulmak isteniyorsa, karekök
dönüşümünde ortalamanın karesi, logaritmik dönüşümde ortalamanın antilogaritması alınır.
Arcsin dönüşümünde ise istatistik kitaplarında yer alan cetveller kullanılır.