Download as pdf or txt
Download as pdf or txt
You are on page 1of 33

OLASILIK, TESADÜFİ

DEĞİŞKEN VE OLASILIK
5 DAĞILIMLARI

Bernoulli’ye göre olasılık, gelecekteki bir olay hakkındaki beklentinin kuvvetinin bir
ölçüsüdür. Keynes ise olasılığın olaylarla ilgili değil, düşüncelerle tanımlanmasının doğru
olacağını savunmuştur (Parzen, 1960). Fakat olasılığın tam olarak anlamı nedir? Daima
kullanılabilecek temel bir tanımı var mıdır? Maalesef bu sorular kolay bir şekilde
cevaplanamamaktadır. Olasılık kavramı hakkında 3 temel yaklaşım mevcuttur:

1) Klasik olasılık yaklaşımı


2) Nispi frekans yaklaşımı
3) Subjektif olasılık yaklaşımı

Klasik olasılık yaklaşımı: Bu yaklaşım simetri koşullarına ve yetersiz sebep prensibine


dayanmaktadır. Eğer belirsiz durum N tane farklı, eşit benzerlikte ve bileşik sonuçlara sahipse
ve A durumu bu sonuçların “n” kadarını içeriyorsa, A olayının olasılığı P(A)=n/N’dir. Buna
klasik olasılık adı verilmektedir. Bu yaklaşımda sonuçların meydana gelme olasılıkları eşit
olmalıdır. 6 yüzlü bir zarın atılışı bu olaya çok iyi bir örnek teşkil etmektedir ve her bir yüzün
meydana gelme olasılığı eşittir (1/6).
A olayını içerdiği sonuçlar
P(Ei)= ———————————————
Beklenen sonuçların toplam sayısı
Örneğin bir firmada 40 bayan ve 60 erkek çalışmaktadır. Firma yetkililerinin bu 100
kişiden tesadüfi olarak bir tanesini görüşme yapmak amacıyla seçtiğini var sayalım. Seçilen
bu kişinin bayan olma olasılığı kaçtır? Bu sorunun cevabı Pbayan=40/100=0.40’dır.
Bu yaklaşım genellikle karşılaşılan olayların simetri prensibine uymaması ve teresiz
sebep prensibinin kabul edilme zorunluluğu olması sebebiyle her zaman
uygulanamamaktadır.

Nispi frekans yaklaşımı: Bu yaklaşım, olayların meydana gelem sayısını hesaplamaya


dayanmaktadır. Eğer “n” kez tekrar eden denemede A olayı “f” kere meydana geliyorsa, A
olayının meydana gelme olasılığı aşağıdaki formül yardımıyla hesaplanır.

P  A 
f
n
Nispi frekansın olasılığın kendisi değil de, olasılığa bir yaklaşım olduğu
unutulmamalıdır. Bu yaklaşımın geçerli olması deneme sayısının yeteri kadar fazla olmasına
bağlıdır. Zira deneme sayısı artırıldıkça nispi frekans yaklaşımıyla bulunan olasılık, gerçek
olasılığa yaklaşmaktadır. İstatistikte bu “çok fazla sayıda deneme yasası” olarak
bilinmektedir. Ayrıca, denemelerin her birinin bağımsız olması gerekmektedir. Yani bir
denemenin sonucu diğerini etkilememelidir.

Örnek:
Bir otomobil fabrikasından tesadüfi olarak seçilmiş 500 otomobilden 10 tanesi imalat
hatalıdır. İmalat hatası olan otomobillerin tesadüfi olarak üretildiğini varsayarsak, bundan
sonra üretilecek ilk otomobilin imalat hatalı olma ihtimali kaçtır?

Çözüm:
n = 500 ve f = 10

PİH  
10
 0.02
500

Otomobil f Nispi frekans


Normal 490 490/500=0.98
Hatalı 10 10/500=0.02
500
Örnek:
Samsun’da yaşayan ailelerden tesadüfi yöntemle seçilen kişilerin “ev sahibi” olma
olasılığını araştırdığımızı düşünelim. Bunu nasıl belirleriz?

Çözüm:
Bu olayın muhtemel iki sonucu vardır; (i) ev sahibi olanlar, (ii) ev sahibi olmayanlar.
Burada her iki sonucun meydana gelme olasılığı eşit değildir. Zira Samsun’da yaşayanların
yarısı ev sahibi, yarısı da değildir diyemeyiz. Bunun için “klasik olasılık yaklaşımı”
kullanılamaz. Nispi frekans yaklaşımı bu durumda daha uygundur.
n=1000
f=670 (ev sahibi olanlar)

PESO 
670
 0.67
1000
Yani, Samsun’da incelenen 1000 kişiden alınan verilere göre ev sahibi olma olasılığı 0.67’dir.

Subjektif olasılık yaklaşımı: Bu yaklaşıma göre olasılığın temeli “sezgiler” dir. Objektif
yaklaşımlar olan “klasik ve nispi frekans” yaklaşımlarında geçerli olan sınırlamalar bu
yaklaşımda gereksiz bulunmaktadır. Bu görüşü savunanlar doktorun “tekrar düzelme olasılığı
%80’dir” veya uzmanın “ilk teklif ikincisine göre daha kabul edilebilir” şeklindeki
cümlelerinde yer alan sezgilerin doğal olasılık olarak kullanılabileceğini savunmuşlardır.
Gerçek hayatta benzer olaylar tekerrür sayısı gibi modellenemeyen birçok problem
vardır. Subjektif olasılık 0 ile 1 arasında değişmekte olup, belirsiz olayın sonucu hakkında
bireysel inanç derecelerini yansıtmaktadır. “0” gerçekleşmesi mümkün olmayan bir olayı, “1”
ise kesin inançları ifade etmektedir. Objektif yaklaşımları savunanlar olasılıkları fiziksel
işlemlerin karakteristikleri gibi tahmin ederken, subjektif olasılık yaklaşımını savunanlar
bireylerin verdiği cümleleri olasılık olarak kabul etmektedirler.
Subjektif olasılıklar doğrudan doğruya kişilerin verdiği ifadelerden elde edilebildiği
gibi, referans kumarı adı verilen dolaylı bir yöntemle de elde edilebilmektedir. Subjektif
olasılıkların dolaylı olarak elde edilme yöntemleri hakkında detaylı bilgi Hardaker et al
(1997) ve Ceyhan (1995) tarafından yazılan eserlerde bulunmaktadır.
3.1. Olasılık Dağılımı ve Tesadüfi Değişken Kavramları
Bilinen olasılık yaklaşımlarının yardımıyla, olayların değişik kombinasyonlarının
olasılıkları belirlenebilmektedir. Bu olasılıklar karar aşamasında çok yararlı olmaktadır. Her
ne kadar olasılık belirlenebilmekte ise de, olasılık dağılımı kavramı sadece
tanımlanabilmektedir. Yani olasılık dağılımları olasılık değerlerinin sunumunu sağlamakta ve
dağılımın genel formunun belirlenmesinde kullanılmaktadır. Bir olayın olasılık dağılımı
mümkün olan her bir çıktının olasılıklarının belirlenmesi suretiyle elde edilebilmektedir.
Olasılık dağılımlarının ortalama, varyans, eğrilik katsayısı ve diklik katsayısı olmak üzere 4
temel karakteristiği bulunmaktadır (Brennan, 1965). Olasılık dağılımını; tablo formunda,
grafik formunda veya matematiksel eşitlik şeklinde vermek mümkündür.
Belirli bir değeri, belirli bir olasılıkla alan değişkene “tesadüfi değişken”
denilmektedir. Yani, bu değişkenlerin alabileceği değerler belirli bir risk taşımaktadır
(Brennan, 1965; Doll, Rhodes and West, 1968). Günlük hayatımızda karşılaştığımız bir çok
olay tesadüfi değişken konumundadır. Tarımsal üretimde kullanılan girdilerden bir kısmı
çiftçinin kontrolü altında iken, diğerleri kontrolü dışındadır. Çiftçinin kontrolü dışında olan,
tesadüfi değişken konumundaki bu girdiler tabiat şartlarına, hükümet politikalarına ve işletme
dışındaki güçlere bağlı olmaktadır. Tarımdaki tesadüfi değişkenlerin en güzel örneğini iklim
faktörleri oluşturmaktadır. Ürün verimleri, yağışa bağlı olduğu için tesadüfi bir değişkendir.
Gelir, verime bağlı olduğu için gelir de tesadüfi bir değişkendir. Kritik hasat periyodunda don
veya rüzgar gelmesi, yetiştiricilik açısından çalışılabilir gün sayısı birer tesadüfi değişkendir.
Hayvancılıkta ölümlerden kaynaklanan kayıplar veya yumurta kayıpları da tesadüf
değişkenlerdir.
Tesadüfi değişkenleri “kesikli” ve “sürekli” olmak üzere iki grupta incelemek
mümkündür. Şimdi kesikli ve sürekli tesadüfi değişkenler ile bunların olasılık dağılımlarını
inceleyelim.

3.1.1. Kesikli tesadüfi değişkenler ve olasılık dağılımları


Tesadüfi değişkenlerin aldığı değerler 1, 2, 5, 7 gibi tam sayılar ise ve iki rakam
arasında bir boşluk söz konusu ise bu tesadüfi değişkenlere “kesikli tesadüfi değişkenler” adı
verilmektedir. Örneğin bir para atıldığında tura gelme olasılığı veya zarın üst yüzeyindeki
sonuçlar kesikli tesadüfi değişkenlerdir. Kesikli tesadüfi değişkenlere ait olasılıkların
göstermiş olduğu dağılıma da kesikli olasılık dağılımlarıdır. Kesikli tesadüfi değişkenlere ait
olasılık dağılımlarının iki temel özelliği vardır: (i) kesikli tesadüfi değişkenlere ait olasılıklar
0 ile 1 arasında değişir ve (ii) olasılıkların toplamı bire eşittir.
Örneğin Samsun ilinde yaşayan 2000 aile ile görüşüldüğünü ve bu ailelerin sahip
oldukları otomobil sayılarını tespit ettiğimizi düşünelim. Elde edilen veriler Çizelge 5.1’de
verilmiştir. Sahip olunan otomobil sayılarına göre olasılıkları belirleyelim ve bunların
gösterdiği dağılımını tanımlayalım. Otomobil sayıları kesikli tesadüfi değişkenlerdir. Zira 1.5
otomobil veya 2.6 otomobil söz konusu değildir. Bu sebeple bu tesadüfi değişkenin olasılık
dağılımı da kesiklidir. Bunun için öncelikle olasılıkları nispi frekans yaklaşımı ile
belirlenmiştir (Çizelge 5.1). Daha sonra bu olasılıklar tablo formunda, grafik ile veya
matematiksel eşitlik şeklinde gösterilebilir. Sahip olunan otomobil sayılarına ilişkin
olasılıkların dağılımı Çizelge 5.1’de tablo formunda verilmiştir. Grafik formunda ise bar
grafiklerinden yararlanılmaktadır. Grafik formunda olasılık dağılımı ise Şekil 5.1’de
verilmiştir.
Çizelge 5.1. Ailelerin Sahip Oldukları Otomobil Sayıları ve Olasılıkları
Otomobil sayısı Frekans Nispi frekans Olasılık
0 850 0.425 0.425
1 490 0.245 0.245
2 470 0.235 0.235
3 160 0.080 0.080
4 30 0.015 0.015
N 2000   1.00  Px   1.00

Olasılık [P(X)]
1

0.8

0.6

0.4

0.2

0
1 2 3 4 5
Otomobil sayısı (X)

Şekil 5.1. Otomobil sayısına ait kesikli olasılık dağılımı


Söz konusu olasılık dağılımını matematik formül olarak Y = 0.538 – 0.1349X +
0.0061X2 (R2 = 0.9516) şeklinde ifade etmekte mümkündür. Formülde Y olasılıkları, X ise
otomobil sayısını ifade etmektedir. Bu formülden yaralanarak otomobil sayısına bağlı olarak
olasılıkları tahmin etmek mümkündür. Bunun için sadece formülde X yerine otomobil sayısını
yazmak ve işlemleri yapmak yeterli olacaktır. Örneğin 2 otomobile sahip olma olasılığı
formülde X yerine 2 yazıp, eşitliği çözmek suretiyle 0.29 olarak tahmin edilecektir. Bu rakam,
nispi frekans yaklaşımı ile bulunan 0.235 rakamından farklıdır. Aradaki fark model kurmadan
kaynaklanan hataya bağlıdır.
Kesikli olasılık dağılımlarının ortalaması (  ) aynı zamanda “beklenen değer” ( Ex  )
olarak da bilinmektedir. Kesikli dağılımlarda beklenen değer her bir gözlemin kendisine ait
olasılık ile çarpımlarının toplamına eşittir. Ortalamanın hesaplanmasında kullanılan eşitlik
aşağıda verilmiştir:
  E x    xP  x 

Örnek:
Aşağıda bir makinenin bir haftada arıza yapma sayısı ve buna ait olasılıklar
verilmiştir. Bu makine için haftalık ortalama arıza sayısını bulunuz?

Arıza sayısı P(x) xP(x)


0 0.15 0(0.15)=0.00
1 0.20 1(0.20)=0.20
2 0.35 2(0.35)=0.70
3 0.30 3(0.30)=0.90

 xPx   1.80

Bu sorunun cevabını vermek için arıza sayısını kendine ait olasılık ile çarpıp, toplamlarını
almamız gerekmektedir. Buna göre haftalık ortalama arıza sayısı
  E x    xP x   1.80 ’dir.
Kesikli olasılık dağılımlarının standart sapması ise gözlemlerin kendilerine ait
olasılıklarla çarpımlarının toplamından gözlemlere ait ortalamanın karesinin çıkartılıp,
bulunan değerin karekökünün alınması ile hesaplanmaktadır. Standart sapma değerinin küçük
olması gözlemlerin ortalama etrafında toplandığını gösterirken, büyük standart sapma değeri
ise gözlemlerin ortalamadan uzakta olduğunu göstermektedir. Standart sapmanın
hesaplanmasında kullanılan formül aşağıda verilmiştir.
 x 2
P( x)   2

Formülde  kesikli olasılık dağılımına ait standart sapmayı, x 2


P( x) gözlemlerinin kareleri

ile olasılıkların çarpımlarının toplamını ve  2 kesikli olasılık dağılımının ortalama değerinin


karesini ifade etmektedir.

Örnek:
Elektronik devre üreten bir firmanın hatalı ürettiği devre sayısı ve buna ait olasılıklar
her 400 parçalık üretim için verilmiştir. Acaba hatalı devre sayısı için standart sapma kaçtır?

Çözüm:
Hatalı devre Olasılıklar
x P(x) xP(x) x2 x 2 P( x)

0 0.02 0.00 0 0.00


1 0.20 0.20 1 0.20
2 0.30 0.60 4 1.20
3 0.30 0.90 9 2.70
4 0.10 0.40 16 1.60
5 0.08 0.40 25 2.00

 xP( x)  2.50 x 2
P( x)  7.70

Örneğe ait standart sapmayı bulmak için öncelikle ortalama değer yada diğer bir ifade ile
beklenen değer bulunur (2.50). Daha sonra gözlemlerinin kareleri ile olasılıkların
çarpımlarının toplamı 7.70 olarak bulunur. Elde edilen veriler ışığında standart sapma

 x 2
P ( x)   2 formülü ile   7.70  (2.50 ) 2  1.20 olarak hesaplanır. Yani

ortalama olarak 2.50 parça hatalı olarak üretilmektedir ve buna ait standart sapma 1.20
parçadır.
Kesikli olasılık dağılımları normal dağılıma uygunluk göstermediğinden, standart
sapmanın yorumlanmasında Chebyshev teoremi kullanılmaktadır. Bu teoreme göre ortalama

değere eşit mesafede bulunan iki nokta arasında kalan alan 1  (1 / k 2 ) .100 formülü ile 
belirlenmektedir. Ancak burada k parametresinin 2 ve 2’den büyük değerler alması
zorunludur. Örneğimizde elektronik devre üretiminde ortalama hatalı üretimin 2.50 ve buna
ait standart sapmanın 1.20 olduğunu tespit etmiştik. Buna göre üretilip satılacak her 400
parçalık partinin %75’i 0.10 ile 4.90 adet hatalı elektronik devreye sahip olacaktır.

  2  2.50  2(1.20)  0.10


  2  2.50  2(1.20)  4.90
1  (1/ 4).100  %75

Kesikli olasılık dağılımları “binomiyal dağılım”, “poisson dağılımı” ve


“hipergeometrik dağılım” olmak üzere 3 grup altında incelenmektedir.

1. Binomiyal dağılım: Bu dağılım, bir olayla ilgili sonuçlara ilişkin olasılıkları hesaplama da
işe yaramaktadır. Söz konusu olayın iki sonucu olup, bunlardan biri istenen diğeri ise
istenmeyen olaydır. Binomiyal dağılıma, Bernoulli tarafından önerilen binomiyal denemesi
sonuçları iyi bir örnek teşkil etmektedir. Binomiyal bir denemenin bilinen üç temel özelliği
vardır: (i) her bir denem bir birinden bağımsızdır, (ii) her denemenin muhtemel sadece iki
tane sonucu vardır ve (iii) sonuçların meydana gelem olasılıkları sabittir yani değişmez. Hile
içermeyen bir paranın 10 kez atıldığını varsayalım. Böyle bir deneme tamamen binomiyal
denemeye uygunluk göstermektedir. Zira olayın yazı ve tura olmak üzere iki sonucu vardır ve
bunların olasılıkları eşit ve sabittir.* Ayrıca her bir para atışı birbirinden bağımsızdır.
Binomiyal dağılıma göre “n” kez tekrar eden olayda istenen olayın meydana gelme
ihtimali “binomiyal formül” yardımıyla bulunabilmektedir. Binomiyal formül aşağıda
verilmiştir:

P( x)   n  p x q n  x
x

Formülde n toplam deneme sayısını, p istenen olayın meydana gelme olasılığını, q


istenmeyen olayın meydana gelme olasılığını [q=(1-p)], x n denemede istenen olayın olma
sayısını ve n  x ise n denemede istenmeyen olayın olma sayısını ifade etmektedir. Formülde
yer alan   kombinasyon gösterimidir. Bu gösterimde
n
x n toplam gözlem sayısını ve x ise her
seferde seçilen gözlem sayısını ifade etmektedir. Kombinasyon, faktöryel yardımıyla
aşağıdaki şekilde hesaplanmaktadır.
*
Sonuçların olasılıklarının eşit olması mutlak gerekli bir koşul değildir. Olasılıklar eşit olmasa da istenen olayın
meydana gelme ihtimali binomiyal dağılım yardımıyla bulunabilmektedir.
 n   n!
 x  x!(n  x)!
Örnek:
Kargo hizmetleri veren bir firma, kendilerine verilen paketi zamanında yerine
ulaştıramazsa paketin değeri kadar parayı ödemeyi garanti etmiştir. Geçmiş yıllarda yapılan
çalışmalara göre firmanın bütün gayretlerine rağmen paketlerin %2’sini zamanında yerine
teslim edemediği tespit edilmiştir. Bu firma ile 10 paketin gönderildiğini düşünelim;
a) Bu 10 paketden 1 tanesinin tam zamanında yerine ulaşmama ihtimali kaçtır?
b) 10 paketden 1 ve bir tanesinden daha azının yerine zamanında ulaşmama ihtimali
kaçtır?

Çözüm:
n  10
p  0.02
q  0.98
a)
x 1
n  x  10  1  9

P( x  1)   (0.02) (0.98)
10
1
1 9

10!
1!(10  1)!
(0.02)1 (0.98) 9  0.1667

Sonuçta 10 paketten 1 tanesinin zamanında ulaşmama ihtimali 0.1667 olarak bulunmuştur.

b) En azından 1 tanesinin ulaşmama ihtimalinin bulunması için x  0 ve x  1 ihtimallerinin


toplanması gerekmektedir.

P( x  1)  P( x  0)  P( x  1)
P( x  1)   (0.02)
10
0
0
(0.98)10   (0.02) (0.98)
10
1
1 9

P( x  1)  0.8171  0.1667  0.9838

10 paketten 1 ve 1’den daha azının zamanında ulaşmama ihtimali 0.9838 olarak bulunmuştur.
Binomiyal olasılık dağılımı p  q  0.5 olduğunda simetrik bir dağılım
göstermektedir. Ancak p  0.5 olduğunda binomiyal dağılım sağa çarpık ve
p  0.5 olduğunda ise sola çarpık bir şekle sahip olmaktadır.

Binomiyal dağılımın ortalaması ve standart sapmasının hesaplanmasında aşağıdaki


formüller kullanılmaktadır.
  np
  npq
Formüllerde n toplam deneme sayısını, p istenen olayın meydana gelme olasılığını ve
q istenmeyen olayın meydana gelme olasılığını ifade etmektedir.

Örnek:
1991 yılında ABD’de yapılan bir araştırmaya göre satılan toplam kişisel
bilgisayarların %18.6’sının IBM tarafından üretildiği belirlenmiştir. Buna göre seçilen 25
kişisel bilgisayar sahibinin sahip olduğu bilgisayarların IBM olma ve olmama ihtimallerini
belirleyin ve söz konusu binomiyal dağılımın ortalama ve standart sapmasını hesaplayın?

Çözüm.
n  25
p  0.186
q  1  p  0.814

  np  25(0.186)  4.65
  npq  (25)(0.186)(0.814)  1.95

Söz konusu binomiyal dağılımın ortalaması 1.95 ve standart sapması 1.95’dir. Yani
bilgisayar sahibi olan her 25 kişiden 4.65 kişisi IBM marka bilgisayara sahiptir ve ortalamaya
ait standart sapma 1.95’dir.

2. Hipergeometrik dağılım: Binomiyal dağılım konusunu açıklarken olayın istenen ve


istenmeyen şeklinde muhtemel iki sonucunun olduğunu ve bu sonuçların olasılıklarının sabit
olduğunu vurgulamış, ayrıca denemelerin bağımsız olması gerekliliği de belirtilmişti.
Denemeler birbirinden bağımsız olduğunda binomiyal olasılık dağılımını kullanmak imkânsız
olmaktadır. Bu gibi durumlarda n denemede istenen olayın meydana gelme olasılığı
bulunurken binomiyal dağılım yerine “hipergeometrik dağılım” kullanılmaktadır. Örneğin
52’lik bir deste kağıdından “kız” çekme olasılığı p  4 / 52  0.076 ’dır. Eğer çekilen kız
desteye ilave edilmezse, çekilecek ikinci kağıdın kız olma ihtimali
p  3 / 52  0.058 olacaktır. Yani ikinci kağıdın kız olma ihtimali birinci kağıda bağımlı
olmuştur ve bağımsız deneme kuralı ihlal edilmiştir. Bu şekilde iade edilmeksizin çekilen
örneklerin olasılıklarının oluşturduğu dağılım hipergeometrik dağılımdır.
Hipergeometrik dağılımın formülü aşağıdaki gibidir:

 r  N  r 
x nx 
P ( x)   
 N 
n 

Formülde N populasyondaki toplam gözlem sayısını, r populasyonda istenen olayın meydana


gelme sayısını, N  r populasyonda istenmeyen olayın meydana gelme sayısını, n deneme
sayısını (örnek büyüklüğü), x n denemede istenen olayın meydana gelme sayısını ve n  x n
denemede istenmeyen olayın meydana gelme sayısını göstermektedir.
Örnek:
Otomobil yedek parçası imal eden bir firma 25 adet yedek parçayı istek üzerine
gönderiyor ve daha sonra 5 adet yedek parçanın arızalı olduğunu belirliyor. Bunun üzerine
firma yetkilisi yedek parçaları sattığı 25 firmadan tesadüfi olarak 4 tanesi ile irtibat kuruyor.
Acaba bu müşterilerden (4 adet) 3 tanesine iyi parça ve 1 tanesine arızalı parça gitme olasılığı
nedir?

Çözüm:
N  25
r  20
N r 5
n4
x3
n  x 1
 20  5  20! 5!
.
3!(20  3)! 1!(5  1)!
P( x  3)     
3 1
 0.4506
 25  25!
4  4!(25  4)!

Böylece satılan 4 parçadan 3’ünün iyi ve bir tanesinin arızalı olma olasılığı 0.4506 olarak
bulunmuştur.

3. Poisson dağılımı: Bu dağılım Fransız matematikçi Siemon D. Poisson tarafından


bulunmuştur. n çok büyük olduğunda ve istenen olayın meydana gelme ihtimali (p) çok
küçük olduğunda binomiyal dağılımdan yararlanarak hesap yapmak çok güçleşmektedir. Bu
gibi durumlarda binomun limiti olan poisson dağılımından yararlanılmaktadır. Bu dağılım
belirli bir zamanda santrale gelen telefon sayısı, fabrikada bir günde arıza yapan makine
sayısı, banka veznesine 1 saatte gelen müşteri sayısı gibi belirli aralıklarla ortaya çıkan
olaylarda kullanılmaktadır. Poisson dağılımı (i) değişken kesikli olması, (ii) beklenen olay
sayısının tasadüfi olması ve (iii) beklenen olayların birbirinden bağımsız olması koşullarına
sahiptir. Poisson dağılımının formülü aşağıda verilmiştir.

xe 
P( x) 
x!

Formülde  belirli bir zaman aralığında beklenen olay sayısını ve e doğal logaritma tabanını
(2.71828) ifade etmektedir. Poisson dağılımının tek parametresi vardır oda  ’dır. Bu değer
bilindiğinde x’in olasılığını hesaplamak mümkün olabilmektedir.

Örnek:
Bir banka önünde bulunan ATM makinesine 1 saatte ortalama 5 kişi gelmektedir.
Banka bu ATM makinesini 1 saatlik tamirat için kapatırsa, 8 müşterinin bu ATM makinesine
gelme ihtimali kaçtır?

Çözüm:
Burada  ATM makinesini ziyaret eden ortalama müşteri sayısıdır. Yani   5 ’dir.
Araştırılan sekiz müşterinin gelme ihtimalidir P(x=8).
(5) 8 e 5 (390625)(0.006738)
P( x  8)    0.0653
8! 40320
Böylece, ATM makinesinin tamir edildiği 1 saat içinde 8 müşterinin gelme olasılığı 0.0653
olarak bulunmuştur.
Poisson dağılımının ortalama ve varyansı birbirine eşittir. Bu dağılım için ortalama ve
standart sapma aşağıdaki formüller yardımıyla hesaplanabilmektedir.

 
2 
  2

Örneğimiz için poisson dağılımından yaralanarak ortalama 5, standart sapma ise

5  2.24 ’dür.

3.1.2. Sürekli tesadüfi değişkenler ve olasılık dağılımları


Sürekli tesadüfi değişkenler bütün verileri sürekli ölçekte olan kıymetler olarak kabul
edilmektedir. Sürekli tesadüfi değişkenler genellikle ölçümlere (ağırlık, zaman, uzunluk,
verim vb.) göre değişiklik göstermektedir. Veriler tam sayı (1, 2, 3 ...) olabileceği gibi
ondalıklı (1.1, 1.2, 1.3 ......) değerlerde alabilmektedir. Yani sürekli verilerde rakamlar
arasında bir boşluk yoktur. Sürekli tesadüfi değişkenlerin değeri sonsuzdur ve hesaplanamaz.
Sürekli olasılık dağılımlarında olasılıklar 0 ile 1 arasında değişmektedir ve bütün
aralıklara ait olasılıkların toplamı 1’e eşittir.
Sürekli değişkenlerde daima iki nokta arasında kalan alanın olasılığı
hesaplanmaktadır. Tek bir noktanın olasılığı sıfıra eşittir.

Bu alan verilerin a ile b arasına


düşme olasılığını verir
P(a  x  b)

x=a x=b
P( x  61)  0

Sürekli olasılık dağılımları “normal dağılım”, “binomiyal dağılıma normal yaklaşım”,


“üniform dağılım” ve “üstel (exponential) dağılım” olmak üzere 4 grup altında
incelenmektedir.

1. Normal dağılım: Birbirlerinden farkları tesadüften kaynaklanan gözlemlerin teşkil ettiği


dağılıma “normal dağılım” adı verilmektedir. İstatistikte en yaygın kullanılan sürekli olasılık
dağılımıdır. Gerçek dünyada bir çok olay ya tam olarak yada yaklaşık olarak normal dağılış
göstermektedir. Normal dağılım düzgün, tek bir tepe değerine (mod) sahip olan ve tam
anlamıyla simetrik çan şeklinde bir dağılımdır. Normal dağılım eğrisi altında kalan alan 1’e
eşittir ve ortalamanın her iki tarafında kalan kısım birbirine tamamen eşittir (simetrik).
Normal dağılımda ortalamanın her iki tarafında uç noktalarda kalan kısımlar sonsuza dek
devam ederler yani ekseni kesmezler. Özetle incelenen değişkenlerin alabileceği değerler -∞
ile + ∞ arasında yer almaktadır. Normal dağılım birisi ortalama (  ) diğeri standart sapma
( ) olmak üzere iki parametreye sahiptir. Normal dağılım gösteren eğrinin fonksiyonu
şöyledir:

1 (1 / 2)( x   ) 2 /  2
Y e
 2

Formülde  populasyona ait ortalamayı,  standart sapmayı, e doğal logaritma tabanını ve


 pi sayısını ifade etmektedir.
Normal dağılımların ortalama ve varyansı birbirinden farklılık göstermektedir. Aynı
ortalama değere fakat farklı standart sapmaya sahip normal dağılım eğrileri Şekil 5.2’de; aynı
standart sapmaya fakat farklı ortalamalara sahip normal dağılım eğrileri ise Şekil 5.3’de
verilmiştir.
 5

  10

  16
  50
Şekil 5.2. Aynı ortalamaya fakat farklı standart sapmaya sahip normal dağılım eğrileri

 5  5  5

  20   30   40
Şekil 5.3. Aynı standart sapmaya fakat farklı ortalamaya sahip normal dağılım eğrileri

Normal dağılımı ortak bir birim olan “standart sapma” ile ifade ederek veri setlerini
karşılaştırmak kolaylaşmaktadır. Zira artık verilerin birimleri ortadan kalkmaktadır. Bu
amaçla normal dağılımın özel bir hali olan “standart normal dağılım” kullanılmaktadır.
Standart normal dağılımın ortalaması ( ) sıfır ve standart sapması ( ) 1’dir. Bu dağılımda
değerler, sürekli tesadüfi değişkenin değerinin temsil eden “z” değerleridir. “z” değeri aynı
zamanda “standart birim” veya “standart skor” olarak da isimlendirilmektedir. “z” değerleri,
tesadüfi değişkenlerin ortalamadan standart sapma olarak uzaklıkları ifade etmektedir.
Örneğin z=2 ise, bu değer ortalamanın 2 standart sapma sağındaki değeri ifade etmektedir.
“z” değerleri 0 ile 3.09 arasında değişen değerler almaktadır (Şekil 5.4).
 0
 1

-3 -2 -1 0 1 2 3 z
Şekil 5.4. Standart normal dağılım eğrisi

Standart normal dağılımdan yararlanarak iki değer arasında kalan alanı bulmak için
hazırlanmış olan “z” tablosundan yararlanılmaktadır. “z” tablosunda satırlar virgülden sonra
bir duyarlılığa sahip “z” değerlerini sütunlar ise virgülden sonraki duyarlılıkları ifade
etmektedir. Bu tablo kullanılırken ilgili z değerinin karşısında bulunan değer 0 ile ilgilenilen
“z” değeri arasında kalan alanı vermektedir.

Örnek:
z=0 ile z=1.95 arasında kalan alanı hesaplayınız.

Çözüm: 0.4744

0 1.95 z
Tablo: Standart Normal Dağılım Tablosunda Eğri Altında Kalan Alan
z .00 .01 .... .05 .... .09
0.0 0.0000 0.0040 .. 0.0199 .. 0.0359
0.1 0.0398 0.0438 .. 0.0596 .. 0.0753
0.2 0.0793 0.0832 .. 0.0987 .. 0.1141
. . . .. . .. .
. . . .. . .. .
. . . .. . .. .
1.9 0.4713 0.4719 .. 0.4744 .. 0.4767
. . . .. . .. .
. . . .. . .. .
. . . .. . .. .
3.0 0.4987 0.4987 .. 0.4989 .. 0.4990

“z” tablosundan yararlanarak, P(0<z<1.95)=0.4744 olarak bulunur.


Örnek:
z=-2.17 ile z=0 arasında kalan alanı hesaplayınız.

Çözüm: 0.4850

-2.17 0 z
Tablo: Standart Normal Dağılım Tablosunda Eğri Altında Kalan Alan
z .00 .01 .... .05 .... .09
0.0 0.0000 0.0040 .. 0.0199 .. 0.0359
0.1 0.0398 0.0438 .. 0.0596 .. 0.0753
0.2 0.0793 0.0832 .. 0.0987 .. 0.1141
. . . .. . .. .
. . . .. . .. .
. . . .. . .. .
2.1 0.4821 0.4826 .. 0.4850 .. 0.4857
. . . .. . .. .
. . . .. . .. .
. . . .. . .. .
3.0 0.4987 0.4987 .. 0.4989 .. 0.4990

“z” tablosundan yararlanarak, P(-2.17<z<0)=0.4850 olarak bulunur.

Belirli bir “z” değerinin sağında veya solunda kalan alan bulunurken, öncelikle ilgili
“z” değeri ile sıfır (ortalama) arasında kalan alan bulunmakta ve daha sonra bulunan bu alan
0.5’ten çıkartılmaktadır.

Örnek:
a) z=-1.54’ün solunda kalan alanı hesaplayınız.
b) z=2.32’nin sağında kalan alanı hesaplayınız.

Çözüm: a) 0.5000-0.4832=0.0618

-1.54 0
b) 0.5000-0.4898=0.0102

0 2.32 z

Standart normal dağılımdan yararlanarak pozitif iki veya negatif iki “z” değeri
arasında kalan alanı bulmak için, önce z=0 ile diğer iki z değeri arasında kalan alanlar tespit
edilir. Daha sonra büyük alandan küçük alan çıkartılarak iki “z” değeri arasında kalan alan
bulunur.

0.3830
0.4830

0 1.19 2.32 z

P(0<z<1.19)=0.3830
P((0<z<2.12)=0.4830
P(1.19<z<2.12)= P(0<z<1.19)- P((0<z<2.12)=0.4830-0.3830=0.10

Standart normal dağılımdan yararlanarak pozitif “z” değeri ile negatif “z” değeri
arasında kalan alanı bulmak için, önce negatif ve pozitif yönde z=0 ile iki “z” değeri arasında
kalan alanlar tespit edilir. Daha sonra bu alanlar toplanarak negatif “z” değeri ile pozitif “z”
değeri arasında kalan alan bulunur.

0.4406 0.4896

-1.56 0 2.31 z
P(-1.56<z<2.31)=0.4406+0.4896=0.9302
Negatif bir “z” değerinin sağ tarafında veya pozitif bir “z” değerinin sol tarafında
kalan alan bulunurken, önce ortalama ile ilgilenilen “z” değeri arasında kalan alan bulunur ve
bu değer üzerine 0.5 ilave edilir.

0.2734 0.5

-0.75 0 z

z=-0.75’in sağa tarafında kalan alan 0.5+0.2734=0.7734’e eşittir.

Sürekli tesadüfi değişkenlerin standartlaştırılması için, bu değişkenlerin değerlerinin


“z” değerine çevrilmesi gerekmektedir. Tesadüfi değişkenlerin değerinin “z” değerlerine
çevrilmesi işlemine “standartlaştırma” adı verilmektedir. Bu çevirme işlemi aşağıda verilen
formül yardımıyla yapılmaktadır.

x
z

Formülde x gözlem yada tesadüfi değişkenin değerini,  populasyonun ortalamasını ve 


standart sapmayı ifade etmektedir.
Örneğin ortalaması 50 ve standart sapması 10 olan bir normal dağılımda, x  35 ve
x  55 değerlerini standartlaştıralım, yani “z” değerlerine dönüştürelim:

x 35  50
z   1.5
 10

-1.5 0 z
x 55  50
z   0.5
 10

0 0.5 z

Örnek:
Bir paketleme tesisinde tasnifi yapılan portakalların çapları 8 cm ve standart sapması
0.5 cm’dir. Derecelendirme yaparken çapları ortalamayı ±0.6 cm’yi geçen portakallar derece
dışı kalacaklardır. Bu durumda portakalların yüzde kaçı derecelendirme dışı kalacaktır?
Çözüm:
x1  8  0.6  8.6
x 2  8  0.6  7.4

8.6  8 7.4  8
z1   1.2 ve z 2   1.2
0.5 0.5

7.4 8 8.6 x

0.1151 0.3849 0.3849 0.1151

-1.2 0 1.2 z

Bu durumda portakalların 0.1151+0.1151=0.2302’si derecelendirme dışı kalacaktır.


Normal dağılım eğrisi altında kalan alan biliniyor, ancak “x” ve “z” değerleri
bilinmiyorsa “z” tablosunda alan bulunup “z” değeri belirlenebilmekte ve daha sonra bu z
değeri “x” değerine dönüştürülebilmektedir. “z” değerinin “x” değerine dönüştürülmesinde
aşağıdaki formül kullanılmaktadır:
x    z

Örneğin ortalaması   54 ve standart sapması   8 olan normal dağılımda, 0 ile belirli bir
“z” değeri arasında kalan alanın 0.4251 olduğunu varsayalım. Acaba bu “z” değeri kaçtır? Bu
sorunun cevabını verebilmek için “z” tablosundan yaralanmalıyız.

Tablo: Standart Normal Dağılım Tablosunda Eğri Altında Kalan Alan


z .00 .01 .... .05 .... .09
0.0 0.0000 0.0040 .. 0.0199 .. 0.0359
0.1 0.0398 0.0438 .. 0.0596 .. 0.0753
0.2 0.0793 0.0832 .. 0.0987 .. 0.1141
. . . .. . .. .
. . . .. . .. .
. . . .. . .. .
1.4 .. 0.4251 .. 0.4857
. . . .. . .. .
. . . .. . .. .
. . . .. . .. .
3.0 0.4987 0.4987 .. 0.4989 .. 0.4990

Bu alan z=1.45’i temsil etmektedir. Bulunan “z değeri formülde yerine konulduğunda


x    z  54  (1.45)(8)  65.6 değeri bulunmaktadır. Yani “x” değerlerinin 54 ile 65.6
arasına düşme ihtimali %42.51’dir.

Zaman zaman iki nokta arasında kalan alan değil de, bir noktanın sağında kalan alan
bilinip, “z” ve “x” değerleri bilinememektedir. Bu gibi durumlarda bilinen alan 0.5’ten
çıkartılıp elde edilen alanı temsil eden “z” değeri bulunmakta ve daha sonra bu “z” değerine
bağlı olarak “x” değeri hesaplanmaktadır.

Örnek:
Ortalaması   50 ve standart sapması   10 olan normal dağılımda belirli bir “z”
değerinin sağında kalan alan 0.005’e eşittir. Acaba “x” ve “z” değeri nedir?
Çözüm:
Eğer belirli bir “z” değerinin sağında kalan alan 0.005’e eşitse, 0 ile bu “z” değeri
arasında kalan alan 0.50 – 0.005 = 0.4950’ye eşittir. “z” tablosundan yararlanarak bu alanın
z = 2.58’e ait olduğu rahatlıkla tespit edilmektedir. Daha sonra bu “z” değeri formülde yerine
konularak “x” değeri x    z  50  (2.58)(10)  75.8 olarak hesaplanır.

2.Binomiyal dağılıma normal yaklaşım: Daha önce binomiyal dağılımın kesikli tesadüfi
değişkenler için geçerli olduğunu belirtmiştik. Ancak deneme sayısı (n) çok arttığında ve
istenen olayın meydana gelme ihtimali (p) 0.5’e yaklaştığında normal dağılım ile binomiyal
dağılım birbirine çok yaklaşmaktadır. Normal dağılım daima simetrik olduğundan p=0.5
olduğunda ve deneme sayısı (n) çok fazla olduğunda binomiyal dağılım normal dağılıma
dönüşmektedir. Genellikle np ve nq 5’ten büyük olduğunda yada diğer bir ifade ile deneme
sayısı (n) 10’dan fazla ve p=0.5 olduğunda “binomiyal dağılıma normal yaklaşım”
kullanılmaktadır. Bu koşullarda binomiyal dağılım bu yaklaşım sayesinde sürekli tesadüfi
değişkenler için de kullanılabilmektedir.

Örnek:
ABD’de yaşayan insanların %50’sinin kredi kartına sahip olduğu tahmin edilmektedir.
Tesadüfen seçilmiş 30 ABD vatandaşının 19 tanesinin en azından 1 adet kredi kartına sahip
olma olasılığı kaçtır?

Çözüm:
n  30
p  0.5
q  1  p  0.5
x  19
n  x  11

Probleme binomiyal dağılım ile yaklaştığımızda 30 kişiden 19’unun en az 1 tane kredi


kartna sahip olma olasılığı aşağıdaki formül yardımıyla 0.0509 olarak bulunur.

P( x  19)   30 (0.50)19 (0.50)11  0.0509


 19 
Ancak np  30(0.5)  15 ve nq  30(0.5)  15 olduğundan ve her ikisi de 5’ten büyük
olduğundan binomiyal dağılıma normal yaklaşımı da kullanmak mümkündür. Bu yaklaşımın
3 temel adımı vardır:

1. adım: Binomiyal dağılım için  ve  hesaplanır.


Daha önce binomiyal dağılımın ortalamasının   np ve standart sapmasının

  npq formülleri ile hesaplandığını görmüştük. Buna göre   15 ve   2.74 olarak


bulunur.

2. adım: Kesikli değişkenler, sürekli değişkenlere çevrilir


Kesikli olasılık dağılımlarında tek bir rakam olabilmektedir ve bunun olasılığı
hesaplanabilmektedir. Oysa, sürekli olasılık dağılımlarında tek bir rakamın olasılığı sıfıra
eşittir ve belirli bir aralığın olasılığı hesaplanmaktadır. Bu sebeple kesikli değişkenlerin,
sürekli değişkenlere dönüştürülmesi için kesikli değişkenlerde “süreklilik düzeltmesi”
yapmamız gerekmektedir. Süreklilik düzeltmesi, elimizdeki rakamdan 0.5 çıkartılarak alt
sınırın ve 0.5 ilave edilerek üst sınırın bulunması ile yapılmaktadır. Eğer binomiyal dağılımda
herhangi bir “x” değerinden büyük ve küçük durumlar için olasılık hesaplanıyorsa, süreklilik
düzeltilmesi belirli bir “x” değerinden küçükler için [ P( x  10) ] yapılıyorsa bu değere 0.5
ilave edilerek; eğer büyük değerler için yapılıyorsa [ P( x  10) ] bu değerden 0.5 çıkartılarak
yapılır. Yani örneğimizdeki x  19 değeri, 18.5 ile 19.5 aralığı gibi bir aralık haline getirilir.
Böylece süreklilik düzeltmesi yapılmış olur.

15 18.5 19.5
  15 19
3. adım. Normal dağılım kullanılarak olasılık hesaplanır
Normal dağılım özelliğinden yararlanarak olasılıklar hesaplanır.
18.5  15
x  18.5 z  1.28
2.74
19.5  15
x  19.5 z  1.64
2.74

“z” tablosu kullanılarak, önce 0 ile z=1.28 arasında kalan alan 0.3997 olarak bulunur. Daha
sonra 0 ile z=1.64 arasında kalan alan 0.4495 olarak tespit edilir. Bu iki alan arasındaki fark
bize seçilen 30 kişiden 19 kişinin en azından bir adet kredi kartına sahip olma olasılığını
verecektir ki bu 0.0498’dir.

P(18.5  x  19.5)  P(1.28  z  1.64)  0.4495  0.3997  0.0498

Dikkat edilecek olursa aynı olasılık binomiyal dağılımdan yararlanarak 0.0509 olarak
bulunmuştu. Normal dağılım yaklaşımı ile bu olasılık 0.0498 olarak hesaplandı. Aralarındaki
fark normal dağılım yaklaşımı kullanılmasından kaynaklanmaktadır.

3.Üniform dağılım: Eğer sürekli tesadüfi değişkenlerin sahip olduğu olasılık bütün
aralıklarda eşit ise bu değişkene “üniform tesadüfi değişken” ve bunların gösterdiği dağılıma
da “üniform olasılık dağılımı” adı verilmektedir. Bu dağılım dikdörtgen şeklinde bir
dağılımdır (Şekil 5.5).
f (x)

1
ba

a b x
Şekil 5.5. Üniform olasılık dağılımının şekli

Dikdörtgenin alanı, eni ile boyunun çarpımına eşittir ( Alan  en. yükseklik) . Bu
dağılımda a ve b değerleri arasında kalan alan bire eşit kabul edilmektedir. Bu durumda
1
yükseklik, genişliğin 1’e bölümüne eşit olmaktadır ( yükseklik  ) . Üniform dağılımının
ba
fonksiyonu bize dikdörtgenin yüksekliğini vermektedir. a ve b değerleri arasında yer alan x
değerleri için üniform olasılık dağılımının fonksiyonu aşağıda verilmiştir.

1
f ( x)  a xb
ba

Üniform dağılımın ortalaması ve standart sapması aşağıda verilen formüller yardımıyla


hesaplanmaktadır.

ab

2
(b  a ) 2

12

Bu dağılımda a ile b aralığında yer alan x tesadüfi değişkeninin c – d noktaları arasında


yer alma olasılığı, c ile d noktaları arasında kalan alana eşittir (Şekil 5.6). Üniform dağılımın
olasılığı aşağıdaki formül yardımıyla hesaplanmaktadır.

d c
P (c  x  d ) 
ba

f (x)

P(c  x  d )

1
ba

a c d b x
Şekil 5.6. Üniform olasılık dağılımında iki nokta arasında kalan alan
Örnek:
OYSA isimli bir firma oyuncak üretmektedir. Firmada oyuncak üretiminde çalışacak
olan yeni bir işçinin bir oyuncağı monte etme süresi 20 ile 27 saat arasında değişmektedir ve
üniform bir dağılım göstermektedir.
a) Yeni işçilerin oyuncak monte etme zamanının olasılık dağılımını çizerek gösteriniz?
b)Ortalama ve standart sapmayı hesaplayınız?
c) Yeni bir işçinin oyuncak montajını öğrenme süresinin 22-24 saat olma olasılığını
hesaplayınız?
d)Yeni bir işçinin oyuncak montajını öğrenme süresinin 26 saat e daha fazla olma
olasılığını hesaplayınız?
e) Yeni bir işçinin oyuncak montajını öğrenme süresinin 23 saatten daha az olma
olasılığını hesaplayınız?

Çözüm:
a) f (x)

1
27  20

20 27 x

b)
a  b 20  27
   23.50
2 2
(b  a) 2 (27  20) 2
   2.021
12 12
c) f (x)

0.2857

1
27  20

20 22 24 27 x

24  22
P(22  x  24)   0.2857
27  20

d) f (x)

0.1429

1
27  20

20 26 27 x

27  26
P(26  x  27)  P( x  26)   0.1429
27  20
e) f (x)

0.4286

1
27  20

20 23 27 x

23  20
P(20  x  23)  P( x  23)   0.4286
27  20
3.Üstel (exponential) dağılım: Üstel dağılım, daha önce açıklanan poisson dağılımına çok
benzemektedir. Poisson dağılımında belirli bir zaman aralığında başarılı olayın meydana
gelme ihtimali önemli iken, bu dağılımda iki başarılı olayın gerçekleşmesi arasında geçen
süre önem kazanmaktadır. Üstel dağılımın tek bir parametresi vardır. Bu parametre  ’dır ve
birim zamanda gerçekleşen ortalama olay sayısını ifade etmektedir. Üstel dağılımın
fonksiyonu ve olasılığı aşağıdaki gibidir:

f ( x )  e  x

P( x  a)  e  a
P( x  a)  1  e  a burada   0 ve a  0
P(a  x  b)  e  a  e  b

 birim zamanda meydana gelen olay sayısını göstermektedir. Örneğin bir bankaya 5
dakikada 10 müşteri geldiğini varsayalım. Birim zaman olarak dakikayı seçtiğimizi

düşünürsek bankaya ortalama olarak her iki dakikada bir müşteri gelmektedir(   10  2 ).
5
Aşağıda 3 farklı  değeri için üstel dağılımın şekli verilmiştir (Şekil 5.7).

f (x)

3  3

2 2

1  1

x
Şekil 5.7. Üç farklı  değeri için üstel olasılık dağılımı
Örnek:
Bir fabrikada imalatta kullanılan bir makinenin 4 haftada bir kez arızalandığı
bilinmektedir. Arızalanmalar arasında geçen sürenin üstel dağıldığı varsayımı altında
makinenin son kez arızalandığı günden itibaren ilk 6 hafta içinde makinenin bir kez daha
arızalanma ihtimali nedir?

Çözüm:
1
  0.25
4
 0.25(6)
P( x  6)  e  e  1.5  0.2231

f (x)

0.2231

6 x

3.1.3. İstatistik dönüşümler


İstatistik analiz yöntemleri, formülleri ve hipotez kontrollerinin büyük bir çoğunluğu
verilerin normal dağılım göstermesini gerektirmektedir. Eğer veri setinde bulunan
gözlemlerin dağılımı normal dağılım göstermiyorsa söz konusu yöntem ve formüller
kullanılamamaktadır. Bu sebeple normal dağılıma uymayan dağılışlar belli dönüşümler
yapılarak normal dağılıma yaklaştırılabilirler. İstatistikte yaygın olarak (i) karekök dönüşümü,
(ii) logaritmik dönüşüm ve (iii) Arcsin dönüşümü olmak üzere üç farklı dönüşüm
kullanılmaktadır.

1. Karekök dönüşümü: Genellikle “poisson dağılımı” gösteren belirli bir alandaki yabancı ot
ve zararlı sayısı, 1000 tanedeki yabancı ot tohumu sayısı gibi değişkenler üzerinde, bu
dağılımın ortalama ve varyansı birbirine eşit olduğu için normal dağılım gerektiren “varyans
analizi” uygulanamamaktadır. Bu dağılıma varyans analizi uygulayabilmek için, verilerin
dönüştürülerek normal dağılıma yaklaştırılması gerekmektedir. Bu gibi durumlarda en uygun
dönüştürme gözlemlerin karekökünü almaktır.
Veri setinde 10 ve 10’dan daha küçük gözlemler versa ve aralarında sıfır da varsa, bu
gibi durumlarda gözlemlerin karekökünü almadan önce gözlemlere 1 ilave edilip daha sonra
karekökü xi  1 alınmalıdır.

Örnek:
Aşağıda poisson dağılımı gösteren değerler ve bunların frekans dağılımı verilmiştir. Bu
rakamların dönüşüm öncesi ortalama ve varyansı 364/300=1.213’dür. Karekökleri alınan
gözlemlerin ortalaması 433.46/300=1.445, varyansı ise 0.12’dir.

xi xi  1 fi f i xi f i xi  1
0 1.00 83 0 83
1 1.41 115 115 162.15
2 1.73 66 132 114.18
3 2.00 28 84 56.00
4 2.24 7 28 15.68
5 2.45 1 5 2.45
300 364 433.46

Şekil 5.8 ve 5.9’da dönüşüm öncesi dağılım ile dönüşüm sonrası dağılım grafik formunda
verilmiştir. Görüldüğü gibi dönüşüm öncesinde poisson dağılımı gösteren seri,
dönüştürüldükten sonra normal dağılıma yaklaşmıştır.

Frek ans

100.00

75.00

50.00

25.00

0.00

0.00 1.00 2.00 3.00 4.00 5.00

Şekil 5.8. Dönüşüm öncesi dağılım


Freka ns

100.00

75.00

50.00

25.00

0.00

0.00 1.00 2.00

Dönüştürülmüş x

Şekil 5.9. Dönüşüm sonrası dağılım

2. Logaritmik dönüşüm: Bu dönüşüm daha çok çarpık dağılım gösteren dağılımlara uygulanır.
Tarım ekonomisi alanında yaygın olarak kullanılan bir dönüşümdür. Örneğin belirli bir
yörede yer alan işletmelerin arazi büyüklüklerinin gösterdiği dağılım genellikle çarpıktır. Bu
dağılımın normale dönüştürülmesi için logaritmik dönüşüm kullanılmalıdır. Bu dönüşüm
genellikle büyük pozitif değerlere uygulanmaktadır. Eğer veri setinde sıfır ve 10’dan daha
küçük değerler varsa, gözlemlerin doğrudan doğruya logaritmasını almak yerine bun
gözlemlere 1 ilave ederek logaritması alınmalıdır. Aynı zamanda 10’dan daha küçük değerler
için karekök dönüşümü, büyük değerler için logaritmik dönüşüm uygulamak da mümkündür.

Örnek:
Çorum İli Kızılırmak havzası tarım işletmelerinin sahip olduğu mülk arazi büyüklükleri
çarpık dağılım göstermektedir. Bu seriyi normal dağılıma yaklaştırmak için logaritmik
dönüşüm uygulandığında serinin dağılımının normale yaklaştığı görülmektedir. Şekil 5.10’da
dönüşüm öncesi dağılım ve Şekil 5.11’de dönüşüm sonrası dağılım gösterilmiştir.
40

30

Frekans

20

10
Std. Dev = 18.41
Mean = 26.4
0 N = 94.00
0. 10 20 30 40 50 60 70 80
0 .0 .0 .0 .0 .0 .0 .0 .0

Mülk arazi (da)

Şekil 5.10. Çorum İli Kızılırmak havzası tarım işletmelerinin mülk arazi büyüklükleri

40

30
Frekans

20

10
Std. Dev = .83
Mean = 3.00
0 N = 94.00
.50
0.00

1.00
1.50
2.00
2.50
3.00
3.50
4.00
4.50

ln mülk arazi
Şekil 5.10. Dönüşüm sonrası Çorum İli Kızılırmak havzası tarım işletmelerinin mülk arazi
büyüklükleri
3. Arcsin dönüşümü: Binomiyal dağılımların normal dağılıma dönüştürülmesinde kullanılır.
Gözlem değerlerinin kareköklerinin arcsinüs değerleri bulunarak dönüşüm tamamlanmış olur.
Bu dönüşüm, tarım ekonomisi alanında sık karşılaşılan bir dönüşüm değildir.
Dönüşüm sonucunda elde edilen veriler orijinal haliyle sunulmak isteniyorsa, karekök
dönüşümünde ortalamanın karesi, logaritmik dönüşümde ortalamanın antilogaritması alınır.
Arcsin dönüşümünde ise istatistik kitaplarında yer alan cetveller kullanılır.

You might also like