Professional Documents
Culture Documents
Hafta
Hafta
4. BÖLÜM
2013
Dördüncü Bölüm
DEĞİŞKENLİK (YAYIKLIK)
ÖLÇÜLERİ
Öğrenme Hedefleri
Temel Kavramlar
Değişken
Değişim Aralığı
Standart Sapma ve Varyans
Çarpıklık ve Basıklık
İçindekiler
1. DEĞİŞKENLİĞİN TANIMI VE ÇEŞİTLERİ
2. DEĞİŞİM ARALIĞI (RANGE)
3. ORTALAMA MUTLAK SAPMA (OMS)
4. STANDART SAPMA VE VARYANS
5. DEĞİŞİM KATSAYISI (DK)
6. ÖRNEKLEMİN VARYANS VE STANDART SAPMASININ HESAPLANMASI
7. STANDART SAPMANIN FAYDALARI
8. ÇARPIKLIK VE BASIKLIK
9. ORTALAMALAR YARDIMIYLA ÇARPIKLIĞIN (ASİMETRİ, SKEWNESS)
HESAPLANMASI
10. MOMENTLER YARDIMIYLA ÇARPIKLIĞIN (ASİMETRİ, SKEWNESS) VE
BASIKLIĞININ (KURTOSİS) HESAPLANMASI
11. ORTALAMALAR, ÇARPIKLIK KATSAYISI VE BASIKLIK KATSAYISI
YARDIMIYLA BİR SERİNİN ANALİZİ
1. DEĞİŞKENLİĞİN TANIMI VE ÇEŞİTLERİ
Seriler için hesaplanan ve tek bir rakamla gösterilen merkezi eğilim ölçüleri, o serinin merkezi
hakkında bazı faydalı bilgiler verse de tek başına o serinin dağılımı ve diğer serilerle
karşılaştırılması için ayrıntılı bilgi vermez ve ilave bilgilere ihtiyaç vardır. Araştırmacı serinin
dağılımı (yayıklığı) yani serideki değerlerin ortalamadan ne ölçüde uzak ya da yakın olduğunu
ölçmeye ve serileri karşılaştırmaya da ihtiyaç duyar. Bunun içinde serilerin merkezi eğilim
ölçülerine ilave olarak “DEĞİŞİM” ölçülerinin de hesaplanması gerekir. Değişim ölçülerinin
önemini bir örnekle açıklayabiliriz.
ÖRNEK: Aşağıdaki seriler İktisat ve Kamu Yönetimi bölümündeki öğrencilerin istatistik final
notlarını vermektedir.
30 5
35 10
40 20
45 25
50 50
55 75
60 80
65 90
70 95
∑ X i=450 ∑ Y i=450
İki sınıfında aritmetik ortalaması ve medyanı hesaplandığında, sınıfların aynı aritmetik
ortalamaya ve medyana sahip olduğu görülmektedir.
450
X i =Y i=
9
=50 ve Medyan = 50
Merkezi eğilim ölçülerine baktığımızda iki sınıf arasında bir fark gözükmüyor olsa da verilerin
yayılımında farklılık olduğu dikkatlerden kaçmamaktadır. İktisat bölümündeki öğrencilerin
notları göreceli olarak Kamu Yönetimi bölümündeki öğrencilerin notlarından birbirine daha
yakındır. Diğer bir ifadeyle, İktisat bölümündeki öğrencilerin notları Kamu Yönetimi
bölümündeki öğrencilerin notlarıyla karşılaştırıldığından ortalama değer etrafında daha yakın
dağılmıştır. Bu nedenle serilerin diğer özelliklerini de ortaya koyacak merkezi eğilim ölçüleri
dışında değişim ölçülerine ihtiyaç vardır. Değişim ölçüleri genel olarak Değişim Aralığı (Range),
Ortalama Sapma, Standart Sapma, Varyans ve Değişim (Varyans) Katsayısı olarak bilinir.
2. DEĞİŞİM ARALIĞI (RANGE)
Serideki en büyük gözlem değeri ile en küçük gözlem değeri arasındaki farka “DEĞİŞİM
ARALIĞI” denir. Formülü aşağıdaki gibi yazılır.
R = Xmax - Xmin
Yukarıdaki örnekte İktisat bölümü için R = 70 - 30 = 40 ve Kamu yönetimi bölümü için
R = 95 - 5 = 90 olarak hesaplanır. Tüm gözlem değerlerinin birbirinden ya da ortalamadan
farklarını ortaya koymaması açısından serinin dağılımı hakkında fazla bir bilgi içermez.
Yukarıdaki örnekten de görüldüğü gibi özellikle serideki uç değerlerden aşırı etkilenmektedir.
∑ | X i− X|
OMS= i=1
N
ÖRNEK: İstatistik dersi sınavına giren 5 öğrencinin aldığı notlar aşağıdaki tabloda verilmiştir.
Öğrencilerin aldığı notların ortalama mutlak sapmasını hesaplayınız.
∑|X i− X|=84
i=1
N
∑ | X i − X| 84
OMS= i=1 = =16.8
N 5
Beş öğrencinin notlarının ortalamadan sapması mutlak değer olarak 16.8 bulunmuştur.
Tasnif edilmiş seride Ortalama Mutlak Sapma aşağıdaki formül yardımıyla hesaplanır.
k
∑ f i|X i− X|
OMS= i=1 k
∑ fi
i=1
ÖRNEK: Maliye bölümü öğrencilerinin İstatistik final sınavı notlarının tasnif edilmiş seri olarak
aşağıda verilmiştir. Bu dağılımın ortalama mutlak sapmasını hesaplayınız.
∑ f i Xi 1400
i=1
İlk aşamada aritmetik ortalama hesaplanır. X = k = =70
20
∑ fi
i=1
Aritmetik ortalamadan mutlak sapmalar (| X i−X|) bulunduktan sonra her bir gözlemin aritmetik
ortalamadan mutlak sapması frekansı ile çarpılır ( f i| X i−X| ). Bulunan değerler formülde yerine
konulduğunda tasnif edilmiş serinin OMS bulunur.
k
∑ f i|X i− X| 220
OMS= i=1 k
= =11 olarak bulunur.
20
∑ fi
i=1
∑ f i|mi−X|
OMS= i=1 k
∑ fi
i=1
ÖRNEK: Sakarya Üniversitesi İİBF öğrencilerinin istatistik yılsonu notlarının gruplanmış seri
olarak aşağıda verilmiştir. Bu dağılımın ortalama mutlak sapmasını hesaplayınız.
∑ f i mi 33550
i=1
İlk aşamada aritmetik ortalama hesaplanır. X = k = =67
500
∑ fi
i=1
Aritmetik ortalamadan mutlak sapmalar (|mi− X|) bulunduktan sonra her bir gözlemin aritmetik
ortalamadan mutlak sapması frekansı ile çarpılır ( f i|mi −X|). Bulunan değerler formülde yerine
konulduğunda tasnif edilmiş serinin OMS bulunur.
k
∑ f i|mi−X| 8350
OMS= i=1 k
= =16.7 olarak bulunur.
500
∑ fi
i=1
N
σ= √∑
i=1
¿¿¿¿
ÖRNEK: İstatistik dersi sınavına giren 5 öğrencinin aldığı notlar aşağıdaki tabloda verilmiştir.
Öğrencilerin aldığı notların (basit serinin) varyansını ve standart sapmasını hesaplayınız.
∑ ¿¿ ¿
i=1
N
2
σ =∑ ¿ ¿ ¿
i=1
N
σ= √∑
i=1
¿¿¿¿
Her bir öğrencinin notu aritmetik ortalamadan (66) ortalama olarak 18.5 standart sapma farklılık
göstermektedir.
Tasnif edilmiş serilerde Varyans ve Standart Sapma aşağıdaki formül yardımıyla hesaplanır.
N
σ 2=∑ f i ¿ ¿ ¿
i=1
N
σ= √∑
i=1
f i¿¿¿¿
ÖRNEK: Maliye bölümü öğrencilerinin İstatistik final sınavı notlarının tasnif edilmiş seri olarak
aşağıda verilmiştir. Bu dağılımın (tasnif edilmiş serinin) varyansını ve standart sapmasını
hesaplayınız.
Öğrencilerin fi ( X ¿ ¿i−μ) ¿ ¿ f i¿
Notları (Xi)
40 1 -30 900 900
50 2 -20 400 800
60 4 -10 100 400
70 6 0 0 0
80 4 10 100 400
90 2 20 400 800
100 1 30 900 900
k N
∑ f i=20 ∑ fi¿¿
Toplam i=1 i=1
k
∑ f i Xi 1400
i=1
İlk aşamada aritmetik ortalama hesaplanır. µ= k = =70
20
∑ fi
i=1
N
σ 2=∑ f i ¿ ¿ ¿
i=1
N
σ= √∑
i=1
f i ¿¿¿¿ Her bir öğrencinin notu
aritmetik ortalamadan (70) ortalama olarak 14.5 standart sapma farklılık göstermektedir.
N
σ= √∑i=1
f i¿¿¿¿
ÖRNEK: Sakarya Üniversitesi İİBF öğrencilerinin istatistik yılsonu notlarının gruplanmış seri
olarak aşağıda verilmiştir. Bu dağılımın varyans ve standart sapmasını hesaplayınız.
Not (mi−μ) ¿
Sınıfları mi fi mifi f i¿
(Gruplar)
90-100 95 50 4750 28 784 39200
85-89 87 60 5220 20 400 24000
80-84 82 40 3280 15 225 9000
75-79 77 50 3850 10 100 5000
70-74 72 100 7200 5 25 2500
60-69 64,5 50 3225 -2.5 6.25 312.5
50-59 54,5 60 3270 -12.5 156.25 9375
40-49 44,5 40 1780 -22.5 506.25 20250
0-39 19,5 50 975 -47.5 2256.25 112812.5
n
∑ f i=500 N
Toplam i=1 33550
∑ f i ¿ ¿222450
i=1
k
∑ f i mi 33550
i=1
İlk aşamada aritmetik ortalama hesaplanır. µ= k = =67
500
∑ fi
i=1
İkinci aşamada sınıf orta değerleri (mi) bulunur. Tabloda bulunan değerler formülde yerine
konulduğunda gruplanmış seride varyans ve standart sapma bulunur.
N
σ 2=∑ f i ¿ ¿ ¿
i=1
N
σ= √∑
i=1
f i¿¿¿¿
Her bir öğrencinin notu aritmetik ortalamadan (67) ortalama olarak 21 standart sapma farklılık
göstermektedir.
Ölçüm birimleri aynı olan iki serinin dağılımının değişkenliğini karşılaştırmak mümkün iken
farklı ölçü birimleri kullanan iki serinin dağılımının değişimlerini gösteren standart sapmaları
karşılaştırmak mümkün değildir. Bu nedenle serilerin standart sapmasının ortalamasına göre
yüzdesi alınarak “DEĞİŞİM KATSAYISI” hesaplanır. Serilerin değişim katsayıları yardımıyla
değişkenlikleri karşılaştırılabilir. Değişim katsayısının formülü aşağıda verilmiştir.
σ
DK = 100
μ
Bu formül yardımıyla hesaplanan değişim katsayılarında ölçü birimleri ortadan kalkarak bir
değişim oranı bulunmuştur ve bu oranlar karşılaştırılabilir.
ÖRNEK: Tabloda 5 kişiye ait yaş ve ağırlıklardan vermektedir. Bu kişilerin yaş ve ağırlıklarından
oluşan bu iki serinin değişkenliklerini karşılaştırınız.
200 380
µyaş = 5
=40 y ıl µağırlık = 5
=76 kg
1000 1178
σyaş = √ 5
= √200=14.4 y ıl σağırlık = √ 5
=√ 235.6=15.4 kg
Yaş ve ağırlıklardan oluşan iki serinin standart sapmalarını karşılaştırdığımızda ağırlık serisindeki
değişimin daha fazla olduğu sonucu ortaya çıkmaktadır ki bu sonuç bizi yanıltır. İki serinin ölçü
birimleri farklı olduğundan standart sapmalarını karşılaştırarak böyle bir sonuca varmak yanıltıcı
olacaktır. Doğru yöntem her iki serinin değişim katsayılarını karşılaştırmaktır.
14.4 15.4
DKyaş = 100=36 DKağırlık = 100=20.2
40 76
Ağırlık serisinin standart sapması daha yüksek olmasına rağmen, yaş serisinin değişim katsayısı
daha yüksektir. Dolasıyla yaş serisinin değişkenliği ağırlık serisinden daha yüksektir.
S2 = Örneklemin varyansı.
X́ = Örneklemin aritmetik ortalaması.
n = Örneklemin gözlem sayısı
n-1 = Serbestlik derecesi. Örnekten bir değer hesaplanırken parametre yerine kullanılan her
istatistik için gözlem sayısından bir eksiltilir.
Örneklemin standart sapması aşağıdaki formül yardımıyla hesaplanır.
n
S= √ ∑ ¿¿ ¿ ¿
i =1
8. ÇARPIKLIK VE BASIKLIK
Serilerin dağılımı hakkında ortalamalar ve değişim ölçüleri yardımıyla belli ölçüde bilgi
edinebiliriz. Bu iki ölçünün yanında, serilerin simetriden ne kadar uzaklaştığını gösteren
“Çarpıklık Katsayısı” ve serinin yüksekliğinin normal serinin yüksekliğinden ne kadar
uzaklaştığını gösteren “Basıklık Katsayısı” hesaplanabilir.
Serinin frekans dağılımını gösteren yukarıdaki şekilden verilerin merkezi eğilim ölçüleri etrafında
simetrik dağıldığını söyleyebiliriz. Bu serinin mod, medyan ve aritmetik ortalaması birbirine
eşittir. Aşırı büyük ve küçük değerlerin frekansları eşit ya da birbirine çok yakındır.
Öğrencilerin istatistik dersinden aldıkları notlar ortalama etrafında simetrik olarak dağılıyorsa
yukardaki durum söz konusu olacaktır.
Serinin frekans dağılımını gösteren yukarıdaki şekil sağa doğru uzun kuyrukludur. Sağa çarpık
frekans dağılıma sahip olan bu seride merkezi eğilim ölçüleri arasındaki ilişki aşağıdaki gibidir.
Sağa çarpık serilerde Mod < Medyan < X
Aşırı küçük değerlerin frekansı büyük değerlerin frekansından daha fazladır. Bundan dolayı
aritmetik ortalama medyandan ve medyanda moddan daha büyüktür. Öğrencilerin istatistik
dersinden aldıkları notların çoğunluğu aritmetik ortalamadan küçükse yukarıdaki şekilde olduğu
gibi sağa çarpık frekans dağılımı söz konusu olacaktır. Yüksek değerli gözlemler geniş bir
aralıkta yer alırken düşük değerli gözlemler nispeten bir arada toplanmıştır.
Serinin frekans dağılımını gösteren yukarıdaki şekil ola doğru uzun kuyrukludur. Sola çarpık
frekans dağılıma sahip olan bu seride merkezi eğilim ölçüleri arasındaki ilişki aşağıdaki gibidir.
Aşırı büyük değerlerin frekansı küçük değerlerin frekansından daha fazladır. Bundan dolayı
aritmetik ortalama medyandan ve medyanda moddan daha küçüktür. Öğrencilerin istatistik
dersinden aldıkları notların çoğunluğu aritmetik ortalamadan büyükse yukarıdaki şekilde olduğu
gibi sağa çarpık frekans dağılımı söz konusu olacaktır. Düşük değerli gözlemler geniş bir aralıkta
yer alırken yüksek değerli gözlemler nispeten bir arada toplanmıştır.
X́ −Mod 3( X́ −Medyan)
ÇK = ve ÇK =
σ σ
ÇK = 0 Seri simetriktir
ÖRNEK: Bahçeliköy’de yaşayan aileler çocuk sayılarına göre tasnif edilmiş seri olarak aşağıda
verilmiştir. Bu dağılımın çarpıklık katsayısını hesaplayınız ve yorumlayınız.
(Xi) Sayısı fi
0 1 0 -2.3 5.3 5.3
1 3 3 -1.3 1.7 5.1
2 8 16 -0.3 0.1 0.8
3 5 15 0.7 0.5 2.5
4 3 12 1.7 2.9 8.7
n n
22.4
Toplam
∑ f i=20 ∑ f i X i=46
i=1 i=1
İlk aşamada serinin aritmetik ortalama, mod, medyan ve standart sapmasını hesaplamalıyız.
Serinin aritmetik ortalama, mod, medyan ve standart sapması aşağıdaki gibi hesaplanmıştır.
k
∑ f i Xi 46
µ= i=1k = =2.3 , Mod = 2, Medyan = 2,
20
∑ fi
i=1
N
σ= √ ∑ f i ¿¿¿¿
i=1
Bu seride aritmetik ortalama medyan ve moddan büyük olduğu için sağa çarpıktır. Çarpıklık
derecesi ya da katsayısı bulunan değerlerin formülde yerine konulmasıyla aşağıdaki gibi bulunur.
µ−Mod 2.3−2
ÇK = = =0.28
σ 1.06
Birinci moment:
∑ ( X i− X́ ¿)
μ1= i=1 =0¿
N
N
İkinci moment: μ2=∑ ¿ ¿¿
i =1
N
Üçüncü moment: μ3=∑ ¿ ¿ ¿
i=1
N
Dördüncü moment: μ4 =∑ ¿ ¿ ¿
i=1
10.2. Tasnif Edilmiş Serilerde Momentler
N
Birinci moment:
∑ f i ( X i− X́ ¿)
μ1= i=1 =0 ¿
N
N
İkinci moment: μ2=∑ f i ¿ ¿ ¿
i =1
N
Üçüncü moment: μ3=∑ f i ¿ ¿ ¿
i=1
N
Dördüncü moment: μ4 =∑ f i ¿ ¿ ¿
i=1
Birinci moment:
∑ f i (mi− X́ ¿)
μ1= i=1 =0 ¿
N
N
İkinci moment: μ2=∑ f i ¿ ¿ ¿
i =1
N
Üçüncü moment: μ3=∑ f i ¿ ¿ ¿
i=1
N
Dördüncü moment: μ4 =∑ f i ¿ ¿ ¿
i=1
N
ÇK =∑ f i ¿ ¿¿ ¿
i=1
İlk aşamada serinin üçüncü momentini ve standart sapmasını hesaplamalıyız. Serinin üçüncü
momenti ve standart sapması yukarıdaki tablo yardımıyla aşağıdaki gibi hesaplanmıştır.
k
∑ f i Xi 46
µ= i=1k = =2.3 ,
20
∑ fi
i=1
N
μ3=∑ f i ¿ ¿ ¿
i=1
N
σ= √∑
i=1
f i ¿¿¿¿
σ 3 =1.2
N
ÇK =∑ f i ¿ ¿¿ ¿
i=1
Genel olarak, |ÇK |>0.50 ise kuvvetli çarpık ve |ÇK |>0.50 ise zayıf çarpık denilebilir.
Bir serinin frekans dağılımının basıklığı dördüncü moment yardımıyla hesaplanabilir. Serinin
hesaplanan dördüncü dereceden momenti yine aynı serinin standart sapmasının dördüncü
kuvvetine bölünürse standart bir basıklık ölçü birimi elde edilmiş olur. Momentler yardımıyla
basıklık katsayısı (BK) aşağıdaki şekilde formüle edilebilir ve yorumlanabilir.
N
BK =∑ f i ¿ ¿ ¿ ¿3 Serinin dağılımının yüksekliği
i=1
ÖRNEK: Bahçeliköy’de yaşayan aileler çocuk sayılarına göre tasnif edilmiş seri olarak aşağıda
verilmiştir. Bu dağılımın çarpıklık katsayısını momentler yardımıyla hesaplayınız ve
yorumlayınız.
∑ f i Xi 46
µ= i=1k = =2.3 ,
20
∑ fi
i=1
N
μ4 =∑ f i ¿ ¿ ¿
i=1
N
σ= √∑i=1
f i ¿¿¿¿
σ 4= 1.26
N
ÇK =∑ f i ¿ ¿¿ ¿
i=1
Serinin basıklık katsayısı 2.86’dır. Seri standart normal dağılıma göre daha basıktır.
ÇK = 0 ÇK > 0 ÇK < 0
Simetrik ve
BK = 3
basıklığı normal
Asimetrisi negatif ve
Asimetrisi pozitif ve
BK > 3 normale göre sivri
normale göre sivri
Asimetrisi pozitif ve Asimetrisi negatif ve
BK < 3
normale göre basık normale göre basık
Serilerin çarpıklık ve basıklık katsayısının serilerin frekansının dağılımını nasıl belirlediği frekans
dağılımının grafiği yardımıyla da görülebilir.
Yukarıda standart normal bir dağılımın grafiği mevcuttur. Serinin ÇK=0 olması simetrik ve
BK > 3 olması basıklığının normalden sivri olduğunu göstermektedir. Dikkat edilirse diğer
veriler sabitken serinin standart sapmasının azalması BK’nı artıracağından serinin frekans
dağılımının sivriliği artacaktır.
Değerlendirme Soruları
1 - Normal dağılış eğrisinde veriler yayvan dağılımlı olabildiği gibi sivri yayılımlı da
olabilmektedir. Bu durum ne olarak adlandırılır?
Kaynakça
1. Yılmaz Özkan, Uygulamalı İstatistik 1, Sakarya Kitapevi, 2008.
2. Özer Serper, Uygulamalı İstatistik 1, Filiz Kitapevi, 1996.
3. Meriç Öztürkcan, İstatistik Ders notları, YTÜ.
4. Andım Oben Balce ve Serdar Demir, İstatistik Ders Notları, Pamukkale Üniversitesi,
2007.
5. Ayşe Canan Yazıcı, Biyoistatistik Ders Notları, Başkent Üniversitesi.
6. Zehra Muluk ve Yavuz Eren Ataman, Biyoistatistik ve Araştırma Teknikleri Ders Notları,
Başkent Üniversitesi.