Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 23

İSTATİSTİK

4. BÖLÜM

DEĞİŞKENLİK (YAYIKLIK) ÖLÇÜLERİ


Doç. Dr. Şakir GÖRMÜŞ

2013
Dördüncü Bölüm
DEĞİŞKENLİK (YAYIKLIK)
ÖLÇÜLERİ

Öğrenme Hedefleri

Bu bölümü çalıştıktan sonra;

- İstatistikte değişkenliği tanımlayabilir.


- İstatiksel olarak toplanan verilerin değişim aralığını hesaplayabilir ve yorumlayabilir.
- İstatiksel olarak toplanan verilerin ortalama mutlak sapmasını hesaplayabilir ve yorumlayabilir.
- İstatiksel olarak toplanan verilerin standart sapma ve varyansını hesaplayabilir ve
yorumlayabilir.

Temel Kavramlar

 Değişken
 Değişim Aralığı
 Standart Sapma ve Varyans
 Çarpıklık ve Basıklık

İçindekiler
1. DEĞİŞKENLİĞİN TANIMI VE ÇEŞİTLERİ
2. DEĞİŞİM ARALIĞI (RANGE)
3. ORTALAMA MUTLAK SAPMA (OMS)
4. STANDART SAPMA VE VARYANS
5. DEĞİŞİM KATSAYISI (DK)
6. ÖRNEKLEMİN VARYANS VE STANDART SAPMASININ HESAPLANMASI
7. STANDART SAPMANIN FAYDALARI
8. ÇARPIKLIK VE BASIKLIK
9. ORTALAMALAR YARDIMIYLA ÇARPIKLIĞIN (ASİMETRİ, SKEWNESS)
HESAPLANMASI
10. MOMENTLER YARDIMIYLA ÇARPIKLIĞIN (ASİMETRİ, SKEWNESS) VE
BASIKLIĞININ (KURTOSİS) HESAPLANMASI
11. ORTALAMALAR, ÇARPIKLIK KATSAYISI VE BASIKLIK KATSAYISI
YARDIMIYLA BİR SERİNİN ANALİZİ
1. DEĞİŞKENLİĞİN TANIMI VE ÇEŞİTLERİ

Seriler için hesaplanan ve tek bir rakamla gösterilen merkezi eğilim ölçüleri, o serinin merkezi
hakkında bazı faydalı bilgiler verse de tek başına o serinin dağılımı ve diğer serilerle
karşılaştırılması için ayrıntılı bilgi vermez ve ilave bilgilere ihtiyaç vardır. Araştırmacı serinin
dağılımı (yayıklığı) yani serideki değerlerin ortalamadan ne ölçüde uzak ya da yakın olduğunu
ölçmeye ve serileri karşılaştırmaya da ihtiyaç duyar. Bunun içinde serilerin merkezi eğilim
ölçülerine ilave olarak “DEĞİŞİM” ölçülerinin de hesaplanması gerekir. Değişim ölçülerinin
önemini bir örnekle açıklayabiliriz.

ÖRNEK: Aşağıdaki seriler İktisat ve Kamu Yönetimi bölümündeki öğrencilerin istatistik final
notlarını vermektedir.

İktisat Bölümü (Xi) Kamu Yönetimi Bölümü (Yi)

30 5
35 10
40 20
45 25
50 50
55 75
60 80
65 90
70 95
∑ X i=450 ∑ Y i=450
İki sınıfında aritmetik ortalaması ve medyanı hesaplandığında, sınıfların aynı aritmetik
ortalamaya ve medyana sahip olduğu görülmektedir.

450
X i =Y i=
9
=50 ve Medyan = 50
Merkezi eğilim ölçülerine baktığımızda iki sınıf arasında bir fark gözükmüyor olsa da verilerin
yayılımında farklılık olduğu dikkatlerden kaçmamaktadır. İktisat bölümündeki öğrencilerin
notları göreceli olarak Kamu Yönetimi bölümündeki öğrencilerin notlarından birbirine daha
yakındır. Diğer bir ifadeyle, İktisat bölümündeki öğrencilerin notları Kamu Yönetimi
bölümündeki öğrencilerin notlarıyla karşılaştırıldığından ortalama değer etrafında daha yakın
dağılmıştır. Bu nedenle serilerin diğer özelliklerini de ortaya koyacak merkezi eğilim ölçüleri
dışında değişim ölçülerine ihtiyaç vardır. Değişim ölçüleri genel olarak Değişim Aralığı (Range),
Ortalama Sapma, Standart Sapma, Varyans ve Değişim (Varyans) Katsayısı olarak bilinir.
2. DEĞİŞİM ARALIĞI (RANGE)

Serideki en büyük gözlem değeri ile en küçük gözlem değeri arasındaki farka “DEĞİŞİM
ARALIĞI” denir. Formülü aşağıdaki gibi yazılır.

R = Xmax - Xmin
Yukarıdaki örnekte İktisat bölümü için R = 70 - 30 = 40 ve Kamu yönetimi bölümü için
R = 95 - 5 = 90 olarak hesaplanır. Tüm gözlem değerlerinin birbirinden ya da ortalamadan
farklarını ortaya koymaması açısından serinin dağılımı hakkında fazla bir bilgi içermez.
Yukarıdaki örnekten de görüldüğü gibi özellikle serideki uç değerlerden aşırı etkilenmektedir.

3. ORTALAMA MUTLAK SAPMA (OMS)


Değişim aralığı hesaplanırken serideki tüm değerler kullanılmadığı için bilgi kaybı olabilir ve bu
bir eksikliktir. Bundan dolayı serideki değişimi ölçmek için daha ileri ve tüm değerleri hesaba
katan değişim ölçülerine ihtiyaç vardır.

Bir serideki gözlem değerlerinin o serinin aritmetik ortalamasından farklarının (sapmalarının)


mutlak değerinin ortalamasına “ORTALAMA MUTLAK SAPMA” denir. Bu değişim ölçüsü
gözlem değerlerinin aritmetik ortalamadan ne kadar saptığını göstermesi açısından değişkenlik
hakkında bilgi içerir. Ortalama mutlak sapma basit seriler, tasnif edilmiş seriler ve gruplanmış
seriler için hesaplanabilir.
3.1. Basit Seride Ortalama Mutlak Sapma

Basit seride Ortalama Mutlak Sapma aşağıdaki formül yardımıyla hesaplanır.


N

∑ | X i− X|
OMS= i=1
N
ÖRNEK: İstatistik dersi sınavına giren 5 öğrencinin aldığı notlar aşağıdaki tabloda verilmiştir.
Öğrencilerin aldığı notların ortalama mutlak sapmasını hesaplayınız.

İstatistik Notları (Xi) Ortalama Sapmalar Ortalama Mutlak Sapmalar


( X ¿ ¿i− X )¿ | X i−X|
70 70 - 66 = 4 4
80 80 - 66 = 14 14
40 40 - 66 = -26 26
90 90 - 66 = 24 24
50 50 – 66 = -16 16
X =66 0 N

∑|X i− X|=84
i=1
N

∑ | X i − X| 84
OMS= i=1 = =16.8
N 5

Beş öğrencinin notlarının ortalamadan sapması mutlak değer olarak 16.8 bulunmuştur.

3.2. Tasnif Edilmiş Seride Ortalama Mutlak Sapma

Tasnif edilmiş seride Ortalama Mutlak Sapma aşağıdaki formül yardımıyla hesaplanır.
k

∑ f i|X i− X|
OMS= i=1 k

∑ fi
i=1

ÖRNEK: Maliye bölümü öğrencilerinin İstatistik final sınavı notlarının tasnif edilmiş seri olarak
aşağıda verilmiştir. Bu dağılımın ortalama mutlak sapmasını hesaplayınız.

Öğrencilerin fi Xi | X i−X| f i| X i−X|


Notları (Xi) fi
40 1 40 30 30
50 2 100 20 40
60 4 240 10 40
70 6 420 0 0
80 4 320 10 40
90 2 180 20 40
100 1 100 30 30
k k k

∑ f i=20 ∑ f i X i=1400 ∑ f i|X i− X|=¿220 ¿


Toplam i=1 i=1 i=1

∑ f i Xi 1400
i=1
İlk aşamada aritmetik ortalama hesaplanır. X = k = =70
20
∑ fi
i=1

Aritmetik ortalamadan mutlak sapmalar (| X i−X|) bulunduktan sonra her bir gözlemin aritmetik

ortalamadan mutlak sapması frekansı ile çarpılır ( f i| X i−X| ). Bulunan değerler formülde yerine
konulduğunda tasnif edilmiş serinin OMS bulunur.
k

∑ f i|X i− X| 220
OMS= i=1 k
= =11 olarak bulunur.
20
∑ fi
i=1

3.3. Gruplanmış Seride Ortalama Mutlak Sapma

Gruplanmış seride Ortalama Mutlak Sapma aşağıdaki formül yardımıyla hesaplanır.


k

∑ f i|mi−X|
OMS= i=1 k

∑ fi
i=1
ÖRNEK: Sakarya Üniversitesi İİBF öğrencilerinin istatistik yılsonu notlarının gruplanmış seri
olarak aşağıda verilmiştir. Bu dağılımın ortalama mutlak sapmasını hesaplayınız.

Not |mi− X| f i|mi −X|


Sınıfları mi fi mifi
(Gruplar)
90-100 95 50 4750 28 1400
85-89 87 60 5220 20 1200
80-84 82 40 3280 15 600
75-79 77 50 3850 10 500
70-74 72 100 7200 5 500
60-69 64,5 50 3225 2.5 125
50-59 54,5 60 3270 12.5 750
40-49 44,5 40 1780 22.5 900
0-39 19,5 50 975 47.5 2375
n k

∑ f i=500 ∑ f i|mi−X|=¿ 8350 ¿


i=1 i=1

∑ f i mi 33550
i=1
İlk aşamada aritmetik ortalama hesaplanır. X = k = =67
500
∑ fi
i=1

İkinci aşamada sınıf orta değerleri (mi) bulunur.

Aritmetik ortalamadan mutlak sapmalar (|mi− X|) bulunduktan sonra her bir gözlemin aritmetik

ortalamadan mutlak sapması frekansı ile çarpılır ( f i|mi −X|). Bulunan değerler formülde yerine
konulduğunda tasnif edilmiş serinin OMS bulunur.
k

∑ f i|mi−X| 8350
OMS= i=1 k
= =16.7 olarak bulunur.
500
∑ fi
i=1

4. STANDART SAPMA VE VARYANS

Gözlem değerlerinin aritmetik ortalamadan farklarının toplamı sıfır olacağından, bu farkların


mutlak değerini alarak ortalama mutlak sapmaları hesapladık. Mutlak ortalama sapmaya alternatif
olarak bir değişkenlik ölçüsü olarak standart sapma kullanılabilir. Bir serideki gözlem
değerlerinin o serinin aritmetik ortalamasından farklarının (sapmalarının) karesinin toplamının
ortalamasına “VARYANS” ve karekökü alınan varyansa “STANDART SAPMA” denir.
Ana kütlenin varyansı σ 2 ve standart sapması σ (sigma) simgesi ile gösterilirken, örneklemin
varyansı s2 ve standart sapması s simgesi ile gösterilir. Gözlem değerlerinin aritmetik
ortalamadan sapmalarının kareleri minimum olduğundan standart sapma ortalama mutlak
sapmadan daha küçük çıkacağından değişim ölçüsü olarak standart sapma daha genel kabul
görmektedir. Serilerdeki varyans ve dolayısıyla standart sapma arttıkça serinin yayıklığı
artmaktadır. Ana kütlenin aritmetik ortalaması μ ve örneklemin aritmetik ortalaması X́ simgesi ile
gösterilir. Bu bölümde ana kütle üzerinde çalışacağımız varsayımı altında aritmetik ortalama μ ile
gösterilecektir.

4.1. Basit Seride Standart Sapma ve Varyans

Basit serilerde Varyans ve Standart Sapma aşağıdaki formül yardımıyla hesaplanır.


N
2
σ =∑ ¿ ¿ ¿
i=1

N
σ= √∑
i=1
¿¿¿¿

ÖRNEK: İstatistik dersi sınavına giren 5 öğrencinin aldığı notlar aşağıdaki tabloda verilmiştir.
Öğrencilerin aldığı notların (basit serinin) varyansını ve standart sapmasını hesaplayınız.

İstatistik Notları (Xi) Ortalama Sapmalar Ortalama Mutlak Sapmalar


( X ¿ ¿i−μ) ¿ ¿¿
70 70 - 66 = 4 16
80 80 - 66 = 14 196
40 40 - 66 = -26 676
90 90 - 66 = 24 576
50 50 – 66 = -16 256
µ=66 0 N

∑ ¿¿ ¿
i=1

N
2
σ =∑ ¿ ¿ ¿
i=1

N
σ= √∑
i=1
¿¿¿¿

Her bir öğrencinin notu aritmetik ortalamadan (66) ortalama olarak 18.5 standart sapma farklılık
göstermektedir.

4.2. Tasnif Edilmiş Seride Standart Sapma ve Varyans

Tasnif edilmiş serilerde Varyans ve Standart Sapma aşağıdaki formül yardımıyla hesaplanır.
N
σ 2=∑ f i ¿ ¿ ¿
i=1

N
σ= √∑
i=1
f i¿¿¿¿

ÖRNEK: Maliye bölümü öğrencilerinin İstatistik final sınavı notlarının tasnif edilmiş seri olarak
aşağıda verilmiştir. Bu dağılımın (tasnif edilmiş serinin) varyansını ve standart sapmasını
hesaplayınız.

Öğrencilerin fi ( X ¿ ¿i−μ) ¿ ¿ f i¿
Notları (Xi)
40 1 -30 900 900
50 2 -20 400 800
60 4 -10 100 400
70 6 0 0 0
80 4 10 100 400
90 2 20 400 800
100 1 30 900 900
k N

∑ f i=20 ∑ fi¿¿
Toplam i=1 i=1
k

∑ f i Xi 1400
i=1
İlk aşamada aritmetik ortalama hesaplanır. µ= k = =70
20
∑ fi
i=1

N
σ 2=∑ f i ¿ ¿ ¿
i=1

N
σ= √∑
i=1
f i ¿¿¿¿ Her bir öğrencinin notu

aritmetik ortalamadan (70) ortalama olarak 14.5 standart sapma farklılık göstermektedir.

4.3. Gruplanmış Seride Standart Sapma ve Varyans

Gruplanmış serilerde Varyans ve Standart Sapma aşağıdaki formül yardımıyla hesaplanır.


N
σ 2=∑ f i ¿ ¿ ¿
i=1

N
σ= √∑i=1
f i¿¿¿¿

ÖRNEK: Sakarya Üniversitesi İİBF öğrencilerinin istatistik yılsonu notlarının gruplanmış seri
olarak aşağıda verilmiştir. Bu dağılımın varyans ve standart sapmasını hesaplayınız.

Not (mi−μ) ¿
Sınıfları mi fi mifi f i¿
(Gruplar)
90-100 95 50 4750 28 784 39200
85-89 87 60 5220 20 400 24000
80-84 82 40 3280 15 225 9000
75-79 77 50 3850 10 100 5000
70-74 72 100 7200 5 25 2500
60-69 64,5 50 3225 -2.5 6.25 312.5
50-59 54,5 60 3270 -12.5 156.25 9375
40-49 44,5 40 1780 -22.5 506.25 20250
0-39 19,5 50 975 -47.5 2256.25 112812.5
n

∑ f i=500 N
Toplam i=1 33550
∑ f i ¿ ¿222450
i=1
k

∑ f i mi 33550
i=1
İlk aşamada aritmetik ortalama hesaplanır. µ= k = =67
500
∑ fi
i=1

İkinci aşamada sınıf orta değerleri (mi) bulunur. Tabloda bulunan değerler formülde yerine
konulduğunda gruplanmış seride varyans ve standart sapma bulunur.

N
σ 2=∑ f i ¿ ¿ ¿
i=1

N
σ= √∑
i=1
f i¿¿¿¿

Her bir öğrencinin notu aritmetik ortalamadan (67) ortalama olarak 21 standart sapma farklılık
göstermektedir.

5. DEĞİŞİM KATSAYISI (DK)

Ölçüm birimleri aynı olan iki serinin dağılımının değişkenliğini karşılaştırmak mümkün iken
farklı ölçü birimleri kullanan iki serinin dağılımının değişimlerini gösteren standart sapmaları
karşılaştırmak mümkün değildir. Bu nedenle serilerin standart sapmasının ortalamasına göre
yüzdesi alınarak “DEĞİŞİM KATSAYISI” hesaplanır. Serilerin değişim katsayıları yardımıyla
değişkenlikleri karşılaştırılabilir. Değişim katsayısının formülü aşağıda verilmiştir.

σ
DK = 100
μ
Bu formül yardımıyla hesaplanan değişim katsayılarında ölçü birimleri ortadan kalkarak bir
değişim oranı bulunmuştur ve bu oranlar karşılaştırılabilir.

ÖRNEK: Tabloda 5 kişiye ait yaş ve ağırlıklardan vermektedir. Bu kişilerin yaş ve ağırlıklarından
oluşan bu iki serinin değişkenliklerini karşılaştırınız.

Yaş (Yıl) (Xi - µyaş)2 Ağırlık (Kilogram) (Xi - µağırlık)2


20 400 52 576
30 100 70 36
40 0 75 1
50 100 85 81
60 400 98 484
∑ ¿200 ∑ ¿1000 ∑ ¿380 ∑ ¿1178
Yaş ve ağırlık farklı ölçü birimleri ile ölçüldüğünden standart sapmalarına bakarak serilerin
değişimlerini karşılaştırmak sağlıklı olmaz. Değişim katsayılarını hesaplamamız gerekir.

200 380
µyaş = 5
=40 y ıl µağırlık = 5
=76 kg

1000 1178
σyaş = √ 5
= √200=14.4 y ıl σağırlık = √ 5
=√ 235.6=15.4 kg

Yaş ve ağırlıklardan oluşan iki serinin standart sapmalarını karşılaştırdığımızda ağırlık serisindeki
değişimin daha fazla olduğu sonucu ortaya çıkmaktadır ki bu sonuç bizi yanıltır. İki serinin ölçü
birimleri farklı olduğundan standart sapmalarını karşılaştırarak böyle bir sonuca varmak yanıltıcı
olacaktır. Doğru yöntem her iki serinin değişim katsayılarını karşılaştırmaktır.

14.4 15.4
DKyaş = 100=36 DKağırlık = 100=20.2
40 76

Ağırlık serisinin standart sapması daha yüksek olmasına rağmen, yaş serisinin değişim katsayısı
daha yüksektir. Dolasıyla yaş serisinin değişkenliği ağırlık serisinden daha yüksektir.

6. ÖRNEKLEMİN VARYANS VE STANDART SAPMASININ HESAPLANMASI

Örneklemin varyansı aşağıdaki formül yardımıyla hesaplanır.


n
S2=∑ ¿ ¿¿
i =1

S2 = Örneklemin varyansı.
X́ = Örneklemin aritmetik ortalaması.
n = Örneklemin gözlem sayısı
n-1 = Serbestlik derecesi. Örnekten bir değer hesaplanırken parametre yerine kullanılan her
istatistik için gözlem sayısından bir eksiltilir.
Örneklemin standart sapması aşağıdaki formül yardımıyla hesaplanır.

n
S= √ ∑ ¿¿ ¿ ¿
i =1

S = Örneklemin standart sapması.

7. STANDART SAPMANIN FAYDALARI

1. Kareler toplamı dolayısıyla varyans minimumdur.


2. Standart sapma büyüdükçe (küçüldükçe) serinin grafiğinin yaygınlığı artar (azalır).
3. Gözlem değerlerinin aritmetik ortalamadan sapmalarının standart sapma cinsinden ifade
edebiliriz. Örneğin istatistik sınavının ortalaması 60 ve standart sapması 10 olsun. Bir
öğrenci bu sınavdan 90 almıştır. Bu öğrenci ortalamadan 30 puan fazla almıştır. Standart
sapma cinsinden ise ortalamadan 2 standart sapma daha yüksek almıştır.
4. Aynı ölçü birimini kullanan farklı serilerdeki gözlem değerlerini standart sapma cinsinden
karşılaştırabiliriz. Örneğin bir öğrenci istatistik dersi birinci vizesinden 40 ( X́ =30 ve S=5
) ve ikinci vizesinden 80 ( X́ =60 ve S=20) almıştır. Bu öğrenci ilk vizede sınıf
ortalamasından 10 puan ikinci sınavda ise 20 puan yüksek not almıştır. Standart sapma
cinsinden hesapladığımızda, bu öğrenci ilk vizede sınıf ortalamasından 2 standart sapma
ve ikinci sınavda ise sınıf ortalamasından 1 standart sapma daha yüksek not almıştır.
Dolayısıyla öğrenci birinci vizede daha başarılıdır.

8. ÇARPIKLIK VE BASIKLIK

Serilerin dağılımı hakkında ortalamalar ve değişim ölçüleri yardımıyla belli ölçüde bilgi
edinebiliriz. Bu iki ölçünün yanında, serilerin simetriden ne kadar uzaklaştığını gösteren
“Çarpıklık Katsayısı” ve serinin yüksekliğinin normal serinin yüksekliğinden ne kadar
uzaklaştığını gösteren “Basıklık Katsayısı” hesaplanabilir.

9. ORTALAMALAR YARDIMIYLA ÇARPIKLIĞIN (ASİMETRİ, SKEWNESS)


HESAPLANMASI

Araştırmacılar çalışmalar genellikle ortalamalar ve değişim ölçülerini hesaplayarak seri hakkında


ulaşabilecekleri maksimum bilgiye ulaştıklarını ve diğer ölçülerin hesaplanmasının fazla bir bilgi
sağlamayacağını savunmaktadırlar. Çoğu zaman bunda haklılık payı olsa da, serinin dağılımının
şekli hakkında bilgiler edinmenin araştırmacıya ilave bilgiler sağlayacağında göz ardı edilmemesi
gerekir. Serilerin frekans dağılımlarını gösteren aşağıdaki üç şekil incelendiğinde bu daha iyi
anlaşılacaktır.

Serinin frekans dağılımını gösteren yukarıdaki şekilden verilerin merkezi eğilim ölçüleri etrafında
simetrik dağıldığını söyleyebiliriz. Bu serinin mod, medyan ve aritmetik ortalaması birbirine
eşittir. Aşırı büyük ve küçük değerlerin frekansları eşit ya da birbirine çok yakındır.

Simetrik serilerde Mod = Medyan = X

Öğrencilerin istatistik dersinden aldıkları notlar ortalama etrafında simetrik olarak dağılıyorsa
yukardaki durum söz konusu olacaktır.

Serinin frekans dağılımını gösteren yukarıdaki şekil sağa doğru uzun kuyrukludur. Sağa çarpık
frekans dağılıma sahip olan bu seride merkezi eğilim ölçüleri arasındaki ilişki aşağıdaki gibidir.
Sağa çarpık serilerde Mod < Medyan < X

Aşırı küçük değerlerin frekansı büyük değerlerin frekansından daha fazladır. Bundan dolayı
aritmetik ortalama medyandan ve medyanda moddan daha büyüktür. Öğrencilerin istatistik
dersinden aldıkları notların çoğunluğu aritmetik ortalamadan küçükse yukarıdaki şekilde olduğu
gibi sağa çarpık frekans dağılımı söz konusu olacaktır. Yüksek değerli gözlemler geniş bir
aralıkta yer alırken düşük değerli gözlemler nispeten bir arada toplanmıştır.

Serinin frekans dağılımını gösteren yukarıdaki şekil ola doğru uzun kuyrukludur. Sola çarpık
frekans dağılıma sahip olan bu seride merkezi eğilim ölçüleri arasındaki ilişki aşağıdaki gibidir.

Sağa çarpık serilerde Mod > Medyan > X

Aşırı büyük değerlerin frekansı küçük değerlerin frekansından daha fazladır. Bundan dolayı
aritmetik ortalama medyandan ve medyanda moddan daha küçüktür. Öğrencilerin istatistik
dersinden aldıkları notların çoğunluğu aritmetik ortalamadan büyükse yukarıdaki şekilde olduğu
gibi sağa çarpık frekans dağılımı söz konusu olacaktır. Düşük değerli gözlemler geniş bir aralıkta
yer alırken yüksek değerli gözlemler nispeten bir arada toplanmıştır.

Görüldüğü gibi gözlemlerin frekans dağılımları farklılık gösterebilir ve serilerin çarpıklığının


ölçülmesi önemli bilgiler içermektedir. Merkezi eğilim ve değişim ölçüleri serilerin çarpıklığı
hakkında bilgi içermezler ve bunların değişik yöntemlerle hesaplanması gerekir. Serilerin
asimetrisi (çarpıklığı) merkezi eğilim ölçüleri, kartiller ya da momentler yardımıyla
hesaplanırken serilerin basıklığı momentler yardımıyla hesaplanabilir.
9.1. Merkezi Eğilim Ölçüleri Yardımıyla Serilerin Çarpıklığının Hesaplanması

Serilerin mod ya da medyanının aritmetik ortalamadan farkının o serinin standart sapmasına


bölünmesi ile serinin asimetrisi yani çarpıklığı hesaplanabilir. Bulucusunun adından dolayı
Pearson Asimetri Ölçüsü denilen bu çarpıklık katsayıları (ÇK) aşağıdaki formüller yardımıyla
hesaplanır.

X́ −Mod 3( X́ −Medyan)
ÇK = ve ÇK =
σ σ

Çarpıklık katsayısının -1 ve +1 sınırları arasında olacaktır. Çarpıklık katsayısı +1’e yaklaştıkça


serinin sağa çarpıklığı ve -1’e yaklaştıkça serinin sola çarpıklığı artacaktır. Çarpıklık katsayısı
sıfıra yaklaştıkça serinin simetrisi (çarpıklığı) artacaktır (azalacaktır).

ÇK = 0 Seri simetriktir

ÇK > 0 Seri sağa çarpıktır

ÇK < 0 Seri sola çarpıktır

ÖRNEK: Bahçeliköy’de yaşayan aileler çocuk sayılarına göre tasnif edilmiş seri olarak aşağıda
verilmiştir. Bu dağılımın çarpıklık katsayısını hesaplayınız ve yorumlayınız.

Çocuk Sayısı Aile fiXi ( X i−μ) ¿ f i¿

(Xi) Sayısı fi
0 1 0 -2.3 5.3 5.3
1 3 3 -1.3 1.7 5.1
2 8 16 -0.3 0.1 0.8
3 5 15 0.7 0.5 2.5
4 3 12 1.7 2.9 8.7
n n
22.4
Toplam
∑ f i=20 ∑ f i X i=46
i=1 i=1

İlk aşamada serinin aritmetik ortalama, mod, medyan ve standart sapmasını hesaplamalıyız.
Serinin aritmetik ortalama, mod, medyan ve standart sapması aşağıdaki gibi hesaplanmıştır.
k

∑ f i Xi 46
µ= i=1k = =2.3 , Mod = 2, Medyan = 2,
20
∑ fi
i=1

N
σ= √ ∑ f i ¿¿¿¿
i=1

Bu seride aritmetik ortalama medyan ve moddan büyük olduğu için sağa çarpıktır. Çarpıklık
derecesi ya da katsayısı bulunan değerlerin formülde yerine konulmasıyla aşağıdaki gibi bulunur.

µ−Mod 2.3−2
ÇK = = =0.28
σ 1.06

Serinin asimetrisi yani çarpıklığı pozitiftir (sağa çarpık) ve katsayısı 0.28’dir.

10. MOMENTLER YARDIMIYLA ÇARPIKLIĞIN (ASİMETRİ, SKEWNESS) VE


BASIKLIĞININ (KURTOSİS) HESAPLANMASI

Serilerin frekans dağılımları hakkında momentler yardımıyla da bilgi edinilebilir. Momentler,


gözlem değerlerinin aritmetik ortalamadan farklarının kuvvetini alarak gözlem sayısına
bölünmesi ile elde edilir. Bu şekilde hesaplanan momentlere aritmetik ortalama etrafındaki
momentler denir ve en yaygın kullanılanıdır. Momentleri hesaplama formülleri serilerin türüne
göre değişecektir. Formüllerdeki r sembolü momentin derecesini gösterir.

10.1. Basit Serilerde Momentler


N

Birinci moment:
∑ ( X i− X́ ¿)
μ1= i=1 =0¿
N

N
İkinci moment: μ2=∑ ¿ ¿¿
i =1

N
Üçüncü moment: μ3=∑ ¿ ¿ ¿
i=1

N
Dördüncü moment: μ4 =∑ ¿ ¿ ¿
i=1
10.2. Tasnif Edilmiş Serilerde Momentler
N

Birinci moment:
∑ f i ( X i− X́ ¿)
μ1= i=1 =0 ¿
N

N
İkinci moment: μ2=∑ f i ¿ ¿ ¿
i =1

N
Üçüncü moment: μ3=∑ f i ¿ ¿ ¿
i=1

N
Dördüncü moment: μ4 =∑ f i ¿ ¿ ¿
i=1

10.3. Gruplanmış Serilerde Momentler


N

Birinci moment:
∑ f i (mi− X́ ¿)
μ1= i=1 =0 ¿
N

N
İkinci moment: μ2=∑ f i ¿ ¿ ¿
i =1

N
Üçüncü moment: μ3=∑ f i ¿ ¿ ¿
i=1

N
Dördüncü moment: μ4 =∑ f i ¿ ¿ ¿
i=1

10.4. Momentler Yardımıyla Çarpıklık (Asimetri, Skewness)


Katsayısının Hesaplanması
Simetrik serilerde aritmetik ortalamadan sapmaların tek dereceli kuvvetlerinin toplamı sıfır
olacağından simetrik serilerde birinci ve üçüncü momentler sıfır olacaktır. Buradan üçüncü
momente bakarak serinin asimetrisi hakkında aşağıdaki sonuçlara ulaşabiliriz.
μ3=¿ 0 Simetrik seri
μ3 >0 Sağa çarpık (Asimetrisi pozitif) seri
μ3 <0 Sola çarpık (Asimetrisi negatif) seri
Bir serinin üçüncü momentine bakarak serinin çarpıklığı konusunda bir fikir sahibi olsak bile
çarpıklığın derecesini ölçmek ve farklı birimlerle ölçülen serilerin asimetrisini karşılaştırmak için
göreceli bir çarpıklık ölçüsüne ihtiyaç vardır. Serinin hesaplanan üçüncü dereceden momenti yine
aynı serinin standart sapmasının üçüncü kuvvetine bölünürse standart bir çarpıklık ölçü birimi
elde edilmiş olur. Momentler yardımıyla çarpıklık katsayısı aşağıdaki şekilde formüle edilebilir.

N
ÇK =∑ f i ¿ ¿¿ ¿
i=1

μ3=¿ 0 ÇK = 0, Simetrik seri


μ3 >0 ÇK > 0, Sağa çarpık (Asimetrisi pozitif) seri
μ3 <0 ÇK < 0, Sola çarpık (Asimetrisi negatif) seri
ÖRNEK: Bahçeliköy’de yaşayan aileler çocuk sayılarına göre tasnif edilmiş seri olarak aşağıda
verilmiştir. Bu dağılımın çarpıklık katsayısını momentler yardımıyla hesaplayınız ve
yorumlayınız.

Çocuk Aile fiXi ( X i−μ) ¿ f i¿


¿ f i¿
Sayısı Sayısı
(Xi) fi
0 1 0 -2.3 5.3 5.3 -12.2 -12.2
1 3 3 -1.3 1.7 5.1 -2.2 -6.6
2 8 16 -0.3 0.1 0.8 -0.03 -0.24
3 5 15 0.7 0.5 2.5 0.35 1.7
4 3 12 1.7 2.9 8.7 4.9 14.7
Toplam 20 46 22.4 -3.2

İlk aşamada serinin üçüncü momentini ve standart sapmasını hesaplamalıyız. Serinin üçüncü
momenti ve standart sapması yukarıdaki tablo yardımıyla aşağıdaki gibi hesaplanmıştır.
k

∑ f i Xi 46
µ= i=1k = =2.3 ,
20
∑ fi
i=1

N
μ3=∑ f i ¿ ¿ ¿
i=1

N
σ= √∑
i=1
f i ¿¿¿¿

σ 3 =1.2

N
ÇK =∑ f i ¿ ¿¿ ¿
i=1

Serinin asimetrisi yani çarpıklığı negatiftir (sola çarpık) ve katsayısı - 0.14’dir.

Genel olarak, |ÇK |>0.50 ise kuvvetli çarpık ve |ÇK |>0.50 ise zayıf çarpık denilebilir.

10.5. Momentler Yardımıyla Basıklık (Kurtosis) Katsayısının


Hesaplanması
İki veya daha fazla serinin aritmetik ortalaması ve standart sapmaları aynı olsa bile frekans
dağılımlarının yüksekliği (Basıklık) farklı olabilir. Bu durumlarda serilerin frekans dağılımının
basıklığı o seri hakkında bazı ilave bilgiler içermektedir ve hesaplanması fayda vardır.

Bir serinin frekans dağılımının basıklığı dördüncü moment yardımıyla hesaplanabilir. Serinin
hesaplanan dördüncü dereceden momenti yine aynı serinin standart sapmasının dördüncü
kuvvetine bölünürse standart bir basıklık ölçü birimi elde edilmiş olur. Momentler yardımıyla
basıklık katsayısı (BK) aşağıdaki şekilde formüle edilebilir ve yorumlanabilir.

N
BK =∑ f i ¿ ¿ ¿ ¿3 Serinin dağılımının yüksekliği
i=1

standart normal dağılıma uygundur.


N
BK =∑ f i ¿ ¿ ¿ ¿ serinin dağılımının yüksekliği
i=1

standart normal dağılımın yüksekliğinden daha sivridir.


N
BK =∑ f i ¿ ¿ ¿ ¿ serinin dağılımının yüksekliği
i=1
standart normal dağılımın yüksekliğinden daha basıktır.

ÖRNEK: Bahçeliköy’de yaşayan aileler çocuk sayılarına göre tasnif edilmiş seri olarak aşağıda
verilmiştir. Bu dağılımın çarpıklık katsayısını momentler yardımıyla hesaplayınız ve
yorumlayınız.

Çocuk Aile fiXi ( X i−μ) ¿ f i¿


¿ f i¿
Sayısı Sayısı
(Xi) fi
0 1 0 -2.3 5.3 5.3 28.1 28.1
1 3 3 -1.3 1.7 5.1 2.9 8.7
2 8 16 -0.3 0.1 0.8 0.01 0.08
3 5 15 0.7 0.5 2.5 0.25 8.5
4 3 12 1.7 2.9 8.7 8.4 25.2
Toplam 20 46 22.4 71.3
İlk aşamada serinin dördüncü momentini ve standart sapmasını hesaplamalıyız. Serinin dördüncü
momenti ve standart sapması yukarıdaki tablo yardımıyla aşağıdaki gibi hesaplanmıştır.
k

∑ f i Xi 46
µ= i=1k = =2.3 ,
20
∑ fi
i=1

N
μ4 =∑ f i ¿ ¿ ¿
i=1

N
σ= √∑i=1
f i ¿¿¿¿

σ 4= 1.26

N
ÇK =∑ f i ¿ ¿¿ ¿
i=1

Serinin basıklık katsayısı 2.86’dır. Seri standart normal dağılıma göre daha basıktır.

11. ORTALAMALAR, ÇARPIKLIK KATSAYISI VE BASIKLIK KATSAYISI


YARDIMIYLA BİR SERİNİN ANALİZİ
Seriler frekans dağılımı çarpıklık katsayısına göre simetrik, sağa çarpık ve sola çarpık olarak
üç olasılığa sahipken, basıklık katsayısına göre de normal, basık ve sivri olmak üzere üç
olasılık mevcuttur. Bir serinin çarpıklığı (Skewness) ve basıklığı (Kurtosis) aşağıdaki tablo
yardımıyla özetlenebilir.

ÇK = 0 ÇK > 0 ÇK < 0

Simetrik ve
BK = 3
basıklığı normal
Asimetrisi negatif ve
Asimetrisi pozitif ve
BK > 3 normale göre sivri
normale göre sivri
Asimetrisi pozitif ve Asimetrisi negatif ve
BK < 3
normale göre basık normale göre basık

Serilerin çarpıklık ve basıklık katsayısının serilerin frekansının dağılımını nasıl belirlediği frekans
dağılımının grafiği yardımıyla da görülebilir.

Yukarıda standart normal bir dağılımın grafiği mevcuttur. Serinin ÇK=0 olması simetrik ve

BK = 3 olması basıklığının normal olduğunu göstermektedir.


Yukarıda normal bir dağılımın grafiği mevcuttur. Serinin ÇK=0 olması simetrik ve

BK > 3 olması basıklığının normalden sivri olduğunu göstermektedir. Dikkat edilirse diğer
veriler sabitken serinin standart sapmasının azalması BK’nı artıracağından serinin frekans
dağılımının sivriliği artacaktır.
Değerlendirme Soruları

1 - Normal dağılış eğrisinde veriler yayvan dağılımlı olabildiği gibi sivri yayılımlı da
olabilmektedir. Bu durum ne olarak adlandırılır?

a) Çarpıklık b) Basıklık ( Kurtosis ) c) Skewness d) Hepsi e) Hiçbiri

2- Varyansın karekökü nedir?

a) Popülasyon ortalaması b) Popülasyondaki fert sayısıdır


c) Örnek ortalamasıdır d) Standart sapmadır e) Hiçbiri

3- Yİ= (12,14,12,8,10,12,10,12,9) Yukarıdaki Y değişkeninin Değişim Aralığı değeri nedir?

a) 6 (14-8=6) b)9 c)8 d)5 e)

4- Belirlenen hedef doğrultusunda bilgi edinilmek istenen yığının tümüne ne ad verilir?

A)Örnekleme B)Örnek C)Grup D)Ana kütle E)Yığın

Kaynakça
1. Yılmaz Özkan, Uygulamalı İstatistik 1, Sakarya Kitapevi, 2008.
2. Özer Serper, Uygulamalı İstatistik 1, Filiz Kitapevi, 1996.
3. Meriç Öztürkcan, İstatistik Ders notları, YTÜ.
4. Andım Oben Balce ve Serdar Demir, İstatistik Ders Notları, Pamukkale Üniversitesi,
2007.
5. Ayşe Canan Yazıcı, Biyoistatistik Ders Notları, Başkent Üniversitesi.
6. Zehra Muluk ve Yavuz Eren Ataman, Biyoistatistik ve Araştırma Teknikleri Ders Notları,
Başkent Üniversitesi.

You might also like