Istatistik-I 02

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 41

2022 – 2023 GÜZ DÖNEMİ

(YBS2 – ULY2 – BAN2 – ULF2 – HVY2)

BÖLÜM 2: Tanımlayıcı İstatistik


Tablolar ve Grafikler: Veri Seti İçerisindeki Düzenin Gösterimi

İSTATİSTİK - I 1
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
Bölümün Amacı:
 Bir çalışmanın gerektirdiği veriyi toplamak, ilgilenilen değişkenlere ait gözlemlerin
ölçümlenmesi anlamına gelmektedir.
 Bu ölçümler, bir birimden diğerine değişkenlik gösterecektir.
 Bu değişkenlik göz önüne alındığında, analiz edilip tanımlanana kadar verilerden herhangi bir
anlam çıkarmak genellikle zordur.
 Bu bölüm, değişkenlikle başa çıkmak ve verileri tanımlamak için temel bir tekniği
incelemektedir: frekans dağılımı oluşturmak. Doğru şekilde oluşturulduğunda, frekans
dağılımları tanımlayıcı istatistiksel tekniklerin hedeflerine ulaşır: Verilerin dünya hakkında
sağladığı bilgileri bozmadan verileri düzenler ve özetler.
 Bu bölüm aynı zamanda frekans dağılımlarının grafiksel gösterimini tanıtır. Grafik gösterimler,
verilerden öğrenmeyi kolaylaştırmak için dağılımların temel özelliklerini vurgular.
 Bu bölümü okurken, frekans dağılımlarını oluşturma prosedürlerinin popülasyonlara ve
örneklemlere uygulanabileceğini unutmayın. Bir popülasyondaki tüm skorlara sahip olmak
çok nadir olduğundan, frekans dağılımları genellikle örneklerden oluşturulur. Bu nedenle
örneklerimiz aksi belirtilmedikçe örneklemleri içerecektir.
 Ayrıca buradaki tekniklerin veri seti içerisindeki her bir değişken için uygulanabileceğini
unutmayın.

İSTATİSTİK-I 2
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
Nitel (Kategorik) Veriler için Frekans Dağılımı
Kategorik verileriniz olduğunda, her kategorideki sıklığı veya yüzdeyi tablolar ve grafikler halinde
sunarsınız.
Bir özet tablo, kategoriler arasındaki farkları görebilmeniz için bir kategori kümesindeki öğelerin
sıklığını (frekansını), oranını veya yüzdesini belirtir. Bir özet tablo, kategorileri bir sütunda ve
sıklık, oran veya yüzdeyi farklı bir sütun veya sütunlarda listeler.
Öğrencilerle ilgili bir çalışma kapsamında, öğrencilere ait kan grupları da ölçümlenmiştir.

 Kan grupları verisi tüm kan gruplarını içeriyor mu?


 Kan gruplarının dağılımı nasıldır?
ve benzeri soruların cevaplarını görebilmek için özet tablo oluşturulur.

KAN GRUPLARINA AİT FREKANS / GÖRECELİ FREKANS / YÜZDE FREKANS DAĞILIMI


ÖĞRENCİ SAYISI GÖRECELİ YÜZDE FREKANS
KAN GRUPLARI
(Frekans) FREKANS (Oran) (%)
A SAY 9 50’ye böl 0.18 100 ile çarp %18
B 11 0.22 %22
AB 13 0.26 %26
O 17 0.34 %34
TOPLAM 50 1 %100
İSTATİSTİK-I 3
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
Nitel (Kategorik) Veriler için Frekans Dağılımı
Frekans, bir skorun gerçekleşme sayısıdır ve sıklık olarak ta adlandırılır. Bir frekans dağılımı, bir
değişkene ait her bir skorun gerçekleşme sayılarının listelenmesidir.
Göreceli frekans, bir skorun dağılımdaki tüm gözlemlerin sayısına oranıdır. Bir göreceli frekans
dağılımı, bir değişkene ait her bir skorun göreceli frekanslarının bir listesidir.
Yüzde frekans, bir skorun göreceli frekansının yüzde (%) olarak ifade edilmesidir. Bir yüzde
frekans dağılımı, bir değişkene ait her bir skorun yüzde frekanslarının bir listesidir.
Bir değişkene ait gözlemlenen skorların frekanslarının toplamı toplam frekanstır. O halde,
toplam frekans o değişkene ait gözlemlerin (birimlerin) sayısıdır.
Örneğin, örneğimizde toplam frekans kan gruplarına bakılan toplam öğrenci sayısıdır ve değeri,
50 dir.
Bu durumda,

 Frekanslar sayma yoluyla,

 Göreceli frekanslar şeklinde hesaplama yoluyla ve

 Yüzde frekanslar veya şeklinde hesaplama


yoluyla bulunur.
İSTATİSTİK-I 4
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
Nitel (Kategorik) Veriler için Frekans Dağılımı
Bir fakülte tüm öğrencileri (popülasyon) üzerinde yaptığı bir çalışma kapsamında ‘’Tekrar
üniversite sınavına girseydiniz aynı bölümü tercih eder miydiniz?’’ sorusunu sormuştur.
Evet

Hayır

Kararsızım
Verilen cevapların (skorların) frekans / göreceli frekans / yüzde frekans dağılımları aşağıda ki
gibidir. Tabloyu yorumlayınız.
VERİLEN CEVAPLARIN FREKANS DAĞILIMLARI
ÖĞRENCİ SAYISI
VERİLEN CEVAPLAR (Frekans) GÖRECELİ FREKANS YÜZDE FREKANS (%)
EVET 2100 0.600 60.0
HAYIR 900 0.257 25.7
KARARSIZIM 500 0.143 14.3
TOPLAM 3500 1 100
** Şu ana kadar verilen örneklerde skorların farklı sıralarda verilebileceğine dikkat ediniz.
Örneğin, kan gruplarında ilk satırda A grubu yerine B grubu da verilebilirdi. Yukardaki örnekte, ilk
satırda EVET yerine KARARSIZIM skoru da gösterilebilirdi. Bunun nedeni, her iki örnekte de veri
nominal ölçektedir.
İSTATİSTİK-I 5
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
Nitel (Kategorik) Veriler için Frekans Dağılımı
Bir üniversite (GANO puanına göre belirlediği) en başarılı 30 öğrencisinin kütüphane
hizmetlerinden memnuniyet seviyelerinin aşağıdaki ölçekte bir değerlendirmesini yapmak
istemiş
Çok memnunum

Memnunum

Emin değilim

Memnun değilim

Hiç memnun değilim


ve sonuçlar aşağıda tabloda verilmiştir.
Frekans Dağılımları
Skorlar Frekans G.F Yüzde
Çok Memnunum 4 0,1333 13,33%
Memnunum 7 0,2333 23,33%
Emin değilim 4 0,1333 13,33%
Memnun değilim 7 0,2333 23,33%
Hiç memnun değilim 8 0,2667 26,67%
Toplam 30 1 100%
Veri ordinal ölçektedir. Bu nedenle, skorların küçükten büyüğe veya büyükten küçüğe, yani, sıralı
olarak listelenmesi önemlidir.
İSTATİSTİK-I 6
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
Nitel Verilerde Grafik Gösterim
Bir frekans dağılımını grafik olarak görüntülemek, verilerin önemli özelliklerini vurgulayabilir.

Frekans dağılımlarının grafikleri her zaman iki eksen kullanılarak çizilir.

Apsis veya x ekseni yatay eksendir. Frekans, göreceli frekans veya yüzde frekans dağılımları için,
genellikle, apsis ölçülen değişkenin skorlarını (kategorileri) gösterir ve değişkenin adıyla
etiketlenir.

Ordinat veya y ekseni, genellikle, frekans, göreceli frekans veya yüzde frekans değerlerini
gösterir ve bu şekilde etiketlenir.

Amaç gösterim olunca yaratıcılıkta sınır yoktur ve uygulamada çok fazla grafik biçimleri vardır.
İstatistik yazılımları frekans dağılımlarını oluşturduğu gibi grafik seçenekleri de sunmaktadır.

Tanıtım ve bir anlayış kazandırma amacıyla burada iki tür grafik gösterim tanıtılacaktır: çubuk
diyagramlar ve daire dilimleri Grafiği. Bunlar en yaygın olarak kullanılan grafiklerdir.

Nicel verilere ait frekans dağılımları ve grafikler ele alınırken, nicel verilere özel, farklı grafikler de
tanıtılacaktır.

İSTATİSTİK-I 7
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
Nitel Verilerde Grafik Gösterim
ÇUBUK DİYAGRAM (BAR CHART): Bir nitel değişkenin sunumu için kullanılan en yaygın grafik
çubuk diyagramlardır. Çubuk diyagramların ayırt edici en önemli özelliği, değişken nitel olduğu
için, çubuklar bitişik değil aralarında (eşit) boşluk içerecek şekilde çizilmesidir. Çubukların taban
genişlikleri eşittir. Böylece çubukların boyları ve alanları frekansları (göreceli frekansları) ile
orantılıdır.

İSTATİSTİK-I 8
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
Nitel Verilerde Grafik Gösterim

İSTATİSTİK-I 9
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
Nitel Verilerde Grafik Gösterim
Frekans G.F Yüzde
Çok Memnunum 4 0,1333 13,33%
Memnunum 7 0,2333 23,33%
Emin değilim 4 0,1333 13,33%
Memnun değilim 7 0,2333 23,33%
Hiç memnun değilim 8 0,2667 26,67%
Toplam 30 1 100%

Ordinal Ölçekte olduğundan Kategoriler sıralı!!!

İSTATİSTİK-I 10
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
Nitel Verilerde Grafik Gösterim
DAİRE DİLİMLERİ GRAFİĞİ (PIE CHART): Nitel veriyi tanımlayan bir diğer gösterim şekli Daire
Dilimleri Grafiğidir. Bu gösterimde her bir daire dilimi, ait olduğu kategorinin toplam frekans
içerisindeki oranını ya da yüzdesini gösterir ve 360 derecelik daire içerisinde söz konusu oranda
bir açı ile temsil edilir. Her bir kategori için merkez açı değeri kategoriye ait göreceli frekans ile
360 derecenin çarpımı ile elde edilir. Daire dilimleri grafiği kategori sayısı arttıkça bir bisiklet jantı
görünümü vereceğinden, yani karmaşık bir yapıya bürüneceğinden dolayı fazla sayıda kategori
içeren nitel verilerde tercih edilmez.

Her bir daire dilimi için;

İSTATİSTİK-I 11
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
Nitel Verilerde Grafik Gösterim

İSTATİSTİK-I 12
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
Çapraz Tablolar ve Mukayeseli Çubuk Diyagramları
Şu ana kadar nitel verilerin frekans dağılımı ve grafiklerinde tek değişken kullandık. Bazen bir
değişkenin dağılımını, bir başka değişkene göre koşullu dağılımı şeklinde gösterebiliriz. Bu tür
tablolara çapraz tablo, iki yönlü tablo, crosstab veya koşula bağlı tablo (contingency table)
denir. Çapraz tablo (iki yönlü tablo) iki değişkenin aynı tabloda özetlenmesidir.
VERİLEN CEVAPLARIN KIZ ve ERKEK ÖĞRENCİLERE GÖRE DAĞILIMI (ÇAPRAZ TABLO – CROSSTAB)

Toplam Öğrenci Sayısı Kız Öğrenciler Erkek Öğrenciler


Verilen Cevaplar (Frekans) Frekans G.F (%) Frekans G.F (%)
EVET 2100 900 0,43 42,86% 1200 0,57 57,14%
HAYIR 900 300 0,33 33,33% 600 0,67 66,67%
KARARSIZIM 500 400 0,80 80,00% 100 0,20 20,00%
TOPLAM 3500 1600 1900

İSTATİSTİK-I 13
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
Nicel Veriler için Frekans Dağılımı ve Grafik Gösterim
Nicel verilerin nitel verilerden farklı olmasından dolayı nicel verilerin sunulması da biraz
farklıdır.
Bununla birlikte, az sayıda farklı skorlar içeren ayrık nicel verilerin nitel verilerdeki gibi frekans
dağılım tablosu ve çubuk diyagram veya daire dilimleri grafiği ile gösterilmesi en uygun yol
olabilir.
Örneğin bir bölgede evler 2,3,4 veya 5 odalı olarak yapılmış ise, her bir oda sayısı evlere ait bir
özelliğin (oda sayısı) kategorileri olarak alınabilir.
Çünkü, oda sayısı değişkeni ayrık nicel değişkendir ve örnekte verildiği üzere değişkenin
alabileceği mümkün skorların değeri 4 tanedir (2, 3, 4 ve 5 skorlarını alabilir).
Böylece;

 Her bir oda sayısının, yani (ayrık nicel) değerinin görünme sıklıkları bir tabloda özetlenir.

 Bu tür ayrık nicel veriler için frekans dağılımı oluşturulduktan sonra çubuk diyagram veya
daire dilimleri grafiği çizilir.

İSTATİSTİK-I 14
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
Nicel Veriler için Frekans Dağılımı ve Grafik Gösterim

Örnek Bir Bölgede bulunan 50 adet ev için yapılan araştırmada oda sayıları belirlenmiştir.
Veri Seti Frekans ve Göreceli Frekans Dağılımı
3 2 4 3 4 2 3 4 4 2 Oda Sayısı Ev Sayısı Yüzde(%)
5 2 4 3 4 3 4 3 4 4 2 8 16%
3 13 26%
5 5 4 5 3 5 4 3 5 5
4 14 28%
4 3 3 3 2 2 4 5 5 5 5 15 30%
5 3 2 5 2 4 5 5 3 5 TOPLAM 50 100%

İSTATİSTİK-I 15
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
Nicel Veriler için Frekans Dağılımı ve Grafik Gösterim
Örnek Bir fakültede öğrencilerin kaç çocuklu ailelerden geldiği belirlenmiştir.
Frekans ve Yüzde Frekans Dağılımı
Skorlar (Çocuk Sayısı) Ailede Çocuk Sayısı (Frekans) Yüzde(%)
1 100 10,0%
2 220 22,0%
3 280 28,0%
4 200 20,0%
5 120 12,0%
6 35 3,5%
7 18 1,8%
8 12 1,2%
9 9 0,9%
10 6 0,6%
Toplam 1000 100%

İSTATİSTİK-I 16
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
Nicel Veriler için Frekans Dağılımı ve Grafik Gösterim
100 öğrencinin Mebis üzerinden 1 yıl içerisinde ders hocalarına ve danışmanlarına gönderdikleri e-
Örnek
posta sayılarının dağılımı aşağıdaki gibidir.
E-posta Miktar Yüzde E-posta Miktar Yüzde E-posta Miktar Yüzde E-posta Miktar Yüzde
1 1 1% 28 1 1% 58 2 2% 87 1 1%
3 1 1% 29 2 2% 60 2 2% 88 2 2%
4 1 1% 30 2 2% 62 1 1% 89 1 1%
5 1 1% 32 1 1% 63 1 1% 91 2 2%
6 2 2% 33 3 3% 64 2 2% 92 1 1%
7 1 1% 34 1 1% 65 2 2% 93 1 1%
9 2 2% 37 1 1% 66 1 1% 97 1 1%
11 2 2% 39 2 2% 69 1 1% 98 2 2%
12 1 1% 40 1 1% 71 1 1% 99 3 3%
13 3 3% 42 1 1% 72 1 1% 100 1 1%
15 1 1% 44 1 1% 73 2 2%
17 3 3% 45 1 1% 74 1 1%
18 1 1% 48 2 2% 75 1 1%
20 1 1% 49 2 2% 77 1 1%
21 1 1% 50 1 1% 79 1 1%
23 1 1% 51 1 1% 81 1 1%
24 2 2% 54 1 1% 82 3 3%
25 3 3% 56 3 3% 85 1 1%
26 2 2% 57 1 1% 86 2 2%

67 adet farklı miktar vardır. Atılan maksimum e-posta sayısı 100 ve minimum e-posta sayısı 1 dir.
İSTATİSTİK-I 17
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
Nicel Veriler için Frekans Dağılımı ve Grafik Gösterim
100 öğrencinin Mebis üzerinden 1 yıl içerisinde ders hocalarına ve danışmanlarına gönderdikleri e-
Örnek
posta sayılarının dağılımı aşağıdaki gibidir.

İSTATİSTİK-I 18
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
Nicel Veriler için Frekans Dağılımı ve Grafik Gösterim
FARKLI BİR ÇÖZÜM ÜRETMEK ZORUNDAYIZ...

 Skorlar, çocuk sayısı kadar dar bir aralıkta (1-10) dağılmıyor.


 Skorlar (1 – 100) gibi geniş bir aralıkta dağılmış.
ÇÜNKÜ  67 farklı skor söz konusu
 Şanslıyız. Çünkü 1 – 100 aralığında en kötü durumda 100 farklı skor da olabilirdi.
 Sonuç olarak, gerçekleşen veri setine göre;
 Frekans dağılım tablosu 67 adet satır ve
 Çubuk diyagramı 67 adet çubuk içermek zorunda.
 Daire dilimleri grafiği bisiklet jantı görünümünde.
E-Posta Sayısı Öğrenci Sayısı
ÇÖZÜM Gruplandırma 1-10 9
11-20 12
21-30 14
31-40 9
41-50 8
51-60 10
61-70 8
71-80 8
81-90 11
91-100 11
İSTATİSTİK-I
Toplam 100 19
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
GRUPLANDIRMA - TANIMLAR
E-Posta Sayılarının Gruplanmış Frekans Dağılımı Özellikler
E-Posta Sayısı Öğrenci Sayısı Alt Sınır Üst Sınır Sınıf Genişliği Sınıf Orta Noktası
1-10 9 1 10 10 5,5
11-20 12 11 20 10 15,5
21-30 14 21 30 10 25,5
31-40 9 31 40 10 35,5
41-50 8 41 50 10 45,5
51-60 10 51 60 10 55,5
61-70 8 61 70 10 65,5
71-80 8 71 80 10 75,5
81-90 11 81 90 10 85,5
91-100 11 91 100 10 95,5
Toplam 100

Bir sınıf içerisine hangi değerlerin alınacağını belirten sınırlara sınıf aralığı veya sınıf genişliği
denir. Örneğin, 1 – 10 sınıfı için alt sınır 1 ve üst sınır 10 dur. Bu durumda, sınıf aralığı 10 – 1 + 1
= 10 dur.
Dağılımın en küçük alt sınırı ve en büyük üst sınırı sırasıyla 1 ve 100 dür.
Her bir sınıfın alt sınırı ile üst sınırının orta noktasına sınıf orta noktası denir. Örneğin, 1 – 10
sınıfı için orta nokta (1 + 10) / 2 = 5.5 değeridir ve bu değere o sınıfın sınıf orta noktası denir.

İSTATİSTİK-I 20
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
GRUPLANDIRMA - TANIMLAR
E-Posta Sayılarının Gruplanmış Frekans Dağılımı
E-Posta Sayısı Öğrenci Sayısı Alt Sınır Üst Sınır Sınıf Genişliği Sınıf Orta Noktası
<11 9 - 10 - -
11-20 12 11 20 10 15,5
21-30 14 21 30 10 25,5
31-40 9 31 40 10 35,5
41-50 8 41 50 10 45,5
51-60 10 51 60 10 55,5
61-70 8 61 70 10 65,5
71-80 8 71 80 10 75,5
81-90 11 81 90 10 85,5
>90 11 91 - - -
Toplam 100

İlk sınıfa ait bir alt sınır ve / veya son sınıfa ait bir üst sınır verilemediği durumda ortaya çıkan
frekans dağılımına açık uçlu dağılım denir.

Örneğin, ilk sınıf için ‘’<11’’ veya ‘’≤ 10’’ ve / veya son sınıf için ‘’>90’’ veya ‘’≥91’’ olması
durumunda açık uçlu dağılım söz konusu olurdu.

İSTATİSTİK-I 21
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
GRUPLANDIRMA - KURALLAR
 Toplanan verinin iyi bir betimlemesini (tanımlamasını) sağlayan yeterli sayıda sınıf
oluşturulmalıdır.
Sınıflar Frekans G.F
1 - 50 52 0,52
Yandaki gibi bir gruplandırma anlamlı mı? Tartışınız.
51 - 100 48 0,48
Aynı şekilde sınıf sayısının 30 olduğu bir gruplandırma anlamlı mı? Tartışınız.
 Genel olarak gruplandırma işleminde, katı bir kural olarak konmasa da, 5’ten az ve 20’den çok
sınıf olmamasına dikkat edilmelidir.
Pratik bir yol: E-Posta örneği
1. Veri setinin alt sınırını (en küçük değerini) ve üst sınırını (en büyük değerini) bulun.
Alt Sınır = 1 ve üst sınır = 100
2. Alt sınır ile üst sınır arasındaki farkı bulun.
100 – 1 = 99
3. Bulduğunuz aralığı tavsiye edilen 5 ve 20 ye bölün.
99 / 5 = 19.8 ve 99 / 20 = 4.95
4. Bulduğunuz değerler ondalıklı ise değerleri en yakın bir üst tamsayıya (veriler tam sayı olduğu
için) yuvarlayın. 19.820 ve 4.955
5. Gruplandırma için sınıf genişliğini 5 – 20 arasında en uygun bulduğunuz bir sayı belirleyerek
seçiniz.

İSTATİSTİK-I 22
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
GRUPLANDIRMA - KURALLAR
 Sınıflar ayrık (üst üste çakışan) sınıflar olarak düzenlenmeli, yani sınıf sınırları bir biri ile
çakışmamalıdır. Örneğin, 1 – 10 ve 10 – 20 sınıfları çakışmaktadır. Bu durumda, 10 ader e-posta
atan bir öğrenci her hangi bir gruba dahil edilemez.

 Sınıflar süreklilik taşımalıdır. Bazı sınıflar skor içermese de (sıfır frekans) frekans dağılımında
görünmelidir. Burada tek istisna ilk ve son sınıfların sıfır frekansa sahip olmasıdır.

 Sınıflar tam olmalı, diğer bir değişle tüm veriyi kapsayabilmelidir. Örneğin, 91 – 100 sınıfı eksik
olursa veri setinde olan bazı değerleri kapsayamaz.

E-Posta Sayısı Öğrenci Sayısı


1-10 ?
10-20 ?
21-30 14
31-40 9
41-50 0
51-60 10
61-70 8
71-80 8
81-90 11
?
İSTATİSTİK-I 23
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
GRUPLANDIRMA - KURALLAR

 Zorunlu olmadıkça açık-uçlu dağılım oluşturulmamalıdır.

 Çok gerekmedikçe sınıf genişlikleri eşit olmalıdır.


Öğrenci Notları Öğrenci Sayısı
< 50 30
50 - 59 10
60 - 69 12
70 - 79 10
80 - 84 6
85 - 89 4
90 - 94 3
> 94 2

İSTATİSTİK-I 24
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
GRUPLANDIRMA – Sürekli Nicel Veri Örneği
Aşağıdaki veri seti nicel sürekli bir değişkenin 50 gözlem birimi üzerinde ölçümlenmiş değerlerdir.
0,02 0,11 0,25 0,39 0,44 0,59 0,70 0,81 0,89 0,97
0,02 0,12 0,31 0,40 0,49 0,60 0,73 0,81 0,91 0,98
0,07 0,17 0,33 0,40 0,52 0,64 0,74 0,84 0,91 0,98
0,10 0,19 0,36 0,41 0,53 0,64 0,77 0,85 0,93 0,99
0,10 0,22 0,37 0,43 0,58 0,70 0,77 0,87 0,93 0,99

En büyük değer : 0,99


En küçük değer : 0,02
Fark : 0,97
5 grup için sınıf aralığı 0,97 / 5 = 0,194 0,20 (en yakın bir üst iki ondalıklı sayıya yuvarlandı)
20 grup için sınıf aralığı 0,97 / 20 = 0,04850,05 (en yakın bir üst iki ondalıklı sayıya yuvarlandı)
0,05 ile 0,20 arasında bir sınıf genişliği tercihi yapılır : 0,18

Sınıflar Sınıflar Frekans Sınıf Genişliği Sınıf Orta Noktası


0,02 - 0,19 0,02 - < 0,20 9 0,18 0,105
0,20 - 0,37 0,20 - < 0,38 6 0,18 0,285
0,38 - 0,55 VEYA 0,38 - < 0,56 9 0,18 0,465
0,56 - 0,73 0,56 - < 0,74 8 0,18 0,645
0,74 - 0,91 0,74 - < 0,92 11 0,18 0,825
0,92 - 1,09 0,92 - < 1,10 7 0,18 1,005
Genel Toplam 50
İSTATİSTİK-I 25
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
Nicel Verilerde Grafik Gösterim
HİSTOGRAM
Dağılımların çubuk diyagrama benzer şekilde gösterilmesi Histogram adını alır.

Histogramların çubuk diyagramlarından farkı, çubuklar arasında boşluk olmayıp bitişik olarak
yerleştirilmeleridir. Bunun nedeni sınıfların süreklilik taşıması, yani sınıflar arası boşluğun
olmamasıdır.

Histogram, yatay eksene ilgili değişkenin sınıf sınırları veya sınıf orta noktaları ve düşey eksene
frekans, göreceli frekans veya yüzde göreceli frekansların yerleştirilmesi ile oluşturulur.

Her bir sınıfa ait ilgili frekans /Göreceli frekans / Yüzde göreceli frekans bir dikdörtgen vasıtasıyla
gösterilir ve dikdörtgenin tabanı yatay eksendeki sınıf genişliği ile yüksekliği ise düşey eksende
her bir sınıfın frekans, göreceli frekans veya yüzde frekans değeri ile belirlenir.

İSTATİSTİK-I 26
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
Nicel Verilerde Grafik Gösterim
HİSTOGRAM
E-Posta Öğrenci
Sayısı Sayısı
1-10 9
11-20 12
21-30 14
31-40 9
41-50 8
51-60 10
61-70 8
71-80 8
81-90 11
91-100 11
Toplam 100

İSTATİSTİK-I 27
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
FREKANS POLİGONU
Bir dağılımın şeklini gösteren ve histograma benzeyen diğer bir gösterim şekli frekans poligonudur.

Frekans poligonu, sınıf orta noktaları ile sınıf frekanslarının keşişim noktalarını (koordinatlarını)
birleştiren doğru parçalarıdır.

E-Posta Sayısı Öğrenci Sayısı


(Sınıf Orta Noktası) (Frekans)
5,5 9
15,5 12
25,5 14
35,5 9
45,5 8
55,5 10
65,5 8
75,5 8
85,5 11
95,5 11
Toplam 100

İSTATİSTİK-I 28
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
FREKANS POLİGONU
Histogram ile frekans poligonu arasındaki tercih kişisel tercih sorunudur.
 Bununla birlikte genel kabul görmüş kural ayrık ve sürekli değişken ayırımına dayanır.
Histogramların ayrık nicel değişkenler için frekans poligonunun ise sürekli nicel değişkenler için
daha uygun olduğu söylenir.

E-Posta Sayısı Öğrenci Sayısı


(Sınıf Orta Noktası) (Frekans)
5,5 9
15,5 12
25,5 14
35,5 9
45,5 8
55,5 10
65,5 8
75,5 8
85,5 11
95,5 11
Toplam 100

İSTATİSTİK-I 29
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
FREKANS POLİGONU
 Frekans poligonunun avantajı birden fazla dağılımı mukayese etmek için aynı grafikte
gösterebiliriz.

E-Posta Sayısı
Öğrenci Sayısı Öğrenci Sayısı
(Sınıf Orta Noktası)
5,5 9 8
15,5 12 9
25,5 14 12
35,5 9 22
45,5 8 20
55,5 10 10
65,5 8 12
75,5 8 1
85,5 11 2
95,5 11 4

İSTATİSTİK-I 30
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
DAL – YAPRAK GRAFİĞİ
Her bir skor iki parçaya ayrılır ve ilk parçaya ait basamaklar (dijit) dal, ikinci parçaya ait
basamaklar yaprak olarak ele alınır. Böylece dallar düşey eksene, yapraklar ise yatay eksene
yığılarak grafik çizilir. Gruplandırma verinin bir parçasının dal, diğer parçasının yaprak şeklinde
düzenlenmesi yoluyla yapılmış olur.
 Gruplanmış frekans dağılımlarına karşı bir avantajı, veriyi grafik olarak gösterirken gözlem
değerlerini de görünür kılmasıdır.
 Genel olarak 5 ile 20 arasında dal kullanılan Dal-Yaprak grafikleri etkin ve iyi olarak kabul
edilir.

Veri Seti
150 soru içeren bir sınavda 50
kişiye ait doğru cevap sayısı Dallar | Yapraklar

İSTATİSTİK-I 31
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
Örnek DAL – YAPRAK GRAFİĞİ Sınıflar Frekans
26 23 26 75 46 46 75 53 28 63 12-21 7
92 63 95 43 98 52 59 51 98 38
69 85 17 88 72 56 79 44 84 96
S 22-31 5
87 34 14 36 14 52 75 79 17 26 ı 32-41 3
94 90 58 18 59 80 12 21 80 51 r
a 42-51 6
12 18 26 43 51 58 69 79 85 94 l 52-61 7
a
14 21 28 44 52 59 72 79 87 95
m
62-71 3
14 23 34 46 52 59 75 80 88 96
17 26 36 46 53 63 75 80 90 98 a 72-81 8
17 26 38 51 56 63 75 84 92 98 82-91 5
92-101 6
Toplam 50

1 2 4 4 7 7 8 1 2 4 4 7 7 8
2 1 3 6 6 6 8 2 1 3 6 6 6 8
3 4 6 8 3 4 6 8
4 3 4 6 6 4 3 4 6 6
5 1 1 2 2 3 6 8 9 9 5 1 1 2 2 3 6 8 9 9
6 3 3 9 6 3 3 9
7 2 5 5 5 9 9 7 2 5 5 5 9 9
8 0 0 4 5 7 8 8 0 0 4 5 7 8
9 0 2 4 5 6 8 8 9 0 2 4 5 6 8 8
İSTATİSTİK-I 32
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
BİRİKİMLİ (KÜMÜLATİF) FREKANS DAĞILIMLARI

 81 den daha az e-posta gönderen öğrencilerin sayısı ?


 40 veya daha az e-posta gönderen öğrencilerin sayısı ?

E-Posta Sayısı Frekans Birikimli Frekans


1-10 9 9 9 10 veya daha az / 11 den daha az
11-20 12 9 + 12 21 20 veya daha az / 21 den daha az
21-30 14 9 + 12 + 14 35 30 veya daha az / 31 den daha az
31-40 9 9 + 12 + 14 + 9 44 40 veya daha az / 41 den daha az
41-50 8 9 + 12 + 14 + 9 + 8 52 50 veya daha az / 51 den daha az
51-60 10 9 + 12 + 14 + 9 + 8 + 10 62 60 veya daha az / 61 den daha az
61-70 8 9 + 12 + 14 + 9 + 8 + 10 + 8 70 70 veya daha az / 71 den daha az
71-80 8 9 + 12 + 14 + 9 + 8 + 10 + 8 + 8 78 80 veya daha az / 81 den daha az
81-90 11 9 + 12 + 14 + 9 + 8 + 10 + 8 + 8 + 11 89 90 veya daha az / 91 den daha az
91-100 11 9 + 12 + 14 + 9 + 8 + 10 + 8 + 8 + 11 + 11 100 100 veya daha az / 101 den daha az

İSTATİSTİK-I 33
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
BİRİKİMLİ (KÜMÜLATİF) FREKANS DAĞILIMLARI

 81 den daha az e-posta gönderen öğrencilerin oranı ?


 40 veya daha az e-posta gönderen öğrencilerin oranı ?

E-Posta Sayısı Frekans Birikimli Frekans Göreceli Birikimli Frekans Yüzde Birikimli Frekans
1-10 9 9 0,09 9%
11-20 12 21 0,21 21%
21-30 14 35 0,35 35%
31-40 9 44 0,44 44%
41-50 8 52 0,52 52%
51-60 10 62 0,62 62%
61-70 8 70 0,7 70%
71-80 8 78 0,78 78%
81-90 11 89 0,89 89%
91-100 11 100 1 100%

İSTATİSTİK-I 34
TANIMLAYICI İSTATİSTİK: TABLOLAR ve GRAFİKLER
BİRİKİMLİ (KÜMÜLATİF) DAĞILIMLAR

Birikimli frekans (göreceli frekans / Yüzde) değerleri, bir sınıfın alt sınırının
altına düşen (‘den küçük) skorların sayısıdır (oranıdır / yüzdesidir).

Ya da

Bir sınıfın üst sınırına eşit veya altındaki (eşit veya daha küçük) skorların sayısıdır
(oranıdır / yüzdesidir).

Tanımdaki ‘den küçük veya eşit veya daha küçük ifadeleri gereği, neyin
küçük olduğunu belirleyebilmek için skorların sıralanabilmesini
gerektirir. Bu nedenle birikimli frekans dağılımları genel olarak
nominal veri için uygun değildir.

İSTATİSTİK-I 35
TANIMLAYICI YÖNTEMLER – TABLOLAR ve GRAFİKLER
ALIŞTIRMALAR
1) Bir magazin dergisi yönetimi, içerik zenginleştirmesi projesi kapsamında okuyucu
kitlesinin “medeni durumu” hakkında bilgi sahibi olmak için bir araştırma süreci başlatmış
ve uygun bir örnek kitle üzerinden aşağıdaki veri setini elde etmiştir. Veri setinin frekans
tablosunu (aşağıdaki tabloyu kullanarak) oluşturunuz. (E:Evli, B:Bekar, N:Boşanmış, D:Dul)

D D E B E N N B B E B D

N D E E D B N D E D E E

Kategoriler Frekans Göreceli Frekans

TOPLAM
İSTATİSTİK-I 36
TANIMLAYICI YÖNTEMLER – TABLOLAR ve GRAFİKLER
ALIŞTIRMALAR
2) Bir çalışmaya ait veri seti aşağıda verilen Dal-Yaprak grafiği ile özetlenmiştir.
50245
66677889
7
801789
92247
a-) Orijinal veri setini (ham veri) tekrar elde ediniz.
b-) Veri setinin frekans dağılımını tabloda gösteriniz (“b” sütunları).
c-) “değeri 90’dan küçük gözlem birimlerinin sayısı nedir?” sorusunu, tablodaki boş sütuna
(“c” sütunu) uygun dağılımı oluşturarak ve sütun başlığını da yazarak, cevaplayınız.
(b) (c)
Sınıf Aralığı Sınıf Orta Noktası Sınıf Genişliği Frekans Göreceli Frekans
50 – 59
60 – 69
70 – 79
80 - 89
90 - 99

İSTATİSTİK-I 37
TANIMLAYICI YÖNTEMLER – TABLOLAR ve GRAFİKLER
ALIŞTIRMALAR
3) En küçük alt sınırı 46 ve sınıf genişliğini 5 alarak aşağıdaki verinin frekans dağılımlarını
oluşturunuz.
68 73 81 76 83 96 76 83 95 81 48 56
75 79 90 73 76 77 84 63 68 65 62 70
4) Bir üniversitenin öğrencileri ile ilgili bir araştırmasında “Eğer bölüm seçiminizi tekrar
yapma olanağınız olsaydı tekrar aynı bölümü tercih eder miydiniz?” sorusuna aldığı
cevapların göreceli frekans dağılımı aşağıdaki gibidir.
“Sanırım Hayır” cevabını veren öğrencilerin sayısı 460 olduğuna göre bu cevabı vermeyen
öğrencilerin sayısı kaçtır.

CEVAPLAR GÖRECELİ FREKANS


Kesinlikle Evet .447
Sanırım Evet .373
Kesinlikle Hayır .134
Sanırım Hayır .046

İSTATİSTİK-I 38
TANIMLAYICI YÖNTEMLER – TABLOLAR ve GRAFİKLER
ALIŞTIRMALAR
5) Bir doktor muayenehanesinde çalışanlar, hastaların muayene öncesi bekleme zamanları
üzerine bir çalışma yapmışlar ve bir aylık bir zaman diliminde aşağıdaki bekleme sürelerini
(dk.) gözlemlemişler.
0 – 4, 5 – 9 , .... Şeklinde giden sınıfları oluşturarak gruplanmış frekans dağılımlarını
oluşturunuz. 19 dk. ve daha az bekleyen hastaların oranını bulunuz.

2 5 10 12 4 4 5 17 11 8
9 8 12 21 6 8 7 13 18 3

İSTATİSTİK-I 39
TANIMLAYICI YÖNTEMLER – TABLOLAR ve GRAFİKLER
ALIŞTIRMALAR
6) Yapılan bir araştırmanın sonuçları aşağıda verilen Dal-Yaprak grafiği ile özetlenmiştir.

0 122289
1 0333
2 35556778
3 0114566
4
5 12489
Aşağıda tabloda verilenler ve dal-yaprak grafiği verilerini kullanarak sınıf sınırlarını, frekans
ve birikimli frekans değerlerini hesaplayınız.

Sınıf Sınırları Sınıf Genişliği Frekans Birikimli Frekans


0– 8
– 15
– 20
– 17
TOPLAM

İSTATİSTİK-I 40
TANIMLAYICI YÖNTEMLER – TABLOLAR ve GRAFİKLER
ALIŞTIRMALAR
7) Bir fakülte, öğrencilerinin kampüse ne kadar mesafeden geldiklerini incelemiş ve
mesafelerin tam sayı olarak kaydedildiği veri seti aşağıdaki frekans poligonu grafiğinde
özetlenmiştir.

En küçük alt sınırı 0 (sıfır) alarak , “sınıf aralıkları (sınırları)”, “frekans” ve “göreceli frekans”
sütunlarına ait değerleri belirleyiniz. 30 km.den daha kısa mesafeden gelen öğrencilerin
oranı nedir?
Sınıf Aralıkları ? Frekans Göreceli Frekans
4.5
14.5
24.5
34.5

İSTATİSTİK-I 41

You might also like