İstatistik 2

Yrd.Doç.Dr.
İstem Köymen KESER

BİR POPULASYON VARYANSI İÇİN GÜVEN
ARALIKLARI
Bir anakütle varyansı için de güven aralığı bulmak gerekebilir.
Bu tahminler örneklem varyansına dayanır.
Varyansı σ 2 olan bir normal anakütleden n gözlemli rassal bir

örneklem seçilsin. Örneklem varyansı da S2 ile gösterilsin.
(n − 1) S x2
χ n2−1 =
σ2
Rassal değişkeni, (n-1) serbestlik dereceli ki-kare dağılımına
uymaktadır. Bu bulgu, normal bir dağılımdan örneklem
alındığında anakütle varyansı için güven aralıklarının
türetilmesinin temelini oluşturur.
Örneklem varyansının gözlenen belli değeri s x2 ise, anakütle
varyansının güven aralığı aşağıdaki gibidir:
 
 ( n − 1) S ( n − 1) S 
2 2
2
P 2
<σ < 2  1 α
=−
χα χ α
 , n −1 1− , n −1 
 2 2 
Örneğin α=0.05 n=10 olsun
Red
Bölgesi Red Bölgesi
1-α
χ21−α/2 , n−1 χ2α/2, n−1

χ 2
0.975;9 χ 2
0.025;9
Örnek
Bir çimento fabrikasında üretilen çimentodan yapılan betonların
sağlamlığının incelenmesi amacıyla 10 beton örneği alınmış ve bu
örneklerin sağlamlılıkları saptanmıştır. Bu örneklerin ortalama ve
varyansı
= x 312= S 2 195 olarak bulunmuştur. Fabrikanın ürettiği
tüm betonların varyansına ilişkin güven aralığını hesaplayınız.
1−α =
0.90 α=0.10
Red
Red Bölgesi
Bölgesi
χ 2 1− α/2, n−1 χ 2 α/2, n−1

χ 0.95;9
2
= 3.33 χ 0.05;9
2
= 16.92 4
1−α =
0.90 α = 0.10 =x 312
= S 2 195
 
 ( n − 1) S ( n − 1) S 
2 2
2
P 2
<σ < 2  1 α
=−
χα χ α
 , n −1 1− , n −1 
 2 2 
 9 (195 ) 9 (195 ) 
P 2 <σ < 2  =
2
0.90 1-α
 χ 0.05;9 χ 0.95;9  χ2α/2, n−1

3.33 16.92
S2
103.72 527.02
 9 (195 ) 9 (195 ) 
P <σ <
2
=0.90
 16.92 3.33 
P (103.72 < σ 2 < 527.02 ) =

0.90
5
ÖRNEK
Denenen bir motorun 16 deneme sürüşündeki yakıt tüketimlerinin standart
sapması 2.2 golondur. Motorun yakıt tüketiminin gerçek değişkenliğini ölçen
anakütle varyansının % 99 güven aralığını hesaplayınız. n=16 s=2.2
Red
Bölgesi Red Bölgesi
χ21−α/2,n−1 χ2α/2,n−1
 2 2

 (n − 1) s (n − 1) s 
P 2 <σ < 2
2
 = 1−α
χα χ α
 2 ,n −1 1− , n −1 
2 
n=16 S=2.2
α = 0.01
χ 02.005,15 = 32.80
2
χ 0.995,15 = 4.60
 2 2

 (n − 1) S (n − 1) S 
P 2 <σ2 < 2  1 α
=−
χα χ α
 2 ,n−1 1− ,n −1 
2 
15(2.2) 2 15( 2 . 2 ) 2

P <σ <
2
 = 0.99
 32.80 4.60 
[ ]
P 2.21 < σ 2 < 15.78 = 0.99
IBF 1008
İSTATİSTİK-II
UYGULAMA SORULARI
ARŞ. GÖR. HATEM ÇOBAN
Dokuz Eylül Üniversitesi

İktisadi ve İdari Bilimler Fakültesi
Ekonometri Bölümü
İstatistik Anabilim Dalı
30 Mart 2020
İzmir
İçindekiler
1 Güven Aralıkları 1
1.1 Popülasyon Ortalaması ve Oranı İçin Büyük Örnek Güven Aralığı . . . . . . . . . . . . 1
1.1.1 Popülasyon Ortalaması (µ) için Güven Aralığı . . . . . . . . . . . . . . . . . . 1
1.1.2 İki Popülasyon Ortalaması Arasındaki Fark (µ1 − µ2 ) için Güven Aralığı (ba-
ğımsız örnekler) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.3 Popülasyon Oranı π için Güven Aralığı . . . . . . . . . . . . . . . . . . . . . . 4
1.1.4 İki Popülasyon Oranı Arasındaki Fark (π1 − π2 ) için Güven Aralığı . . . . . . . 4
1.2 Popülasyon Ortalaması İçin Küçük Örnek Güven Aralıkları . . . . . . . . . . . . . . . . 5
1.2.1 Populasyon Ortalaması (µ) için Güven Aralığı . . . . . . . . . . . . . . . . . . 5
1.2.2 İki Populasyon Ortalaması Arasındaki Fark (µ1 − µ2 ) için Güven Aralığı . . . . 6
1.2.2.1 Eşleştirilmiş Gözlemlerde . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2.2.2 Eşleştirilmemiş(bağımsız) Gözlemlerde . . . . . . . . . . . . . . . . 7
1.3 Popülasyon Varyansı(σ 2 ) için Güven Aralığı . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.1 Tek Popülasyon Varyansı(σ 2 ) için Güven Aralığı . . . . . . . . . . . . . . . . . 8
σ2
1.3.2 İki Popülasyon Varyansının Oranı σ12 için Güven Aralığı . . . . . . . . . . . . . 8
2
1.4 Örnek Büyüklüğünün Tespiti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.4.1 Popülasyon Ortalamasının Kullanılması . . . . . . . . . . . . . . . . . . . . . . 9
1.4.2 Popülasyon Oranının Kullanılması . . . . . . . . . . . . . . . . . . . . . . . . . 10
2 Hipotez Testleri 11
Kaynaklar 11
SORULAR
1 Güven Aralıkları
1.1 Popülasyon Ortalaması ve Oranı İçin Büyük Örnek Güven Aralığı

1.1.1 Popülasyon Ortalaması (µ) için Güven Aralığı
1. Bir bankada birgün içinde açılan vadeli TL hesaplarının ortalamasını incelemek amacıyla yapılan
bir araştırma yapılmıştır. 12 günlük incelemenin sonunda vadeli hesapların ortalaması 5250 TL
olduğu görülmüştür. Daha önceki çalışmalardan populasyon standart sapmasının 350 TL olduğu
bilindiğine göre, ana kütle ortalaması için %95’lik güven aralığını oluşturup yorumlayınız.
Çözüm: Soruda verilenleri istatistik terimleriyle ifade edersek, α = 0.05 −→ α2 = 0.025, n = 12,
x = 5250, σ = 350, ana kütle varyansı bilindiğine göre α değeri için bakmamız gereken tablo z
tablosudur.

σ σ
Pr x − zα/2 σx̄ ≤ µ ≤ x + zα/2 σx̄ = Pr x − zα/2 √ ≤ µ ≤ x + zα/2 √ = 1−α
n n

350 350
= Pr 5250 − 1.96 √ ≤ µ ≤ 5250 + 1.96 √ = 0.95
12 12
= Pr(5051.969 ≤ µ ≤ 5448.031) = 0.95
Yorum: %95 güvenle ana kütle ortalaması µ, 5051.969 ile 5448.031 arasında yer almaktadır.
2. Özel bir hastahane hastalarının ortalama kalış süresini tahmin etmek istemektedir. Bu amaçla has-
tane rastgele olarak hastalardan n = 100 kişi seçmiş ve örnek ortalama kalış süresinin 4.5 gün
olduğunu tespit etmiştir. Ayrıca, tüm hastanedeki hastalar için kalış süresinin standart sapmasının
σ = 4 gün olduğu bildiğine göre, ana kütle ortalaması için %90’lık güven aralığını oluşturup yo-
rumlayınız.
Çözüm: soruda verilenleri istatistik terimleriyle ifade edersek, α = 0.10 −→ α2 = 0.05, n = 100,
x = 4.5, σ = 4, ana kütle varyansı bilindiğine göre α değeri için bakmamız gereken tablo z tablo-
sudur.
IBF 1008 İstatistik-II 1 ARŞ. GÖR. HATEM ÇOBAN

σ σ
n n

4 4
= Pr 4.5 − 1.645 √ ≤ µ ≤ 4.5 + 1.645 √ = 0.90
100 100
= Pr(3.842 ≤ µ ≤ 5.158) = 0.90
3. Uçuşlardaki boş koltuklar havayolu şirketlerinde gelir kaybına neden olur. Büyük bir havayolu
şirketinin geçen yıl boyunca uçuş başına ortalama boş koltuk sayısını tahmin etmek istemektedir.
Bunu gerçekleştirmek için 225 uçuşun kayıtları rastgele seçilmiş ve örneklenen uçuşların her biri
için boş koltuk sayısı not edilmiş. Verilerin ortalaması 11.6 ve standart sapması ise 4.1 olduğuna
göre, buna göre ana kütle ortalaması için %90’lık güven aralığını oluşturup yorumlayınız.
Çözüm: soruda verilenleri istatistik terimleriyle ifade edersek, α = 0.10 −→ α2 = 0.05, n = 225,
x = 4.5, s = 4.1, ana kütle varyansı BİLİNMEMEKTEDİR fakat örnek hacmi n = 225 > 30 oldu-
ğundan α değeri için bakmamız gereken tablo z tablosudur.

s s
n n

4.1 4.1
= Pr 11.6 − 1.645 √ ≤ µ ≤ 11.6 + 1.645 √ = 0.90
225 225
= Pr(11.15 ≤ µ ≤ 12.05) = 0.90
1.1.2 İki Popülasyon Ortalaması Arasındaki Fark (µ1 − µ2 ) için Güven Aralığı (bağımsız örnek-
ler)
1. Bir diyetisyen, yağ, karbonhidrat ve kolesterol bakımından düşük bir diyet geliştirmiştir. Diyet
başlangıçta kalp hastalığı olan kişiler tarafından kullanılmak üzere tasarlanmış olsa da, diyetis-
yen bu diyetin obez insanların ağırlıkları üzerindeki etkisini incelemek istemektedir. Her biri 100
obez kişiden oluşan iki rastgele örnek seçilir ve 100’lük bir grup az yağlı diyete yerleştirilir. Diğer
100 tanesi yaklaşık olarak aynı miktarda yiyecek içeren, ancak yağ, karbonhidrat ve kolesterol
bakımından düşük olmayan bir diyete yerleştirilir. Her bir kişi için üç haftalık bir sürede kaybedi-
len (veya alınan) kilo miktarı kaydedilir. Birinci grubun ortalaması 9.31 ve standart sapması 4.67
iken ikinci grubun ortalaması 7.40 ve standart sapması 4.04 olarak elde edilmiştir. Buna göre iki
popülasyon için ortalama kilo kaybı arasındaki farkın %95’lik güven aralığı oluşturup sonucunu
yorumlayınız.
Çözüm: soruda verilenleri istatistik terimleriyle ifade edersek, α = 0.05 −→ α2 = 0.025, n1 =
100, x1 = 9.31, s21 = 4.67, n2 = 100, x2 = 7.40, s22 = 4.04, ve ana kütle varyansları BİLİNMEMEK-
TEDİR fakat örnek hacimleri n1 = n2 = 100 > 30 olduğundan α değeri için bakmamız gereken

tablo z tablosudur.

Pr x1 − x2 − zα/2 σx1 −x2 ≤ µ1 − µ2 ≤ x1 − x2 + zα/2 σx1 −x2 = 1 − α
s s
s21 s22 s21 s22

Pr x1 − x2 − zα/2 + ≤ µ1 − µ2 ≤ x1 − x2 + zα/2 + = 1−α
n1 n2 n1 n2
r
(4.67)2 (4.04)2
:= (9.31 − 7.40) ∓ 1.96 + = 1.91 ∓ 1.96(0.62),
100 100
= Pr(0.69 ≤ µ1 − µ2 ≤ 3.13) = 0.95
Yorum: %95 güvenle popülasyon ortalamarı arasındaki fark µ1 − µ2 , 0.69 ile 3.13 değerleri ara-
sında yer almaktadır.
2. Birbirine rakip iki bilgisayar firmasının her türlü işlem için merkezi işlem birimindeki(CPU) işlem
sürelerinin varyansları sırasıyla 3 ve 2.1 değerinde olduğu bilinmektedir. Oldukça uzun işlem sü-
resine sahip olabilecek bir yapay sinir ağı kodu yazan bir kullanıcı grubu birinci firmaya ait 148
bilgisayarda kodlarını çalıştırmış ve ortalama 15.2 saniyede işlemleri sonlanmıştır. Diğer taraftan
bu grup ikinci firmaya ait 135 bilgisayarı seçip kodlarını çalıştırmış ve ortalama 11.3 saniyede
işlemleri sonlanmıştır. İki popülasyon arasındaki fark için %99’luk güven aralığını oluşturup yo-
rumlayınız.
Çözüm: Soruda verilenleri istatistik sempolleriyle ifade edersek, n1 = 148, n2 = 135, x1 = 15.2,
x2 = 11.3, σ12 = 3, σ22 = 2.1, α = 0.01 −→ α2 = 0.005 olur. Ana kütle varyansları bilindiğine göre
α için bakmamız gerek tablo z tablosudur.

Pr x1 − x2 − zα/2 σx1 −x2 ≤ µ1 − µ2 ≤ x1 − x2 + zα/2 σx1 −x2 = 1 − α
s s
σ12 σ22 σ12 σ22

Pr x1 − x2 − zα/2 + ≤ µ1 − µ2 ≤ x1 − x2 + zα/2 + = 1−α
n1 n2 n1 n2

r
3 2.1
:= (15.2 − 11.3) ∓ 2.575 + = 3.9 ∓ 2.575(0.189),
148 135
= Pr(3.413 ≤ µ1 − µ2 ≤ 4.387) = 0.99
Yorum: %99 güvenle popülasyon ortalamarı arasındaki fark µ1 − µ2 , 3.413 ile 4.387 değerleri
arasında yer almaktadır
1.1.3 Popülasyon Oranı π için Güven Aralığı
1. Bir şirket, cumhurbaşkanına güvenen ABD vatandaşlarının oranını tahmin etmek için düzenli ola-
rak kamuoyu yoklaması gerçekleştirmektedir. Yapılan bir yoklamada 1000 kişi rasgele seçilmiş ve
637 kişi başkana güvendiklerini söylemiştir. Cumhurbaşkanı’na güvenen tüm ABD vatandaşları-
nın gerçek oranı için %95’lik güven aralığını oluşturup yorumlayınız.
α x
Çözüm: Soruda verilenleri özetlersek, α = 0.05 −→ 2 =0.025, x = 637, n = 1000, p̂ = n ⇒
637 π(1 − π)
p̂ = 1000 = 0.637, q̂ = 1 − p̂ = 0.363, p̂ ∼ N π, olduğundan α değeri için bakmamız
n
gereken tablo z tablosudur.
r r
p̂q̂ p̂q̂
Pr p̂ − zα/2 σ p̂ ≤ π ≤ p̂ + zα/2 σ p̂ = Pr p̂ − zα/2 ≤ π ≤ p̂ + zα/2 = 1−α
n n

p p
= Pr 0.637 − 1.96 0.637 0.363/1000 ≤ π ≤ 0.637 + 1.96 0.637 0.363/1000 = 0.95
= Pr(0.607 − 1.96 0.03 ≤ π ≤ 0.607 + 1.96 0.03) = 0.95

= Pr(0.607 ≤ π ≤ 0.667) = 0.95
Yorum: %95 güvenle popülasyon oranı π, 0.607 ile 0.667 değerleri arasında yer almaktadır.
1.1.4 İki Popülasyon Oranı Arasındaki Fark (π1 − π2 ) için Güven Aralığı
1. Kalabalık bir ilde bir başkan adayı şehrin kuzeydoğudaki kayıtlı seçmenlerin tercihlerini güneydo-
ğusundaki seçmenlerle karşılaştırmak istemektedir. Böyle bir karşılaştırmayla, kampanya çabaları-
nın nerede daha fazla yoğunlaştırması gerektiğini belirlemede yardımcı olacaktır. Aday, kuzeydo-
ğuda 1.000, güneydoğuda 1.000 kayıtlı rasgele seçmen seçmek ve oy kullanma tercihini öğrenmek
için her biri ile görüşmek üzere profesyonel bir anketör kiralar. Şehrin kuzeydoğusunda 546, gü-
ney doğusunda 475 kişi aday lehine oy kullanacağını belirtmiştir. Buna göre, iki popülasyon oranı
arasındaki farkın %95’lik güven aralığını oluşturup yorumlayınız.
Çözüm: Soruda verilenleri özetleyelim:α = 0.05 −→ α2 = 0.025,
x1 = 546, n1 = 1000, x2 = 475, n2 = 1000,
x1 546
p̂1 = ⇒ p̂1 = = 0.546, q̂1 = 1 − p̂1 = 0.454,
n1 1000

x2 475
p̂2 = ⇒ p̂2 = = 0.475, q̂2 = 1 − p̂2 = 0.525,
n2 1000
π1 (1 − π1 ) π2 (1 − π2 )
p̂1 − p̂2 ∼ N π1 − π2 , + olduğundan α değeri için bakmamız gereken
n1 n2
tablo z tablosudur.

Pr p̂1 − p̂2 − zα/2 σ p̂1 − p̂2 ≤ π1 − π2 ≤ p̂1 − p̂2 + zα/2 σ p̂1 − p̂2 = 1 − α
r r
p̂1 q̂1 p̂2 q̂2 p̂1 q̂1 p̂2 q̂2
Pr p̂1 − p̂2 − zα/2 + ≤ π1 − π2 ≤ p̂1 − p̂2 + zα/2 + = 1−α
n1 n2 n1 n2
r
0.546 0.454 0.475 0.525
:= (0.546 − 0.475) ∓ 1.96 + = (0.546 − 0.475) ∓ 0.044
1000 1000
= Pr(0.071 − 0.044 ≤ π1 − π2 ≤ 0.071 + 0.044) = 0.95
= Pr(0.027 ≤ π1 − π2 ≤ 0.115) = 0.95
Yorum: %95 güvenle popülasyon oranıları arasındaki fark π1 − π2 , 0.027 ile 0.115 değerleri ara-
sında yer almaktadır. Şehrin kuzeydoğusunda, adayı için oy vermeyi planlayan güneydoğuya göre
%2.7 ile %11.5 arasında daha fazla kayıtlı seçmen olduğunu görülmektedir. Adayın güneydoğuda
kuzeydoğuya göre daha büyük bir kampanya çalışması yürütmesi gerektiği anlaşılıyor.
1.2 Popülasyon Ortalaması İçin Küçük Örnek Güven Aralıkları

1.2.1 Populasyon Ortalaması (µ) için Güven Aralığı
1. Yeni bir ilaç alan hastaların kan basıncındaki ortalama artışın bir tahminini isteyen ilaç şirke-
tini,insan test fazındaki n = 6 hasta için kan basıncı artışlarını ölçmüştür. Hastalara ait ortalama
kan basıncı artışı 2.283 ve standart sapması 0.95 elde edilmiştir. Buna göre, popülasyon ortalaması
için %95’lik güven aralığını oluşturup yorumlayınız.
Çözüm: Soruda verilenlere baktığımızda α = 0.05 −→ α/2 = 0.025 n = 6 , bunlarla birlikte po-
pülasyon varyansı BİLİNMEMEKTE ve örnek hacmi n = 6 < 30 olduğu görülmektedir. Dolayı-
sıyla bakmamız gereken tablo t tablosudur. Burada serbestlik derecesi v = n − 1 = 6 − 1 = 5 ve
α/2 = 0.025 olduğundan t tablosunda t5,0.025 değerini bulmamız gerekir. Tablo değerimiz t5, 0.025 =
2.571’dir.

s s
Pr x − tv, α/2 σx̄ ≤ µ ≤ x + tv, α/2 σx̄ = Pr x − tv, α/2 √ ≤ µ ≤ x + tv, α/2 √ = 1−α
n n

0.95 0.95
= Pr 2.283 − 2.571 √ ≤ µ ≤ 2.283 + 2.571 √ = 0.95
6 6
= Pr(2.283 − 0.997 ≤ µ ≤ 2.283 + 0.997) = 0.95
= Pr(1.286 ≤ µ ≤ 3.280) = 0.95
Yorum: Bu yeni ilacı almakla ilişkili kan basıncındaki ortalama artış µ, %95 güvenle 1.286 ile
3.28 puan arasındadır.
1.2.2 İki Populasyon Ortalaması Arasındaki Fark (µ1 − µ2 ) için Güven Aralığı
1.2.2.1 Eşleştirilmiş Gözlemlerde

1. Bir yakıt üretim firması otomobillerde kullanılan yakıta bir madde ekleyerek yakıtın performans
açısından iyileştiğini test etmek istemektedir. Bunun için 8 adet otomobil rastgele seçilerek eski ve
yeni yakıt kullanım sonucunda aşağıdaki performans tablosu oluşturulmuştur. Buna göre her iki
popülasyon ortalamsının normal dağıldığı varsayımı altında yeni yakıt ve eski yakıt arasındaki ana
kütle ortalama farkının %99’luk güven aralığını oluşturup yorumlayınız.
Eski Yakıt 19.4 18.8 20.6 17.6 19.2 20.9 18.3 20.4
Yeni Yakıt 19.6 17.5 18.4 17.5 18 20 18.8 19.2
Çözüm: Soruda verilenleri özetlersek, ana kütle varyansları bilinmiyor, normallik varsayımı ve-
rilmiş ve eşleştirilmiş bir gözlem grubu ile karşı karşıta olduğumuz görülmektedir. α = 0.01 −→
α/2 = 0.005, n = 8 < 30 olduğundan α değeri için bakmamız gereken tablo t tablosudur.
t8−1,0.005 = t7,0.005 = 3.499
sd sd
Pr d −tv,α/2 σd ≤ µ1 − µ2 ≤ d +tv,α/2 σd = Pr d −tn−1,α/2 √ ≤ µ1 − µ2 ≤ d +tn−1,α/2 √ = 1 − α
n n
1 n 1 n n

1
q
d = ∑ di , s2d = ∑ (di − d)2 = ∑ di2 − n(d)2 , sd = s2d
n i=1 n − 1 i=1 n−1 i=1
olduğuna göre bu değerleri elde etmeliyiz.
Eski Yakıt 19.4 18.8 20.6 17.6 19.2 20.9 18.3 20.4
Yeni Yakıt 19.6 17.5 18.4 17.5 18 20 18.8 19.2
Fark di -0.2 1.3 2.2 0.1 1.2 0.9 -0.5 1.2
1 8 1 8
q √
d = ∑ di = 0.775, s2d = ∑ (di − d)2 = 0.816, sd = s2d = 0.816 = 0.903
8 i=1 7 i=1

0.903 0.903
Pr 0.775 − 3.499 √ ≤ µ1 − µ2 ≤ 0.775 + 3.499 √ = 0.99
8 8

Pr − 0.342 ≤ µ1 − µ2 ≤ 1.892 = 0.99
Yorum: Aralık şu şekilde yorumlanabilir: .95’e eşit bir güven katsayısı ile, yeni yakıt ile eski ya-
kıt kullanımı arasındaki ortalama performans değerleri arasındaki fark −0.342 ile 1.892 aralığına
düşmektedir.Başka bir deyişle, yeni yakıtın ortalama performans değeri, eski yakıtınn ortalama
performans değerinden 0.342’den daha az, 1.892 değerinden daha fazla olacağı tahmin edilmekte-
dir (%95 güven ile).
1.2.2.2 Eşleştirilmemiş(bağımsız) Gözlemlerde

1. "Yavaş öğrenenlere" okumayı yeni bir öğretim yöntemi ile mevcut standart yöntemle karşılaştır-
mak istemektedir. Bu karşılaştırma için altı aylık bir öğrenme süresinin sonunda verilen okuma
testi sonuçları kullanılacaktır. 1000 kişilik “yavaş öğrenen” rastgele bir örneklemden 10’u yeni
yöntemle, 12’si de standart yöntemle 22 çocuğa da belirlenen altı aylık süre boyunca benzer ko-
şullar altında kalifiye eğitmenler tarafından eğitim verilmektedir. Eğitim sonucunda yeni yöntemle
eğitim görenlerin test skorlarının ortalaması 76.4 standart sapması 5.835 iken standart yöntemle
eğitim görenlerin test skorlarının ortalaması 72.333 standart sapması 6.344 olmuştur. Buna göre
her iki popülasyonun yaklaşık normal dağıldığı ve populasyon varyanslarının eşit olduğu varsa-
yımı altında, yeni yöntem ve standart yöntemle eğitim görenlerin arasındaki ana kütle ortalama
farkının %95’lik güven aralığını oluşturup yorumlayınız.
Çözüm: Soruda verilenlere göre, n1 = 10, n2 = 12, x1 = 76.4, x2 = 72.333, s1 = 5.835, s2 = 6.344,
α = 0.05 −→ α/2 = 0.025 olur. Buna göre n1 = 10 < 30, n2 = 12 < 30, her iki ana kütlenin yak-
laşık normal dağıldığı ve ana kütle varyanslarının eşit olduğu soruda verilmiş bu nedenle α için
bakmamız gerek tablo t tablosudur. Bu soru eşleştirilmemiş(bağımsız) gözlemler için anakütleler
arasındaki farkın güven aralığını bulma problemidir.

Pr (x1 − x2 ) − tv,α/2 σx1 −x2 ≤ µ1 − µ2 ≤ (x1 − x2 ) + tv,α/2 σx1 −x2 = 1 − α
s
(n1 − 1)s21 + (n2 − 1)s22

1 1
σx1 −x2 = s2p + , s2p = , tv,α/2 = tn1 +n2 −2,α/2
n1 n2 n1 + n2 − 2
tn1 +n2 −2,α/2 = t10+12−2,0.025 = t20,0.025 = 2.086
(n1 − 1)s21 + (n2 − 1)s22

s2p =
n1 + n2 − 2
(10 − 1)(5.385)2 + (12 − 1)(6.344)2
= = 37.45
10 + 12 − 2

Pr (x1 − x2 ) − tv,α/2 σx1 −x2 ≤ µ1 − µ2 ≤ (x1 − x2 ) + tv,α/2 σx1 −x2 = 0.95

s s
2
1 1 1 1
(x1 − x2 ) ∓ tv,α/2 s p + = (76.4 − 72.333) ∓ tv,α/2 37.45 +
n1 n2 10 12
= 4.07 ∓ 2.086(2.62)

Pr 4.07 − 2.086(2.62) ≤ µ1 − µ2 ≤ 4.07 + 2.086(2.62) = 0.95

Pr − 1.4 ≤ µ1 − µ2 ≤ 9.54 = 0.95
Yorum: Aralık şu şekilde yorumlanabilir: .95’e eşit bir güven katsayısı ile, yeni öğretim yöntemini
kullanma ile standart yöntemi kullanma arasındaki ortalama test puanları arasındaki fark −1.4
ile 9.54 aralığına düşmektedir.Başka bir deyişle, yeni yöntemin ortalama test puanının, standart
yöntemin ortalama test puanından 1.4 puandan daha az, 9.54 puandan daha fazla olacağı tahmin
edilmektedir (%95 güven ile).
1.3 Popülasyon Varyansı(σ 2 ) için Güven Aralığı

1.3.1 Tek Popülasyon Varyansı(σ 2 ) için Güven Aralığı
1. Çelik tel üreten bir şirketinin yöneticisi, firmanın yeni elektrikli fırınındaki sıcaklık değişkenli-
ğini değerlendirmek istiyor. Sıcaklık değerlerinin normal olarak dağıldığı bilinmektedir. 1 haftalık
bir süre zarfında 25 sıcaklıktan oluşan rastgele bir örnek seçildiğinde örneğin ortalaması 12.6 ve
varyansı 100 olarak bulunuyor. Popülasyon varyans sıcaklığı için %95’lik güven aralığı bulup yo-
rumlayınız.
Çözüm:Soruda verilenlere göre, n = 25, x = 12.6, s2 = 100, α = 0.05 −→ α/2 = 0.025 olur.
Popülasyon varyansı için güven aralığını oluşturacağımıza göre α değeri için bakmamız gerekn
tablo χ 2 tablosudur. χ 2 dağılışı simetrik olmadığından χv,α/2
2 2
ve χv,1−α/2 değerlerine bakmalıyız.
2 2
v = n − 1 = 25 − 1 = 24 olduğundan χ24,0.025 = 39.364 ve χ24,0.975 = 12.401 bulunur.
(n − 1)s2 (n − 1)s2

2
Pr 2
≤ σ ≤ 2
= 1 − α olduğundan,
χv,α/2 χv,1−α/2

(24)100 2 (24)100
Pr ≤σ ≤ = Pr(60.97 ≤ σ 2 ≤ 153.93) = 0.95
39.364 12.401
Yorum: %95 güvenle popülasyon varyansı 60.97 ile 153.93 değerleri arasında yer almaktadır.
σ12
1.3.2 İki Popülasyon Varyansının Oranı σ22
için Güven Aralığı
1. Pazara sunulan iki ayrı bağımsız hisse senedinin değişkenliklerini değerlendirmek isteyen bir yatı-
rımcı, bu hisse senetlerine ilişkin bazı istatistikler elde etmiştir. Birinci hisse senedine ait 17 günlük
bir örnek seçmiş ortalama 12.23 ve varyansını 123.38 elde ederken, ikinci hisse senedine ait 11
günlük bir örnek için ortalama 6.27 ve varyansını 8.02 bulmuştur. Her iki hisse senedinin dağı-
lışı normal ve örnekler birbirinden bağımsız seçildiğine göre popülasyon varyanslarının oranı için

%90’lik güven aralığını elde ediniz.
Çözüm: Soruda verilenlari istatistik sembolleriyle ifade edelim:
n1 = 17, x1 = 12.23, s21 = 123.38, n1 = 11, x2 = 6.27, s22 = 8.02, α = 0.10, α/2 = 0.05 İki
varyansın oranı F dağılışı gösterdiği için α değeri için bakmamız gereken tablo Ftablosudur.
v1 = n1 − 1 v2 = n2 − 1 olmak üzere,
s21 σ12 s21

Pr 2 Fv1 ,v2 :1−α/2 ≤ 2 ≤ 2 Fv1 ,v2 :α/2 = 1 − α
s2 σ2 s2
1
ve Fv1 ,v2 :1−α/2 = olduğundan,
Fv2 ,v1 :α/2
s21 σ12 s21

1
Pr 2 ≤ ≤ 2 Fv1 ,v2 :α/2 = 1 − α
s2 Fv2 ,v1 :α/2 σ22 s2
1
F16,10;0.05 = 2.83, F10,16;0.05 = 2.49 ve böylece F16,10;0.95 = = 0.40 olur.
2.49
2
σ2 s2

s 1
Pr 12 ≤ 12 ≤ 12 Fv1 ,v2 :α/2 = 1 − α
s2 Fv2 ,v1 :α/2 σ2 s2
σ2

123.38 1 123.38
Pr ≤ 12 ≤ 2.83 = 0.95
8.02 2.49 σ2 8.02
σ2

Pr 15.384(0.40) ≤ 12 ≤ 15.384(2.83) = 0.95
σ2
σ2

Pr 6.154 ≤ 12 ≤ 43.537 = 0.95
σ2
Yorum: %95 güvenle iki popülasyon varyansının oranı 6.154 ile 43.537 değerleri arasında yer
almaktadır.
1.4 Örnek Büyüklüğünün Tespiti

1.4.1 Popülasyon Ortalamasının Kullanılması
1. Endüstriyel bir işlemle üretilen metal çubukların uzunlukları 1.8 mm standart sapma ilenormal
dağılmaktadır. Bu popülasyondan dokuz gözlemin rastgele bir örneğine dayanarak, popülasyon
ortalama uzunluğunun 194.65 ile 197.75 arasında %99’luk bir güven aralığı bulunmuştur. Bir üre-
tim yöneticisinin aralığın pratik kullanım için çok geniş olduğuna inandığını ve bunun yerine örnek
ortalamanın her bir tarafında en fazla 0.50 mm’yi kapsayan %99’luk bir güven aralığı gerektirdi-
ğini belirtmektedir. Böyle bir aralığı elde etmek için ne kadar büyüklükte örnek gerekir?
Çözüm: Soruda verilenlere göre α = 0.01, ⇒ α/2 = 0.005, σ = 1.8,Ana kütle varyansı bilindiği

için α için bakılması gereken tablo z tablosudur. zα/2 = z0.005 = 2.575 olur. Örnekleme hatası (SE)
veya tolerans değeri(d) 0.50 olması isteniyor.

σ σ
Pr x − zα/2 √ ≤ µ ≤ x + zα/2 √ = 1−α
n n
| {z } | {z }
SE SE
olduğundan
σ z2α/2 σ 2
SE = zα/2 √ ⇒ n =
n (SE)2
elde edilir. Dolayısıyla
z2α/2 σ 2 (2.575)2 (1.8)2
n= = ≈ 86
(SE)2 (0.5)2
bulunur.
1.4.2 Popülasyon Oranının Kullanılması
1. Bir araştırmacı ev bilgisayarına sahip olanların oranını %95 güvenle tahmin etmek istemektedir.
Önceki bir çalışma, görüşülenlerin %40’ının evde bir bilgisayarı olduğunu göstermektedir. Araştır-
macı örnek oranın en fazla %2’si içinde kalmak istediğine göre gerekli minimum örnek büyüklüğü
kaçtır?
Çözüm: Popülasyon oranı (π) için güven aralığı;
r r
p̂(1 − p̂) p̂(1 − p̂)
Pr p̂ − zα/2 ≤ π ≤ p̂ + zα/2 = 1−α
| {z n } | {z n }
SE SE
olduğundan r
p̂(1 − p̂) (zα/2 )2 p̂(1 − p̂)
SE = zα/2 ⇒n=
n (SE)2
elde edilir. Bu durumda literatürde iki farklı yaklaşım sergilenmektedir. Birinci yaklaşımda p̂ bi-
lindiği için bunun direk olarak n formülünde kullanılmasıdır. Diğeri ise p̂ bilinmiyorsa bu değeri
p̂ = 0.5 almaktır. Bunun nedeni p̂(1 − p̂) çarpımının en büyük değeri 0.25 olmasıdır. Bu değer,
güven aralığı ve tahmin hatası göz önüne alındığında, doğru bir tahmin sağlamak için yeterince
büyük bir örnek boyutu verecektir.
Bu yüzden, SE = 0.02, α = 0.05 ⇒ α/2 = 0.025, z0.025 = 1.96, p̂ = 0.4, 1 − p̂ = 0.6 ise,

birinci yaklaşım kullanılırsa örnek hacmi,
(1.96)2 (0.4)(0.6)
n= = 2304.96 ≈ 2305
(0.02)2
ikinci yaklaşım kullanılırsa örnek hacmi,
(1.96)2 (0.5)(0.5)
n= = 2401
(0.02)2
bulunur. İkinci yaklaşım daha garanti gösteren bir yaklaşımdır.Dolayısıyla çok tercih edilmektedir.
Fakat p̂ bilindiğinde ihtiyaçtan daha fazla örnek seçilebilmektedir.
2 Hipotez Testleri
Kaynaklar
[1] A. Bluman. Elementary Statistics: A Step By Step Approach. McGraw-Hill Higher Education, 2014.
[2] J.T. McClave ve T.T. Sincich. Statistics, Global Edition. Pearson Education Limited, 2017.
[3] P. Newbold, B. Thorne, ve W. Carlson. Statistics for Business and Economics. Pearson Education,
2013.

II.Tip Hata
Örnek 1. Büyük bir enerji üreticisi firma yeni bir nükleer santral kurmuştur. Bu santral Atlantik Ok-
yanusu’na dökülmesine izin verilen atık su boşaltmaktadır. Boşaltılan su sıcaklık değerlerinin normal
dağıldığı bilinmektedir. Çevre Koruma Ajansı, santral yakınındaki marinanın termal kirliliğinin engel-
lenmesi için atık suyun sıcaklığının çok fazla olmaması gerektiğini belirtmiştir. Boşaltılan suyun sıcaklığı
60 derece veya daha az ise soğutma sisteminin doğru çalıştığı anlaşılmaktadır. Bunu test etmek amacıyla
rassal olarak seçilen 36 sıcaklık değerinin ortalaması 60.5 ve standart sapması 2 olarak elde edilmiştir.
a) %3 önem seviyesinde ortalama su sıcaklığının 60 dereceden fazla olduğu söylenebilir mi?
b) Eğer gerçek su sıcaklığı 61 derece anlaşıldığında II. Tip hata olasılığı ve testin gücünü elde ediniz.
Çözüm:
a) 1. Adım: Hipotezi kurmaktır.

H0 : µ = 60 H1 : µ > 60
2. Adım: Tablo Değerini bulmaktır. Popülasyon varyansı bilinmemekte fakat n = 36 > 30 olduğu
için α değeri için bakılması gereken tablo z tablosudur. Hipotez tek yönlü olduğu için α = 0.03 ⇒
z0.03 = zt = 1.881 bulunur.
3. Adım: Test Değerini(hesap değeri) bulmaktır.
x − µ0 x − µ0 60.5 − 60
zh = = √ = √ = 1.5
σx̄ s/ n 2/ 36
4. Adım: Karar. | zh |<| zt | olduğundan H0 hipotezi reddedilemez.

Yorum: %97 güvenle ana kütle ortalamasının 60 dereceden daha büyük olduğu söylenemez.
b) Burada H0 hipotezi için kurulan ortalamanın (µ0 = 60) yanlış olduğunu aslında gerçek ortalamanın
(µyeni = 61) olduğu söyleniyor. II. Tip Hata olasılığının H0 hipotezinin reddedilemediği bölgede
çıktığını biliyoruz öncelikle bulmamız gereken değer X üst olacaktır. X üst aşağıdaki formülle bu-
lunabilir;
s
X üst = µ0 + zα σX = µ0 + zα √
n
2
= 60 + 1.881 √
36
= 60.627
X
µ0 X üst
X
X üst µyeni
Tek taraflı H1 > µ0 bir hipotezde karşılaşılabilecek II. Tip Hata Türü, turuncu renkli kısım II. Tip Hata
olasılığını göstermektedir.
IBF 1008 İstatistik-II 1 Arş. Gör. Hatem Çoban

II.Tip Hata
Yukarıdaki şekilde II. Tip hata olasılığı gösterilmiştir. Burada bulmamız geren olasılık değeri tu-
runcu renkli bölgedir. İkinci tip hata olasılığını kolay bulmamız için verilen değerleri standart-
laştırmamız ve bu değerlere karşılık gelen olasılık değerini standart normal dağılış tablosundan
(z-tablosu) bulmamız gerekir. II. Tip hata olasılığı P(β ) ve testin gücü T.G;
P(β ) = 0.5 − P(X üst < X < µyeni )

X üst − µyeni
= 0.5 − P √ <z<0
s/ n

60.627 − 61
= 0.5 − P √ <z<0
2/ 36
= 0.5 − P(−1.12 < z < 0) = P(0 < z < 1.12)
= 0.5 − 0.3686
P(β ) = 0.1314
Testin gücü ise T.G = 1 − P(β ) olduğundan T.G = 1 − 0.1314 = 0.8686 olarak bulunur.
IBF 1008 İstatistik-II 2 Arş. Gör. Hatem Çoban

İSTATİSTİK II
Hipotez Testleri 1
1
Hipotez Testleri 1
1. Hipotez Testlerinin Esasları

2. Ortalama ile ilgili bir iddianın testi:
Büyük örnekler
3. Ortalama ile ilgili bir iddianın testi:
Küçük örnekler
4. Bir oran ile ilgili bir iddianın testi
2
Tanım
Hipotez
İstatistikte hipotez, bir anakütlenin bir
özelliği hakkındaki bir iddia yada bir
ifadedir.
3
µ = 98.6 olarak varsayıldığında
Örnek Ortalamalarının
Örnekleme Dağılışı
Örnek verisi: z = - 6.64 Olası Örnek Ortalamaları
veya
x = 98.20
µx = 98.6
z = - 1.96 z= 1.96
veya veya
x = 98.48 x = 98.72
4
Bir Hipotez Testinin
Bileşenleri
5
Sıfır Hipotezi: H0
 Bir anakütle parametresinin değeri
hakkındaki bir ifadedir. Normal
durumu ifade eder.
 =, ≥, veya ≤ ifadelerini içerir.
Test sonucu sıfır hipotezi için kararlar:
 H0 ret veya H0 reddedilemez
şeklindedir.
6
Alternatif Hipotez: H1
 H0 yanlış ise, doğrudur.
 ≠, <, > içerir.
 Sıfır hipotezinin ‘karşıtıdır’.
 Eğer bir çalışmanın sonunda
fikrinizi test etmek istiyorsanız,
bu iddiayı alternatif hipotez ile
ifade etmelisiniz. 7
Test İstatistiği
Sıfır hipotezinin reddi hakkında karar vermek
için kullanılan, örnek verilerinden hesaplanan
bir değerdir.
Büyük örnekler için, anakütle ortalamasının

testinde kullanılan test istatistiği,
x - µx
z=
σ
n
8
Ret Bölgesi (Kritik Bölge)
Test istatistiğinin, sıfır hipotezinin reddine
yol açacak tüm değerlerin seti.
Ret
bölgeleri
9
Önem Seviyesi
α ile gösterilir.
 Sıfır hipotezi gerçekte doğru iken,
test istatistiğinin ret bölgesine
düşmesi olasılığıdır.
 Genellikle 0.05, 0.01, veya 0.10
seçilir.
10
Kritik Değer
Ret bölgesi ile kabul bölgesini ayıran değer
veya değerler.
H0 Ret H0 Reddedilemez
Kritik Değer
( z değeri )
11
Çift Taraflı Test
H0: µ = 100 α, iki eşit kısma bölünür.
H1: µ ≠ 100
Küçük veya büyüktür.
H0 ret H0 reddedilemez H0 ret
100
100’den anlamlı derecede farklı olan değerler

12
Tek Taraflı Test
H0: µ =100
H1: µ > 100
Ret bölgesi sağda
H0 reddedilemez H0 ret
100’den anlamlı derecede

Büyük değerler
100
13
Tek Taraflı Test
H0: µ =100
H1: µ < 100
Ret bölgesi
solda
H0 ret H0 reddedilemez
100’den anlamlı
derecede küçük 100
değerler
14
Hipotez Testlerinde Hatalar
Tip I ve Tip II Hatalar
Sıfır hipotezi Sıfır hipotezi
DOĞRU YANLIŞ
Sıfır hipotezi Tip I hata Doğru karar

RET α (Testin gücü)
1-β
KARAR
Sıfır hipotezi Doğru karar Tip II hata
REDDEDİLEMEZ 1-α β
15
Ortalama ile ilgili bir iddianın
testi: Büyük örnekler
Varsayımlar
1) Örnek, basit şans örneğidir.
2) a) Örnek büyüktür (n >= 30) veya,
b) Anakütlenin dağılışı normaldir ve σ
bilinmektedir.
3) n >= 30 iken, σ bilinmiyorsa,

örnek standart sapması s, anakütle
standart sapması σ yerine kullanılabilir..
16
Test İstatistiği
x - µx
z= σ
n
17
Karar Kriteri
Test istatistiği ret bölgesine düşüyorsa, sıfır

hipotezi reddedilir.
Test istatistiği ret bölgesine düşmüyorsa,

sıfır hipotezi reddedilemez.
18
Çift Taraflı Z Testine Örnek:
Bir fabrikada üretilmekte olan vidaların boylarının ortalaması 100
mm, ve standart sapması 2 mm olan normal dağılım
gösterdikleri bilinmektedir. Makinalarda olan bir arıza
giderildikten sonra üretilen vidalardan alınan 9 vidalık bir örneğin
boy ortalaması 102 mm olarak bulunmuştur. Makinalardaki
arıza giderilirken vidaların boyunun ayarı bozulmuş mudur?
α=0.05 için test ediniz ve yorumlayınız.
1. Adım: Hipotezlerin belirlenmesi µ=100mm

H 0 : µ = 100mm
σ=2mm
H1 : µ ≠ 100mm
2. Adım: Test istatistiğinin hesaplanması n=9
X −µ 102 − 100
Z hesap = = =3 X = 102mm
σ 2 9
n 19
19
3. Adım: Kritik değerlerin belirlenmesi:
Standart Normal
.500 Dağılım Tablosu
- .025
 
.475 Z .05 .06 .07
1.6 .4505 .4515 .4525

α /2 = .025
α /2 = .025
1.7 .4599 .4608 .4616

-1.96 0 1.96 Z 1.8 .4678 .4686 .4693
 1.9 .4744 .4750 .4756
20
20
4. Adım: İstatistiksel karşılaştırmanın yapılması:
X −µ 102 − 100
Z hesap = = =3 idi
σ 2 9
n
H0 RED H0 RED
α /2 = .025
α /2 = .025
Zhesap=3
0
-Ztablo= -1.96 Ztablo= 1.96
5. Adım: Karar verme ve yorumlama:
Zhesap değeri H0 red bölgesine düştüğü için H0 hipotezi reddedilir,
yani vidaları boy ortalaması 100 mm’den farklıdır, makinanın ayarı
21
bozulmuştur. 21
Tek Taraflı Z Testi Örneği
• Bir kutu mısır gevreğinin ağırlığının üzerinde yazan 368

gr’dan fazla olduğu iddia edilmektedir. Ayrıca normal
dağılım varsayımı altında σ = 15 gram olduğunu belirtmiştir.
n= 25 kutuluk bir örnek alınmış veX = 372.5 gr. olarak
bulunmuştur. 0.05 seviyesinde test ediniz.
H0: µ =368
H1: µ > 368
α = 0.05
n = 25
Kritik değer:
22
22
Çözüm
H0: µ = 368 Test İstatistiği:

H1: µ > 368 X −µ 372.5 − 368
α = 0.05 Z= = = +150
.
σ 15
n = 25 n 25
• Kritik değer: Karar:
α = .05 için H0 hipotezi
RED bölgesi reddedilemez.
α=.05 Yorum:
Ortalamanın 368 gr.dan
0 Z fazla olduğuna dair yeterli
kanıt yoktur.
Zhesap=1.5 Ztablo=1.645
23
23
Çift Taraflı Z testi örneği:
Bu sene DEÜ.İİBF İktisat bölümünden mezun olacak öğrencilerin
mezuniyet not ortalamalarının 70 olduğu belirtilmekte ancak
öğrenciler 70’den farklı olduğunu iddia etmektedirler. Bu amaçla
mezuniyet sonrası 36 öğrencilik bir örnek alınmış ve mezuniyet
ortalamalarının 66, standart sapmasının 12 olduğu bulunmuştur.
Bu veriler ışığında iddiayı α=0.01 için test ediniz.
H0 : µ=70
H1 : µ≠70
X − µx X − µ 66 − 70 −4
Z= = = = = −2
sx s 12 / 6 2
n
III. α = 0.01 için z tablo değeri 2.58
IV. |zhes|<|ztab| H0 red edilemez. 24
24
Ortalama ile ilgili bir iddianın
testi: Küçük örnekler
Varsayımlar
1) Örnek, bir basit şans örneğidir.

2) Örnek, bir küçük örnektir (n < 30).
3) Anakütle standart sapması σ bilinmemektedir.
4) Anakütlenin dağılışı normaldir.
25
Test İstatistiği
x -µx
t= s
n
Kritik Değerler
t tablosundan bulunur.
Serbestlik Derecesi (df) = n -1
26
ÖRNEK
Bir konserve fabrikasının imal ettiği konservelerin üzerinde
ortalama ağırlık 455 gr yazmaktadır. Bu konservelerin ortalama
ağırlıkları ile ilgili bir karar vermek üzere rastgele seçilen 17
kutunun ortalama ağırlığı 450 gr ve standart sapması 13 gr
bulunmuştur. Ağırlıkların normal dağılım gösterdiği varsayımı
altında ortalama ağırlığın 455 gr olup olmadığını 0.05 önem
seviyesinde test ediniz.
n = 17 v = n − 1 = 16
H 0 : µ = 455 X = 450 gr.
H1 : µ ≠ 455 s = 13 gr. ttab = ±2.12
α 2 = 0.025
H 0 Red
X − µ 450 − 455
H0 Red th = = ≅ −1.54
edilem s 13
ez. n 16
-2.12-1.54 2.12
27 27
ÖRNEK: Bir otomobil firması yeni geliştirdiği teknoloji ile
ürettiği akülerin ortalama dayanma süresi olan 42 ayın
değiştiği ve artık akülerinin ortalama dayanma süresinin
42 ayın üzerinde olduğunu iddia etmektedirler. Akülerin
dayanma sürelerinin normal dağılım gösterdiği varsayımı
altında bu iddiayı araştırmak üzerine 10 adet akü örnek
olarak seçilmiş ve dayanma süreleri ay olarak aşağıdaki
biçimde bulunmuştur:
42, 36, 40, 39, 35, 43, 45, 43, 41, 46 α=0.05 önem
seviyesi için üreticinin iddiasını test ediniz.
H 0 : µ = 42 x−µ x−µ
H 1 : µ > 42 t= = t0, 05,9 = 1,833 > th = −0,88
α = 0,05 Sx S n
41 − 42
th = = −0,88
∑ x 410 3,59
x= = = 41
102
H0 Red edilemez
n 10
(∑ x )
∑x 2
−
n ∑ x2 − n x
2
16926 − 10(41) 2
S= = = = 3,59
n −1 n −1 9
28
Anakütle Ortalaması µ İçin Hipotez Testleri
Başla
normal dağılışı kullanın
Evet x - µx
Z=
n > 30 σ/ n
?
Hayır (σ bilinmediğinde s kullanın.)
Anakütle
Verilerinin Hayır
Parametrik olmayan
Dağılışı normal
Mi? İstatistik yöntemleri kullanın.
Evet normal dağılışı kullanın

σ Evet x - µx
Biliniyor Z=
mu?
σ/ n
Hayır (Nadiren karşılaşılan bir durumdur.)
Student t dağılışını kullanın

x - µx
t = s/ n
29
Bir oran ile ilgili bir iddianın
testi
30
Notasyon
n = deneme sayısı
p=x/n (örnek başarı oranı)
31
Test İstatistiği
p − π0
z=
π 0 (1 − π 0 )
n
32
ÖRNEK
Bir süpermarketler zinciri sahibi müşterilerinin %95’inin
süpermarketlerindeki fiyatlardan memnun olduğunu söylemektedir.
Tesadüfi olarak seçilen 200 müşteriden 184’ü fiyatlardan memnun
olduğunu bildirmektedir.%1 önem düzeyinde, süpermarketteki
fiyatlardan memnun olanların oranının %95’e eşit olmadığını
söyleyebilir miyiz?
H 0 : π = 0,95 α = 0.01 p = 184 / 200 = 0.92
H1 : π ≠ 0,95 Z tab = ±2.58
p −π p −π 0.92 − 0.95
Z= = = = −1.95
σp π (1 − π ) 0.95(1 − 0.95)
n 200
Hreddedilemez
0 33
33
İSTATİSTİK II
Hipotez Testleri - 2
1
Hipotez Testleri - 2
1 İki Anakütle Ortalaması Arasındaki Farkın
Testi: Bağımsız ve Büyük Örnekler
Testi: Bağımsız ve Küçük Örnekler
Testi: Eşleştirilmiş Örnekler
4 İki Anakütle Oranı Arasındaki Farkın Testi
2
İki Anakütle Ortalaması Arasındaki
Farkın Testi: Bağımsız ve Büyük
Örnekler
3
Tanımlar
Bağımsız İki Örnek
Bir anakütleden seçilen örnek değerleri,
diğer bir anakütleden seçilen örnek
değerleri ile ilişkisizdir veya bir şekilde
eşleşmemiştir.
Bir örnekteki değerler, diğer bir örnekteki
değerler ile ilişkili ise, bu tür örnekler
bağımlıdır. Böyle örneklere eşleştirilmiş
örnekler denir.
4
Varsayımlar
1. İki örnek bağımsızdır.
2. İki örnek de büyüktür. Yani, n1 >= 30 ve

n2 >= 30. Bu varsayım sağlanmadığında σ1
ve σ2 biliniyor ve her iki anakütlenin
dağılışı da normal olmalıdır.
3. Her iki örnek basit şans örneği olmalıdır.
5
 2 2
σ σ
(X1 − X 2 ) ~ N  µ1 − µ2 , 1 + 2 
 n1 n2 
6
Hipotezler
• H 0: µ 1 – µ 2 = 0
• H 1: µ 1 – µ 2 ≠ 0 (Çift Taraflı Test)
• H 0: µ 1 – µ 2 = 0
• H 1: µ 1 – µ 2 > 0 (Tek Taraflı Test)
• H 0: µ 1 – µ 2 = 0
• H 1: µ 1 – µ 2 < 0 (Tek Taraflı Test)
7
Test İstatistiği
(x1 - x2)
z =
σ 2.
σ 2
n1
1
+ n 2
σ1, σ2 bilinmediğinde, σ 12 σ 22 s12 s2 2

+ ≅ +
n1 >= 30 ve n2 >= 30 ise, n1 n2 n1 n2
8
Coca Cola Pepsi’ye Karşı
İki kola markası Coca Cola ve Pepsinin kutulu
ürünlerinin içerik ağırlıklarını (pound)
karşılaştırmak için her iki üründen şans örnekleri
alınmış ve aşağıdaki veriler elde edilmiştir. 0.01
önem seviyesinde, Coca Cola’ların ortalama
ağırlıklarının, Pepsi’lerin ortalama ağırlıklarından
farklı olup olmadığını araştırınız.
Coca Cola Pepsi

n 36 36
x 0.81682 0.82410
s 0.007507 0.005701
9
İddia: µ1 ≠ µ2
Ho : µ 1 = µ 2
H1 : µ 1 ≠ µ 2
α = 0.01
Z = - 2.575 Z = 2.575
µ1 - µ2 = 0
or Z = 0
10
z =
(0.81682 - 0.82410)
0.0075707 2 0.005701 2
+
36 36
= - 4.63
11
İddia: µ1 ≠ µ2
Ho : µ 1 = µ 2
H1 : µ 1 ≠ µ 2
α = 0.01
Z = - 2.575 Z = 2.575
Örnek verisi: µ1 - µ2 = 0
z = - 4.63 or Z = 0
12
İddia: µ1 ≠ µ2
Coca Cola’nın ortalama kutu içerik
Ho : µ 1 = µ 2 ağırlıkları, Pepsi’nin ortalama kutu
içerik ağırlıklarından anlamlı derecede
H1 : µ 1 ≠ µ 2 farklıdır.
α = 0.01
Z = - 2.575 Z = 2.575
Örnek verisi: µ1 - µ2 = 0
z = - 4.63 or Z = 0
13
İki Anakütle Ortalaması
Arasındaki Farkın Testi:
Bağımsız ve Küçük Örnekler
14
Varsayımlar
1. İki örnek de basit şans örneğidir ve bağımsızdır.
2. Anakütlelerin dağılışı normaldir ve örneklerin en az biri
30’un altındadır.
3. σ1 ve σ2 bilinmemektedir.
4. σ1 = σ2.
15
X1 − X 2
t= ~ t n1 + n2 −2
2 1 1 
s p  + 
 n1 n2 
(n1 − 1)s12 + (n2 − 1)s22

s 2p =
n1 + n2 − 2
serbestlik derecesi = n1 + n2 – 2
16
Örnek
•Bir aracı kurumda çalışan bir finansal analistten, iki hisse
senedinin ortalama fiyatlarının aynı olup olmadığını
araştırması istenmiştir. Kapanış fiyatlarından, aşağıdaki
veriler elde edilmiştir.
A Hisse S. B Hisse S.
•Gün 21 25
•Ortalama 3.27 2.53
•Std Sapma 1.30 1.16
•Aynı standart sapmalı, normal
dağılış varsayımıyla, ortalama
kapanış fiyatları aynı kabul edilebilir mi?
(α = .05) © 1984-1994 T/Maker Co.
17
Çözüm
•H0: µ1 - µ2 = 0 (µ1 = µ2) Test İstatistiği:

•H1: µ1 - µ2 ≠ 0 (µ1 ≠ µ2)
α = .05
•df = 21 + 25 - 2 = 44
•Kritik Değerler
Karar:
Sonuç:
18
Çözüm

•H1: µ1 - µ2 ≠ 0 (µ1 ≠ µ2)
α = .05
•df = 21 + 25 - 2 = 44
•Kritik Değerler
Karar:
Reject H0 Reject H0
.025 .025 Sonuç:
-2.0154 0 2.0154 t
19
Çözüm
t=
(X 1 − X2)
=
(3.27 − 2.53) = +2.03
1 1  1 1 
SP
2
⋅  +  1.510 ⋅  + 
 n1 n2   21 25 
SP
2 (n
= 1
− 1) ⋅ S1
2
+ (n2 − 1) ⋅ S 2
2
n1 + n2 − 2
=
(21 − 1) ⋅ (1.30 ) + (25 − 1) ⋅ (1.16 )
2 2
= 1.510
21 + 25 − 2
20
Çözüm

•H1: µ1 - µ2 ≠ 0 (µ1 ≠ µ2) 3.27 − 2.53
α = .05 t= = +2.03
1 1
•df = 21 + 25 - 2 = 44 1.510 ⋅  + 
 21 25 
•Kritik Değerler
Karar:
Reject H0 Reject H0 2.0154 < 2.03 H0 ret
.025 .025 Sonuç: Ortalamalar
arasında anlamlı bir
-2.0154 0 2.0154 t fark vardır.
21
İki Anakütle Ortalaması
Arasındaki Farkın Testi:
Eşleştirilmiş Örnekler
22
Varsayımlar
1. Örnek verileri eşleştirilmiştir.
2. Örnekler, basit şans örnekleridir.
3. Eşleştirilmiş veri sayısı küçük ise

(n < 30 ise), eşleşmiş verilerin farklarının
dağılışı normal olmak zorundadır.
23
Notasyon
µd = eşleştirilmiş verilerin farklarının (d’ler)

anakütlesi için ortalama değer.
d = eşleştirilmiş örnek verilerinin farkları

d’lerin ortalaması. (x - y değerlerinin
ortalamasına eşittir)
sd = eşleştirilmiş örnek verilerinin farkları d’ler

için standart sapma.
n = eşleştirilmiş veri sayısı.

24
Kritik Değerler
n < 30 ise, kritik değerler t
dağılışından bulunur.
n >= 30 ise, kritik değerler normal

dağılıştan bulunur.
25
Örnek
•Bir Pazar araştırmaları uzmanı
müşterisinin bir ürününün • (1) (2)
satışları ile rakibinin aynı Mağaza Müşteri Rakip d
ürününün satışlarını
karşılaştırmak istemektedir. • 1 10 11 -1
Bunun için rastgele 8 perakende• 2 8 11 -3
satış mağazası seçilmiş ve 3 7 10 -3
yandaki veriler elde edilmiştir.
4 9 12 -3
•müşterinin ortalama satışları,
rakip firma ortalama 5 11 11 0
satışlarından daha az mıdır? α = 6 10 13 -3
0.01 için araştırınız. 7 9 12 -3
8 8 10 -2
26
Çözüm
•H0: µD = 0 (µD = µ1 - µ2)
Test İstatistiği:
•Ha: µD < 0
α = .01
d −µd −2.25 − 0
t= = = −5.486
SD 116
.
•sd = 8 - 1 = 7
•Kritik değer
nD 8
tα,n-1 = t0.01,7 = 2.998 Karar:
Reject Ho Ret
.01 Sonuç:
Müşterinin satışları
-2.998 0 t rakibinden azdır.
27
İki Anakütle Oranı Arasındaki
Farkın Testi
28
Varsayımlar
1. İki bağımsız basit şans örneğinden elde
edilmiş oranlara sahibiz.
2. Her iki örnek için, np ≥ 5 ve nq ≥ 5

koşulları sağlanmıştır.
29
Notasyon
Anakütle 1 için:
π1 = anakütle oranı
n1 = örnek büyüklüğü
x1 = örnekteki başarı sayısı
p1 = x1/n1 (örnek oranı)
q1 = 1 - p1
Anakütle 2 için aynı tanımlamalar sırasıyla
π2, n2 , x2 , p2. and q2 , için de geçerlidir.
30
Oranlar Arasındaki Farkın
 π (1 − π 1 ) π 2 (1 − π 2 ) 
p1 − p 2 ~ N π 1 − π 2 ; 1
+ 

 n1 n 2 
31
Hipotezler
H0 π1 - π 2 = 0 π1 - π2= 0 π1 - π2= 0
H1 π1 - π2 ≠ 0 π1 - π2< 0 π1 - π2 > 0
32
Test İstatistiği
Z ≅
( p1 − p2 ) − (π 1 − π 2 ) p=
X1 + X 2
1 1 n1 + n2
p ⋅ (1 − p ) ⋅  + 
 n1 n2 
33
Örnek
•Bir firmanın personel müdürü, firmada
kullanılmış olan iki ayrı performans
değerlendirme yönteminin ne kadar adil
olduğu ile ilgili olarak çalışanların
algılamalarını ölçmüştür. Yöntem 1’i
değerlendiren 78 çalışandan 63’ü bu
yöntemi adil bulmuştur. Yöntem 2’yi
değerlendiren 82 çalışandan 49’u bu
yöntemi adil bulmuştur. 0.01 önem
düzeyinde, çalışanların algılamaları
arasında fark olup olmadığını test
ediniz.
34
Çözüm
•H0: π1 - π2 = 0 Test İstatistiği:

•H1: π1 - π2 ≠ 0
α = .01
•n1 = 78 n2 = 82
•Kritik değerler
Karar:
Sonuç:
35
Çözüm
X 1 63 X 2 49
p1 = = = .808 p2 = = = .598
n1 78 n2 82
X 1 + X 2 63 + 49
p= = = .70
n1 + n2 78 + 82
Z=
( p1 − p2 ) =
(.808 − .598)
1 1  1 1 
p ⋅ (1 − p ) ⋅  +  (.70) ⋅ (1 − .70) ⋅  + 
 n1 n2   78 82 
= +2.90
36
Çözüm
•H0: π1 - π 2 = 0 Test İstatistiği:

•H1: π 1 - π 2 ≠ 0
α = .01
Z = +2.90
•n1 = 78 n1 = 82
•Kritik Değerler:
Karar:
H0 Ret
Sonuç:
İki performans değerlendirme
yönteminin adilliğine dair
algılamaların oranları farklıdır.
37
İSTATİSTİK II
Hipotez Testleri 3
Hipotez Testleri 3
1. Bir anakütle varyansı veya standart

sapması için testler
2. İki varyansın karşılaştırılması
3. Hipotez testlerinde 2. tip hata ve testin
gücü.
Bir anakütle varyansı veya
standart sapması için testler
Varsayımlar
1) Alınan örnek bir basit şans

örneğidir.
2) Anakütlenin dağılışı normaldir.

Hipotezler
• H 0: σ = σ 0
• H 1: σ ≠ σ 0 (Çift Taraflı Test)
• H 0: σ = σ 0
• H 1: σ > σ 0 (Tek Taraflı Test)
• H 0: σ = σ 0
• H 1: σ < σ 0 (Tek Taraflı Test)
Ki-Kare Dağılışı
Test İstatistiği
(n - 1) s 2
X2=
σ2
n = örnek büyüklüğü
s 2 = örnek varyansı
σ 2 = anakütle varyansı
(sıfır hipotezinde verilmektedir)
Ki-Kare Dağılışı İçin
Kritik Değerler
 Ki-kare tablosundan
bulunur.
 Serbestlik derecesi = n -1
Table A-4 Chi-Square (x2) Distribution
Degrees of Area to the Right of the Critical Value
freedom 0.995 0.99 0.975 0.95 0.90 0.10 0.05 0.025 0.01 0.005
1 _ _ 0.001 0.004 0.016 2.706 3.841 5.024 6.635 7.879

2 0.010 0.020 0.051 0.103 0.211 4.605 5.991 7.378 9.210 10.597
3 0.072 0.115 0.216 0.352 0.584 6.251 7.815 9.348 11.345 12.838
4 0.207 0.297 0.484 0.711 1.064 7.779 9.488 11.143 13.277 14.860
5 0.412 0.554 0.831 1.145 1.610 9.236 11.071 12.833 15.086 16.750
6 0.676 0.872 1.237 1.635 2.204 10.645 12.592 14.449 16.812 18.548
7 0.989 1.239 1.690 2.167 2.833 12.017 14.067 16.013 18.475 20.278
8 1.344 1.646 2.180 2.733 3.490 13.362 15.507 17.535 20.090 21.955
9 1.735 2.088 2.700 3.325 4.168 14.684 16.919 19.023 21.666 23.589
10 2.156 2.558 3.247 3.940 4.865 15.987 18.307 20.483 23.209 25.188
11 2.603 3.053 3.816 4.575 5.578 17.275 19.675 21.920 24.725 26.757
12 3.074 3.571 4.404 5.226 6.304 18.549 21.026 23.337 26.217 28.299
13 3.565 4.107 5.009 5.892 7.042 19.812 22.362 24.736 27.688 29.819
14 4.075 4.660 5.629 6.571 7.790 21.064 23.685 26.119 29.141 31.319
15 4.601 5.229 6.262 7.261 8.547 22.307 24.996 27.488 30.578 32.801
16 5.142 5.812 6.908 7.962 9.312 23.542 26.296 28.845 32.000 34.267
17 5.697 6.408 7.564 8.672 10.085 24.769 27.587 30.191 33.409 35.718
18 6.265 7.015 8.231 9.390 10.865 25.989 28.869 31.526 34.805 37.156
19 6.844 7.633 8.907 10.117 11.651 27.204 30.144 32.852 36.191 38.582
20 7.434 8.260 9.591 10.851 12.443 28.412 31.410 34.170 37.566 39.997
21 8.034 8.897 10.283 11.591 13.240 29.615 32.671 35.479 38.932 41.401
22 8.643 9.542 10.982 12.338 14.042 30.813 33.924 36.781 40.289 42.796
23 9.260 10.196 11.689 13.091 14.848 32.007 35.172 38.076 41.638 44.181
24 9.886 10.856 12.401 13.848 15.659 33.196 36.415 39.364 42.980 45.559
25 10.520 11.524 13.120 14.611 16.473 34.382 37.652 40.646 44.314 46.928
26 11.160 12.198 13.844 15.379 17.292 35.563 38.885 41.923 45.642 48.290
27 11.808 12.879 14.573 16.151 18.114 36.741 40.113 43.194 46.963 49.645
28 12.461 13.565 15.308 16.928 18.939 37.916 41.337 44.461 48.278 50.993
29 13.121 14.257 16.047 17.708 19.768 39.087 42.557 45.722 49.588 52.336
30 13.787 14.954 16.791 18.493 20.599 40.256 43.773 46.979 50.892 53.672
40 20.707 22.164 24.433 26.509 29.051 51.805 55.758 59.342 63.691 66.766
50 27.991 29.707 32.357 34.764 37.689 63.167 67.505 71.420 76.154 79.490
60 35.534 37.485 40.482 43.188 46.459 74.397 79.082 83.298 88.379 91.952
70 43.275 45.442 48.758 51.739 55.329 85.527 90.531 95.023 100.425 104.215
80 51.172 53.540 57.153 60.391 64.278 96.578 101.879 106.629 112.329 116.321
90 59.196 61.754 65.647 69.126 73.291 107.565 113.145 118.136 124.116 128.299
100 67.328 70.065 74.222 77.929 82.358 118.498 124.342 129.561 135.807 140.169
Örnek: yeni tasarlanan bir otomobil motorunun benzin tüketiminin
standart sapmasının, 2.5 galondan farklı olup olmadığını anlamak için
16 motor test edilmiş ve örnek standart sapması 2.2 galon
bulunmuştur. İddiayı α = 0.01 önem seviyesinde araştırınız.
Örnek: yeni tasarlanan bir otomobil motorunun benzin tüketiminin
standart sapmasının, 2.5 galondan farklı olup olmadığını anlamak için
16 motor test edilmiş ve örnek standart sapması 2.2 galon
bulunmuştur. İddiayı α = 0.01 önem seviyesinde araştırınız.
iddia: σ ≠ 2.5
H0: σ 2= 6.25
H1: σ2 ≠ 6.25
Örnek: yeni tasarlanan bir otomobil motorunun benzin tüketiminin standart
sapmasının, 2.5 galondan farklı olup olmadığını anlamak için 16 motor test
edilmiş ve örnek standart sapması 2.2 galon bulunmuştur. İddiayı α = 0.01
önem seviyesinde araştırınız.
iddia: σ ≠ 2.5
H0: σ 2= 6.25
α = 0.01 α/2 = 0.005
H1: σ2 ≠ 6.25
0.005 0.005
iddia: σ ≠ 2.5
H0: σ 2= 6.25
α = 0.01 α/2 = 0.005
H1: σ2 ≠ 6.25
n = 16
0.005 0.005 df = 15
32.801
iddia: σ ≠ 2.5
H0: σ 2= 6.25
α = 0.01 α/2 = 0.005
H1: σ2 ≠ 6.25
0.995
n = 16
0.005 0.005 df = 15
4.601 32.801
x 2
=
(n -1)s2
σ 2
= (16 -1) (2.2)2
2.52
≈ 7.916
x 2
=
(n -1)s2
σ 2
= (16 -1) (2.2)2
2.52
≈ 7.916
H0 reddedilemez
4.601 32.801
x2 = 7.916
Tüketim değerlerinin standart sapmasının 2.5
galondan farklı olduğu söylenemez.
İki Varyansın Karşılaştırılması
•Varyansların karşılaştırılması söz konusu

olduğunda, F dağılışı kullanılır:
(n1 − 1) s12
χ12 σ 12
ν1 (n1 − 1) s12 / σ 12
F= 2 = 2
= 2 2
χ 2 (n2 − 1) s2 s2 / σ 2
ν2 σ 22
(n2 − 1)
•Dağılışın serbestlik dereceleri

İki Varyansın Karşılaştırılması
•Sıfır hipotezi:
2 2
•H0: σ 1 = σ 2
•İki anakütle varyansı eşit, diğer bir deyişle birbirine
oranı “1” anlamına gelmektedir.
•Buradan, test istatistiği F, sadeleşerek
halini alır.
F Dağılışı
Alternatif Hipotez, Test İstatistiği
ve Ret Bölgesi
• H1: σ 2 ≠ σ 2
1 2
s12 > s22 ise F = s12 / s22 > Fα / 2,n1 −1,n2 −1 ise H0 ret
s22 > s12 ise F = s22 / s12 > Fα / 2,n2 −1,n1 −1 ise H0 ret
2 2
σ
• H1: 1 < σ 2 F = s22 / s12 > Fα ,n2 −1,n1 −1 ise H0 ret
• H1: σ 2 > σ 2
1 2
F = s12 / s22 > Fα ,n1 −1,n2 −1 ise H0 ret
Örnek
• Bir fabrikadaki aynı işi yapan iki makasın aynı kalitede
üretim yapıp yapmadığını araştırmak için her iki makasta
kesilmiş metal çubuklardan 8’er örnek alınmış ve boy
değerleri aşağıdaki gibi bulunmuştur. Kalite ölçüsü
olarak varyans kullanılırsa, α = 0.02 için araştırma
yapınız.
• Birinci makas - 7.5, 8.2, 8.1, 8.4, 7.1, 7.3, 7.1, 7.8
• İkinci makas - 7.9, 8.4, 8.0, 7.8, 7.5, 7.2, 7.4, 7.3
Örnek
H0: σ 12 = σ 22
H1: σ 12 ≠ σ 22
2 2
F= s1 / s2 = 0.261 / 0.167 = 1.565
Fα / 2,n1 −1,n2 −1 = F0.01,7,7 = 6.9928
1.565 < 6.9929 H0 reddedilemez.

Hipotez Testlerinde II. Tip
Hata Olasılığı
II. Tip Hata Olasılığı
• H0 gerçekte yanlış iken doğru kabul

edilmesi olasılığıdır.
• II. Tip hata olasılığı şunlara bağlıdır:
–α
– Örnek büyüklüğü
– Anakütle varyansı
– Gerçek ortalama ile hipotezdeki ortalama
arasındaki fark
Örnek
• Bir otomobil lastiği imalatçısı, lastiklerini en az
35000 mil sorunsuz kullanacak şekilde
tasarlamaktadır.
• Bağımsız bir test kuruluşu, ortalama ömrün
35000 milin altında olup olmadığını test etmek
için 35 lastik üzerinde hızlandırılmış yaşam testi
gerçekleştirilmiştir.
• α = 0.05 önem düzeyinde karar verilecektir.
• Anakütle standart sapması 4000 mil olarak
bilinmektedir.
• Gerçek ortalama ömür 34000 mil ise, II. Tip hata
olasılığı nedir?
II. Tip Hatanın Hesaplanması
μt μ0
μ0 - zα (σ/√n)
μ0 - zα (σ/√n) = 35000 – (1.645)(4000/√35)

= 33887.78
Gerçek ortalama 34000 iken, örnek ortalamasının
33887.78’in altında çıkması olasılığı,
– Standardize: [μ0 - zα (σ/√n)] – μt
σ/√n
– II. Tip hata olasılığı

β = P(z > (μ0– μt)/(σ/√n) - zα )
• β =1-P(z < (μ0– μt)/(σ/√n) - zα ))

= 1-P(z < (35000 – 34000)/(4000/√ 35) -
1.645)
= 1-P(z < 1.48) = 1 - 0.9306 = 0.0694
Örnek
• Gerçek ortalama 32000 ise ve α = 0.001 için II.

Tip hata olasılığı ne olur?
• β =1-P(z < (μ0– μt)/(σ/√n) - zα ))
= 1-P(z < (35000 – 32000)/(4000/√ 35) -3.090)
= 1-P(z < 1.35) = 1-0.9115=0.0885
Testin Gücü
• Güç nedir?
⇒ Testin gücü = 1 - β
1) Bir kafede yaz aylarında satılan
HİPOTEZ TESTLERİ
TESTLERİ limonataların satış miktarının ortalamasının
24 lt.’den az olduğu iddia edilmektedir. İddiayı
ALIŞ
ALIŞTIRMA SORULARI test etmek amacıyla 36 günlük bir inceleme
yapılmış ortalamanın 22 lt. ve standart
sapmanın ise 3,5 lt. olduğu görülmüştür. Buna
göre α = 0,04 önem seviyesinde gerekli
hipotezleri kurup iddiayı test ederek
yorumlayınız.
2012
Araş.Gör. Efe SARIBAY
2) Bir hisse senedinin kapanış fiyatının 3) Bir üretici satın aldığı çelik levhaların
varyansının daha önceki yapılan ağırlıklarının ortalamasının 100 kg.
çalışmalardan 144 olduğu bilinmektedir. 25 standardına uygun olup olmadığını
günlük yapılan bir inceleme sonucunda hisse araştırmaktadır. Bu amaçla incelenen
senedinin kapanış fiyatının ortalaması 35 24 adet levhanın ağırlıklarının ortalaması
olarak hesaplanmıştır. Hisse senedinin 95 kg. ve varyansı 121 olarak
kapanış fiyatı ortalamasının 30’dan büyük hesaplanmıştır. Levhaların ağırlıklarının
olduğu iddiasını α = 0,01 önem seviyesinde normal dağılıma uygun olduğu varsayımı
iddiayı test edip yorumlayınız. altında α = 0,02 önem seviyesinde iddiayı
test edip yorumlayınız.
1
4) Çevre koruma müdürlüğü büyük bir 5) Yabancı marka spor ayakkabı üreten bir
sanayi kuruluşunun çıkardığı günlük işletme Ege Bölgesi’ndeki Pazar payının
sülfürükoksit miktarının ortalamasının
belirlemek için araştırma yapmıştır. Bu % 30’dan fazla olduğunu iddia etmektedir. Bu
miktarın kabul edilebilir ortalama olan 9’dan amaçla yapmış olduğu bir alan
az olduğu iddia edilmektedir. Ölçüm fiyatları araştırmasında 850 kişiden 289 kişi
çok yüksek olduğundan sadece 9 günlük tarafından bu markanın tercih edildiği
ölçümlerden bir rastgele örnek oluşturularak
aşağıda verilmiştir.Normal dağılış varsayımı görülmüştür. α = 0,08 önem seviyesinde
hipotezi α = 0,10 önem seviyesinde test iddiayı test edip yorumlayınız.
edip yorumlayınız.
7,3 8,3 9,4 8,9 7,4 7,5 9,3 8,8 9,6
6) Genel seçimlerde A partisinin oy oranının 7) Uzun dönemde bir hisse senedinin

kaç olacağı konusunda bir araştırma kapanış fiyatının varyansının 2,05
yapılması isteniyor. Bu amaçla İzmir’de 1000 seviyesinde sabitlenmesi planlanmıştır.
kişi üzerinde yapılan bir kamuoyu Yapılan düzenlemelerden sonra, 17 gün
yoklamasında 470 kişinin A partisine oy boyunca yapılan bir inceleme sonucunda
verdiği görülmüştür. A partisinin İzmir ili oy hisse senedinin kapanış fiyatının ortalaması
oranının % 50’ye eşit olup olmadığını 4,05 ve standart sapması 1,77 olarak elde
α = 0,004 önem seviyesinde test edip edilmiştir. Arzu edilen hedefe ulaşıp
yorumlayınız. ulaşılmadığını α = 0,05 önem seviyesinde
2
8) Bir ekmek fabrikasında günlük üretilen 9) Ege İ.İ.B.F ve Dokuz Eylül İ.İ.B.F. okuyan
ekmeklerin ağırlıklarının varyansları öğrencilerin ALES sınavı başarıları
konusunda yapılan bir çalışmada incelenen karşılaştırılmak isteniyor. Fakültemizin öğretim
41 ekmeğin ağırlıkları ortalaması 400gr., üyeleri öğrencilerimizin daha başarılı olduğunu
öne sürerek aşağıdaki istatistiksel bilgileri
standart sapması ise 12 gr. olarak
ALES sınav sonuçlarından elde ediyorlar. Buna
hesaplanmıştır. Yapılan iyileştirmeler
göre öne sürülen görüşün doğruluğunu
sonucunda ekmelerin ağırlığının varyansının α = 0,003 önem seviyesinde test edip
300’den az olacağı beklendiğine göre, yorumlayınız.
beklentinin karşılanıp karşılanmadığını
Ege İİBF DEU İİBF
α = 0,01 önem seviyesinde test edip
n 50 70
yorumlayınız.
x 70 76
s 6 7
10) Bodrum ve Marmaris’in yaz ayları 11) Zirai bir merkezde bir gübrenin buğday üretimi
üzerindeki etkisi ölçülecektir. Bunu incelemek
içerisindeki deniz suyu sıcaklıkları
amacıyla şansa bağlı olarak 10 toprak saha
karşılaştırılmak isteniyor. Bu amaçla 40 gübrelenmiş ve diğer 12 toprak saha kontrol grubu
günlük yapılan bir inceleme sonucunda olarak gübrelenmiştir. Diğer tüm koşulların aynı
Bodrum’daki deniz suyu sıcaklık ortalaması olduğu bilgisi altında, gübrelenen parsellerde
250C, varyansı 16, Marmaris’te yapılan 50 ortalama buğday üretimi 5,1 kg. ve standart sapma
günlük bir inceleme sonucunda deniz suyu 0,36 kg bulunmuştur. Kontrol grubunda ise ortalama
sıcaklığı 270C, varyansı ise 25 olarak buğday tüketimi 4,8 kg. ve standart sapma 0,4 kg.
olarak bulunmuştur. Anakütle dağılımlarının normal
hesaplanmıştır. Deniz suyu sıcaklıklarının
ve eşit varyanslı olduğu varsayımı altında kontrol
ortalamasının birbirine eşit olup olmadığını grubunda ortalama buğday üretiminin gübrelenmiş
α = 0,05 önem seviyesinde test edip parsellerden daha az olduğu iddiasını α = 0,01
yorumlayınız. önem seviyesinde test edip yorumlayınız.
3
12) Karşıyaka ve Alsancak’ta şubesi bulunan 13) Yatılı okul eğitiminin öğrencilerin
pastanenin aylık tükettiği dondurma miktarları ağırlıklarında bir farklılık meydana getirip
karşılaştırmak isteniyor. 12 aylık bir inceleme getirmediğini araştırmak amacıyla
sonucunda Karşıyaka’da satılan dondurma rastgele seçilen 6 öğrencinin ilk gün
miktarının ortalaması 65 kg., standart sapması ağırlıkları ile 6 ay sonraki ağırlıkları
5 kg., Alsancak’ta ise ortalamanın 72 kg.,
standart sapmanın ise 6 kg olduğu
aşağıdaki gibi kaydedilmiştir. Buna göre
görülmüştür. Anakütle dağılımlarının normal bir yıllık yatılı eğitiminin öğrencilerin
ve eşit varyanslı olduğu varsayımı altında ağırlıkları üzerinde herhangi bir etkisi olup
Alsancak’ta satılan dondurma miktarının olmadığını α = 0,10 önem seviyesinde
ortalamasının Karşıyaka’dan daha fazla test edip yorumlayınız.
olduğu iddiasını α = 0,025 önem seviyesinde öğrenciler 1 2 3 4 5 6
test ediniz. ilk gün ağırlıkları (kg.) 64 71 46 80 95 47
1 yıl sonraki ağırlıkları (kg.) 56 73 45 82 90 52
14) Piyasa yeni sürülecek olan bir tansiyon 15) Bir bankada ocak ve şubat aylarında
ilacının etkinliğinin araştırılmaktadır. Bu yatırımcıların altın fonu alma oranları
amaçla 7 tansiyon hastasının ilaç karşılaştırılmak isteniyor. Şubat ayında 250
verilmeden önce ve ilaç verildikten sonra yatırımcıdan 117’si, Mart ayından ise 325
tansiyon değerleri ölçülüp aşağıdaki tabloda yatırımcıdan 141’i yatırımlarını altın fonu alarak
verilmiştir. Buna göre ilacın tansiyonu değerlendirmiştir. Buna göre Şubat ve Mart
düşürmede etkili olup olmadığını aylarında yatırımcıların altın fonunu tercih
yorumlayınız etme oranlarının birbirine eşit olup olmadığını
yorumlayınız
İlaç öncesi 14 16 17 18 16 19 21
İlaç sonrası 13 15 17 15 14 16 17
4
16) İstatistik 2 dersi başarı oranı açısından 17) İMKB’de işlem gören iki hisse senedinin
İşletme ve İktisat Bölümleri karşılaştırılmak haftalık kapanış fiyatları arasındaki
isteniyor. Bu amaçla iktisat bölümünde okuyan değişkenlik karşılaştırılmak isteniyor. Bu
istatistik 2 dersini almış 150 öğrenci seçiliyor ve amaçla A hisse senedinin 13 haftalık kapanış
80’inin başarılı olduğu, işletme bölümünde fiyatlarının varyansı 81, B hisse senedinin 21
okuyan istatistik 2 dersini almış 200 öğrenciden haftalık kapanış fiyatının varyansı ise 65
120’sinin başarılı olduğu görülüyor. İşletme olarak hesaplanmıştır. B hisse senedinde
bölümü öğrencilerinin başarını oranının daha meydana gelen değişkenliğin A hisse
fazla olduğu iddiasını α = 0,10 önem senedinde meydana gelen değişkenlikten
seviyesinde test edip yorumlayınız. daha az olduğu iddiasını normal dağılış
varsayımı altında α = 0,05 önem seviyesinde
18) İki fabrikada çalışan işçilerin ücretlerinin

değişkenliği karşılaştırılmak isteniyor. Bu
amaçla A fabrikasından 9, B fabrikasından da
11 işçi şansa bağlı olarak seçiliyor. A
fabrikasından seçilen işçi ücretlerinin standart
sapması 15 TL., B fabrikasından seçilen
işçilerin ücretlerinin standart sapması ise 22
TL. olarak bulunmuştur. Ücretlerin normal
dağıldığı varsayımı altında her iki fabrikadaki
işçilerinin ücretlerinin varyanslarının eşit olup
olmadığını α = 0,10 önem seviyesinde test
edip yorumlayınız.
5
İSTATİSTİK-II
Korelasyon ve Regresyon
1
Korelasyon ve Regresyon
• Genel Bakış
• Korelasyon
• Regresyon
• Belirleme katsayısı
• Varyans analizi
• Kestirimler için aralık tahminlemesi
2
Genel Bakış
İkili veriler
 aralarında bir ilişki var mıdır?
 varsa bu ilişki bir eşitlik ile temsil
edilebilir mi?
 bu eşitliğin kestirimler (öngörümler)
için kullanılması
3
Korelasyon
4
Tanım
Korelasyon
bir değişkenin değeri değişirken
diğer bir değişken bununla
doğrusal ilişkili olarak
değişiyorsa korelasyon vardır
denebilir.
5
Varsayımlar
1. (x,y) ikili verilerden oluşan örnek
bir şans örneğidir.
2. x ve y’lerin dağılışı normaldir.
6
Tanım
Saçılma diyagramı
yatay eksen x, dikey eksen y
olmak üzere, (x,y) ikili örnek
verilerinin işaretlendiği bir
grafiktir. Her bir (x,y) ikilisi tek bir
noktadır.
7
Örnek
Bir firma bünyesindeki satış personeli
sayısı ile satış gelirleri arasındaki ilişkiyi
bilmek istemektedir.
Satış Personeli Sayısı Satış Gelirleri (yüz
Yıllar
(x) bin $) (y)
1999 15 1,35
2000 18 1,63
2001 24 2,33
2002 22 2,41
2003 25 2,63
2004 29 2,93
2005 30 3,41
2006 32 3,26
2007 35 3,63
2008 38 4,15
8
İkili Verilerin Saçılma Diyagramı
Scatterplot of satış geliri vs personel sayısı
4,5
4,0
3,5
satış geliri
3,0
2,5
2,0
1,5
1,0
15 20 25 30 35 40
personel sayısı
9
Pozitif Korelasyon
y y y
x x x
(a) Pozitif (b) Güçlü (c) Mükemmel
pozitif pozitif
10
Negatif Korelasyon
y y y
x x x
(d) Negatif (e) Güçlü (f) Mükemmel
negatif negatif
11
y y
x x
(g) Korelasyon yok (h) Doğrusal olmayan güçlü ilişki
12
Tanım
Korelasyon Katsayısı r
Bir örnekteki x ve y ikili değerleri arasındaki
doğrusal ilişkinin gücünü ölçmektedir.
nxy - (x)(y)
r=
n(x2) - (x)2 n(y2) - (y)2
13
Korelasyon Katsayısı r’nin
Özellikleri
1. -1  r  1
2. Mükemmel pozitif doğrusal ilişki olduğunda
r = 1 olur.
3. Mükemmel negatif doğrusal ilişki
olduğunda r = -1 olur.
4. Doğrusal ilişki yok ise r = 0 olur.
14
Korelasyon ile ilgili hatalar
1. Nedensellik: Korelasyon değişkenler
arasındaki sebep sonuç ilişkilerini açıklamaz.
2. Doğrusallık: x ile y arasında anlamlı bir

korelasyon olmadığı halde, aralarında farklı
şekilde bir ilişki olabilir. (Bakınız izleyen slayt)
15
Korelasyon ile ilgili hatalar
250
200
150
y
100
50
0
0 1 2 3 4 5 6 7 8
16
Örnek Verileri İçin Korelasyon
Hesaplamaları
Satış Gelirleri
Satış Personeli
Yıllar (yüz bin $) x2 y2 xy
Sayısı (x)
(y)
1999 15 1,35 225 1,8225 20,25
2000 18 1,63 324 2,6569 29,34
2001 24 2,33 576 5,4289 55,92
2002 22 2,41 484 5,8081 53,02
2003 25 2,63 625 6,9169 65,75
2004 29 2,93 841 8,5849 84,97
2005 30 3,41 900 11,6281 102,3
2006 32 3,26 1024 10,6276 104,32
2007 35 3,63 1225 13,1769 127,05
2008 38 4,15 1444 17,2225 157,7
Toplamlar 268 27,73 7668 83,8733 800,62
17
Örnek Verileri İçin Korelasyon
Hesaplamaları
nxy - (x)(y)
r=
n(x2) - (x)2 n(y2) - (y)2
(10)(800,62) - (268)(27,73)
r=
(10)(7668) - (268)2 (10)(83,8733) - (27,73)2
r = 0,987 Güçlü pozitif korelasyon
18
Anakütle Korelasyon
Katsayısının Testi
 =Anakütle korelasyon katsayısı
 H0: =
(anlamlı bir korelasyon yoktur)
H1: 
(anlamlı bir korelasyon vardır)
19
Test İstatistiği t
Test istatistiği:
r
t=
1-r2
n-2
Kritik değerler
serbestlik derecesi = n - 2 olan tablo

değerleri dikkate alınarak karar verilir.
20
Ret Bölgeleri
21
Anakütle Korelasyon
Katsayısının Testi
 =Anakütle korelasyon katsayısı
 H0: =
(satış personeli sayısı ile satış gelirleri arasında
anlamlı bir korelasyon yoktur)
H1: 
(satış personeli sayısı ile satış gelirleri arasında
anlamlı bir korelasyon vardır)
22
Test istatistiği:
0,987
r = 17,39
t= =
1-r2 1 – 0,987 2
n-2 10 - 2
Kritik değer
serbestlik derecesi = n - 2 = 10 – 2 = 8, a = 0,05 için t0,025, 8= 2,31 < 17,39
Karar: H0 ret. Korelasyon anlamlıdır.
23
Regresyon
x bağımsız değişken (açıklayıcı
değişken)
y bağımlı değişken (cevap = yanıt

değişkeni)
y = b0 + b1x + e Basit doğrusal

regresyon modeli
b1 = eğim b0 = kesen
24
Regresyon
 Regresyon Eşitliği
Verilen bir ikili veriler topluluğu için regresyon
eşitliği,
y^ = b0 + b1x
iki değişken arasındaki ilişkiyi tanımlamaktadır.
b1 = eğim b0 = kesen
 Regresyon Doğrusu
Regresyon eşitliğinin grafiğidir.
25
Regresyon Doğrusu
Scatterplot of satış geliri vs personel sayısı
4,5
4,0
3,5
satış geliri
3,0
2,5
2,0
1,5
1,0
15 20 25 30 35 40
personel sayısı
26
Notasyon
Anakütle Örnek
Parametresi istatistiği
Regresyon eşitliğinde kesen 0 b0
Regresyon eşitliğinin eğimi 1 b1

Regresyon modeli ve eşitliği y = 0 + 1 x + e ^
y = b0 + b1 x
27
Artıklar ve En Küçük Kareler
Yöntemi
Artıklar
e = (y - ^
y)
En Küçük Kareler Yöntemi
e2’yi minimum yapan b0 ve b1 değerlerinin
bulunmasıdır.
28
0 and 1 için En Küçük Kareler
Tahminleyicileri
(y) (x2) - (x) (xy)
b0 =
n(x2) - (x)2
n(xy) - (x) (y)

b1 =
n(x2) - (x)2
29
Önce b1 bulunursa, ardından
b0 = y - b1x
30
Satış geliri için regresyon
eşitliğinin tahminlenmesi
n(xy) - (x) (y)
b1 =
n(x2) - (x)2
10(8,62) - (268) (27,73)
b1 =
10(7668) - (268)2
b1 = 0,118
b0 = y - b1x = 2,773 – (0,118)(26,8) = - 0,398

31
Kestirimler (Öngörümler)
Verilen bir x değeri için y’nin değeri ne
olur?..
Eğer anlamlı bir korelasyon varsa, en iyi
öngörülen y değeri, x değerinin regresyon
eşitliğinde yerine konulmasıyla bulunur.
Önemli Not: Regresyon doğrusu yalnızca

tahminlemede kullanılan x uzayı içinde
geçerlidir. Mevcut x’lerden uzak bir noktada
öngörümleme yapılmamalıdır. 32
30 satış personeli çalıştığında satış gelirinin
kestirilmiş değeri nedir?
^
y = - 0.398 + 0.118 (30)
^
y = 3.1516, 315160 $
33
Toplam Değişkenlik, Açıklanan Değişkenlik ve
Açıklanamayan Değişkenlik
y
20
(5, 19)
19
18
•
17 Açıklanamayan
16 değişkenlik
15 Toplam (5, 13) ^)
14 (y - y
13
değişkenlik
(y - y )
• Açıklanan
12
11 değişkenlik
10
(^
y - y)
9
8
•
7 (5, 9) y=9
6
5
4
y^ = 3 + 2x
3
2
1
0 x
0 1 2 3 4 5 6 7 8 9
34
(toplam değişkenlik) = (açıklanan değişkenlik) + (açıklanamayan değişkenlik)
(y - y) = ^
(y - y) + (y - ^y)
(toplam değişkenlik) = (açıklanan değişkenlik) + (açıklanamayan değişkenlik)
(y - y) =  +  (y - y)
2 ^ 2 ^ 2
(y - y)
(Genel kareler toplamı) = (regresyon kareler toplamı) + (artık kareler toplamı)
35
Tanım
Belirleme Katsayısı
y’deki değişkenliğin ne kadarının regresyon
doğrusu tarafından açıklanabildiğini söyler.
2 Regresyon kareler toplamı

r =
Genel kareler toplamı
^ - y)2
 (y
2
RKT
r = =
 (y - y)2 GKT
36
^ - y)2
 (y
2
b12( x2 – (x)2/n)
r = =
 (y - y)2  y2 – (y)2/n
2
0,1182(7668 – (268)2/10)
r = = %97,4
83,873– (27,73)2/10
y’deki değişmelerin %97,4’ü regresyon doğrusu

ile açıklanabilmektedir.
37
Varyans Analizi Tablosu (VAT)
Değişkenlik Kareler Serbestlik Kareler F-Oranı
Kaynağı Toplamları (KT) Derecesi Ortalaması (KO)
Regresyon KO =
Regresyon
RKT = b1 ( x – (x) /n) 1
2 2 2 RKO = RKT / 1
RKO
Artık Kareler Toplamı Artık KO = F
Artık AKT = GKT - RKT AKO = AKT / (n – 2) AKO
n-2
= S2
Toplam
(Genel) Genel Kareler Toplamı n-1
GKT =  y2 – (y)2/n
38
Hata Varyansının Tahmini
2  (y - y) ^ 2
s = = Artık Kareler
n-2 Ortalaması
Tahminin Standart Hatası

 (y ^
- y) 2
s= n-2
39
F - Testi
 H0: 12...k
(Model anlamsızdır)
H1: en az bir i için i
(Model anlamlıdır)
40
F – Testi (Basit Doğrusal
Regresyon İçin)
 H0: 1
H1: 1
Test İstatistiği = F – oranı
Ret Bölgesi = F > Fa, 1, (n – 2) ise H0 RET.
41
(Satış Gelirleri Örneği)
Değişkenlik Kareler Serbestlik Kareler F-Oranı
Kaynağı Toplamları (KT) Derecesi Ortalaması (KO)
Regresyon KO =
RKT = b12( x2 – (x)2/n)
RKO = RKT / 1
Regresyon = 6,7982 / 1 RKO
2 2
= 0,118 (7668 –(268) /10) 1 F
= 6,7982
= 6,7982 AKO
Artık Kareler Toplamı Artık KO = 6,7982

AKO = AKT / (n – 2) F
AKT = GKT – RKT 0,0225
Artık n–2= = 0,1798 / 8
= 6,9780 - 6,7982
10 – 2 = 8 = 0,0225 = 302,41
= 0,1798
GKT =  y2 – (y)2/n
Toplam
= 83,873– (27,73)2/10 n–1=
(Genel) = 6,9780 10 – 1 = 9
42
F – Testi (Satış Gelirleri Örneği
İçin)
 H0: 1
H1: 1
Test İstatistiği = F – oranı = 302,41
Karar = F = 302,41 > F0,05, 1, 8 = 5,32 H0 RET.
43
Anakütle Regresyon
Katsayısılarının Testi
 1=Anakütle regresyon
katsayısı (X1 için)
 H0: 1=
(1 anlamsızdır)
H1: 1
(1 anlamlıdır)
44
Test istatistiği:
b1
t=
Sb1
Sb1 = b1’in standart hatasıdır.

S
Sb1=
(x2 – (x)2/n)
45
Kritik değerler
serbestlik derecesi = n - 2 olan

tablo değerleri dikkate alınarak
karar verilir.
|t | > t a/2, n – 2 ise H0 RET.
46
Anakütle Regresyon
Katsayısılarının Testi (Satış
Gelirleri Örneği)
katsayısı (X1 için)
 H0: 1=
H1: 1
(1 anlamlıdır)
47
Test istatistiği:
0,118
b1
t= = = 17,39
S b1 0,006804

S 0,1499
Sb1= = =0,006804
(x2 – (x)2/n) (7668 – (268)2/10)
48
Kritik değerler
karar verilir. a = 0,05 olsun.
|17,39 | > t a/2, n – 2 = t 0,025, 8 = 2,306

H0 RET. 1 anlamlıdır.
Basit doğrusal regresyonda t2 = F

olmaktadır.
49
Anakütle Regresyon
Katsayısılarının Testi
modelinde sabit terim
 H0: 0=
H1: 0
(0 anlamlıdır)
50
Test istatistiği:
b0
t=
Sb0

S x2
Sb0=
n(x2 – (x)2/n)
51
Kritik değerler

karar verilir.
|t | > t a/2, n – 2 ise H0 RET.
52
Anakütle Regresyon
Katsayısılarının Testi (Satış
Gelirleri Örneği)
modelindeki sabit terim
 H0: 0=
H1: 
(0 anlamlıdır)
53
Test istatistiği:
b0 - 0,398
t= = = - 2,11
S b0 0,1884
S x2 (0,1499) (7668)

S b1 = =
n(x2 – (x)2/n) (10)(7668 – (268)2/10)
=0,1884
54
Kritik değerler
karar verilir. a = 0,05 olsun.
|- 2,11 | < t a/2, n – 2 = t 0,025, 8 = 2,306

H0 REDDEDİLEMEZ. 0 anlamsızdır.
55
E(y) Değeri İçin Kestirim Aralığı
^
y ^ +E
- E < E(y) < y
Burada
2
1 n(x0 - x)
E = ta2,n - 2 s n + n(x2) - (x)2
• x0, x’in verilen bir değeridir.

^değeri
• Karekök içindeki ifade ile S’nin çarpımı ise x0’daki y
için standart hatadır.
• Standart hata en düşük değerini x0 = x olduğunda alır.
56
E(y) Değeri İçin Kestirim Aralığı
x0 = 30 personel için satışların beklenen değeri
%95 güven ile hangi aralıkta gerçekleşir?
3.1516 - E < E(y) < 3.1516 + E
1 (10)(30 -26,8)2
E = (2,306)(0,1499)
10
+ (10)(7668) - (268)
2
E = (2,306)(0,01815) = 0,04186
3,1097 < E(y) < 3,1935

57
ÖRNEKLEME DAĞILIŞLARI VE
TAHMİNLEYİCİLERİN ÖZELLİKLERİ
TEMEL KAVRAMLAR
PARAMETRE: ÖRNEK İSTATİSTİĞİ
• Populasyonun sayısal (PARAMETRE
açıklayıcı bir ölçüsüdür ve TAHMİNLEYİCİSİ):
anakütledeki tüm • Bir örneğin sayısal betimsel
elemanlar dikkate ölçüsüdür ve örnekteki
alınarak hesaplanabilir. gözlemlerden hesaplanır.
• Ana kütledeki tek bir • Diğer bir deyişle bilinmeyen bir
eleman dahi işlemin parametrenin sayısal değerini
dışında kalır ise elde bulabilmek (tahminlemek) için
edilen sonuç parametre kullanılır.
olarak kabul edilemez.
PARAMETRE VE ÖRNEK
İSTATİSTİKLERİ İÇİN ÖRNEKLER
Parametre  Örnek istatistiği ˆ
• Anakütle ortalaması  • Örnek ortalaması x
• Anakütle Medyan M • Örnek Medyanı m
• Anakütle Varyansı 2 • Örnek Varyansı s2
• Anakütle Standart • Örnek Standart
sapması  sapması s
• Anakütle Oranı  • Örnek Oranı p
Bir Populasyon Parametresi Hakkında
En Geniş Bilgiyi Hangi Örnek
İstatistiğinin İçerdiğine Nasıl Karar
Verilecek?
Örneğin anakütle ortalaması  için
• Aritmetik ortalama
• Geometrik ortalama
• Harmonik ortalama
• Medyan
vb. örnek istatistiklerinden hangisi tercih
edilmelidir.
Örnek 1 a
Bir zar atılışında x üst yüzdeki sayıyı göstersin. E(x)=
anakütle parametresini (anakütle ortalamasını)
bulunuz.
x 1 2 3 4 5 6
P(x) 1/6 1/6 1/6 1/6 1/6 1/6
xP(x) 1/6 2/6 3/6 4/6 5/6 6/6
6
1 2 6 21
  E ( x)   xP( x)    ......    3,5
x 1 6 6 6 6
Örnek 1b
• Ancak bu  değerinin bir an için bilinmediği
ve bunu tahmin etmek için populasyondan
3 örnek alındığını varsayılsın.
• Zar 3 kez atılsın ve örnek sonuçları; x1=2, x2=2,
x3=6 elde edilsin.
 x 2  2  6 10
x    3,333 ve m=2 hesaplanabilir.
n 3 3

 =3.5
 
1 2 3 4 5 6
X=3.3
m=2
SONUÇ: x değeri  değerine daha yakındır.

•Zar 3 kez daha atılsın ve örnek sonuçları; x1=3, x2=4,
x3=6 elde edilsin.
13
x  4,3 ve m=4
3

  
1 2 3 4 5 6
x
m
SONUÇ: m değeri  değerine daha yakındır.

Örnek İçin Yorum
1. Örnekten hesaplanan örnek istatistikleri (tahminleyiciler)
birer şans değişkenidir.
2. Ne örnek aritmetik ortalaması x

Ne de örnek medyanı (m) ,
populasyon ortalamasına daima daha yakındır denilemez.
Sonuçların genellenebilmesi için örnek istatistiklerinin
dağılışına gerek duyulmaktadır.
ÖRNEKLEME DAĞILIMLARI
• Anakütleden n adet ölçümden
x1, …, xn oluşan bir örnekten
alınmış olsun.
• Anakütledeki eleman sayısı N
olsun.
• Anakütleden alınabilecek her
biri n adet eleman içeren tüm
N
mümkün örnek sayısı:    k
n
• Bu koşullar (N, n) altında
hesaplanabilecek örnek
istatistiği sayısı k adettir.
• Örnek istatistiğinin
anakütlesindeki eleman sayısı k
olur.
• Örnek verilerinden hesaplanan
bir örnek istatistiği için elde
edilen bu anakütle örnekleme
dağılışı olarak adlandırılır.
• Örnekleme dağılımı bu
istatistiğin bir olasılık
dağılışıdır.
• Örnekleme dağılımı
anakütledeki eleman sayısı N ve
n örnek hacminin bir
fonksiyonudur.
ÖRNEK 2
Büyük bir populasyondan alınmış 3 ölçümün (0, 3, 12) olasılık dağılışı aşağıdaki gibidir.
x 0 3 12
P(x) 1 1 1
3 3 3
n=3
a) Örnek ortalaması ( x )’ nın örnekleme dağılışı
b) Örnek medyanı (m)’ nın örnekleme dağılışını bulunuz.
DİKKAT: ANAKÜTLEDEKİ ELEMAN SAYISI N BİLİNMİYOR. FAKAT ŞANS
DEĞİŞKENİNİN OLASILIK DAĞILIMI P(x) BİLİNİYOR.

Mümkün Örnekler Olasılık
x m p= x / n
(x tek sayı
gelmesi durumu)
0 0 0 0 0 1/27 0/3
0 0 3 1 0 1/27 1/3
0 0 12 4 0 1/27 0/3
0 3 0 1 0 1/27 1/3
0 3 3 2 3 1/27 2/3
0 3 12 5 3 1/27 1/3
0 12 0 4 0 1/27 0/3
0 12 3 5 3 1/27 1/3
0 12 12 8 12 1/27 0/3
3 0 0 1 0 1/27 1/3
3 0 3 2 3 1/27 2/3
3 0 12 5 3 1/27 1/3
3 3 0 2 3 1/27 2/3
3 3 3 3 3 1/27 3/3
3 3 12 6 3 1/27 2/3
3 12 0 5 3 1/27 1/3
3 12 3 6 3 1/27 2/3
3 12 12 9 12 1/27 1/3
12 0 0 4 0 1/27 0/3
12 0 3 5 3 1/27 1/3
12 0 12 8 12 1/27 0/3
12 3 0 5 3 1/27 1/3
12 3 3 6 3 1/27 2/3
12 3 12 9 12 1/27 1/3
12 12 0 8 12 1/27 0/3
12 12 3 9 12 1/27 1/3
12 12 12 12 12 1/27 0/3 5
ÖRNEK 2
 Aritmetik Ortalama Örnekleme Dağılışı
x 0 1 2 3 4 5 6 8 9 12
P x  1 3 3 1 3 6 3 3 3 1
27 27 27 27 27 27 27 27 27 27
 Medyan Örnekleme Dağılışı
m 0 3 12
P (m) 7 13 7
27 27 27
ÖRNEK İSTATİSTİKLERİNİN-
TAHMİNLEYİCİLERİN
ÖZELLİKLERİ
 sapmasızlık
 minimum varyanslılık
Eğer bir tahminleyici bu iki özelliği de sağlıyor ise buna

en iyi tahminleyici-etkin tahminleyici denir.
SAPMASIZLIK
 Eğer örnek istatistiğinin örnekleme dağılışının

anakütle ortalaması populasyon parametresine
eşit ise bu istatistiğe parametrenin
sapmasız tahminleyicisi
denir.

 E ˆ  
: Parametre
A, B : İstatistik
f(A)
A

 için sapmasız örnek istatistiği
f(B)
B

Sapma
 için sapmalı örnek istatistiği

ÖRNEK 3 Sapmasızlık
Anakütle ortalaması için aritmetik ortalama sapmasız fakat medyan
sapmalı bir tahminleyicidir.
Ex   E  m  
P(X) Sapmasız Sapmalı
A C
X
x m
ÖRNEK 3:
• Örnek 2 verileri için aritmetik ortalama ve
örnek medyanının tahminleyici özelliklerini
araştırınız.
ÖRNEK 3:
Aritmetik ortalama x , anakütle ortalamasının
 sapmasız bir tahminleyicisi midir?
x 0 3 12
P(x) 1/3 1/3 1/3
N
  E  x    xi P( xi )
i 1
1 1 1
 0    3    12  
3 3  3
5
ÖRNEK 3:
x 0 1 2 3 4 5 6 8 9 12
P  x  1/27 3/27 3/27 1/27 3/27 6/27 3/27 3/27 3/27 1/27
N
 x  E  x    xi P( xi )
i 1
 1   3   1 
 0    1    12  
 27   27   27 
5
ÖRNEK 3:
Sonuç:
Ex  
olduğundan aritmetik ortalama (tahminleyici),
anakütle ortalamasının (parametrenin)
sapmasız bir tahminleyicisidir.
ÖRNEK 3:
Sonuç:
E  m  
olduğundan örnek medyanı (tahminleyici),
anakütle ortalamasının (parametrenin)
sapmalı bir tahminleyicisidir.
MİNİMUM VARYANSLILIK
 Anakütle parametresi  olsun.
 Parametrenin tahminleyicileri; ˆ1 , ,ˆk
olsun.
 Eğer,
   
V ˆi  V ˆj i  j  1,..., k  1
ise
ˆi tahminleyicisi  parametresinin minimum
varyanslı tahminleyicisidir.
ÖRNEK: MİNİMUM VARYANSLILIK
 Anakütle parametresi  (anakütle
ortalaması) olsun.
 Parametrenin alternatif tahminleyicileri;
ˆ1  x
ˆ2  G.O
ˆ3  H .O
ˆ4  m
olsun.
 V  x   V  m   V  G.O   V  H .O 
x tahminleyicisi  parametresinin minimum
varyanslı tahminleyicisidir.
ÖRNEK: ETKİN TAHMİNLEYİCİ
 Anakütle parametresi  (anakütle
ortalaması) olsun.
 Parametrenin alternatif tahminleyicileri;
ˆ1  x
ˆ2  G.O
ˆ3  H .O
ˆ4  m
olsun.
 E  x    ve
V  x   V  m   V  G.O   V  H .O 
x tahminleyicisi  parametresinin etkin
tahminleyicisidir.
ÖRNEK: ETKİN TAHMİNLEYİCİ
P(X) Ortalamanın
örnekleme
dağılışı B
Medyanın
A örnekleme
dağılışı
 X
ÖRNEKLEME DAĞILIMI ÖRNEK
HACMİNİN BİR FONKSİYONUDUR
Örnek Hacmi büyüdükçe tahminleyicinin varyansı küçülür.
Büyük
P(X) örnek
hacimli
durum
B
Küçük
örnek
A hacimli
durum
X

ÖRNEK 3:
Örnek medyanı m, anakütle ortalamasının 
sapmasız bir tahminleyicisi midir?
m 0 3 12
P(m) 7/27 13/27 7/27
 7   13   7 
E  m    mi P  mi   0    3    12  
i  27   27   27 
 4.56
E  m  
ÖRNEK 3:
Aritmetik ortalama x , anakütle ortalamasının 
Minimum Varyanslı bir tahminleyicisi midir?
x 0 3 12
P(x) 13 13 13
x2 0 9 144
x2P(x) 0 9 3 144 3
E  x 2    xi2 P ( xi ) 
153
3
  V  x   E  x    E  x 
2 2 2
x
153 2
 5
3
 26
ÖRNEK 3
Aritmetik ortalamanın varyansı  x2
xi 0 1 2 3 4 5 6 8 9 12
P  xi  1
27
3
27
3
27
1
27
3
27
6
27
3
27
3
27
3
27
1
27
xi 2 0 1 4 9 16 25 36 64 81 144
xi 2 P  xi  0 3 27 12 27 9 27 48 27 150 27 108 27 192 27 243 27 144 27
E  x    xi P  xi  
2 2 909
27
V  x   E ( x )   E ( x )
2 2
909
  (5)2
27
=8,66
ÖRNEK 3
Örnek medyanının varyansı  2
m
mi 0 3 12
7 13 7
P(mi) 27 27 27
mi2 0 9 144
2 117 1008
mi P(mi) 0 27 27
E m 2
   m P  m   41.66
i
2
i
V  m   E (m )   E (m)
2 2
 41.66  (4.56)2
=20.86
ÖRNEK 3
Sonuç:
V  x   V  m
Aritmetik ortalama x , anakütle ortalamasının
 Sapmasız ve Minimum Varyanslı
bir tahminleyicisidir.
BEKLENEN DEĞER VE VARYANS
OPERATÖRLERİNİN ÖZELLİKLERİ
BEKLENEN DEĞER OPERATÖRÜ E(.)
Şans değişkeni x anakütle ortalaması  ve
anakütle varyansı  olsun.
2
a ile b birer sabit sayı olmak üzere,

 E(a)=a
 E(ax)=aE(x)=a
 E(ax+b)=aE(x)+b=a+b
BEKLENEN DEĞER VE VARYANS
OPERATÖRLERİNİN ÖZELLİKLERİ
VARYANS OPERATÖRÜ V(.)
anakütle varyansı 2 olsun.
a ile b birer sabit sayı olmak üzere,
 V(a)=0
 V(ax)=a V(x)= a 
2 2 2
 V(ax+b)= a2V(x)= a22

MERKEZİ LİMİT TEOREMİ
 Şans değişkeni x’in dağılımı ne olursa
olsun bu anakütleden alınan n hacimli
örneklerden hesaplanan aritmetik
ortalamanın x dağılımı yaklaşık olarak
normal dağılıma sahiptir.
 Örnek hacmi büyüdükçe aritmetik
ortalamanın x dağılımının normal
dağılıma yakınsaması artar.
Şans Değişkenlerinin
Standartlaştırılması
• Standart değişkenler genellikle z ile
gösterilir.
• ortalaması sıfır, E(z)=0
• Varyansı bir, V(Z)=1.
şans değişkeni-anakütle ortalaması

z
anakütle standart sapması
BAZI ÖNEMLİ TAHMİNLEYİCİLER İÇİN
ÖRNEKLEME DAĞILIMLARININ
BELİRLENMESİ
 Aritmetik ortalama x
 Örnek varyansı s 2
 Örnek oranı p
BİR DAĞILIMIN BELİRLENMESİ
• Dağılışın tipinin belirlenmesi,

(Normal, Üstel, Poisson vb.)
• Dağılımın parametrelerinin
belirlenmesi
ARİTMETİK ORTALAMA x İÇİN
ÖRNEKLEME DAĞILIMI
anakütle varyansı 2 olsun.

n
x x1  x2   xn
x 
i 1 i
n n
Cevaplanması gereken sorular
 Dağılımın tipi?
 Parametreleri;
Ex  ?
V x  ?
DAĞILIMIN TİPİ
• Merkezi limit teoremine göre aritmetik
ortalamanın dağılımı yaklaşık olarak
normal dağılıma sahiptir.
• Normal dağılımın parametreleri:
– Anakütle ortalaması
Dağılımın Parametreleri: Aritmetik
Ortalama için Anakütle Ortalaması
  in1 xi  1
Ex  E    E  x1    E  xn  
 n  n
 
1 n
E  x        
n n
Ex  
Dağılımın Parametreleri: Aritmetik
Ortalama için Anakütle Varyansı
  i 1 xi
n
 1
V x V    2 V  x1    V  xn  
 n
  n
1 n 2
V  x   2  
 2
    2
2
n n
 2
V x 
n
ARİTMETİK ORTALAMA x İÇİN
  
2
x ~N   x ;    N   x ; 
2
x
x
 n 
Aritmetik Ortalamanın
Standartlaştırılması
x - x
z
x
x - x
z
x n
Normal olmayan dağılışlardan
örnekleme
•Merkezi eğilim
Anakütle dağılışı
x   = 10
•Yayılma
  = 50 X
x 
n Örnekleme dağılışı
– Yerine koyarak n = 4 n =30
örnekleme X = 5 X = 1.8
X- = 50 X
Normal dağılış gösteren bir
anakütleden örnekleme
•Merkezi eğilim
Anakütle dağılışı
x   = 10
•Yayılma
  = 50 X
x 
n Örnekleme dağılışı
Yerine konularak n = 4 n =16
örnekleme X = 5 X = 2.5
X- = 50 X
Merkezi limit teoremi
Örnek
hacmi 
yeterince x 
büyükse n
Örnekleme
(n  30) ...
dağılışı
hemen hemen
normal olur.
X
x  
ÖRNEK 3
•Telekom’da çalışan bir
uzman, uzun zaman
yaptığı gözlemlerden,
telefon konuşma
sürelerinin (x),
 = 8 dk. &  = 2 dk. olan
normal dağılış gösterdiğini
belirlemiştir.
25 görüşme rasgele
seçilirse, örnek
ortalamasının 7.8 & 8.2
dakika arasında çıkması
olasılığı nedir? © 1984-1994 T/Maker Co.
Çözüm
X   7.8  8
Z    .50
 n 2 25
X   8.2  8
Örnekleme dağılışıZ    .50 Standart Normal
 n 2 25
Dağılış
X = .4 =1
.3830
.1915 .1915
7.8 8 8.2 X -.50 0 .50 Z

ÖRNEK ORANI: p
 Birbirinden bağımsız n adet Bernoulli Deneyinin bir

araya gelmesi sonucunda x başarı sayısı Binom
Dağılımına sahiptir.
 Başarı olayının populasyon oranının bilinmediği
durumlarda olasılık hesaplamaları için kullanacak dağılışı
belirlemek bir problemdir olarak.
 Örnek olarak bir yeni ilin A partisi için oy oranının
belirlenmesi veya yeni çıkan bir derginin tüm rakip
dergiler dikkate alında satış yüzdesinin belirlenmesi
verilebilir.
ÖRNEK ORANI: p
 Bu gibi örneklerde anakütle başarı olasılığını “” ’yi

tahminlemek amacıyla populasyondan alınan örnekten
elde edilen bilgiler doğrultusunda örnek oranı p
hesaplanır.
 İlgilenilen başarı olasılığının ’nin bilinmediği
durumlarda n hacimlik örnek alındığında ve x örnekteki
başarı sayısı olarak ele alındığında, örnekten elde edilen
başarı olasılığı (örnek oranı);
x
p
n
ÖRNEK ORANI p İÇİN
Şans değişkeni x sabit n hacimli denemede
ortaya çıkan başarı sayısı olsun. x ~B  n;  
Örnek oranı:
x
p
n
Cevaplanması gereken sorular
 Dağılımın tipi?
 Parametreleri;
p  E  p  ?
 p2  V  p   ?
DAĞILIMIN TİPİ
• Merkezi limit teoremine göre örnek oranının
dağılımı eğer n örnek hacmi yeterince büyük ise
yaklaşık olarak normal dağılıma sahiptir.
• Bunun temel sebebi örnek oranının, n adet
denemede ortaya çıkan ortalama başarı sayısını
temsil etmesidir.
• Normal dağılımın parametreleri:
– Anakütle ortalaması
Dağılımın Parametreleri: Örnek Oranı
için Anakütle Ortalaması
 x 1
E  p  E    E  x
n n
n
E  p 
n
E  p  
Not: x şans değişkeni binom dağılımına

sahip olduğundan:
E(x)=n
Dağılımın Parametreleri: Örnek oranı
için Anakütle Varyansı
 x 1
V  p  V    2 V  x
n n
n 1   
V  p 
n2
 1   
V  p 
n
Not: x şans değişkeni binom dağılımına

sahip olduğundan:
V(x)=n(1-)
ÖRNEK ORANI p İÇİN
      
p ~N   p ; p   N   ;
2 1

 n 
Örnek Oranının Standartlaştırılması
p - p
z
p
p-
z
 1    n
Örnek Hacminin Örnek Oranı Üzerindeki
Etkisi
Anakütle oranı  sabitken örnek hacmi arttığında örnek
oranının standart hatası küçülür.
Aşağıdaki şekilde görüldüğü gibi örnek hacmi arttığında
p’in kendi ortalaması etrafında yoğunlaştığı
görülmektedir.
f ( p)
n=400
n=100
.68 .72 .76 .80 .84 .88 .92

p
ÖRNEK 4
Büyük bir populasyondan alınan 3 ölçüm ile ilgili
örneğe dönersek x başarı sayısının örnekte tek sayı
gelme olayını göstermek üzere örnek oranının
beklenen değerini ve varyansını bularak dağılımını
elde ediniz.
ÖRNEK 4
pi 0/3 1/3 2/3 3/3
pi2 0/9 1/9 4/9 9/9
P(pi) 8/27 12/27 6/27 1/27
E ( p)   pi P  pi 
i
E ( p)     p
8  0  12  1  6  2  1  3 
E ( p)              0.33
27  3  27  3  27  3  27  3 
ÖRNEK 4
 1   
I. YÖNTEM  2
p  V  p 
n
 (1   ) 0.33(1  0.33)
 p2    0.074
n 3
II. YÖNTEM  p2  E ( p 2 )   E ( p)2
E ( p 2 )   pi2 P  pi 
i
8  0  12  1  6  4  1  9 
E( p2 )              0.185
27  9  27  9  27  9  27  9 
 p2  E ( p 2 )   E ( p)  0.185  (0.33) 2  0.074
2
ÖRNEK 5
Gelirler Genel Müdürlüğü’ne göre, bütün vergi
beyannamelerinin % 75’i vergi iadesine yol açmaktadır. 100
beyannamelik bir rassal örneklem alınmıştır.
a) Vergi iadesine yol açan beyannamelerin örneklem
oranının ortalaması kaçtır?
b) Örneklem oranının varyansı kaçtır?
c) Örneklem oranının standart hatası kaçtır?
d) Örneklem oranının 0,8’den büyük olma olasılığı kaçtır?
ÖRNEK 5
Çözüm:
a) E ( p)    0,75
 (1   )
b)  
2
p
n
0,75(1  0,75)
 
2
p  0,001875
100
c) Standart Sapma (ya da Standart Hata)
   p  0,001875  0,0433
2
p
ÖRNEK 5
d) P( p  0,8)  ?
p  0,8  
P( p  0,8)  P(  )
p p
0,8  0,75 0,8  0,75
 P( z  )  P( z  )
0,0433 0,0433
 P( z  1,15)  0,5  0,3749  0,1251
 2
v =
(n - 1) s 2
2
n = örnek miktarı
s 2 = örnek varyansı
2 = anakütle varyansı
df = serbestlik derecesi = n – 1=v
 Ki-kare dağılımının tek bir parametresi

vardır: v
 Bu parametre genel olarak serbestlik
derecesi olarak adlandırılır.
  v şeklinde gösterilir.
2
 Ki-kare dağılımı normal (standart normal)

dağılıma sahip şans değişkenlerinden elde
edlilir.
Şans değişkenleri xi ler normal dağılıma sahip
olmak üzere, Örnek varyansı:
 x  x
2
  n  1 s 2    xi  x 
2
s 2
 i
n 1
Eşitliğin her iki tarafı anakütle varyansına

bölünerek
 n  1 s  x  x
2 2
 i
  n21
2 2
Ki-kare şans değişeninin beklenen değeri:

E   v2   v
Ki-kare şans değişeninin varyansı:

V   v2   2v
Ki-kare istatistiğinin dağılışının
özellikleri
1. ki-kare dağılışı simetrik değildir
2. Serbestlik derecesi arttıkça, dağılış daha simetrik
hale gelir (normale yaklaşır)
Simetrik değil df = 10
df = 20
x2
0 0 5 10 15 20 25 30 35 40 45
Tüm değerler sıfır veya pozitif
ÖRNEK VARYANSININ
Anakütle ortalaması  x ve anakütle varyansı  x olan bilinmeyen bir
2
populasyondan x1, x2,…, xn ile gösterilen n adet rassal bir örnek

alındığında populasyon varyansı aşağıdaki gibi bir beklenen değer
ifadesine eşittir:
 x2  E ( xi   x ) 2
Populasyon ortalaması  x bilinmediğinde yerine x konularak örnek

varyansı aşağıdaki gibi tanımlanır.
n
1
sx2   i
n  1 i 1
( x  x ) 2
ÖRNEK VARYANSININ
Varyansı  x2 olan bir populasyondan alınan n hacimlik bir

örneğin örnek varyansı s x2 olarak ifade edildiğinde;
  x
n  1 s 2
 s 
 x2  n21
n 1  x
2 2
 2
 n  1
ÖRNEK VARYANSININ
 s x2 ’nin örnekleme dağılımının ortalaması  x2 ’dir.
 x2 E   n21   x2  n  1
E s 2
   n  1 
x
 n  1
E ( s x2 )   x2
ÖRNEK VARYANSININ
 s x2 ’nin örnekleme dağılımının varyansı, örnekleme
dağılımın Ki- Kare dağılımına uygun olduğunu
sonucundan hareketle ;
V s   V 
 
2 2
  4
V  n1 
 2

2 x n 1 x
  n  1   n  1
x 2
2 x  n  1
4
V  sx  
2
 n  1
2
2 4
V s  
2 x
x
 n  1
PARAMETRİK OLMAYAN
HİPOTEZ TESTLERİ
“Kİ-KARE TESTLERİ”
1
Populasyonun incelediğimiz bir özelliğinin
dağılışı bilenen dağılışlardan birisine,
Normal Dağılış,
t Dağılışı,
F Dağılışı,
gibi bir dağılışa uygun olduğu durumlarda
populasyonun parametrelerine ilişkin yapılan hipotez
testlerine parametrik hipotez testleri adı verilir.
2
Parametrik hipotez testleri genellikle
normal dağılış varsayımı altıda gerçekleştirilen
testlerdir.
Merkezi limit teoremi gereğince;

“ anakütle dağılışı ne olursa olsun o dağılışa
ilişkin örnekleme dağılışının normal dağıldığı
“sonucundan hareketle normal dağılışın çok
yaygın bir şekilde kullanıldığı açıkça ortadadır.
3
Populasyonla ilgili belli başlı
varsayımların ve parametre tahminlerinin
gerçekleştirilemediği, bu sebepten dolayı
dağılış varsayımı yapılamadığı durumlarda
kullanılan testler,
“ Parametrik Olmayan Hipotez Testleri”

olarak adlandırılır.
4
Parametrik Olmayan Hipotez Testlerinin
Kullanılabileceği Durumlar:
1) Gözlem ile elde edilen verilerin olması durumunda,
2)Parametrik test varsayımının yerine getirilemediği durumlarda
3)Testte kullanılacak değerler yerine bu değerlerin sıra

numaralarının verildiği durumlarda,
4)Testte kullanılacak örneklerin küçük hacimli olduğu

durumlarda.
5
Parametrik Olmayan Hipotez Testlerinin ;
AVANTAJLARI DEZAVANTAJLARI
• Uygulanması için • Örnek hacminin büyük olması

birçok varsayıma halinde uygulanması güçleşir.
gerek yoktur.
• Anlaşılması ve • Bu tür testlerin uygulanmasıyla

uygulanması elde edilen sonuçlar, parametrik
kolaydır. testlerin uygulanmasıyla elde
edilen sonuçlardan daha az
• Küçük hacimli bir güvenilirdir.
örnek üzerinden
yapılması
mümkündür.
6
Bu dersin kapsamı içinde parametrik olmayan
hipotez testlerinin yalnız bir kısmını oluşturan
“Parametrik Olmayan c2 Ki- Kare Hipotez Testleri”
’ne ye verilecektir.
Günümüzde birçok araştırmada kullanılan
değişkenler niteliksel yapıdadır.
Zarın atıldığında alacağı değerler,
göz rengi,
din, ırk ve dil gibi sınıflamalar.
7
Bazı durumlarda ise niceliksel yapıdaki bazı
değişkenlerin sınıflandırılarak niteliksel hale
dönüştürüldüğü görülür.
50 kilonun altında olan kişilere zayıf,
50-80 kilo arasında olanlara normal,
80 kilonun üstünde olanlara kilolu denmesi
gibi.
Niteliksel yapıya sahip değişkenler üzerinde
yapılan gözlemler çoğunlukla araştırılan özelliği
gösteren sınıfların sayıları şeklindedir.
8
Ele alınan değişkenlerin niteliksel yapıda
olduğu durumlarda, yapılan ölçüm ve gözlemlerin
ilgili sınıflara ait frekanslarını dikkate alan çalışmalar
için uygulanan hipotez testleri,
“PARAMETRİK OLMAYAN Kİ-KARE HİPOTEZ

TESTLERİ “
dir.
9
Parametrik Olmayan c2 Ki- Kare
Hipotez Testleri
İyi Uyum rxc Dağılışa Uyum

Testleri Bağımsızlık Testleri
Testleri • Uniform
• Binom
• Poisson
10
• Normal
Parametrik Olmayan c2 (Ki- Kare) Hipotez
Testleri adını kullanılan test istatistiğinden almıştır.
Yukarıdaki tabloda ifade edilen 3 faklı Ki-Kare testi;
sayımla elde edilen veya ölçülen değerlerin
iddia edilen teorik frekanslar uygun olup olmadığını,
populasyonun iki farklı özelliğinin birbirinden
bağımsız olup olmadığını,
populasyonunun dağılışının ifade edilen bilinen
bir dağılışa uygun olup olmadığını, ( Binom , Normal
vb. )
test etmek amacıyla kullanılır.
11
Burada ele alınan tüm durumlarda
kullanılacak test istatistiği ortak olmakla birlikte
Ki-Kare dağılışına uygundur.
Gi : Gözlenen Değerler
Bi : Beklenen Değerler
c 
2
k
(G i  Bi 
2
i 1 Bi
12
İyi Uyum Testleri
Gözlenen frekansların teorik beklenen frekanslara
uyup uymadığının araştırılmasında kullanılır.
Bir zar atıldığında eğer zar hilesiz ise tüm değerlerin

ortaya çıkma olasılığının birbirine eşit ve 1 / 6 olması,
Bir haftalık süre içinde Çiğli- Kipa’ya gelen

müşterilerin % 25’nin Cumartesi , % 25’nin Pazar ve diğer
hafta içi 5 günde de her gün % 10’nun gelmesi.
13
Toplam
Grup 1 2 3 ............ k
Gözlenen
değerler G1 G2 G3 ............ Gk n
( Gi )
H0 doğru iken
olasılık değeri p1 p2 p3 ............ pk 1
( pi )
H0 doğru iken
beklenen değer B1 = np1 B2 = np2 B3 =np3 Bk = npk n
............
( Bi )
14
Kullanılan ki-kare test istatistiği göz önünde
bulundurulacak olursa, gözlenen ve beklenen değerler
arasındaki farkın anlamlı derecede büyük olması durumunda
teorik frekanslara gözlenen frekansların uymadığı sonucuna
varılır.
H0 : pi’ler ifade edilen teorik olasılık değerlerine eşittir.
H1 : En az bir eşitlik geçersizdir.
k (G i  Bi 2
c2    c k21;
i 1 Bi
ise H0 red edilir.

k : grup sayısı ( kategori sayısı ) 15
Örnek: Bir spor yazarı, Türkiye’deki kişilerin % 40 ‘ının
Fenerbahçe, % 25 ‘inin Galatasaray, % 20’sinin Beşiktaş ,
% 10’nun Trabzonspor’u ve geriye kalan % 5‘lik kısmın ise
diğer takımları desteklediğini düşünmektedir. Bu amaçla 1000
kişilik bir örnek alındığında aşağıdaki tablodaki sonuçlar elde
edilmiştir. Yazarın iddiasını % 5 ‘lik hata payıyla test ediniz.
Takım FB GS BJK TS Diğer Toplam
Taraftar 387 259 208 97 49 1000

Sayısı
16
H0 : pFB = 0,40, pGS = 0,25, pBJK = 0,20, pTRB = 0,10, pD = 0,05
H1 : En az bir eşitlik geçersizdir.
BFB = n pFB = 1000 ( 0,40 ) = 400 , GFB = 387

BGS = n pGS = 1000 ( 0,25 ) = 250 , GGS = 259
BBJK = n pBJK = 1000 ( 0,20 ) = 200 , GBJK = 208
BTRB = n pTRB = 1000 ( 0,10 ) = 100 , GTRB = 97
BD = n pD = 1000 ( 0,05 ) = 50 , GD = 49
17
k (G i  Bi 2 (387  4002 (259  2502 (  2
c h2     ....  49 50  1,18
i 1 Bi 400 250 50
2
χ tablo  2
χ k -1,α  2
χ 5-1;0,05  2
χ 4;0,05  9,49
c h2  c t2 olduğundan Ho red edilemez.
Spor yazarının taraftarların dağılış yüzdeleriyle ilgili

iddiasının % 5 hata payıyla doğru olduğu söylenebilir.
18
r x c Bağımsızlık Testleri
Bir populasyonun iki özelliğinin birbirinden
bağımsız olup olmadığını test etmede kullanılır.
Örneği meydana getiren bireyler iki farklı kritere
göre sınıflanır.
Örneğin bireylerin hem sigara içip
içmemelerine hem de içki içip içmemelerine gör
sınıflandırılması, iktisat bölümündeki öğrencilerin
matematik ve istatistik derslerindeki başarı
durumuna göre sınıflandırılması gibi.
19
Populasyonun sınıflandırılmasında iki özellik
dikkate alındığından dolayı iki yönlü tablolar
( kontenjans tabloları ) kullanılır.
Bu tabloların satırlarında ele alınan özelliklerden

birincinin farklı seviye veya durumlarını, sütunlarında
ise ikinci karakterlerin farklı seviye veya durumlarını
gösterilir.
Bu durumlar, sıralayıcı ve sınıflayıcı ölçekler

şeklinde olabilir.
20
İki Yönlü ( Kontenjans ) Tablolarda
Beklenen Değerlerin Hesaplanması
Özellik A
Özellik B 1 2 3 C Toplam
1 G11 G12 ....... G1c R1
2 G21 G22 ....... G2c R2
3 G31 G32 ....... G3c R3
.... ...... ...... ....... ........
R Gr1 Gr2 ....... Grc Rr
Toplam C1 C2 C3 Cc N
21
Herhangi bir hücrenin beklenen değerin
hesaplanmasında iki özelliğin var olması sebebiyle, o
hücrenin bulunduğu satır ve sütun toplamlarının
çarpımının örnek hacmine bölünmesiyle hesaplanır.
i. inci satır , j. inci sütundaki bir gözlemin beklenen
değeri ,
R iC j
Bij 
şeklinde bulunur. N
1. satır , 2. sütundaki hücrenin beklenen değeri,
R 1C 2
B12 
N
şeklindedir. 22
H0 : Populasyonun iki özelliği birbirinden bağımsızdır.
( aralarında ilişki yoktur. )
H1 : Populasyonun iki özelliği birbirinden bağımsız değildir.
( aralarında ilişki vardır. )
Test İstatistiği: r c (G ij  B ij 
2
 
i 1 j1 Bij
r c (G ij  Bij 
2
 
i 1 j1 Bij
 χ (r2 1)(c 1);α ise H0 red edilir.
23
Örnek: İzmir’in Buca ilçesinde yapılan bir anket çalışmasında
kişilerin oy verdikleri parti ile cinsiyet arasında bir ilişki olup
olmadığı araştırılmaktadır. Aşağıdaki tabloda anket sonucunda
elde edilen bilgiler bulunmaktadır. Buca ilçesinde oturan
kişilerin cinsiyetleri ile oy verdikleri parti arasında ilişki olup
olmadığını  = 0,01 önem seviyesinde test ediniz.
Cinsiyet
Kadın Erkek
A 100 150
Partiler B 200 200
C 200 150 24
H0 : Cinsiyet ile oy verilen parti birbirinden bağımsızdır.
H1 : Cinsiyet ile oy verilen parti birbirinden bağımsız
değildir.
Cinsiyet
Kadın Erkek Toplam
A 100 125 150 125 250
Partiler
B 200 200 200 200 400
C 200 175 150 175 350
Toplam 500 500 1000
R 1C1 250 * 500

B11    125
N 1000
25
r c (G ij  Bij 
2
(100  125 (150  125 (200  200
2 2 2
 
i 1 j1 Bij

125
 
125 200

(200  200 (200  175 (200  175
2

2

2
 17,14
200 175 175
χ 2
(r 1)(c 1);α χ 2
(31)(2 1);0,01  9,21
17,14 > 9,21 olduğundan dolayı H0 red edilir. % 99 olasılıkla

Buca ilçesindeki kişiler için oy verilen partiler ile cinsiyet
arasında bir ilişki olduğu söylenebilir.
26
DAĞILIŞA UYUM TESTLERİ
Örnek verilerinden yola çıkarak populasyonun dağılımı

hakkında ortaya atılan iddiayı test etmek için “Dağılışa
Uyum Testleri” kullanılır.
Örnek verileri gözlenen değerler olarak, örnek hacmi

dikkate alınarak ilgili dağılışın olasılık değerlerinden
yola çıkarak beklenen değerler (teorik frekanslar)
hesaplanır.
27
Dağılışa Uyum Testlerinde de kullanılacak olan test
istatistiği c 2
dağılışına uymaktadır. Örnekten elde edilen
gözlenen değerler ile dağılıştan yola çıkarak hesaplanan
beklenen değerler birbirine yakınsa hesaplanan c değeri
2
küçük çıkacak ve örnek verilerinin dağılışının iddia edilen

dağılışa uygun olduğu sonucu ortaya çıkacaktır.
Ho: Örnek verileri ilgili dağılışa uygundur.
H1: Örnek verileri ilgili dağılışa uygun değildir.
Dağılışa Uyum Testlerinde Kullanılacak

Olan Test İstatistiği:
k
(G  B 2
2
c  i i
i 1 Bi
28
Hesaplanan χ 2hesap değeri ile tablodan bulunan χ 2tablo
değeri karşılaştırılarak iddianın doğruluğu hakkında
karar verilir.
χ 2tablo  χ 2v,α
v = k - 1- g
k : χ hesap değeri bulunurken dikkate alınan grup
2
sayısı
g : İlgili dağılış için örnek verileri kullanılarak
hesaplanan (tahmin edilen) parametre sayısı
29
χ 2
hesap
χ 2
> tablo ise H0 red edilir.
c2
χ 2tablo
H0 ‘ın red edilemediği durumlarda örnek

verilerinin dağılışı parametresi bilinen veya
örnekten tahmin edilen dağılışa uygun olduğu
sonucuna varılır.
30
KESİKLİ ÜNİFORM(DÜZGÜN)
DAĞILIŞ
Tanımlı olduğu değerleri eşit olasılıklar ile alan şans
değişkenlerinin dağılışıdır. Kesikli üniform dağılışı gösteren bir
şans değişkeni N farklı değeri eşit olasılıklar ile alıyorsa her bir
değeri alma olasılığı 1/N’ e eşittir.
1
 x  1,2,3,........n
P (X  x    N
0 d.d
31
    p=1/N
N adet
Hilesiz bir zar atıldığında zarın yüzeylerinde

bulunan 6 sayının zarın ön yüzünde gelmesinin
olasılığı birbirine birbirine eşit ve 1/6 olacaktır.
32
Örnek: Büyük bir işletmede hafta içerisindeki 5 gün
içerisindeki işe gelmeme sayılarının dağılışı araştırılmaktadır.
Bu amaçla bir hafta boyunca her gün işe gelmeyen işçi sayıları
kontrol edilerek not edilmiştir. Hafta içerisinde iş yerine
gelmeyen işçi sayılarının dağılışının Üniform(Düzgün) Dağılışa
uygun olup olmadığını % 5 hata payıyla test ediniz.
Günler işe gelmeyen pi İşe gelmemesi (G i  Bi 2
işçi sayısı(Gi) beklenen işçi
sayısı(Bi) Bi
Pazartesi 15 1/5 12 0,75
Salı 9 1/5 12 0,75
Çarşamba 9 1/5 12 0,75
Perşembe 11 1/5 12 0,08
Cuma 16 1/5 12 1,33
toplam 60 1 60 3,66 33
Ho: İlgili işletmedeki hafta içi günlerdeki işe gelmeyen işçi
sayılarının dağılışı Üniform Dağılışına uygundur.
H1: İlgili işletmedeki hafta içi günlerdeki işe gelmeyen işçi
sayılarının dağılışı Üniform Dağılışına uygun değildir.
c 
2
k
(G i  Bi 
2
 3,66 χ 2tablo  χ 2v,α
h
i 1 Bi
v = k - 1- g = 5-1-0 =4
Üniform Dağılışında tahmin
edilen parametre sayısı 0’dır. χ 2tablo  χ 24,0.05  9,49

İlgili işletmedeki hafta içi günlerdeki işe gelmeyen işçi
sayılarının dağılışı Üniform Dağılışına uygun olduğu % 5
hata payıyla söylenebilir.
34
Örnek: Meyve suyu üreticisi bir firma ürettiği meyve sularını
her birinde 20 şişe bulunmak üzere kutular halinde
poşetlemektedir. İşletmenin deposundan 100 kutu seçilerek
kutuların her birindeki hatalı şişelenmiş olan meyve suları
sayılarak kayıt edilmiştir. Aşağıdaki tabloda kutuların sayısı ve
içerisindeki hatalı bulunan şişe sayıları verilmiştir.
a) Toplam kaç şişe kontrol edilmiştir?
b) Toplam kaç hatalı şişe bulunmuştur?
c) Örnekteki hatalı şişelerin oranını nedir?
d) Kutuların içerisindeki bulunan hatalı meyve sularının
sayılarının Binom Dağılışına uygun olup olmadığını % 5 hata
payıyla test ediniz.
Hatalı Şişe Sayısı 0 1 2 3 4 5 ve daha fazla
Kutu Sayısı 48 25 15 8 3 1 35
a) Toplam 100 kutu kontrol edilmiştir. Her bir kutu
içerisinde 20 şişe meyve suyu bulunduğuna göre toplam
2000 adet şişe kontrol edilmiştir.
b)  xi fi  0  48  1 25  2 15  3 8  4  3  5 1  96
c)
ˆ  96  0,048  0,05
p
2000
d) Ho: Kutularda bulunan hatalı şişelerin sayısı n=20 olan Binom

Dağılışına uygundur.
H1: Kutularda bulunan hatalı şişelerin sayısı n=20 olan Binom
Dağılışına uygun değildir.
36
Hatalı Şişe Sayısı 0 1 2 3 4 5 ve daha
fazla
Kutu Sayısı (Gi) 48 25 15 8 3 1
pi 0,3585 0,3774 0,1887 0,0596 0,0133 0,0025
Beklenen Kutu 35,85 37,74 18,87 5,96 1,33 0,25
Sayısı (Bi)
n x  20 
P(X  x    p (1  p 
nx
P (X  0   
0  (0,050
(1  0,0520-0
x  
c 2(Ki-Kare) Parametrik Olmayan Testler’de herhangi bir
hücrenin veya grubun beklenen değer 5’ten küçük ise kendisine
en yakın olan hücre veya grup ile birleştirilir. Bu işleme
herhangi bir hücre veya grup içerisinde 5’ten küçük bir
beklenen değer ifadesi kalmayıncaya kadar devam edilir.
37
Hatalı Şişe Sayısı 0 1 2 3 ve daha fazla
Kutu Sayısı (Gi) 48 25 15 12
Beklenen Kutu Sayısı (Bi) 35,85 37,74 18,87 7,54
k
(G i  Bi 2 (48  35,852 (
12  7,54 2
c h2   Bi

35,85
 ....
7,54
 12,03
i 1
χ 2tablo  χ 2v,α  χ 2k-1-g,α  χ 24-1-1,0,05  χ 22,0,05  5,99

Binom Dağılışında parametre sayısı 2 (n,p) olmasına
rağmen soruda tahmin edilen parametre sayısı 1 (p) ‘dir
c h2  c t2 olduğundan Ho red edilir..
Kutularda bulunan meyve sularının içerisinde hatalı
şişelenenlerinin sayısının n = 20 olan Binom Dağılışına
uygun olmadığı % 5 hata payıyla söylenebilir. 38
Örnek: Bir havaalanında uçuşlar kalkış zamanına göre
zamanında ve gecikmeli olarak iki şekilde sınıflandırılmıştır.
Aşağıdaki tabloda 1 saatlik süre içerisindeki gecikmeli
gerçekleşen uçuşların sayıları ifade edilmiştir.
a) Bir saatlik süre içerisinde ortalama kaç adet gecikmeli
uçuş yapılmaktadır ?
b) Bir saatlik süre içerisindeki gerçekleşen gecikmeli uçuş
sayılarının Poisson Dağılışına uygun olup olamadığını % 5
hata payıyla test ediniz?
1 saatte gerçekleşen
0 1 2 3 4 5 6 7 8 9 ve daha fazla
gecikmeli uçuş sayısı
Frekans 24 35 43 25 16 4 2 0 1 0
39
a)
λ
 x ifi

0  24  1  35  .....9  0 300
 2
 fi 150 150
b) Ho: Bir saatlik süre içerisindeki zamanında gerçekleşmeyen
uçuşların sayısı Poisson Dağılışına uygundur.
Ha: Bir saatlik süre içerisindeki zamanında gerçekleşmeyen
uçuşların sayısı Poisson Dağılışına uygun değildir.
e -λ λ x e-2 20
P(X  x   P(X  0  
x! 0!
1 saatte gerçekleşen
0 1 2 3 4 5 6 7 8 9 ve üstü
gecikmeli uçuş saysı
Frekans Gi 24 35 43 25 16 4 2 0 1 0
pi 0,1353 0,2707 0,2707 0,1804 0,0902 0,0361 0,012 0,0034 0,0009 0,0002
Beklenen uçuş sayısı B i 20,3 40,60 40,60 27,07 13,53 5,41 1,80 0,52 0,13 0,04
40
1 saatte gerçekleşen 5 ve
0 1 2 3 4
gecikmeli uçuş saysı üstü
Frekans Gi 24 35 43 25 16 7
Beklenen uçuş sayısı B i 20,3 40,60 40,60 27,07 13,53 7,9
c 
2
k (G i
 Bi 
2

24  20,3 2



 ....  
2
 7  7,9 


 2,29
h
i 1 Bi 20,3 7,9
χ 2
tablo
χ 2
v,α
χ 2
k -1-g,α
χ 2
6-1-1,0,05
χ 2
4,0,05
 9,49
Poisson Dağılışında parametre sayısı 1 (l’dir.

Havaalanında 1 saatlik süre içerisinde gerçekleşen gecikmeli
uçuş sayılarının Poisson Dağılımın uygun olduğu % 5 hata
payıyla söylenebilir.
41
Normal Dağılışa Uyum Testi Örneği:
Kimyasal bir madde üreten bir firma günlük

satışlarının ( 1000 galon) normal dağılışa uygun olup
olmadığını araştırmak istemektedir. Bu amaçla 200
gün boyunca satılan miktarlar kayıt edilerek
aşağıdaki sınıflanmış veri seti elde edilmiştir. Buna
göre % 5 hata payıyla satışların normal dağılışa
uygun olup olmadığını test ediniz.
42
Satışlar (1000 galon) Satılan Gün Sayısı
x < 34,0 0
34,0 ≤ x < 35,5 13
35,5 ≤ x < 37,0 20
37,0 ≤ x < 38,5 35
38,5 ≤ x < 40,0 43
40,0 ≤ x < 41,5 51
41,5 ≤ x < 43,0 27
43,0 ≤ x < 44,5 10
44,5 ≤ x <46,0 1
46,0 ≤ x 0
Toplam 200
43
Uyumu araştırılacak dağılış olan normal dağılışın
parametreleri ifade edilmediğinden verilen örnekten yola
çıkılarak, örnek istatistikleri tahmin edilir.
x  40 s  2,5
Her bir sınıfa ait olan olasılık değerleri sınıflanmış
verilerin aralığına düşmesi olasılığına karşılık gelir.
Anakütle dağılışının uygun olduğu varsayılan normal
dağılışla ilişkin olasılık hesaplamaları standart normal
dağılışa ( z ) dönüştürme yoluyla hesaplanır.
44
P(0  x  34)  P(0  z  2,4)  0,5  0,4918  0,0082
P(40  x  41,5)  P(0  z  0,6)  0,2257

Hesaplanan bu olasılıklar toplam örnek hacmiyle
çarpılarak beklenen değerler elde edilir.
B1 = np1 = 0,0082 * 200 = 1,64

B6 = np6 = 0,2257 * 200 = 54
Ho: Satışlar normal dağılışa uygundur.
H1: Satışlar normal dağılışa uygun değildir.
45
G1=13, B1= 7,18
Satışlar Gi pi Bi = npi Gi- Bi (Gi- Bi)2/Bi
x < 34,0 0 0,0082 1,64
5,82 4,7176
34,0 ≤ x < 35,5 13 0,0227 5,54
35,5 ≤ x < 37,0 20 0,0792 15,84 4,16 1,0925
37,0 ≤ x < 38,5 35 0,1592 31,84 3,16 0,3136
38,5 ≤ x < 40,0 43 0,2257 45,14 -2,14 0,1015
40,0 ≤ x < 41,5 51 0,2257 45,14 5,86 0,7607
41,5 ≤ x < 43,0 27 0,1592 31,84 -4,84 0,7357
43,0 ≤ x < 44,5 10 0,0792 15,84 -5,84 2,1531
44,5 ≤ x <46,0 1 0,0277 5,54
-6,18 5,3193
46,0 ≤ x 0 0,0082 1,64
G8=1, B8= 6,18 46

c h2  
k
(G i  Bi  2
 4,7176  1,0925 .......... .  5,3193  15,194
i 1 Bi
v = k - 1- g = 8-1-2 =5
χ 2
tablo χ 2
v;α χ 2
k -1-g;α χ 2
8-1-5;0,05 χ 2
5;0,05  11,07
c 2
h  c t
2
olduğundan Ho red edilir.
Firmanın günlük satışlarının normal dağılışa uygun

olmadığı % 5 hata payıyla söylenebilir.
47
Örnek-1: Bir işletmenin iki farklı deposunda bulunan hatalı ürünlerin oranı karşılaştırılmak isteniyor. Bu
amaçla 1. depodan 200 adetlik bir örnek alındığında 20 adet hatalı ürün, 2. depodan ise 300 adetlik bir
örnek alındığında ise 15 adet hatalı ürün gözleniyor. İki depoda bulunan hatalı ürünlerin anakütle
oranları arsındaki fark için %98’lik güven aralığını oluşturup yorumlayınız.
n1 = 200 x1 = 20 n2 = 300 x2 = 15 1 - α = 0,98 α / 2 = 0,01

𝑛𝑛 20 𝑛𝑛 15
𝑝𝑝̂1 = 𝑥𝑥1 = = 0,1 𝑝𝑝̂2 = 𝑥𝑥2 = = 0,05
1 200 2 300
𝑝𝑝�1 (1−𝑝𝑝�1 ) 𝑝𝑝�2 (1−𝑝𝑝�2 ) 𝑝𝑝�1 (1−𝑝𝑝�1 ) 𝑝𝑝�2 (1−𝑝𝑝�2 )

𝑃𝑃 �(𝑝𝑝̂1 − 𝑝𝑝̂2 ) − 𝑧𝑧𝛼𝛼�2 � + < 𝑝𝑝1 − 𝑝𝑝2 < (𝑝𝑝̂1 − 𝑝𝑝̂2 ) + 𝑧𝑧𝛼𝛼�2 � + � = 1 − 𝛼𝛼
𝑛𝑛1 𝑛𝑛2 𝑛𝑛1 𝑛𝑛2
0,44 0,44
α / 2 = 0,01
α / 2 = 0,01
z
-2,33 0 2,33
0,1 (0,9) 0,05(0,95) 0,1 (0,9) 0,05(0,95)

𝑃𝑃 �(0,1 − 0,05) − 2,33� + < 𝑝𝑝1 − 𝑝𝑝2 < (0,1 − 0,05) + 2,33� + � = 0,98
200 300 200 300
𝑃𝑃[0,05 − 2,33 (0,0178) < 𝑝𝑝1 − 𝑝𝑝2 < 0,05 + 2,33 (0,0178)] = 0,98
𝑃𝑃[0,01 < 𝑝𝑝1 − 𝑝𝑝2 < 0,09] = 0,98
Yorum: Bu işletmenin iki farklı deposundaki hataları ürünlerin anakütle oranları arasındaki farkın
% 98 olasılıkla 0,01 ile 0,09 arasında değiştiğini söyleyebiliriz.
Örnek-2: İstatistik 2 dersi başarı oranı açısından Ekonometri ve İktisat Bölümleri karşılaştırılmak
isteniyor. Bu amaçla iktisat bölümünde okuyan istatistik 2 dersini almış 150 öğrenci seçiliyor ve 80’inin
başarılı olduğu, ekonometri bölümünde okuyan istatistik 2 dersini almış 200 öğrenciden 120’sinin
başarılı olduğu görülüyor. Ekonometri bölümü öğrencilerinin başarını oranının iktisat bölümü
öğrencilerinden daha fazla olduğu iddiasını α = 0,10 önem seviyesinde test edip yorumlayınız.
ni = 150 xi = 80 nE = 200 xE = 120 α = 0,10
𝐻𝐻0 : 𝑝𝑝𝐸𝐸 = 𝑝𝑝İ
𝐻𝐻1 : 𝑝𝑝𝐸𝐸 > 𝑝𝑝İ

𝑛𝑛𝐸𝐸 120 𝑛𝑛İ 80
𝑝𝑝̂𝐸𝐸 = = = 0,6 𝑝𝑝̂ İ = = = 0,53
𝑥𝑥𝐸𝐸 200 𝑥𝑥İ 150
�𝑝𝑝�𝐸𝐸 −𝑝𝑝�İ �−�𝑝𝑝𝐸𝐸 − 𝑝𝑝İ � 𝑛𝑛𝐸𝐸 +𝑛𝑛İ 120+80

𝑧𝑧𝐻𝐻 = 𝑝𝑝̂ 0 = 𝑥𝑥𝐸𝐸 +𝑥𝑥İ
= = 0,57
1 1
200+150
�𝑝𝑝�0 (1−𝑝𝑝�0 )�𝑛𝑛 +𝑛𝑛 �
𝐸𝐸 İ
(0,6 − 0,53) − (0) 0,07

𝑧𝑧𝐻𝐻 = = ≅ 1,04
0,067
�0,57(0,43) � 1 + 1 �
200 150
H0 red edilemez H0 red edilir
0,50 0,40 α = 0,10
0 1,28
z
Zh = 1,04
Karar: H0 red edilemez.
Yorum : % 10 hata payıyla Ekonometri Bölümü öğrencilerinin İstatistik II dersi başarı oranının İktisat
bölümü öğrencilerinden daha fazla olduğunu söyleyecek yeterli kanıt bulunamamıştır.
Örnek-3: Bir oto yıkamacıda günlük kullanılan temizlik maddesi miktarının ortalamasının değişimi
incelemek amacıyla 23 günlük bir inceleme yapılmış ve günlük kullanılan temizlik maddesinin
ortalamasının 13,57 kg., varyansının ise 7,29 kg2 olduğu görülmüştür. Günlük kullanılan temizlik
maddesi miktarının normal dağılıma uygun olduğu varsayımı altında günlük kullanılan temizlik
maddesinin anakütle ortalaması için % 95 ’lik güven aralığını oluşturup yorumlayınız.
n = 23 𝑥𝑥̅ = 13,57 𝑘𝑘𝑘𝑘. 𝑠𝑠 2 = 7,29 𝑘𝑘𝑘𝑘2 1 - α = 0,95 α / 2 = 0,025
𝑠𝑠2 𝑠𝑠2
� − 𝑡𝑡𝑛𝑛−1;𝛼𝛼⁄2 �
𝑃𝑃 �𝑥𝑥 � + 𝑡𝑡𝑛𝑛−1;𝛼𝛼⁄2 � � = 1 − 𝛼𝛼
< 𝜇𝜇 < 𝑥𝑥
𝑛𝑛 𝑛𝑛
7,29 7,29
𝑃𝑃 �13,57 − 𝑡𝑡22;0,025 � < 𝜇𝜇 < 13,57 − 𝑡𝑡22;0,025 � � = 0,95
23 23
0,475 0,475
α / 2 = 0,025
α / 2 = 0,025
t
-2,074 0 𝑡𝑡22;0,025= 2,074
7,29 7,29
𝑃𝑃 �13,57 − 2,704� < 𝜇𝜇 < 13,57 − 2,704� � = 0,95
23 23
𝑃𝑃[ 12.06 < 𝜇𝜇 < 15,08] = 0,95
Yorum: Bu oto yıkamacıda 100 günlük bir inceleme yapıldığında, 95 gün kullanılan temizlik miktarının
ortalamasının 12,06 kg. ile 15.08 kg. arasında değiştiği, 5 gün ise 12.06 kg.’dan daha az veya
15,08 kg.’dan daha fazla olabileceği söylenebilir.
Örnek-4: Çevre koruma müdürlüğü büyük bir sanayi kuruluşunun çıkardığı günlük sülfürükoksit
miktarının ortalamasının belirlemek için araştırma yapmıştır. Bu miktarın kabul edilebilir ortalama olan
9,5’dan az olduğu iddia edilmektedir. Ölçüm fiyatları çok yüksek olduğundan sadece 9 günlük
ölçümlerden bir rastgele örnek oluşturularak aşağıda verilmiştir. Normal dağılış varsayımı hipotezi
α = 0,01 önem seviyesinde test edip yorumlayınız.
7,3 8,3 9,4 8,9 7,4 7,5 9,3 8,8 9,6
𝐻𝐻0 : 𝜇𝜇 = 9,5
𝐻𝐻1 : 𝜇𝜇 < 9,5
∑ 𝑥𝑥𝑖𝑖
𝑥𝑥̅ = 𝑛𝑛
= 7,3 + 8,3 + ⋯ + 9,6 = 8,5
∑(𝑥𝑥𝑖𝑖 −𝑥𝑥̅ )2 (7,3−8,5)2 + (8,3−8,5)2 +⋯+ (9,6−8,5)2 6,6

𝑠𝑠 2 = 𝑛𝑛−1
= 8
= ≅ 0,83
8
𝑥𝑥̅ − 𝜇𝜇0 𝑥𝑥̅ − 𝜇𝜇0 8,5 − 9,5

𝑡𝑡𝐻𝐻 = = = ≅ −3,29
𝑠𝑠𝑥𝑥̅ 2
�𝑠𝑠 �0,83
𝑛𝑛 9
H0 red edilir
H0 red edilemez
α = 0,01
0,49 0,50
t8;0,01 = -2,896
t
tH = - 3,29
Karar: H0 red edilir.
Yorum : % 1 hata payıyla bu sanayi kuruluşunun günlük çıkardığı sülfürükoksit miktarının anakütle
ortalamasının 9,5’dan daha az olduğu söylenebilir.
Örnek-1: X ve Y marka otomobil boyalarının saat olarak kuruma zamanlarının normal dağılıma uyduğu
ve anakütle varyanslarının eşit olduğu varsayımı altında X marka boya ile aynı anda 10 farklı alan
boyanıyor ve kuruma zamanının ortalaması 80 dk., standart sapması 9 dk. olduğu görülüyor. Y marka
boya ile yine aynı anda 8 farklı alan boyanıyor ve ortalama kuruma zamanı 65 dk., standart sapması
7 dk. olarak hesaplanıyor. X ve Y marka boyaların kuruma zamanlarının anakütle ortalamaları
arasındaki fark için % 90’lık güven aralığını oluşturup boyaların kuruma zamanlarının birbirine eşit olup
olmadığını konusundaki görüşünüzü belirtiniz.
nx = 10 𝑥𝑥̅ = 80 𝑑𝑑𝑑𝑑. 𝑆𝑆𝑥𝑥 = 8 𝑑𝑑𝑑𝑑.
ny = 8 𝑦𝑦� = 60 𝑑𝑑𝑘𝑘. 𝑆𝑆𝑦𝑦 = 7 𝑑𝑑𝑑𝑑.
1 - α = 0,90 α / 2 = 0,05
(𝑥𝑥̅ −𝑦𝑦�)−�𝜇𝜇𝑥𝑥� − 𝜇𝜇𝑦𝑦

�� 1 1
± 𝑡𝑡 𝑛𝑛𝑥𝑥 + 𝑛𝑛𝑦𝑦 − 2 ; 𝛼𝛼�2 = → (𝑥𝑥̅ − 𝑦𝑦�) ± 𝑡𝑡 𝑛𝑛𝑥𝑥 + 𝑛𝑛𝑦𝑦 − 2 ; 𝛼𝛼� 𝑆𝑆� +
2
1
𝑆𝑆� +
1 𝑥𝑥𝑛𝑛 𝑛𝑛 𝑦𝑦
𝑛𝑛𝑥𝑥 𝑛𝑛𝑦𝑦
(𝑛𝑛𝑥𝑥 − 1) 𝑆𝑆𝑥𝑥2 + �𝑛𝑛𝑦𝑦 − 1� 𝑆𝑆𝑦𝑦2 9 (64) + 7(49)

𝑆𝑆 2 = = = 57,44 → 𝑆𝑆 ≅ 7,58 𝑑𝑑𝑑𝑑.
𝑛𝑛𝑥𝑥 + 𝑛𝑛𝑦𝑦 − 2 10 + 8 − 2
𝑡𝑡16 ; 0,05 = 1,746
1 1
(80 − 60) ± 𝑡𝑡16; 0,05 (7,58)� +
10 8
20 ± (1,746) (3,56)
𝑃𝑃 � 13,78 < 𝜇𝜇𝑥𝑥� − 𝜇𝜇𝑦𝑦� < 26,22� = 0,90
Oluşturulan güven aralığının sınırları içerisinde “ 0 “ değeri yer almadığı için % 10 hat payıyla X ve Y
marka boyaların kuruma zamanlarının birbirine eşit olmadığı söylenebilir.
Örnek-2: Zirai araştırmalar yapan merkezde üzerinde çalışılan yeni gübrenin buğday verimi üzerindeki
etkisi araştırılmaktadır. Bu amaçla şansa bağlı olarak 9 toprak saha yeni gübre ile gübrelenmiş ve diğer
12 toprak saha hali hazırda kullanılmakta olan gübre ile gübrelenmiştir. Diğer tüm koşulların aynı
olduğu bilgisi altında, yeni gübre ile gübrelenen parsellerde günlük ortalama buğday verimi 95,1 kg. ve
standart sapma 8,2 kg , mevcut gübre ile gübrelenen de ise ortalama buğday verimi 114,8 kg. ve
standart sapma 9,5 kg. olarak bulunmuştur. Anakütle dağılımlarının normal ve eşit varyanslı olduğu
varsayımı altında yeni gübre ile gübrelenmiş grupta ortalama buğday üretiminin mevcut gübre ile
gübrelenmiş parsellerden daha az olduğu iddiasını α = 0,005 önem seviyesinde test edip yorumlayınız.
ny = 9 𝑦𝑦� = 95,1 𝑘𝑘𝑘𝑘. 𝑆𝑆𝑦𝑦 = 8,2 𝑘𝑘𝑘𝑘. nm = 12 𝑚𝑚

� = 114,8 𝑘𝑘𝑘𝑘. 𝑆𝑆𝑚𝑚 = 9,5 𝑘𝑘𝑘𝑘.
α = 0,005
𝐻𝐻0 : 𝜇𝜇𝑦𝑦� = 𝜇𝜇𝑚𝑚
𝐻𝐻1 : 𝜇𝜇𝑦𝑦� < 𝜇𝜇𝑚𝑚

�
(𝑦𝑦� −��)
𝑚𝑚 − � 𝜇𝜇𝑦𝑦� − 𝜇𝜇𝑚𝑚
��
𝑡𝑡ℎ = 1 1
𝑆𝑆 � +
𝑛𝑛𝑦𝑦 𝑛𝑛𝑚𝑚
�𝑛𝑛𝑦𝑦 − 1� 𝑆𝑆𝑦𝑦2 + (𝑛𝑛𝑚𝑚 − 1) 𝑆𝑆𝑚𝑚

2
8 (8,2)2 + 11(9,5)2
𝑆𝑆 2 = 𝑛𝑛𝑦𝑦 + 𝑛𝑛𝑚𝑚 − 2
= 9 + 12 − 2
≅ 85 → 𝑆𝑆 ≅ 9,22 𝑘𝑘𝑘𝑘.
(95,1−114,8) − 0 −19,7
𝑡𝑡ℎ = = ≅ −4,84
1 1 4,07
9,22 � +
9 12
H0 red edilir
H0 red edilemez
α = 0,005
0,495 0,50
t
t19;0,005 = -2,861
tH = - 4,84
Yorum : % 0,5 hata payıyla yeni gübre ile gübrelenmiş grupta ortalama buğday veriminin mevcut
gübre ile gübrelenmiş parsellerdeki ortalama buğday üretiminden daha az olduğu söylenebilir.
Örnek-3: Bir diyetisyen yeni geliştirdiği diyet programını 8 kişi üzerinde denemiştir. Aşağıdaki tabloda
bu kişilerin diyete başlamadan önceki ve diyeti uyguladıktan sonraki vücut ağırlıkları kilogram cinsinden
ifade edilmiştir. Normal dağılım varsayımı altında kişilerin diyete başlamadan önceki ve diyet
tamamlandıktan sonraki ağırlıklarının ortalamaları arasındaki fark için % 99’luk güven aralığını
oluşturup yorumlayınız.
KİŞİ 1 2 3 4 5 6 7 8
ÖNCE 75 93 62 112 73 81 90 82
SONRA 72 84 60 101 58 77 71 65
1 - α = 0,99 α / 2 = 0,005
Eşlenik ( eşleştirilebilen ) çiftler için güven aralığı oluşturulması gerekmektedir.
1 - α = 0,99 α / 2 = 0,005
𝑑𝑑� −𝐷𝐷 𝑑𝑑� −𝐷𝐷 𝑆𝑆𝑑𝑑

± 𝑡𝑡𝑛𝑛 − 2 ; 𝛼𝛼�2 = = 𝑆𝑆𝑑𝑑 → 𝑑𝑑̅ ± 𝑡𝑡𝑛𝑛 − 2 ; 𝛼𝛼�2
𝑆𝑆𝑑𝑑
� � √𝑛𝑛
√𝑛𝑛
di ( önce-sonra) 3 9 2 11 15 4 19 17
∑ 𝑑𝑑 3+9+⋯+17
𝑑𝑑̅ = 𝑖𝑖 = = 10
𝑛𝑛 8
∑(𝑑𝑑𝑖𝑖 −𝑑𝑑� )2 (3−105)2 + (9−10)2 +⋯+ (17−10)2 306

𝑆𝑆𝑑𝑑2 = 𝑛𝑛−1
= 7
= ≅ 43,71
7
2 2
� − 𝑡𝑡𝑛𝑛−1;𝛼𝛼⁄2 �𝑆𝑆𝑑𝑑 < 𝐷𝐷 < 𝑑𝑑
𝑃𝑃 � 𝑑𝑑 � + 𝑡𝑡𝑛𝑛−1;𝛼𝛼⁄2 �𝑆𝑆𝑑𝑑 � = 1 − 𝛼𝛼
𝑛𝑛 𝑛𝑛
𝑡𝑡7 ; 0,005 = 3,499
43,71 43,71
𝑃𝑃 � 10 − 3,499� < 𝐷𝐷 < 10 + 3,499� � = 0,99
8 8
𝑃𝑃[ 1,81 < 𝐷𝐷 < 18,19 ] = 0,99
Yorum: Diyetisyenin yeni geliştirdiği diyet programının uygulandığı kişilerin diyete başlamadan önceki
ağırlıklarının ve diyeti uyguladıktan sonraki ağırlıklarının ortalamaları arasındaki farkın % 1 hata payıyla
1,81 kg. ile 18,19 arasında değiştiği ifade edilebilir.
Örnek-4: Piyasa yeni sürülecek olan bir tansiyon ilacının etkinliğinin araştırılmaktadır. Bu amaçla
7 tansiyon hastasının ilaç verilmeden önceki ve ilaç verildikten sonraki tansiyon değerleri ölçülüp kayıt
altına alınmıştır. Sonuçlar aşağıdaki tabloda verilmiştir. Buna göre piyasaya yeni sürülecek ilacın
tansiyonu düşürmede etkili olup olmadığını α = 0,01 önem seviyesinde test edip yorumlayınız.
HASTA 1 2 3 4 5 6 7
ÖNCE 14 16 17 18 16 19 21
SONRA 13 15 17 15 14 16 17
𝐻𝐻0 : 𝐷𝐷 = 0
𝐻𝐻1 : 𝐷𝐷 > 0
𝑑𝑑� −𝐷𝐷 𝑑𝑑� −𝐷𝐷
𝑡𝑡𝐻𝐻 = = 𝑆𝑆𝑑𝑑
𝑆𝑆𝑑𝑑
� �
√𝑛𝑛
di ( önce-sonra) 1 1 0 3 2 3 4
di 2 1 1 0 9 4 9 16
2
�∑ 𝑑𝑑𝑖𝑖 � (14)2
∑ 𝑑𝑑𝑖𝑖2 − 40 −
𝑆𝑆𝑑𝑑2 = 𝑛𝑛−1
𝑛𝑛
= 6
7
=2 → 𝑆𝑆𝑑𝑑 ≅ 1,41 𝑘𝑘𝑘𝑘.
14
𝑑𝑑� − 𝐷𝐷 −0
𝑡𝑡𝐻𝐻 = 𝑆𝑆𝑑𝑑 = 1,41
7
≅ 3,75
� �
√𝑛𝑛 √7
H0 red edilemez H0 red edilir
0,50 0,49 α = 0,01
0 t
t6;0,01 = 3,143
th = 3,75
Yorum : Piyasaya yeni sürülecek olan tansiyon ilacının tansiyonu düşürmede etkili olduğu % 1 hata
payıyla söylenebilir.
İSTATİSTİK II
Varyans Analizi
Varyans Analizi
Üç veya daha fazla anakütle
ortalamasının eşitliğinin testi için
kullanılır.
Hipotezler:
H0 : µ 1 = µ 2 = µ 3 = . . . = µ k
H1: En az bir i ≠ j için µi ≠ µj

Varyans Analizi
Tanım
 Üç veya daha fazla anakütle
ortalamasının eşitliğinin, örnek
varyasyonlarının analizi yolu ile test
etmek için kullanılan bir yöntemdir.
Örnek
• Aynı sınıfta yer Yakıt Tüketim Verileri (galon başına mil)
alan üç ayrı
marka otomobilin A arabaları B arabaları C arabaları
ortalama yakıt
tüketimleri 22.2 24.6 22.7
karşılaştırılmak
19.9 23.1 21.9
istenmektedir.
20.3 22.0 23.3
• Bunu test etmek
21.4 23.5 24.1
için 20 sürücünün
yedisi A, yedisi B, 21.2 23.6 22.1
altısı da C 21.0 22.1 23.4
arabalarına 20.3 23.5
rastgele (rassal Toplam 146.3 162.4 137.4
olarak) atanmıştır.
Tek Yönlü Varyans Analizi
Varsayımlar
1. Anakütlelerin dağılışı normaldir.
2. Anakütleler aynı varyanslıdırlar.
(Anakütlelerin varyansı σ 2’dir.)
3. Örnekler basit şans örnekleridir.
4. Örnekler birbirlerinden bağımsızdır.
K Anakütleden Alınmış Bağımsız
Şans Örneklerinin Gözlemleri
Anakütle
1 2 … K
x11 x21 … xK1
x12 x22 … xK2
. . . .
. . . .
. . . .
x1n1 x2n2 … xKnK
Anakütle Ortalamalarının
Eşitliğinin Testi
• Anakütle ortalamalarının eşitliğinin testi, K
tane anakütlenin ortak bir varyansı olduğu
varsayımına dayanır.
• Anakütle ortalamalarının hepsi aynıdır
hipotezi doğruysa, GİKT ve GAKT
anakütle varyansını tahmin etmede
kullanılabilir.
• Bu tahminleri elde etmek için serbestlik
derecelerine bölmek gerekmektedir.
Anakütle Varyansının Sapmasız
Tahminleyicileri
GIKT GİKO = Grup İçi Kareler Ortalaması
GIKO =
n−K
GAKT
GAKO = GAKO = Gruplar Arası Kareler
K −1 Ortalaması
Notasyon
x = genel ortalama
K = karşılaştırılan anakütle ortalama sayısı
ni = i. Örnekteki veri sayısı
xi = i. Örnek ortalaması
K ni K
K
∑∑ xij ∑ ni xi
i =1 j =1 i =1
n = ∑ ni x= =
i =1 n n
Örnek: Tüketim Verileri İçin
Hesaplamalar
146.3 162.4 x3 =
137.4
= 22.9
x1 = = 20.9 x2 = = 23.2
7 7 6
K
n = ∑ ni = n1 + n2 + n3 = 7 + 7 + 6 = 20
i =1
K ni K
∑∑ xij ∑ ni xi
i =1 j =1 i =1 (7)(20.9) + (7)(23.2) + (6)(22.9)
x= = = = 22.305
n n 20
Grup İçi Değişkenlik
n1 n2
KT1 = ∑ ( x1 j − x1 ) 2 KT2 = ∑ ( x2 j − x2 ) 2
j =1 j =1
GİKT = KT1 + KT2 + … + KTK
GİKT = Grup İçi Kareler Toplamı
K ni
GIKT = ∑∑ ( xij − xi ) 2
i =1 j =1
Örnek: Tüketim Verileri İçin GİKT
Hesaplamaları
KT1 = (22.2 − 20.9) 2 + (19.9 − 20.9) 2 + ... + (20.3 − 20.9) 2 = 3.76

KT2 = (24.6 − 23.2) 2 + (23.1 − 23.2) 2 + ... + (23.5 − 23.2) 2 = 4.96
KT3 = (22.7 − 22.9) 2 + (21.9 − 22.9) 2 + ... + (23.4 − 22.9) 2 = 3.46
GIKT = KT1 + KT2 + KT3 = 3.76 + 4.06 + 3.46 = 12.18

Gruplar Arası Değişkenlik
2 2 2
( x1 − x ) , ( x2 − x ) ,..., ( xK − x )
K
GAKT = ∑ ni ( xi − x ) 2
i =1
GAKT = Gruplar Arası Kareler Toplamı

GAKT Hesaplamaları
K
GAKT = ∑ ni ( xi − x ) 2
i =1
GAKT = (7)(20.9 − 22.305) 2 + (7)(23.2 − 22.305) 2 + (6)(22.9 − 22.305) 2

GAKT = 21.5495
Toplam Değişkenlik
• GKT = Genel Kareler Toplamı

• GKT = GİKT + GAKT
• Örnek verileri için GKT,

GKT = 12.18 + 21.5495 = 33.7295
GİKO ve GAKO Hesaplamaları
12.18
GIKO = = 0.7165
20 − 3
21.5495
GAKO = = 10.7748
3 −1
Test İstatistiği ve Ret Bölgesi
Örnekler arası varyans

F= Örnekler içi varyans
GAKO
F=
GIKO
F > Fα, K – 1, n – K ise H0 RET.

Örnek: Tüketim Verileri İçin F
İstatistiği ve Karar
GAKO 10.7748
F= = = 15.04
GIKO 0.7165
K – 1 = 2 ve n – K = 17. α = 0.01 için
F0.01, 2, 17 = 6.11 < F = 15.04 H0 RET.

Değişkenlik Kareler Serbestlik Kareler Ortalaması F Oranı

Kaynağı Toplamı Dereceleri
Gruplar GAKT K–1 GAKO = GAKT / (K – 1) GAKO

Arası GİKO
Gruplar GİKO n–K GİKO = GİKT / (n – K)

İçi
Genel GKT n–1

Değişkenlik Kareler Serbestlik Kareler Ortalaması F Oranı
Kaynağı Toplamı Dereceleri
Gruplar 21.5495 2 10.7748 15.04

Arası
Gruplar 12.1800 17 0.7165

İçi
Genel 33.7295 19
1) Bir bankada bir gün içerisinde açılan
GÜVEN ARALIKLARI vadeli TL. hesaplarının ortalamasını
ALISTIRMA SORULARI incelemek amacıyla yapılan bir araştırmada
12 günlük yapılan bir incelemede, vadeli TL.
hesaplarının ortalaması 5250 TL. olduğu
görülmüştür. Daha önceki yapılan
çalışmalardan populasyon standart
sapmasının 350 TL. olduğu bilindiğine göre,
bir günde açılan vadeli hesapların
2012 populasyon ortalaması için % 95’lik güven
Aras.Gör. Efe SARIBAY ® aralığını oluşturup yorumlayınız.
3) Bir oto yıkamacıda günlük kullanılan

2) Bir mandırada günlük işlenen sütlerin
temizlik maddesi miktarının ortalamasının
ortalaması ile ilgili olarak yapılan bir
değişimi incelemek amacıyla 18 günlük bir
araştırmaya göre 33 günlük süre işlenen inceleme yapılmış ve günlük kullanılan
sütlerin ortalamasının 112 kg., temizlik maddesinin ortalamasının 16,56 kg.,
varyansının ise 68 olduğu görülmüştür. standart sapmasının ise 7 kg. olduğu
Buna göre mandırada günlük işlenen görülmüştür. Günlük kullanılan temizlik
sütlerin populasyon ortalaması için maddesi miktarının normal dağılıma uygun
% 97’lik güven aralığını oluşturup olduğu varsayımı altında günlük kullanılan
yorumlayınız. temizlik maddesinin ortalaması için
% 99 ’luk güven aralığını oluşturup
yorumlayınız.
1
4) İzmir ilinin Haziran ayı sıcaklık 5) Kurşunsuz benzin fiyatlarının artış
ortalamasını tahminlemek amacıyla bir oranını tahmin etmek amacıyla 600 kişiye
araştırma yapılmıştır. Bu araştırmada 2011 yıl sonunda kurşunsuz benzin fiyatının
yılındaki Haziran ayı içindeki 25 gün dikkate 5 TL.’yi geçip geçmeyeceği konusunda
alınmıştır ve ortalama 280 C ve standart görüşü alınmış ve 350 kişi 5 TL.’yi
sapma ise 30 C olarak hesaplanmıştır. Normal geçeceği konusunda görüş bildirmiştir.
dağılış varsayımı altında İzmir ilinin Haziran Kurşunsuz benzin fiyatlarının yıl sonunda
ayı sıcaklık değerinin populasyon ortalaması
5 TL.’yi geçeceği görüşüne sahip
için % 90’lık güven aralığını oluşturup
olanların kişilerin populasyon oranı için
yorumlayınız.
% 90 ‘lık güven aralığını oluşturup
yorumlayınız.
6) Tüketici tercihleri konusunda yapılan bir 7) Bir fabrikada üretilen vidaların yarıçap
araştırmada son bir ay içinde elektronik eşya uzunluğunun değişkenliği araştırılmak
alan 250 kişiden 87’sinin alışverişini internet istenmektedir. Bu amaçla şansa bağlı olarak
üzerinden gerçekleştirdiği görülmüştür. Buna seçilen 16 vidanın yarıçap uzunluklarının
göre son bir ayda internet üzerinden ortalaması 2 mm. ve standart sapması 0,4
elektronik eşya alan kişilerin populasyon mm. olarak bulunmuştur. Vidaların yarıçap
oranı için %99’luk güven aralığını tahmin uzunluklarının normal dağıldığı varsayımı
edip yorumlayınız. altında populasyon(anakütle) varyansı için
%95’lik güven aralığını oluşturup
yorumlayınız.
2
8) İstatistik II dersinin vize notlarının 9) Bir bankanın iki şubesinde açılan Є
değişkenliğini incelemek amacıyla bir hesaplarının ortalamaları arasındaki fark
çalışma yapılmıştır. Çalışmada 25 öğrencinin incelenmek istenmektedir. Birinci şubede
vize notları incelenmiş ortalaması 55 ve yapılan 50 aylık bir incelemede aylık
standart sapması 6 olarak bulunmuştur. ortalamanın 2000 Є standart sapmanın 25
Normal dağılım varsayımı altında İstatistik II Є, ikinci şubede 40 aylık bir inceleme
dersinin vize notlarının populasyon varyansı yapıldığında aylık ortalamanın 1500 Є,
için % 98’lik güven aralığını oluşturup standart sapmasının 80 Є olarak
yorumlayınız. bulunduğuna göre iki şubede açılan Є
hesaplarının aylık ortalamaları arasındaki
fark için %95 güven aralığını oluşturup
yorumlayınız.
11) Karşıyaka ve Alsancak’ta şubesi bulunan bir

10) Bir mandıra keçi ve inek sütlerinin günlük pastanenin aylık tükettiği dondurma miktarları
ortalama satış miktarlarının karşılaştırmak karşılaştırılmak isteniyor. 12 aylık yapılan bir
istemektedir. Bu amaçla 40 günlük yapılan inceleme sonucunda Karşıyaka’da satılan
bir inceleme sonucunda keçi sütlerinin dondurmaların ortalamasının 100 kg. varyansının
ortalaması 8 kg., varyansı 16; 50 günlük 64, Alsancak’ta satılan dondurmaların
yapılan bir inceleme sonucunda ise inek ortalamasının 150 kg. ve varyansının 81 olduğu
sütlerinin ortalaması 13 kg., varyansı ise görülmüştür. Buna göre populasyon
varyanslarının eşit olduğunu varsayımı ile iki
100 olarak bulunmuştur. Bu mandırada
şubede aylık satılan dondurma miktarlarının
satılan keçi ve inek sütlerinin anakütle ortalamaları arasındaki fark için % 98’lik güven
ortalamaları arasındaki fark için %90’lık aralığını elde ederek yorumlayınız.
güven aralığını oluşturup yorumlayınız.
3
13) Üniversite birinci sınıfta okutulan matematik
12) X ve Y marka otomobil boyalarının saat olarak
dersi için verilen 6 aylık bir kurs programının faydalı
kuruma zamanlarının normal dağılıma uyduğu ve
olduğu ve başarı ortalamasını arttırdığı iddia ediliyor.
anakütle varyanslarının eşit olduğu varsayımı
Bunu araştırmak amacıyla, rastgele belirlenen sekiz
altında X marka boyadan farklı zamanlarda 12 tane
öğrenciye ait veriler aşağıdaki gibidir;
alan boyanıyor ve kuruma zamanının ortalaması
80 kg., standart sapması 30kg. olduğu görülüyor. Y Kurs öncesi sınav notu: 40 20 60 50 60 30 50 10
marka boya ile yine aynı koşulları sağlayan 8 tane Kurs sonrası sınav notu: 60 60 80 60 50 80 80 90
farklı alan boyanıyor ve ortalama kuruma zamanı
60 dk., standart sapması 25 dk. olarak Normal dağılım varsayımı ile kurs verilmeden önceki
hesaplanıyor. X ve Y marka boyaların kuruma ve kurs verildikten sonraki sınav notlarının
zamanlarının populasyon ortalamaları arasındaki ortalamaları arasındaki fark için % 99’ luk güven
fark için % 90’lık güven aralığını oluşturup aralığını oluşturup yorumlayınız.
yorumlayınız.
14) Bir diyetisyen yeni geliştirdiği bir diyet

programını 6 kişi üzerinde denemiştir. Bu 15) Bir işletmenin iki farklı deposunda bulunan
Aşağıdaki tabloda bu kişilerin diyete başlamadan hatalı ürünlerin oranı karşılaştırılmak isteniyor.
önceki ve tamamladıktan sonraki ağırlıkları kg. Bu amaçla 1. depodan 200 adetlik bir örnek
cinsinden ifade edilmiştir. Normal dağılım alındığında 20 adet hatalı, 2. depodan 300
varsayımları altında diyete başlamadan önceki adetlik bir örnek alındığında ise 15 adet hatalı
ve diyet tamamlandıktan sonraki kişilerin ürün gözleniyor. İki depoda bulunan bulunan
ağırlıkları ortalamaları arasındaki fark için hatalı ürünlerin oranı arsındaki fark için
% 99’ luk güven aralığını oluşturup yorumlayınız. %99’luk güven aralığını oluşturup
yorumlayınız.
KİŞİ 1 2 3 4 5 6
ÖNCE 75 93 62 112 73 81
SONRA 73 85 60 101 58 77
4
16) İki banka verdikleri bireysel ihtiyaç
kredilerin geri ödenme oranlarına göre
karşılaştırılmıştır. Buna göre A bankasından
kredi alan 250 kişinin 210’u, B bankasından
kredi alan 200 kişiden 150’si aldıkları kredileri
zamanında ödemiştir. Bankaların verdikleri
kredilerin geri ödenme oranları arasındaki fark
için % 80’lik güven aralığını oluşturup
yorumlayınız.
5
Yrd.Doç.Dr.İstem Köymen KESER
Tahminler
Nokta Aralık
Tahmini Tahmini
Uygulamada çoğu sorun için nokta tahmini yeterlidir.
Örneğin, büyük bir parti maldan rassal seçilmiş parçaların
incelenmesi, bütün parçaların %10’unun kusurlu olmuş
olduğu tahminini ortaya koymuş olsun. Bu sayıyı gören bir
yönetici şöyle sorular sorabilir.
Bu sayıyı gören bir yönetici şöyle sorular sorabilir:
“Gerçek kusurlu oranının %5 ile %15 arasında olduğundan
az çok emin olabilir miyim?”
“Bu durumda bütün parçaların %9 ile %11 arasındaki bir
oranının kusurlu olduğu mu görülüyor?”
Böyle sorular tek bir nokta tahmininin güvenilirliğini
sorgulamaktadır. Daha doğrudan söylenirse, tahmini
yapılan büyüklüğün arasında kalacağı bir aralık demek olan
aralık tahmini sorulmaktadır.
Bir anakütleden örnekleme yaparken diğer tüm etmenler
aynı kaldığında hacmi büyük bir örnekten hacmi küçük bir
örneğe göre daha güvenli bilgi sağlamayı bekleriz. Ancak
bu etmen nokta tahminine yansımamaktadır.
Örneğin, bir partideki kusurlu parça oranı
konusundaki nokta tahminimiz, on parçalık bir
örnekte (örneklemde) bir kusurlu parça görsek de,
1000 parçalık bir örnekte 100 kusurlu parça bulsak da
değişmez.
Anakütle katsayılarına ilişkin bilgilerimizin hassalığı
aralık tahminine yansır. Bir diğer deyişle örnek
büyüklüğü artıkça, diğer tüm etmenler aynı
kaldığında, bir anakütle katsayısının gerçek değeri
konusundaki belirsizliğimizi yansıtan güven aralığı
azalır.
Tanım 1: Bir anakütle katsayısının aralık tahmin
edicisi, o anakütle katsayısının içine düşebileceği bir
aralığı (örnekleme bilgisine dayanarak) belirlemenin
bir kuralıdır. Buna karşılık gelen tahmine de aralık
tahmini denir.
Aralık tahmin edicileri gerçek ama bilinmeyen anakütle
katsayılarını “içerebilir” yada içermesi “çok olası” diye
tanımlanmıştır. Daha hassas bir açıklama yapmak için bu
terimler olasılık ifadelerine dönüştürmek gerekir.
tahmin edilecek anakütle katsayısını θ ile gösterelim. bir
rassal örnek seçildiğini ve bu örnek bilgisine dayanarak A,
B’den küçük olmak üzere A ile B gibi iki rassal değişken
bulunabileceğini düşünelim. Bu rassal dağişkenler, A’nın θ
küçük ve B’nin θ’dan büyük olma olasılığı 0.90 gibi bir
özellik taşıyorsa,
P(A< θ<B) = 0.90 yazılabilir.
Eğer A ile B belli örnek genişlemeleri ile a ile b
şeklinde gösterilirse o zaman a ile b aralığına %90
güven aralığı denir.
Olasılık kavramına göre bu tür olasılıklar şöyle
yorumlanabilir:
Eğer anakütleden tekrarlı örneklemeler alınır ve bu
yolla aralıklar hesaplanırsa, bu aralıkların %90’ı
bilinmeyen anakütle katsayısını içerir.
Tanım 2: θ bilinmeyen bir anakütle katsayısı olsun. Örnek
bilgisine dayanarak,
P(A< θ<B) = 1-α
eşitliğini sağlayan A ve B rassal değişkenlerini
bulabileceğimizi düşünelim. A ile B belli örnek seçimleri
ile a ile b olarak gösterilirse, bu durumda a ile b aralığına
θ’nın %100(1- α) güven aralığı denir. (1- α) büyüklüğü de,
bu aralığın olasılık içeriği ya da güven düzeyi adını alır.
eğer anakütleden çok büyük sayıda yinelenen örnekler
seçilirse bu yolla bulunan aralıkların %(1- α) oranı, θ
katsayısını içerecektir. Bu yolla hesaplanan güven aralığı
a< θ<b şeklindedir.
Tanımlar
Güven Aralığı
(veya Aralık Tahmini)
Bir anakütle parametresinin gerçek değerini tahmin

etmek için kullanılan değerler aralığı
Alt değer < anakütle parametresi < Üst değer
Örnek olarak
Alt değer <  < Üst değer
Tanımlar
Güven Derecesi
(güven seviyesi veya güven katsayısı)
güven aralığı, 1 -  olasılığı ile anakütle

parametresini içerir.
genellikle 90%, 95%, veya 99%

( = 10%), ( = 5%), ( = 1%)
Bir güven aralığının yorumu
98.08 < µ < 98.32
o o
Doğru: 98.08 ve 98.32 aralığı, %95 olasılıkla ’nün

gerçek değerini içerir.

Yanlış: nün gerçek değerinin 98.08 ile 98.32
arasına düşmesi olasılığı %95’tir.
1. BİR NORMAL DAĞILIM ORTALAMASININ GÜVEN
ARALIKLARI : ANAKÜTLE VARYANSI BİLİNİYOR
Ortalaması bilinmeyen ama varyansı bilinen bir normal
dağılımdan rassal bir örnek seçildiğini amacın da anakütle
ortalamasının güven aralığını bulmak olduğunu
varsayalım. Bu sorun gerçeklikten uzaktır, çünkü ortalama
bilinmezken anakütle varyansının tam olarak bilinmesi
(olanaksız değilse de) ender bir durumdur. Ancak kimi
zaman benzer anakütlelerden o denli örnek alınır ki,
sözkonusu anakütlenin varyansının, geçmiş deneyimlere
dayanılarak büyük bir yaklaşıklıkla bilindiği varsayılabilir.
Aynı zamanda örnek hacmi yeterince büyükse anakütle
varyansının bilindiği durum için geliştirilen süreçler bu
varyans örnekten tahmin edilirse de uygulanabilir.
Bilinmeyen ortalaması μ ve bilinen varyansı olan
bir anakütleden çekilen rassal bir örneğin gözlemleri
X1, X2, …, Xn
ve örnek ortalaması olsun. Bu durumda anakütle
ortalamasının güven aralıkları,
rassal değişkeninin standart bir normal dağılıma

uyduğu bulgusuna dayanır.
Anakütle ortalamasının %90 güven aralığını bulmak
istediğimizi varsayalım. Standart normal değişken için
P(Z<1.96) =0.975
P(Z>1.96) =0.025
şeklindedir. Benzer şekilde simetriklik özelliğinden dolayı
P(Z<-1.96)= 0.025 şeklindedir. Özetle Z’nin -1.645 ile 1.645
arasında bulunma olasılığı
P(-1.96<Z< 1.96) = 1-P(Z>1.96) – P(Z<-1.96)=
0.975-0.025 =0.95 şeklindedir.
Özetle standart normal bir rassal değişkenin -1.96 ile 1.96
arasında olma olasılığı 0.95 şeklindedir.
Buradan anakütle ortalaması için bir güven aralığına
dönüştürürsek
P(-1.96<Z<1.96)=0.95
P(-1.96< <1.96)=0.95
𝜎 𝜎
𝑃(−1,96 <𝑥 − µ< +1,96 ) = 0.95
𝑛 𝑛
𝜎 𝜎
𝑃(𝑥 − 1,96 𝑛
<µ< 𝑥 + 1,96 𝑛) = 0.95
şeklindedir. Bu aralığın μ ‘yü içerme olasılığı 0.95’dır. Bir

𝜎
diğer deyişle 𝑥 − 1,96 ve 𝑥 + 1,96 𝜎 aralığı μ’nün
𝑛
𝑛
%95 güven aralığıdır.
 Standart sapması 6 olan normal dağılımdan seçilmiş
onaltı gözlemli rassal bir örnek ortalaması 25’dir.
Anakütle ortalaması μ için %90 güven aralığını
oluşturunuz. (Newbold sayfa 303)
 Anakütle ortalamasının bir güven aralığı örnek
ortalamasının bir gözlenen değerine- örnekleme
dağılımından çekilmiş bir gözlem değerine-dayanır.
Genellersek,
Tanım 3: Bir Normal Anakütle Ortalamasının Güven
Aralıkları: Anakütle Varyansı Biliniyor
Ortalaması μ, varyansı olan bir normal dağılımdan
çekilen n gözlemli rassal bir örnek olsun. biliniyorsa,
gözlenen örnek ortalaması da ise anakütle
ortalamasının güven aralığı
Şeklindedir. Burada aşağıdaki eşitliği sağlar:

P(Z > ) = α/2 şeklindedir. Z rassal değişkeni standart
normal dağılıma uyar. Bir diğer deyişle,
şeklindedir.
Örnek: Bir üretim süreci torba içinde rafine şeker
üretmektedir. Bu torbaların içerik ağırlıkları standart
sapması 1.2 kg olan normal dağılıma uymaktadır. Yirmibeş
torbalık rassal bir örnekte ortalama ağırlık 19.8 kg çıkmıştır.
Bu süreçte üretilen bütün şeker torbalarının ortalama
ağırlığının %95 güven aralığını bulunuz. (Newbold, sayfa
307)
Güven Aralığının Özellikleri:
 Verilmiş bir olasılık içeriği ve örnek büyüklüğü için
anakütle standart sapması σ büyüdükçe, anakütle
ortalamasının güven aralığı da genişler. Bir diğer deyişle
diğer her şey aynıyken anakütlenin kendi ortalaması
etrafındaki dağılımı ne kadar yaygınsa, ortalamaya ilişkin
çıkarsamalar o kadar belirsiz olur. Bu fazladan belirsizlik
daha geniş güven aralığı çıkarır.
 Verilmiş bir olasılık ve anakütle standart sapması için
örnek hacmi büyüdükçe anakütle ortalamasının güven
aralığı da daralır. Bir diğer deyişle bir anakütleden ne kadar
çok bilgi alırsak onun ortalamasına ilişkin çıkarsamamız o
kadar hasssas olur. Bu fazladan hassalık daha dar güven
aralığı çıkarır.
 Verilen bir anakütle standart sapması ve örnek
büyüklüğü için, olasılık içeriği (1-α) yükseldikçe,
anakütle ortalamasının güven aralığı da genişler. (1-α)
genişledikçe α küçülür dolayısıyla büyür. Olasılık
içeriği yükseldiğinden anakütle katsayılarının daha
geniş güven aralıklarına yansır.
Doç.Dr.İstem Köymen KESER
Güven Aralıkları
Ortalama yada iki Oranlar yada iki Varyansların testi

ortalama farkı için oran farkı için
Bir İki varyans
2 biliniyor 2 bilinmiyor varyans için oranı için
n30 n<30 Z İstatistiği F İstatistiği
Z İstatistiği t İstatistiği 2 İstatistiği
2
Anakütle Ortalamasının Güven Aralığı Büyük
Örneklerde
Ortalaması µ olan bir dağılımdan n gözlemli rassal bir
örnek çektiğimizi varsayalım . Örnek ortalaması ile
standart sapmasını ve S ile gösterelim. Eğer n≥30
ise , populasyon ortalamasının %(1-α)’lık güven aralığı
aşağıdaki gibidir:
Örnek: Bir araştırma için, 106 sağlıklı yetişkinin vücut
sıcaklıkları incelenmiştir. Örnek ortalaması 98.2 derece ve örnek
standart sapması 0.62 derece olarak bulunmuştur. Gerçek sıcaklık
ortalaması için %95 güven aralığını bulunuz.
n = 106 E = z / 2 •  = 1.96 • 0.62 = 0.12

x = 98.20o n 106
s = 0.62o
 = 0.05 x -E << x +E
/2 = 0.025
z / 2 = 1.96 98.20o - 0.12 << 98.20o + 0.12
98.08o << 98.32o

98.08 ve 98.32 aralığı, %95 olasılıkla ’nün gerçek değerini
içerir
Anakütle Oranının Güven Aralıkları
(Büyük Örneklem)
 Başarı oranı п olan n hacimli bir anakütleden seçilmiş
olan n gözlemli rassal bir örneklemde başarı oranını p
ile gösterelim. Bu durumda n≥30 ise anakütle oranı п
için %(1-α)’lık güven aralığı:
şeklindedir.
Örnek: Grip aşısı yaptıran rastgele seçilmiş 400 kişiden
136’sı aşı sonrası sıkıntı yaşamıştır. Aşı sonrası sıkıntı
yaşayanların gerçek oranı için %95 güven aralığını bulunuz.
 n = 400, pˆ  136 / 400  0.34 z0.025  1.96

(0.34)(0.66) (0.34)(0.66)
0.34  1.96  p  0.34  1.96
400 400
0.29  p  0.39
0.29 ve 0.39 aralığı, %95 olasılıkla ’nün gerçek değerini içerir
İki Anakütle Oranı Arasındaki Fark İçin Güven
Aralıkları (Büyük Örneklerde)
Başarı oranı olan bir anakütleden seçilmiş gözlemli bir
örneklemde gözlenen başarı oranı ile, başarı oranı olan bir
anakütleden rassal seçilmiş gözlemli bir örneklemde gözlenen başarı
oranı ile gösterilsin.
Olmak üzere
Bu durumda örnekler büyükse İki anakütle oranı
arasındaki fark için %(1-α)’lık güven aralığı aşağıdaki
biçimdedir.
 Örnek: Son sınıf kız ve erkek muhasebe
öğrencilerinden bağımsız rassal örnekler seçilmiştir.
120 erkekten 107’si on yıl sonra tam zamanlı olarak
çalışmayı beklemektedir. 141 kız öğrenciden de 73’ü
aynı beklentidedir. İki anakütle oranları arasındaki
fark için %95 güven aralığını oluşturunuz. (newbold,
sf. 345)
 Örnek: Üniversitelerin pazarlama derslerinde müşteri
destekli projeler (MDP) araştırmasında, MDP kullanan
öğretim üyelerine “MDP’ler öğretim üyesi için zaman
alıcıdır” tümcesi verilmiştir. Vakıf üniversitelerinden
seçilen 92 MDP kullanıcısından oluşan rassal bir örnekte
49 kişi bu görüşe katılmıştır. Devlet üniversitelerinden
seçilen 86 MDP kullanıcısından 36 kişi bu görüşe
katılmıştır. İki anakütle oranı arasındaki fark için %90’lık
güven aralığını oluşturunuz.(Newbold sf. 344)
İki Anakütle Ortalaması Arasındaki Fark İçin Güven Aralıkları
(Populasyon Varyansları Biliniyor veya Örneklemler Büyük)
Ortalamaları ile varyansları ile
olan normal dağılımlardan ve gözlemli
bağımsız rassal örnekler seçilmiş olsun. Örnek
ortalamaları ve ise, iki anakütle ortalaması
arasındaki fark için %(1-α)’lık güven aralığı aşağıdaki
gibidir:
Örnek hacimleri ≥ 30 ise populasyon varyansları
yerine örnek varyansları koyulabilir ve iki ortalama
arasındaki fark için güven aralığı aşağıdaki biçimde
olur:
 Örnek: Sigara içen 96 kişilik bir rassal örneklemde kısa süreli iş
devamsızlığının ortalaması ayda 2.15 saat, standart sapması ayda 2.09
saattir. Hayatında hiç sigara içmemiş 206 kişilik bağımsız bir örnekte
ise ortalama devamsızlık 1.69 saat, standart sapma ayda 1.91 saattir. İki
anakütle ortalaması arasındaki fark için %99 güven aralığını bulunuz
ve yorumlayınız.(Newbold sf.337)
Populasyonun Varyansı 2X Bilinmediğinde ve
n< 30 Olduğunda Ortalama İçin Güven Aralığı
 Varsayımlar:
 POPULASYONUN standart sapması bilinmiyor
 Populasyon Normal dağılımlıdır.
 Populasyonun normal dağılış göstermesi şartıyla
X -  şeklinde hesaplanan
t=
S
n
test istatistiği n-1 serbestlik dereceli t dağılışı gösterir.
Populasyon ortalaması için güven aralığı aşağıdaki
biçimdedir.
 
P  x  t ,n1 * S x
 2
   x  t
2
,n 1
* S   1
x 

Student t Dağılımı
*t dağılışı, normal dağılış gibi simetrik bir dağılıştır. Bu

dağılış ilk olarak 1908 yılında W.S.Gosset tarafından
örnekleme denemeleri sonunda bulunmuştur. Gosset
yayınlarında “Student” takma ismini kullandığı için
bulduğu t dağılışı “Student t dağılışı” olarak bilinmektedir.
Bu dağılıştan kısaca t dağılışı olarak bahsedilecektir.
*t dağılışı, normal dağılış gibi simetrik bir dağılıştır.

Ortalaması 0 olup normal dağılıştan daha yaygın bir şekil
göstermektedir. t dağılışının bir tek parametresi vardır ve
bu parametre serbestlik derecesi olarak isimlendirilir. S’nin
hesaplanmasında kullanılan (n-1), S’nin serbestlik derecesi
olup t’nin dağılışını belirler.
Student t Dağılımı
t dağılışı için z cetveli yerine, çeşitli örnek büyüklükleri ve
olasılık seviyeleri için ayrı ayrı hesaplanmış t cetvelleri
kullanılır.
16
Çan şekilli
simetrik,
Standart
‘Tombul’
Normal
kuyruklar
t (sd = 13)
t (sd = 5)
z
t
0
17
Student’ın t Tablosu
n=3
sd = n - 1 = 2
Üst kuyruk alanı  = .10
/2 =.05
sd .25 .10 .05
Olsun:
1 1.000 3.078 6.314
2 0.817 1.886 2.920 .05

3 0.765 1.638 2.353
0 t
t değerleri 2.920
18
Örnek: Çeşitli kazalara karışan 12 A marka otomobilin onarım
giderlerinin ortalaması $26,227 ve standart sapması $15,873
tutmuştur. Giderlerin dağılışının normal olduğu varsayımı altında,
tüm kazalara karışan A’ların gerçek ortalama onarım giderleri için
%95 güven aralığını bulunuz.
x = 26,227 E = t2 s = (2.201)(15,873) = 10,085.3

s = 15,873 12
n
 = 0.05 x -E <µ< x +E
/2 = 0.025
26,227 - 10,085.3 < µ < 26,227 + 10,085.3
t/2 = 2.201
$16,141.7 < µ < $36,312.3
Bu aralığın bir A’nın ortalama onarım giderini içerdiğinden
%95 eminiz.
ÖRNEK: Varyansı bilinmeyen normal dağılmış bir populasyonun bilmediğimiz
ortalaması hakkında %99 güven katsayısı ile bir aralık oluşturmak isteyelim. Bu
anakütleden 9 birimlik bir örnek alınıyor ve aşağıdaki değerler elde ediliyor.
5, 8.5, 12, 15, 7, 9, 7.5, 6.5, 10.5
%99 güven aralığını oluşturunuz.
n=9 x
x 9
n
 x  2
 x2

n  x2  nx
2
805  9(9) 2
S    3,082
n 1 n 1 8
P( 9- 3,355*(3,082)/3<µ<9+3,355*(3,082)/3)=0.99
İKİ ANAKÜTLE ORTALAMASINA
İLİŞKİN HİPOTEZ TESTLERİ Normal Dağılım Örnek Hacimleri Küçük
Bağımsız ve İlişkili Populasyonlar
Bağımsız İlişkili
1. Farklı veri kaynakları 1. Aynı veri kaynağı
 İlişkisiz  Eşleştirilmiş
 Bağımsız  Tekrarlı ölçümler
2. İki örnek ortalaması 2. Her gözlem çifti
arasındaki farkın arasındaki farkın
kullanılması kullanılması
X X
1 2 Dn = X1n - X2n
21
(
1- ÖRNEKLERİN BAĞIMSIZ OLMASI HALİ
Populasyonların normal dağılım göstermesi ve
 12   2 2   2
Şeklinde populasyon varyanslarının eşit olduğu varsayımı altında
( n  1) s 2
 ( n  1) s 2 Olmak üzere
s2  1 1 2 2
n1  n2  2
𝑋1 − 𝑋2 − (µ1 − µ2 ) 𝑋1 − 𝑋2 − (µ1 − µ2 )
𝑡= =
𝑆𝑋1 −𝑋2 1 1
𝑆2 +
𝑛1 𝑛2
Şeklindeki istatistik t dağılımı
gösterir.
22
 Ortalamaları ve , varyansları aynı olan iki
normal dağılımdan ve gözlemli bağımsız
örnekler seçtiğimizi varsayalım. Örnek ortalamaları
varyansları sırasıyla olmak üzere iki
populasyon ortalaması arasındaki fark için %(1-α)’lık
güven aralığı aşağıdaki biçimdedir:

1 1 1 1
𝑃 (𝑋1 − 𝑋2 ) − 𝑡𝑛 1+𝑛 𝑆2 + < (µ1 − µ2 ) < (𝑋1 − 𝑋2 ) + 𝑡𝑛 1+𝑛 𝛼 𝑆 2 + = %(1 − α)
𝛼
2−2,,,, 2 𝑛1 𝑛2 2,−2, 2 𝑛1 𝑛2
Örnek
Pınar Et için çalışan bir finansal analistsiniz. İki ayrı
kesimhanenin üretim kayıtlarıyla ilgili aşağıdaki rassal olarak
seçilen örneklere ait verileri topladınız:
 fab1 fab2
n 11 13
Ortalama 3.27 2.53
Std Sapma 1.30 1.16
Populasyonların normal dağılım gösterdiği ve eşit varyans

varsayımı altında, iki ortalama arasındaki fark için (1- = 0.95)
güven aralığını oluşturunuz.
© 1984-1994 T/Maker Co.

24
fab1 fab2
n 11 13
Ortalama 3.27 2.53
Std Sapma 1.30 1.16
Test İstatistiğinin Hesaplanması
25
Belli bir kuş cinsinde erkek ve dişi ağırlıklarının eşit olup olmadığı
araştırılmaktadır. Aşağıdaki verilere göre iki ortalama arasındaki fark için %95
güven aralığını oluşturunuz. Populasyon normal dağılımlı ve populasyon
varyanslarının eşitliği varsayımı bulunmaktadır.
Örnek hacmi(n) ortalama( x ) varyans( S2 )
Erkek 10 90.80 55.2
Dişi 9 81.52 66.2
1 1 1 1
S 2
x1 - x 2
2
=S ( + ) S X1 _ X 2  60.38(  )  3.57
n1 n 2 10 9
9(55.2)  8(66.2)
2 2
( n - 1)S + ( n - 1)S
S2 = 1 S   60.98
1 2 2 2
n1 + n 2 - 2 10  9  2
𝑃 (90.80 − 81.52) − 2.11(3.57) < (µ1 − µ2 ) < (90.80 − 81.52) + 2.11(3.57) = %95
𝑃(1.7473 < (µ1 − µ2 ) < 16.8127)

2-Eşleştirilmiş Örnek t Testi
1. İki ilişkili populasyonun ortalamasını test eder.

 Çift ya da eşleştirilmiş
 Tekrarlı gözlemler (önce/sonra)
2. Nesneler arasındaki varyasyonu ortadan kaldırır.

3. Varsayımları
 İki populasyon da normal dağılımlıdır.
28
İki değişken arasındaki fark d değişkeni ile gösterilmek üzere
d
 d i
 d
n

2
d  n
2
Sd 
Sd
S d2 
n 1 n
Şeklindeki t istatistiği (n-1) serbestlik dereceli t

d  D dağılımı göstermek üzere iki ortalama arasındaki
th  fark için güven aralığı aşağıdaki biçimdedir.
Sd
Eşleştirilmiş Örnek t Testi
İki komisyoncunun aynı evlere farklı fiyatlar verdiği iddia edilmektedir.
Populasyonların normal dağıldığı varsayımı altında iddiayı test etmek için 12 ev
seçilmiş ve komisyonculardan bu evlere 1000$ bazında fiyat vermeleri istenmiştir. Elde
edilen sonuçlar aşağıdaki gibidir.İki komisyoncunun aynı evlere verdiği
fiyatların ortalaması arasındaki fark için %98’lik güven aralığını oluşturunuz.
Komisyoncular
Evler A B d d2
1 181.0 182.0 -1.0 1.00
2 179.9 180.0 -0.1 0.01
3 163.0 161.5 1.5 2.25
4 218.0 215.0 3.0 9.00
5 213.0 216.5 -3.5 12.25
6 175.0 175.0 0.0 0.00
7 217.9 219.5 -1.6 2.56
8 151.0 150.0 1.0 1.00
9 164.9 165.5 -0.6 0.36
10 192.5 195.0 -2.5 6.25
11 225.0 222.7 2.3 5.29
12 177.5 178.0 -0.5 0.25
Toplam -2.0 40.22 30
Eşleştirilmiş Örnek t Testi
 d 2
d   0,167  d
i

2
(2) 2
n 12
d  n
2
40,22 
12  3.62
S d2  
n 1 12  1
Sd
3.62 1.904
Sd   
n 12 12
v  n 1  12 1  11s.d.
31
Örnek: İki ayrı TV program kuşağında 10 ayrı reklam kişilere izlettirilmiş ve 24
saat sonra, iki ayrı kuşaktaki reklamlardan hatırlanma indeksleri elde
edilmiştir.
Ürün Sabah Akşam di d i2

Kuşağı Kuşağı
1 137 53 84 7,056
2 135 114 21 441
3 83 81 2 4
4 125 86 39 1,521
5 47 34 13 169
6 46 66 -20 400
7 114 89 25 625
8 157 113 44 1,936
9 57 88 -31 961
10 144 111 23 1,089
Toplam 210 14,202
İki ayrı kuşakta izlenen reklamların hatırlanması indeksleri

karşılaştırıldığında sabah kuşağının hatırlanması indeksinin daha yüksek
olup olmadığını %95 güven aralığına göre yorumlayınız.
d
 d i

210
 21 Sd 
Sd

1,088

32,98
n 10 n 10 10
 d  2
 d 
n
2
 d 2  nd
2
14,202  1021
2
S 
2
   1,088
n 1 n 1
d
9
Örnek: İki ayrı TV program kuşağında 10 ayrı reklam kişilere izlettirilmiş ve 24 saat
sonra, iki ayrı kuşaktaki reklamlardan hatırlanma indeksleri elde edilmiştir.
Ürün Sabah Akşam di d i2

Kuşağı Kuşağı
1 137 53 84 7,056
2 135 114 21 441
3 83 81 2 4
4 125 86 39 1,521
5 47 34 13 169
6 46 66 -20 400
7 114 89 25 625
8 157 113 44 1,936
9 57 88 -31 961
10 144 111 23 1,089
Toplam 210 14,202
İki ayrı kuşakta izlenen reklamların hatırlanması indekslerinin

ortalamaları arasındaki fark için %90 güven aralığını oluşturunuz.

İstatistik 2

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

İstatistik 2

Uploaded by

Copyright:

Available Formats

Yrd.Doç.Dr.

İstem Köymen KESER

Varyansı σ 2 olan bir normal anakütleden n gözlemli rassal bir

χ21−α/2 , n−1 χ2α/2, n−1

χ 2 1− α/2, n−1 χ 2 α/2, n−1

 χ 0.05;9 χ 0.95;9  χ2α/2, n−1

P (103.72 < σ 2 < 527.02 ) =

ARŞ. GÖR. HATEM ÇOBAN

Dokuz Eylül Üniversitesi

1.1 Popülasyon Ortalaması ve Oranı İçin Büyük Örnek Güven Aralığı

IBF 1008 İstatistik-II 1 ARŞ. GÖR. HATEM ÇOBAN

IBF 1008 İstatistik-II 2 ARŞ. GÖR. HATEM ÇOBAN

IBF 1008 İstatistik-II 3 ARŞ. GÖR. HATEM ÇOBAN

1.1.3 Popülasyon Oranı π için Güven Aralığı

= Pr(0.607 − 1.96 0.03 ≤ π ≤ 0.607 + 1.96 0.03) = 0.95

IBF 1008 İstatistik-II 4 ARŞ. GÖR. HATEM ÇOBAN

1.2 Popülasyon Ortalaması İçin Küçük Örnek Güven Aralıkları

IBF 1008 İstatistik-II 5 ARŞ. GÖR. HATEM ÇOBAN

1.2.2.1 Eşleştirilmiş Gözlemlerde

t8−1,0.005 = t7,0.005 = 3.499

olduğuna göre bu değerleri elde etmeliyiz.

IBF 1008 İstatistik-II 6 ARŞ. GÖR. HATEM ÇOBAN

1.2.2.2 Eşleştirilmemiş(bağımsız) Gözlemlerde

(n1 − 1)s21 + (n2 − 1)s22

IBF 1008 İstatistik-II 7 ARŞ. GÖR. HATEM ÇOBAN

1.3 Popülasyon Varyansı(σ 2 ) için Güven Aralığı

IBF 1008 İstatistik-II 8 ARŞ. GÖR. HATEM ÇOBAN

s21 σ12 s21

s21 σ12 s21

1.4 Örnek Büyüklüğünün Tespiti

IBF 1008 İstatistik-II 9 ARŞ. GÖR. HATEM ÇOBAN

1.4.2 Popülasyon Oranının Kullanılması

IBF 1008 İstatistik-II 10 ARŞ. GÖR. HATEM ÇOBAN

ikinci yaklaşım kullanılırsa örnek hacmi,

IBF 1008 İstatistik-II 11 ARŞ. GÖR. HATEM ÇOBAN

a) %3 önem seviyesinde ortalama su sıcaklığının 60 dereceden fazla olduğu söylenebilir mi?

a) 1. Adım: Hipotezi kurmaktır.

4. Adım: Karar. | zh |<| zt | olduğundan H0 hipotezi reddedilemez.

IBF 1008 İstatistik-II 1 Arş. Gör. Hatem Çoban

P(β ) = 0.5 − P(X üst < X < µyeni )

IBF 1008 İstatistik-II 2 Arş. Gör. Hatem Çoban

1. Hipotez Testlerinin Esasları

Büyük örnekler için, anakütle ortalamasının

H0 ret H0 reddedilemez H0 ret

100’den anlamlı derecede farklı olan değerler

100’den anlamlı derecede

Sıfır hipotezi Tip I hata Doğru karar

3) n >= 30 iken, σ bilinmiyorsa,

Test istatistiği ret bölgesine düşüyorsa, sıfır

Test istatistiği ret bölgesine düşmüyorsa,

1. Adım: Hipotezlerin belirlenmesi µ=100mm

1.6 .4505 .4515 .4525

 1.9 .4744 .4750 .4756

• Bir kutu mısır gevreğinin ağırlığının üzerinde yazan 368

H0: µ = 368 Test İstatistiği:

1) Örnek, bir basit şans örneğidir.

3) Anakütle standart sapması σ bilinmemektedir.

4) Anakütlenin dağılışı normaldir.

normal dağılışı kullanın

Evet normal dağılışı kullanın

Student t dağılışını kullanın

H 0 : π = 0,95 α = 0.01 p = 184 / 200 = 0.92

H1 : π ≠ 0,95 Z tab = ±2.58

1. İki örnek bağımsızdır.