Download as pdf or txt
Download as pdf or txt
You are on page 1of 406

Yrd.Doç.Dr.

İstem Köymen KESER


BİR POPULASYON VARYANSI İÇİN GÜVEN
ARALIKLARI
Bir anakütle varyansı için de güven aralığı bulmak gerekebilir.
Bu tahminler örneklem varyansına dayanır.

Varyansı σ 2 olan bir normal anakütleden n gözlemli rassal bir


örneklem seçilsin. Örneklem varyansı da S2 ile gösterilsin.

(n − 1) S x2
χ n2−1 =
σ2
Rassal değişkeni, (n-1) serbestlik dereceli ki-kare dağılımına
uymaktadır. Bu bulgu, normal bir dağılımdan örneklem
alındığında anakütle varyansı için güven aralıklarının
türetilmesinin temelini oluşturur.
Örneklem varyansının gözlenen belli değeri s x2 ise, anakütle
varyansının güven aralığı aşağıdaki gibidir:
 
 ( n − 1) S ( n − 1) S 
2 2
2
P 2
<σ < 2  1 α
=−
χα χ α
 , n −1 1− , n −1 
 2 2 
Örneğin α=0.05 n=10 olsun

Red
Bölgesi Red Bölgesi
1-α

χ21−α/2 , n−1 χ2α/2, n−1


χ 2
0.975;9 χ 2
0.025;9
Örnek
Bir çimento fabrikasında üretilen çimentodan yapılan betonların
sağlamlığının incelenmesi amacıyla 10 beton örneği alınmış ve bu
örneklerin sağlamlılıkları saptanmıştır. Bu örneklerin ortalama ve
varyansı
= x 312= S 2 195 olarak bulunmuştur. Fabrikanın ürettiği
tüm betonların varyansına ilişkin güven aralığını hesaplayınız.
1−α =
0.90 α=0.10

Red
Red Bölgesi
Bölgesi

χ 2 1− α/2, n−1 χ 2 α/2, n−1


χ 0.95;9
2
= 3.33 χ 0.05;9
2
= 16.92 4
1−α =
0.90 α = 0.10 =x 312
= S 2 195
 
 ( n − 1) S ( n − 1) S 
2 2
2
P 2
<σ < 2  1 α
=−
χα χ α
 , n −1 1− , n −1 
 2 2 
 9 (195 ) 9 (195 ) 
P 2 <σ < 2  =
2
0.90 1-α

 χ 0.05;9 χ 0.95;9  χ2α/2, n−1


3.33 16.92

S2
103.72 527.02
 9 (195 ) 9 (195 ) 
P <σ <
2
=0.90
 16.92 3.33 

P (103.72 < σ 2 < 527.02 ) =


0.90
5
ÖRNEK
Denenen bir motorun 16 deneme sürüşündeki yakıt tüketimlerinin standart
sapması 2.2 golondur. Motorun yakıt tüketiminin gerçek değişkenliğini ölçen
anakütle varyansının % 99 güven aralığını hesaplayınız. n=16 s=2.2

Red
Bölgesi Red Bölgesi

χ21−α/2,n−1 χ2α/2,n−1
 2 2

 (n − 1) s (n − 1) s 
P 2 <σ < 2
2
 = 1−α
χα χ α
 2 ,n −1 1− , n −1 
2 
n=16 S=2.2
α = 0.01
χ 02.005,15 = 32.80
2
χ 0.995,15 = 4.60
 2 2

 (n − 1) S (n − 1) S 
P 2 <σ2 < 2  1 α
=−
χα χ α
 2 ,n−1 1− ,n −1 
2 

15(2.2) 2 15( 2 . 2 ) 2

P <σ <
2
 = 0.99
 32.80 4.60 

[ ]
P 2.21 < σ 2 < 15.78 = 0.99
IBF 1008
İSTATİSTİK-II
UYGULAMA SORULARI

ARŞ. GÖR. HATEM ÇOBAN

Dokuz Eylül Üniversitesi


İktisadi ve İdari Bilimler Fakültesi
Ekonometri Bölümü
İstatistik Anabilim Dalı

30 Mart 2020
İzmir
İçindekiler

1 Güven Aralıkları 1
1.1 Popülasyon Ortalaması ve Oranı İçin Büyük Örnek Güven Aralığı . . . . . . . . . . . . 1
1.1.1 Popülasyon Ortalaması (µ) için Güven Aralığı . . . . . . . . . . . . . . . . . . 1
1.1.2 İki Popülasyon Ortalaması Arasındaki Fark (µ1 − µ2 ) için Güven Aralığı (ba-
ğımsız örnekler) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.3 Popülasyon Oranı π için Güven Aralığı . . . . . . . . . . . . . . . . . . . . . . 4
1.1.4 İki Popülasyon Oranı Arasındaki Fark (π1 − π2 ) için Güven Aralığı . . . . . . . 4
1.2 Popülasyon Ortalaması İçin Küçük Örnek Güven Aralıkları . . . . . . . . . . . . . . . . 5
1.2.1 Populasyon Ortalaması (µ) için Güven Aralığı . . . . . . . . . . . . . . . . . . 5
1.2.2 İki Populasyon Ortalaması Arasındaki Fark (µ1 − µ2 ) için Güven Aralığı . . . . 6
1.2.2.1 Eşleştirilmiş Gözlemlerde . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2.2.2 Eşleştirilmemiş(bağımsız) Gözlemlerde . . . . . . . . . . . . . . . . 7
1.3 Popülasyon Varyansı(σ 2 ) için Güven Aralığı . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.1 Tek Popülasyon Varyansı(σ 2 ) için Güven Aralığı . . . . . . . . . . . . . . . . . 8
σ2
1.3.2 İki Popülasyon Varyansının Oranı σ12 için Güven Aralığı . . . . . . . . . . . . . 8
2
1.4 Örnek Büyüklüğünün Tespiti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.4.1 Popülasyon Ortalamasının Kullanılması . . . . . . . . . . . . . . . . . . . . . . 9
1.4.2 Popülasyon Oranının Kullanılması . . . . . . . . . . . . . . . . . . . . . . . . . 10

2 Hipotez Testleri 11

Kaynaklar 11
SORULAR

1 Güven Aralıkları

1.1 Popülasyon Ortalaması ve Oranı İçin Büyük Örnek Güven Aralığı


1.1.1 Popülasyon Ortalaması (µ) için Güven Aralığı

1. Bir bankada birgün içinde açılan vadeli TL hesaplarının ortalamasını incelemek amacıyla yapılan
bir araştırma yapılmıştır. 12 günlük incelemenin sonunda vadeli hesapların ortalaması 5250 TL
olduğu görülmüştür. Daha önceki çalışmalardan populasyon standart sapmasının 350 TL olduğu
bilindiğine göre, ana kütle ortalaması için %95’lik güven aralığını oluşturup yorumlayınız.
Çözüm: Soruda verilenleri istatistik terimleriyle ifade edersek, α = 0.05 −→ α2 = 0.025, n = 12,
x = 5250, σ = 350, ana kütle varyansı bilindiğine göre α değeri için bakmamız gereken tablo z
tablosudur.

 
 σ σ
Pr x − zα/2 σx̄ ≤ µ ≤ x + zα/2 σx̄ = Pr x − zα/2 √ ≤ µ ≤ x + zα/2 √ = 1−α
n n
 
350 350
= Pr 5250 − 1.96 √ ≤ µ ≤ 5250 + 1.96 √ = 0.95
12 12
= Pr(5051.969 ≤ µ ≤ 5448.031) = 0.95

Yorum: %95 güvenle ana kütle ortalaması µ, 5051.969 ile 5448.031 arasında yer almaktadır.

2. Özel bir hastahane hastalarının ortalama kalış süresini tahmin etmek istemektedir. Bu amaçla has-
tane rastgele olarak hastalardan n = 100 kişi seçmiş ve örnek ortalama kalış süresinin 4.5 gün
olduğunu tespit etmiştir. Ayrıca, tüm hastanedeki hastalar için kalış süresinin standart sapmasının
σ = 4 gün olduğu bildiğine göre, ana kütle ortalaması için %90’lık güven aralığını oluşturup yo-
rumlayınız.
Çözüm: soruda verilenleri istatistik terimleriyle ifade edersek, α = 0.10 −→ α2 = 0.05, n = 100,
x = 4.5, σ = 4, ana kütle varyansı bilindiğine göre α değeri için bakmamız gereken tablo z tablo-
sudur.

IBF 1008 İstatistik-II 1 ARŞ. GÖR. HATEM ÇOBAN


 
 σ σ
Pr x − zα/2 σx̄ ≤ µ ≤ x + zα/2 σx̄ = Pr x − zα/2 √ ≤ µ ≤ x + zα/2 √ = 1−α
n n
 
4 4
= Pr 4.5 − 1.645 √ ≤ µ ≤ 4.5 + 1.645 √ = 0.90
100 100
= Pr(3.842 ≤ µ ≤ 5.158) = 0.90

Yorum: %90 güvenle ana kütle ortalaması µ, 3.842 ile 5.158 arasında yer almaktadır.

3. Uçuşlardaki boş koltuklar havayolu şirketlerinde gelir kaybına neden olur. Büyük bir havayolu
şirketinin geçen yıl boyunca uçuş başına ortalama boş koltuk sayısını tahmin etmek istemektedir.
Bunu gerçekleştirmek için 225 uçuşun kayıtları rastgele seçilmiş ve örneklenen uçuşların her biri
için boş koltuk sayısı not edilmiş. Verilerin ortalaması 11.6 ve standart sapması ise 4.1 olduğuna
göre, buna göre ana kütle ortalaması için %90’lık güven aralığını oluşturup yorumlayınız.
Çözüm: soruda verilenleri istatistik terimleriyle ifade edersek, α = 0.10 −→ α2 = 0.05, n = 225,
x = 4.5, s = 4.1, ana kütle varyansı BİLİNMEMEKTEDİR fakat örnek hacmi n = 225 > 30 oldu-
ğundan α değeri için bakmamız gereken tablo z tablosudur.

 
 s s
Pr x − zα/2 σx̄ ≤ µ ≤ x + zα/2 σx̄ = Pr x − zα/2 √ ≤ µ ≤ x + zα/2 √ = 1−α
n n
 
4.1 4.1
= Pr 11.6 − 1.645 √ ≤ µ ≤ 11.6 + 1.645 √ = 0.90
225 225
= Pr(11.15 ≤ µ ≤ 12.05) = 0.90

Yorum: %90 güvenle ana kütle ortalaması µ, 11.15 ile 12.05 arasında yer almaktadır.

1.1.2 İki Popülasyon Ortalaması Arasındaki Fark (µ1 − µ2 ) için Güven Aralığı (bağımsız örnek-
ler)

1. Bir diyetisyen, yağ, karbonhidrat ve kolesterol bakımından düşük bir diyet geliştirmiştir. Diyet
başlangıçta kalp hastalığı olan kişiler tarafından kullanılmak üzere tasarlanmış olsa da, diyetis-
yen bu diyetin obez insanların ağırlıkları üzerindeki etkisini incelemek istemektedir. Her biri 100
obez kişiden oluşan iki rastgele örnek seçilir ve 100’lük bir grup az yağlı diyete yerleştirilir. Diğer
100 tanesi yaklaşık olarak aynı miktarda yiyecek içeren, ancak yağ, karbonhidrat ve kolesterol
bakımından düşük olmayan bir diyete yerleştirilir. Her bir kişi için üç haftalık bir sürede kaybedi-
len (veya alınan) kilo miktarı kaydedilir. Birinci grubun ortalaması 9.31 ve standart sapması 4.67
iken ikinci grubun ortalaması 7.40 ve standart sapması 4.04 olarak elde edilmiştir. Buna göre iki
popülasyon için ortalama kilo kaybı arasındaki farkın %95’lik güven aralığı oluşturup sonucunu
yorumlayınız.
Çözüm: soruda verilenleri istatistik terimleriyle ifade edersek, α = 0.05 −→ α2 = 0.025, n1 =
100, x1 = 9.31, s21 = 4.67, n2 = 100, x2 = 7.40, s22 = 4.04, ve ana kütle varyansları BİLİNMEMEK-
TEDİR fakat örnek hacimleri n1 = n2 = 100 > 30 olduğundan α değeri için bakmamız gereken

IBF 1008 İstatistik-II 2 ARŞ. GÖR. HATEM ÇOBAN


tablo z tablosudur.


Pr x1 − x2 − zα/2 σx1 −x2 ≤ µ1 − µ2 ≤ x1 − x2 + zα/2 σx1 −x2 = 1 − α
s s
s21 s22 s21 s22
 
Pr x1 − x2 − zα/2 + ≤ µ1 − µ2 ≤ x1 − x2 + zα/2 + = 1−α
n1 n2 n1 n2

r
(4.67)2 (4.04)2
:= (9.31 − 7.40) ∓ 1.96 + = 1.91 ∓ 1.96(0.62),
100 100
= Pr(0.69 ≤ µ1 − µ2 ≤ 3.13) = 0.95

Yorum: %95 güvenle popülasyon ortalamarı arasındaki fark µ1 − µ2 , 0.69 ile 3.13 değerleri ara-
sında yer almaktadır.

2. Birbirine rakip iki bilgisayar firmasının her türlü işlem için merkezi işlem birimindeki(CPU) işlem
sürelerinin varyansları sırasıyla 3 ve 2.1 değerinde olduğu bilinmektedir. Oldukça uzun işlem sü-
resine sahip olabilecek bir yapay sinir ağı kodu yazan bir kullanıcı grubu birinci firmaya ait 148
bilgisayarda kodlarını çalıştırmış ve ortalama 15.2 saniyede işlemleri sonlanmıştır. Diğer taraftan
bu grup ikinci firmaya ait 135 bilgisayarı seçip kodlarını çalıştırmış ve ortalama 11.3 saniyede
işlemleri sonlanmıştır. İki popülasyon arasındaki fark için %99’luk güven aralığını oluşturup yo-
rumlayınız.
Çözüm: Soruda verilenleri istatistik sempolleriyle ifade edersek, n1 = 148, n2 = 135, x1 = 15.2,
x2 = 11.3, σ12 = 3, σ22 = 2.1, α = 0.01 −→ α2 = 0.005 olur. Ana kütle varyansları bilindiğine göre
α için bakmamız gerek tablo z tablosudur.


Pr x1 − x2 − zα/2 σx1 −x2 ≤ µ1 − µ2 ≤ x1 − x2 + zα/2 σx1 −x2 = 1 − α
s s
σ12 σ22 σ12 σ22
 
Pr x1 − x2 − zα/2 + ≤ µ1 − µ2 ≤ x1 − x2 + zα/2 + = 1−α
n1 n2 n1 n2

IBF 1008 İstatistik-II 3 ARŞ. GÖR. HATEM ÇOBAN


r
3 2.1
:= (15.2 − 11.3) ∓ 2.575 + = 3.9 ∓ 2.575(0.189),
148 135
= Pr(3.413 ≤ µ1 − µ2 ≤ 4.387) = 0.99

Yorum: %99 güvenle popülasyon ortalamarı arasındaki fark µ1 − µ2 , 3.413 ile 4.387 değerleri
arasında yer almaktadır

1.1.3 Popülasyon Oranı π için Güven Aralığı

1. Bir şirket, cumhurbaşkanına güvenen ABD vatandaşlarının oranını tahmin etmek için düzenli ola-
rak kamuoyu yoklaması gerçekleştirmektedir. Yapılan bir yoklamada 1000 kişi rasgele seçilmiş ve
637 kişi başkana güvendiklerini söylemiştir. Cumhurbaşkanı’na güvenen tüm ABD vatandaşları-
nın gerçek oranı için %95’lik güven aralığını oluşturup yorumlayınız.
α x
Çözüm: Soruda verilenleri özetlersek, α = 0.05  −→ 2 =0.025, x = 637, n = 1000, p̂ = n ⇒
637 π(1 − π)
p̂ = 1000 = 0.637, q̂ = 1 − p̂ = 0.363, p̂ ∼ N π, olduğundan α değeri için bakmamız
n
gereken tablo z tablosudur.

 r r 
 p̂q̂ p̂q̂
Pr p̂ − zα/2 σ p̂ ≤ π ≤ p̂ + zα/2 σ p̂ = Pr p̂ − zα/2 ≤ π ≤ p̂ + zα/2 = 1−α
n n

 
p p
= Pr 0.637 − 1.96 0.637 0.363/1000 ≤ π ≤ 0.637 + 1.96 0.637 0.363/1000 = 0.95

= Pr(0.607 − 1.96 0.03 ≤ π ≤ 0.607 + 1.96 0.03) = 0.95


= Pr(0.607 ≤ π ≤ 0.667) = 0.95

Yorum: %95 güvenle popülasyon oranı π, 0.607 ile 0.667 değerleri arasında yer almaktadır.

1.1.4 İki Popülasyon Oranı Arasındaki Fark (π1 − π2 ) için Güven Aralığı

1. Kalabalık bir ilde bir başkan adayı şehrin kuzeydoğudaki kayıtlı seçmenlerin tercihlerini güneydo-
ğusundaki seçmenlerle karşılaştırmak istemektedir. Böyle bir karşılaştırmayla, kampanya çabaları-
nın nerede daha fazla yoğunlaştırması gerektiğini belirlemede yardımcı olacaktır. Aday, kuzeydo-
ğuda 1.000, güneydoğuda 1.000 kayıtlı rasgele seçmen seçmek ve oy kullanma tercihini öğrenmek
için her biri ile görüşmek üzere profesyonel bir anketör kiralar. Şehrin kuzeydoğusunda 546, gü-
ney doğusunda 475 kişi aday lehine oy kullanacağını belirtmiştir. Buna göre, iki popülasyon oranı
arasındaki farkın %95’lik güven aralığını oluşturup yorumlayınız.
Çözüm: Soruda verilenleri özetleyelim:α = 0.05 −→ α2 = 0.025,
x1 = 546, n1 = 1000, x2 = 475, n2 = 1000,
x1 546
p̂1 = ⇒ p̂1 = = 0.546, q̂1 = 1 − p̂1 = 0.454,
n1 1000

IBF 1008 İstatistik-II 4 ARŞ. GÖR. HATEM ÇOBAN


x2 475
p̂2 = ⇒ p̂2 = = 0.475, q̂2 = 1 − p̂2 = 0.525,
n2  1000 
π1 (1 − π1 ) π2 (1 − π2 )
p̂1 − p̂2 ∼ N π1 − π2 , + olduğundan α değeri için bakmamız gereken
n1 n2
tablo z tablosudur.


Pr p̂1 − p̂2 − zα/2 σ p̂1 − p̂2 ≤ π1 − π2 ≤ p̂1 − p̂2 + zα/2 σ p̂1 − p̂2 = 1 − α
 r r 
p̂1 q̂1 p̂2 q̂2 p̂1 q̂1 p̂2 q̂2
Pr p̂1 − p̂2 − zα/2 + ≤ π1 − π2 ≤ p̂1 − p̂2 + zα/2 + = 1−α
n1 n2 n1 n2
r
0.546 0.454 0.475 0.525
:= (0.546 − 0.475) ∓ 1.96 + = (0.546 − 0.475) ∓ 0.044
1000 1000
= Pr(0.071 − 0.044 ≤ π1 − π2 ≤ 0.071 + 0.044) = 0.95
= Pr(0.027 ≤ π1 − π2 ≤ 0.115) = 0.95

Yorum: %95 güvenle popülasyon oranıları arasındaki fark π1 − π2 , 0.027 ile 0.115 değerleri ara-
sında yer almaktadır. Şehrin kuzeydoğusunda, adayı için oy vermeyi planlayan güneydoğuya göre
%2.7 ile %11.5 arasında daha fazla kayıtlı seçmen olduğunu görülmektedir. Adayın güneydoğuda
kuzeydoğuya göre daha büyük bir kampanya çalışması yürütmesi gerektiği anlaşılıyor.

1.2 Popülasyon Ortalaması İçin Küçük Örnek Güven Aralıkları


1.2.1 Populasyon Ortalaması (µ) için Güven Aralığı

1. Yeni bir ilaç alan hastaların kan basıncındaki ortalama artışın bir tahminini isteyen ilaç şirke-
tini,insan test fazındaki n = 6 hasta için kan basıncı artışlarını ölçmüştür. Hastalara ait ortalama
kan basıncı artışı 2.283 ve standart sapması 0.95 elde edilmiştir. Buna göre, popülasyon ortalaması
için %95’lik güven aralığını oluşturup yorumlayınız.
Çözüm: Soruda verilenlere baktığımızda α = 0.05 −→ α/2 = 0.025 n = 6 , bunlarla birlikte po-
pülasyon varyansı BİLİNMEMEKTE ve örnek hacmi n = 6 < 30 olduğu görülmektedir. Dolayı-
sıyla bakmamız gereken tablo t tablosudur. Burada serbestlik derecesi v = n − 1 = 6 − 1 = 5 ve
α/2 = 0.025 olduğundan t tablosunda t5,0.025 değerini bulmamız gerekir. Tablo değerimiz t5, 0.025 =

2.571’dir.

IBF 1008 İstatistik-II 5 ARŞ. GÖR. HATEM ÇOBAN


 
 s s
Pr x − tv, α/2 σx̄ ≤ µ ≤ x + tv, α/2 σx̄ = Pr x − tv, α/2 √ ≤ µ ≤ x + tv, α/2 √ = 1−α
n n

 
0.95 0.95
= Pr 2.283 − 2.571 √ ≤ µ ≤ 2.283 + 2.571 √ = 0.95
6 6
= Pr(2.283 − 0.997 ≤ µ ≤ 2.283 + 0.997) = 0.95
= Pr(1.286 ≤ µ ≤ 3.280) = 0.95

Yorum: Bu yeni ilacı almakla ilişkili kan basıncındaki ortalama artış µ, %95 güvenle 1.286 ile
3.28 puan arasındadır.

1.2.2 İki Populasyon Ortalaması Arasındaki Fark (µ1 − µ2 ) için Güven Aralığı

1.2.2.1 Eşleştirilmiş Gözlemlerde


1. Bir yakıt üretim firması otomobillerde kullanılan yakıta bir madde ekleyerek yakıtın performans
açısından iyileştiğini test etmek istemektedir. Bunun için 8 adet otomobil rastgele seçilerek eski ve
yeni yakıt kullanım sonucunda aşağıdaki performans tablosu oluşturulmuştur. Buna göre her iki
popülasyon ortalamsının normal dağıldığı varsayımı altında yeni yakıt ve eski yakıt arasındaki ana
kütle ortalama farkının %99’luk güven aralığını oluşturup yorumlayınız.

Eski Yakıt 19.4 18.8 20.6 17.6 19.2 20.9 18.3 20.4
Yeni Yakıt 19.6 17.5 18.4 17.5 18 20 18.8 19.2

Çözüm: Soruda verilenleri özetlersek, ana kütle varyansları bilinmiyor, normallik varsayımı ve-
rilmiş ve eşleştirilmiş bir gözlem grubu ile karşı karşıta olduğumuz görülmektedir. α = 0.01 −→
α/2 = 0.005, n = 8 < 30 olduğundan α değeri için bakmamız gereken tablo t tablosudur.

t8−1,0.005 = t7,0.005 = 3.499

 sd sd 
Pr d −tv,α/2 σd ≤ µ1 − µ2 ≤ d +tv,α/2 σd = Pr d −tn−1,α/2 √ ≤ µ1 − µ2 ≤ d +tn−1,α/2 √ = 1 − α
n n

1 n 1 n n
 
1
q
d = ∑ di , s2d = ∑ (di − d)2 = ∑ di2 − n(d)2 , sd = s2d
n i=1 n − 1 i=1 n−1 i=1

olduğuna göre bu değerleri elde etmeliyiz.

Eski Yakıt 19.4 18.8 20.6 17.6 19.2 20.9 18.3 20.4
Yeni Yakıt 19.6 17.5 18.4 17.5 18 20 18.8 19.2
Fark di -0.2 1.3 2.2 0.1 1.2 0.9 -0.5 1.2

1 8 1 8
q √
d = ∑ di = 0.775, s2d = ∑ (di − d)2 = 0.816, sd = s2d = 0.816 = 0.903
8 i=1 7 i=1

IBF 1008 İstatistik-II 6 ARŞ. GÖR. HATEM ÇOBAN


 
0.903 0.903
Pr 0.775 − 3.499 √ ≤ µ1 − µ2 ≤ 0.775 + 3.499 √ = 0.99
8 8

Pr − 0.342 ≤ µ1 − µ2 ≤ 1.892 = 0.99

Yorum: Aralık şu şekilde yorumlanabilir: .95’e eşit bir güven katsayısı ile, yeni yakıt ile eski ya-
kıt kullanımı arasındaki ortalama performans değerleri arasındaki fark −0.342 ile 1.892 aralığına
düşmektedir.Başka bir deyişle, yeni yakıtın ortalama performans değeri, eski yakıtınn ortalama
performans değerinden 0.342’den daha az, 1.892 değerinden daha fazla olacağı tahmin edilmekte-
dir (%95 güven ile).

1.2.2.2 Eşleştirilmemiş(bağımsız) Gözlemlerde


1. "Yavaş öğrenenlere" okumayı yeni bir öğretim yöntemi ile mevcut standart yöntemle karşılaştır-
mak istemektedir. Bu karşılaştırma için altı aylık bir öğrenme süresinin sonunda verilen okuma
testi sonuçları kullanılacaktır. 1000 kişilik “yavaş öğrenen” rastgele bir örneklemden 10’u yeni
yöntemle, 12’si de standart yöntemle 22 çocuğa da belirlenen altı aylık süre boyunca benzer ko-
şullar altında kalifiye eğitmenler tarafından eğitim verilmektedir. Eğitim sonucunda yeni yöntemle
eğitim görenlerin test skorlarının ortalaması 76.4 standart sapması 5.835 iken standart yöntemle
eğitim görenlerin test skorlarının ortalaması 72.333 standart sapması 6.344 olmuştur. Buna göre
her iki popülasyonun yaklaşık normal dağıldığı ve populasyon varyanslarının eşit olduğu varsa-
yımı altında, yeni yöntem ve standart yöntemle eğitim görenlerin arasındaki ana kütle ortalama
farkının %95’lik güven aralığını oluşturup yorumlayınız.
Çözüm: Soruda verilenlere göre, n1 = 10, n2 = 12, x1 = 76.4, x2 = 72.333, s1 = 5.835, s2 = 6.344,
α = 0.05 −→ α/2 = 0.025 olur. Buna göre n1 = 10 < 30, n2 = 12 < 30, her iki ana kütlenin yak-
laşık normal dağıldığı ve ana kütle varyanslarının eşit olduğu soruda verilmiş bu nedenle α için
bakmamız gerek tablo t tablosudur. Bu soru eşleştirilmemiş(bağımsız) gözlemler için anakütleler
arasındaki farkın güven aralığını bulma problemidir.

Pr (x1 − x2 ) − tv,α/2 σx1 −x2 ≤ µ1 − µ2 ≤ (x1 − x2 ) + tv,α/2 σx1 −x2 = 1 − α
s 
(n1 − 1)s21 + (n2 − 1)s22

1 1
σx1 −x2 = s2p + , s2p = , tv,α/2 = tn1 +n2 −2,α/2
n1 n2 n1 + n2 − 2
tn1 +n2 −2,α/2 = t10+12−2,0.025 = t20,0.025 = 2.086

(n1 − 1)s21 + (n2 − 1)s22


s2p =
n1 + n2 − 2
(10 − 1)(5.385)2 + (12 − 1)(6.344)2
= = 37.45
10 + 12 − 2

Pr (x1 − x2 ) − tv,α/2 σx1 −x2 ≤ µ1 − µ2 ≤ (x1 − x2 ) + tv,α/2 σx1 −x2 = 0.95

IBF 1008 İstatistik-II 7 ARŞ. GÖR. HATEM ÇOBAN


s   s  
2
1 1 1 1
(x1 − x2 ) ∓ tv,α/2 s p + = (76.4 − 72.333) ∓ tv,α/2 37.45 +
n1 n2 10 12
= 4.07 ∓ 2.086(2.62)


Pr 4.07 − 2.086(2.62) ≤ µ1 − µ2 ≤ 4.07 + 2.086(2.62) = 0.95

Pr − 1.4 ≤ µ1 − µ2 ≤ 9.54 = 0.95

Yorum: Aralık şu şekilde yorumlanabilir: .95’e eşit bir güven katsayısı ile, yeni öğretim yöntemini
kullanma ile standart yöntemi kullanma arasındaki ortalama test puanları arasındaki fark −1.4
ile 9.54 aralığına düşmektedir.Başka bir deyişle, yeni yöntemin ortalama test puanının, standart
yöntemin ortalama test puanından 1.4 puandan daha az, 9.54 puandan daha fazla olacağı tahmin
edilmektedir (%95 güven ile).

1.3 Popülasyon Varyansı(σ 2 ) için Güven Aralığı


1.3.1 Tek Popülasyon Varyansı(σ 2 ) için Güven Aralığı

1. Çelik tel üreten bir şirketinin yöneticisi, firmanın yeni elektrikli fırınındaki sıcaklık değişkenli-
ğini değerlendirmek istiyor. Sıcaklık değerlerinin normal olarak dağıldığı bilinmektedir. 1 haftalık
bir süre zarfında 25 sıcaklıktan oluşan rastgele bir örnek seçildiğinde örneğin ortalaması 12.6 ve
varyansı 100 olarak bulunuyor. Popülasyon varyans sıcaklığı için %95’lik güven aralığı bulup yo-
rumlayınız.
Çözüm:Soruda verilenlere göre, n = 25, x = 12.6, s2 = 100, α = 0.05 −→ α/2 = 0.025 olur.
Popülasyon varyansı için güven aralığını oluşturacağımıza göre α değeri için bakmamız gerekn
tablo χ 2 tablosudur. χ 2 dağılışı simetrik olmadığından χv,α/2
2 2
ve χv,1−α/2 değerlerine bakmalıyız.
2 2
v = n − 1 = 25 − 1 = 24 olduğundan χ24,0.025 = 39.364 ve χ24,0.975 = 12.401 bulunur.

(n − 1)s2 (n − 1)s2
 
2
Pr 2
≤ σ ≤ 2
= 1 − α olduğundan,
χv,α/2 χv,1−α/2
 
(24)100 2 (24)100
Pr ≤σ ≤ = Pr(60.97 ≤ σ 2 ≤ 153.93) = 0.95
39.364 12.401

Yorum: %95 güvenle popülasyon varyansı 60.97 ile 153.93 değerleri arasında yer almaktadır.

σ12
1.3.2 İki Popülasyon Varyansının Oranı σ22
için Güven Aralığı

1. Pazara sunulan iki ayrı bağımsız hisse senedinin değişkenliklerini değerlendirmek isteyen bir yatı-
rımcı, bu hisse senetlerine ilişkin bazı istatistikler elde etmiştir. Birinci hisse senedine ait 17 günlük
bir örnek seçmiş ortalama 12.23 ve varyansını 123.38 elde ederken, ikinci hisse senedine ait 11
günlük bir örnek için ortalama 6.27 ve varyansını 8.02 bulmuştur. Her iki hisse senedinin dağı-
lışı normal ve örnekler birbirinden bağımsız seçildiğine göre popülasyon varyanslarının oranı için

IBF 1008 İstatistik-II 8 ARŞ. GÖR. HATEM ÇOBAN


%90’lik güven aralığını elde ediniz.
Çözüm: Soruda verilenlari istatistik sembolleriyle ifade edelim:
n1 = 17, x1 = 12.23, s21 = 123.38, n1 = 11, x2 = 6.27, s22 = 8.02, α = 0.10, α/2 = 0.05 İki
varyansın oranı F dağılışı gösterdiği için α değeri için bakmamız gereken tablo Ftablosudur.
v1 = n1 − 1 v2 = n2 − 1 olmak üzere,

s21 σ12 s21


 
Pr 2 Fv1 ,v2 :1−α/2 ≤ 2 ≤ 2 Fv1 ,v2 :α/2 = 1 − α
s2 σ2 s2

1
ve Fv1 ,v2 :1−α/2 = olduğundan,
Fv2 ,v1 :α/2

s21 σ12 s21


 
1
Pr 2 ≤ ≤ 2 Fv1 ,v2 :α/2 = 1 − α
s2 Fv2 ,v1 :α/2 σ22 s2

1
F16,10;0.05 = 2.83, F10,16;0.05 = 2.49 ve böylece F16,10;0.95 = = 0.40 olur.
2.49
 2
σ2 s2

s 1
Pr 12 ≤ 12 ≤ 12 Fv1 ,v2 :α/2 = 1 − α
s2 Fv2 ,v1 :α/2 σ2 s2
σ2
 
123.38 1 123.38
Pr ≤ 12 ≤ 2.83 = 0.95
8.02 2.49 σ2 8.02
σ2
 
Pr 15.384(0.40) ≤ 12 ≤ 15.384(2.83) = 0.95
σ2
σ2
 
Pr 6.154 ≤ 12 ≤ 43.537 = 0.95
σ2

Yorum: %95 güvenle iki popülasyon varyansının oranı 6.154 ile 43.537 değerleri arasında yer
almaktadır.

1.4 Örnek Büyüklüğünün Tespiti


1.4.1 Popülasyon Ortalamasının Kullanılması

1. Endüstriyel bir işlemle üretilen metal çubukların uzunlukları 1.8 mm standart sapma ilenormal
dağılmaktadır. Bu popülasyondan dokuz gözlemin rastgele bir örneğine dayanarak, popülasyon
ortalama uzunluğunun 194.65 ile 197.75 arasında %99’luk bir güven aralığı bulunmuştur. Bir üre-
tim yöneticisinin aralığın pratik kullanım için çok geniş olduğuna inandığını ve bunun yerine örnek
ortalamanın her bir tarafında en fazla 0.50 mm’yi kapsayan %99’luk bir güven aralığı gerektirdi-
ğini belirtmektedir. Böyle bir aralığı elde etmek için ne kadar büyüklükte örnek gerekir?
Çözüm: Soruda verilenlere göre α = 0.01, ⇒ α/2 = 0.005, σ = 1.8,Ana kütle varyansı bilindiği

IBF 1008 İstatistik-II 9 ARŞ. GÖR. HATEM ÇOBAN


için α için bakılması gereken tablo z tablosudur. zα/2 = z0.005 = 2.575 olur. Örnekleme hatası (SE)
veya tolerans değeri(d) 0.50 olması isteniyor.

 
σ σ
Pr x − zα/2 √ ≤ µ ≤ x + zα/2 √ = 1−α
n n
| {z } | {z }
SE SE

olduğundan
σ z2α/2 σ 2
SE = zα/2 √ ⇒ n =
n (SE)2
elde edilir. Dolayısıyla
z2α/2 σ 2 (2.575)2 (1.8)2
n= = ≈ 86
(SE)2 (0.5)2
bulunur.

1.4.2 Popülasyon Oranının Kullanılması

1. Bir araştırmacı ev bilgisayarına sahip olanların oranını %95 güvenle tahmin etmek istemektedir.
Önceki bir çalışma, görüşülenlerin %40’ının evde bir bilgisayarı olduğunu göstermektedir. Araştır-
macı örnek oranın en fazla %2’si içinde kalmak istediğine göre gerekli minimum örnek büyüklüğü
kaçtır?
Çözüm: Popülasyon oranı (π) için güven aralığı;
 r r 
p̂(1 − p̂) p̂(1 − p̂)
Pr p̂ − zα/2 ≤ π ≤ p̂ + zα/2 = 1−α
| {z n } | {z n }
SE SE

olduğundan r
p̂(1 − p̂) (zα/2 )2 p̂(1 − p̂)
SE = zα/2 ⇒n=
n (SE)2
elde edilir. Bu durumda literatürde iki farklı yaklaşım sergilenmektedir. Birinci yaklaşımda p̂ bi-
lindiği için bunun direk olarak n formülünde kullanılmasıdır. Diğeri ise p̂ bilinmiyorsa bu değeri
p̂ = 0.5 almaktır. Bunun nedeni p̂(1 − p̂) çarpımının en büyük değeri 0.25 olmasıdır. Bu değer,
güven aralığı ve tahmin hatası göz önüne alındığında, doğru bir tahmin sağlamak için yeterince
büyük bir örnek boyutu verecektir.
Bu yüzden, SE = 0.02, α = 0.05 ⇒ α/2 = 0.025, z0.025 = 1.96, p̂ = 0.4, 1 − p̂ = 0.6 ise,

IBF 1008 İstatistik-II 10 ARŞ. GÖR. HATEM ÇOBAN


birinci yaklaşım kullanılırsa örnek hacmi,

(1.96)2 (0.4)(0.6)
n= = 2304.96 ≈ 2305
(0.02)2

ikinci yaklaşım kullanılırsa örnek hacmi,

(1.96)2 (0.5)(0.5)
n= = 2401
(0.02)2

bulunur. İkinci yaklaşım daha garanti gösteren bir yaklaşımdır.Dolayısıyla çok tercih edilmektedir.
Fakat p̂ bilindiğinde ihtiyaçtan daha fazla örnek seçilebilmektedir.

2 Hipotez Testleri

Kaynaklar
[1] A. Bluman. Elementary Statistics: A Step By Step Approach. McGraw-Hill Higher Education, 2014.

[2] J.T. McClave ve T.T. Sincich. Statistics, Global Edition. Pearson Education Limited, 2017.

[3] P. Newbold, B. Thorne, ve W. Carlson. Statistics for Business and Economics. Pearson Education,
2013.

IBF 1008 İstatistik-II 11 ARŞ. GÖR. HATEM ÇOBAN


II.Tip Hata

Örnek 1. Büyük bir enerji üreticisi firma yeni bir nükleer santral kurmuştur. Bu santral Atlantik Ok-
yanusu’na dökülmesine izin verilen atık su boşaltmaktadır. Boşaltılan su sıcaklık değerlerinin normal
dağıldığı bilinmektedir. Çevre Koruma Ajansı, santral yakınındaki marinanın termal kirliliğinin engel-
lenmesi için atık suyun sıcaklığının çok fazla olmaması gerektiğini belirtmiştir. Boşaltılan suyun sıcaklığı
60 derece veya daha az ise soğutma sisteminin doğru çalıştığı anlaşılmaktadır. Bunu test etmek amacıyla
rassal olarak seçilen 36 sıcaklık değerinin ortalaması 60.5 ve standart sapması 2 olarak elde edilmiştir.

a) %3 önem seviyesinde ortalama su sıcaklığının 60 dereceden fazla olduğu söylenebilir mi?

b) Eğer gerçek su sıcaklığı 61 derece anlaşıldığında II. Tip hata olasılığı ve testin gücünü elde ediniz.

Çözüm:

a) 1. Adım: Hipotezi kurmaktır.


H0 : µ = 60 H1 : µ > 60
2. Adım: Tablo Değerini bulmaktır. Popülasyon varyansı bilinmemekte fakat n = 36 > 30 olduğu
için α değeri için bakılması gereken tablo z tablosudur. Hipotez tek yönlü olduğu için α = 0.03 ⇒
z0.03 = zt = 1.881 bulunur.
3. Adım: Test Değerini(hesap değeri) bulmaktır.
x − µ0 x − µ0 60.5 − 60
zh = = √ = √ = 1.5
σx̄ s/ n 2/ 36

4. Adım: Karar. | zh |<| zt | olduğundan H0 hipotezi reddedilemez.


Yorum: %97 güvenle ana kütle ortalamasının 60 dereceden daha büyük olduğu söylenemez.

b) Burada H0 hipotezi için kurulan ortalamanın (µ0 = 60) yanlış olduğunu aslında gerçek ortalamanın
(µyeni = 61) olduğu söyleniyor. II. Tip Hata olasılığının H0 hipotezinin reddedilemediği bölgede
çıktığını biliyoruz öncelikle bulmamız gereken değer X üst olacaktır. X üst aşağıdaki formülle bu-
lunabilir;
s
X üst = µ0 + zα σX = µ0 + zα √
n
2
= 60 + 1.881 √
36
= 60.627

X
µ0 X üst

X
X üst µyeni

Tek taraflı H1 > µ0 bir hipotezde karşılaşılabilecek II. Tip Hata Türü, turuncu renkli kısım II. Tip Hata
olasılığını göstermektedir.

IBF 1008 İstatistik-II 1 Arş. Gör. Hatem Çoban


II.Tip Hata

Yukarıdaki şekilde II. Tip hata olasılığı gösterilmiştir. Burada bulmamız geren olasılık değeri tu-
runcu renkli bölgedir. İkinci tip hata olasılığını kolay bulmamız için verilen değerleri standart-
laştırmamız ve bu değerlere karşılık gelen olasılık değerini standart normal dağılış tablosundan
(z-tablosu) bulmamız gerekir. II. Tip hata olasılığı P(β ) ve testin gücü T.G;

P(β ) = 0.5 − P(X üst < X < µyeni )


 
X üst − µyeni
= 0.5 − P √ <z<0
s/ n
 
60.627 − 61
= 0.5 − P √ <z<0
2/ 36
= 0.5 − P(−1.12 < z < 0) = P(0 < z < 1.12)
= 0.5 − 0.3686
P(β ) = 0.1314

Testin gücü ise T.G = 1 − P(β ) olduğundan T.G = 1 − 0.1314 = 0.8686 olarak bulunur.

IBF 1008 İstatistik-II 2 Arş. Gör. Hatem Çoban


İSTATİSTİK II
Hipotez Testleri 1

1
Hipotez Testleri 1

1. Hipotez Testlerinin Esasları


2. Ortalama ile ilgili bir iddianın testi:
Büyük örnekler
3. Ortalama ile ilgili bir iddianın testi:
Küçük örnekler
4. Bir oran ile ilgili bir iddianın testi

2
Tanım
Hipotez
İstatistikte hipotez, bir anakütlenin bir
özelliği hakkındaki bir iddia yada bir
ifadedir.

3
µ = 98.6 olarak varsayıldığında
Örnek Ortalamalarının
Örnekleme Dağılışı
Örnek verisi: z = - 6.64 Olası Örnek Ortalamaları
veya
x = 98.20

µx = 98.6

z = - 1.96 z= 1.96
veya veya
x = 98.48 x = 98.72
4
Bir Hipotez Testinin
Bileşenleri

5
Sıfır Hipotezi: H0
 Bir anakütle parametresinin değeri
hakkındaki bir ifadedir. Normal
durumu ifade eder.
 =, ≥, veya ≤ ifadelerini içerir.
Test sonucu sıfır hipotezi için kararlar:
 H0 ret veya H0 reddedilemez
şeklindedir.
6
Alternatif Hipotez: H1
 H0 yanlış ise, doğrudur.
 ≠, <, > içerir.
 Sıfır hipotezinin ‘karşıtıdır’.
 Eğer bir çalışmanın sonunda
fikrinizi test etmek istiyorsanız,
bu iddiayı alternatif hipotez ile
ifade etmelisiniz. 7
Test İstatistiği
Sıfır hipotezinin reddi hakkında karar vermek
için kullanılan, örnek verilerinden hesaplanan
bir değerdir.

Büyük örnekler için, anakütle ortalamasının


testinde kullanılan test istatistiği,

x - µx
z=
σ
n
8
Ret Bölgesi (Kritik Bölge)
Test istatistiğinin, sıfır hipotezinin reddine
yol açacak tüm değerlerin seti.

Ret
bölgeleri

9
Önem Seviyesi
α ile gösterilir.
 Sıfır hipotezi gerçekte doğru iken,
test istatistiğinin ret bölgesine
düşmesi olasılığıdır.
 Genellikle 0.05, 0.01, veya 0.10
seçilir.

10
Kritik Değer
Ret bölgesi ile kabul bölgesini ayıran değer
veya değerler.

H0 Ret H0 Reddedilemez

Kritik Değer
( z değeri )
11
Çift Taraflı Test
H0: µ = 100 α, iki eşit kısma bölünür.
H1: µ ≠ 100
Küçük veya büyüktür.

H0 ret H0 reddedilemez H0 ret

100

100’den anlamlı derecede farklı olan değerler


12
Tek Taraflı Test
H0: µ =100
H1: µ > 100
Ret bölgesi sağda

H0 reddedilemez H0 ret

100’den anlamlı derecede


Büyük değerler
100
13
Tek Taraflı Test
H0: µ =100
H1: µ < 100
Ret bölgesi
solda
H0 ret H0 reddedilemez

100’den anlamlı
derecede küçük 100
değerler
14
Hipotez Testlerinde Hatalar
Tip I ve Tip II Hatalar
Sıfır hipotezi Sıfır hipotezi
DOĞRU YANLIŞ

Sıfır hipotezi Tip I hata Doğru karar


RET α (Testin gücü)
1-β
KARAR
Sıfır hipotezi Doğru karar Tip II hata
REDDEDİLEMEZ 1-α β

15
Ortalama ile ilgili bir iddianın
testi: Büyük örnekler
Varsayımlar
1) Örnek, basit şans örneğidir.
2) a) Örnek büyüktür (n >= 30) veya,
b) Anakütlenin dağılışı normaldir ve σ
bilinmektedir.

3) n >= 30 iken, σ bilinmiyorsa,


örnek standart sapması s, anakütle
standart sapması σ yerine kullanılabilir..
16
Test İstatistiği

x - µx
z= σ
n

17
Karar Kriteri

Test istatistiği ret bölgesine düşüyorsa, sıfır


hipotezi reddedilir.

Test istatistiği ret bölgesine düşmüyorsa,


sıfır hipotezi reddedilemez.

18
Çift Taraflı Z Testine Örnek:
Bir fabrikada üretilmekte olan vidaların boylarının ortalaması 100
mm, ve standart sapması 2 mm olan normal dağılım
gösterdikleri bilinmektedir. Makinalarda olan bir arıza
giderildikten sonra üretilen vidalardan alınan 9 vidalık bir örneğin
boy ortalaması 102 mm olarak bulunmuştur. Makinalardaki
arıza giderilirken vidaların boyunun ayarı bozulmuş mudur?
α=0.05 için test ediniz ve yorumlayınız.

1. Adım: Hipotezlerin belirlenmesi µ=100mm


H 0 : µ = 100mm
σ=2mm
H1 : µ ≠ 100mm
2. Adım: Test istatistiğinin hesaplanması n=9
X −µ 102 − 100
Z hesap = = =3 X = 102mm
σ 2 9
n 19
19
3. Adım: Kritik değerlerin belirlenmesi:
Standart Normal
.500 Dağılım Tablosu
- .025
 
.475 Z .05 .06 .07

1.6 .4505 .4515 .4525


α /2 = .025
α /2 = .025
1.7 .4599 .4608 .4616

-1.96 0 1.96 Z 1.8 .4678 .4686 .4693

 1.9 .4744 .4750 .4756

20
20
4. Adım: İstatistiksel karşılaştırmanın yapılması:
X −µ 102 − 100
Z hesap = = =3 idi
σ 2 9
n
H0 RED H0 RED

α /2 = .025
α /2 = .025
Zhesap=3
0
-Ztablo= -1.96 Ztablo= 1.96
5. Adım: Karar verme ve yorumlama:
Zhesap değeri H0 red bölgesine düştüğü için H0 hipotezi reddedilir,
yani vidaları boy ortalaması 100 mm’den farklıdır, makinanın ayarı
21
bozulmuştur. 21
Tek Taraflı Z Testi Örneği

• Bir kutu mısır gevreğinin ağırlığının üzerinde yazan 368


gr’dan fazla olduğu iddia edilmektedir. Ayrıca normal
dağılım varsayımı altında σ = 15 gram olduğunu belirtmiştir.
n= 25 kutuluk bir örnek alınmış veX = 372.5 gr. olarak
bulunmuştur. 0.05 seviyesinde test ediniz.
H0: µ =368
H1: µ > 368
α = 0.05
n = 25
Kritik değer:

22
22
Çözüm

H0: µ = 368 Test İstatistiği:


H1: µ > 368 X −µ 372.5 − 368
α = 0.05 Z= = = +150
.
σ 15
n = 25 n 25
• Kritik değer: Karar:
α = .05 için H0 hipotezi
RED bölgesi reddedilemez.
α=.05 Yorum:
Ortalamanın 368 gr.dan
0 Z fazla olduğuna dair yeterli
kanıt yoktur.
Zhesap=1.5 Ztablo=1.645
23
23
Çift Taraflı Z testi örneği:
Bu sene DEÜ.İİBF İktisat bölümünden mezun olacak öğrencilerin
mezuniyet not ortalamalarının 70 olduğu belirtilmekte ancak
öğrenciler 70’den farklı olduğunu iddia etmektedirler. Bu amaçla
mezuniyet sonrası 36 öğrencilik bir örnek alınmış ve mezuniyet
ortalamalarının 66, standart sapmasının 12 olduğu bulunmuştur.
Bu veriler ışığında iddiayı α=0.01 için test ediniz.
H0 : µ=70
H1 : µ≠70
X − µx X − µ 66 − 70 −4
Z= = = = = −2
sx s 12 / 6 2
n
III. α = 0.01 için z tablo değeri 2.58
IV. |zhes|<|ztab| H0 red edilemez. 24
24
Ortalama ile ilgili bir iddianın
testi: Küçük örnekler
Varsayımlar

1) Örnek, bir basit şans örneğidir.


2) Örnek, bir küçük örnektir (n < 30).

3) Anakütle standart sapması σ bilinmemektedir.

4) Anakütlenin dağılışı normaldir.

25
Test İstatistiği

x -µx
t= s
n
Kritik Değerler
t tablosundan bulunur.
Serbestlik Derecesi (df) = n -1

26
ÖRNEK
Bir konserve fabrikasının imal ettiği konservelerin üzerinde
ortalama ağırlık 455 gr yazmaktadır. Bu konservelerin ortalama
ağırlıkları ile ilgili bir karar vermek üzere rastgele seçilen 17
kutunun ortalama ağırlığı 450 gr ve standart sapması 13 gr
bulunmuştur. Ağırlıkların normal dağılım gösterdiği varsayımı
altında ortalama ağırlığın 455 gr olup olmadığını 0.05 önem
seviyesinde test ediniz.
n = 17 v = n − 1 = 16
H 0 : µ = 455 X = 450 gr.
H1 : µ ≠ 455 s = 13 gr. ttab = ±2.12
α 2 = 0.025
H 0 Red
X − µ 450 − 455
H0 Red th = = ≅ −1.54
edilem s 13
ez. n 16
-2.12-1.54 2.12
27 27
ÖRNEK: Bir otomobil firması yeni geliştirdiği teknoloji ile
ürettiği akülerin ortalama dayanma süresi olan 42 ayın
değiştiği ve artık akülerinin ortalama dayanma süresinin
42 ayın üzerinde olduğunu iddia etmektedirler. Akülerin
dayanma sürelerinin normal dağılım gösterdiği varsayımı
altında bu iddiayı araştırmak üzerine 10 adet akü örnek
olarak seçilmiş ve dayanma süreleri ay olarak aşağıdaki
biçimde bulunmuştur:
42, 36, 40, 39, 35, 43, 45, 43, 41, 46 α=0.05 önem
seviyesi için üreticinin iddiasını test ediniz.
H 0 : µ = 42 x−µ x−µ
H 1 : µ > 42 t= = t0, 05,9 = 1,833 > th = −0,88
α = 0,05 Sx S n
41 − 42
th = = −0,88
∑ x 410 3,59
x= = = 41
102
H0 Red edilemez
n 10
(∑ x )
∑x 2

n ∑ x2 − n x
2
16926 − 10(41) 2
S= = = = 3,59
n −1 n −1 9
28
Anakütle Ortalaması µ İçin Hipotez Testleri

Başla

normal dağılışı kullanın

Evet x - µx
Z=
n > 30 σ/ n
?
Hayır (σ bilinmediğinde s kullanın.)

Anakütle
Verilerinin Hayır
Parametrik olmayan
Dağılışı normal
Mi? İstatistik yöntemleri kullanın.

Evet normal dağılışı kullanın


σ Evet x - µx
Biliniyor Z=
mu?
σ/ n
Hayır (Nadiren karşılaşılan bir durumdur.)

Student t dağılışını kullanın


x - µx
t = s/ n
29
Bir oran ile ilgili bir iddianın
testi

30
Notasyon
n = deneme sayısı
p=x/n (örnek başarı oranı)

31
Test İstatistiği

p − π0
z=
π 0 (1 − π 0 )
n

32
ÖRNEK
Bir süpermarketler zinciri sahibi müşterilerinin %95’inin
süpermarketlerindeki fiyatlardan memnun olduğunu söylemektedir.
Tesadüfi olarak seçilen 200 müşteriden 184’ü fiyatlardan memnun
olduğunu bildirmektedir.%1 önem düzeyinde, süpermarketteki
fiyatlardan memnun olanların oranının %95’e eşit olmadığını
söyleyebilir miyiz?

H 0 : π = 0,95 α = 0.01 p = 184 / 200 = 0.92

H1 : π ≠ 0,95 Z tab = ±2.58

p −π p −π 0.92 − 0.95
Z= = = = −1.95
σp π (1 − π ) 0.95(1 − 0.95)
n 200
Hreddedilemez
0 33
33
İSTATİSTİK II
Hipotez Testleri - 2

1
Hipotez Testleri - 2
1 İki Anakütle Ortalaması Arasındaki Farkın
Testi: Bağımsız ve Büyük Örnekler
2 İki Anakütle Ortalaması Arasındaki Farkın
Testi: Bağımsız ve Küçük Örnekler
3 İki Anakütle Ortalaması Arasındaki Farkın
Testi: Eşleştirilmiş Örnekler
4 İki Anakütle Oranı Arasındaki Farkın Testi

2
İki Anakütle Ortalaması Arasındaki
Farkın Testi: Bağımsız ve Büyük
Örnekler

3
Tanımlar
Bağımsız İki Örnek
Bir anakütleden seçilen örnek değerleri,
diğer bir anakütleden seçilen örnek
değerleri ile ilişkisizdir veya bir şekilde
eşleşmemiştir.
Bir örnekteki değerler, diğer bir örnekteki
değerler ile ilişkili ise, bu tür örnekler
bağımlıdır. Böyle örneklere eşleştirilmiş
örnekler denir.

4
Varsayımlar

1. İki örnek bağımsızdır.

2. İki örnek de büyüktür. Yani, n1 >= 30 ve


n2 >= 30. Bu varsayım sağlanmadığında σ1
ve σ2 biliniyor ve her iki anakütlenin
dağılışı da normal olmalıdır.

3. Her iki örnek basit şans örneği olmalıdır.

5
Örnekleme Dağılışı

 2 2
σ σ
(X1 − X 2 ) ~ N  µ1 − µ2 , 1 + 2 
 n1 n2 

6
Hipotezler

• H 0: µ 1 – µ 2 = 0
• H 1: µ 1 – µ 2 ≠ 0 (Çift Taraflı Test)

• H 0: µ 1 – µ 2 = 0
• H 1: µ 1 – µ 2 > 0 (Tek Taraflı Test)

• H 0: µ 1 – µ 2 = 0
• H 1: µ 1 – µ 2 < 0 (Tek Taraflı Test)

7
Test İstatistiği

(x1 - x2)
z =
σ 2.
σ 2

n1
1
+ n 2

σ1, σ2 bilinmediğinde, σ 12 σ 22 s12 s2 2


+ ≅ +
n1 >= 30 ve n2 >= 30 ise, n1 n2 n1 n2

8
Coca Cola Pepsi’ye Karşı
İki kola markası Coca Cola ve Pepsinin kutulu
ürünlerinin içerik ağırlıklarını (pound)
karşılaştırmak için her iki üründen şans örnekleri
alınmış ve aşağıdaki veriler elde edilmiştir. 0.01
önem seviyesinde, Coca Cola’ların ortalama
ağırlıklarının, Pepsi’lerin ortalama ağırlıklarından
farklı olup olmadığını araştırınız.

Coca Cola Pepsi


n 36 36
x 0.81682 0.82410
s 0.007507 0.005701
9
Coca Cola Pepsi’ye Karşı
İddia: µ1 ≠ µ2
Ho : µ 1 = µ 2
H1 : µ 1 ≠ µ 2
α = 0.01
H0 ret H0 reddedilemez H0 ret

Z = - 2.575 Z = 2.575
µ1 - µ2 = 0
or Z = 0
10
Coca Cola Pepsi’ye Karşı

z =
(0.81682 - 0.82410)
0.0075707 2 0.005701 2
+
36 36

= - 4.63

11
Coca Cola Pepsi’ye Karşı
İddia: µ1 ≠ µ2
Ho : µ 1 = µ 2
H1 : µ 1 ≠ µ 2
α = 0.01
H0 ret H0 reddedilemez H0 ret

Z = - 2.575 Z = 2.575
Örnek verisi: µ1 - µ2 = 0
z = - 4.63 or Z = 0
12
Coca Cola Pepsi’ye Karşı
İddia: µ1 ≠ µ2
Coca Cola’nın ortalama kutu içerik
Ho : µ 1 = µ 2 ağırlıkları, Pepsi’nin ortalama kutu
içerik ağırlıklarından anlamlı derecede
H1 : µ 1 ≠ µ 2 farklıdır.

α = 0.01
H0 ret H0 reddedilemez H0 ret

Z = - 2.575 Z = 2.575
Örnek verisi: µ1 - µ2 = 0
z = - 4.63 or Z = 0
13
İki Anakütle Ortalaması
Arasındaki Farkın Testi:
Bağımsız ve Küçük Örnekler

14
Varsayımlar
1. İki örnek de basit şans örneğidir ve bağımsızdır.
2. Anakütlelerin dağılışı normaldir ve örneklerin en az biri
30’un altındadır.
3. σ1 ve σ2 bilinmemektedir.
4. σ1 = σ2.

15
Örnekleme Dağılışı

X1 − X 2
t= ~ t n1 + n2 −2
2 1 1 
s p  + 
 n1 n2 

(n1 − 1)s12 + (n2 − 1)s22


s 2p =
n1 + n2 − 2

serbestlik derecesi = n1 + n2 – 2

16
Örnek
•Bir aracı kurumda çalışan bir finansal analistten, iki hisse
senedinin ortalama fiyatlarının aynı olup olmadığını
araştırması istenmiştir. Kapanış fiyatlarından, aşağıdaki
veriler elde edilmiştir.
A Hisse S. B Hisse S.
•Gün 21 25
•Ortalama 3.27 2.53
•Std Sapma 1.30 1.16
•Aynı standart sapmalı, normal
dağılış varsayımıyla, ortalama
kapanış fiyatları aynı kabul edilebilir mi?
(α = .05) © 1984-1994 T/Maker Co.
17
Çözüm

•H0: µ1 - µ2 = 0 (µ1 = µ2) Test İstatistiği:


•H1: µ1 - µ2 ≠ 0 (µ1 ≠ µ2)
α = .05
•df = 21 + 25 - 2 = 44
•Kritik Değerler
Karar:

Sonuç:

18
Çözüm

•H0: µ1 - µ2 = 0 (µ1 = µ2) Test İstatistiği:


•H1: µ1 - µ2 ≠ 0 (µ1 ≠ µ2)
α = .05
•df = 21 + 25 - 2 = 44
•Kritik Değerler
Karar:
Reject H0 Reject H0

.025 .025 Sonuç:

-2.0154 0 2.0154 t
19
Çözüm

t=
(X 1 − X2)
=
(3.27 − 2.53) = +2.03
1 1  1 1 
SP
2
⋅  +  1.510 ⋅  + 
 n1 n2   21 25 

SP
2 (n
= 1
− 1) ⋅ S1
2
+ (n2 − 1) ⋅ S 2
2

n1 + n2 − 2

=
(21 − 1) ⋅ (1.30 ) + (25 − 1) ⋅ (1.16 )
2 2
= 1.510
21 + 25 − 2

20
Çözüm

•H0: µ1 - µ2 = 0 (µ1 = µ2) Test İstatistiği:


•H1: µ1 - µ2 ≠ 0 (µ1 ≠ µ2) 3.27 − 2.53
α = .05 t= = +2.03
1 1
•df = 21 + 25 - 2 = 44 1.510 ⋅  + 
 21 25 
•Kritik Değerler
Karar:
Reject H0 Reject H0 2.0154 < 2.03 H0 ret
.025 .025 Sonuç: Ortalamalar
arasında anlamlı bir
-2.0154 0 2.0154 t fark vardır.
21
İki Anakütle Ortalaması
Arasındaki Farkın Testi:
Eşleştirilmiş Örnekler

22
Varsayımlar
1. Örnek verileri eşleştirilmiştir.

2. Örnekler, basit şans örnekleridir.

3. Eşleştirilmiş veri sayısı küçük ise


(n < 30 ise), eşleşmiş verilerin farklarının
dağılışı normal olmak zorundadır.

23
Notasyon

µd = eşleştirilmiş verilerin farklarının (d’ler)


anakütlesi için ortalama değer.

d = eşleştirilmiş örnek verilerinin farkları


d’lerin ortalaması. (x - y değerlerinin
ortalamasına eşittir)

sd = eşleştirilmiş örnek verilerinin farkları d’ler


için standart sapma.

n = eşleştirilmiş veri sayısı.


24
Kritik Değerler
n < 30 ise, kritik değerler t
dağılışından bulunur.

n >= 30 ise, kritik değerler normal


dağılıştan bulunur.

25
Örnek
•Bir Pazar araştırmaları uzmanı
müşterisinin bir ürününün • (1) (2)
satışları ile rakibinin aynı Mağaza Müşteri Rakip d
ürününün satışlarını
karşılaştırmak istemektedir. • 1 10 11 -1
Bunun için rastgele 8 perakende• 2 8 11 -3
satış mağazası seçilmiş ve 3 7 10 -3
yandaki veriler elde edilmiştir.
4 9 12 -3
•müşterinin ortalama satışları,
rakip firma ortalama 5 11 11 0
satışlarından daha az mıdır? α = 6 10 13 -3
0.01 için araştırınız. 7 9 12 -3
8 8 10 -2
26
Çözüm
•H0: µD = 0 (µD = µ1 - µ2)
Test İstatistiği:
•Ha: µD < 0
α = .01
d −µd −2.25 − 0
t= = = −5.486
SD 116
.
•sd = 8 - 1 = 7
•Kritik değer
nD 8
tα,n-1 = t0.01,7 = 2.998 Karar:
Reject Ho Ret
.01 Sonuç:
Müşterinin satışları
-2.998 0 t rakibinden azdır.
27
İki Anakütle Oranı Arasındaki
Farkın Testi

28
Varsayımlar
1. İki bağımsız basit şans örneğinden elde
edilmiş oranlara sahibiz.

2. Her iki örnek için, np ≥ 5 ve nq ≥ 5


koşulları sağlanmıştır.

29
Notasyon
Anakütle 1 için:
π1 = anakütle oranı
n1 = örnek büyüklüğü
x1 = örnekteki başarı sayısı
p1 = x1/n1 (örnek oranı)
q1 = 1 - p1
Anakütle 2 için aynı tanımlamalar sırasıyla
π2, n2 , x2 , p2. and q2 , için de geçerlidir.

30
Oranlar Arasındaki Farkın
Örnekleme Dağılışı

 π (1 − π 1 ) π 2 (1 − π 2 ) 
p1 − p 2 ~ N π 1 − π 2 ; 1
+ 

 n1 n 2 

31
Hipotezler

H0 π1 - π 2 = 0 π1 - π2= 0 π1 - π2= 0

H1 π1 - π2 ≠ 0 π1 - π2< 0 π1 - π2 > 0

32
Test İstatistiği

Z ≅
( p1 − p2 ) − (π 1 − π 2 ) p=
X1 + X 2
1 1 n1 + n2
p ⋅ (1 − p ) ⋅  + 
 n1 n2 

33
Örnek
•Bir firmanın personel müdürü, firmada
kullanılmış olan iki ayrı performans
değerlendirme yönteminin ne kadar adil
olduğu ile ilgili olarak çalışanların
algılamalarını ölçmüştür. Yöntem 1’i
değerlendiren 78 çalışandan 63’ü bu
yöntemi adil bulmuştur. Yöntem 2’yi
değerlendiren 82 çalışandan 49’u bu
yöntemi adil bulmuştur. 0.01 önem
düzeyinde, çalışanların algılamaları
arasında fark olup olmadığını test
ediniz.

34
Çözüm

•H0: π1 - π2 = 0 Test İstatistiği:


•H1: π1 - π2 ≠ 0
α = .01
•n1 = 78 n2 = 82
•Kritik değerler
Karar:

Sonuç:

35
Çözüm

X 1 63 X 2 49
p1 = = = .808 p2 = = = .598
n1 78 n2 82

X 1 + X 2 63 + 49
p= = = .70
n1 + n2 78 + 82

Z=
( p1 − p2 ) =
(.808 − .598)
1 1  1 1 
p ⋅ (1 − p ) ⋅  +  (.70) ⋅ (1 − .70) ⋅  + 
 n1 n2   78 82 
= +2.90

36
Çözüm

•H0: π1 - π 2 = 0 Test İstatistiği:


•H1: π 1 - π 2 ≠ 0
α = .01
Z = +2.90
•n1 = 78 n1 = 82
•Kritik Değerler:
Karar:
H0 Ret
Sonuç:
İki performans değerlendirme
yönteminin adilliğine dair
algılamaların oranları farklıdır.
37
İSTATİSTİK II
Hipotez Testleri 3
Hipotez Testleri 3

1. Bir anakütle varyansı veya standart


sapması için testler
2. İki varyansın karşılaştırılması
3. Hipotez testlerinde 2. tip hata ve testin
gücü.
Bir anakütle varyansı veya
standart sapması için testler
Varsayımlar

1) Alınan örnek bir basit şans


örneğidir.

2) Anakütlenin dağılışı normaldir.


Hipotezler

• H 0: σ = σ 0
• H 1: σ ≠ σ 0 (Çift Taraflı Test)

• H 0: σ = σ 0
• H 1: σ > σ 0 (Tek Taraflı Test)

• H 0: σ = σ 0
• H 1: σ < σ 0 (Tek Taraflı Test)
Ki-Kare Dağılışı
Test İstatistiği

(n - 1) s 2
X2=
σ2

n = örnek büyüklüğü
s 2 = örnek varyansı
σ 2 = anakütle varyansı
(sıfır hipotezinde verilmektedir)
Ki-Kare Dağılışı İçin
Kritik Değerler

 Ki-kare tablosundan
bulunur.
 Serbestlik derecesi = n -1
Table A-4 Chi-Square (x2) Distribution
Degrees of Area to the Right of the Critical Value
freedom 0.995 0.99 0.975 0.95 0.90 0.10 0.05 0.025 0.01 0.005

1 _ _ 0.001 0.004 0.016 2.706 3.841 5.024 6.635 7.879


2 0.010 0.020 0.051 0.103 0.211 4.605 5.991 7.378 9.210 10.597
3 0.072 0.115 0.216 0.352 0.584 6.251 7.815 9.348 11.345 12.838
4 0.207 0.297 0.484 0.711 1.064 7.779 9.488 11.143 13.277 14.860
5 0.412 0.554 0.831 1.145 1.610 9.236 11.071 12.833 15.086 16.750
6 0.676 0.872 1.237 1.635 2.204 10.645 12.592 14.449 16.812 18.548
7 0.989 1.239 1.690 2.167 2.833 12.017 14.067 16.013 18.475 20.278
8 1.344 1.646 2.180 2.733 3.490 13.362 15.507 17.535 20.090 21.955
9 1.735 2.088 2.700 3.325 4.168 14.684 16.919 19.023 21.666 23.589
10 2.156 2.558 3.247 3.940 4.865 15.987 18.307 20.483 23.209 25.188
11 2.603 3.053 3.816 4.575 5.578 17.275 19.675 21.920 24.725 26.757
12 3.074 3.571 4.404 5.226 6.304 18.549 21.026 23.337 26.217 28.299
13 3.565 4.107 5.009 5.892 7.042 19.812 22.362 24.736 27.688 29.819
14 4.075 4.660 5.629 6.571 7.790 21.064 23.685 26.119 29.141 31.319
15 4.601 5.229 6.262 7.261 8.547 22.307 24.996 27.488 30.578 32.801
16 5.142 5.812 6.908 7.962 9.312 23.542 26.296 28.845 32.000 34.267
17 5.697 6.408 7.564 8.672 10.085 24.769 27.587 30.191 33.409 35.718
18 6.265 7.015 8.231 9.390 10.865 25.989 28.869 31.526 34.805 37.156
19 6.844 7.633 8.907 10.117 11.651 27.204 30.144 32.852 36.191 38.582
20 7.434 8.260 9.591 10.851 12.443 28.412 31.410 34.170 37.566 39.997
21 8.034 8.897 10.283 11.591 13.240 29.615 32.671 35.479 38.932 41.401
22 8.643 9.542 10.982 12.338 14.042 30.813 33.924 36.781 40.289 42.796
23 9.260 10.196 11.689 13.091 14.848 32.007 35.172 38.076 41.638 44.181
24 9.886 10.856 12.401 13.848 15.659 33.196 36.415 39.364 42.980 45.559
25 10.520 11.524 13.120 14.611 16.473 34.382 37.652 40.646 44.314 46.928
26 11.160 12.198 13.844 15.379 17.292 35.563 38.885 41.923 45.642 48.290
27 11.808 12.879 14.573 16.151 18.114 36.741 40.113 43.194 46.963 49.645
28 12.461 13.565 15.308 16.928 18.939 37.916 41.337 44.461 48.278 50.993
29 13.121 14.257 16.047 17.708 19.768 39.087 42.557 45.722 49.588 52.336
30 13.787 14.954 16.791 18.493 20.599 40.256 43.773 46.979 50.892 53.672
40 20.707 22.164 24.433 26.509 29.051 51.805 55.758 59.342 63.691 66.766
50 27.991 29.707 32.357 34.764 37.689 63.167 67.505 71.420 76.154 79.490
60 35.534 37.485 40.482 43.188 46.459 74.397 79.082 83.298 88.379 91.952
70 43.275 45.442 48.758 51.739 55.329 85.527 90.531 95.023 100.425 104.215
80 51.172 53.540 57.153 60.391 64.278 96.578 101.879 106.629 112.329 116.321
90 59.196 61.754 65.647 69.126 73.291 107.565 113.145 118.136 124.116 128.299
100 67.328 70.065 74.222 77.929 82.358 118.498 124.342 129.561 135.807 140.169
Örnek: yeni tasarlanan bir otomobil motorunun benzin tüketiminin
standart sapmasının, 2.5 galondan farklı olup olmadığını anlamak için
16 motor test edilmiş ve örnek standart sapması 2.2 galon
bulunmuştur. İddiayı α = 0.01 önem seviyesinde araştırınız.
Örnek: yeni tasarlanan bir otomobil motorunun benzin tüketiminin
standart sapmasının, 2.5 galondan farklı olup olmadığını anlamak için
16 motor test edilmiş ve örnek standart sapması 2.2 galon
bulunmuştur. İddiayı α = 0.01 önem seviyesinde araştırınız.

iddia: σ ≠ 2.5
H0: σ 2= 6.25
H1: σ2 ≠ 6.25
Örnek: yeni tasarlanan bir otomobil motorunun benzin tüketiminin standart
sapmasının, 2.5 galondan farklı olup olmadığını anlamak için 16 motor test
edilmiş ve örnek standart sapması 2.2 galon bulunmuştur. İddiayı α = 0.01
önem seviyesinde araştırınız.

iddia: σ ≠ 2.5
H0: σ 2= 6.25
α = 0.01 α/2 = 0.005
H1: σ2 ≠ 6.25

0.005 0.005
Örnek: yeni tasarlanan bir otomobil motorunun benzin tüketiminin standart
sapmasının, 2.5 galondan farklı olup olmadığını anlamak için 16 motor test
edilmiş ve örnek standart sapması 2.2 galon bulunmuştur. İddiayı α = 0.01
önem seviyesinde araştırınız.

iddia: σ ≠ 2.5
H0: σ 2= 6.25
α = 0.01 α/2 = 0.005
H1: σ2 ≠ 6.25

n = 16
0.005 0.005 df = 15

32.801
Örnek: yeni tasarlanan bir otomobil motorunun benzin tüketiminin standart
sapmasının, 2.5 galondan farklı olup olmadığını anlamak için 16 motor test
edilmiş ve örnek standart sapması 2.2 galon bulunmuştur. İddiayı α = 0.01
önem seviyesinde araştırınız.

iddia: σ ≠ 2.5
H0: σ 2= 6.25
α = 0.01 α/2 = 0.005
H1: σ2 ≠ 6.25
0.995

n = 16
0.005 0.005 df = 15

4.601 32.801
x 2
=
(n -1)s2
σ 2
= (16 -1) (2.2)2
2.52
≈ 7.916
x 2
=
(n -1)s2
σ 2
= (16 -1) (2.2)2
2.52
≈ 7.916

H0 reddedilemez

4.601 32.801

x2 = 7.916
Tüketim değerlerinin standart sapmasının 2.5
galondan farklı olduğu söylenemez.
İki Varyansın Karşılaştırılması

•Varyansların karşılaştırılması söz konusu


olduğunda, F dağılışı kullanılır:
(n1 − 1) s12
χ12 σ 12
ν1 (n1 − 1) s12 / σ 12
F= 2 = 2
= 2 2
χ 2 (n2 − 1) s2 s2 / σ 2
ν2 σ 22
(n2 − 1)

•Dağılışın serbestlik dereceleri


İki Varyansın Karşılaştırılması

•Sıfır hipotezi:
2 2
•H0: σ 1 = σ 2
•İki anakütle varyansı eşit, diğer bir deyişle birbirine
oranı “1” anlamına gelmektedir.
•Buradan, test istatistiği F, sadeleşerek

halini alır.
F Dağılışı
Alternatif Hipotez, Test İstatistiği
ve Ret Bölgesi
• H1: σ 2 ≠ σ 2
1 2

s12 > s22 ise F = s12 / s22 > Fα / 2,n1 −1,n2 −1 ise H0 ret

s22 > s12 ise F = s22 / s12 > Fα / 2,n2 −1,n1 −1 ise H0 ret

2 2
σ
• H1: 1 < σ 2 F = s22 / s12 > Fα ,n2 −1,n1 −1 ise H0 ret

• H1: σ 2 > σ 2
1 2
F = s12 / s22 > Fα ,n1 −1,n2 −1 ise H0 ret
Örnek
• Bir fabrikadaki aynı işi yapan iki makasın aynı kalitede
üretim yapıp yapmadığını araştırmak için her iki makasta
kesilmiş metal çubuklardan 8’er örnek alınmış ve boy
değerleri aşağıdaki gibi bulunmuştur. Kalite ölçüsü
olarak varyans kullanılırsa, α = 0.02 için araştırma
yapınız.
• Birinci makas - 7.5, 8.2, 8.1, 8.4, 7.1, 7.3, 7.1, 7.8
• İkinci makas - 7.9, 8.4, 8.0, 7.8, 7.5, 7.2, 7.4, 7.3
Örnek
H0: σ 12 = σ 22

H1: σ 12 ≠ σ 22

2 2
F= s1 / s2 = 0.261 / 0.167 = 1.565

Fα / 2,n1 −1,n2 −1 = F0.01,7,7 = 6.9928

1.565 < 6.9929 H0 reddedilemez.


Hipotez Testlerinde II. Tip
Hata Olasılığı
II. Tip Hata Olasılığı

• H0 gerçekte yanlış iken doğru kabul


edilmesi olasılığıdır.
• II. Tip hata olasılığı şunlara bağlıdır:
–α
– Örnek büyüklüğü
– Anakütle varyansı
– Gerçek ortalama ile hipotezdeki ortalama
arasındaki fark
Örnek
• Bir otomobil lastiği imalatçısı, lastiklerini en az
35000 mil sorunsuz kullanacak şekilde
tasarlamaktadır.
• Bağımsız bir test kuruluşu, ortalama ömrün
35000 milin altında olup olmadığını test etmek
için 35 lastik üzerinde hızlandırılmış yaşam testi
gerçekleştirilmiştir.
• α = 0.05 önem düzeyinde karar verilecektir.
• Anakütle standart sapması 4000 mil olarak
bilinmektedir.
• Gerçek ortalama ömür 34000 mil ise, II. Tip hata
olasılığı nedir?
II. Tip Hatanın Hesaplanması

μt μ0
μ0 - zα (σ/√n)
II. Tip Hatanın Hesaplanması

μ0 - zα (σ/√n) = 35000 – (1.645)(4000/√35)


= 33887.78
Gerçek ortalama 34000 iken, örnek ortalamasının
33887.78’in altında çıkması olasılığı,
– Standardize: [μ0 - zα (σ/√n)] – μt
σ/√n

– II. Tip hata olasılığı


β = P(z > (μ0– μt)/(σ/√n) - zα )
II. Tip Hatanın Hesaplanması

• β =1-P(z < (μ0– μt)/(σ/√n) - zα ))


= 1-P(z < (35000 – 34000)/(4000/√ 35) -
1.645)
= 1-P(z < 1.48) = 1 - 0.9306 = 0.0694
Örnek

• Gerçek ortalama 32000 ise ve α = 0.001 için II.


Tip hata olasılığı ne olur?
• β =1-P(z < (μ0– μt)/(σ/√n) - zα ))
= 1-P(z < (35000 – 32000)/(4000/√ 35) -3.090)
= 1-P(z < 1.35) = 1-0.9115=0.0885
Testin Gücü

• Güç nedir?

⇒ Testin gücü = 1 - β
1) Bir kafede yaz aylarında satılan
HİPOTEZ TESTLERİ
TESTLERİ limonataların satış miktarının ortalamasının
24 lt.’den az olduğu iddia edilmektedir. İddiayı
ALIŞ
ALIŞTIRMA SORULARI test etmek amacıyla 36 günlük bir inceleme
yapılmış ortalamanın 22 lt. ve standart
sapmanın ise 3,5 lt. olduğu görülmüştür. Buna
göre α = 0,04 önem seviyesinde gerekli
hipotezleri kurup iddiayı test ederek
yorumlayınız.
2012
Araş.Gör. Efe SARIBAY

2) Bir hisse senedinin kapanış fiyatının 3) Bir üretici satın aldığı çelik levhaların
varyansının daha önceki yapılan ağırlıklarının ortalamasının 100 kg.
çalışmalardan 144 olduğu bilinmektedir. 25 standardına uygun olup olmadığını
günlük yapılan bir inceleme sonucunda hisse araştırmaktadır. Bu amaçla incelenen
senedinin kapanış fiyatının ortalaması 35 24 adet levhanın ağırlıklarının ortalaması
olarak hesaplanmıştır. Hisse senedinin 95 kg. ve varyansı 121 olarak
kapanış fiyatı ortalamasının 30’dan büyük hesaplanmıştır. Levhaların ağırlıklarının
olduğu iddiasını α = 0,01 önem seviyesinde normal dağılıma uygun olduğu varsayımı
iddiayı test edip yorumlayınız. altında α = 0,02 önem seviyesinde iddiayı
test edip yorumlayınız.

1
4) Çevre koruma müdürlüğü büyük bir 5) Yabancı marka spor ayakkabı üreten bir
sanayi kuruluşunun çıkardığı günlük işletme Ege Bölgesi’ndeki Pazar payının
sülfürükoksit miktarının ortalamasının
belirlemek için araştırma yapmıştır. Bu % 30’dan fazla olduğunu iddia etmektedir. Bu
miktarın kabul edilebilir ortalama olan 9’dan amaçla yapmış olduğu bir alan
az olduğu iddia edilmektedir. Ölçüm fiyatları araştırmasında 850 kişiden 289 kişi
çok yüksek olduğundan sadece 9 günlük tarafından bu markanın tercih edildiği
ölçümlerden bir rastgele örnek oluşturularak
aşağıda verilmiştir.Normal dağılış varsayımı görülmüştür. α = 0,08 önem seviyesinde
hipotezi α = 0,10 önem seviyesinde test iddiayı test edip yorumlayınız.
edip yorumlayınız.

7,3 8,3 9,4 8,9 7,4 7,5 9,3 8,8 9,6

6) Genel seçimlerde A partisinin oy oranının 7) Uzun dönemde bir hisse senedinin


kaç olacağı konusunda bir araştırma kapanış fiyatının varyansının 2,05
yapılması isteniyor. Bu amaçla İzmir’de 1000 seviyesinde sabitlenmesi planlanmıştır.
kişi üzerinde yapılan bir kamuoyu Yapılan düzenlemelerden sonra, 17 gün
yoklamasında 470 kişinin A partisine oy boyunca yapılan bir inceleme sonucunda
verdiği görülmüştür. A partisinin İzmir ili oy hisse senedinin kapanış fiyatının ortalaması
oranının % 50’ye eşit olup olmadığını 4,05 ve standart sapması 1,77 olarak elde
α = 0,004 önem seviyesinde test edip edilmiştir. Arzu edilen hedefe ulaşıp
yorumlayınız. ulaşılmadığını α = 0,05 önem seviyesinde
test edip yorumlayınız.

2
8) Bir ekmek fabrikasında günlük üretilen 9) Ege İ.İ.B.F ve Dokuz Eylül İ.İ.B.F. okuyan
ekmeklerin ağırlıklarının varyansları öğrencilerin ALES sınavı başarıları
konusunda yapılan bir çalışmada incelenen karşılaştırılmak isteniyor. Fakültemizin öğretim
41 ekmeğin ağırlıkları ortalaması 400gr., üyeleri öğrencilerimizin daha başarılı olduğunu
öne sürerek aşağıdaki istatistiksel bilgileri
standart sapması ise 12 gr. olarak
ALES sınav sonuçlarından elde ediyorlar. Buna
hesaplanmıştır. Yapılan iyileştirmeler
göre öne sürülen görüşün doğruluğunu
sonucunda ekmelerin ağırlığının varyansının α = 0,003 önem seviyesinde test edip
300’den az olacağı beklendiğine göre, yorumlayınız.
beklentinin karşılanıp karşılanmadığını
Ege İİBF DEU İİBF
α = 0,01 önem seviyesinde test edip
n 50 70
yorumlayınız.
x 70 76
s 6 7

10) Bodrum ve Marmaris’in yaz ayları 11) Zirai bir merkezde bir gübrenin buğday üretimi
üzerindeki etkisi ölçülecektir. Bunu incelemek
içerisindeki deniz suyu sıcaklıkları
amacıyla şansa bağlı olarak 10 toprak saha
karşılaştırılmak isteniyor. Bu amaçla 40 gübrelenmiş ve diğer 12 toprak saha kontrol grubu
günlük yapılan bir inceleme sonucunda olarak gübrelenmiştir. Diğer tüm koşulların aynı
Bodrum’daki deniz suyu sıcaklık ortalaması olduğu bilgisi altında, gübrelenen parsellerde
250C, varyansı 16, Marmaris’te yapılan 50 ortalama buğday üretimi 5,1 kg. ve standart sapma
günlük bir inceleme sonucunda deniz suyu 0,36 kg bulunmuştur. Kontrol grubunda ise ortalama
sıcaklığı 270C, varyansı ise 25 olarak buğday tüketimi 4,8 kg. ve standart sapma 0,4 kg.
olarak bulunmuştur. Anakütle dağılımlarının normal
hesaplanmıştır. Deniz suyu sıcaklıklarının
ve eşit varyanslı olduğu varsayımı altında kontrol
ortalamasının birbirine eşit olup olmadığını grubunda ortalama buğday üretiminin gübrelenmiş
α = 0,05 önem seviyesinde test edip parsellerden daha az olduğu iddiasını α = 0,01
yorumlayınız. önem seviyesinde test edip yorumlayınız.

3
12) Karşıyaka ve Alsancak’ta şubesi bulunan 13) Yatılı okul eğitiminin öğrencilerin
pastanenin aylık tükettiği dondurma miktarları ağırlıklarında bir farklılık meydana getirip
karşılaştırmak isteniyor. 12 aylık bir inceleme getirmediğini araştırmak amacıyla
sonucunda Karşıyaka’da satılan dondurma rastgele seçilen 6 öğrencinin ilk gün
miktarının ortalaması 65 kg., standart sapması ağırlıkları ile 6 ay sonraki ağırlıkları
5 kg., Alsancak’ta ise ortalamanın 72 kg.,
standart sapmanın ise 6 kg olduğu
aşağıdaki gibi kaydedilmiştir. Buna göre
görülmüştür. Anakütle dağılımlarının normal bir yıllık yatılı eğitiminin öğrencilerin
ve eşit varyanslı olduğu varsayımı altında ağırlıkları üzerinde herhangi bir etkisi olup
Alsancak’ta satılan dondurma miktarının olmadığını α = 0,10 önem seviyesinde
ortalamasının Karşıyaka’dan daha fazla test edip yorumlayınız.
olduğu iddiasını α = 0,025 önem seviyesinde öğrenciler 1 2 3 4 5 6
test ediniz. ilk gün ağırlıkları (kg.) 64 71 46 80 95 47
1 yıl sonraki ağırlıkları (kg.) 56 73 45 82 90 52

14) Piyasa yeni sürülecek olan bir tansiyon 15) Bir bankada ocak ve şubat aylarında
ilacının etkinliğinin araştırılmaktadır. Bu yatırımcıların altın fonu alma oranları
amaçla 7 tansiyon hastasının ilaç karşılaştırılmak isteniyor. Şubat ayında 250
verilmeden önce ve ilaç verildikten sonra yatırımcıdan 117’si, Mart ayından ise 325
tansiyon değerleri ölçülüp aşağıdaki tabloda yatırımcıdan 141’i yatırımlarını altın fonu alarak
verilmiştir. Buna göre ilacın tansiyonu değerlendirmiştir. Buna göre Şubat ve Mart
düşürmede etkili olup olmadığını aylarında yatırımcıların altın fonunu tercih
α = 0,01 önem seviyesinde test edip
yorumlayınız etme oranlarının birbirine eşit olup olmadığını
α = 0,01 önem seviyesinde test edip
yorumlayınız
İlaç öncesi 14 16 17 18 16 19 21
İlaç sonrası 13 15 17 15 14 16 17

4
16) İstatistik 2 dersi başarı oranı açısından 17) İMKB’de işlem gören iki hisse senedinin
İşletme ve İktisat Bölümleri karşılaştırılmak haftalık kapanış fiyatları arasındaki
isteniyor. Bu amaçla iktisat bölümünde okuyan değişkenlik karşılaştırılmak isteniyor. Bu
istatistik 2 dersini almış 150 öğrenci seçiliyor ve amaçla A hisse senedinin 13 haftalık kapanış
80’inin başarılı olduğu, işletme bölümünde fiyatlarının varyansı 81, B hisse senedinin 21
okuyan istatistik 2 dersini almış 200 öğrenciden haftalık kapanış fiyatının varyansı ise 65
120’sinin başarılı olduğu görülüyor. İşletme olarak hesaplanmıştır. B hisse senedinde
bölümü öğrencilerinin başarını oranının daha meydana gelen değişkenliğin A hisse
fazla olduğu iddiasını α = 0,10 önem senedinde meydana gelen değişkenlikten
seviyesinde test edip yorumlayınız. daha az olduğu iddiasını normal dağılış
varsayımı altında α = 0,05 önem seviyesinde
test edip yorumlayınız.

18) İki fabrikada çalışan işçilerin ücretlerinin


değişkenliği karşılaştırılmak isteniyor. Bu
amaçla A fabrikasından 9, B fabrikasından da
11 işçi şansa bağlı olarak seçiliyor. A
fabrikasından seçilen işçi ücretlerinin standart
sapması 15 TL., B fabrikasından seçilen
işçilerin ücretlerinin standart sapması ise 22
TL. olarak bulunmuştur. Ücretlerin normal
dağıldığı varsayımı altında her iki fabrikadaki
işçilerinin ücretlerinin varyanslarının eşit olup
olmadığını α = 0,10 önem seviyesinde test
edip yorumlayınız.

5
İSTATİSTİK-II
Korelasyon ve Regresyon

1
Korelasyon ve Regresyon

• Genel Bakış
• Korelasyon
• Regresyon
• Belirleme katsayısı
• Varyans analizi
• Kestirimler için aralık tahminlemesi
2
Genel Bakış

İkili veriler
 aralarında bir ilişki var mıdır?
 varsa bu ilişki bir eşitlik ile temsil
edilebilir mi?
 bu eşitliğin kestirimler (öngörümler)
için kullanılması

3
Korelasyon

4
Tanım
Korelasyon
bir değişkenin değeri değişirken
diğer bir değişken bununla
doğrusal ilişkili olarak
değişiyorsa korelasyon vardır
denebilir.

5
Varsayımlar
1. (x,y) ikili verilerden oluşan örnek
bir şans örneğidir.
2. x ve y’lerin dağılışı normaldir.

6
Tanım
Saçılma diyagramı
yatay eksen x, dikey eksen y
olmak üzere, (x,y) ikili örnek
verilerinin işaretlendiği bir
grafiktir. Her bir (x,y) ikilisi tek bir
noktadır.

7
Örnek
Bir firma bünyesindeki satış personeli
sayısı ile satış gelirleri arasındaki ilişkiyi
bilmek istemektedir.
Satış Personeli Sayısı Satış Gelirleri (yüz
Yıllar
(x) bin $) (y)
1999 15 1,35
2000 18 1,63
2001 24 2,33
2002 22 2,41
2003 25 2,63
2004 29 2,93
2005 30 3,41
2006 32 3,26
2007 35 3,63
2008 38 4,15
8
İkili Verilerin Saçılma Diyagramı
Scatterplot of satış geliri vs personel sayısı
4,5

4,0

3,5
satış geliri

3,0

2,5

2,0

1,5

1,0
15 20 25 30 35 40
personel sayısı

9
Pozitif Korelasyon

y y y

x x x
(a) Pozitif (b) Güçlü (c) Mükemmel
pozitif pozitif

10
Negatif Korelasyon

y y y

x x x
(d) Negatif (e) Güçlü (f) Mükemmel
negatif negatif

11
y y

x x
(g) Korelasyon yok (h) Doğrusal olmayan güçlü ilişki

12
Tanım
Korelasyon Katsayısı r
Bir örnekteki x ve y ikili değerleri arasındaki
doğrusal ilişkinin gücünü ölçmektedir.

nxy - (x)(y)
r=
n(x2) - (x)2 n(y2) - (y)2

13
Korelasyon Katsayısı r’nin
Özellikleri

1. -1  r  1
2. Mükemmel pozitif doğrusal ilişki olduğunda
r = 1 olur.
3. Mükemmel negatif doğrusal ilişki
olduğunda r = -1 olur.
4. Doğrusal ilişki yok ise r = 0 olur.

14
Korelasyon ile ilgili hatalar
1. Nedensellik: Korelasyon değişkenler
arasındaki sebep sonuç ilişkilerini açıklamaz.

2. Doğrusallık: x ile y arasında anlamlı bir


korelasyon olmadığı halde, aralarında farklı
şekilde bir ilişki olabilir. (Bakınız izleyen slayt)

15
Korelasyon ile ilgili hatalar

250

200

150
y

100

50

0
0 1 2 3 4 5 6 7 8

16
Örnek Verileri İçin Korelasyon
Hesaplamaları
Satış Gelirleri
Satış Personeli
Yıllar (yüz bin $) x2 y2 xy
Sayısı (x)
(y)
1999 15 1,35 225 1,8225 20,25
2000 18 1,63 324 2,6569 29,34
2001 24 2,33 576 5,4289 55,92
2002 22 2,41 484 5,8081 53,02
2003 25 2,63 625 6,9169 65,75
2004 29 2,93 841 8,5849 84,97
2005 30 3,41 900 11,6281 102,3
2006 32 3,26 1024 10,6276 104,32
2007 35 3,63 1225 13,1769 127,05
2008 38 4,15 1444 17,2225 157,7
Toplamlar 268 27,73 7668 83,8733 800,62

17
Örnek Verileri İçin Korelasyon
Hesaplamaları
nxy - (x)(y)
r=
n(x2) - (x)2 n(y2) - (y)2

(10)(800,62) - (268)(27,73)
r=
(10)(7668) - (268)2 (10)(83,8733) - (27,73)2

r = 0,987 Güçlü pozitif korelasyon

18
Anakütle Korelasyon
Katsayısının Testi
 =Anakütle korelasyon katsayısı
 H0: =
(anlamlı bir korelasyon yoktur)
H1: 
(anlamlı bir korelasyon vardır)

19
Test İstatistiği t

Test istatistiği:
r
t=
1-r2
n-2

Kritik değerler

serbestlik derecesi = n - 2 olan tablo


değerleri dikkate alınarak karar verilir.
20
Ret Bölgeleri

21
Anakütle Korelasyon
Katsayısının Testi
 =Anakütle korelasyon katsayısı
 H0: =
(satış personeli sayısı ile satış gelirleri arasında
anlamlı bir korelasyon yoktur)
H1: 
(satış personeli sayısı ile satış gelirleri arasında
anlamlı bir korelasyon vardır)

22
Test İstatistiği t

Test istatistiği:
0,987
r = 17,39
t= =
1-r2 1 – 0,987 2
n-2 10 - 2

Kritik değer
serbestlik derecesi = n - 2 = 10 – 2 = 8, a = 0,05 için t0,025, 8= 2,31 < 17,39

Karar: H0 ret. Korelasyon anlamlıdır.

23
Regresyon
x bağımsız değişken (açıklayıcı
değişken)

y bağımlı değişken (cevap = yanıt


değişkeni)

y = b0 + b1x + e Basit doğrusal


regresyon modeli

b1 = eğim b0 = kesen
24
Regresyon
 Regresyon Eşitliği
Verilen bir ikili veriler topluluğu için regresyon
eşitliği,

y^ = b0 + b1x
iki değişken arasındaki ilişkiyi tanımlamaktadır.

b1 = eğim b0 = kesen
 Regresyon Doğrusu
Regresyon eşitliğinin grafiğidir.

25
Regresyon Doğrusu
Scatterplot of satış geliri vs personel sayısı
4,5

4,0

3,5
satış geliri

3,0

2,5

2,0

1,5

1,0
15 20 25 30 35 40
personel sayısı

26
Notasyon

Anakütle Örnek
Parametresi istatistiği

Regresyon eşitliğinde kesen 0 b0

Regresyon eşitliğinin eğimi 1 b1


Regresyon modeli ve eşitliği y = 0 + 1 x + e ^
y = b0 + b1 x

27
Artıklar ve En Küçük Kareler
Yöntemi
Artıklar
e = (y - ^
y)
En Küçük Kareler Yöntemi
e2’yi minimum yapan b0 ve b1 değerlerinin
bulunmasıdır.

28
0 and 1 için En Küçük Kareler
Tahminleyicileri
(y) (x2) - (x) (xy)
b0 =
n(x2) - (x)2

n(xy) - (x) (y)


b1 =
n(x2) - (x)2

29
Önce b1 bulunursa, ardından

b0 = y - b1x

30
Satış geliri için regresyon
eşitliğinin tahminlenmesi
n(xy) - (x) (y)
b1 =
n(x2) - (x)2
10(8,62) - (268) (27,73)
b1 =
10(7668) - (268)2

b1 = 0,118

b0 = y - b1x = 2,773 – (0,118)(26,8) = - 0,398


31
Kestirimler (Öngörümler)
Verilen bir x değeri için y’nin değeri ne
olur?..
Eğer anlamlı bir korelasyon varsa, en iyi
öngörülen y değeri, x değerinin regresyon
eşitliğinde yerine konulmasıyla bulunur.

Önemli Not: Regresyon doğrusu yalnızca


tahminlemede kullanılan x uzayı içinde
geçerlidir. Mevcut x’lerden uzak bir noktada
öngörümleme yapılmamalıdır. 32
30 satış personeli çalıştığında satış gelirinin
kestirilmiş değeri nedir?

^
y = - 0.398 + 0.118 (30)

^
y = 3.1516, 315160 $

33
Toplam Değişkenlik, Açıklanan Değişkenlik ve
Açıklanamayan Değişkenlik
y
20
(5, 19)
19
18

17 Açıklanamayan
16 değişkenlik
15 Toplam (5, 13) ^)
14 (y - y
13
değişkenlik
(y - y )
• Açıklanan
12
11 değişkenlik
10
(^
y - y)
9
8

7 (5, 9) y=9
6
5
4
y^ = 3 + 2x
3
2
1
0 x
0 1 2 3 4 5 6 7 8 9

34
(toplam değişkenlik) = (açıklanan değişkenlik) + (açıklanamayan değişkenlik)

(y - y) = ^
(y - y) + (y - ^y)

(toplam değişkenlik) = (açıklanan değişkenlik) + (açıklanamayan değişkenlik)

(y - y) =  +  (y - y)
2 ^ 2 ^ 2
(y - y)
(Genel kareler toplamı) = (regresyon kareler toplamı) + (artık kareler toplamı)

35
Tanım
Belirleme Katsayısı
y’deki değişkenliğin ne kadarının regresyon
doğrusu tarafından açıklanabildiğini söyler.

2 Regresyon kareler toplamı


r =
Genel kareler toplamı

^ - y)2
 (y
2
RKT
r = =
 (y - y)2 GKT

36
^ - y)2
 (y
2
b12( x2 – (x)2/n)
r = =
 (y - y)2  y2 – (y)2/n

2
0,1182(7668 – (268)2/10)
r = = %97,4
83,873– (27,73)2/10

y’deki değişmelerin %97,4’ü regresyon doğrusu


ile açıklanabilmektedir.
37
Varyans Analizi Tablosu (VAT)
Değişkenlik Kareler Serbestlik Kareler F-Oranı
Kaynağı Toplamları (KT) Derecesi Ortalaması (KO)
Regresyon KO =
Regresyon
RKT = b1 ( x – (x) /n) 1
2 2 2 RKO = RKT / 1
RKO
Artık Kareler Toplamı Artık KO = F
Artık AKT = GKT - RKT AKO = AKT / (n – 2) AKO
n-2
= S2

Toplam
(Genel) Genel Kareler Toplamı n-1
GKT =  y2 – (y)2/n

38
Hata Varyansının Tahmini
2  (y - y) ^ 2

s = = Artık Kareler
n-2 Ortalaması

Tahminin Standart Hatası


 (y ^
- y) 2

s= n-2
39
F - Testi

 H0: 12...k
(Model anlamsızdır)
H1: en az bir i için i
(Model anlamlıdır)

40
F – Testi (Basit Doğrusal
Regresyon İçin)

 H0: 1
(Model anlamsızdır)
H1: 1
(Model anlamlıdır)

Test İstatistiği = F – oranı

Ret Bölgesi = F > Fa, 1, (n – 2) ise H0 RET.

41
Varyans Analizi Tablosu (VAT)
(Satış Gelirleri Örneği)
Değişkenlik Kareler Serbestlik Kareler F-Oranı
Kaynağı Toplamları (KT) Derecesi Ortalaması (KO)
Regresyon KO =
RKT = b12( x2 – (x)2/n)
RKO = RKT / 1
Regresyon = 6,7982 / 1 RKO
2 2
= 0,118 (7668 –(268) /10) 1 F
= 6,7982
= 6,7982 AKO

Artık Kareler Toplamı Artık KO = 6,7982


AKO = AKT / (n – 2) F
AKT = GKT – RKT 0,0225
Artık n–2= = 0,1798 / 8
= 6,9780 - 6,7982
10 – 2 = 8 = 0,0225 = 302,41
= 0,1798

GKT =  y2 – (y)2/n
Toplam
= 83,873– (27,73)2/10 n–1=
(Genel) = 6,9780 10 – 1 = 9

42
F – Testi (Satış Gelirleri Örneği
İçin)

 H0: 1
(Model anlamsızdır)
H1: 1
(Model anlamlıdır)

Test İstatistiği = F – oranı = 302,41

Karar = F = 302,41 > F0,05, 1, 8 = 5,32 H0 RET.

43
Anakütle Regresyon
Katsayısılarının Testi
 1=Anakütle regresyon
katsayısı (X1 için)

 H0: 1=
(1 anlamsızdır)
H1: 1
(1 anlamlıdır)

44
Test İstatistiği t

Test istatistiği:
b1
t=
Sb1

Sb1 = b1’in standart hatasıdır.


S
Sb1=
(x2 – (x)2/n)

45
Kritik değerler

serbestlik derecesi = n - 2 olan


tablo değerleri dikkate alınarak
karar verilir.

|t | > t a/2, n – 2 ise H0 RET.

46
Anakütle Regresyon
Katsayısılarının Testi (Satış
Gelirleri Örneği)
 1=Anakütle regresyon
katsayısı (X1 için)

 H0: 1=
(1 anlamsızdır)
H1: 1
(1 anlamlıdır)

47
Test İstatistiği t

Test istatistiği:
0,118
b1
t= = = 17,39
S b1 0,006804

Sb1 = b1’in standart hatasıdır.


S 0,1499
Sb1= = =0,006804
(x2 – (x)2/n) (7668 – (268)2/10)

48
Kritik değerler
serbestlik derecesi = n - 2 olan
tablo değerleri dikkate alınarak
karar verilir. a = 0,05 olsun.

|17,39 | > t a/2, n – 2 = t 0,025, 8 = 2,306


H0 RET. 1 anlamlıdır.

Basit doğrusal regresyonda t2 = F


olmaktadır.

49
Anakütle Regresyon
Katsayısılarının Testi
 0=Anakütle regresyon
modelinde sabit terim

 H0: 0=
(0 anlamsızdır)
H1: 0
(0 anlamlıdır)

50
Test İstatistiği t

Test istatistiği:
b0
t=
Sb0

Sb0 = b0’in standart hatasıdır.


S x2
Sb0=
n(x2 – (x)2/n)

51
Kritik değerler

serbestlik derecesi = n - 2 olan


tablo değerleri dikkate alınarak
karar verilir.

|t | > t a/2, n – 2 ise H0 RET.

52
Anakütle Regresyon
Katsayısılarının Testi (Satış
Gelirleri Örneği)
 0=Anakütle regresyon
modelindeki sabit terim
 H0: 0=
(0 anlamsızdır)
H1: 
(0 anlamlıdır)

53
Test İstatistiği t

Test istatistiği:
b0 - 0,398
t= = = - 2,11
S b0 0,1884

S x2 (0,1499) (7668)


S b1 = =
n(x2 – (x)2/n) (10)(7668 – (268)2/10)

=0,1884

54
Kritik değerler
serbestlik derecesi = n - 2 olan
tablo değerleri dikkate alınarak
karar verilir. a = 0,05 olsun.

|- 2,11 | < t a/2, n – 2 = t 0,025, 8 = 2,306


H0 REDDEDİLEMEZ. 0 anlamsızdır.

55
E(y) Değeri İçin Kestirim Aralığı

^
y ^ +E
- E < E(y) < y

Burada
2
1 n(x0 - x)
E = ta2,n - 2 s n + n(x2) - (x)2

• x0, x’in verilen bir değeridir.


^değeri
• Karekök içindeki ifade ile S’nin çarpımı ise x0’daki y
için standart hatadır.
• Standart hata en düşük değerini x0 = x olduğunda alır.
56
E(y) Değeri İçin Kestirim Aralığı
x0 = 30 personel için satışların beklenen değeri
%95 güven ile hangi aralıkta gerçekleşir?

3.1516 - E < E(y) < 3.1516 + E

1 (10)(30 -26,8)2
E = (2,306)(0,1499)
10
+ (10)(7668) - (268)
2

E = (2,306)(0,01815) = 0,04186

3,1097 < E(y) < 3,1935


57
ÖRNEKLEME DAĞILIŞLARI VE
TAHMİNLEYİCİLERİN ÖZELLİKLERİ
TEMEL KAVRAMLAR
PARAMETRE: ÖRNEK İSTATİSTİĞİ
• Populasyonun sayısal (PARAMETRE
açıklayıcı bir ölçüsüdür ve TAHMİNLEYİCİSİ):
anakütledeki tüm • Bir örneğin sayısal betimsel
elemanlar dikkate ölçüsüdür ve örnekteki
alınarak hesaplanabilir. gözlemlerden hesaplanır.
• Ana kütledeki tek bir • Diğer bir deyişle bilinmeyen bir
eleman dahi işlemin parametrenin sayısal değerini
dışında kalır ise elde bulabilmek (tahminlemek) için
edilen sonuç parametre kullanılır.
olarak kabul edilemez.
PARAMETRE VE ÖRNEK
İSTATİSTİKLERİ İÇİN ÖRNEKLER
Parametre  Örnek istatistiği ˆ
• Anakütle ortalaması  • Örnek ortalaması x
• Anakütle Medyan M • Örnek Medyanı m
• Anakütle Varyansı 2 • Örnek Varyansı s2
• Anakütle Standart • Örnek Standart
sapması  sapması s
• Anakütle Oranı  • Örnek Oranı p
Bir Populasyon Parametresi Hakkında
En Geniş Bilgiyi Hangi Örnek
İstatistiğinin İçerdiğine Nasıl Karar
Verilecek?
Örneğin anakütle ortalaması  için
• Aritmetik ortalama
• Geometrik ortalama
• Harmonik ortalama
• Medyan
vb. örnek istatistiklerinden hangisi tercih
edilmelidir.
Örnek 1 a
Bir zar atılışında x üst yüzdeki sayıyı göstersin. E(x)=
anakütle parametresini (anakütle ortalamasını)
bulunuz.
x 1 2 3 4 5 6

P(x) 1/6 1/6 1/6 1/6 1/6 1/6

xP(x) 1/6 2/6 3/6 4/6 5/6 6/6

6
1 2 6 21
  E ( x)   xP( x)    ......    3,5
x 1 6 6 6 6
Örnek 1b
• Ancak bu  değerinin bir an için bilinmediği
ve bunu tahmin etmek için populasyondan
3 örnek alındığını varsayılsın.
• Zar 3 kez atılsın ve örnek sonuçları; x1=2, x2=2,
x3=6 elde edilsin.
 x 2  2  6 10
x    3,333 ve m=2 hesaplanabilir.
n 3 3

 =3.5
 

1 2 3 4 5 6

X=3.3
m=2

SONUÇ: x değeri  değerine daha yakındır.


•Zar 3 kez daha atılsın ve örnek sonuçları; x1=3, x2=4,
x3=6 elde edilsin.
13
x  4,3 ve m=4
3

  

1 2 3 4 5 6
x
m

SONUÇ: m değeri  değerine daha yakındır.


Örnek İçin Yorum
1. Örnekten hesaplanan örnek istatistikleri (tahminleyiciler)
birer şans değişkenidir.

2. Ne örnek aritmetik ortalaması x


Ne de örnek medyanı (m) ,
populasyon ortalamasına daima daha yakındır denilemez.
Sonuçların genellenebilmesi için örnek istatistiklerinin
dağılışına gerek duyulmaktadır.
ÖRNEKLEME DAĞILIMLARI
• Anakütleden n adet ölçümden
x1, …, xn oluşan bir örnekten
alınmış olsun.
• Anakütledeki eleman sayısı N
olsun.
• Anakütleden alınabilecek her
biri n adet eleman içeren tüm
N
mümkün örnek sayısı:    k
n
ÖRNEKLEME DAĞILIMLARI
• Bu koşullar (N, n) altında
hesaplanabilecek örnek
istatistiği sayısı k adettir.
• Örnek istatistiğinin
anakütlesindeki eleman sayısı k
olur.
• Örnek verilerinden hesaplanan
bir örnek istatistiği için elde
edilen bu anakütle örnekleme
dağılışı olarak adlandırılır.
ÖRNEKLEME DAĞILIMLARI
• Örnekleme dağılımı bu
istatistiğin bir olasılık
dağılışıdır.
• Örnekleme dağılımı
anakütledeki eleman sayısı N ve
n örnek hacminin bir
fonksiyonudur.
ÖRNEK 2
Büyük bir populasyondan alınmış 3 ölçümün (0, 3, 12) olasılık dağılışı aşağıdaki gibidir.

x 0 3 12
P(x) 1 1 1
3 3 3

n=3

a) Örnek ortalaması ( x )’ nın örnekleme dağılışı

b) Örnek medyanı (m)’ nın örnekleme dağılışını bulunuz.

DİKKAT: ANAKÜTLEDEKİ ELEMAN SAYISI N BİLİNMİYOR. FAKAT ŞANS

DEĞİŞKENİNİN OLASILIK DAĞILIMI P(x) BİLİNİYOR.


Mümkün Örnekler Olasılık
x m p= x / n
(x tek sayı
gelmesi durumu)
0 0 0 0 0 1/27 0/3
0 0 3 1 0 1/27 1/3
0 0 12 4 0 1/27 0/3
0 3 0 1 0 1/27 1/3
0 3 3 2 3 1/27 2/3
0 3 12 5 3 1/27 1/3
0 12 0 4 0 1/27 0/3
0 12 3 5 3 1/27 1/3
0 12 12 8 12 1/27 0/3
3 0 0 1 0 1/27 1/3
3 0 3 2 3 1/27 2/3
3 0 12 5 3 1/27 1/3
3 3 0 2 3 1/27 2/3
3 3 3 3 3 1/27 3/3
3 3 12 6 3 1/27 2/3
3 12 0 5 3 1/27 1/3
3 12 3 6 3 1/27 2/3
3 12 12 9 12 1/27 1/3
12 0 0 4 0 1/27 0/3
12 0 3 5 3 1/27 1/3
12 0 12 8 12 1/27 0/3
12 3 0 5 3 1/27 1/3
12 3 3 6 3 1/27 2/3
12 3 12 9 12 1/27 1/3
12 12 0 8 12 1/27 0/3
12 12 3 9 12 1/27 1/3
12 12 12 12 12 1/27 0/3 5
ÖRNEK 2
 Aritmetik Ortalama Örnekleme Dağılışı

x 0 1 2 3 4 5 6 8 9 12
P x  1 3 3 1 3 6 3 3 3 1
27 27 27 27 27 27 27 27 27 27

 Medyan Örnekleme Dağılışı

m 0 3 12
P (m) 7 13 7
27 27 27
ÖRNEK İSTATİSTİKLERİNİN-
TAHMİNLEYİCİLERİN
ÖZELLİKLERİ
 sapmasızlık
 minimum varyanslılık

Eğer bir tahminleyici bu iki özelliği de sağlıyor ise buna


en iyi tahminleyici-etkin tahminleyici denir.
SAPMASIZLIK

 Eğer örnek istatistiğinin örnekleme dağılışının


anakütle ortalaması populasyon parametresine
eşit ise bu istatistiğe parametrenin
sapmasız tahminleyicisi
denir.

 E ˆ  
: Parametre
A, B : İstatistik

f(A)

A

 için sapmasız örnek istatistiği

f(B)

B

Sapma

 için sapmalı örnek istatistiği


ÖRNEK 3 Sapmasızlık
Anakütle ortalaması için aritmetik ortalama sapmasız fakat medyan
sapmalı bir tahminleyicidir.

Ex   E  m  

P(X) Sapmasız Sapmalı

A C

X
x m
ÖRNEK 3:
• Örnek 2 verileri için aritmetik ortalama ve
örnek medyanının tahminleyici özelliklerini
araştırınız.
ÖRNEK 3:
Aritmetik ortalama x , anakütle ortalamasının
 sapmasız bir tahminleyicisi midir?
x 0 3 12
P(x) 1/3 1/3 1/3

N
  E  x    xi P( xi )
i 1
1 1 1
 0    3    12  
3 3  3
5
ÖRNEK 3:
x 0 1 2 3 4 5 6 8 9 12
P  x  1/27 3/27 3/27 1/27 3/27 6/27 3/27 3/27 3/27 1/27

N
 x  E  x    xi P( xi )
i 1
 1   3   1 
 0    1    12  
 27   27   27 
5
ÖRNEK 3:

Sonuç:
Ex  
olduğundan aritmetik ortalama (tahminleyici),
anakütle ortalamasının (parametrenin)
sapmasız bir tahminleyicisidir.
ÖRNEK 3:

Sonuç:
E  m  
olduğundan örnek medyanı (tahminleyici),
anakütle ortalamasının (parametrenin)
sapmalı bir tahminleyicisidir.
MİNİMUM VARYANSLILIK
 Anakütle parametresi  olsun.
 Parametrenin tahminleyicileri; ˆ1 , ,ˆk
olsun.
 Eğer,
   
V ˆi  V ˆj i  j  1,..., k  1
ise
ˆi tahminleyicisi  parametresinin minimum
varyanslı tahminleyicisidir.
ÖRNEK: MİNİMUM VARYANSLILIK
 Anakütle parametresi  (anakütle
ortalaması) olsun.
 Parametrenin alternatif tahminleyicileri;
ˆ1  x
ˆ2  G.O
ˆ3  H .O
ˆ4  m
olsun.
 V  x   V  m   V  G.O   V  H .O 
x tahminleyicisi  parametresinin minimum
varyanslı tahminleyicisidir.
ÖRNEK: ETKİN TAHMİNLEYİCİ
 Anakütle parametresi  (anakütle
ortalaması) olsun.
 Parametrenin alternatif tahminleyicileri;
ˆ1  x
ˆ2  G.O
ˆ3  H .O
ˆ4  m
olsun.
 E  x    ve
V  x   V  m   V  G.O   V  H .O 
x tahminleyicisi  parametresinin etkin
tahminleyicisidir.
ÖRNEK: ETKİN TAHMİNLEYİCİ

P(X) Ortalamanın
örnekleme
dağılışı B
Medyanın
A örnekleme
dağılışı

 X
ÖRNEKLEME DAĞILIMI ÖRNEK
HACMİNİN BİR FONKSİYONUDUR
Örnek Hacmi büyüdükçe tahminleyicinin varyansı küçülür.

Büyük
P(X) örnek
hacimli
durum
B
Küçük
örnek
A hacimli
durum

X

ÖRNEK 3:
Örnek medyanı m, anakütle ortalamasının 
sapmasız bir tahminleyicisi midir?

m 0 3 12
P(m) 7/27 13/27 7/27
 7   13   7 
E  m    mi P  mi   0    3    12  
i  27   27   27 
 4.56
E  m  
ÖRNEK 3:
Aritmetik ortalama x , anakütle ortalamasının 
Minimum Varyanslı bir tahminleyicisi midir?

x 0 3 12
P(x) 13 13 13
x2 0 9 144
x2P(x) 0 9 3 144 3

E  x 2    xi2 P ( xi ) 
153
3

  V  x   E  x    E  x 
2 2 2
x

153 2
 5
3
 26
ÖRNEK 3
Aritmetik ortalamanın varyansı  x2
xi 0 1 2 3 4 5 6 8 9 12
P  xi  1
27
3
27
3
27
1
27
3
27
6
27
3
27
3
27
3
27
1
27

xi 2 0 1 4 9 16 25 36 64 81 144
xi 2 P  xi  0 3 27 12 27 9 27 48 27 150 27 108 27 192 27 243 27 144 27

E  x    xi P  xi  
2 2 909
27
V  x   E ( x )   E ( x )
2 2

909
  (5)2
27
=8,66
ÖRNEK 3
Örnek medyanının varyansı  2
m

mi 0 3 12
7 13 7
P(mi) 27 27 27
mi2 0 9 144
2 117 1008
mi P(mi) 0 27 27

E m 2
   m P  m   41.66
i
2
i

V  m   E (m )   E (m)
2 2

 41.66  (4.56)2
=20.86
ÖRNEK 3
Sonuç:
V  x   V  m
Aritmetik ortalama x , anakütle ortalamasının
 Sapmasız ve Minimum Varyanslı
bir tahminleyicisidir.
BEKLENEN DEĞER VE VARYANS
OPERATÖRLERİNİN ÖZELLİKLERİ
BEKLENEN DEĞER OPERATÖRÜ E(.)
Şans değişkeni x anakütle ortalaması  ve
anakütle varyansı  olsun.
2

a ile b birer sabit sayı olmak üzere,


 E(a)=a
 E(ax)=aE(x)=a
 E(ax+b)=aE(x)+b=a+b
BEKLENEN DEĞER VE VARYANS
OPERATÖRLERİNİN ÖZELLİKLERİ
VARYANS OPERATÖRÜ V(.)
Şans değişkeni x anakütle ortalaması  ve
anakütle varyansı 2 olsun.
a ile b birer sabit sayı olmak üzere,
 V(a)=0
 V(ax)=a V(x)= a 
2 2 2

 V(ax+b)= a2V(x)= a22


MERKEZİ LİMİT TEOREMİ
 Şans değişkeni x’in dağılımı ne olursa
olsun bu anakütleden alınan n hacimli
örneklerden hesaplanan aritmetik
ortalamanın x dağılımı yaklaşık olarak
normal dağılıma sahiptir.
 Örnek hacmi büyüdükçe aritmetik
ortalamanın x dağılımının normal
dağılıma yakınsaması artar.
Şans Değişkenlerinin
Standartlaştırılması
• Standart değişkenler genellikle z ile
gösterilir.
• ortalaması sıfır, E(z)=0
• Varyansı bir, V(Z)=1.

şans değişkeni-anakütle ortalaması


z
anakütle standart sapması
BAZI ÖNEMLİ TAHMİNLEYİCİLER İÇİN
ÖRNEKLEME DAĞILIMLARININ
BELİRLENMESİ

 Aritmetik ortalama x
 Örnek varyansı s 2

 Örnek oranı p
BİR DAĞILIMIN BELİRLENMESİ

• Dağılışın tipinin belirlenmesi,


(Normal, Üstel, Poisson vb.)
• Dağılımın parametrelerinin
belirlenmesi
ARİTMETİK ORTALAMA x İÇİN
ÖRNEKLEME DAĞILIMI
Şans değişkeni x anakütle ortalaması  ve
anakütle varyansı 2 olsun.

n
x x1  x2   xn
x 
i 1 i

n n
Cevaplanması gereken sorular
 Dağılımın tipi?
 Parametreleri;
Ex  ?
V x  ?
DAĞILIMIN TİPİ
• Merkezi limit teoremine göre aritmetik
ortalamanın dağılımı yaklaşık olarak
normal dağılıma sahiptir.
• Normal dağılımın parametreleri:
– Anakütle ortalaması
– Anakütle varyansı
Dağılımın Parametreleri: Aritmetik
Ortalama için Anakütle Ortalaması
  in1 xi  1
Ex  E    E  x1    E  xn  
 n  n
 
1 n
E  x        
n n
Ex  
Dağılımın Parametreleri: Aritmetik
Ortalama için Anakütle Varyansı

  i 1 xi
n
 1
V x V    2 V  x1    V  xn  
 n
  n
1 n 2
V  x   2  
 2
    2
2

n n
 2
V x 
n
ARİTMETİK ORTALAMA x İÇİN
ÖRNEKLEME DAĞILIMI

  
2
x ~N   x ;    N   x ; 
2
x
x

 n 
Aritmetik Ortalamanın
Standartlaştırılması

x - x
z
x
x - x
z
x n
Normal olmayan dağılışlardan
örnekleme
•Merkezi eğilim
Anakütle dağılışı
x   = 10

•Yayılma
  = 50 X
x 
n Örnekleme dağılışı
– Yerine koyarak n = 4 n =30
örnekleme X = 5 X = 1.8

X- = 50 X
Normal dağılış gösteren bir
anakütleden örnekleme
•Merkezi eğilim
Anakütle dağılışı
x   = 10

•Yayılma
  = 50 X
x 
n Örnekleme dağılışı
Yerine konularak n = 4 n =16
örnekleme X = 5 X = 2.5

X- = 50 X
Merkezi limit teoremi
Örnek
hacmi 
yeterince x 
büyükse n
Örnekleme
(n  30) ...
dağılışı
hemen hemen
normal olur.

X
x  
ÖRNEK 3
•Telekom’da çalışan bir
uzman, uzun zaman
yaptığı gözlemlerden,
telefon konuşma
sürelerinin (x),
 = 8 dk. &  = 2 dk. olan
normal dağılış gösterdiğini
belirlemiştir.
25 görüşme rasgele
seçilirse, örnek
ortalamasının 7.8 & 8.2
dakika arasında çıkması
olasılığı nedir? © 1984-1994 T/Maker Co.
Çözüm
X   7.8  8
Z    .50
 n 2 25
X   8.2  8
Örnekleme dağılışıZ    .50 Standart Normal
 n 2 25
Dağılış
X = .4 =1
.3830

.1915 .1915

7.8 8 8.2 X -.50 0 .50 Z


ÖRNEK ORANI: p

 Birbirinden bağımsız n adet Bernoulli Deneyinin bir


araya gelmesi sonucunda x başarı sayısı Binom
Dağılımına sahiptir.
 Başarı olayının populasyon oranının bilinmediği
durumlarda olasılık hesaplamaları için kullanacak dağılışı
belirlemek bir problemdir olarak.
 Örnek olarak bir yeni ilin A partisi için oy oranının
belirlenmesi veya yeni çıkan bir derginin tüm rakip
dergiler dikkate alında satış yüzdesinin belirlenmesi
verilebilir.
ÖRNEK ORANI: p

 Bu gibi örneklerde anakütle başarı olasılığını “” ’yi


tahminlemek amacıyla populasyondan alınan örnekten
elde edilen bilgiler doğrultusunda örnek oranı p
hesaplanır.
 İlgilenilen başarı olasılığının ’nin bilinmediği
durumlarda n hacimlik örnek alındığında ve x örnekteki
başarı sayısı olarak ele alındığında, örnekten elde edilen
başarı olasılığı (örnek oranı);
x
p
n
ÖRNEK ORANI p İÇİN
ÖRNEKLEME DAĞILIMI
Şans değişkeni x sabit n hacimli denemede
ortaya çıkan başarı sayısı olsun. x ~B  n;  
Örnek oranı:
x
p
n
Cevaplanması gereken sorular
 Dağılımın tipi?
 Parametreleri;
p  E  p  ?
 p2  V  p   ?
DAĞILIMIN TİPİ
• Merkezi limit teoremine göre örnek oranının
dağılımı eğer n örnek hacmi yeterince büyük ise
yaklaşık olarak normal dağılıma sahiptir.
• Bunun temel sebebi örnek oranının, n adet
denemede ortaya çıkan ortalama başarı sayısını
temsil etmesidir.
• Normal dağılımın parametreleri:
– Anakütle ortalaması
– Anakütle varyansı
Dağılımın Parametreleri: Örnek Oranı
için Anakütle Ortalaması
 x 1
E  p  E    E  x
n n
n
E  p 
n
E  p  

Not: x şans değişkeni binom dağılımına


sahip olduğundan:
E(x)=n
Dağılımın Parametreleri: Örnek oranı
için Anakütle Varyansı
 x 1
V  p  V    2 V  x
n n
n 1   
V  p 
n2
 1   
V  p 
n

Not: x şans değişkeni binom dağılımına


sahip olduğundan:
V(x)=n(1-)
ÖRNEK ORANI p İÇİN
ÖRNEKLEME DAĞILIMI

      
p ~N   p ; p   N   ;
2 1

 n 
Örnek Oranının Standartlaştırılması

p - p
z
p
p-
z
 1    n
Örnek Hacminin Örnek Oranı Üzerindeki
Etkisi
Anakütle oranı  sabitken örnek hacmi arttığında örnek
oranının standart hatası küçülür.
Aşağıdaki şekilde görüldüğü gibi örnek hacmi arttığında
p’in kendi ortalaması etrafında yoğunlaştığı
görülmektedir.

f ( p)
n=400

n=100

.68 .72 .76 .80 .84 .88 .92


p
ÖRNEK 4
Büyük bir populasyondan alınan 3 ölçüm ile ilgili
örneğe dönersek x başarı sayısının örnekte tek sayı
gelme olayını göstermek üzere örnek oranının
beklenen değerini ve varyansını bularak dağılımını
elde ediniz.
ÖRNEK 4
pi 0/3 1/3 2/3 3/3
pi2 0/9 1/9 4/9 9/9
P(pi) 8/27 12/27 6/27 1/27

E ( p)   pi P  pi 
i

E ( p)     p
8  0  12  1  6  2  1  3 
E ( p)              0.33
27  3  27  3  27  3  27  3 
ÖRNEK 4

 1   
I. YÖNTEM  2
p  V  p 
n
 (1   ) 0.33(1  0.33)
 p2    0.074
n 3

II. YÖNTEM  p2  E ( p 2 )   E ( p)2

E ( p 2 )   pi2 P  pi 
i

8  0  12  1  6  4  1  9 
E( p2 )              0.185
27  9  27  9  27  9  27  9 
 p2  E ( p 2 )   E ( p)  0.185  (0.33) 2  0.074
2
ÖRNEK 5
Gelirler Genel Müdürlüğü’ne göre, bütün vergi
beyannamelerinin % 75’i vergi iadesine yol açmaktadır. 100
beyannamelik bir rassal örneklem alınmıştır.
a) Vergi iadesine yol açan beyannamelerin örneklem
oranının ortalaması kaçtır?
b) Örneklem oranının varyansı kaçtır?
c) Örneklem oranının standart hatası kaçtır?
d) Örneklem oranının 0,8’den büyük olma olasılığı kaçtır?
ÖRNEK 5
Çözüm:
a) E ( p)    0,75
 (1   )
b)  
2
p
n
0,75(1  0,75)
 
2
p  0,001875
100
c) Standart Sapma (ya da Standart Hata)
   p  0,001875  0,0433
2
p
ÖRNEK 5
d) P( p  0,8)  ?
p  0,8  
P( p  0,8)  P(  )
p p
0,8  0,75 0,8  0,75
 P( z  )  P( z  )
0,0433 0,0433
 P( z  1,15)  0,5  0,3749  0,1251
Ki-Kare Dağılışı

 2
v =
(n - 1) s 2
2

n = örnek miktarı
s 2 = örnek varyansı
2 = anakütle varyansı
df = serbestlik derecesi = n – 1=v
Ki-Kare Dağılışı

 Ki-kare dağılımının tek bir parametresi


vardır: v
 Bu parametre genel olarak serbestlik
derecesi olarak adlandırılır.
  v şeklinde gösterilir.
2

 Ki-kare dağılımı normal (standart normal)


dağılıma sahip şans değişkenlerinden elde
edlilir.
Ki-Kare Dağılışı
Şans değişkenleri xi ler normal dağılıma sahip
olmak üzere, Örnek varyansı:
 x  x
2

  n  1 s 2    xi  x 
2
s 2
 i

n 1

Eşitliğin her iki tarafı anakütle varyansına


bölünerek

 n  1 s  x  x
2 2

 i
  n21
2 2
Ki-Kare Dağılışı

Ki-kare şans değişeninin beklenen değeri:


E   v2   v

Ki-kare şans değişeninin varyansı:


V   v2   2v
Ki-kare istatistiğinin dağılışının
özellikleri
1. ki-kare dağılışı simetrik değildir
2. Serbestlik derecesi arttıkça, dağılış daha simetrik
hale gelir (normale yaklaşır)

Simetrik değil df = 10

df = 20

x2
0 0 5 10 15 20 25 30 35 40 45
Tüm değerler sıfır veya pozitif
ÖRNEK VARYANSININ
ÖRNEKLEME DAĞILIMI
Anakütle ortalaması  x ve anakütle varyansı  x olan bilinmeyen bir
2

populasyondan x1, x2,…, xn ile gösterilen n adet rassal bir örnek


alındığında populasyon varyansı aşağıdaki gibi bir beklenen değer
ifadesine eşittir:

 x2  E ( xi   x ) 2

Populasyon ortalaması  x bilinmediğinde yerine x konularak örnek


varyansı aşağıdaki gibi tanımlanır.

n
1
sx2   i
n  1 i 1
( x  x ) 2
ÖRNEK VARYANSININ
ÖRNEKLEME DAĞILIMI

Varyansı  x2 olan bir populasyondan alınan n hacimlik bir


örneğin örnek varyansı s x2 olarak ifade edildiğinde;
  x
n  1 s 2

 s 
 x2  n21
n 1  x
2 2

 2
 n  1
ÖRNEK VARYANSININ
ÖRNEKLEME DAĞILIMI
 s x2 ’nin örnekleme dağılımının ortalaması  x2 ’dir.

 x2 E   n21   x2  n  1
E s 2
   n  1 
x
 n  1
E ( s x2 )   x2
ÖRNEK VARYANSININ
ÖRNEKLEME DAĞILIMI
 s x2 ’nin örnekleme dağılımının varyansı, örnekleme
dağılımın Ki- Kare dağılımına uygun olduğunu
sonucundan hareketle ;

V s   V 
 
2 2
  4
V  n1 
 2


2 x n 1 x

  n  1   n  1
x 2

2 x  n  1
4

V  sx  
2

 n  1
2

2 4
V s  
2 x
x
 n  1
PARAMETRİK OLMAYAN
HİPOTEZ TESTLERİ
“Kİ-KARE TESTLERİ”

1
Populasyonun incelediğimiz bir özelliğinin
dağılışı bilenen dağılışlardan birisine,
Normal Dağılış,
t Dağılışı,
F Dağılışı,
gibi bir dağılışa uygun olduğu durumlarda
populasyonun parametrelerine ilişkin yapılan hipotez
testlerine parametrik hipotez testleri adı verilir.

2
Parametrik hipotez testleri genellikle
normal dağılış varsayımı altıda gerçekleştirilen
testlerdir.

Merkezi limit teoremi gereğince;


“ anakütle dağılışı ne olursa olsun o dağılışa
ilişkin örnekleme dağılışının normal dağıldığı
“sonucundan hareketle normal dağılışın çok
yaygın bir şekilde kullanıldığı açıkça ortadadır.
3
Populasyonla ilgili belli başlı
varsayımların ve parametre tahminlerinin
gerçekleştirilemediği, bu sebepten dolayı
dağılış varsayımı yapılamadığı durumlarda
kullanılan testler,

“ Parametrik Olmayan Hipotez Testleri”


olarak adlandırılır.

4
Parametrik Olmayan Hipotez Testlerinin
Kullanılabileceği Durumlar:
1) Gözlem ile elde edilen verilerin olması durumunda,

2)Parametrik test varsayımının yerine getirilemediği durumlarda

3)Testte kullanılacak değerler yerine bu değerlerin sıra


numaralarının verildiği durumlarda,

4)Testte kullanılacak örneklerin küçük hacimli olduğu


durumlarda.
5
Parametrik Olmayan Hipotez Testlerinin ;
AVANTAJLARI DEZAVANTAJLARI

• Uygulanması için • Örnek hacminin büyük olması


birçok varsayıma halinde uygulanması güçleşir.
gerek yoktur.

• Anlaşılması ve • Bu tür testlerin uygulanmasıyla


uygulanması elde edilen sonuçlar, parametrik
kolaydır. testlerin uygulanmasıyla elde
edilen sonuçlardan daha az
• Küçük hacimli bir güvenilirdir.
örnek üzerinden
yapılması
mümkündür.
6
Bu dersin kapsamı içinde parametrik olmayan
hipotez testlerinin yalnız bir kısmını oluşturan
“Parametrik Olmayan c2 Ki- Kare Hipotez Testleri”
’ne ye verilecektir.
Günümüzde birçok araştırmada kullanılan
değişkenler niteliksel yapıdadır.
Zarın atıldığında alacağı değerler,
göz rengi,
din, ırk ve dil gibi sınıflamalar.

7
Bazı durumlarda ise niceliksel yapıdaki bazı
değişkenlerin sınıflandırılarak niteliksel hale
dönüştürüldüğü görülür.
50 kilonun altında olan kişilere zayıf,
50-80 kilo arasında olanlara normal,
80 kilonun üstünde olanlara kilolu denmesi
gibi.
Niteliksel yapıya sahip değişkenler üzerinde
yapılan gözlemler çoğunlukla araştırılan özelliği
gösteren sınıfların sayıları şeklindedir.

8
Ele alınan değişkenlerin niteliksel yapıda
olduğu durumlarda, yapılan ölçüm ve gözlemlerin
ilgili sınıflara ait frekanslarını dikkate alan çalışmalar
için uygulanan hipotez testleri,

“PARAMETRİK OLMAYAN Kİ-KARE HİPOTEZ


TESTLERİ “

dir.

9
Parametrik Olmayan c2 Ki- Kare
Hipotez Testleri

İyi Uyum rxc Dağılışa Uyum


Testleri Bağımsızlık Testleri
Testleri • Uniform
• Binom
• Poisson
10
• Normal
Parametrik Olmayan c2 (Ki- Kare) Hipotez
Testleri adını kullanılan test istatistiğinden almıştır.
Yukarıdaki tabloda ifade edilen 3 faklı Ki-Kare testi;
sayımla elde edilen veya ölçülen değerlerin
iddia edilen teorik frekanslar uygun olup olmadığını,
populasyonun iki farklı özelliğinin birbirinden
bağımsız olup olmadığını,
populasyonunun dağılışının ifade edilen bilinen
bir dağılışa uygun olup olmadığını, ( Binom , Normal
vb. )
test etmek amacıyla kullanılır.
11
Burada ele alınan tüm durumlarda
kullanılacak test istatistiği ortak olmakla birlikte
Ki-Kare dağılışına uygundur.

Gi : Gözlenen Değerler
Bi : Beklenen Değerler

c 
2
k
(G i  Bi 
2

i 1 Bi

12
İyi Uyum Testleri
Gözlenen frekansların teorik beklenen frekanslara
uyup uymadığının araştırılmasında kullanılır.

Bir zar atıldığında eğer zar hilesiz ise tüm değerlerin


ortaya çıkma olasılığının birbirine eşit ve 1 / 6 olması,

Bir haftalık süre içinde Çiğli- Kipa’ya gelen


müşterilerin % 25’nin Cumartesi , % 25’nin Pazar ve diğer
hafta içi 5 günde de her gün % 10’nun gelmesi.

13
Toplam
Grup 1 2 3 ............ k

Gözlenen
değerler G1 G2 G3 ............ Gk n
( Gi )

H0 doğru iken
olasılık değeri p1 p2 p3 ............ pk 1
( pi )

H0 doğru iken
beklenen değer B1 = np1 B2 = np2 B3 =np3 Bk = npk n
............
( Bi )

14
Kullanılan ki-kare test istatistiği göz önünde
bulundurulacak olursa, gözlenen ve beklenen değerler
arasındaki farkın anlamlı derecede büyük olması durumunda
teorik frekanslara gözlenen frekansların uymadığı sonucuna
varılır.
H0 : pi’ler ifade edilen teorik olasılık değerlerine eşittir.
H1 : En az bir eşitlik geçersizdir.

k (G i  Bi 2
c2    c k21;
i 1 Bi

ise H0 red edilir.


k : grup sayısı ( kategori sayısı ) 15
Örnek: Bir spor yazarı, Türkiye’deki kişilerin % 40 ‘ının
Fenerbahçe, % 25 ‘inin Galatasaray, % 20’sinin Beşiktaş ,
% 10’nun Trabzonspor’u ve geriye kalan % 5‘lik kısmın ise
diğer takımları desteklediğini düşünmektedir. Bu amaçla 1000
kişilik bir örnek alındığında aşağıdaki tablodaki sonuçlar elde
edilmiştir. Yazarın iddiasını % 5 ‘lik hata payıyla test ediniz.

Takım FB GS BJK TS Diğer Toplam

Taraftar 387 259 208 97 49 1000


Sayısı

16
H0 : pFB = 0,40, pGS = 0,25, pBJK = 0,20, pTRB = 0,10, pD = 0,05
H1 : En az bir eşitlik geçersizdir.

BFB = n pFB = 1000 ( 0,40 ) = 400 , GFB = 387


BGS = n pGS = 1000 ( 0,25 ) = 250 , GGS = 259
BBJK = n pBJK = 1000 ( 0,20 ) = 200 , GBJK = 208
BTRB = n pTRB = 1000 ( 0,10 ) = 100 , GTRB = 97
BD = n pD = 1000 ( 0,05 ) = 50 , GD = 49

17
k (G i  Bi 2 (387  4002 (259  2502 (  2
c h2     ....  49 50  1,18
i 1 Bi 400 250 50

2
χ tablo  2
χ k -1,α  2
χ 5-1;0,05  2
χ 4;0,05  9,49

c h2  c t2 olduğundan Ho red edilemez.

Spor yazarının taraftarların dağılış yüzdeleriyle ilgili


iddiasının % 5 hata payıyla doğru olduğu söylenebilir.

18
r x c Bağımsızlık Testleri
Bir populasyonun iki özelliğinin birbirinden
bağımsız olup olmadığını test etmede kullanılır.
Örneği meydana getiren bireyler iki farklı kritere
göre sınıflanır.
Örneğin bireylerin hem sigara içip
içmemelerine hem de içki içip içmemelerine gör
sınıflandırılması, iktisat bölümündeki öğrencilerin
matematik ve istatistik derslerindeki başarı
durumuna göre sınıflandırılması gibi.

19
Populasyonun sınıflandırılmasında iki özellik
dikkate alındığından dolayı iki yönlü tablolar
( kontenjans tabloları ) kullanılır.

Bu tabloların satırlarında ele alınan özelliklerden


birincinin farklı seviye veya durumlarını, sütunlarında
ise ikinci karakterlerin farklı seviye veya durumlarını
gösterilir.

Bu durumlar, sıralayıcı ve sınıflayıcı ölçekler


şeklinde olabilir.

20
İki Yönlü ( Kontenjans ) Tablolarda
Beklenen Değerlerin Hesaplanması
Özellik A
Özellik B 1 2 3 C Toplam
1 G11 G12 ....... G1c R1
2 G21 G22 ....... G2c R2
3 G31 G32 ....... G3c R3
.... ...... ...... ....... ........
R Gr1 Gr2 ....... Grc Rr
Toplam C1 C2 C3 Cc N
21
Herhangi bir hücrenin beklenen değerin
hesaplanmasında iki özelliğin var olması sebebiyle, o
hücrenin bulunduğu satır ve sütun toplamlarının
çarpımının örnek hacmine bölünmesiyle hesaplanır.
i. inci satır , j. inci sütundaki bir gözlemin beklenen
değeri ,
R iC j
Bij 
şeklinde bulunur. N

1. satır , 2. sütundaki hücrenin beklenen değeri,

R 1C 2
B12 
N
şeklindedir. 22
H0 : Populasyonun iki özelliği birbirinden bağımsızdır.
( aralarında ilişki yoktur. )
H1 : Populasyonun iki özelliği birbirinden bağımsız değildir.
( aralarında ilişki vardır. )

Test İstatistiği: r c (G ij  B ij 
2

 
i 1 j1 Bij

r c (G ij  Bij 
2

 
i 1 j1 Bij
 χ (r2 1)(c 1);α ise H0 red edilir.

23
Örnek: İzmir’in Buca ilçesinde yapılan bir anket çalışmasında
kişilerin oy verdikleri parti ile cinsiyet arasında bir ilişki olup
olmadığı araştırılmaktadır. Aşağıdaki tabloda anket sonucunda
elde edilen bilgiler bulunmaktadır. Buca ilçesinde oturan
kişilerin cinsiyetleri ile oy verdikleri parti arasında ilişki olup
olmadığını  = 0,01 önem seviyesinde test ediniz.

Cinsiyet

Kadın Erkek

A 100 150

Partiler B 200 200

C 200 150 24
H0 : Cinsiyet ile oy verilen parti birbirinden bağımsızdır.
H1 : Cinsiyet ile oy verilen parti birbirinden bağımsız
değildir.
Cinsiyet
Kadın Erkek Toplam
A 100 125 150 125 250
Partiler
B 200 200 200 200 400
C 200 175 150 175 350
Toplam 500 500 1000

R 1C1 250 * 500


B11    125
N 1000
25
r c (G ij  Bij 
2
(100  125 (150  125 (200  200
2 2 2

 
i 1 j1 Bij

125
 
125 200


(200  200 (200  175 (200  175
2

2

2
 17,14
200 175 175

χ 2
(r 1)(c 1);α χ 2
(31)(2 1);0,01  9,21

17,14 > 9,21 olduğundan dolayı H0 red edilir. % 99 olasılıkla


Buca ilçesindeki kişiler için oy verilen partiler ile cinsiyet
arasında bir ilişki olduğu söylenebilir.

26
DAĞILIŞA UYUM TESTLERİ

Örnek verilerinden yola çıkarak populasyonun dağılımı


hakkında ortaya atılan iddiayı test etmek için “Dağılışa
Uyum Testleri” kullanılır.

Örnek verileri gözlenen değerler olarak, örnek hacmi


dikkate alınarak ilgili dağılışın olasılık değerlerinden
yola çıkarak beklenen değerler (teorik frekanslar)
hesaplanır.

27
Dağılışa Uyum Testlerinde de kullanılacak olan test
istatistiği c 2
dağılışına uymaktadır. Örnekten elde edilen
gözlenen değerler ile dağılıştan yola çıkarak hesaplanan
beklenen değerler birbirine yakınsa hesaplanan c değeri
2

küçük çıkacak ve örnek verilerinin dağılışının iddia edilen


dağılışa uygun olduğu sonucu ortaya çıkacaktır.
Ho: Örnek verileri ilgili dağılışa uygundur.
H1: Örnek verileri ilgili dağılışa uygun değildir.

Dağılışa Uyum Testlerinde Kullanılacak


Olan Test İstatistiği:
k
(G  B 2
2
c  i i

i 1 Bi
28
Hesaplanan χ 2hesap değeri ile tablodan bulunan χ 2tablo
değeri karşılaştırılarak iddianın doğruluğu hakkında
karar verilir.

χ 2tablo  χ 2v,α

v = k - 1- g
k : χ hesap değeri bulunurken dikkate alınan grup
2

sayısı
g : İlgili dağılış için örnek verileri kullanılarak
hesaplanan (tahmin edilen) parametre sayısı

29
χ 2
hesap
χ 2
> tablo ise H0 red edilir.
c2

χ 2tablo

H0 ‘ın red edilemediği durumlarda örnek


verilerinin dağılışı parametresi bilinen veya
örnekten tahmin edilen dağılışa uygun olduğu
sonucuna varılır.
30
KESİKLİ ÜNİFORM(DÜZGÜN)
DAĞILIŞ
Tanımlı olduğu değerleri eşit olasılıklar ile alan şans
değişkenlerinin dağılışıdır. Kesikli üniform dağılışı gösteren bir
şans değişkeni N farklı değeri eşit olasılıklar ile alıyorsa her bir
değeri alma olasılığı 1/N’ e eşittir.

1
 x  1,2,3,........n
P (X  x    N
0 d.d

31
    p=1/N

N adet

Hilesiz bir zar atıldığında zarın yüzeylerinde


bulunan 6 sayının zarın ön yüzünde gelmesinin
olasılığı birbirine birbirine eşit ve 1/6 olacaktır.

32
Örnek: Büyük bir işletmede hafta içerisindeki 5 gün
içerisindeki işe gelmeme sayılarının dağılışı araştırılmaktadır.
Bu amaçla bir hafta boyunca her gün işe gelmeyen işçi sayıları
kontrol edilerek not edilmiştir. Hafta içerisinde iş yerine
gelmeyen işçi sayılarının dağılışının Üniform(Düzgün) Dağılışa
uygun olup olmadığını % 5 hata payıyla test ediniz.
Günler işe gelmeyen pi İşe gelmemesi (G i  Bi 2
işçi sayısı(Gi) beklenen işçi
sayısı(Bi) Bi
Pazartesi 15 1/5 12 0,75
Salı 9 1/5 12 0,75
Çarşamba 9 1/5 12 0,75
Perşembe 11 1/5 12 0,08
Cuma 16 1/5 12 1,33
toplam 60 1 60 3,66 33
Ho: İlgili işletmedeki hafta içi günlerdeki işe gelmeyen işçi
sayılarının dağılışı Üniform Dağılışına uygundur.
H1: İlgili işletmedeki hafta içi günlerdeki işe gelmeyen işçi
sayılarının dağılışı Üniform Dağılışına uygun değildir.

c 
2
k
(G i  Bi 
2
 3,66 χ 2tablo  χ 2v,α
h
i 1 Bi
v = k - 1- g = 5-1-0 =4
Üniform Dağılışında tahmin
edilen parametre sayısı 0’dır. χ 2tablo  χ 24,0.05  9,49

c h2  c t2 olduğundan Ho red edilemez.


İlgili işletmedeki hafta içi günlerdeki işe gelmeyen işçi
sayılarının dağılışı Üniform Dağılışına uygun olduğu % 5
hata payıyla söylenebilir.
34
Örnek: Meyve suyu üreticisi bir firma ürettiği meyve sularını
her birinde 20 şişe bulunmak üzere kutular halinde
poşetlemektedir. İşletmenin deposundan 100 kutu seçilerek
kutuların her birindeki hatalı şişelenmiş olan meyve suları
sayılarak kayıt edilmiştir. Aşağıdaki tabloda kutuların sayısı ve
içerisindeki hatalı bulunan şişe sayıları verilmiştir.
a) Toplam kaç şişe kontrol edilmiştir?
b) Toplam kaç hatalı şişe bulunmuştur?
c) Örnekteki hatalı şişelerin oranını nedir?
d) Kutuların içerisindeki bulunan hatalı meyve sularının
sayılarının Binom Dağılışına uygun olup olmadığını % 5 hata
payıyla test ediniz.
Hatalı Şişe Sayısı 0 1 2 3 4 5 ve daha fazla

Kutu Sayısı 48 25 15 8 3 1 35
a) Toplam 100 kutu kontrol edilmiştir. Her bir kutu
içerisinde 20 şişe meyve suyu bulunduğuna göre toplam
2000 adet şişe kontrol edilmiştir.
b)  xi fi  0  48  1 25  2 15  3 8  4  3  5 1  96
c)
ˆ  96  0,048  0,05
p
2000

d) Ho: Kutularda bulunan hatalı şişelerin sayısı n=20 olan Binom


Dağılışına uygundur.
H1: Kutularda bulunan hatalı şişelerin sayısı n=20 olan Binom
Dağılışına uygun değildir.

36
Hatalı Şişe Sayısı 0 1 2 3 4 5 ve daha
fazla
Kutu Sayısı (Gi) 48 25 15 8 3 1
pi 0,3585 0,3774 0,1887 0,0596 0,0133 0,0025
Beklenen Kutu 35,85 37,74 18,87 5,96 1,33 0,25
Sayısı (Bi)

n x  20 
P(X  x    p (1  p 
nx
P (X  0   
0  (0,050
(1  0,0520-0

x  
c 2(Ki-Kare) Parametrik Olmayan Testler’de herhangi bir
hücrenin veya grubun beklenen değer 5’ten küçük ise kendisine
en yakın olan hücre veya grup ile birleştirilir. Bu işleme
herhangi bir hücre veya grup içerisinde 5’ten küçük bir
beklenen değer ifadesi kalmayıncaya kadar devam edilir.
37
Hatalı Şişe Sayısı 0 1 2 3 ve daha fazla
Kutu Sayısı (Gi) 48 25 15 12
Beklenen Kutu Sayısı (Bi) 35,85 37,74 18,87 7,54

k
(G i  Bi 2 (48  35,852 (
12  7,54 2
c h2   Bi

35,85
 ....
7,54
 12,03
i 1

χ 2tablo  χ 2v,α  χ 2k-1-g,α  χ 24-1-1,0,05  χ 22,0,05  5,99


Binom Dağılışında parametre sayısı 2 (n,p) olmasına
rağmen soruda tahmin edilen parametre sayısı 1 (p) ‘dir
c h2  c t2 olduğundan Ho red edilir..
Kutularda bulunan meyve sularının içerisinde hatalı
şişelenenlerinin sayısının n = 20 olan Binom Dağılışına
uygun olmadığı % 5 hata payıyla söylenebilir. 38
Örnek: Bir havaalanında uçuşlar kalkış zamanına göre
zamanında ve gecikmeli olarak iki şekilde sınıflandırılmıştır.
Aşağıdaki tabloda 1 saatlik süre içerisindeki gecikmeli
gerçekleşen uçuşların sayıları ifade edilmiştir.
a) Bir saatlik süre içerisinde ortalama kaç adet gecikmeli
uçuş yapılmaktadır ?
b) Bir saatlik süre içerisindeki gerçekleşen gecikmeli uçuş
sayılarının Poisson Dağılışına uygun olup olamadığını % 5
hata payıyla test ediniz?

1 saatte gerçekleşen
0 1 2 3 4 5 6 7 8 9 ve daha fazla
gecikmeli uçuş sayısı
Frekans 24 35 43 25 16 4 2 0 1 0
39
a)
λ
 x ifi

0  24  1  35  .....9  0 300
 2
 fi 150 150
b) Ho: Bir saatlik süre içerisindeki zamanında gerçekleşmeyen
uçuşların sayısı Poisson Dağılışına uygundur.
Ha: Bir saatlik süre içerisindeki zamanında gerçekleşmeyen
uçuşların sayısı Poisson Dağılışına uygun değildir.
e -λ λ x e-2 20
P(X  x   P(X  0  
x! 0!

1 saatte gerçekleşen
0 1 2 3 4 5 6 7 8 9 ve üstü
gecikmeli uçuş saysı
Frekans Gi 24 35 43 25 16 4 2 0 1 0
pi 0,1353 0,2707 0,2707 0,1804 0,0902 0,0361 0,012 0,0034 0,0009 0,0002
Beklenen uçuş sayısı B i 20,3 40,60 40,60 27,07 13,53 5,41 1,80 0,52 0,13 0,04
40
1 saatte gerçekleşen 5 ve
0 1 2 3 4
gecikmeli uçuş saysı üstü
Frekans Gi 24 35 43 25 16 7
Beklenen uçuş sayısı B i 20,3 40,60 40,60 27,07 13,53 7,9

c 
2
k (G i
 Bi 
2


24  20,3 2



 ....  
2
 7  7,9 


 2,29
h
i 1 Bi 20,3 7,9
χ 2
tablo
χ 2
v,α
χ 2
k -1-g,α
χ 2
6-1-1,0,05
χ 2
4,0,05
 9,49
Poisson Dağılışında parametre sayısı 1 (l’dir.

c h2  c t2 olduğundan Ho red edilemez.


Havaalanında 1 saatlik süre içerisinde gerçekleşen gecikmeli
uçuş sayılarının Poisson Dağılımın uygun olduğu % 5 hata
payıyla söylenebilir.
41
Normal Dağılışa Uyum Testi Örneği:

Kimyasal bir madde üreten bir firma günlük


satışlarının ( 1000 galon) normal dağılışa uygun olup
olmadığını araştırmak istemektedir. Bu amaçla 200
gün boyunca satılan miktarlar kayıt edilerek
aşağıdaki sınıflanmış veri seti elde edilmiştir. Buna
göre % 5 hata payıyla satışların normal dağılışa
uygun olup olmadığını test ediniz.

42
Satışlar (1000 galon) Satılan Gün Sayısı

x < 34,0 0
34,0 ≤ x < 35,5 13
35,5 ≤ x < 37,0 20
37,0 ≤ x < 38,5 35
38,5 ≤ x < 40,0 43
40,0 ≤ x < 41,5 51
41,5 ≤ x < 43,0 27
43,0 ≤ x < 44,5 10
44,5 ≤ x <46,0 1
46,0 ≤ x 0
Toplam 200
43
Uyumu araştırılacak dağılış olan normal dağılışın
parametreleri ifade edilmediğinden verilen örnekten yola
çıkılarak, örnek istatistikleri tahmin edilir.

x  40 s  2,5
Her bir sınıfa ait olan olasılık değerleri sınıflanmış
verilerin aralığına düşmesi olasılığına karşılık gelir.
Anakütle dağılışının uygun olduğu varsayılan normal
dağılışla ilişkin olasılık hesaplamaları standart normal
dağılışa ( z ) dönüştürme yoluyla hesaplanır.

44
P(0  x  34)  P(0  z  2,4)  0,5  0,4918  0,0082

P(40  x  41,5)  P(0  z  0,6)  0,2257


Hesaplanan bu olasılıklar toplam örnek hacmiyle
çarpılarak beklenen değerler elde edilir.

B1 = np1 = 0,0082 * 200 = 1,64


B6 = np6 = 0,2257 * 200 = 54
Ho: Satışlar normal dağılışa uygundur.
H1: Satışlar normal dağılışa uygun değildir.

45
G1=13, B1= 7,18
Satışlar Gi pi Bi = npi Gi- Bi (Gi- Bi)2/Bi
x < 34,0 0 0,0082 1,64
5,82 4,7176
34,0 ≤ x < 35,5 13 0,0227 5,54
35,5 ≤ x < 37,0 20 0,0792 15,84 4,16 1,0925
37,0 ≤ x < 38,5 35 0,1592 31,84 3,16 0,3136
38,5 ≤ x < 40,0 43 0,2257 45,14 -2,14 0,1015
40,0 ≤ x < 41,5 51 0,2257 45,14 5,86 0,7607
41,5 ≤ x < 43,0 27 0,1592 31,84 -4,84 0,7357
43,0 ≤ x < 44,5 10 0,0792 15,84 -5,84 2,1531
44,5 ≤ x <46,0 1 0,0277 5,54
-6,18 5,3193
46,0 ≤ x 0 0,0082 1,64

G8=1, B8= 6,18 46


c h2  
k
(G i  Bi  2
 4,7176  1,0925 .......... .  5,3193  15,194
i 1 Bi

v = k - 1- g = 8-1-2 =5

χ 2
tablo χ 2
v;α χ 2
k -1-g;α χ 2
8-1-5;0,05 χ 2
5;0,05  11,07

c 2
h  c t
2
olduğundan Ho red edilir.

Firmanın günlük satışlarının normal dağılışa uygun


olmadığı % 5 hata payıyla söylenebilir.

47
Örnek-1: Bir işletmenin iki farklı deposunda bulunan hatalı ürünlerin oranı karşılaştırılmak isteniyor. Bu
amaçla 1. depodan 200 adetlik bir örnek alındığında 20 adet hatalı ürün, 2. depodan ise 300 adetlik bir
örnek alındığında ise 15 adet hatalı ürün gözleniyor. İki depoda bulunan hatalı ürünlerin anakütle
oranları arsındaki fark için %98’lik güven aralığını oluşturup yorumlayınız.

n1 = 200 x1 = 20 n2 = 300 x2 = 15 1 - α = 0,98 α / 2 = 0,01


𝑛𝑛 20 𝑛𝑛 15
𝑝𝑝̂1 = 𝑥𝑥1 = = 0,1 𝑝𝑝̂2 = 𝑥𝑥2 = = 0,05
1 200 2 300

𝑝𝑝�1 (1−𝑝𝑝�1 ) 𝑝𝑝�2 (1−𝑝𝑝�2 ) 𝑝𝑝�1 (1−𝑝𝑝�1 ) 𝑝𝑝�2 (1−𝑝𝑝�2 )


𝑃𝑃 �(𝑝𝑝̂1 − 𝑝𝑝̂2 ) − 𝑧𝑧𝛼𝛼�2 � + < 𝑝𝑝1 − 𝑝𝑝2 < (𝑝𝑝̂1 − 𝑝𝑝̂2 ) + 𝑧𝑧𝛼𝛼�2 � + � = 1 − 𝛼𝛼
𝑛𝑛1 𝑛𝑛2 𝑛𝑛1 𝑛𝑛2

0,44 0,44
α / 2 = 0,01
α / 2 = 0,01

z
-2,33 0 2,33

0,1 (0,9) 0,05(0,95) 0,1 (0,9) 0,05(0,95)


𝑃𝑃 �(0,1 − 0,05) − 2,33� + < 𝑝𝑝1 − 𝑝𝑝2 < (0,1 − 0,05) + 2,33� + � = 0,98
200 300 200 300

𝑃𝑃[0,05 − 2,33 (0,0178) < 𝑝𝑝1 − 𝑝𝑝2 < 0,05 + 2,33 (0,0178)] = 0,98

𝑃𝑃[0,01 < 𝑝𝑝1 − 𝑝𝑝2 < 0,09] = 0,98

Yorum: Bu işletmenin iki farklı deposundaki hataları ürünlerin anakütle oranları arasındaki farkın
% 98 olasılıkla 0,01 ile 0,09 arasında değiştiğini söyleyebiliriz.
Örnek-2: İstatistik 2 dersi başarı oranı açısından Ekonometri ve İktisat Bölümleri karşılaştırılmak
isteniyor. Bu amaçla iktisat bölümünde okuyan istatistik 2 dersini almış 150 öğrenci seçiliyor ve 80’inin
başarılı olduğu, ekonometri bölümünde okuyan istatistik 2 dersini almış 200 öğrenciden 120’sinin
başarılı olduğu görülüyor. Ekonometri bölümü öğrencilerinin başarını oranının iktisat bölümü
öğrencilerinden daha fazla olduğu iddiasını α = 0,10 önem seviyesinde test edip yorumlayınız.

ni = 150 xi = 80 nE = 200 xE = 120 α = 0,10

𝐻𝐻0 : 𝑝𝑝𝐸𝐸 = 𝑝𝑝İ

𝐻𝐻1 : 𝑝𝑝𝐸𝐸 > 𝑝𝑝İ


𝑛𝑛𝐸𝐸 120 𝑛𝑛İ 80
𝑝𝑝̂𝐸𝐸 = = = 0,6 𝑝𝑝̂ İ = = = 0,53
𝑥𝑥𝐸𝐸 200 𝑥𝑥İ 150

�𝑝𝑝�𝐸𝐸 −𝑝𝑝�İ �−�𝑝𝑝𝐸𝐸 − 𝑝𝑝İ � 𝑛𝑛𝐸𝐸 +𝑛𝑛İ 120+80


𝑧𝑧𝐻𝐻 = 𝑝𝑝̂ 0 = 𝑥𝑥𝐸𝐸 +𝑥𝑥İ
= = 0,57
1 1
200+150
�𝑝𝑝�0 (1−𝑝𝑝�0 )�𝑛𝑛 +𝑛𝑛 �
𝐸𝐸 İ

(0,6 − 0,53) − (0) 0,07


𝑧𝑧𝐻𝐻 = = ≅ 1,04
0,067
�0,57(0,43) � 1 + 1 �
200 150

H0 red edilemez H0 red edilir

0,50 0,40 α = 0,10

0 1,28
z

Zh = 1,04

Karar: H0 red edilemez.

Yorum : % 10 hata payıyla Ekonometri Bölümü öğrencilerinin İstatistik II dersi başarı oranının İktisat
bölümü öğrencilerinden daha fazla olduğunu söyleyecek yeterli kanıt bulunamamıştır.
Örnek-3: Bir oto yıkamacıda günlük kullanılan temizlik maddesi miktarının ortalamasının değişimi
incelemek amacıyla 23 günlük bir inceleme yapılmış ve günlük kullanılan temizlik maddesinin
ortalamasının 13,57 kg., varyansının ise 7,29 kg2 olduğu görülmüştür. Günlük kullanılan temizlik
maddesi miktarının normal dağılıma uygun olduğu varsayımı altında günlük kullanılan temizlik
maddesinin anakütle ortalaması için % 95 ’lik güven aralığını oluşturup yorumlayınız.

n = 23 𝑥𝑥̅ = 13,57 𝑘𝑘𝑘𝑘. 𝑠𝑠 2 = 7,29 𝑘𝑘𝑘𝑘2 1 - α = 0,95 α / 2 = 0,025

𝑠𝑠2 𝑠𝑠2
� − 𝑡𝑡𝑛𝑛−1;𝛼𝛼⁄2 �
𝑃𝑃 �𝑥𝑥 � + 𝑡𝑡𝑛𝑛−1;𝛼𝛼⁄2 � � = 1 − 𝛼𝛼
< 𝜇𝜇 < 𝑥𝑥
𝑛𝑛 𝑛𝑛

7,29 7,29
𝑃𝑃 �13,57 − 𝑡𝑡22;0,025 � < 𝜇𝜇 < 13,57 − 𝑡𝑡22;0,025 � � = 0,95
23 23

0,475 0,475
α / 2 = 0,025
α / 2 = 0,025

t
-2,074 0 𝑡𝑡22;0,025= 2,074

7,29 7,29
𝑃𝑃 �13,57 − 2,704� < 𝜇𝜇 < 13,57 − 2,704� � = 0,95
23 23

𝑃𝑃[ 12.06 < 𝜇𝜇 < 15,08] = 0,95

Yorum: Bu oto yıkamacıda 100 günlük bir inceleme yapıldığında, 95 gün kullanılan temizlik miktarının
ortalamasının 12,06 kg. ile 15.08 kg. arasında değiştiği, 5 gün ise 12.06 kg.’dan daha az veya
15,08 kg.’dan daha fazla olabileceği söylenebilir.
Örnek-4: Çevre koruma müdürlüğü büyük bir sanayi kuruluşunun çıkardığı günlük sülfürükoksit
miktarının ortalamasının belirlemek için araştırma yapmıştır. Bu miktarın kabul edilebilir ortalama olan
9,5’dan az olduğu iddia edilmektedir. Ölçüm fiyatları çok yüksek olduğundan sadece 9 günlük
ölçümlerden bir rastgele örnek oluşturularak aşağıda verilmiştir. Normal dağılış varsayımı hipotezi
α = 0,01 önem seviyesinde test edip yorumlayınız.

7,3 8,3 9,4 8,9 7,4 7,5 9,3 8,8 9,6

𝐻𝐻0 : 𝜇𝜇 = 9,5

𝐻𝐻1 : 𝜇𝜇 < 9,5

∑ 𝑥𝑥𝑖𝑖
𝑥𝑥̅ = 𝑛𝑛
= 7,3 + 8,3 + ⋯ + 9,6 = 8,5

∑(𝑥𝑥𝑖𝑖 −𝑥𝑥̅ )2 (7,3−8,5)2 + (8,3−8,5)2 +⋯+ (9,6−8,5)2 6,6


𝑠𝑠 2 = 𝑛𝑛−1
= 8
= ≅ 0,83
8

𝑥𝑥̅ − 𝜇𝜇0 𝑥𝑥̅ − 𝜇𝜇0 8,5 − 9,5


𝑡𝑡𝐻𝐻 = = = ≅ −3,29
𝑠𝑠𝑥𝑥̅ 2
�𝑠𝑠 �0,83
𝑛𝑛 9

H0 red edilir

H0 red edilemez
α = 0,01
0,49 0,50

t8;0,01 = -2,896
t

tH = - 3,29

Karar: H0 red edilir.

Yorum : % 1 hata payıyla bu sanayi kuruluşunun günlük çıkardığı sülfürükoksit miktarının anakütle
ortalamasının 9,5’dan daha az olduğu söylenebilir.
Örnek-1: X ve Y marka otomobil boyalarının saat olarak kuruma zamanlarının normal dağılıma uyduğu
ve anakütle varyanslarının eşit olduğu varsayımı altında X marka boya ile aynı anda 10 farklı alan
boyanıyor ve kuruma zamanının ortalaması 80 dk., standart sapması 9 dk. olduğu görülüyor. Y marka
boya ile yine aynı anda 8 farklı alan boyanıyor ve ortalama kuruma zamanı 65 dk., standart sapması
7 dk. olarak hesaplanıyor. X ve Y marka boyaların kuruma zamanlarının anakütle ortalamaları
arasındaki fark için % 90’lık güven aralığını oluşturup boyaların kuruma zamanlarının birbirine eşit olup
olmadığını konusundaki görüşünüzü belirtiniz.

nx = 10 𝑥𝑥̅ = 80 𝑑𝑑𝑑𝑑. 𝑆𝑆𝑥𝑥 = 8 𝑑𝑑𝑑𝑑.

ny = 8 𝑦𝑦� = 60 𝑑𝑑𝑘𝑘. 𝑆𝑆𝑦𝑦 = 7 𝑑𝑑𝑑𝑑.

1 - α = 0,90 α / 2 = 0,05

(𝑥𝑥̅ −𝑦𝑦�)−�𝜇𝜇𝑥𝑥� − 𝜇𝜇𝑦𝑦


�� 1 1
± 𝑡𝑡 𝑛𝑛𝑥𝑥 + 𝑛𝑛𝑦𝑦 − 2 ; 𝛼𝛼�2 = → (𝑥𝑥̅ − 𝑦𝑦�) ± 𝑡𝑡 𝑛𝑛𝑥𝑥 + 𝑛𝑛𝑦𝑦 − 2 ; 𝛼𝛼� 𝑆𝑆� +
2
1
𝑆𝑆� +
1 𝑥𝑥𝑛𝑛 𝑛𝑛 𝑦𝑦
𝑛𝑛𝑥𝑥 𝑛𝑛𝑦𝑦

(𝑛𝑛𝑥𝑥 − 1) 𝑆𝑆𝑥𝑥2 + �𝑛𝑛𝑦𝑦 − 1� 𝑆𝑆𝑦𝑦2 9 (64) + 7(49)


𝑆𝑆 2 = = = 57,44 → 𝑆𝑆 ≅ 7,58 𝑑𝑑𝑑𝑑.
𝑛𝑛𝑥𝑥 + 𝑛𝑛𝑦𝑦 − 2 10 + 8 − 2

𝑡𝑡16 ; 0,05 = 1,746

1 1
(80 − 60) ± 𝑡𝑡16; 0,05 (7,58)� +
10 8

20 ± (1,746) (3,56)

𝑃𝑃 � 13,78 < 𝜇𝜇𝑥𝑥� − 𝜇𝜇𝑦𝑦� < 26,22� = 0,90

Oluşturulan güven aralığının sınırları içerisinde “ 0 “ değeri yer almadığı için % 10 hat payıyla X ve Y
marka boyaların kuruma zamanlarının birbirine eşit olmadığı söylenebilir.
Örnek-2: Zirai araştırmalar yapan merkezde üzerinde çalışılan yeni gübrenin buğday verimi üzerindeki
etkisi araştırılmaktadır. Bu amaçla şansa bağlı olarak 9 toprak saha yeni gübre ile gübrelenmiş ve diğer
12 toprak saha hali hazırda kullanılmakta olan gübre ile gübrelenmiştir. Diğer tüm koşulların aynı
olduğu bilgisi altında, yeni gübre ile gübrelenen parsellerde günlük ortalama buğday verimi 95,1 kg. ve
standart sapma 8,2 kg , mevcut gübre ile gübrelenen de ise ortalama buğday verimi 114,8 kg. ve
standart sapma 9,5 kg. olarak bulunmuştur. Anakütle dağılımlarının normal ve eşit varyanslı olduğu
varsayımı altında yeni gübre ile gübrelenmiş grupta ortalama buğday üretiminin mevcut gübre ile
gübrelenmiş parsellerden daha az olduğu iddiasını α = 0,005 önem seviyesinde test edip yorumlayınız.

ny = 9 𝑦𝑦� = 95,1 𝑘𝑘𝑘𝑘. 𝑆𝑆𝑦𝑦 = 8,2 𝑘𝑘𝑘𝑘. nm = 12 𝑚𝑚


� = 114,8 𝑘𝑘𝑘𝑘. 𝑆𝑆𝑚𝑚 = 9,5 𝑘𝑘𝑘𝑘.

α = 0,005

𝐻𝐻0 : 𝜇𝜇𝑦𝑦� = 𝜇𝜇𝑚𝑚

𝐻𝐻1 : 𝜇𝜇𝑦𝑦� < 𝜇𝜇𝑚𝑚


(𝑦𝑦� −����)
𝑚𝑚 − � 𝜇𝜇𝑦𝑦� − 𝜇𝜇𝑚𝑚
��� �
𝑡𝑡ℎ = 1 1
𝑆𝑆 � +
𝑛𝑛𝑦𝑦 𝑛𝑛𝑚𝑚

�𝑛𝑛𝑦𝑦 − 1� 𝑆𝑆𝑦𝑦2 + (𝑛𝑛𝑚𝑚 − 1) 𝑆𝑆𝑚𝑚


2
8 (8,2)2 + 11(9,5)2
𝑆𝑆 2 = 𝑛𝑛𝑦𝑦 + 𝑛𝑛𝑚𝑚 − 2
= 9 + 12 − 2
≅ 85 → 𝑆𝑆 ≅ 9,22 𝑘𝑘𝑘𝑘.

(95,1−114,8) − 0 −19,7
𝑡𝑡ℎ = = ≅ −4,84
1 1 4,07
9,22 � +
9 12

H0 red edilir

H0 red edilemez
α = 0,005
0,495 0,50

t
t19;0,005 = -2,861

tH = - 4,84

Karar: H0 red edilir.

Yorum : % 0,5 hata payıyla yeni gübre ile gübrelenmiş grupta ortalama buğday veriminin mevcut
gübre ile gübrelenmiş parsellerdeki ortalama buğday üretiminden daha az olduğu söylenebilir.
Örnek-3: Bir diyetisyen yeni geliştirdiği diyet programını 8 kişi üzerinde denemiştir. Aşağıdaki tabloda
bu kişilerin diyete başlamadan önceki ve diyeti uyguladıktan sonraki vücut ağırlıkları kilogram cinsinden
ifade edilmiştir. Normal dağılım varsayımı altında kişilerin diyete başlamadan önceki ve diyet
tamamlandıktan sonraki ağırlıklarının ortalamaları arasındaki fark için % 99’luk güven aralığını
oluşturup yorumlayınız.

KİŞİ 1 2 3 4 5 6 7 8
ÖNCE 75 93 62 112 73 81 90 82
SONRA 72 84 60 101 58 77 71 65

1 - α = 0,99 α / 2 = 0,005

Eşlenik ( eşleştirilebilen ) çiftler için güven aralığı oluşturulması gerekmektedir.

1 - α = 0,99 α / 2 = 0,005

𝑑𝑑� −𝐷𝐷 𝑑𝑑� −𝐷𝐷 𝑆𝑆𝑑𝑑


± 𝑡𝑡𝑛𝑛 − 2 ; 𝛼𝛼�2 = = 𝑆𝑆𝑑𝑑 → 𝑑𝑑̅ ± 𝑡𝑡𝑛𝑛 − 2 ; 𝛼𝛼�2
𝑆𝑆𝑑𝑑
� � √𝑛𝑛
√𝑛𝑛

di ( önce-sonra) 3 9 2 11 15 4 19 17

∑ 𝑑𝑑 3+9+⋯+17
𝑑𝑑̅ = 𝑖𝑖 = = 10
𝑛𝑛 8

∑(𝑑𝑑𝑖𝑖 −𝑑𝑑� )2 (3−105)2 + (9−10)2 +⋯+ (17−10)2 306


𝑆𝑆𝑑𝑑2 = 𝑛𝑛−1
= 7
= ≅ 43,71
7

2 2
� − 𝑡𝑡𝑛𝑛−1;𝛼𝛼⁄2 �𝑆𝑆𝑑𝑑 < 𝐷𝐷 < 𝑑𝑑
𝑃𝑃 � 𝑑𝑑 � + 𝑡𝑡𝑛𝑛−1;𝛼𝛼⁄2 �𝑆𝑆𝑑𝑑 � = 1 − 𝛼𝛼
𝑛𝑛 𝑛𝑛

𝑡𝑡7 ; 0,005 = 3,499

43,71 43,71
𝑃𝑃 � 10 − 3,499� < 𝐷𝐷 < 10 + 3,499� � = 0,99
8 8

𝑃𝑃[ 1,81 < 𝐷𝐷 < 18,19 ] = 0,99

Yorum: Diyetisyenin yeni geliştirdiği diyet programının uygulandığı kişilerin diyete başlamadan önceki
ağırlıklarının ve diyeti uyguladıktan sonraki ağırlıklarının ortalamaları arasındaki farkın % 1 hata payıyla
1,81 kg. ile 18,19 arasında değiştiği ifade edilebilir.
Örnek-4: Piyasa yeni sürülecek olan bir tansiyon ilacının etkinliğinin araştırılmaktadır. Bu amaçla
7 tansiyon hastasının ilaç verilmeden önceki ve ilaç verildikten sonraki tansiyon değerleri ölçülüp kayıt
altına alınmıştır. Sonuçlar aşağıdaki tabloda verilmiştir. Buna göre piyasaya yeni sürülecek ilacın
tansiyonu düşürmede etkili olup olmadığını α = 0,01 önem seviyesinde test edip yorumlayınız.

HASTA 1 2 3 4 5 6 7
ÖNCE 14 16 17 18 16 19 21
SONRA 13 15 17 15 14 16 17

𝐻𝐻0 : 𝐷𝐷 = 0

𝐻𝐻1 : 𝐷𝐷 > 0
𝑑𝑑� −𝐷𝐷 𝑑𝑑� −𝐷𝐷
𝑡𝑡𝐻𝐻 = = 𝑆𝑆𝑑𝑑
𝑆𝑆𝑑𝑑
� �
√𝑛𝑛

di ( önce-sonra) 1 1 0 3 2 3 4
di 2 1 1 0 9 4 9 16

2
�∑ 𝑑𝑑𝑖𝑖 � (14)2
∑ 𝑑𝑑𝑖𝑖2 − 40 −
𝑆𝑆𝑑𝑑2 = 𝑛𝑛−1
𝑛𝑛
= 6
7
=2 → 𝑆𝑆𝑑𝑑 ≅ 1,41 𝑘𝑘𝑘𝑘.

14
𝑑𝑑� − 𝐷𝐷 −0
𝑡𝑡𝐻𝐻 = 𝑆𝑆𝑑𝑑 = 1,41
7
≅ 3,75
� �
√𝑛𝑛 √7

H0 red edilemez H0 red edilir

0,50 0,49 α = 0,01

0 t
t6;0,01 = 3,143
th = 3,75

Karar: H0 red edilir.

Yorum : Piyasaya yeni sürülecek olan tansiyon ilacının tansiyonu düşürmede etkili olduğu % 1 hata
payıyla söylenebilir.
İSTATİSTİK II
Varyans Analizi
Varyans Analizi
Üç veya daha fazla anakütle
ortalamasının eşitliğinin testi için
kullanılır.

Hipotezler:
H0 : µ 1 = µ 2 = µ 3 = . . . = µ k

H1: En az bir i ≠ j için µi ≠ µj


Varyans Analizi
Tanım
 Üç veya daha fazla anakütle
ortalamasının eşitliğinin, örnek
varyasyonlarının analizi yolu ile test
etmek için kullanılan bir yöntemdir.
Örnek
• Aynı sınıfta yer Yakıt Tüketim Verileri (galon başına mil)
alan üç ayrı
marka otomobilin A arabaları B arabaları C arabaları
ortalama yakıt
tüketimleri 22.2 24.6 22.7
karşılaştırılmak
19.9 23.1 21.9
istenmektedir.
20.3 22.0 23.3
• Bunu test etmek
21.4 23.5 24.1
için 20 sürücünün
yedisi A, yedisi B, 21.2 23.6 22.1
altısı da C 21.0 22.1 23.4
arabalarına 20.3 23.5
rastgele (rassal Toplam 146.3 162.4 137.4
olarak) atanmıştır.
Tek Yönlü Varyans Analizi
Varsayımlar
1. Anakütlelerin dağılışı normaldir.
2. Anakütleler aynı varyanslıdırlar.
(Anakütlelerin varyansı σ 2’dir.)
3. Örnekler basit şans örnekleridir.
4. Örnekler birbirlerinden bağımsızdır.
K Anakütleden Alınmış Bağımsız
Şans Örneklerinin Gözlemleri
Anakütle
1 2 … K
x11 x21 … xK1
x12 x22 … xK2
. . . .
. . . .
. . . .
x1n1 x2n2 … xKnK
Anakütle Ortalamalarının
Eşitliğinin Testi
• Anakütle ortalamalarının eşitliğinin testi, K
tane anakütlenin ortak bir varyansı olduğu
varsayımına dayanır.
• Anakütle ortalamalarının hepsi aynıdır
hipotezi doğruysa, GİKT ve GAKT
anakütle varyansını tahmin etmede
kullanılabilir.
• Bu tahminleri elde etmek için serbestlik
derecelerine bölmek gerekmektedir.
Anakütle Varyansının Sapmasız
Tahminleyicileri
GIKT GİKO = Grup İçi Kareler Ortalaması
GIKO =
n−K

GAKT
GAKO = GAKO = Gruplar Arası Kareler
K −1 Ortalaması
Notasyon
x = genel ortalama
K = karşılaştırılan anakütle ortalama sayısı
ni = i. Örnekteki veri sayısı
xi = i. Örnek ortalaması
K ni K

K
∑∑ xij ∑ ni xi
i =1 j =1 i =1
n = ∑ ni x= =
i =1 n n
Örnek: Tüketim Verileri İçin
Hesaplamalar
146.3 162.4 x3 =
137.4
= 22.9
x1 = = 20.9 x2 = = 23.2
7 7 6

K
n = ∑ ni = n1 + n2 + n3 = 7 + 7 + 6 = 20
i =1

K ni K
∑∑ xij ∑ ni xi
i =1 j =1 i =1 (7)(20.9) + (7)(23.2) + (6)(22.9)
x= = = = 22.305
n n 20
Grup İçi Değişkenlik
n1 n2
KT1 = ∑ ( x1 j − x1 ) 2 KT2 = ∑ ( x2 j − x2 ) 2
j =1 j =1

GİKT = KT1 + KT2 + … + KTK

GİKT = Grup İçi Kareler Toplamı

K ni
GIKT = ∑∑ ( xij − xi ) 2
i =1 j =1
Örnek: Tüketim Verileri İçin GİKT
Hesaplamaları

KT1 = (22.2 − 20.9) 2 + (19.9 − 20.9) 2 + ... + (20.3 − 20.9) 2 = 3.76


KT2 = (24.6 − 23.2) 2 + (23.1 − 23.2) 2 + ... + (23.5 − 23.2) 2 = 4.96
KT3 = (22.7 − 22.9) 2 + (21.9 − 22.9) 2 + ... + (23.4 − 22.9) 2 = 3.46

GIKT = KT1 + KT2 + KT3 = 3.76 + 4.06 + 3.46 = 12.18


Gruplar Arası Değişkenlik

2 2 2
( x1 − x ) , ( x2 − x ) ,..., ( xK − x )

K
GAKT = ∑ ni ( xi − x ) 2

i =1

GAKT = Gruplar Arası Kareler Toplamı


Örnek: Tüketim Verileri İçin
GAKT Hesaplamaları
K
GAKT = ∑ ni ( xi − x ) 2

i =1

GAKT = (7)(20.9 − 22.305) 2 + (7)(23.2 − 22.305) 2 + (6)(22.9 − 22.305) 2


GAKT = 21.5495
Toplam Değişkenlik

• GKT = Genel Kareler Toplamı


• GKT = GİKT + GAKT

• Örnek verileri için GKT,


GKT = 12.18 + 21.5495 = 33.7295
Örnek: Tüketim Verileri İçin
GİKO ve GAKO Hesaplamaları

12.18
GIKO = = 0.7165
20 − 3

21.5495
GAKO = = 10.7748
3 −1
Test İstatistiği ve Ret Bölgesi

Örnekler arası varyans


F= Örnekler içi varyans

GAKO
F=
GIKO

F > Fα, K – 1, n – K ise H0 RET.


Örnek: Tüketim Verileri İçin F
İstatistiği ve Karar

GAKO 10.7748
F= = = 15.04
GIKO 0.7165

K – 1 = 2 ve n – K = 17. α = 0.01 için

F0.01, 2, 17 = 6.11 < F = 15.04 H0 RET.


Varyans Analizi Tablosu (VAT)

Değişkenlik Kareler Serbestlik Kareler Ortalaması F Oranı


Kaynağı Toplamı Dereceleri

Gruplar GAKT K–1 GAKO = GAKT / (K – 1) GAKO


Arası GİKO

Gruplar GİKO n–K GİKO = GİKT / (n – K)


İçi

Genel GKT n–1


Varyans Analizi Tablosu (VAT)
Değişkenlik Kareler Serbestlik Kareler Ortalaması F Oranı
Kaynağı Toplamı Dereceleri

Gruplar 21.5495 2 10.7748 15.04


Arası

Gruplar 12.1800 17 0.7165


İçi

Genel 33.7295 19
1) Bir bankada bir gün içerisinde açılan
GÜVEN ARALIKLARI vadeli TL. hesaplarının ortalamasını
ALISTIRMA SORULARI incelemek amacıyla yapılan bir araştırmada
12 günlük yapılan bir incelemede, vadeli TL.
hesaplarının ortalaması 5250 TL. olduğu
görülmüştür. Daha önceki yapılan
çalışmalardan populasyon standart
sapmasının 350 TL. olduğu bilindiğine göre,
bir günde açılan vadeli hesapların
2012 populasyon ortalaması için % 95’lik güven
Aras.Gör. Efe SARIBAY ® aralığını oluşturup yorumlayınız.

3) Bir oto yıkamacıda günlük kullanılan


2) Bir mandırada günlük işlenen sütlerin
temizlik maddesi miktarının ortalamasının
ortalaması ile ilgili olarak yapılan bir
değişimi incelemek amacıyla 18 günlük bir
araştırmaya göre 33 günlük süre işlenen inceleme yapılmış ve günlük kullanılan
sütlerin ortalamasının 112 kg., temizlik maddesinin ortalamasının 16,56 kg.,
varyansının ise 68 olduğu görülmüştür. standart sapmasının ise 7 kg. olduğu
Buna göre mandırada günlük işlenen görülmüştür. Günlük kullanılan temizlik
sütlerin populasyon ortalaması için maddesi miktarının normal dağılıma uygun
% 97’lik güven aralığını oluşturup olduğu varsayımı altında günlük kullanılan
yorumlayınız. temizlik maddesinin ortalaması için
% 99 ’luk güven aralığını oluşturup
yorumlayınız.

1
4) İzmir ilinin Haziran ayı sıcaklık 5) Kurşunsuz benzin fiyatlarının artış
ortalamasını tahminlemek amacıyla bir oranını tahmin etmek amacıyla 600 kişiye
araştırma yapılmıştır. Bu araştırmada 2011 yıl sonunda kurşunsuz benzin fiyatının
yılındaki Haziran ayı içindeki 25 gün dikkate 5 TL.’yi geçip geçmeyeceği konusunda
alınmıştır ve ortalama 280 C ve standart görüşü alınmış ve 350 kişi 5 TL.’yi
sapma ise 30 C olarak hesaplanmıştır. Normal geçeceği konusunda görüş bildirmiştir.
dağılış varsayımı altında İzmir ilinin Haziran Kurşunsuz benzin fiyatlarının yıl sonunda
ayı sıcaklık değerinin populasyon ortalaması
5 TL.’yi geçeceği görüşüne sahip
için % 90’lık güven aralığını oluşturup
olanların kişilerin populasyon oranı için
yorumlayınız.
% 90 ‘lık güven aralığını oluşturup
yorumlayınız.

6) Tüketici tercihleri konusunda yapılan bir 7) Bir fabrikada üretilen vidaların yarıçap
araştırmada son bir ay içinde elektronik eşya uzunluğunun değişkenliği araştırılmak
alan 250 kişiden 87’sinin alışverişini internet istenmektedir. Bu amaçla şansa bağlı olarak
üzerinden gerçekleştirdiği görülmüştür. Buna seçilen 16 vidanın yarıçap uzunluklarının
göre son bir ayda internet üzerinden ortalaması 2 mm. ve standart sapması 0,4
elektronik eşya alan kişilerin populasyon mm. olarak bulunmuştur. Vidaların yarıçap
oranı için %99’luk güven aralığını tahmin uzunluklarının normal dağıldığı varsayımı
edip yorumlayınız. altında populasyon(anakütle) varyansı için
%95’lik güven aralığını oluşturup
yorumlayınız.

2
8) İstatistik II dersinin vize notlarının 9) Bir bankanın iki şubesinde açılan Є
değişkenliğini incelemek amacıyla bir hesaplarının ortalamaları arasındaki fark
çalışma yapılmıştır. Çalışmada 25 öğrencinin incelenmek istenmektedir. Birinci şubede
vize notları incelenmiş ortalaması 55 ve yapılan 50 aylık bir incelemede aylık
standart sapması 6 olarak bulunmuştur. ortalamanın 2000 Є standart sapmanın 25
Normal dağılım varsayımı altında İstatistik II Є, ikinci şubede 40 aylık bir inceleme
dersinin vize notlarının populasyon varyansı yapıldığında aylık ortalamanın 1500 Є,
için % 98’lik güven aralığını oluşturup standart sapmasının 80 Є olarak
yorumlayınız. bulunduğuna göre iki şubede açılan Є
hesaplarının aylık ortalamaları arasındaki
fark için %95 güven aralığını oluşturup
yorumlayınız.

11) Karşıyaka ve Alsancak’ta şubesi bulunan bir


10) Bir mandıra keçi ve inek sütlerinin günlük pastanenin aylık tükettiği dondurma miktarları
ortalama satış miktarlarının karşılaştırmak karşılaştırılmak isteniyor. 12 aylık yapılan bir
istemektedir. Bu amaçla 40 günlük yapılan inceleme sonucunda Karşıyaka’da satılan
bir inceleme sonucunda keçi sütlerinin dondurmaların ortalamasının 100 kg. varyansının
ortalaması 8 kg., varyansı 16; 50 günlük 64, Alsancak’ta satılan dondurmaların
yapılan bir inceleme sonucunda ise inek ortalamasının 150 kg. ve varyansının 81 olduğu
sütlerinin ortalaması 13 kg., varyansı ise görülmüştür. Buna göre populasyon
varyanslarının eşit olduğunu varsayımı ile iki
100 olarak bulunmuştur. Bu mandırada
şubede aylık satılan dondurma miktarlarının
satılan keçi ve inek sütlerinin anakütle ortalamaları arasındaki fark için % 98’lik güven
ortalamaları arasındaki fark için %90’lık aralığını elde ederek yorumlayınız.
güven aralığını oluşturup yorumlayınız.

3
13) Üniversite birinci sınıfta okutulan matematik
12) X ve Y marka otomobil boyalarının saat olarak
dersi için verilen 6 aylık bir kurs programının faydalı
kuruma zamanlarının normal dağılıma uyduğu ve
olduğu ve başarı ortalamasını arttırdığı iddia ediliyor.
anakütle varyanslarının eşit olduğu varsayımı
Bunu araştırmak amacıyla, rastgele belirlenen sekiz
altında X marka boyadan farklı zamanlarda 12 tane
öğrenciye ait veriler aşağıdaki gibidir;
alan boyanıyor ve kuruma zamanının ortalaması
80 kg., standart sapması 30kg. olduğu görülüyor. Y Kurs öncesi sınav notu: 40 20 60 50 60 30 50 10
marka boya ile yine aynı koşulları sağlayan 8 tane Kurs sonrası sınav notu: 60 60 80 60 50 80 80 90
farklı alan boyanıyor ve ortalama kuruma zamanı
60 dk., standart sapması 25 dk. olarak Normal dağılım varsayımı ile kurs verilmeden önceki
hesaplanıyor. X ve Y marka boyaların kuruma ve kurs verildikten sonraki sınav notlarının
zamanlarının populasyon ortalamaları arasındaki ortalamaları arasındaki fark için % 99’ luk güven
fark için % 90’lık güven aralığını oluşturup aralığını oluşturup yorumlayınız.
yorumlayınız.

14) Bir diyetisyen yeni geliştirdiği bir diyet


programını 6 kişi üzerinde denemiştir. Bu 15) Bir işletmenin iki farklı deposunda bulunan
Aşağıdaki tabloda bu kişilerin diyete başlamadan hatalı ürünlerin oranı karşılaştırılmak isteniyor.
önceki ve tamamladıktan sonraki ağırlıkları kg. Bu amaçla 1. depodan 200 adetlik bir örnek
cinsinden ifade edilmiştir. Normal dağılım alındığında 20 adet hatalı, 2. depodan 300
varsayımları altında diyete başlamadan önceki adetlik bir örnek alındığında ise 15 adet hatalı
ve diyet tamamlandıktan sonraki kişilerin ürün gözleniyor. İki depoda bulunan bulunan
ağırlıkları ortalamaları arasındaki fark için hatalı ürünlerin oranı arsındaki fark için
% 99’ luk güven aralığını oluşturup yorumlayınız. %99’luk güven aralığını oluşturup
yorumlayınız.
KİŞİ 1 2 3 4 5 6
ÖNCE 75 93 62 112 73 81
SONRA 73 85 60 101 58 77

4
16) İki banka verdikleri bireysel ihtiyaç
kredilerin geri ödenme oranlarına göre
karşılaştırılmıştır. Buna göre A bankasından
kredi alan 250 kişinin 210’u, B bankasından
kredi alan 200 kişiden 150’si aldıkları kredileri
zamanında ödemiştir. Bankaların verdikleri
kredilerin geri ödenme oranları arasındaki fark
için % 80’lik güven aralığını oluşturup
yorumlayınız.

5
Yrd.Doç.Dr.İstem Köymen KESER
Tahminler

Nokta Aralık
Tahmini Tahmini
Uygulamada çoğu sorun için nokta tahmini yeterlidir.
Örneğin, büyük bir parti maldan rassal seçilmiş parçaların
incelenmesi, bütün parçaların %10’unun kusurlu olmuş
olduğu tahminini ortaya koymuş olsun. Bu sayıyı gören bir
yönetici şöyle sorular sorabilir.
Bu sayıyı gören bir yönetici şöyle sorular sorabilir:
“Gerçek kusurlu oranının %5 ile %15 arasında olduğundan
az çok emin olabilir miyim?”
“Bu durumda bütün parçaların %9 ile %11 arasındaki bir
oranının kusurlu olduğu mu görülüyor?”
Böyle sorular tek bir nokta tahmininin güvenilirliğini
sorgulamaktadır. Daha doğrudan söylenirse, tahmini
yapılan büyüklüğün arasında kalacağı bir aralık demek olan
aralık tahmini sorulmaktadır.
Bir anakütleden örnekleme yaparken diğer tüm etmenler
aynı kaldığında hacmi büyük bir örnekten hacmi küçük bir
örneğe göre daha güvenli bilgi sağlamayı bekleriz. Ancak
bu etmen nokta tahminine yansımamaktadır.
Örneğin, bir partideki kusurlu parça oranı
konusundaki nokta tahminimiz, on parçalık bir
örnekte (örneklemde) bir kusurlu parça görsek de,
1000 parçalık bir örnekte 100 kusurlu parça bulsak da
değişmez.
Anakütle katsayılarına ilişkin bilgilerimizin hassalığı
aralık tahminine yansır. Bir diğer deyişle örnek
büyüklüğü artıkça, diğer tüm etmenler aynı
kaldığında, bir anakütle katsayısının gerçek değeri
konusundaki belirsizliğimizi yansıtan güven aralığı
azalır.
Tanım 1: Bir anakütle katsayısının aralık tahmin
edicisi, o anakütle katsayısının içine düşebileceği bir
aralığı (örnekleme bilgisine dayanarak) belirlemenin
bir kuralıdır. Buna karşılık gelen tahmine de aralık
tahmini denir.
Aralık tahmin edicileri gerçek ama bilinmeyen anakütle
katsayılarını “içerebilir” yada içermesi “çok olası” diye
tanımlanmıştır. Daha hassas bir açıklama yapmak için bu
terimler olasılık ifadelerine dönüştürmek gerekir.
tahmin edilecek anakütle katsayısını θ ile gösterelim. bir
rassal örnek seçildiğini ve bu örnek bilgisine dayanarak A,
B’den küçük olmak üzere A ile B gibi iki rassal değişken
bulunabileceğini düşünelim. Bu rassal dağişkenler, A’nın θ
küçük ve B’nin θ’dan büyük olma olasılığı 0.90 gibi bir
özellik taşıyorsa,
P(A< θ<B) = 0.90 yazılabilir.
Eğer A ile B belli örnek genişlemeleri ile a ile b
şeklinde gösterilirse o zaman a ile b aralığına %90
güven aralığı denir.
Olasılık kavramına göre bu tür olasılıklar şöyle
yorumlanabilir:
Eğer anakütleden tekrarlı örneklemeler alınır ve bu
yolla aralıklar hesaplanırsa, bu aralıkların %90’ı
bilinmeyen anakütle katsayısını içerir.
Tanım 2: θ bilinmeyen bir anakütle katsayısı olsun. Örnek
bilgisine dayanarak,
P(A< θ<B) = 1-α
eşitliğini sağlayan A ve B rassal değişkenlerini
bulabileceğimizi düşünelim. A ile B belli örnek seçimleri
ile a ile b olarak gösterilirse, bu durumda a ile b aralığına
θ’nın %100(1- α) güven aralığı denir. (1- α) büyüklüğü de,
bu aralığın olasılık içeriği ya da güven düzeyi adını alır.
eğer anakütleden çok büyük sayıda yinelenen örnekler
seçilirse bu yolla bulunan aralıkların %(1- α) oranı, θ
katsayısını içerecektir. Bu yolla hesaplanan güven aralığı
a< θ<b şeklindedir.
Tanımlar
Güven Aralığı
(veya Aralık Tahmini)

Bir anakütle parametresinin gerçek değerini tahmin


etmek için kullanılan değerler aralığı

Alt değer < anakütle parametresi < Üst değer

Örnek olarak
Alt değer <  < Üst değer
Tanımlar
Güven Derecesi
(güven seviyesi veya güven katsayısı)

güven aralığı, 1 -  olasılığı ile anakütle


parametresini içerir.

genellikle 90%, 95%, veya 99%


( = 10%), ( = 5%), ( = 1%)
Bir güven aralığının yorumu
98.08 < µ < 98.32
o o

Doğru: 98.08 ve 98.32 aralığı, %95 olasılıkla ’nün


gerçek değerini içerir.


Yanlış: nün gerçek değerinin 98.08 ile 98.32
arasına düşmesi olasılığı %95’tir.
1. BİR NORMAL DAĞILIM ORTALAMASININ GÜVEN
ARALIKLARI : ANAKÜTLE VARYANSI BİLİNİYOR
Ortalaması bilinmeyen ama varyansı bilinen bir normal
dağılımdan rassal bir örnek seçildiğini amacın da anakütle
ortalamasının güven aralığını bulmak olduğunu
varsayalım. Bu sorun gerçeklikten uzaktır, çünkü ortalama
bilinmezken anakütle varyansının tam olarak bilinmesi
(olanaksız değilse de) ender bir durumdur. Ancak kimi
zaman benzer anakütlelerden o denli örnek alınır ki,
sözkonusu anakütlenin varyansının, geçmiş deneyimlere
dayanılarak büyük bir yaklaşıklıkla bilindiği varsayılabilir.
Aynı zamanda örnek hacmi yeterince büyükse anakütle
varyansının bilindiği durum için geliştirilen süreçler bu
varyans örnekten tahmin edilirse de uygulanabilir.
Bilinmeyen ortalaması μ ve bilinen varyansı olan
bir anakütleden çekilen rassal bir örneğin gözlemleri
X1, X2, …, Xn
ve örnek ortalaması olsun. Bu durumda anakütle
ortalamasının güven aralıkları,

rassal değişkeninin standart bir normal dağılıma


uyduğu bulgusuna dayanır.
Anakütle ortalamasının %90 güven aralığını bulmak
istediğimizi varsayalım. Standart normal değişken için
P(Z<1.96) =0.975
P(Z>1.96) =0.025
şeklindedir. Benzer şekilde simetriklik özelliğinden dolayı
P(Z<-1.96)= 0.025 şeklindedir. Özetle Z’nin -1.645 ile 1.645
arasında bulunma olasılığı
P(-1.96<Z< 1.96) = 1-P(Z>1.96) – P(Z<-1.96)=
0.975-0.025 =0.95 şeklindedir.
Özetle standart normal bir rassal değişkenin -1.96 ile 1.96
arasında olma olasılığı 0.95 şeklindedir.
Buradan anakütle ortalaması için bir güven aralığına
dönüştürürsek
P(-1.96<Z<1.96)=0.95
P(-1.96< <1.96)=0.95
𝜎 𝜎
𝑃(−1,96 <𝑥 − µ< +1,96 ) = 0.95
𝑛 𝑛
𝜎 𝜎
𝑃(𝑥 − 1,96 𝑛
<µ< 𝑥 + 1,96 𝑛) = 0.95

şeklindedir. Bu aralığın μ ‘yü içerme olasılığı 0.95’dır. Bir


𝜎
diğer deyişle 𝑥 − 1,96 ve 𝑥 + 1,96 𝜎 aralığı μ’nün
𝑛
𝑛
%95 güven aralığıdır.
 Standart sapması 6 olan normal dağılımdan seçilmiş
onaltı gözlemli rassal bir örnek ortalaması 25’dir.
Anakütle ortalaması μ için %90 güven aralığını
oluşturunuz. (Newbold sayfa 303)
 Anakütle ortalamasının bir güven aralığı örnek
ortalamasının bir gözlenen değerine- örnekleme
dağılımından çekilmiş bir gözlem değerine-dayanır.
Genellersek,
Tanım 3: Bir Normal Anakütle Ortalamasının Güven
Aralıkları: Anakütle Varyansı Biliniyor
Ortalaması μ, varyansı olan bir normal dağılımdan
çekilen n gözlemli rassal bir örnek olsun. biliniyorsa,
gözlenen örnek ortalaması da ise anakütle
ortalamasının güven aralığı

Şeklindedir. Burada aşağıdaki eşitliği sağlar:


P(Z > ) = α/2 şeklindedir. Z rassal değişkeni standart
normal dağılıma uyar. Bir diğer deyişle,

şeklindedir.
Örnek: Bir üretim süreci torba içinde rafine şeker
üretmektedir. Bu torbaların içerik ağırlıkları standart
sapması 1.2 kg olan normal dağılıma uymaktadır. Yirmibeş
torbalık rassal bir örnekte ortalama ağırlık 19.8 kg çıkmıştır.
Bu süreçte üretilen bütün şeker torbalarının ortalama
ağırlığının %95 güven aralığını bulunuz. (Newbold, sayfa
307)
Güven Aralığının Özellikleri:
 Verilmiş bir olasılık içeriği ve örnek büyüklüğü için
anakütle standart sapması σ büyüdükçe, anakütle
ortalamasının güven aralığı da genişler. Bir diğer deyişle
diğer her şey aynıyken anakütlenin kendi ortalaması
etrafındaki dağılımı ne kadar yaygınsa, ortalamaya ilişkin
çıkarsamalar o kadar belirsiz olur. Bu fazladan belirsizlik
daha geniş güven aralığı çıkarır.
 Verilmiş bir olasılık ve anakütle standart sapması için
örnek hacmi büyüdükçe anakütle ortalamasının güven
aralığı da daralır. Bir diğer deyişle bir anakütleden ne kadar
çok bilgi alırsak onun ortalamasına ilişkin çıkarsamamız o
kadar hasssas olur. Bu fazladan hassalık daha dar güven
aralığı çıkarır.
 Verilen bir anakütle standart sapması ve örnek
büyüklüğü için, olasılık içeriği (1-α) yükseldikçe,
anakütle ortalamasının güven aralığı da genişler. (1-α)
genişledikçe α küçülür dolayısıyla büyür. Olasılık
içeriği yükseldiğinden anakütle katsayılarının daha
geniş güven aralıklarına yansır.
Doç.Dr.İstem Köymen KESER
Güven Aralıkları

Ortalama yada iki Oranlar yada iki Varyansların testi


ortalama farkı için oran farkı için
Bir İki varyans
2 biliniyor 2 bilinmiyor varyans için oranı için
n30 n<30 Z İstatistiği F İstatistiği
Z İstatistiği t İstatistiği 2 İstatistiği

2
Anakütle Ortalamasının Güven Aralığı Büyük
Örneklerde
Ortalaması µ olan bir dağılımdan n gözlemli rassal bir
örnek çektiğimizi varsayalım . Örnek ortalaması ile
standart sapmasını ve S ile gösterelim. Eğer n≥30
ise , populasyon ortalamasının %(1-α)’lık güven aralığı
aşağıdaki gibidir:
Örnek: Bir araştırma için, 106 sağlıklı yetişkinin vücut
sıcaklıkları incelenmiştir. Örnek ortalaması 98.2 derece ve örnek
standart sapması 0.62 derece olarak bulunmuştur. Gerçek sıcaklık
ortalaması için %95 güven aralığını bulunuz.

n = 106 E = z / 2 •  = 1.96 • 0.62 = 0.12


x = 98.20o n 106
s = 0.62o

 = 0.05 x -E << x +E
/2 = 0.025
z / 2 = 1.96 98.20o - 0.12 << 98.20o + 0.12

98.08o << 98.32o


98.08 ve 98.32 aralığı, %95 olasılıkla ’nün gerçek değerini
içerir
Anakütle Oranının Güven Aralıkları
(Büyük Örneklem)
 Başarı oranı п olan n hacimli bir anakütleden seçilmiş
olan n gözlemli rassal bir örneklemde başarı oranını p
ile gösterelim. Bu durumda n≥30 ise anakütle oranı п
için %(1-α)’lık güven aralığı:

şeklindedir.
Örnek: Grip aşısı yaptıran rastgele seçilmiş 400 kişiden
136’sı aşı sonrası sıkıntı yaşamıştır. Aşı sonrası sıkıntı
yaşayanların gerçek oranı için %95 güven aralığını bulunuz.

 n = 400, pˆ  136 / 400  0.34 z0.025  1.96


(0.34)(0.66) (0.34)(0.66)
0.34  1.96  p  0.34  1.96
400 400

0.29  p  0.39
0.29 ve 0.39 aralığı, %95 olasılıkla ’nün gerçek değerini içerir
İki Anakütle Oranı Arasındaki Fark İçin Güven
Aralıkları (Büyük Örneklerde)
Başarı oranı olan bir anakütleden seçilmiş gözlemli bir
örneklemde gözlenen başarı oranı ile, başarı oranı olan bir
anakütleden rassal seçilmiş gözlemli bir örneklemde gözlenen başarı
oranı ile gösterilsin.

Olmak üzere
Bu durumda örnekler büyükse İki anakütle oranı
arasındaki fark için %(1-α)’lık güven aralığı aşağıdaki
biçimdedir.
 Örnek: Son sınıf kız ve erkek muhasebe
öğrencilerinden bağımsız rassal örnekler seçilmiştir.
120 erkekten 107’si on yıl sonra tam zamanlı olarak
çalışmayı beklemektedir. 141 kız öğrenciden de 73’ü
aynı beklentidedir. İki anakütle oranları arasındaki
fark için %95 güven aralığını oluşturunuz. (newbold,
sf. 345)
 Örnek: Üniversitelerin pazarlama derslerinde müşteri
destekli projeler (MDP) araştırmasında, MDP kullanan
öğretim üyelerine “MDP’ler öğretim üyesi için zaman
alıcıdır” tümcesi verilmiştir. Vakıf üniversitelerinden
seçilen 92 MDP kullanıcısından oluşan rassal bir örnekte
49 kişi bu görüşe katılmıştır. Devlet üniversitelerinden
seçilen 86 MDP kullanıcısından 36 kişi bu görüşe
katılmıştır. İki anakütle oranı arasındaki fark için %90’lık
güven aralığını oluşturunuz.(Newbold sf. 344)
İki Anakütle Ortalaması Arasındaki Fark İçin Güven Aralıkları
(Populasyon Varyansları Biliniyor veya Örneklemler Büyük)
Ortalamaları ile varyansları ile
olan normal dağılımlardan ve gözlemli
bağımsız rassal örnekler seçilmiş olsun. Örnek
ortalamaları ve ise, iki anakütle ortalaması
arasındaki fark için %(1-α)’lık güven aralığı aşağıdaki
gibidir:
Örnek hacimleri ≥ 30 ise populasyon varyansları
yerine örnek varyansları koyulabilir ve iki ortalama
arasındaki fark için güven aralığı aşağıdaki biçimde
olur:
 Örnek: Sigara içen 96 kişilik bir rassal örneklemde kısa süreli iş
devamsızlığının ortalaması ayda 2.15 saat, standart sapması ayda 2.09
saattir. Hayatında hiç sigara içmemiş 206 kişilik bağımsız bir örnekte
ise ortalama devamsızlık 1.69 saat, standart sapma ayda 1.91 saattir. İki
anakütle ortalaması arasındaki fark için %99 güven aralığını bulunuz
ve yorumlayınız.(Newbold sf.337)
Populasyonun Varyansı 2X Bilinmediğinde ve
n< 30 Olduğunda Ortalama İçin Güven Aralığı
 Varsayımlar:
 POPULASYONUN standart sapması bilinmiyor
 Populasyon Normal dağılımlıdır.
 Populasyonun normal dağılış göstermesi şartıyla
X -  şeklinde hesaplanan
t=
S
n
test istatistiği n-1 serbestlik dereceli t dağılışı gösterir.
Populasyon ortalaması için güven aralığı aşağıdaki
biçimdedir.

 
P  x  t ,n1 * S x
 2
   x  t
2
,n 1
* S   1
x 

Student t Dağılımı

*t dağılışı, normal dağılış gibi simetrik bir dağılıştır. Bu


dağılış ilk olarak 1908 yılında W.S.Gosset tarafından
örnekleme denemeleri sonunda bulunmuştur. Gosset
yayınlarında “Student” takma ismini kullandığı için
bulduğu t dağılışı “Student t dağılışı” olarak bilinmektedir.
Bu dağılıştan kısaca t dağılışı olarak bahsedilecektir.

*t dağılışı, normal dağılış gibi simetrik bir dağılıştır.


Ortalaması 0 olup normal dağılıştan daha yaygın bir şekil
göstermektedir. t dağılışının bir tek parametresi vardır ve
bu parametre serbestlik derecesi olarak isimlendirilir. S’nin
hesaplanmasında kullanılan (n-1), S’nin serbestlik derecesi
olup t’nin dağılışını belirler.
Student t Dağılımı
t dağılışı için z cetveli yerine, çeşitli örnek büyüklükleri ve
olasılık seviyeleri için ayrı ayrı hesaplanmış t cetvelleri
kullanılır.

16
Çan şekilli
simetrik,
Standart
‘Tombul’
Normal
kuyruklar
t (sd = 13)

t (sd = 5)

z
t
0
17
Student’ın t Tablosu
n=3
sd = n - 1 = 2
Üst kuyruk alanı  = .10
/2 =.05
sd .25 .10 .05
Olsun:
1 1.000 3.078 6.314

2 0.817 1.886 2.920 .05


3 0.765 1.638 2.353
0 t
t değerleri 2.920

18
Örnek: Çeşitli kazalara karışan 12 A marka otomobilin onarım
giderlerinin ortalaması $26,227 ve standart sapması $15,873
tutmuştur. Giderlerin dağılışının normal olduğu varsayımı altında,
tüm kazalara karışan A’ların gerçek ortalama onarım giderleri için
%95 güven aralığını bulunuz.

x = 26,227 E = t2 s = (2.201)(15,873) = 10,085.3


s = 15,873 12
n
 = 0.05 x -E <µ< x +E
/2 = 0.025
26,227 - 10,085.3 < µ < 26,227 + 10,085.3
t/2 = 2.201
$16,141.7 < µ < $36,312.3
Bu aralığın bir A’nın ortalama onarım giderini içerdiğinden
%95 eminiz.
ÖRNEK: Varyansı bilinmeyen normal dağılmış bir populasyonun bilmediğimiz
ortalaması hakkında %99 güven katsayısı ile bir aralık oluşturmak isteyelim. Bu
anakütleden 9 birimlik bir örnek alınıyor ve aşağıdaki değerler elde ediliyor.
5, 8.5, 12, 15, 7, 9, 7.5, 6.5, 10.5
%99 güven aralığını oluşturunuz.

n=9 x
x 9
n

 x  2

 x2

n  x2  nx
2
805  9(9) 2
S    3,082
n 1 n 1 8

P( 9- 3,355*(3,082)/3<µ<9+3,355*(3,082)/3)=0.99
İKİ ANAKÜTLE ORTALAMASINA
İLİŞKİN HİPOTEZ TESTLERİ Normal Dağılım Örnek Hacimleri Küçük
Bağımsız ve İlişkili Populasyonlar

Bağımsız İlişkili
1. Farklı veri kaynakları 1. Aynı veri kaynağı
 İlişkisiz  Eşleştirilmiş
 Bağımsız  Tekrarlı ölçümler
2. İki örnek ortalaması 2. Her gözlem çifti
arasındaki farkın arasındaki farkın
kullanılması kullanılması

X X
1 2 Dn = X1n - X2n
21
(

1- ÖRNEKLERİN BAĞIMSIZ OLMASI HALİ

Populasyonların normal dağılım göstermesi ve

 12   2 2   2
Şeklinde populasyon varyanslarının eşit olduğu varsayımı altında

( n  1) s 2
 ( n  1) s 2 Olmak üzere
s2  1 1 2 2

n1  n2  2
𝑋1 − 𝑋2 − (µ1 − µ2 ) 𝑋1 − 𝑋2 − (µ1 − µ2 )
𝑡= =
𝑆𝑋1 −𝑋2 1 1
𝑆2 +
𝑛1 𝑛2
Şeklindeki istatistik t dağılımı
gösterir.

22
 Ortalamaları ve , varyansları aynı olan iki
normal dağılımdan ve gözlemli bağımsız
örnekler seçtiğimizi varsayalım. Örnek ortalamaları
varyansları sırasıyla olmak üzere iki
populasyon ortalaması arasındaki fark için %(1-α)’lık
güven aralığı aşağıdaki biçimdedir:

1 1 1 1
𝑃 (𝑋1 − 𝑋2 ) − 𝑡𝑛 1+𝑛 𝑆2 + < (µ1 − µ2 ) < (𝑋1 − 𝑋2 ) + 𝑡𝑛 1+𝑛 𝛼 𝑆 2 + = %(1 − α)
𝛼
2−2,,,, 2 𝑛1 𝑛2 2,−2, 2 𝑛1 𝑛2
Örnek
Pınar Et için çalışan bir finansal analistsiniz. İki ayrı
kesimhanenin üretim kayıtlarıyla ilgili aşağıdaki rassal olarak
seçilen örneklere ait verileri topladınız:

 fab1 fab2
n 11 13
Ortalama 3.27 2.53
Std Sapma 1.30 1.16

Populasyonların normal dağılım gösterdiği ve eşit varyans


varsayımı altında, iki ortalama arasındaki fark için (1- = 0.95)
güven aralığını oluşturunuz.

© 1984-1994 T/Maker Co.


24
fab1 fab2
n 11 13
Ortalama 3.27 2.53
Std Sapma 1.30 1.16

Test İstatistiğinin Hesaplanması

25
Belli bir kuş cinsinde erkek ve dişi ağırlıklarının eşit olup olmadığı
araştırılmaktadır. Aşağıdaki verilere göre iki ortalama arasındaki fark için %95
güven aralığını oluşturunuz. Populasyon normal dağılımlı ve populasyon
varyanslarının eşitliği varsayımı bulunmaktadır.
Örnek hacmi(n) ortalama( x ) varyans( S2 )
Erkek 10 90.80 55.2
Dişi 9 81.52 66.2

1 1 1 1
S 2
x1 - x 2
2
=S ( + ) S X1 _ X 2  60.38(  )  3.57
n1 n 2 10 9

9(55.2)  8(66.2)
2 2
( n - 1)S + ( n - 1)S
S2 = 1 S   60.98
1 2 2 2
n1 + n 2 - 2 10  9  2
𝑃 (90.80 − 81.52) − 2.11(3.57) < (µ1 − µ2 ) < (90.80 − 81.52) + 2.11(3.57) = %95

𝑃(1.7473 < (µ1 − µ2 ) < 16.8127)


2-Eşleştirilmiş Örnek t Testi

1. İki ilişkili populasyonun ortalamasını test eder.


 Çift ya da eşleştirilmiş
 Tekrarlı gözlemler (önce/sonra)

2. Nesneler arasındaki varyasyonu ortadan kaldırır.


3. Varsayımları
 İki populasyon da normal dağılımlıdır.

28
İki değişken arasındaki fark d değişkeni ile gösterilmek üzere

d
 d i

 d
n

2

d  n
2

Sd 
Sd
S d2 
n 1 n

Şeklindeki t istatistiği (n-1) serbestlik dereceli t


d  D dağılımı göstermek üzere iki ortalama arasındaki
th  fark için güven aralığı aşağıdaki biçimdedir.
Sd
Eşleştirilmiş Örnek t Testi
İki komisyoncunun aynı evlere farklı fiyatlar verdiği iddia edilmektedir.
Populasyonların normal dağıldığı varsayımı altında iddiayı test etmek için 12 ev
seçilmiş ve komisyonculardan bu evlere 1000$ bazında fiyat vermeleri istenmiştir. Elde
edilen sonuçlar aşağıdaki gibidir.İki komisyoncunun aynı evlere verdiği
fiyatların ortalaması arasındaki fark için %98’lik güven aralığını oluşturunuz.
Komisyoncular
Evler A B d d2
1 181.0 182.0 -1.0 1.00
2 179.9 180.0 -0.1 0.01
3 163.0 161.5 1.5 2.25
4 218.0 215.0 3.0 9.00
5 213.0 216.5 -3.5 12.25
6 175.0 175.0 0.0 0.00
7 217.9 219.5 -1.6 2.56
8 151.0 150.0 1.0 1.00
9 164.9 165.5 -0.6 0.36
10 192.5 195.0 -2.5 6.25
11 225.0 222.7 2.3 5.29
12 177.5 178.0 -0.5 0.25
Toplam -2.0 40.22 30
Eşleştirilmiş Örnek t Testi
 d 2
d   0,167  d
i

2
(2) 2
n 12
d  n
2
40,22 
12  3.62
S d2  
n 1 12  1

Sd
3.62 1.904
Sd   
n 12 12

v  n 1  12 1  11s.d.

31
Örnek: İki ayrı TV program kuşağında 10 ayrı reklam kişilere izlettirilmiş ve 24
saat sonra, iki ayrı kuşaktaki reklamlardan hatırlanma indeksleri elde
edilmiştir.

Ürün Sabah Akşam di d i2


Kuşağı Kuşağı
1 137 53 84 7,056
2 135 114 21 441
3 83 81 2 4
4 125 86 39 1,521
5 47 34 13 169
6 46 66 -20 400
7 114 89 25 625
8 157 113 44 1,936
9 57 88 -31 961
10 144 111 23 1,089
Toplam 210 14,202

İki ayrı kuşakta izlenen reklamların hatırlanması indeksleri


karşılaştırıldığında sabah kuşağının hatırlanması indeksinin daha yüksek
olup olmadığını %95 güven aralığına göre yorumlayınız.
d
 d i

210
 21 Sd 
Sd

1,088

32,98
n 10 n 10 10

 d  2

 d 
n
2
 d 2  nd
2
14,202  1021
2
S 
2
   1,088
n 1 n 1
d
9
Örnek: İki ayrı TV program kuşağında 10 ayrı reklam kişilere izlettirilmiş ve 24 saat
sonra, iki ayrı kuşaktaki reklamlardan hatırlanma indeksleri elde edilmiştir.

Ürün Sabah Akşam di d i2


Kuşağı Kuşağı
1 137 53 84 7,056
2 135 114 21 441
3 83 81 2 4
4 125 86 39 1,521
5 47 34 13 169
6 46 66 -20 400
7 114 89 25 625
8 157 113 44 1,936
9 57 88 -31 961
10 144 111 23 1,089
Toplam 210 14,202

İki ayrı kuşakta izlenen reklamların hatırlanması indekslerinin


ortalamaları arasındaki fark için %90 güven aralığını oluşturunuz.

You might also like