Professional Documents
Culture Documents
İstatistik 2
İstatistik 2
(n − 1) S x2
χ n2−1 =
σ2
Rassal değişkeni, (n-1) serbestlik dereceli ki-kare dağılımına
uymaktadır. Bu bulgu, normal bir dağılımdan örneklem
alındığında anakütle varyansı için güven aralıklarının
türetilmesinin temelini oluşturur.
Örneklem varyansının gözlenen belli değeri s x2 ise, anakütle
varyansının güven aralığı aşağıdaki gibidir:
( n − 1) S ( n − 1) S
2 2
2
P 2
<σ < 2 1 α
=−
χα χ α
, n −1 1− , n −1
2 2
Örneğin α=0.05 n=10 olsun
Red
Bölgesi Red Bölgesi
1-α
Red
Red Bölgesi
Bölgesi
S2
103.72 527.02
9 (195 ) 9 (195 )
P <σ <
2
=0.90
16.92 3.33
Red
Bölgesi Red Bölgesi
χ21−α/2,n−1 χ2α/2,n−1
2 2
(n − 1) s (n − 1) s
P 2 <σ < 2
2
= 1−α
χα χ α
2 ,n −1 1− , n −1
2
n=16 S=2.2
α = 0.01
χ 02.005,15 = 32.80
2
χ 0.995,15 = 4.60
2 2
(n − 1) S (n − 1) S
P 2 <σ2 < 2 1 α
=−
χα χ α
2 ,n−1 1− ,n −1
2
15(2.2) 2 15( 2 . 2 ) 2
P <σ <
2
= 0.99
32.80 4.60
[ ]
P 2.21 < σ 2 < 15.78 = 0.99
IBF 1008
İSTATİSTİK-II
UYGULAMA SORULARI
30 Mart 2020
İzmir
İçindekiler
1 Güven Aralıkları 1
1.1 Popülasyon Ortalaması ve Oranı İçin Büyük Örnek Güven Aralığı . . . . . . . . . . . . 1
1.1.1 Popülasyon Ortalaması (µ) için Güven Aralığı . . . . . . . . . . . . . . . . . . 1
1.1.2 İki Popülasyon Ortalaması Arasındaki Fark (µ1 − µ2 ) için Güven Aralığı (ba-
ğımsız örnekler) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.3 Popülasyon Oranı π için Güven Aralığı . . . . . . . . . . . . . . . . . . . . . . 4
1.1.4 İki Popülasyon Oranı Arasındaki Fark (π1 − π2 ) için Güven Aralığı . . . . . . . 4
1.2 Popülasyon Ortalaması İçin Küçük Örnek Güven Aralıkları . . . . . . . . . . . . . . . . 5
1.2.1 Populasyon Ortalaması (µ) için Güven Aralığı . . . . . . . . . . . . . . . . . . 5
1.2.2 İki Populasyon Ortalaması Arasındaki Fark (µ1 − µ2 ) için Güven Aralığı . . . . 6
1.2.2.1 Eşleştirilmiş Gözlemlerde . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2.2.2 Eşleştirilmemiş(bağımsız) Gözlemlerde . . . . . . . . . . . . . . . . 7
1.3 Popülasyon Varyansı(σ 2 ) için Güven Aralığı . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.1 Tek Popülasyon Varyansı(σ 2 ) için Güven Aralığı . . . . . . . . . . . . . . . . . 8
σ2
1.3.2 İki Popülasyon Varyansının Oranı σ12 için Güven Aralığı . . . . . . . . . . . . . 8
2
1.4 Örnek Büyüklüğünün Tespiti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.4.1 Popülasyon Ortalamasının Kullanılması . . . . . . . . . . . . . . . . . . . . . . 9
1.4.2 Popülasyon Oranının Kullanılması . . . . . . . . . . . . . . . . . . . . . . . . . 10
2 Hipotez Testleri 11
Kaynaklar 11
SORULAR
1 Güven Aralıkları
1. Bir bankada birgün içinde açılan vadeli TL hesaplarının ortalamasını incelemek amacıyla yapılan
bir araştırma yapılmıştır. 12 günlük incelemenin sonunda vadeli hesapların ortalaması 5250 TL
olduğu görülmüştür. Daha önceki çalışmalardan populasyon standart sapmasının 350 TL olduğu
bilindiğine göre, ana kütle ortalaması için %95’lik güven aralığını oluşturup yorumlayınız.
Çözüm: Soruda verilenleri istatistik terimleriyle ifade edersek, α = 0.05 −→ α2 = 0.025, n = 12,
x = 5250, σ = 350, ana kütle varyansı bilindiğine göre α değeri için bakmamız gereken tablo z
tablosudur.
σ σ
Pr x − zα/2 σx̄ ≤ µ ≤ x + zα/2 σx̄ = Pr x − zα/2 √ ≤ µ ≤ x + zα/2 √ = 1−α
n n
350 350
= Pr 5250 − 1.96 √ ≤ µ ≤ 5250 + 1.96 √ = 0.95
12 12
= Pr(5051.969 ≤ µ ≤ 5448.031) = 0.95
Yorum: %95 güvenle ana kütle ortalaması µ, 5051.969 ile 5448.031 arasında yer almaktadır.
2. Özel bir hastahane hastalarının ortalama kalış süresini tahmin etmek istemektedir. Bu amaçla has-
tane rastgele olarak hastalardan n = 100 kişi seçmiş ve örnek ortalama kalış süresinin 4.5 gün
olduğunu tespit etmiştir. Ayrıca, tüm hastanedeki hastalar için kalış süresinin standart sapmasının
σ = 4 gün olduğu bildiğine göre, ana kütle ortalaması için %90’lık güven aralığını oluşturup yo-
rumlayınız.
Çözüm: soruda verilenleri istatistik terimleriyle ifade edersek, α = 0.10 −→ α2 = 0.05, n = 100,
x = 4.5, σ = 4, ana kütle varyansı bilindiğine göre α değeri için bakmamız gereken tablo z tablo-
sudur.
Yorum: %90 güvenle ana kütle ortalaması µ, 3.842 ile 5.158 arasında yer almaktadır.
3. Uçuşlardaki boş koltuklar havayolu şirketlerinde gelir kaybına neden olur. Büyük bir havayolu
şirketinin geçen yıl boyunca uçuş başına ortalama boş koltuk sayısını tahmin etmek istemektedir.
Bunu gerçekleştirmek için 225 uçuşun kayıtları rastgele seçilmiş ve örneklenen uçuşların her biri
için boş koltuk sayısı not edilmiş. Verilerin ortalaması 11.6 ve standart sapması ise 4.1 olduğuna
göre, buna göre ana kütle ortalaması için %90’lık güven aralığını oluşturup yorumlayınız.
Çözüm: soruda verilenleri istatistik terimleriyle ifade edersek, α = 0.10 −→ α2 = 0.05, n = 225,
x = 4.5, s = 4.1, ana kütle varyansı BİLİNMEMEKTEDİR fakat örnek hacmi n = 225 > 30 oldu-
ğundan α değeri için bakmamız gereken tablo z tablosudur.
s s
Pr x − zα/2 σx̄ ≤ µ ≤ x + zα/2 σx̄ = Pr x − zα/2 √ ≤ µ ≤ x + zα/2 √ = 1−α
n n
4.1 4.1
= Pr 11.6 − 1.645 √ ≤ µ ≤ 11.6 + 1.645 √ = 0.90
225 225
= Pr(11.15 ≤ µ ≤ 12.05) = 0.90
Yorum: %90 güvenle ana kütle ortalaması µ, 11.15 ile 12.05 arasında yer almaktadır.
1.1.2 İki Popülasyon Ortalaması Arasındaki Fark (µ1 − µ2 ) için Güven Aralığı (bağımsız örnek-
ler)
1. Bir diyetisyen, yağ, karbonhidrat ve kolesterol bakımından düşük bir diyet geliştirmiştir. Diyet
başlangıçta kalp hastalığı olan kişiler tarafından kullanılmak üzere tasarlanmış olsa da, diyetis-
yen bu diyetin obez insanların ağırlıkları üzerindeki etkisini incelemek istemektedir. Her biri 100
obez kişiden oluşan iki rastgele örnek seçilir ve 100’lük bir grup az yağlı diyete yerleştirilir. Diğer
100 tanesi yaklaşık olarak aynı miktarda yiyecek içeren, ancak yağ, karbonhidrat ve kolesterol
bakımından düşük olmayan bir diyete yerleştirilir. Her bir kişi için üç haftalık bir sürede kaybedi-
len (veya alınan) kilo miktarı kaydedilir. Birinci grubun ortalaması 9.31 ve standart sapması 4.67
iken ikinci grubun ortalaması 7.40 ve standart sapması 4.04 olarak elde edilmiştir. Buna göre iki
popülasyon için ortalama kilo kaybı arasındaki farkın %95’lik güven aralığı oluşturup sonucunu
yorumlayınız.
Çözüm: soruda verilenleri istatistik terimleriyle ifade edersek, α = 0.05 −→ α2 = 0.025, n1 =
100, x1 = 9.31, s21 = 4.67, n2 = 100, x2 = 7.40, s22 = 4.04, ve ana kütle varyansları BİLİNMEMEK-
TEDİR fakat örnek hacimleri n1 = n2 = 100 > 30 olduğundan α değeri için bakmamız gereken
Pr x1 − x2 − zα/2 σx1 −x2 ≤ µ1 − µ2 ≤ x1 − x2 + zα/2 σx1 −x2 = 1 − α
s s
s21 s22 s21 s22
Pr x1 − x2 − zα/2 + ≤ µ1 − µ2 ≤ x1 − x2 + zα/2 + = 1−α
n1 n2 n1 n2
r
(4.67)2 (4.04)2
:= (9.31 − 7.40) ∓ 1.96 + = 1.91 ∓ 1.96(0.62),
100 100
= Pr(0.69 ≤ µ1 − µ2 ≤ 3.13) = 0.95
Yorum: %95 güvenle popülasyon ortalamarı arasındaki fark µ1 − µ2 , 0.69 ile 3.13 değerleri ara-
sında yer almaktadır.
2. Birbirine rakip iki bilgisayar firmasının her türlü işlem için merkezi işlem birimindeki(CPU) işlem
sürelerinin varyansları sırasıyla 3 ve 2.1 değerinde olduğu bilinmektedir. Oldukça uzun işlem sü-
resine sahip olabilecek bir yapay sinir ağı kodu yazan bir kullanıcı grubu birinci firmaya ait 148
bilgisayarda kodlarını çalıştırmış ve ortalama 15.2 saniyede işlemleri sonlanmıştır. Diğer taraftan
bu grup ikinci firmaya ait 135 bilgisayarı seçip kodlarını çalıştırmış ve ortalama 11.3 saniyede
işlemleri sonlanmıştır. İki popülasyon arasındaki fark için %99’luk güven aralığını oluşturup yo-
rumlayınız.
Çözüm: Soruda verilenleri istatistik sempolleriyle ifade edersek, n1 = 148, n2 = 135, x1 = 15.2,
x2 = 11.3, σ12 = 3, σ22 = 2.1, α = 0.01 −→ α2 = 0.005 olur. Ana kütle varyansları bilindiğine göre
α için bakmamız gerek tablo z tablosudur.
Pr x1 − x2 − zα/2 σx1 −x2 ≤ µ1 − µ2 ≤ x1 − x2 + zα/2 σx1 −x2 = 1 − α
s s
σ12 σ22 σ12 σ22
Pr x1 − x2 − zα/2 + ≤ µ1 − µ2 ≤ x1 − x2 + zα/2 + = 1−α
n1 n2 n1 n2
Yorum: %99 güvenle popülasyon ortalamarı arasındaki fark µ1 − µ2 , 3.413 ile 4.387 değerleri
arasında yer almaktadır
1. Bir şirket, cumhurbaşkanına güvenen ABD vatandaşlarının oranını tahmin etmek için düzenli ola-
rak kamuoyu yoklaması gerçekleştirmektedir. Yapılan bir yoklamada 1000 kişi rasgele seçilmiş ve
637 kişi başkana güvendiklerini söylemiştir. Cumhurbaşkanı’na güvenen tüm ABD vatandaşları-
nın gerçek oranı için %95’lik güven aralığını oluşturup yorumlayınız.
α x
Çözüm: Soruda verilenleri özetlersek, α = 0.05 −→ 2 =0.025, x = 637, n = 1000, p̂ = n ⇒
637 π(1 − π)
p̂ = 1000 = 0.637, q̂ = 1 − p̂ = 0.363, p̂ ∼ N π, olduğundan α değeri için bakmamız
n
gereken tablo z tablosudur.
r r
p̂q̂ p̂q̂
Pr p̂ − zα/2 σ p̂ ≤ π ≤ p̂ + zα/2 σ p̂ = Pr p̂ − zα/2 ≤ π ≤ p̂ + zα/2 = 1−α
n n
p p
= Pr 0.637 − 1.96 0.637 0.363/1000 ≤ π ≤ 0.637 + 1.96 0.637 0.363/1000 = 0.95
Yorum: %95 güvenle popülasyon oranı π, 0.607 ile 0.667 değerleri arasında yer almaktadır.
1.1.4 İki Popülasyon Oranı Arasındaki Fark (π1 − π2 ) için Güven Aralığı
1. Kalabalık bir ilde bir başkan adayı şehrin kuzeydoğudaki kayıtlı seçmenlerin tercihlerini güneydo-
ğusundaki seçmenlerle karşılaştırmak istemektedir. Böyle bir karşılaştırmayla, kampanya çabaları-
nın nerede daha fazla yoğunlaştırması gerektiğini belirlemede yardımcı olacaktır. Aday, kuzeydo-
ğuda 1.000, güneydoğuda 1.000 kayıtlı rasgele seçmen seçmek ve oy kullanma tercihini öğrenmek
için her biri ile görüşmek üzere profesyonel bir anketör kiralar. Şehrin kuzeydoğusunda 546, gü-
ney doğusunda 475 kişi aday lehine oy kullanacağını belirtmiştir. Buna göre, iki popülasyon oranı
arasındaki farkın %95’lik güven aralığını oluşturup yorumlayınız.
Çözüm: Soruda verilenleri özetleyelim:α = 0.05 −→ α2 = 0.025,
x1 = 546, n1 = 1000, x2 = 475, n2 = 1000,
x1 546
p̂1 = ⇒ p̂1 = = 0.546, q̂1 = 1 − p̂1 = 0.454,
n1 1000
Pr p̂1 − p̂2 − zα/2 σ p̂1 − p̂2 ≤ π1 − π2 ≤ p̂1 − p̂2 + zα/2 σ p̂1 − p̂2 = 1 − α
r r
p̂1 q̂1 p̂2 q̂2 p̂1 q̂1 p̂2 q̂2
Pr p̂1 − p̂2 − zα/2 + ≤ π1 − π2 ≤ p̂1 − p̂2 + zα/2 + = 1−α
n1 n2 n1 n2
r
0.546 0.454 0.475 0.525
:= (0.546 − 0.475) ∓ 1.96 + = (0.546 − 0.475) ∓ 0.044
1000 1000
= Pr(0.071 − 0.044 ≤ π1 − π2 ≤ 0.071 + 0.044) = 0.95
= Pr(0.027 ≤ π1 − π2 ≤ 0.115) = 0.95
Yorum: %95 güvenle popülasyon oranıları arasındaki fark π1 − π2 , 0.027 ile 0.115 değerleri ara-
sında yer almaktadır. Şehrin kuzeydoğusunda, adayı için oy vermeyi planlayan güneydoğuya göre
%2.7 ile %11.5 arasında daha fazla kayıtlı seçmen olduğunu görülmektedir. Adayın güneydoğuda
kuzeydoğuya göre daha büyük bir kampanya çalışması yürütmesi gerektiği anlaşılıyor.
1. Yeni bir ilaç alan hastaların kan basıncındaki ortalama artışın bir tahminini isteyen ilaç şirke-
tini,insan test fazındaki n = 6 hasta için kan basıncı artışlarını ölçmüştür. Hastalara ait ortalama
kan basıncı artışı 2.283 ve standart sapması 0.95 elde edilmiştir. Buna göre, popülasyon ortalaması
için %95’lik güven aralığını oluşturup yorumlayınız.
Çözüm: Soruda verilenlere baktığımızda α = 0.05 −→ α/2 = 0.025 n = 6 , bunlarla birlikte po-
pülasyon varyansı BİLİNMEMEKTE ve örnek hacmi n = 6 < 30 olduğu görülmektedir. Dolayı-
sıyla bakmamız gereken tablo t tablosudur. Burada serbestlik derecesi v = n − 1 = 6 − 1 = 5 ve
α/2 = 0.025 olduğundan t tablosunda t5,0.025 değerini bulmamız gerekir. Tablo değerimiz t5, 0.025 =
2.571’dir.
0.95 0.95
= Pr 2.283 − 2.571 √ ≤ µ ≤ 2.283 + 2.571 √ = 0.95
6 6
= Pr(2.283 − 0.997 ≤ µ ≤ 2.283 + 0.997) = 0.95
= Pr(1.286 ≤ µ ≤ 3.280) = 0.95
Yorum: Bu yeni ilacı almakla ilişkili kan basıncındaki ortalama artış µ, %95 güvenle 1.286 ile
3.28 puan arasındadır.
1.2.2 İki Populasyon Ortalaması Arasındaki Fark (µ1 − µ2 ) için Güven Aralığı
Eski Yakıt 19.4 18.8 20.6 17.6 19.2 20.9 18.3 20.4
Yeni Yakıt 19.6 17.5 18.4 17.5 18 20 18.8 19.2
Çözüm: Soruda verilenleri özetlersek, ana kütle varyansları bilinmiyor, normallik varsayımı ve-
rilmiş ve eşleştirilmiş bir gözlem grubu ile karşı karşıta olduğumuz görülmektedir. α = 0.01 −→
α/2 = 0.005, n = 8 < 30 olduğundan α değeri için bakmamız gereken tablo t tablosudur.
sd sd
Pr d −tv,α/2 σd ≤ µ1 − µ2 ≤ d +tv,α/2 σd = Pr d −tn−1,α/2 √ ≤ µ1 − µ2 ≤ d +tn−1,α/2 √ = 1 − α
n n
1 n 1 n n
1
q
d = ∑ di , s2d = ∑ (di − d)2 = ∑ di2 − n(d)2 , sd = s2d
n i=1 n − 1 i=1 n−1 i=1
Eski Yakıt 19.4 18.8 20.6 17.6 19.2 20.9 18.3 20.4
Yeni Yakıt 19.6 17.5 18.4 17.5 18 20 18.8 19.2
Fark di -0.2 1.3 2.2 0.1 1.2 0.9 -0.5 1.2
1 8 1 8
q √
d = ∑ di = 0.775, s2d = ∑ (di − d)2 = 0.816, sd = s2d = 0.816 = 0.903
8 i=1 7 i=1
Yorum: Aralık şu şekilde yorumlanabilir: .95’e eşit bir güven katsayısı ile, yeni yakıt ile eski ya-
kıt kullanımı arasındaki ortalama performans değerleri arasındaki fark −0.342 ile 1.892 aralığına
düşmektedir.Başka bir deyişle, yeni yakıtın ortalama performans değeri, eski yakıtınn ortalama
performans değerinden 0.342’den daha az, 1.892 değerinden daha fazla olacağı tahmin edilmekte-
dir (%95 güven ile).
Pr 4.07 − 2.086(2.62) ≤ µ1 − µ2 ≤ 4.07 + 2.086(2.62) = 0.95
Pr − 1.4 ≤ µ1 − µ2 ≤ 9.54 = 0.95
Yorum: Aralık şu şekilde yorumlanabilir: .95’e eşit bir güven katsayısı ile, yeni öğretim yöntemini
kullanma ile standart yöntemi kullanma arasındaki ortalama test puanları arasındaki fark −1.4
ile 9.54 aralığına düşmektedir.Başka bir deyişle, yeni yöntemin ortalama test puanının, standart
yöntemin ortalama test puanından 1.4 puandan daha az, 9.54 puandan daha fazla olacağı tahmin
edilmektedir (%95 güven ile).
1. Çelik tel üreten bir şirketinin yöneticisi, firmanın yeni elektrikli fırınındaki sıcaklık değişkenli-
ğini değerlendirmek istiyor. Sıcaklık değerlerinin normal olarak dağıldığı bilinmektedir. 1 haftalık
bir süre zarfında 25 sıcaklıktan oluşan rastgele bir örnek seçildiğinde örneğin ortalaması 12.6 ve
varyansı 100 olarak bulunuyor. Popülasyon varyans sıcaklığı için %95’lik güven aralığı bulup yo-
rumlayınız.
Çözüm:Soruda verilenlere göre, n = 25, x = 12.6, s2 = 100, α = 0.05 −→ α/2 = 0.025 olur.
Popülasyon varyansı için güven aralığını oluşturacağımıza göre α değeri için bakmamız gerekn
tablo χ 2 tablosudur. χ 2 dağılışı simetrik olmadığından χv,α/2
2 2
ve χv,1−α/2 değerlerine bakmalıyız.
2 2
v = n − 1 = 25 − 1 = 24 olduğundan χ24,0.025 = 39.364 ve χ24,0.975 = 12.401 bulunur.
(n − 1)s2 (n − 1)s2
2
Pr 2
≤ σ ≤ 2
= 1 − α olduğundan,
χv,α/2 χv,1−α/2
(24)100 2 (24)100
Pr ≤σ ≤ = Pr(60.97 ≤ σ 2 ≤ 153.93) = 0.95
39.364 12.401
Yorum: %95 güvenle popülasyon varyansı 60.97 ile 153.93 değerleri arasında yer almaktadır.
σ12
1.3.2 İki Popülasyon Varyansının Oranı σ22
için Güven Aralığı
1. Pazara sunulan iki ayrı bağımsız hisse senedinin değişkenliklerini değerlendirmek isteyen bir yatı-
rımcı, bu hisse senetlerine ilişkin bazı istatistikler elde etmiştir. Birinci hisse senedine ait 17 günlük
bir örnek seçmiş ortalama 12.23 ve varyansını 123.38 elde ederken, ikinci hisse senedine ait 11
günlük bir örnek için ortalama 6.27 ve varyansını 8.02 bulmuştur. Her iki hisse senedinin dağı-
lışı normal ve örnekler birbirinden bağımsız seçildiğine göre popülasyon varyanslarının oranı için
1
ve Fv1 ,v2 :1−α/2 = olduğundan,
Fv2 ,v1 :α/2
1
F16,10;0.05 = 2.83, F10,16;0.05 = 2.49 ve böylece F16,10;0.95 = = 0.40 olur.
2.49
2
σ2 s2
s 1
Pr 12 ≤ 12 ≤ 12 Fv1 ,v2 :α/2 = 1 − α
s2 Fv2 ,v1 :α/2 σ2 s2
σ2
123.38 1 123.38
Pr ≤ 12 ≤ 2.83 = 0.95
8.02 2.49 σ2 8.02
σ2
Pr 15.384(0.40) ≤ 12 ≤ 15.384(2.83) = 0.95
σ2
σ2
Pr 6.154 ≤ 12 ≤ 43.537 = 0.95
σ2
Yorum: %95 güvenle iki popülasyon varyansının oranı 6.154 ile 43.537 değerleri arasında yer
almaktadır.
1. Endüstriyel bir işlemle üretilen metal çubukların uzunlukları 1.8 mm standart sapma ilenormal
dağılmaktadır. Bu popülasyondan dokuz gözlemin rastgele bir örneğine dayanarak, popülasyon
ortalama uzunluğunun 194.65 ile 197.75 arasında %99’luk bir güven aralığı bulunmuştur. Bir üre-
tim yöneticisinin aralığın pratik kullanım için çok geniş olduğuna inandığını ve bunun yerine örnek
ortalamanın her bir tarafında en fazla 0.50 mm’yi kapsayan %99’luk bir güven aralığı gerektirdi-
ğini belirtmektedir. Böyle bir aralığı elde etmek için ne kadar büyüklükte örnek gerekir?
Çözüm: Soruda verilenlere göre α = 0.01, ⇒ α/2 = 0.005, σ = 1.8,Ana kütle varyansı bilindiği
σ σ
Pr x − zα/2 √ ≤ µ ≤ x + zα/2 √ = 1−α
n n
| {z } | {z }
SE SE
olduğundan
σ z2α/2 σ 2
SE = zα/2 √ ⇒ n =
n (SE)2
elde edilir. Dolayısıyla
z2α/2 σ 2 (2.575)2 (1.8)2
n= = ≈ 86
(SE)2 (0.5)2
bulunur.
1. Bir araştırmacı ev bilgisayarına sahip olanların oranını %95 güvenle tahmin etmek istemektedir.
Önceki bir çalışma, görüşülenlerin %40’ının evde bir bilgisayarı olduğunu göstermektedir. Araştır-
macı örnek oranın en fazla %2’si içinde kalmak istediğine göre gerekli minimum örnek büyüklüğü
kaçtır?
Çözüm: Popülasyon oranı (π) için güven aralığı;
r r
p̂(1 − p̂) p̂(1 − p̂)
Pr p̂ − zα/2 ≤ π ≤ p̂ + zα/2 = 1−α
| {z n } | {z n }
SE SE
olduğundan r
p̂(1 − p̂) (zα/2 )2 p̂(1 − p̂)
SE = zα/2 ⇒n=
n (SE)2
elde edilir. Bu durumda literatürde iki farklı yaklaşım sergilenmektedir. Birinci yaklaşımda p̂ bi-
lindiği için bunun direk olarak n formülünde kullanılmasıdır. Diğeri ise p̂ bilinmiyorsa bu değeri
p̂ = 0.5 almaktır. Bunun nedeni p̂(1 − p̂) çarpımının en büyük değeri 0.25 olmasıdır. Bu değer,
güven aralığı ve tahmin hatası göz önüne alındığında, doğru bir tahmin sağlamak için yeterince
büyük bir örnek boyutu verecektir.
Bu yüzden, SE = 0.02, α = 0.05 ⇒ α/2 = 0.025, z0.025 = 1.96, p̂ = 0.4, 1 − p̂ = 0.6 ise,
(1.96)2 (0.4)(0.6)
n= = 2304.96 ≈ 2305
(0.02)2
(1.96)2 (0.5)(0.5)
n= = 2401
(0.02)2
bulunur. İkinci yaklaşım daha garanti gösteren bir yaklaşımdır.Dolayısıyla çok tercih edilmektedir.
Fakat p̂ bilindiğinde ihtiyaçtan daha fazla örnek seçilebilmektedir.
2 Hipotez Testleri
Kaynaklar
[1] A. Bluman. Elementary Statistics: A Step By Step Approach. McGraw-Hill Higher Education, 2014.
[2] J.T. McClave ve T.T. Sincich. Statistics, Global Edition. Pearson Education Limited, 2017.
[3] P. Newbold, B. Thorne, ve W. Carlson. Statistics for Business and Economics. Pearson Education,
2013.
Örnek 1. Büyük bir enerji üreticisi firma yeni bir nükleer santral kurmuştur. Bu santral Atlantik Ok-
yanusu’na dökülmesine izin verilen atık su boşaltmaktadır. Boşaltılan su sıcaklık değerlerinin normal
dağıldığı bilinmektedir. Çevre Koruma Ajansı, santral yakınındaki marinanın termal kirliliğinin engel-
lenmesi için atık suyun sıcaklığının çok fazla olmaması gerektiğini belirtmiştir. Boşaltılan suyun sıcaklığı
60 derece veya daha az ise soğutma sisteminin doğru çalıştığı anlaşılmaktadır. Bunu test etmek amacıyla
rassal olarak seçilen 36 sıcaklık değerinin ortalaması 60.5 ve standart sapması 2 olarak elde edilmiştir.
b) Eğer gerçek su sıcaklığı 61 derece anlaşıldığında II. Tip hata olasılığı ve testin gücünü elde ediniz.
Çözüm:
b) Burada H0 hipotezi için kurulan ortalamanın (µ0 = 60) yanlış olduğunu aslında gerçek ortalamanın
(µyeni = 61) olduğu söyleniyor. II. Tip Hata olasılığının H0 hipotezinin reddedilemediği bölgede
çıktığını biliyoruz öncelikle bulmamız gereken değer X üst olacaktır. X üst aşağıdaki formülle bu-
lunabilir;
s
X üst = µ0 + zα σX = µ0 + zα √
n
2
= 60 + 1.881 √
36
= 60.627
X
µ0 X üst
X
X üst µyeni
Tek taraflı H1 > µ0 bir hipotezde karşılaşılabilecek II. Tip Hata Türü, turuncu renkli kısım II. Tip Hata
olasılığını göstermektedir.
Yukarıdaki şekilde II. Tip hata olasılığı gösterilmiştir. Burada bulmamız geren olasılık değeri tu-
runcu renkli bölgedir. İkinci tip hata olasılığını kolay bulmamız için verilen değerleri standart-
laştırmamız ve bu değerlere karşılık gelen olasılık değerini standart normal dağılış tablosundan
(z-tablosu) bulmamız gerekir. II. Tip hata olasılığı P(β ) ve testin gücü T.G;
Testin gücü ise T.G = 1 − P(β ) olduğundan T.G = 1 − 0.1314 = 0.8686 olarak bulunur.
1
Hipotez Testleri 1
2
Tanım
Hipotez
İstatistikte hipotez, bir anakütlenin bir
özelliği hakkındaki bir iddia yada bir
ifadedir.
3
µ = 98.6 olarak varsayıldığında
Örnek Ortalamalarının
Örnekleme Dağılışı
Örnek verisi: z = - 6.64 Olası Örnek Ortalamaları
veya
x = 98.20
µx = 98.6
z = - 1.96 z= 1.96
veya veya
x = 98.48 x = 98.72
4
Bir Hipotez Testinin
Bileşenleri
5
Sıfır Hipotezi: H0
Bir anakütle parametresinin değeri
hakkındaki bir ifadedir. Normal
durumu ifade eder.
=, ≥, veya ≤ ifadelerini içerir.
Test sonucu sıfır hipotezi için kararlar:
H0 ret veya H0 reddedilemez
şeklindedir.
6
Alternatif Hipotez: H1
H0 yanlış ise, doğrudur.
≠, <, > içerir.
Sıfır hipotezinin ‘karşıtıdır’.
Eğer bir çalışmanın sonunda
fikrinizi test etmek istiyorsanız,
bu iddiayı alternatif hipotez ile
ifade etmelisiniz. 7
Test İstatistiği
Sıfır hipotezinin reddi hakkında karar vermek
için kullanılan, örnek verilerinden hesaplanan
bir değerdir.
x - µx
z=
σ
n
8
Ret Bölgesi (Kritik Bölge)
Test istatistiğinin, sıfır hipotezinin reddine
yol açacak tüm değerlerin seti.
Ret
bölgeleri
9
Önem Seviyesi
α ile gösterilir.
Sıfır hipotezi gerçekte doğru iken,
test istatistiğinin ret bölgesine
düşmesi olasılığıdır.
Genellikle 0.05, 0.01, veya 0.10
seçilir.
10
Kritik Değer
Ret bölgesi ile kabul bölgesini ayıran değer
veya değerler.
H0 Ret H0 Reddedilemez
Kritik Değer
( z değeri )
11
Çift Taraflı Test
H0: µ = 100 α, iki eşit kısma bölünür.
H1: µ ≠ 100
Küçük veya büyüktür.
100
H0 reddedilemez H0 ret
100’den anlamlı
derecede küçük 100
değerler
14
Hipotez Testlerinde Hatalar
Tip I ve Tip II Hatalar
Sıfır hipotezi Sıfır hipotezi
DOĞRU YANLIŞ
15
Ortalama ile ilgili bir iddianın
testi: Büyük örnekler
Varsayımlar
1) Örnek, basit şans örneğidir.
2) a) Örnek büyüktür (n >= 30) veya,
b) Anakütlenin dağılışı normaldir ve σ
bilinmektedir.
x - µx
z= σ
n
17
Karar Kriteri
18
Çift Taraflı Z Testine Örnek:
Bir fabrikada üretilmekte olan vidaların boylarının ortalaması 100
mm, ve standart sapması 2 mm olan normal dağılım
gösterdikleri bilinmektedir. Makinalarda olan bir arıza
giderildikten sonra üretilen vidalardan alınan 9 vidalık bir örneğin
boy ortalaması 102 mm olarak bulunmuştur. Makinalardaki
arıza giderilirken vidaların boyunun ayarı bozulmuş mudur?
α=0.05 için test ediniz ve yorumlayınız.
20
20
4. Adım: İstatistiksel karşılaştırmanın yapılması:
X −µ 102 − 100
Z hesap = = =3 idi
σ 2 9
n
H0 RED H0 RED
α /2 = .025
α /2 = .025
Zhesap=3
0
-Ztablo= -1.96 Ztablo= 1.96
5. Adım: Karar verme ve yorumlama:
Zhesap değeri H0 red bölgesine düştüğü için H0 hipotezi reddedilir,
yani vidaları boy ortalaması 100 mm’den farklıdır, makinanın ayarı
21
bozulmuştur. 21
Tek Taraflı Z Testi Örneği
22
22
Çözüm
25
Test İstatistiği
x -µx
t= s
n
Kritik Değerler
t tablosundan bulunur.
Serbestlik Derecesi (df) = n -1
26
ÖRNEK
Bir konserve fabrikasının imal ettiği konservelerin üzerinde
ortalama ağırlık 455 gr yazmaktadır. Bu konservelerin ortalama
ağırlıkları ile ilgili bir karar vermek üzere rastgele seçilen 17
kutunun ortalama ağırlığı 450 gr ve standart sapması 13 gr
bulunmuştur. Ağırlıkların normal dağılım gösterdiği varsayımı
altında ortalama ağırlığın 455 gr olup olmadığını 0.05 önem
seviyesinde test ediniz.
n = 17 v = n − 1 = 16
H 0 : µ = 455 X = 450 gr.
H1 : µ ≠ 455 s = 13 gr. ttab = ±2.12
α 2 = 0.025
H 0 Red
X − µ 450 − 455
H0 Red th = = ≅ −1.54
edilem s 13
ez. n 16
-2.12-1.54 2.12
27 27
ÖRNEK: Bir otomobil firması yeni geliştirdiği teknoloji ile
ürettiği akülerin ortalama dayanma süresi olan 42 ayın
değiştiği ve artık akülerinin ortalama dayanma süresinin
42 ayın üzerinde olduğunu iddia etmektedirler. Akülerin
dayanma sürelerinin normal dağılım gösterdiği varsayımı
altında bu iddiayı araştırmak üzerine 10 adet akü örnek
olarak seçilmiş ve dayanma süreleri ay olarak aşağıdaki
biçimde bulunmuştur:
42, 36, 40, 39, 35, 43, 45, 43, 41, 46 α=0.05 önem
seviyesi için üreticinin iddiasını test ediniz.
H 0 : µ = 42 x−µ x−µ
H 1 : µ > 42 t= = t0, 05,9 = 1,833 > th = −0,88
α = 0,05 Sx S n
41 − 42
th = = −0,88
∑ x 410 3,59
x= = = 41
102
H0 Red edilemez
n 10
(∑ x )
∑x 2
−
n ∑ x2 − n x
2
16926 − 10(41) 2
S= = = = 3,59
n −1 n −1 9
28
Anakütle Ortalaması µ İçin Hipotez Testleri
Başla
Evet x - µx
Z=
n > 30 σ/ n
?
Hayır (σ bilinmediğinde s kullanın.)
Anakütle
Verilerinin Hayır
Parametrik olmayan
Dağılışı normal
Mi? İstatistik yöntemleri kullanın.
30
Notasyon
n = deneme sayısı
p=x/n (örnek başarı oranı)
31
Test İstatistiği
p − π0
z=
π 0 (1 − π 0 )
n
32
ÖRNEK
Bir süpermarketler zinciri sahibi müşterilerinin %95’inin
süpermarketlerindeki fiyatlardan memnun olduğunu söylemektedir.
Tesadüfi olarak seçilen 200 müşteriden 184’ü fiyatlardan memnun
olduğunu bildirmektedir.%1 önem düzeyinde, süpermarketteki
fiyatlardan memnun olanların oranının %95’e eşit olmadığını
söyleyebilir miyiz?
p −π p −π 0.92 − 0.95
Z= = = = −1.95
σp π (1 − π ) 0.95(1 − 0.95)
n 200
Hreddedilemez
0 33
33
İSTATİSTİK II
Hipotez Testleri - 2
1
Hipotez Testleri - 2
1 İki Anakütle Ortalaması Arasındaki Farkın
Testi: Bağımsız ve Büyük Örnekler
2 İki Anakütle Ortalaması Arasındaki Farkın
Testi: Bağımsız ve Küçük Örnekler
3 İki Anakütle Ortalaması Arasındaki Farkın
Testi: Eşleştirilmiş Örnekler
4 İki Anakütle Oranı Arasındaki Farkın Testi
2
İki Anakütle Ortalaması Arasındaki
Farkın Testi: Bağımsız ve Büyük
Örnekler
3
Tanımlar
Bağımsız İki Örnek
Bir anakütleden seçilen örnek değerleri,
diğer bir anakütleden seçilen örnek
değerleri ile ilişkisizdir veya bir şekilde
eşleşmemiştir.
Bir örnekteki değerler, diğer bir örnekteki
değerler ile ilişkili ise, bu tür örnekler
bağımlıdır. Böyle örneklere eşleştirilmiş
örnekler denir.
4
Varsayımlar
5
Örnekleme Dağılışı
2 2
σ σ
(X1 − X 2 ) ~ N µ1 − µ2 , 1 + 2
n1 n2
6
Hipotezler
• H 0: µ 1 – µ 2 = 0
• H 1: µ 1 – µ 2 ≠ 0 (Çift Taraflı Test)
• H 0: µ 1 – µ 2 = 0
• H 1: µ 1 – µ 2 > 0 (Tek Taraflı Test)
• H 0: µ 1 – µ 2 = 0
• H 1: µ 1 – µ 2 < 0 (Tek Taraflı Test)
7
Test İstatistiği
(x1 - x2)
z =
σ 2.
σ 2
n1
1
+ n 2
8
Coca Cola Pepsi’ye Karşı
İki kola markası Coca Cola ve Pepsinin kutulu
ürünlerinin içerik ağırlıklarını (pound)
karşılaştırmak için her iki üründen şans örnekleri
alınmış ve aşağıdaki veriler elde edilmiştir. 0.01
önem seviyesinde, Coca Cola’ların ortalama
ağırlıklarının, Pepsi’lerin ortalama ağırlıklarından
farklı olup olmadığını araştırınız.
Z = - 2.575 Z = 2.575
µ1 - µ2 = 0
or Z = 0
10
Coca Cola Pepsi’ye Karşı
z =
(0.81682 - 0.82410)
0.0075707 2 0.005701 2
+
36 36
= - 4.63
11
Coca Cola Pepsi’ye Karşı
İddia: µ1 ≠ µ2
Ho : µ 1 = µ 2
H1 : µ 1 ≠ µ 2
α = 0.01
H0 ret H0 reddedilemez H0 ret
Z = - 2.575 Z = 2.575
Örnek verisi: µ1 - µ2 = 0
z = - 4.63 or Z = 0
12
Coca Cola Pepsi’ye Karşı
İddia: µ1 ≠ µ2
Coca Cola’nın ortalama kutu içerik
Ho : µ 1 = µ 2 ağırlıkları, Pepsi’nin ortalama kutu
içerik ağırlıklarından anlamlı derecede
H1 : µ 1 ≠ µ 2 farklıdır.
α = 0.01
H0 ret H0 reddedilemez H0 ret
Z = - 2.575 Z = 2.575
Örnek verisi: µ1 - µ2 = 0
z = - 4.63 or Z = 0
13
İki Anakütle Ortalaması
Arasındaki Farkın Testi:
Bağımsız ve Küçük Örnekler
14
Varsayımlar
1. İki örnek de basit şans örneğidir ve bağımsızdır.
2. Anakütlelerin dağılışı normaldir ve örneklerin en az biri
30’un altındadır.
3. σ1 ve σ2 bilinmemektedir.
4. σ1 = σ2.
15
Örnekleme Dağılışı
X1 − X 2
t= ~ t n1 + n2 −2
2 1 1
s p +
n1 n2
serbestlik derecesi = n1 + n2 – 2
16
Örnek
•Bir aracı kurumda çalışan bir finansal analistten, iki hisse
senedinin ortalama fiyatlarının aynı olup olmadığını
araştırması istenmiştir. Kapanış fiyatlarından, aşağıdaki
veriler elde edilmiştir.
A Hisse S. B Hisse S.
•Gün 21 25
•Ortalama 3.27 2.53
•Std Sapma 1.30 1.16
•Aynı standart sapmalı, normal
dağılış varsayımıyla, ortalama
kapanış fiyatları aynı kabul edilebilir mi?
(α = .05) © 1984-1994 T/Maker Co.
17
Çözüm
Sonuç:
18
Çözüm
-2.0154 0 2.0154 t
19
Çözüm
t=
(X 1 − X2)
=
(3.27 − 2.53) = +2.03
1 1 1 1
SP
2
⋅ + 1.510 ⋅ +
n1 n2 21 25
SP
2 (n
= 1
− 1) ⋅ S1
2
+ (n2 − 1) ⋅ S 2
2
n1 + n2 − 2
=
(21 − 1) ⋅ (1.30 ) + (25 − 1) ⋅ (1.16 )
2 2
= 1.510
21 + 25 − 2
20
Çözüm
22
Varsayımlar
1. Örnek verileri eşleştirilmiştir.
23
Notasyon
25
Örnek
•Bir Pazar araştırmaları uzmanı
müşterisinin bir ürününün • (1) (2)
satışları ile rakibinin aynı Mağaza Müşteri Rakip d
ürününün satışlarını
karşılaştırmak istemektedir. • 1 10 11 -1
Bunun için rastgele 8 perakende• 2 8 11 -3
satış mağazası seçilmiş ve 3 7 10 -3
yandaki veriler elde edilmiştir.
4 9 12 -3
•müşterinin ortalama satışları,
rakip firma ortalama 5 11 11 0
satışlarından daha az mıdır? α = 6 10 13 -3
0.01 için araştırınız. 7 9 12 -3
8 8 10 -2
26
Çözüm
•H0: µD = 0 (µD = µ1 - µ2)
Test İstatistiği:
•Ha: µD < 0
α = .01
d −µd −2.25 − 0
t= = = −5.486
SD 116
.
•sd = 8 - 1 = 7
•Kritik değer
nD 8
tα,n-1 = t0.01,7 = 2.998 Karar:
Reject Ho Ret
.01 Sonuç:
Müşterinin satışları
-2.998 0 t rakibinden azdır.
27
İki Anakütle Oranı Arasındaki
Farkın Testi
28
Varsayımlar
1. İki bağımsız basit şans örneğinden elde
edilmiş oranlara sahibiz.
29
Notasyon
Anakütle 1 için:
π1 = anakütle oranı
n1 = örnek büyüklüğü
x1 = örnekteki başarı sayısı
p1 = x1/n1 (örnek oranı)
q1 = 1 - p1
Anakütle 2 için aynı tanımlamalar sırasıyla
π2, n2 , x2 , p2. and q2 , için de geçerlidir.
30
Oranlar Arasındaki Farkın
Örnekleme Dağılışı
π (1 − π 1 ) π 2 (1 − π 2 )
p1 − p 2 ~ N π 1 − π 2 ; 1
+
n1 n 2
31
Hipotezler
H0 π1 - π 2 = 0 π1 - π2= 0 π1 - π2= 0
H1 π1 - π2 ≠ 0 π1 - π2< 0 π1 - π2 > 0
32
Test İstatistiği
Z ≅
( p1 − p2 ) − (π 1 − π 2 ) p=
X1 + X 2
1 1 n1 + n2
p ⋅ (1 − p ) ⋅ +
n1 n2
33
Örnek
•Bir firmanın personel müdürü, firmada
kullanılmış olan iki ayrı performans
değerlendirme yönteminin ne kadar adil
olduğu ile ilgili olarak çalışanların
algılamalarını ölçmüştür. Yöntem 1’i
değerlendiren 78 çalışandan 63’ü bu
yöntemi adil bulmuştur. Yöntem 2’yi
değerlendiren 82 çalışandan 49’u bu
yöntemi adil bulmuştur. 0.01 önem
düzeyinde, çalışanların algılamaları
arasında fark olup olmadığını test
ediniz.
34
Çözüm
Sonuç:
35
Çözüm
X 1 63 X 2 49
p1 = = = .808 p2 = = = .598
n1 78 n2 82
X 1 + X 2 63 + 49
p= = = .70
n1 + n2 78 + 82
Z=
( p1 − p2 ) =
(.808 − .598)
1 1 1 1
p ⋅ (1 − p ) ⋅ + (.70) ⋅ (1 − .70) ⋅ +
n1 n2 78 82
= +2.90
36
Çözüm
• H 0: σ = σ 0
• H 1: σ ≠ σ 0 (Çift Taraflı Test)
• H 0: σ = σ 0
• H 1: σ > σ 0 (Tek Taraflı Test)
• H 0: σ = σ 0
• H 1: σ < σ 0 (Tek Taraflı Test)
Ki-Kare Dağılışı
Test İstatistiği
(n - 1) s 2
X2=
σ2
n = örnek büyüklüğü
s 2 = örnek varyansı
σ 2 = anakütle varyansı
(sıfır hipotezinde verilmektedir)
Ki-Kare Dağılışı İçin
Kritik Değerler
Ki-kare tablosundan
bulunur.
Serbestlik derecesi = n -1
Table A-4 Chi-Square (x2) Distribution
Degrees of Area to the Right of the Critical Value
freedom 0.995 0.99 0.975 0.95 0.90 0.10 0.05 0.025 0.01 0.005
iddia: σ ≠ 2.5
H0: σ 2= 6.25
H1: σ2 ≠ 6.25
Örnek: yeni tasarlanan bir otomobil motorunun benzin tüketiminin standart
sapmasının, 2.5 galondan farklı olup olmadığını anlamak için 16 motor test
edilmiş ve örnek standart sapması 2.2 galon bulunmuştur. İddiayı α = 0.01
önem seviyesinde araştırınız.
iddia: σ ≠ 2.5
H0: σ 2= 6.25
α = 0.01 α/2 = 0.005
H1: σ2 ≠ 6.25
0.005 0.005
Örnek: yeni tasarlanan bir otomobil motorunun benzin tüketiminin standart
sapmasının, 2.5 galondan farklı olup olmadığını anlamak için 16 motor test
edilmiş ve örnek standart sapması 2.2 galon bulunmuştur. İddiayı α = 0.01
önem seviyesinde araştırınız.
iddia: σ ≠ 2.5
H0: σ 2= 6.25
α = 0.01 α/2 = 0.005
H1: σ2 ≠ 6.25
n = 16
0.005 0.005 df = 15
32.801
Örnek: yeni tasarlanan bir otomobil motorunun benzin tüketiminin standart
sapmasının, 2.5 galondan farklı olup olmadığını anlamak için 16 motor test
edilmiş ve örnek standart sapması 2.2 galon bulunmuştur. İddiayı α = 0.01
önem seviyesinde araştırınız.
iddia: σ ≠ 2.5
H0: σ 2= 6.25
α = 0.01 α/2 = 0.005
H1: σ2 ≠ 6.25
0.995
n = 16
0.005 0.005 df = 15
4.601 32.801
x 2
=
(n -1)s2
σ 2
= (16 -1) (2.2)2
2.52
≈ 7.916
x 2
=
(n -1)s2
σ 2
= (16 -1) (2.2)2
2.52
≈ 7.916
H0 reddedilemez
4.601 32.801
x2 = 7.916
Tüketim değerlerinin standart sapmasının 2.5
galondan farklı olduğu söylenemez.
İki Varyansın Karşılaştırılması
•Sıfır hipotezi:
2 2
•H0: σ 1 = σ 2
•İki anakütle varyansı eşit, diğer bir deyişle birbirine
oranı “1” anlamına gelmektedir.
•Buradan, test istatistiği F, sadeleşerek
halini alır.
F Dağılışı
Alternatif Hipotez, Test İstatistiği
ve Ret Bölgesi
• H1: σ 2 ≠ σ 2
1 2
s12 > s22 ise F = s12 / s22 > Fα / 2,n1 −1,n2 −1 ise H0 ret
s22 > s12 ise F = s22 / s12 > Fα / 2,n2 −1,n1 −1 ise H0 ret
2 2
σ
• H1: 1 < σ 2 F = s22 / s12 > Fα ,n2 −1,n1 −1 ise H0 ret
• H1: σ 2 > σ 2
1 2
F = s12 / s22 > Fα ,n1 −1,n2 −1 ise H0 ret
Örnek
• Bir fabrikadaki aynı işi yapan iki makasın aynı kalitede
üretim yapıp yapmadığını araştırmak için her iki makasta
kesilmiş metal çubuklardan 8’er örnek alınmış ve boy
değerleri aşağıdaki gibi bulunmuştur. Kalite ölçüsü
olarak varyans kullanılırsa, α = 0.02 için araştırma
yapınız.
• Birinci makas - 7.5, 8.2, 8.1, 8.4, 7.1, 7.3, 7.1, 7.8
• İkinci makas - 7.9, 8.4, 8.0, 7.8, 7.5, 7.2, 7.4, 7.3
Örnek
H0: σ 12 = σ 22
H1: σ 12 ≠ σ 22
2 2
F= s1 / s2 = 0.261 / 0.167 = 1.565
μt μ0
μ0 - zα (σ/√n)
II. Tip Hatanın Hesaplanması
• Güç nedir?
⇒ Testin gücü = 1 - β
1) Bir kafede yaz aylarında satılan
HİPOTEZ TESTLERİ
TESTLERİ limonataların satış miktarının ortalamasının
24 lt.’den az olduğu iddia edilmektedir. İddiayı
ALIŞ
ALIŞTIRMA SORULARI test etmek amacıyla 36 günlük bir inceleme
yapılmış ortalamanın 22 lt. ve standart
sapmanın ise 3,5 lt. olduğu görülmüştür. Buna
göre α = 0,04 önem seviyesinde gerekli
hipotezleri kurup iddiayı test ederek
yorumlayınız.
2012
Araş.Gör. Efe SARIBAY
2) Bir hisse senedinin kapanış fiyatının 3) Bir üretici satın aldığı çelik levhaların
varyansının daha önceki yapılan ağırlıklarının ortalamasının 100 kg.
çalışmalardan 144 olduğu bilinmektedir. 25 standardına uygun olup olmadığını
günlük yapılan bir inceleme sonucunda hisse araştırmaktadır. Bu amaçla incelenen
senedinin kapanış fiyatının ortalaması 35 24 adet levhanın ağırlıklarının ortalaması
olarak hesaplanmıştır. Hisse senedinin 95 kg. ve varyansı 121 olarak
kapanış fiyatı ortalamasının 30’dan büyük hesaplanmıştır. Levhaların ağırlıklarının
olduğu iddiasını α = 0,01 önem seviyesinde normal dağılıma uygun olduğu varsayımı
iddiayı test edip yorumlayınız. altında α = 0,02 önem seviyesinde iddiayı
test edip yorumlayınız.
1
4) Çevre koruma müdürlüğü büyük bir 5) Yabancı marka spor ayakkabı üreten bir
sanayi kuruluşunun çıkardığı günlük işletme Ege Bölgesi’ndeki Pazar payının
sülfürükoksit miktarının ortalamasının
belirlemek için araştırma yapmıştır. Bu % 30’dan fazla olduğunu iddia etmektedir. Bu
miktarın kabul edilebilir ortalama olan 9’dan amaçla yapmış olduğu bir alan
az olduğu iddia edilmektedir. Ölçüm fiyatları araştırmasında 850 kişiden 289 kişi
çok yüksek olduğundan sadece 9 günlük tarafından bu markanın tercih edildiği
ölçümlerden bir rastgele örnek oluşturularak
aşağıda verilmiştir.Normal dağılış varsayımı görülmüştür. α = 0,08 önem seviyesinde
hipotezi α = 0,10 önem seviyesinde test iddiayı test edip yorumlayınız.
edip yorumlayınız.
2
8) Bir ekmek fabrikasında günlük üretilen 9) Ege İ.İ.B.F ve Dokuz Eylül İ.İ.B.F. okuyan
ekmeklerin ağırlıklarının varyansları öğrencilerin ALES sınavı başarıları
konusunda yapılan bir çalışmada incelenen karşılaştırılmak isteniyor. Fakültemizin öğretim
41 ekmeğin ağırlıkları ortalaması 400gr., üyeleri öğrencilerimizin daha başarılı olduğunu
öne sürerek aşağıdaki istatistiksel bilgileri
standart sapması ise 12 gr. olarak
ALES sınav sonuçlarından elde ediyorlar. Buna
hesaplanmıştır. Yapılan iyileştirmeler
göre öne sürülen görüşün doğruluğunu
sonucunda ekmelerin ağırlığının varyansının α = 0,003 önem seviyesinde test edip
300’den az olacağı beklendiğine göre, yorumlayınız.
beklentinin karşılanıp karşılanmadığını
Ege İİBF DEU İİBF
α = 0,01 önem seviyesinde test edip
n 50 70
yorumlayınız.
x 70 76
s 6 7
10) Bodrum ve Marmaris’in yaz ayları 11) Zirai bir merkezde bir gübrenin buğday üretimi
üzerindeki etkisi ölçülecektir. Bunu incelemek
içerisindeki deniz suyu sıcaklıkları
amacıyla şansa bağlı olarak 10 toprak saha
karşılaştırılmak isteniyor. Bu amaçla 40 gübrelenmiş ve diğer 12 toprak saha kontrol grubu
günlük yapılan bir inceleme sonucunda olarak gübrelenmiştir. Diğer tüm koşulların aynı
Bodrum’daki deniz suyu sıcaklık ortalaması olduğu bilgisi altında, gübrelenen parsellerde
250C, varyansı 16, Marmaris’te yapılan 50 ortalama buğday üretimi 5,1 kg. ve standart sapma
günlük bir inceleme sonucunda deniz suyu 0,36 kg bulunmuştur. Kontrol grubunda ise ortalama
sıcaklığı 270C, varyansı ise 25 olarak buğday tüketimi 4,8 kg. ve standart sapma 0,4 kg.
olarak bulunmuştur. Anakütle dağılımlarının normal
hesaplanmıştır. Deniz suyu sıcaklıklarının
ve eşit varyanslı olduğu varsayımı altında kontrol
ortalamasının birbirine eşit olup olmadığını grubunda ortalama buğday üretiminin gübrelenmiş
α = 0,05 önem seviyesinde test edip parsellerden daha az olduğu iddiasını α = 0,01
yorumlayınız. önem seviyesinde test edip yorumlayınız.
3
12) Karşıyaka ve Alsancak’ta şubesi bulunan 13) Yatılı okul eğitiminin öğrencilerin
pastanenin aylık tükettiği dondurma miktarları ağırlıklarında bir farklılık meydana getirip
karşılaştırmak isteniyor. 12 aylık bir inceleme getirmediğini araştırmak amacıyla
sonucunda Karşıyaka’da satılan dondurma rastgele seçilen 6 öğrencinin ilk gün
miktarının ortalaması 65 kg., standart sapması ağırlıkları ile 6 ay sonraki ağırlıkları
5 kg., Alsancak’ta ise ortalamanın 72 kg.,
standart sapmanın ise 6 kg olduğu
aşağıdaki gibi kaydedilmiştir. Buna göre
görülmüştür. Anakütle dağılımlarının normal bir yıllık yatılı eğitiminin öğrencilerin
ve eşit varyanslı olduğu varsayımı altında ağırlıkları üzerinde herhangi bir etkisi olup
Alsancak’ta satılan dondurma miktarının olmadığını α = 0,10 önem seviyesinde
ortalamasının Karşıyaka’dan daha fazla test edip yorumlayınız.
olduğu iddiasını α = 0,025 önem seviyesinde öğrenciler 1 2 3 4 5 6
test ediniz. ilk gün ağırlıkları (kg.) 64 71 46 80 95 47
1 yıl sonraki ağırlıkları (kg.) 56 73 45 82 90 52
14) Piyasa yeni sürülecek olan bir tansiyon 15) Bir bankada ocak ve şubat aylarında
ilacının etkinliğinin araştırılmaktadır. Bu yatırımcıların altın fonu alma oranları
amaçla 7 tansiyon hastasının ilaç karşılaştırılmak isteniyor. Şubat ayında 250
verilmeden önce ve ilaç verildikten sonra yatırımcıdan 117’si, Mart ayından ise 325
tansiyon değerleri ölçülüp aşağıdaki tabloda yatırımcıdan 141’i yatırımlarını altın fonu alarak
verilmiştir. Buna göre ilacın tansiyonu değerlendirmiştir. Buna göre Şubat ve Mart
düşürmede etkili olup olmadığını aylarında yatırımcıların altın fonunu tercih
α = 0,01 önem seviyesinde test edip
yorumlayınız etme oranlarının birbirine eşit olup olmadığını
α = 0,01 önem seviyesinde test edip
yorumlayınız
İlaç öncesi 14 16 17 18 16 19 21
İlaç sonrası 13 15 17 15 14 16 17
4
16) İstatistik 2 dersi başarı oranı açısından 17) İMKB’de işlem gören iki hisse senedinin
İşletme ve İktisat Bölümleri karşılaştırılmak haftalık kapanış fiyatları arasındaki
isteniyor. Bu amaçla iktisat bölümünde okuyan değişkenlik karşılaştırılmak isteniyor. Bu
istatistik 2 dersini almış 150 öğrenci seçiliyor ve amaçla A hisse senedinin 13 haftalık kapanış
80’inin başarılı olduğu, işletme bölümünde fiyatlarının varyansı 81, B hisse senedinin 21
okuyan istatistik 2 dersini almış 200 öğrenciden haftalık kapanış fiyatının varyansı ise 65
120’sinin başarılı olduğu görülüyor. İşletme olarak hesaplanmıştır. B hisse senedinde
bölümü öğrencilerinin başarını oranının daha meydana gelen değişkenliğin A hisse
fazla olduğu iddiasını α = 0,10 önem senedinde meydana gelen değişkenlikten
seviyesinde test edip yorumlayınız. daha az olduğu iddiasını normal dağılış
varsayımı altında α = 0,05 önem seviyesinde
test edip yorumlayınız.
5
İSTATİSTİK-II
Korelasyon ve Regresyon
1
Korelasyon ve Regresyon
• Genel Bakış
• Korelasyon
• Regresyon
• Belirleme katsayısı
• Varyans analizi
• Kestirimler için aralık tahminlemesi
2
Genel Bakış
İkili veriler
aralarında bir ilişki var mıdır?
varsa bu ilişki bir eşitlik ile temsil
edilebilir mi?
bu eşitliğin kestirimler (öngörümler)
için kullanılması
3
Korelasyon
4
Tanım
Korelasyon
bir değişkenin değeri değişirken
diğer bir değişken bununla
doğrusal ilişkili olarak
değişiyorsa korelasyon vardır
denebilir.
5
Varsayımlar
1. (x,y) ikili verilerden oluşan örnek
bir şans örneğidir.
2. x ve y’lerin dağılışı normaldir.
6
Tanım
Saçılma diyagramı
yatay eksen x, dikey eksen y
olmak üzere, (x,y) ikili örnek
verilerinin işaretlendiği bir
grafiktir. Her bir (x,y) ikilisi tek bir
noktadır.
7
Örnek
Bir firma bünyesindeki satış personeli
sayısı ile satış gelirleri arasındaki ilişkiyi
bilmek istemektedir.
Satış Personeli Sayısı Satış Gelirleri (yüz
Yıllar
(x) bin $) (y)
1999 15 1,35
2000 18 1,63
2001 24 2,33
2002 22 2,41
2003 25 2,63
2004 29 2,93
2005 30 3,41
2006 32 3,26
2007 35 3,63
2008 38 4,15
8
İkili Verilerin Saçılma Diyagramı
Scatterplot of satış geliri vs personel sayısı
4,5
4,0
3,5
satış geliri
3,0
2,5
2,0
1,5
1,0
15 20 25 30 35 40
personel sayısı
9
Pozitif Korelasyon
y y y
x x x
(a) Pozitif (b) Güçlü (c) Mükemmel
pozitif pozitif
10
Negatif Korelasyon
y y y
x x x
(d) Negatif (e) Güçlü (f) Mükemmel
negatif negatif
11
y y
x x
(g) Korelasyon yok (h) Doğrusal olmayan güçlü ilişki
12
Tanım
Korelasyon Katsayısı r
Bir örnekteki x ve y ikili değerleri arasındaki
doğrusal ilişkinin gücünü ölçmektedir.
nxy - (x)(y)
r=
n(x2) - (x)2 n(y2) - (y)2
13
Korelasyon Katsayısı r’nin
Özellikleri
1. -1 r 1
2. Mükemmel pozitif doğrusal ilişki olduğunda
r = 1 olur.
3. Mükemmel negatif doğrusal ilişki
olduğunda r = -1 olur.
4. Doğrusal ilişki yok ise r = 0 olur.
14
Korelasyon ile ilgili hatalar
1. Nedensellik: Korelasyon değişkenler
arasındaki sebep sonuç ilişkilerini açıklamaz.
15
Korelasyon ile ilgili hatalar
250
200
150
y
100
50
0
0 1 2 3 4 5 6 7 8
16
Örnek Verileri İçin Korelasyon
Hesaplamaları
Satış Gelirleri
Satış Personeli
Yıllar (yüz bin $) x2 y2 xy
Sayısı (x)
(y)
1999 15 1,35 225 1,8225 20,25
2000 18 1,63 324 2,6569 29,34
2001 24 2,33 576 5,4289 55,92
2002 22 2,41 484 5,8081 53,02
2003 25 2,63 625 6,9169 65,75
2004 29 2,93 841 8,5849 84,97
2005 30 3,41 900 11,6281 102,3
2006 32 3,26 1024 10,6276 104,32
2007 35 3,63 1225 13,1769 127,05
2008 38 4,15 1444 17,2225 157,7
Toplamlar 268 27,73 7668 83,8733 800,62
17
Örnek Verileri İçin Korelasyon
Hesaplamaları
nxy - (x)(y)
r=
n(x2) - (x)2 n(y2) - (y)2
(10)(800,62) - (268)(27,73)
r=
(10)(7668) - (268)2 (10)(83,8733) - (27,73)2
18
Anakütle Korelasyon
Katsayısının Testi
=Anakütle korelasyon katsayısı
H0: =
(anlamlı bir korelasyon yoktur)
H1:
(anlamlı bir korelasyon vardır)
19
Test İstatistiği t
Test istatistiği:
r
t=
1-r2
n-2
Kritik değerler
21
Anakütle Korelasyon
Katsayısının Testi
=Anakütle korelasyon katsayısı
H0: =
(satış personeli sayısı ile satış gelirleri arasında
anlamlı bir korelasyon yoktur)
H1:
(satış personeli sayısı ile satış gelirleri arasında
anlamlı bir korelasyon vardır)
22
Test İstatistiği t
Test istatistiği:
0,987
r = 17,39
t= =
1-r2 1 – 0,987 2
n-2 10 - 2
Kritik değer
serbestlik derecesi = n - 2 = 10 – 2 = 8, a = 0,05 için t0,025, 8= 2,31 < 17,39
23
Regresyon
x bağımsız değişken (açıklayıcı
değişken)
b1 = eğim b0 = kesen
24
Regresyon
Regresyon Eşitliği
Verilen bir ikili veriler topluluğu için regresyon
eşitliği,
y^ = b0 + b1x
iki değişken arasındaki ilişkiyi tanımlamaktadır.
b1 = eğim b0 = kesen
Regresyon Doğrusu
Regresyon eşitliğinin grafiğidir.
25
Regresyon Doğrusu
Scatterplot of satış geliri vs personel sayısı
4,5
4,0
3,5
satış geliri
3,0
2,5
2,0
1,5
1,0
15 20 25 30 35 40
personel sayısı
26
Notasyon
Anakütle Örnek
Parametresi istatistiği
27
Artıklar ve En Küçük Kareler
Yöntemi
Artıklar
e = (y - ^
y)
En Küçük Kareler Yöntemi
e2’yi minimum yapan b0 ve b1 değerlerinin
bulunmasıdır.
28
0 and 1 için En Küçük Kareler
Tahminleyicileri
(y) (x2) - (x) (xy)
b0 =
n(x2) - (x)2
29
Önce b1 bulunursa, ardından
b0 = y - b1x
30
Satış geliri için regresyon
eşitliğinin tahminlenmesi
n(xy) - (x) (y)
b1 =
n(x2) - (x)2
10(8,62) - (268) (27,73)
b1 =
10(7668) - (268)2
b1 = 0,118
^
y = - 0.398 + 0.118 (30)
^
y = 3.1516, 315160 $
33
Toplam Değişkenlik, Açıklanan Değişkenlik ve
Açıklanamayan Değişkenlik
y
20
(5, 19)
19
18
•
17 Açıklanamayan
16 değişkenlik
15 Toplam (5, 13) ^)
14 (y - y
13
değişkenlik
(y - y )
• Açıklanan
12
11 değişkenlik
10
(^
y - y)
9
8
•
7 (5, 9) y=9
6
5
4
y^ = 3 + 2x
3
2
1
0 x
0 1 2 3 4 5 6 7 8 9
34
(toplam değişkenlik) = (açıklanan değişkenlik) + (açıklanamayan değişkenlik)
(y - y) = ^
(y - y) + (y - ^y)
(y - y) = + (y - y)
2 ^ 2 ^ 2
(y - y)
(Genel kareler toplamı) = (regresyon kareler toplamı) + (artık kareler toplamı)
35
Tanım
Belirleme Katsayısı
y’deki değişkenliğin ne kadarının regresyon
doğrusu tarafından açıklanabildiğini söyler.
^ - y)2
(y
2
RKT
r = =
(y - y)2 GKT
36
^ - y)2
(y
2
b12( x2 – (x)2/n)
r = =
(y - y)2 y2 – (y)2/n
2
0,1182(7668 – (268)2/10)
r = = %97,4
83,873– (27,73)2/10
Toplam
(Genel) Genel Kareler Toplamı n-1
GKT = y2 – (y)2/n
38
Hata Varyansının Tahmini
2 (y - y) ^ 2
s = = Artık Kareler
n-2 Ortalaması
s= n-2
39
F - Testi
H0: 12...k
(Model anlamsızdır)
H1: en az bir i için i
(Model anlamlıdır)
40
F – Testi (Basit Doğrusal
Regresyon İçin)
H0: 1
(Model anlamsızdır)
H1: 1
(Model anlamlıdır)
41
Varyans Analizi Tablosu (VAT)
(Satış Gelirleri Örneği)
Değişkenlik Kareler Serbestlik Kareler F-Oranı
Kaynağı Toplamları (KT) Derecesi Ortalaması (KO)
Regresyon KO =
RKT = b12( x2 – (x)2/n)
RKO = RKT / 1
Regresyon = 6,7982 / 1 RKO
2 2
= 0,118 (7668 –(268) /10) 1 F
= 6,7982
= 6,7982 AKO
GKT = y2 – (y)2/n
Toplam
= 83,873– (27,73)2/10 n–1=
(Genel) = 6,9780 10 – 1 = 9
42
F – Testi (Satış Gelirleri Örneği
İçin)
H0: 1
(Model anlamsızdır)
H1: 1
(Model anlamlıdır)
43
Anakütle Regresyon
Katsayısılarının Testi
1=Anakütle regresyon
katsayısı (X1 için)
H0: 1=
(1 anlamsızdır)
H1: 1
(1 anlamlıdır)
44
Test İstatistiği t
Test istatistiği:
b1
t=
Sb1
45
Kritik değerler
46
Anakütle Regresyon
Katsayısılarının Testi (Satış
Gelirleri Örneği)
1=Anakütle regresyon
katsayısı (X1 için)
H0: 1=
(1 anlamsızdır)
H1: 1
(1 anlamlıdır)
47
Test İstatistiği t
Test istatistiği:
0,118
b1
t= = = 17,39
S b1 0,006804
48
Kritik değerler
serbestlik derecesi = n - 2 olan
tablo değerleri dikkate alınarak
karar verilir. a = 0,05 olsun.
49
Anakütle Regresyon
Katsayısılarının Testi
0=Anakütle regresyon
modelinde sabit terim
H0: 0=
(0 anlamsızdır)
H1: 0
(0 anlamlıdır)
50
Test İstatistiği t
Test istatistiği:
b0
t=
Sb0
51
Kritik değerler
52
Anakütle Regresyon
Katsayısılarının Testi (Satış
Gelirleri Örneği)
0=Anakütle regresyon
modelindeki sabit terim
H0: 0=
(0 anlamsızdır)
H1:
(0 anlamlıdır)
53
Test İstatistiği t
Test istatistiği:
b0 - 0,398
t= = = - 2,11
S b0 0,1884
=0,1884
54
Kritik değerler
serbestlik derecesi = n - 2 olan
tablo değerleri dikkate alınarak
karar verilir. a = 0,05 olsun.
55
E(y) Değeri İçin Kestirim Aralığı
^
y ^ +E
- E < E(y) < y
Burada
2
1 n(x0 - x)
E = ta2,n - 2 s n + n(x2) - (x)2
1 (10)(30 -26,8)2
E = (2,306)(0,1499)
10
+ (10)(7668) - (268)
2
E = (2,306)(0,01815) = 0,04186
6
1 2 6 21
E ( x) xP( x) ...... 3,5
x 1 6 6 6 6
Örnek 1b
• Ancak bu değerinin bir an için bilinmediği
ve bunu tahmin etmek için populasyondan
3 örnek alındığını varsayılsın.
• Zar 3 kez atılsın ve örnek sonuçları; x1=2, x2=2,
x3=6 elde edilsin.
x 2 2 6 10
x 3,333 ve m=2 hesaplanabilir.
n 3 3
=3.5
1 2 3 4 5 6
X=3.3
m=2
1 2 3 4 5 6
x
m
x 0 3 12
P(x) 1 1 1
3 3 3
n=3
x 0 1 2 3 4 5 6 8 9 12
P x 1 3 3 1 3 6 3 3 3 1
27 27 27 27 27 27 27 27 27 27
m 0 3 12
P (m) 7 13 7
27 27 27
ÖRNEK İSTATİSTİKLERİNİN-
TAHMİNLEYİCİLERİN
ÖZELLİKLERİ
sapmasızlık
minimum varyanslılık
f(A)
A
için sapmasız örnek istatistiği
f(B)
B
Sapma
Ex E m
A C
X
x m
ÖRNEK 3:
• Örnek 2 verileri için aritmetik ortalama ve
örnek medyanının tahminleyici özelliklerini
araştırınız.
ÖRNEK 3:
Aritmetik ortalama x , anakütle ortalamasının
sapmasız bir tahminleyicisi midir?
x 0 3 12
P(x) 1/3 1/3 1/3
N
E x xi P( xi )
i 1
1 1 1
0 3 12
3 3 3
5
ÖRNEK 3:
x 0 1 2 3 4 5 6 8 9 12
P x 1/27 3/27 3/27 1/27 3/27 6/27 3/27 3/27 3/27 1/27
N
x E x xi P( xi )
i 1
1 3 1
0 1 12
27 27 27
5
ÖRNEK 3:
Sonuç:
Ex
olduğundan aritmetik ortalama (tahminleyici),
anakütle ortalamasının (parametrenin)
sapmasız bir tahminleyicisidir.
ÖRNEK 3:
Sonuç:
E m
olduğundan örnek medyanı (tahminleyici),
anakütle ortalamasının (parametrenin)
sapmalı bir tahminleyicisidir.
MİNİMUM VARYANSLILIK
Anakütle parametresi olsun.
Parametrenin tahminleyicileri; ˆ1 , ,ˆk
olsun.
Eğer,
V ˆi V ˆj i j 1,..., k 1
ise
ˆi tahminleyicisi parametresinin minimum
varyanslı tahminleyicisidir.
ÖRNEK: MİNİMUM VARYANSLILIK
Anakütle parametresi (anakütle
ortalaması) olsun.
Parametrenin alternatif tahminleyicileri;
ˆ1 x
ˆ2 G.O
ˆ3 H .O
ˆ4 m
olsun.
V x V m V G.O V H .O
x tahminleyicisi parametresinin minimum
varyanslı tahminleyicisidir.
ÖRNEK: ETKİN TAHMİNLEYİCİ
Anakütle parametresi (anakütle
ortalaması) olsun.
Parametrenin alternatif tahminleyicileri;
ˆ1 x
ˆ2 G.O
ˆ3 H .O
ˆ4 m
olsun.
E x ve
V x V m V G.O V H .O
x tahminleyicisi parametresinin etkin
tahminleyicisidir.
ÖRNEK: ETKİN TAHMİNLEYİCİ
P(X) Ortalamanın
örnekleme
dağılışı B
Medyanın
A örnekleme
dağılışı
X
ÖRNEKLEME DAĞILIMI ÖRNEK
HACMİNİN BİR FONKSİYONUDUR
Örnek Hacmi büyüdükçe tahminleyicinin varyansı küçülür.
Büyük
P(X) örnek
hacimli
durum
B
Küçük
örnek
A hacimli
durum
X
ÖRNEK 3:
Örnek medyanı m, anakütle ortalamasının
sapmasız bir tahminleyicisi midir?
m 0 3 12
P(m) 7/27 13/27 7/27
7 13 7
E m mi P mi 0 3 12
i 27 27 27
4.56
E m
ÖRNEK 3:
Aritmetik ortalama x , anakütle ortalamasının
Minimum Varyanslı bir tahminleyicisi midir?
x 0 3 12
P(x) 13 13 13
x2 0 9 144
x2P(x) 0 9 3 144 3
E x 2 xi2 P ( xi )
153
3
V x E x E x
2 2 2
x
153 2
5
3
26
ÖRNEK 3
Aritmetik ortalamanın varyansı x2
xi 0 1 2 3 4 5 6 8 9 12
P xi 1
27
3
27
3
27
1
27
3
27
6
27
3
27
3
27
3
27
1
27
xi 2 0 1 4 9 16 25 36 64 81 144
xi 2 P xi 0 3 27 12 27 9 27 48 27 150 27 108 27 192 27 243 27 144 27
E x xi P xi
2 2 909
27
V x E ( x ) E ( x )
2 2
909
(5)2
27
=8,66
ÖRNEK 3
Örnek medyanının varyansı 2
m
mi 0 3 12
7 13 7
P(mi) 27 27 27
mi2 0 9 144
2 117 1008
mi P(mi) 0 27 27
E m 2
m P m 41.66
i
2
i
V m E (m ) E (m)
2 2
41.66 (4.56)2
=20.86
ÖRNEK 3
Sonuç:
V x V m
Aritmetik ortalama x , anakütle ortalamasının
Sapmasız ve Minimum Varyanslı
bir tahminleyicisidir.
BEKLENEN DEĞER VE VARYANS
OPERATÖRLERİNİN ÖZELLİKLERİ
BEKLENEN DEĞER OPERATÖRÜ E(.)
Şans değişkeni x anakütle ortalaması ve
anakütle varyansı olsun.
2
Aritmetik ortalama x
Örnek varyansı s 2
Örnek oranı p
BİR DAĞILIMIN BELİRLENMESİ
n n
Cevaplanması gereken sorular
Dağılımın tipi?
Parametreleri;
Ex ?
V x ?
DAĞILIMIN TİPİ
• Merkezi limit teoremine göre aritmetik
ortalamanın dağılımı yaklaşık olarak
normal dağılıma sahiptir.
• Normal dağılımın parametreleri:
– Anakütle ortalaması
– Anakütle varyansı
Dağılımın Parametreleri: Aritmetik
Ortalama için Anakütle Ortalaması
in1 xi 1
Ex E E x1 E xn
n n
1 n
E x
n n
Ex
Dağılımın Parametreleri: Aritmetik
Ortalama için Anakütle Varyansı
i 1 xi
n
1
V x V 2 V x1 V xn
n
n
1 n 2
V x 2
2
2
2
n n
2
V x
n
ARİTMETİK ORTALAMA x İÇİN
ÖRNEKLEME DAĞILIMI
2
x ~N x ; N x ;
2
x
x
n
Aritmetik Ortalamanın
Standartlaştırılması
x - x
z
x
x - x
z
x n
Normal olmayan dağılışlardan
örnekleme
•Merkezi eğilim
Anakütle dağılışı
x = 10
•Yayılma
= 50 X
x
n Örnekleme dağılışı
– Yerine koyarak n = 4 n =30
örnekleme X = 5 X = 1.8
X- = 50 X
Normal dağılış gösteren bir
anakütleden örnekleme
•Merkezi eğilim
Anakütle dağılışı
x = 10
•Yayılma
= 50 X
x
n Örnekleme dağılışı
Yerine konularak n = 4 n =16
örnekleme X = 5 X = 2.5
X- = 50 X
Merkezi limit teoremi
Örnek
hacmi
yeterince x
büyükse n
Örnekleme
(n 30) ...
dağılışı
hemen hemen
normal olur.
X
x
ÖRNEK 3
•Telekom’da çalışan bir
uzman, uzun zaman
yaptığı gözlemlerden,
telefon konuşma
sürelerinin (x),
= 8 dk. & = 2 dk. olan
normal dağılış gösterdiğini
belirlemiştir.
25 görüşme rasgele
seçilirse, örnek
ortalamasının 7.8 & 8.2
dakika arasında çıkması
olasılığı nedir? © 1984-1994 T/Maker Co.
Çözüm
X 7.8 8
Z .50
n 2 25
X 8.2 8
Örnekleme dağılışıZ .50 Standart Normal
n 2 25
Dağılış
X = .4 =1
.3830
.1915 .1915
p ~N p ; p N ;
2 1
n
Örnek Oranının Standartlaştırılması
p - p
z
p
p-
z
1 n
Örnek Hacminin Örnek Oranı Üzerindeki
Etkisi
Anakütle oranı sabitken örnek hacmi arttığında örnek
oranının standart hatası küçülür.
Aşağıdaki şekilde görüldüğü gibi örnek hacmi arttığında
p’in kendi ortalaması etrafında yoğunlaştığı
görülmektedir.
f ( p)
n=400
n=100
E ( p) pi P pi
i
E ( p) p
8 0 12 1 6 2 1 3
E ( p) 0.33
27 3 27 3 27 3 27 3
ÖRNEK 4
1
I. YÖNTEM 2
p V p
n
(1 ) 0.33(1 0.33)
p2 0.074
n 3
E ( p 2 ) pi2 P pi
i
8 0 12 1 6 4 1 9
E( p2 ) 0.185
27 9 27 9 27 9 27 9
p2 E ( p 2 ) E ( p) 0.185 (0.33) 2 0.074
2
ÖRNEK 5
Gelirler Genel Müdürlüğü’ne göre, bütün vergi
beyannamelerinin % 75’i vergi iadesine yol açmaktadır. 100
beyannamelik bir rassal örneklem alınmıştır.
a) Vergi iadesine yol açan beyannamelerin örneklem
oranının ortalaması kaçtır?
b) Örneklem oranının varyansı kaçtır?
c) Örneklem oranının standart hatası kaçtır?
d) Örneklem oranının 0,8’den büyük olma olasılığı kaçtır?
ÖRNEK 5
Çözüm:
a) E ( p) 0,75
(1 )
b)
2
p
n
0,75(1 0,75)
2
p 0,001875
100
c) Standart Sapma (ya da Standart Hata)
p 0,001875 0,0433
2
p
ÖRNEK 5
d) P( p 0,8) ?
p 0,8
P( p 0,8) P( )
p p
0,8 0,75 0,8 0,75
P( z ) P( z )
0,0433 0,0433
P( z 1,15) 0,5 0,3749 0,1251
Ki-Kare Dağılışı
2
v =
(n - 1) s 2
2
n = örnek miktarı
s 2 = örnek varyansı
2 = anakütle varyansı
df = serbestlik derecesi = n – 1=v
Ki-Kare Dağılışı
n 1 s 2 xi x
2
s 2
i
n 1
n 1 s x x
2 2
i
n21
2 2
Ki-Kare Dağılışı
Simetrik değil df = 10
df = 20
x2
0 0 5 10 15 20 25 30 35 40 45
Tüm değerler sıfır veya pozitif
ÖRNEK VARYANSININ
ÖRNEKLEME DAĞILIMI
Anakütle ortalaması x ve anakütle varyansı x olan bilinmeyen bir
2
x2 E ( xi x ) 2
n
1
sx2 i
n 1 i 1
( x x ) 2
ÖRNEK VARYANSININ
ÖRNEKLEME DAĞILIMI
s
x2 n21
n 1 x
2 2
2
n 1
ÖRNEK VARYANSININ
ÖRNEKLEME DAĞILIMI
s x2 ’nin örnekleme dağılımının ortalaması x2 ’dir.
x2 E n21 x2 n 1
E s 2
n 1
x
n 1
E ( s x2 ) x2
ÖRNEK VARYANSININ
ÖRNEKLEME DAĞILIMI
s x2 ’nin örnekleme dağılımının varyansı, örnekleme
dağılımın Ki- Kare dağılımına uygun olduğunu
sonucundan hareketle ;
V s V
2 2
4
V n1
2
2 x n 1 x
n 1 n 1
x 2
2 x n 1
4
V sx
2
n 1
2
2 4
V s
2 x
x
n 1
PARAMETRİK OLMAYAN
HİPOTEZ TESTLERİ
“Kİ-KARE TESTLERİ”
1
Populasyonun incelediğimiz bir özelliğinin
dağılışı bilenen dağılışlardan birisine,
Normal Dağılış,
t Dağılışı,
F Dağılışı,
gibi bir dağılışa uygun olduğu durumlarda
populasyonun parametrelerine ilişkin yapılan hipotez
testlerine parametrik hipotez testleri adı verilir.
2
Parametrik hipotez testleri genellikle
normal dağılış varsayımı altıda gerçekleştirilen
testlerdir.
4
Parametrik Olmayan Hipotez Testlerinin
Kullanılabileceği Durumlar:
1) Gözlem ile elde edilen verilerin olması durumunda,
7
Bazı durumlarda ise niceliksel yapıdaki bazı
değişkenlerin sınıflandırılarak niteliksel hale
dönüştürüldüğü görülür.
50 kilonun altında olan kişilere zayıf,
50-80 kilo arasında olanlara normal,
80 kilonun üstünde olanlara kilolu denmesi
gibi.
Niteliksel yapıya sahip değişkenler üzerinde
yapılan gözlemler çoğunlukla araştırılan özelliği
gösteren sınıfların sayıları şeklindedir.
8
Ele alınan değişkenlerin niteliksel yapıda
olduğu durumlarda, yapılan ölçüm ve gözlemlerin
ilgili sınıflara ait frekanslarını dikkate alan çalışmalar
için uygulanan hipotez testleri,
dir.
9
Parametrik Olmayan c2 Ki- Kare
Hipotez Testleri
Gi : Gözlenen Değerler
Bi : Beklenen Değerler
c
2
k
(G i Bi
2
i 1 Bi
12
İyi Uyum Testleri
Gözlenen frekansların teorik beklenen frekanslara
uyup uymadığının araştırılmasında kullanılır.
13
Toplam
Grup 1 2 3 ............ k
Gözlenen
değerler G1 G2 G3 ............ Gk n
( Gi )
H0 doğru iken
olasılık değeri p1 p2 p3 ............ pk 1
( pi )
H0 doğru iken
beklenen değer B1 = np1 B2 = np2 B3 =np3 Bk = npk n
............
( Bi )
14
Kullanılan ki-kare test istatistiği göz önünde
bulundurulacak olursa, gözlenen ve beklenen değerler
arasındaki farkın anlamlı derecede büyük olması durumunda
teorik frekanslara gözlenen frekansların uymadığı sonucuna
varılır.
H0 : pi’ler ifade edilen teorik olasılık değerlerine eşittir.
H1 : En az bir eşitlik geçersizdir.
k (G i Bi 2
c2 c k21;
i 1 Bi
16
H0 : pFB = 0,40, pGS = 0,25, pBJK = 0,20, pTRB = 0,10, pD = 0,05
H1 : En az bir eşitlik geçersizdir.
17
k (G i Bi 2 (387 4002 (259 2502 ( 2
c h2 .... 49 50 1,18
i 1 Bi 400 250 50
2
χ tablo 2
χ k -1,α 2
χ 5-1;0,05 2
χ 4;0,05 9,49
18
r x c Bağımsızlık Testleri
Bir populasyonun iki özelliğinin birbirinden
bağımsız olup olmadığını test etmede kullanılır.
Örneği meydana getiren bireyler iki farklı kritere
göre sınıflanır.
Örneğin bireylerin hem sigara içip
içmemelerine hem de içki içip içmemelerine gör
sınıflandırılması, iktisat bölümündeki öğrencilerin
matematik ve istatistik derslerindeki başarı
durumuna göre sınıflandırılması gibi.
19
Populasyonun sınıflandırılmasında iki özellik
dikkate alındığından dolayı iki yönlü tablolar
( kontenjans tabloları ) kullanılır.
20
İki Yönlü ( Kontenjans ) Tablolarda
Beklenen Değerlerin Hesaplanması
Özellik A
Özellik B 1 2 3 C Toplam
1 G11 G12 ....... G1c R1
2 G21 G22 ....... G2c R2
3 G31 G32 ....... G3c R3
.... ...... ...... ....... ........
R Gr1 Gr2 ....... Grc Rr
Toplam C1 C2 C3 Cc N
21
Herhangi bir hücrenin beklenen değerin
hesaplanmasında iki özelliğin var olması sebebiyle, o
hücrenin bulunduğu satır ve sütun toplamlarının
çarpımının örnek hacmine bölünmesiyle hesaplanır.
i. inci satır , j. inci sütundaki bir gözlemin beklenen
değeri ,
R iC j
Bij
şeklinde bulunur. N
R 1C 2
B12
N
şeklindedir. 22
H0 : Populasyonun iki özelliği birbirinden bağımsızdır.
( aralarında ilişki yoktur. )
H1 : Populasyonun iki özelliği birbirinden bağımsız değildir.
( aralarında ilişki vardır. )
Test İstatistiği: r c (G ij B ij
2
i 1 j1 Bij
r c (G ij Bij
2
i 1 j1 Bij
χ (r2 1)(c 1);α ise H0 red edilir.
23
Örnek: İzmir’in Buca ilçesinde yapılan bir anket çalışmasında
kişilerin oy verdikleri parti ile cinsiyet arasında bir ilişki olup
olmadığı araştırılmaktadır. Aşağıdaki tabloda anket sonucunda
elde edilen bilgiler bulunmaktadır. Buca ilçesinde oturan
kişilerin cinsiyetleri ile oy verdikleri parti arasında ilişki olup
olmadığını = 0,01 önem seviyesinde test ediniz.
Cinsiyet
Kadın Erkek
A 100 150
C 200 150 24
H0 : Cinsiyet ile oy verilen parti birbirinden bağımsızdır.
H1 : Cinsiyet ile oy verilen parti birbirinden bağımsız
değildir.
Cinsiyet
Kadın Erkek Toplam
A 100 125 150 125 250
Partiler
B 200 200 200 200 400
C 200 175 150 175 350
Toplam 500 500 1000
i 1 j1 Bij
125
125 200
(200 200 (200 175 (200 175
2
2
2
17,14
200 175 175
χ 2
(r 1)(c 1);α χ 2
(31)(2 1);0,01 9,21
26
DAĞILIŞA UYUM TESTLERİ
27
Dağılışa Uyum Testlerinde de kullanılacak olan test
istatistiği c 2
dağılışına uymaktadır. Örnekten elde edilen
gözlenen değerler ile dağılıştan yola çıkarak hesaplanan
beklenen değerler birbirine yakınsa hesaplanan c değeri
2
i 1 Bi
28
Hesaplanan χ 2hesap değeri ile tablodan bulunan χ 2tablo
değeri karşılaştırılarak iddianın doğruluğu hakkında
karar verilir.
χ 2tablo χ 2v,α
v = k - 1- g
k : χ hesap değeri bulunurken dikkate alınan grup
2
sayısı
g : İlgili dağılış için örnek verileri kullanılarak
hesaplanan (tahmin edilen) parametre sayısı
29
χ 2
hesap
χ 2
> tablo ise H0 red edilir.
c2
χ 2tablo
1
x 1,2,3,........n
P (X x N
0 d.d
31
p=1/N
N adet
32
Örnek: Büyük bir işletmede hafta içerisindeki 5 gün
içerisindeki işe gelmeme sayılarının dağılışı araştırılmaktadır.
Bu amaçla bir hafta boyunca her gün işe gelmeyen işçi sayıları
kontrol edilerek not edilmiştir. Hafta içerisinde iş yerine
gelmeyen işçi sayılarının dağılışının Üniform(Düzgün) Dağılışa
uygun olup olmadığını % 5 hata payıyla test ediniz.
Günler işe gelmeyen pi İşe gelmemesi (G i Bi 2
işçi sayısı(Gi) beklenen işçi
sayısı(Bi) Bi
Pazartesi 15 1/5 12 0,75
Salı 9 1/5 12 0,75
Çarşamba 9 1/5 12 0,75
Perşembe 11 1/5 12 0,08
Cuma 16 1/5 12 1,33
toplam 60 1 60 3,66 33
Ho: İlgili işletmedeki hafta içi günlerdeki işe gelmeyen işçi
sayılarının dağılışı Üniform Dağılışına uygundur.
H1: İlgili işletmedeki hafta içi günlerdeki işe gelmeyen işçi
sayılarının dağılışı Üniform Dağılışına uygun değildir.
c
2
k
(G i Bi
2
3,66 χ 2tablo χ 2v,α
h
i 1 Bi
v = k - 1- g = 5-1-0 =4
Üniform Dağılışında tahmin
edilen parametre sayısı 0’dır. χ 2tablo χ 24,0.05 9,49
Kutu Sayısı 48 25 15 8 3 1 35
a) Toplam 100 kutu kontrol edilmiştir. Her bir kutu
içerisinde 20 şişe meyve suyu bulunduğuna göre toplam
2000 adet şişe kontrol edilmiştir.
b) xi fi 0 48 1 25 2 15 3 8 4 3 5 1 96
c)
ˆ 96 0,048 0,05
p
2000
36
Hatalı Şişe Sayısı 0 1 2 3 4 5 ve daha
fazla
Kutu Sayısı (Gi) 48 25 15 8 3 1
pi 0,3585 0,3774 0,1887 0,0596 0,0133 0,0025
Beklenen Kutu 35,85 37,74 18,87 5,96 1,33 0,25
Sayısı (Bi)
n x 20
P(X x p (1 p
nx
P (X 0
0 (0,050
(1 0,0520-0
x
c 2(Ki-Kare) Parametrik Olmayan Testler’de herhangi bir
hücrenin veya grubun beklenen değer 5’ten küçük ise kendisine
en yakın olan hücre veya grup ile birleştirilir. Bu işleme
herhangi bir hücre veya grup içerisinde 5’ten küçük bir
beklenen değer ifadesi kalmayıncaya kadar devam edilir.
37
Hatalı Şişe Sayısı 0 1 2 3 ve daha fazla
Kutu Sayısı (Gi) 48 25 15 12
Beklenen Kutu Sayısı (Bi) 35,85 37,74 18,87 7,54
k
(G i Bi 2 (48 35,852 (
12 7,54 2
c h2 Bi
35,85
....
7,54
12,03
i 1
1 saatte gerçekleşen
0 1 2 3 4 5 6 7 8 9 ve daha fazla
gecikmeli uçuş sayısı
Frekans 24 35 43 25 16 4 2 0 1 0
39
a)
λ
x ifi
0 24 1 35 .....9 0 300
2
fi 150 150
b) Ho: Bir saatlik süre içerisindeki zamanında gerçekleşmeyen
uçuşların sayısı Poisson Dağılışına uygundur.
Ha: Bir saatlik süre içerisindeki zamanında gerçekleşmeyen
uçuşların sayısı Poisson Dağılışına uygun değildir.
e -λ λ x e-2 20
P(X x P(X 0
x! 0!
1 saatte gerçekleşen
0 1 2 3 4 5 6 7 8 9 ve üstü
gecikmeli uçuş saysı
Frekans Gi 24 35 43 25 16 4 2 0 1 0
pi 0,1353 0,2707 0,2707 0,1804 0,0902 0,0361 0,012 0,0034 0,0009 0,0002
Beklenen uçuş sayısı B i 20,3 40,60 40,60 27,07 13,53 5,41 1,80 0,52 0,13 0,04
40
1 saatte gerçekleşen 5 ve
0 1 2 3 4
gecikmeli uçuş saysı üstü
Frekans Gi 24 35 43 25 16 7
Beklenen uçuş sayısı B i 20,3 40,60 40,60 27,07 13,53 7,9
c
2
k (G i
Bi
2
24 20,3 2
....
2
7 7,9
2,29
h
i 1 Bi 20,3 7,9
χ 2
tablo
χ 2
v,α
χ 2
k -1-g,α
χ 2
6-1-1,0,05
χ 2
4,0,05
9,49
Poisson Dağılışında parametre sayısı 1 (l’dir.
42
Satışlar (1000 galon) Satılan Gün Sayısı
x < 34,0 0
34,0 ≤ x < 35,5 13
35,5 ≤ x < 37,0 20
37,0 ≤ x < 38,5 35
38,5 ≤ x < 40,0 43
40,0 ≤ x < 41,5 51
41,5 ≤ x < 43,0 27
43,0 ≤ x < 44,5 10
44,5 ≤ x <46,0 1
46,0 ≤ x 0
Toplam 200
43
Uyumu araştırılacak dağılış olan normal dağılışın
parametreleri ifade edilmediğinden verilen örnekten yola
çıkılarak, örnek istatistikleri tahmin edilir.
x 40 s 2,5
Her bir sınıfa ait olan olasılık değerleri sınıflanmış
verilerin aralığına düşmesi olasılığına karşılık gelir.
Anakütle dağılışının uygun olduğu varsayılan normal
dağılışla ilişkin olasılık hesaplamaları standart normal
dağılışa ( z ) dönüştürme yoluyla hesaplanır.
44
P(0 x 34) P(0 z 2,4) 0,5 0,4918 0,0082
45
G1=13, B1= 7,18
Satışlar Gi pi Bi = npi Gi- Bi (Gi- Bi)2/Bi
x < 34,0 0 0,0082 1,64
5,82 4,7176
34,0 ≤ x < 35,5 13 0,0227 5,54
35,5 ≤ x < 37,0 20 0,0792 15,84 4,16 1,0925
37,0 ≤ x < 38,5 35 0,1592 31,84 3,16 0,3136
38,5 ≤ x < 40,0 43 0,2257 45,14 -2,14 0,1015
40,0 ≤ x < 41,5 51 0,2257 45,14 5,86 0,7607
41,5 ≤ x < 43,0 27 0,1592 31,84 -4,84 0,7357
43,0 ≤ x < 44,5 10 0,0792 15,84 -5,84 2,1531
44,5 ≤ x <46,0 1 0,0277 5,54
-6,18 5,3193
46,0 ≤ x 0 0,0082 1,64
v = k - 1- g = 8-1-2 =5
χ 2
tablo χ 2
v;α χ 2
k -1-g;α χ 2
8-1-5;0,05 χ 2
5;0,05 11,07
c 2
h c t
2
olduğundan Ho red edilir.
47
Örnek-1: Bir işletmenin iki farklı deposunda bulunan hatalı ürünlerin oranı karşılaştırılmak isteniyor. Bu
amaçla 1. depodan 200 adetlik bir örnek alındığında 20 adet hatalı ürün, 2. depodan ise 300 adetlik bir
örnek alındığında ise 15 adet hatalı ürün gözleniyor. İki depoda bulunan hatalı ürünlerin anakütle
oranları arsındaki fark için %98’lik güven aralığını oluşturup yorumlayınız.
0,44 0,44
α / 2 = 0,01
α / 2 = 0,01
z
-2,33 0 2,33
𝑃𝑃[0,05 − 2,33 (0,0178) < 𝑝𝑝1 − 𝑝𝑝2 < 0,05 + 2,33 (0,0178)] = 0,98
Yorum: Bu işletmenin iki farklı deposundaki hataları ürünlerin anakütle oranları arasındaki farkın
% 98 olasılıkla 0,01 ile 0,09 arasında değiştiğini söyleyebiliriz.
Örnek-2: İstatistik 2 dersi başarı oranı açısından Ekonometri ve İktisat Bölümleri karşılaştırılmak
isteniyor. Bu amaçla iktisat bölümünde okuyan istatistik 2 dersini almış 150 öğrenci seçiliyor ve 80’inin
başarılı olduğu, ekonometri bölümünde okuyan istatistik 2 dersini almış 200 öğrenciden 120’sinin
başarılı olduğu görülüyor. Ekonometri bölümü öğrencilerinin başarını oranının iktisat bölümü
öğrencilerinden daha fazla olduğu iddiasını α = 0,10 önem seviyesinde test edip yorumlayınız.
0 1,28
z
Zh = 1,04
Yorum : % 10 hata payıyla Ekonometri Bölümü öğrencilerinin İstatistik II dersi başarı oranının İktisat
bölümü öğrencilerinden daha fazla olduğunu söyleyecek yeterli kanıt bulunamamıştır.
Örnek-3: Bir oto yıkamacıda günlük kullanılan temizlik maddesi miktarının ortalamasının değişimi
incelemek amacıyla 23 günlük bir inceleme yapılmış ve günlük kullanılan temizlik maddesinin
ortalamasının 13,57 kg., varyansının ise 7,29 kg2 olduğu görülmüştür. Günlük kullanılan temizlik
maddesi miktarının normal dağılıma uygun olduğu varsayımı altında günlük kullanılan temizlik
maddesinin anakütle ortalaması için % 95 ’lik güven aralığını oluşturup yorumlayınız.
𝑠𝑠2 𝑠𝑠2
� − 𝑡𝑡𝑛𝑛−1;𝛼𝛼⁄2 �
𝑃𝑃 �𝑥𝑥 � + 𝑡𝑡𝑛𝑛−1;𝛼𝛼⁄2 � � = 1 − 𝛼𝛼
< 𝜇𝜇 < 𝑥𝑥
𝑛𝑛 𝑛𝑛
7,29 7,29
𝑃𝑃 �13,57 − 𝑡𝑡22;0,025 � < 𝜇𝜇 < 13,57 − 𝑡𝑡22;0,025 � � = 0,95
23 23
0,475 0,475
α / 2 = 0,025
α / 2 = 0,025
t
-2,074 0 𝑡𝑡22;0,025= 2,074
7,29 7,29
𝑃𝑃 �13,57 − 2,704� < 𝜇𝜇 < 13,57 − 2,704� � = 0,95
23 23
Yorum: Bu oto yıkamacıda 100 günlük bir inceleme yapıldığında, 95 gün kullanılan temizlik miktarının
ortalamasının 12,06 kg. ile 15.08 kg. arasında değiştiği, 5 gün ise 12.06 kg.’dan daha az veya
15,08 kg.’dan daha fazla olabileceği söylenebilir.
Örnek-4: Çevre koruma müdürlüğü büyük bir sanayi kuruluşunun çıkardığı günlük sülfürükoksit
miktarının ortalamasının belirlemek için araştırma yapmıştır. Bu miktarın kabul edilebilir ortalama olan
9,5’dan az olduğu iddia edilmektedir. Ölçüm fiyatları çok yüksek olduğundan sadece 9 günlük
ölçümlerden bir rastgele örnek oluşturularak aşağıda verilmiştir. Normal dağılış varsayımı hipotezi
α = 0,01 önem seviyesinde test edip yorumlayınız.
𝐻𝐻0 : 𝜇𝜇 = 9,5
∑ 𝑥𝑥𝑖𝑖
𝑥𝑥̅ = 𝑛𝑛
= 7,3 + 8,3 + ⋯ + 9,6 = 8,5
H0 red edilir
H0 red edilemez
α = 0,01
0,49 0,50
t8;0,01 = -2,896
t
tH = - 3,29
Yorum : % 1 hata payıyla bu sanayi kuruluşunun günlük çıkardığı sülfürükoksit miktarının anakütle
ortalamasının 9,5’dan daha az olduğu söylenebilir.
Örnek-1: X ve Y marka otomobil boyalarının saat olarak kuruma zamanlarının normal dağılıma uyduğu
ve anakütle varyanslarının eşit olduğu varsayımı altında X marka boya ile aynı anda 10 farklı alan
boyanıyor ve kuruma zamanının ortalaması 80 dk., standart sapması 9 dk. olduğu görülüyor. Y marka
boya ile yine aynı anda 8 farklı alan boyanıyor ve ortalama kuruma zamanı 65 dk., standart sapması
7 dk. olarak hesaplanıyor. X ve Y marka boyaların kuruma zamanlarının anakütle ortalamaları
arasındaki fark için % 90’lık güven aralığını oluşturup boyaların kuruma zamanlarının birbirine eşit olup
olmadığını konusundaki görüşünüzü belirtiniz.
1 - α = 0,90 α / 2 = 0,05
1 1
(80 − 60) ± 𝑡𝑡16; 0,05 (7,58)� +
10 8
20 ± (1,746) (3,56)
Oluşturulan güven aralığının sınırları içerisinde “ 0 “ değeri yer almadığı için % 10 hat payıyla X ve Y
marka boyaların kuruma zamanlarının birbirine eşit olmadığı söylenebilir.
Örnek-2: Zirai araştırmalar yapan merkezde üzerinde çalışılan yeni gübrenin buğday verimi üzerindeki
etkisi araştırılmaktadır. Bu amaçla şansa bağlı olarak 9 toprak saha yeni gübre ile gübrelenmiş ve diğer
12 toprak saha hali hazırda kullanılmakta olan gübre ile gübrelenmiştir. Diğer tüm koşulların aynı
olduğu bilgisi altında, yeni gübre ile gübrelenen parsellerde günlük ortalama buğday verimi 95,1 kg. ve
standart sapma 8,2 kg , mevcut gübre ile gübrelenen de ise ortalama buğday verimi 114,8 kg. ve
standart sapma 9,5 kg. olarak bulunmuştur. Anakütle dağılımlarının normal ve eşit varyanslı olduğu
varsayımı altında yeni gübre ile gübrelenmiş grupta ortalama buğday üretiminin mevcut gübre ile
gübrelenmiş parsellerden daha az olduğu iddiasını α = 0,005 önem seviyesinde test edip yorumlayınız.
α = 0,005
(𝑦𝑦� −����)
𝑚𝑚 − � 𝜇𝜇𝑦𝑦� − 𝜇𝜇𝑚𝑚
��� �
𝑡𝑡ℎ = 1 1
𝑆𝑆 � +
𝑛𝑛𝑦𝑦 𝑛𝑛𝑚𝑚
(95,1−114,8) − 0 −19,7
𝑡𝑡ℎ = = ≅ −4,84
1 1 4,07
9,22 � +
9 12
H0 red edilir
H0 red edilemez
α = 0,005
0,495 0,50
t
t19;0,005 = -2,861
tH = - 4,84
Yorum : % 0,5 hata payıyla yeni gübre ile gübrelenmiş grupta ortalama buğday veriminin mevcut
gübre ile gübrelenmiş parsellerdeki ortalama buğday üretiminden daha az olduğu söylenebilir.
Örnek-3: Bir diyetisyen yeni geliştirdiği diyet programını 8 kişi üzerinde denemiştir. Aşağıdaki tabloda
bu kişilerin diyete başlamadan önceki ve diyeti uyguladıktan sonraki vücut ağırlıkları kilogram cinsinden
ifade edilmiştir. Normal dağılım varsayımı altında kişilerin diyete başlamadan önceki ve diyet
tamamlandıktan sonraki ağırlıklarının ortalamaları arasındaki fark için % 99’luk güven aralığını
oluşturup yorumlayınız.
KİŞİ 1 2 3 4 5 6 7 8
ÖNCE 75 93 62 112 73 81 90 82
SONRA 72 84 60 101 58 77 71 65
1 - α = 0,99 α / 2 = 0,005
1 - α = 0,99 α / 2 = 0,005
di ( önce-sonra) 3 9 2 11 15 4 19 17
∑ 𝑑𝑑 3+9+⋯+17
𝑑𝑑̅ = 𝑖𝑖 = = 10
𝑛𝑛 8
2 2
� − 𝑡𝑡𝑛𝑛−1;𝛼𝛼⁄2 �𝑆𝑆𝑑𝑑 < 𝐷𝐷 < 𝑑𝑑
𝑃𝑃 � 𝑑𝑑 � + 𝑡𝑡𝑛𝑛−1;𝛼𝛼⁄2 �𝑆𝑆𝑑𝑑 � = 1 − 𝛼𝛼
𝑛𝑛 𝑛𝑛
43,71 43,71
𝑃𝑃 � 10 − 3,499� < 𝐷𝐷 < 10 + 3,499� � = 0,99
8 8
Yorum: Diyetisyenin yeni geliştirdiği diyet programının uygulandığı kişilerin diyete başlamadan önceki
ağırlıklarının ve diyeti uyguladıktan sonraki ağırlıklarının ortalamaları arasındaki farkın % 1 hata payıyla
1,81 kg. ile 18,19 arasında değiştiği ifade edilebilir.
Örnek-4: Piyasa yeni sürülecek olan bir tansiyon ilacının etkinliğinin araştırılmaktadır. Bu amaçla
7 tansiyon hastasının ilaç verilmeden önceki ve ilaç verildikten sonraki tansiyon değerleri ölçülüp kayıt
altına alınmıştır. Sonuçlar aşağıdaki tabloda verilmiştir. Buna göre piyasaya yeni sürülecek ilacın
tansiyonu düşürmede etkili olup olmadığını α = 0,01 önem seviyesinde test edip yorumlayınız.
HASTA 1 2 3 4 5 6 7
ÖNCE 14 16 17 18 16 19 21
SONRA 13 15 17 15 14 16 17
𝐻𝐻0 : 𝐷𝐷 = 0
𝐻𝐻1 : 𝐷𝐷 > 0
𝑑𝑑� −𝐷𝐷 𝑑𝑑� −𝐷𝐷
𝑡𝑡𝐻𝐻 = = 𝑆𝑆𝑑𝑑
𝑆𝑆𝑑𝑑
� �
√𝑛𝑛
di ( önce-sonra) 1 1 0 3 2 3 4
di 2 1 1 0 9 4 9 16
2
�∑ 𝑑𝑑𝑖𝑖 � (14)2
∑ 𝑑𝑑𝑖𝑖2 − 40 −
𝑆𝑆𝑑𝑑2 = 𝑛𝑛−1
𝑛𝑛
= 6
7
=2 → 𝑆𝑆𝑑𝑑 ≅ 1,41 𝑘𝑘𝑘𝑘.
14
𝑑𝑑� − 𝐷𝐷 −0
𝑡𝑡𝐻𝐻 = 𝑆𝑆𝑑𝑑 = 1,41
7
≅ 3,75
� �
√𝑛𝑛 √7
0 t
t6;0,01 = 3,143
th = 3,75
Yorum : Piyasaya yeni sürülecek olan tansiyon ilacının tansiyonu düşürmede etkili olduğu % 1 hata
payıyla söylenebilir.
İSTATİSTİK II
Varyans Analizi
Varyans Analizi
Üç veya daha fazla anakütle
ortalamasının eşitliğinin testi için
kullanılır.
Hipotezler:
H0 : µ 1 = µ 2 = µ 3 = . . . = µ k
GAKT
GAKO = GAKO = Gruplar Arası Kareler
K −1 Ortalaması
Notasyon
x = genel ortalama
K = karşılaştırılan anakütle ortalama sayısı
ni = i. Örnekteki veri sayısı
xi = i. Örnek ortalaması
K ni K
K
∑∑ xij ∑ ni xi
i =1 j =1 i =1
n = ∑ ni x= =
i =1 n n
Örnek: Tüketim Verileri İçin
Hesaplamalar
146.3 162.4 x3 =
137.4
= 22.9
x1 = = 20.9 x2 = = 23.2
7 7 6
K
n = ∑ ni = n1 + n2 + n3 = 7 + 7 + 6 = 20
i =1
K ni K
∑∑ xij ∑ ni xi
i =1 j =1 i =1 (7)(20.9) + (7)(23.2) + (6)(22.9)
x= = = = 22.305
n n 20
Grup İçi Değişkenlik
n1 n2
KT1 = ∑ ( x1 j − x1 ) 2 KT2 = ∑ ( x2 j − x2 ) 2
j =1 j =1
K ni
GIKT = ∑∑ ( xij − xi ) 2
i =1 j =1
Örnek: Tüketim Verileri İçin GİKT
Hesaplamaları
2 2 2
( x1 − x ) , ( x2 − x ) ,..., ( xK − x )
K
GAKT = ∑ ni ( xi − x ) 2
i =1
i =1
12.18
GIKO = = 0.7165
20 − 3
21.5495
GAKO = = 10.7748
3 −1
Test İstatistiği ve Ret Bölgesi
GAKO
F=
GIKO
GAKO 10.7748
F= = = 15.04
GIKO 0.7165
Genel 33.7295 19
1) Bir bankada bir gün içerisinde açılan
GÜVEN ARALIKLARI vadeli TL. hesaplarının ortalamasını
ALISTIRMA SORULARI incelemek amacıyla yapılan bir araştırmada
12 günlük yapılan bir incelemede, vadeli TL.
hesaplarının ortalaması 5250 TL. olduğu
görülmüştür. Daha önceki yapılan
çalışmalardan populasyon standart
sapmasının 350 TL. olduğu bilindiğine göre,
bir günde açılan vadeli hesapların
2012 populasyon ortalaması için % 95’lik güven
Aras.Gör. Efe SARIBAY ® aralığını oluşturup yorumlayınız.
1
4) İzmir ilinin Haziran ayı sıcaklık 5) Kurşunsuz benzin fiyatlarının artış
ortalamasını tahminlemek amacıyla bir oranını tahmin etmek amacıyla 600 kişiye
araştırma yapılmıştır. Bu araştırmada 2011 yıl sonunda kurşunsuz benzin fiyatının
yılındaki Haziran ayı içindeki 25 gün dikkate 5 TL.’yi geçip geçmeyeceği konusunda
alınmıştır ve ortalama 280 C ve standart görüşü alınmış ve 350 kişi 5 TL.’yi
sapma ise 30 C olarak hesaplanmıştır. Normal geçeceği konusunda görüş bildirmiştir.
dağılış varsayımı altında İzmir ilinin Haziran Kurşunsuz benzin fiyatlarının yıl sonunda
ayı sıcaklık değerinin populasyon ortalaması
5 TL.’yi geçeceği görüşüne sahip
için % 90’lık güven aralığını oluşturup
olanların kişilerin populasyon oranı için
yorumlayınız.
% 90 ‘lık güven aralığını oluşturup
yorumlayınız.
6) Tüketici tercihleri konusunda yapılan bir 7) Bir fabrikada üretilen vidaların yarıçap
araştırmada son bir ay içinde elektronik eşya uzunluğunun değişkenliği araştırılmak
alan 250 kişiden 87’sinin alışverişini internet istenmektedir. Bu amaçla şansa bağlı olarak
üzerinden gerçekleştirdiği görülmüştür. Buna seçilen 16 vidanın yarıçap uzunluklarının
göre son bir ayda internet üzerinden ortalaması 2 mm. ve standart sapması 0,4
elektronik eşya alan kişilerin populasyon mm. olarak bulunmuştur. Vidaların yarıçap
oranı için %99’luk güven aralığını tahmin uzunluklarının normal dağıldığı varsayımı
edip yorumlayınız. altında populasyon(anakütle) varyansı için
%95’lik güven aralığını oluşturup
yorumlayınız.
2
8) İstatistik II dersinin vize notlarının 9) Bir bankanın iki şubesinde açılan Є
değişkenliğini incelemek amacıyla bir hesaplarının ortalamaları arasındaki fark
çalışma yapılmıştır. Çalışmada 25 öğrencinin incelenmek istenmektedir. Birinci şubede
vize notları incelenmiş ortalaması 55 ve yapılan 50 aylık bir incelemede aylık
standart sapması 6 olarak bulunmuştur. ortalamanın 2000 Є standart sapmanın 25
Normal dağılım varsayımı altında İstatistik II Є, ikinci şubede 40 aylık bir inceleme
dersinin vize notlarının populasyon varyansı yapıldığında aylık ortalamanın 1500 Є,
için % 98’lik güven aralığını oluşturup standart sapmasının 80 Є olarak
yorumlayınız. bulunduğuna göre iki şubede açılan Є
hesaplarının aylık ortalamaları arasındaki
fark için %95 güven aralığını oluşturup
yorumlayınız.
3
13) Üniversite birinci sınıfta okutulan matematik
12) X ve Y marka otomobil boyalarının saat olarak
dersi için verilen 6 aylık bir kurs programının faydalı
kuruma zamanlarının normal dağılıma uyduğu ve
olduğu ve başarı ortalamasını arttırdığı iddia ediliyor.
anakütle varyanslarının eşit olduğu varsayımı
Bunu araştırmak amacıyla, rastgele belirlenen sekiz
altında X marka boyadan farklı zamanlarda 12 tane
öğrenciye ait veriler aşağıdaki gibidir;
alan boyanıyor ve kuruma zamanının ortalaması
80 kg., standart sapması 30kg. olduğu görülüyor. Y Kurs öncesi sınav notu: 40 20 60 50 60 30 50 10
marka boya ile yine aynı koşulları sağlayan 8 tane Kurs sonrası sınav notu: 60 60 80 60 50 80 80 90
farklı alan boyanıyor ve ortalama kuruma zamanı
60 dk., standart sapması 25 dk. olarak Normal dağılım varsayımı ile kurs verilmeden önceki
hesaplanıyor. X ve Y marka boyaların kuruma ve kurs verildikten sonraki sınav notlarının
zamanlarının populasyon ortalamaları arasındaki ortalamaları arasındaki fark için % 99’ luk güven
fark için % 90’lık güven aralığını oluşturup aralığını oluşturup yorumlayınız.
yorumlayınız.
4
16) İki banka verdikleri bireysel ihtiyaç
kredilerin geri ödenme oranlarına göre
karşılaştırılmıştır. Buna göre A bankasından
kredi alan 250 kişinin 210’u, B bankasından
kredi alan 200 kişiden 150’si aldıkları kredileri
zamanında ödemiştir. Bankaların verdikleri
kredilerin geri ödenme oranları arasındaki fark
için % 80’lik güven aralığını oluşturup
yorumlayınız.
5
Yrd.Doç.Dr.İstem Köymen KESER
Tahminler
Nokta Aralık
Tahmini Tahmini
Uygulamada çoğu sorun için nokta tahmini yeterlidir.
Örneğin, büyük bir parti maldan rassal seçilmiş parçaların
incelenmesi, bütün parçaların %10’unun kusurlu olmuş
olduğu tahminini ortaya koymuş olsun. Bu sayıyı gören bir
yönetici şöyle sorular sorabilir.
Bu sayıyı gören bir yönetici şöyle sorular sorabilir:
“Gerçek kusurlu oranının %5 ile %15 arasında olduğundan
az çok emin olabilir miyim?”
“Bu durumda bütün parçaların %9 ile %11 arasındaki bir
oranının kusurlu olduğu mu görülüyor?”
Böyle sorular tek bir nokta tahmininin güvenilirliğini
sorgulamaktadır. Daha doğrudan söylenirse, tahmini
yapılan büyüklüğün arasında kalacağı bir aralık demek olan
aralık tahmini sorulmaktadır.
Bir anakütleden örnekleme yaparken diğer tüm etmenler
aynı kaldığında hacmi büyük bir örnekten hacmi küçük bir
örneğe göre daha güvenli bilgi sağlamayı bekleriz. Ancak
bu etmen nokta tahminine yansımamaktadır.
Örneğin, bir partideki kusurlu parça oranı
konusundaki nokta tahminimiz, on parçalık bir
örnekte (örneklemde) bir kusurlu parça görsek de,
1000 parçalık bir örnekte 100 kusurlu parça bulsak da
değişmez.
Anakütle katsayılarına ilişkin bilgilerimizin hassalığı
aralık tahminine yansır. Bir diğer deyişle örnek
büyüklüğü artıkça, diğer tüm etmenler aynı
kaldığında, bir anakütle katsayısının gerçek değeri
konusundaki belirsizliğimizi yansıtan güven aralığı
azalır.
Tanım 1: Bir anakütle katsayısının aralık tahmin
edicisi, o anakütle katsayısının içine düşebileceği bir
aralığı (örnekleme bilgisine dayanarak) belirlemenin
bir kuralıdır. Buna karşılık gelen tahmine de aralık
tahmini denir.
Aralık tahmin edicileri gerçek ama bilinmeyen anakütle
katsayılarını “içerebilir” yada içermesi “çok olası” diye
tanımlanmıştır. Daha hassas bir açıklama yapmak için bu
terimler olasılık ifadelerine dönüştürmek gerekir.
tahmin edilecek anakütle katsayısını θ ile gösterelim. bir
rassal örnek seçildiğini ve bu örnek bilgisine dayanarak A,
B’den küçük olmak üzere A ile B gibi iki rassal değişken
bulunabileceğini düşünelim. Bu rassal dağişkenler, A’nın θ
küçük ve B’nin θ’dan büyük olma olasılığı 0.90 gibi bir
özellik taşıyorsa,
P(A< θ<B) = 0.90 yazılabilir.
Eğer A ile B belli örnek genişlemeleri ile a ile b
şeklinde gösterilirse o zaman a ile b aralığına %90
güven aralığı denir.
Olasılık kavramına göre bu tür olasılıklar şöyle
yorumlanabilir:
Eğer anakütleden tekrarlı örneklemeler alınır ve bu
yolla aralıklar hesaplanırsa, bu aralıkların %90’ı
bilinmeyen anakütle katsayısını içerir.
Tanım 2: θ bilinmeyen bir anakütle katsayısı olsun. Örnek
bilgisine dayanarak,
P(A< θ<B) = 1-α
eşitliğini sağlayan A ve B rassal değişkenlerini
bulabileceğimizi düşünelim. A ile B belli örnek seçimleri
ile a ile b olarak gösterilirse, bu durumda a ile b aralığına
θ’nın %100(1- α) güven aralığı denir. (1- α) büyüklüğü de,
bu aralığın olasılık içeriği ya da güven düzeyi adını alır.
eğer anakütleden çok büyük sayıda yinelenen örnekler
seçilirse bu yolla bulunan aralıkların %(1- α) oranı, θ
katsayısını içerecektir. Bu yolla hesaplanan güven aralığı
a< θ<b şeklindedir.
Tanımlar
Güven Aralığı
(veya Aralık Tahmini)
Örnek olarak
Alt değer < < Üst değer
Tanımlar
Güven Derecesi
(güven seviyesi veya güven katsayısı)
Yanlış: nün gerçek değerinin 98.08 ile 98.32
arasına düşmesi olasılığı %95’tir.
1. BİR NORMAL DAĞILIM ORTALAMASININ GÜVEN
ARALIKLARI : ANAKÜTLE VARYANSI BİLİNİYOR
Ortalaması bilinmeyen ama varyansı bilinen bir normal
dağılımdan rassal bir örnek seçildiğini amacın da anakütle
ortalamasının güven aralığını bulmak olduğunu
varsayalım. Bu sorun gerçeklikten uzaktır, çünkü ortalama
bilinmezken anakütle varyansının tam olarak bilinmesi
(olanaksız değilse de) ender bir durumdur. Ancak kimi
zaman benzer anakütlelerden o denli örnek alınır ki,
sözkonusu anakütlenin varyansının, geçmiş deneyimlere
dayanılarak büyük bir yaklaşıklıkla bilindiği varsayılabilir.
Aynı zamanda örnek hacmi yeterince büyükse anakütle
varyansının bilindiği durum için geliştirilen süreçler bu
varyans örnekten tahmin edilirse de uygulanabilir.
Bilinmeyen ortalaması μ ve bilinen varyansı olan
bir anakütleden çekilen rassal bir örneğin gözlemleri
X1, X2, …, Xn
ve örnek ortalaması olsun. Bu durumda anakütle
ortalamasının güven aralıkları,
şeklindedir.
Örnek: Bir üretim süreci torba içinde rafine şeker
üretmektedir. Bu torbaların içerik ağırlıkları standart
sapması 1.2 kg olan normal dağılıma uymaktadır. Yirmibeş
torbalık rassal bir örnekte ortalama ağırlık 19.8 kg çıkmıştır.
Bu süreçte üretilen bütün şeker torbalarının ortalama
ağırlığının %95 güven aralığını bulunuz. (Newbold, sayfa
307)
Güven Aralığının Özellikleri:
Verilmiş bir olasılık içeriği ve örnek büyüklüğü için
anakütle standart sapması σ büyüdükçe, anakütle
ortalamasının güven aralığı da genişler. Bir diğer deyişle
diğer her şey aynıyken anakütlenin kendi ortalaması
etrafındaki dağılımı ne kadar yaygınsa, ortalamaya ilişkin
çıkarsamalar o kadar belirsiz olur. Bu fazladan belirsizlik
daha geniş güven aralığı çıkarır.
Verilmiş bir olasılık ve anakütle standart sapması için
örnek hacmi büyüdükçe anakütle ortalamasının güven
aralığı da daralır. Bir diğer deyişle bir anakütleden ne kadar
çok bilgi alırsak onun ortalamasına ilişkin çıkarsamamız o
kadar hasssas olur. Bu fazladan hassalık daha dar güven
aralığı çıkarır.
Verilen bir anakütle standart sapması ve örnek
büyüklüğü için, olasılık içeriği (1-α) yükseldikçe,
anakütle ortalamasının güven aralığı da genişler. (1-α)
genişledikçe α küçülür dolayısıyla büyür. Olasılık
içeriği yükseldiğinden anakütle katsayılarının daha
geniş güven aralıklarına yansır.
Doç.Dr.İstem Köymen KESER
Güven Aralıkları
2
Anakütle Ortalamasının Güven Aralığı Büyük
Örneklerde
Ortalaması µ olan bir dağılımdan n gözlemli rassal bir
örnek çektiğimizi varsayalım . Örnek ortalaması ile
standart sapmasını ve S ile gösterelim. Eğer n≥30
ise , populasyon ortalamasının %(1-α)’lık güven aralığı
aşağıdaki gibidir:
Örnek: Bir araştırma için, 106 sağlıklı yetişkinin vücut
sıcaklıkları incelenmiştir. Örnek ortalaması 98.2 derece ve örnek
standart sapması 0.62 derece olarak bulunmuştur. Gerçek sıcaklık
ortalaması için %95 güven aralığını bulunuz.
= 0.05 x -E << x +E
/2 = 0.025
z / 2 = 1.96 98.20o - 0.12 << 98.20o + 0.12
şeklindedir.
Örnek: Grip aşısı yaptıran rastgele seçilmiş 400 kişiden
136’sı aşı sonrası sıkıntı yaşamıştır. Aşı sonrası sıkıntı
yaşayanların gerçek oranı için %95 güven aralığını bulunuz.
0.29 p 0.39
0.29 ve 0.39 aralığı, %95 olasılıkla ’nün gerçek değerini içerir
İki Anakütle Oranı Arasındaki Fark İçin Güven
Aralıkları (Büyük Örneklerde)
Başarı oranı olan bir anakütleden seçilmiş gözlemli bir
örneklemde gözlenen başarı oranı ile, başarı oranı olan bir
anakütleden rassal seçilmiş gözlemli bir örneklemde gözlenen başarı
oranı ile gösterilsin.
Olmak üzere
Bu durumda örnekler büyükse İki anakütle oranı
arasındaki fark için %(1-α)’lık güven aralığı aşağıdaki
biçimdedir.
Örnek: Son sınıf kız ve erkek muhasebe
öğrencilerinden bağımsız rassal örnekler seçilmiştir.
120 erkekten 107’si on yıl sonra tam zamanlı olarak
çalışmayı beklemektedir. 141 kız öğrenciden de 73’ü
aynı beklentidedir. İki anakütle oranları arasındaki
fark için %95 güven aralığını oluşturunuz. (newbold,
sf. 345)
Örnek: Üniversitelerin pazarlama derslerinde müşteri
destekli projeler (MDP) araştırmasında, MDP kullanan
öğretim üyelerine “MDP’ler öğretim üyesi için zaman
alıcıdır” tümcesi verilmiştir. Vakıf üniversitelerinden
seçilen 92 MDP kullanıcısından oluşan rassal bir örnekte
49 kişi bu görüşe katılmıştır. Devlet üniversitelerinden
seçilen 86 MDP kullanıcısından 36 kişi bu görüşe
katılmıştır. İki anakütle oranı arasındaki fark için %90’lık
güven aralığını oluşturunuz.(Newbold sf. 344)
İki Anakütle Ortalaması Arasındaki Fark İçin Güven Aralıkları
(Populasyon Varyansları Biliniyor veya Örneklemler Büyük)
Ortalamaları ile varyansları ile
olan normal dağılımlardan ve gözlemli
bağımsız rassal örnekler seçilmiş olsun. Örnek
ortalamaları ve ise, iki anakütle ortalaması
arasındaki fark için %(1-α)’lık güven aralığı aşağıdaki
gibidir:
Örnek hacimleri ≥ 30 ise populasyon varyansları
yerine örnek varyansları koyulabilir ve iki ortalama
arasındaki fark için güven aralığı aşağıdaki biçimde
olur:
Örnek: Sigara içen 96 kişilik bir rassal örneklemde kısa süreli iş
devamsızlığının ortalaması ayda 2.15 saat, standart sapması ayda 2.09
saattir. Hayatında hiç sigara içmemiş 206 kişilik bağımsız bir örnekte
ise ortalama devamsızlık 1.69 saat, standart sapma ayda 1.91 saattir. İki
anakütle ortalaması arasındaki fark için %99 güven aralığını bulunuz
ve yorumlayınız.(Newbold sf.337)
Populasyonun Varyansı 2X Bilinmediğinde ve
n< 30 Olduğunda Ortalama İçin Güven Aralığı
Varsayımlar:
POPULASYONUN standart sapması bilinmiyor
Populasyon Normal dağılımlıdır.
Populasyonun normal dağılış göstermesi şartıyla
X - şeklinde hesaplanan
t=
S
n
test istatistiği n-1 serbestlik dereceli t dağılışı gösterir.
Populasyon ortalaması için güven aralığı aşağıdaki
biçimdedir.
P x t ,n1 * S x
2
x t
2
,n 1
* S 1
x
Student t Dağılımı
16
Çan şekilli
simetrik,
Standart
‘Tombul’
Normal
kuyruklar
t (sd = 13)
t (sd = 5)
z
t
0
17
Student’ın t Tablosu
n=3
sd = n - 1 = 2
Üst kuyruk alanı = .10
/2 =.05
sd .25 .10 .05
Olsun:
1 1.000 3.078 6.314
18
Örnek: Çeşitli kazalara karışan 12 A marka otomobilin onarım
giderlerinin ortalaması $26,227 ve standart sapması $15,873
tutmuştur. Giderlerin dağılışının normal olduğu varsayımı altında,
tüm kazalara karışan A’ların gerçek ortalama onarım giderleri için
%95 güven aralığını bulunuz.
n=9 x
x 9
n
x 2
x2
n x2 nx
2
805 9(9) 2
S 3,082
n 1 n 1 8
P( 9- 3,355*(3,082)/3<µ<9+3,355*(3,082)/3)=0.99
İKİ ANAKÜTLE ORTALAMASINA
İLİŞKİN HİPOTEZ TESTLERİ Normal Dağılım Örnek Hacimleri Küçük
Bağımsız ve İlişkili Populasyonlar
Bağımsız İlişkili
1. Farklı veri kaynakları 1. Aynı veri kaynağı
İlişkisiz Eşleştirilmiş
Bağımsız Tekrarlı ölçümler
2. İki örnek ortalaması 2. Her gözlem çifti
arasındaki farkın arasındaki farkın
kullanılması kullanılması
X X
1 2 Dn = X1n - X2n
21
(
12 2 2 2
Şeklinde populasyon varyanslarının eşit olduğu varsayımı altında
( n 1) s 2
( n 1) s 2 Olmak üzere
s2 1 1 2 2
n1 n2 2
𝑋1 − 𝑋2 − (µ1 − µ2 ) 𝑋1 − 𝑋2 − (µ1 − µ2 )
𝑡= =
𝑆𝑋1 −𝑋2 1 1
𝑆2 +
𝑛1 𝑛2
Şeklindeki istatistik t dağılımı
gösterir.
22
Ortalamaları ve , varyansları aynı olan iki
normal dağılımdan ve gözlemli bağımsız
örnekler seçtiğimizi varsayalım. Örnek ortalamaları
varyansları sırasıyla olmak üzere iki
populasyon ortalaması arasındaki fark için %(1-α)’lık
güven aralığı aşağıdaki biçimdedir:
1 1 1 1
𝑃 (𝑋1 − 𝑋2 ) − 𝑡𝑛 1+𝑛 𝑆2 + < (µ1 − µ2 ) < (𝑋1 − 𝑋2 ) + 𝑡𝑛 1+𝑛 𝛼 𝑆 2 + = %(1 − α)
𝛼
2−2,,,, 2 𝑛1 𝑛2 2,−2, 2 𝑛1 𝑛2
Örnek
Pınar Et için çalışan bir finansal analistsiniz. İki ayrı
kesimhanenin üretim kayıtlarıyla ilgili aşağıdaki rassal olarak
seçilen örneklere ait verileri topladınız:
fab1 fab2
n 11 13
Ortalama 3.27 2.53
Std Sapma 1.30 1.16
25
Belli bir kuş cinsinde erkek ve dişi ağırlıklarının eşit olup olmadığı
araştırılmaktadır. Aşağıdaki verilere göre iki ortalama arasındaki fark için %95
güven aralığını oluşturunuz. Populasyon normal dağılımlı ve populasyon
varyanslarının eşitliği varsayımı bulunmaktadır.
Örnek hacmi(n) ortalama( x ) varyans( S2 )
Erkek 10 90.80 55.2
Dişi 9 81.52 66.2
1 1 1 1
S 2
x1 - x 2
2
=S ( + ) S X1 _ X 2 60.38( ) 3.57
n1 n 2 10 9
9(55.2) 8(66.2)
2 2
( n - 1)S + ( n - 1)S
S2 = 1 S 60.98
1 2 2 2
n1 + n 2 - 2 10 9 2
𝑃 (90.80 − 81.52) − 2.11(3.57) < (µ1 − µ2 ) < (90.80 − 81.52) + 2.11(3.57) = %95
28
İki değişken arasındaki fark d değişkeni ile gösterilmek üzere
d
d i
d
n
2
d n
2
Sd
Sd
S d2
n 1 n
Sd
3.62 1.904
Sd
n 12 12
v n 1 12 1 11s.d.
31
Örnek: İki ayrı TV program kuşağında 10 ayrı reklam kişilere izlettirilmiş ve 24
saat sonra, iki ayrı kuşaktaki reklamlardan hatırlanma indeksleri elde
edilmiştir.
d 2
d
n
2
d 2 nd
2
14,202 1021
2
S
2
1,088
n 1 n 1
d
9
Örnek: İki ayrı TV program kuşağında 10 ayrı reklam kişilere izlettirilmiş ve 24 saat
sonra, iki ayrı kuşaktaki reklamlardan hatırlanma indeksleri elde edilmiştir.