Ders Slaytları Tümü

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 311

İSTATİSTİK

Doç. Dr. Adem AKPINAR


Ders Öğrenme Kaynakları

 Ders Notları
 Basılı notlar ve sunular

2
Ders Öğrenme Kaynakları

 Ders Notları
 Basılı notlar ve sunular

3
Katılım ve Değerlendirme

 14 hafta / haftada 2 saat teorik


 %70 devam zorunluluğu
 Sınavlar ve değerlendirme:

 Ödev: 10%
 Vize: 30%
 Final: 60%

4
Dersin Amacı

 Mühendislik problemlerinde kullanılabilecek


temel olasılık ve istatistiksel kavramları
tanımlayabilir ve kullanabilir seviyeye
gelmelerini sağlamak

5
Dersin Öğrenme Kazanımları
 İstatistiğin mühendislikteki önemini kavrayabilme
 İstatistiksel yöntemleri kullanarak, verilerin temel
istatistiklerini hesaplayabilmek,
 Olasılık kavramını anlayabilmek, temel olasılık
problemlerini çözebilmek,
 Temel olasılık dağılımlarını tanımlayabilmek ve
uygulayabilmek
 Hipotez testleriyle ilgili temel kavramları açıklayabilme
ve uygun istatistiksel testleri uygulayabilme
 İki veri dizisi arasında korelasyon analizi yaparak,
aralarındaki ilişkiyi hesaplayabilmek
Ders Bilgi Paketi için Bakınız:
6
http://bilgipaketi.uludag.edu.tr/Ders/Index/715949
Dersin İçeriği
 Giriş, İstatistiğin tanımı, Temel kavramlar
 Frekans analizi
 İstatistiksel ölçümler: Tanımlayıcı ve Açıklayıcı istatistik
 Olasılık Teorisinin Esasları
 Önemli Olasılık Dağılım Fonksiyonları (Ayrık ve Sürekli değişkenler için)
 Örnekleme Dağılımları ve Güven Aralığı
 İstatistik Hipotezlerin Kontrolü
 Olasılık dağılım testleri
 Korelasyon
 Regresyon Analizi
7
Giriş

Doç. Dr. Adem AKPINAR


Giriş

 Doğa bilimlerinde karşılaşılan problemlerde değişkenlerin


değerleri bilindiğinde probleme kesin ve tek bir çözüm
bulunabilir. Bu gibi olaylarda yasalar deterministik
(belirleyici) anlamda bilinmektedir.

Örneğin, bir basınçlı boruda akım probleminde,


Kesit alanı (A) biliniyorsa,
Akışkanın hızı (V) biliniyorsa,
Borudan geçen debi (Q=V*A) bulunabilir.

9
Giriş
 Ancak, mühendislik problemlerinde sonucu önceden bilmek
her zaman mümkün olmaz. Örneğin,
 Bir yağış ölçerde gelecek yıl ne kadar yağış düşeceği,
 Özellikleri bilinen bir çelik kirişin yükün hangi değerinde
kırılacağı,
belirsizlik içerir.

 Menfez tasarımında gerekli çap


proje akımına ve dolayısıyla
düşecek yağışa bağlıdır.
 Fazla küçük bir çap seçilirse menfez dolar ve yolu su
basar.
 Fazla büyük bir çap seçilirse ekonomik olmaz. 10
Giriş

 Belirsizliğin giderilebilmesi için Olasılık Teorisi ve


İstatistik bilimlerine başvurmak gerekir.

 İstatistik Tanımı:

İstatistik hakkında bugüne kadar bilimsel yada bilimsel


olmayan pek çok tanım yapılmıştır. Bilimsel olmayan
tanım ve benzetmelerden bazıları ciddiyet dışı
görünmelerine karşın, gerçekte bazı önemli noktaları
ortaya koymaktadır; 11
Giriş

 İstatistik Tanımı:

Kuyruklu
Yalanlar
Yalanlar İstatistik
Benjamin Disraeli
(1804-1881)

There are three kinds of lies

(Üç tür yalan vardır)

12
Giriş

 İstatistik Tanımı:

Dar anlamda İstatistik; geçmiş ve şimdiki durumla ilgili


toplanmış sayısal verileri geliştirilmiş olan bazı
tekniklerle analiz ederek gelecek hakkında karar
vermemizi kolaylaştıran bir bilim dalıdır.

13
Giriş

 Genel olarak İstatistik Tanımı:

• Verilerin toplanması
• organize edilmesi
• özetlenmesi
• sunulması
• tahlil edilmesi ve
• bu verilerden bir sonuca varılabilmesi için kullanılan
bilimsel metotlar topluluğudur.
14
Giriş
 İstatistik; bir belirsizlik bilimidir.

 İstatistikçiler, "Nedir?" sorusuyla değil, "Ne olabilir?"


veya "Ne muhtemeldir?"

• «Gelecek yıl Bursa iline bu yıla kıyasla daha fazla


yağış düşecek." ifadesini inceleyelim…

• Bu ifade bir kesinlik içermektedir. İspat istendiğinde


gerçekliklerinden emin olunamadığı görülecektir. Bir
meteorolog, toplam yağış miktarının gelecek yıl daha fazla
olacağına inansa bile emin olamaz. 15
Giriş
 Dil bilimi, belirsizliği "imkansızdan kesin'e kadar" ifade
etmek için yeterlidir, fakat bazı olayların belirsizliği
konusunda yetersiz kalabilmektedir. Burada kullanılan dil
"Olasılık (probabilite) " olmaktadır.

• Diğer yandan, istatistiğin incelediği olaylar gelişigüzel


(rasgele, random) olaylar olduğundan deney yada
gözlemlerden elde edilen sonuçlar kesin şekilde değil de
ihtimal olarak ifade edilir.

16
Giriş
• Şöyle ki istatistiğin verdiği sonuçların değerlendirilmesi
probabilite teorisinin ilkelerine göre yapılır.

• Genel ve kaba bir ifade ile probabilite teorisi, herhangi


bir olayın meydana gelme ihtimalini inceler.

• Bu ihtimal 0 ile 1 veya yüzde olarak 0 ile 100 arasında


değişen bir sayı ile ifade edilir.

17
Giriş
• Sonuç olarak,

• İstatistik; verilerin toplanması, analizi, sunulması ve


yorumlanması ile ilgili ilkeleri ve yöntemleri içeren ve
bu işlemlerin sonuçlarını probabilite ilkelerine göre
objektif bir şekilde değerlendiren bir bilim dalıdır.

18
Giriş
• İstatistikte, küme (yığın) (ana kütle) ve numune
(örnek) (örnek kütle) olmak üzere iki önemli kavram
vardır.

• Küme (population) aynı özelliklere sahip olan bireyler


topluluğuna denir. Numune (sample), küme içinden
analiz için seçilen bireyler topluluğudur.

19
Giriş

20
Giriş

Ana Kütle
Evren
Popülasyon

Örnek Kütle
Örneklem

21
Giriş
• İstatistik ikiye ayrılır;
 Tanımlayıcı (Descriptive) İstatistik
• Verilerin özetlenmesi ile ilgilidir.

• Frekans dağılımı, Yer ölçüleri (aritmetik


ortalama, geometrik ortalama, harmonik
ortalama, kareli ortalama, mod ve medyan),
Dağılma ölçüleri, (ortalama, sapma, standart
sapma, varyans, değişim aralığı vb.),
Çarpıklık ve Basıklık ölçüleri
22
Giriş
• İstatistik ikiye ayrılır;
 Açıklayıcı (Explanatory) İstatistik
• Örnekleme teorisi, Hipotez testleri,
regresyon ve korelasyon analizi

23
Giriş
• İstatistiksel Bilgisayar Paket Programları,
 SPSS
 MINITAB
 SAS
 STATISTICA
 MATLAB
 EXCEL

24
Giriş
• İnşaat Mühendisliğinde İstatistik
Hidrolojik değişkenlerin ifade
edilmesinde

Tarih En Büyük
Debi (m3/s)
13/4/1984 235
11/3/1985 342
9/4/1986 545
18/3/1987 400
4/2/1988 250
5/4/1989 245
22/3/1990 650
28/2/1991 450
3/4/1992 35625
Giriş
• İnşaat Mühendisliğinde İstatistik
Yapı malzemelerinin
özelliklerinin ifade edilmesinde

26
Giriş
• İnşaat Mühendisliğinde İstatistik
Zemin özelliklerinin ifade
edilmesinde

27
Giriş
• İnşaat Mühendisliğinde İstatistik

Trafik değişkenlerinin ifade


edilmesinde

Bu tür büyüklükler rasgele


değişken niteliğinde olup
deterministik bir yaklaşımla
ele alınmaları bir çok hallerde
yeterli olmamaktadır. 28
Giriş
• Olasılık teorisi kavramlarının ve istatistik
yöntemlerinin bilinmesi mühendislerin verecekleri
kararlarda belirsizlik ve risk etkilerini göz önüne
almalarına olanak verir. Böylelikle daha gerçekçi
projelerin hazırlanması sağlanabilir.

• Çünkü, bilgilerimizin tümü bir tahminler ağından başka


bir şey değildir.

29
Giriş
• Bu yüzden risk yada tehlike, anılan belirsizliklerin
doğal sonucudur. Tüm insani etkinliklerin,
planlamaların, tasarımların yapısında/bünyesinde
kendiliğinden, kaçınılmaz biçimde var olan potansiyel
bir unsurdur.

• Riskleri yalnızca ve yalnızca istatistiksel


çıkarsamalarla elde ettiğimiz bilgileri olasılık
yasalarına göre değerlendirerek tahmin edebiliriz.

30
Temel Kavramlar

Doç. Dr. Adem AKPINAR


Temel Kavramlar
 İstatistik biliminin temel amacı planlanmış bir çalışmada
yada bilimsel bir araştırmada ortaya çıkan (gözlenen)
rasgele sonuçların tanıtılması, yorumlanması ve
değerlendirilmesidir.

 Bu bağlamda kayda geçirilen belgelenen herhangi


bir değer gözlem (ölçüm) terimiyle adlandırılır.

 Sayılabilen yada ölçülebilen, toplandığı biçimiyle kayda


geçirilen ve kaynak olarak kullanılan bilgilere işlenmemiş
veri (düzenlenmemiş veri, kaba veri) denir. 32
Temel Kavramlar

 İstatistikte kaba verilerin elde edilmesini sağlayan


süreç için deney terimi kullanılır.

 Herhangi bir rasgele deneyin yada olayın mümkün


olabilen tüm sonuçlarının oluşturduğu ortama yaygın
terimle toplum (popülasyon, ana kütle) ve olayın
bir bölümüne ilişkin sonuçların elde edilmesi işlemine
örnekleme elde edilen sonuçlara da kısaca örnek
denir.
33
Temel Kavramlar

 Örneği tanımlayan sayısal bir değere istatistik denir;


örnek ortalaması değeri ve standart sapması gibi.

 Toplumu belirten sayısal bir değer de parametre


(değişken) terimiyle adlandırılır.

 Olasılık ve istatistikte, değişkenler önceden ne olacağı


kesin olarak tahmin edilemeyen rastgele karakterdedirler.
Bu nedenle rassal değişken (random variable, stochastic
variable) olarak adlandırılırlar. 34
Temel Kavramlar

Kesikli Değişkenler

Değişkenler

Sürekli Değişkenler

....... no'lu AGİ na ait 1 günlük akım değerleri


Dört Büyük ilde 1 yılda gözlenen
100
4 den büyük şiddete sahip deprem sayıları
80
12

Q (m³/s)
10 60
8
Adet/yıl

6 40
4 20
2
0 0
Adana İstanbul Ankara İzmir 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

İller Zaman (saat)

35
Temel Kavramlar

 Veri Tipi Örnekleri

1. Sayısal
a. Kesikli
Şu Anda Kaç Adet Dergiye Abonesiniz?(Sayı)
b. Sürekli
Boyunuz Ne Kadar? ___ (Cm)

2. Kategorik
Hisse Senedine yatırım yapar mısınız? __ Evet__ Hayır

36
Yararlanılan Kaynaklar
• Biyoistatistik Ders Notları, Ankara Ü., Sibel A. Kemaloğlu, Esin K Babacan

• İstatistik Ders Notları, Dokuz Eylül Ü.

• İstatistik Ders Notları, Celal Bayar Ü., Emre Yalamaç

• Olasılık ve İstatistik Ders Notları, İstanbul Teknik Ü., Mehmet Özger

• İstatistik Ders Notları, Balıkesir Ü., Banu Yağcı

• Mühendislikte İstatistik Yöntemler Ders Notları, Erciyes Ü., Murat Çobaner


• İstatistik Ders Notları, Karadeniz Teknik Ü., Murat İhsan Kömürcü, Ömer Yüksek,
Murat Kankal

37
Frekans Analizi
ve
Verilerin Sunumu

Doç. Dr. Adem AKPINAR


Frekans Analizi ve Verilerin Sunumu
 Ana kütleden (toplumdan) alınan örnek yardımıyla elde edilen
verilerin değişkeninin türüne göre sınıflandırıldıktan veya
gruplandıktan sonra çizelgeler ve grafikler halinde bir diğer
analize hazır olmak üzere incelenebilir.

2
Frekans Analizi ve Verilerin Sunumu

SERİ TÜRLERİ

Basit Seri Gruplanmış Seri Sınıflanmış Seri

 Ölçüm sonucu elde edilen ve büyük bir yığın oluşturan bilgilerin,


amaca uygun olarak ve özelliklerini de dikkate alarak sıralanması
ile elde edilen rakamlar dizisine istatistik seri denir.
3
Frekans Analizi ve Verilerin Sunumu

 Basit Seri

 Araştırma veya analizlerde kullanılmak üzere elde edilen veri


sayısı az ise bu tür veri yapılarına BASİT SERİ adı verilir.

 Verilerin büyükten küçüğe veya küçükten büyüğe sıralanmasıyla


oluşturulan seridir.

Örnek verecek olursak;

 7 öğrencinin bir dersten devamsızlık sayıları 3,4,6,1,5,2,4 olsun.


Verileri küçükten büyüğe doğru sıraladığımızda

 basit seri; 1,2,3,4,4,5,6 elde edilir.


4
Frekans Analizi ve Verilerin Sunumu

 Basit Seri Grafikleri;


 Basit serilerde değişkenin sürekli veya kesikli olduğuna
bakılmaksızın verileri bir grafik halinde özetlemek amacıyla
ÇUBUK ve ÇİZGİ grafikleri kullanılır.

5
Frekans Analizi ve Verilerin Sunumu

 Gruplanmış Seri;
 Bir seriyi özetlemek ve daha anlaşılır hale getirmek
istediğimizde gruplandırılmış seriyi kullanabiliriz.

Örnek verecek olursak;

 Bir mağazada satılan kot pantolonların bedenlerine göre satış


adetleri; 2 adet 28 beden, 5 adet 29 beden, 6 adet 30 beden, 7
adet 32 beden, 1 adet 33 beden 4 adet 34 beden

NOT: Frekans, olaydaki tekrar sayısıdır.

6
Frekans Analizi ve Verilerin Sunumu

 Gruplanmış Seri;
 Basit serilerde değişken kesikli olduğundan verileri bir tablo
şekline getirip frekans dağılımı ve relatif frekans dağılımını
kullanabiliriz.

 Relatif (göreli) frekanslar her bir grubun bütün


içerisindeki miktarı yüzde olarak ifade eden değerlerdir.
Kümülatif frekans ise mevcut grup ve kendinden önceki
grupların toplam içindeki yüzdesini ifade eder.

7
Frekans Analizi ve Verilerin Sunumu

 Gruplanmış Seri;

8
Frekans Analizi ve Verilerin Sunumu

 Gruplanmış Seri Grafikleri;


 Gruplanmış serilerde değişkenin kesikli olmasından dolayı
verileri bir grafik halinde özetlemek amacıyla ÇUBUK, ÇİZGİ
ve DAİRE(PASTA) grafikleri kullanılabilir.

9
Frekans Analizi ve Verilerin Sunumu

 Gruplanmış Seri Grafikleri;

10
Frekans Analizi ve Verilerin Sunumu

 Sınıflanmış Seri;
 Verilerin sürekli değişken olduğu durumlarda her bir verinin
belirli kurallara göre oluşturulan bir sınıfa kaydedilerek
sınıflandırıldığı seridir.

Örnek verecek olursak;

 Bir sınıftaki erkek öğrencilerin kiloları hakkında bir araştırma


yapılmaktadır. Bu amaçla 50 öğrencinin kiloları ölçülerek
kaydedilmiştir.

11
Frekans Analizi ve Verilerin Sunumu

 50 öğrencinin ağırlıkları

71.6678 77.9169 84.2766 73.6000 66.0908


71.9902 63.5059 78.6458 73.0000 78.4345
74.1246 76.8961 73.1000 85.5665 53.6750
52.1406 90.4038 94.5391 53.1676 82.0000
70.0821 74.5058 80.6314 80.9486 77.0000
62.7181 69.6469 74.4337 62.4231 76.0000
77.5122 61.9232 66.6818 76.6000 67.1974
86.1013 65.7171 86.5080 61.5705 68.9855
81.0930 75.5000 68.1715 67.0000 80.0149
72.1109 83.8189 88.4113 71.3824 68.2225

12
Frekans Analizi ve Verilerin Sunumu

 50 öğrencinin ağırlıklarının frekans tabloları

13
Frekans Analizi ve Verilerin Sunumu
Tarih Yağış (cm)
 Hidrolojik değişkenlerle frekans
1990 23
tablosu ve grafiklerinin
1991 21
irdelenmesi 1992 12
1993 23
1994 32
1995 12
 En küçük değer = 12
1996 45
 En büyük değer = 45
Mevcut 1997 37
veri
1998 23
1999 32
14
Frekans Analizi ve Verilerin Sunumu
Sıralanmış Veri Frekans tablosu
Gruplandırılmış seri
Yağış (cm)
12 Yağış (cm) frekans
12
21
12 2
23 21 1
23
23 3
23
32 32 2
32 37 1
37
45
45 1
15
Frekans Analizi ve Verilerin Sunumu
Sıralanmış Veri
Sınıflandırılmış
Frekans tablosu
Yağış (cm)
12 Sınıf frekans Sınıf frekans
12
10 – 20 2 < 20 2
21
23 20 – 30 4 20 – 30 4
23
30 – 40 3 30 – 40 3
23
32 40 – 50 1 > 40 1
32
Toplam 10 Toplam 10
37
45 16
Frekans Analizi ve Verilerin Sunumu
Sıralanmış Veri Sınıf frekans
10 – 15 2
Yağış (cm)
12 15 – 20 0
12
20 – 25 4
21
Sınıflandırılmış
23 25 – 30 0 Frekans
tablosu
23 30 – 35 2
23
32 35 – 40 1
32 40 - 45 1
37
45 Toplam 10 17
Frekans Analizi ve Verilerin Sunumu
Sıralanmış Veri

Sınıf frekans % frekans


Yağış (cm)
12 10 – 20 2 20
(2/10)*100
12 20 – 30 4 40
21
30 – 40 3 30
23
23 40 – 50 1 10
(3/10)*100
23 Toplam 10 100
32
32
37
45 18
Frekans Analizi ve Verilerin Sunumu
Kümülatif
Sıralanmış Veri
frekans

Yağış (cm)
Birikimli
12
Sınıf frekans frekans
12
(... den az)
21
23 10 – 20 2 2
2+4
23 20 – 30 4 6
23
32
30 – 40 3 9
6+3
32 40 – 50 1 10
37
Toplam 10
45 19
Frekans Analizi ve Verilerin Sunumu
Sıralanmış Veri
Birikimli
Sınıf frekans frekans
Yağış (cm)
(... den fazla)
12
12
10 – 20 2 10 8+2
21 20 – 30 4 8
23
30 – 40 3 4 4 +4
23
23 40 – 50 1 1
32
Toplam 10
32
37
45 20
Frekans Analizi ve Verilerin Sunumu

 Frekans Tablosu
Birikimli % Birikimli
Sınıf frekans % frekans frekans frekans
(... den az) (... den az)
10 – 20 2 20 2 20
20 – 30 4 40 6 60
30 – 40 3 30 9 90
40 – 50 1 10 10 100
Toplam 10
21
Frekans Analizi ve Verilerin Sunumu

 Frekans Tablosu

22
Frekans Analizi ve Verilerin Sunumu

 Frekans Tablosu Sınıf Orta Noktaları

Sınıf
Sınıf frekans Orta
Noktaları
10 – 20 2 15
20 – 30 4 25
30 – 40 3 35
40 – 50 1 45
Toplam 10
23
Frekans Analizi ve Verilerin Sunumu

 Frekans Histogramı ve Poligonu


5

4
Sınıf frekans
3
10 – 20 2 f
2
20 – 30 4
1

30 – 40 3
0

40 – 50 1 10 - 20 20 - 30 30 - 40 40 - 50

Yağış (cm)
Frekans
Toplam 10 poligonu Frekans
histogramı 24
Frekans Analizi ve Verilerin Sunumu

 Frekans Histogramı ve Poligonu

Sınıf frekans 4.5


4
10 – 15 2
3.5
15 – 20 0 3
2.5
20 – 25 4
f

2
25 – 30 0 1.5
1
30 – 35 2 0.5
0
35 – 40 1
10 - 15 15 - 20 20 - 25 25 - 30 30 - 35 35 - 40 40 - 45
40 - 45 1 Yağış (cm)
Toplam 10 25
Frekans Analizi ve Verilerin Sunumu

 Kümülatif Frekans Poligonu

12
Sınıf Birikimli
Frekans 10

Kümülatif frekans
10 – 20 2 8
6
20 – 30 6
4
30 – 40 9 2
0
40 – 50 10
10 - 20 20 - 30 30 - 40 40 - 50
Yağış (cm)

26
Frekans Analizi

27
Tanımlayıcı
İstatistikler_1

Doç. Dr. Adem AKPINAR


Tanımlayıcı İstatistik

29
Tanımlayıcı İstatistik (Yer Ölçüleri)

 Yer ölçüleri, parametrik merkezi eğilim ölçüleri olarak da


ifade edilmektedir.
 Aritmetik Ortalama:
o Bir seriyi oluşturan gözlem değerleri toplamının,
gözlem sayısına oranı olarak tanımlanır.

o Seriyi oluşturan gözlem değerleri


aritmetik ortalamada ile gösterilirse tanım
uyarınca,

30
Tanımlayıcı İstatistik (Yer Ölçüleri)

 Aritmetik Ortalama:
Örnek verecek olursak;
 Sınav notlarının ortalaması,
 Yaz aylarında m2’ye düşen ortalama yağış miktarı

 Serideki birimlerin ağırlıklı ortalamadan sapmalarının


toplamı sıfırdır.

31
Tanımlayıcı İstatistik (Yer Ölçüleri)

 Basit Seriler İçin Aritmetik Ortalama Hesabı:

32
Tanımlayıcı İstatistik (Yer Ölçüleri)

 Gruplanmış Seriler İçin

Ağırlıklı Aritmetik Ortalama Hesabı:

33
Tanımlayıcı İstatistik (Yer Ölçüleri)

 Sınıflanmış Seriler İçin Ağırlıklı Aritmetik Ortalama Hesabı:

34
Tanımlayıcı İstatistik (Yer Ölçüleri)

 Geometrik Ortalama:
o Seriyi oluşturan gözlem değerlerinin çarpımının
gözlem değeri sayısına eşit mertebeden kökü olarak
tanımlanır.
o Seriyi oluşturan gözlem değerleri , G’ de
geometrik ortalamayı gösterirse,

35
Tanımlayıcı İstatistik (Yer Ölçüleri)

 Kareli Ortalama:
o Seriyi oluşturan gözlem değerlerinin karelerinin
toplamının gözlem sayısına oranının kare kökü
olarak tanımlanır. Kareli ortalama K ile gösterilir.

o Görüleceği gibi, kareli ortalama da tüm gözlem


değerlerinin büyüklüklerinden etkilenen, duyarlı bir
ortalamadır. 36
Tanımlayıcı İstatistik (Yer Ölçüleri)
 Harmonik Ortalama:
o Bir veri setinde bulunan n adet elemanın çarpma işlemine göre
terslerinin ortalamasının tersinin alınmasıyla elde edilen yer
ölçüsüdür. Genellikle basit seriler için kullanışlıdır.

37
Tanımlayıcı İstatistik (Yer Ölçüleri)

 Medyan:
o Bir veri setini büyükten küçüğe veya küçükten büyüğe
sıraladığımızda tam orta noktadan veri setini iki eşit parçaya
ayıran değere medyan adı verilir.
 Serideki eleman sayısı çiftse ortadaki iki değerin ortalaması
 Serideki eleman sayısı tekse tam ortadaki değer

38
Tanımlayıcı İstatistik (Yer Ölçüleri)

 Sınıflanmış Seriler İçin Medyan:


o Medyan sınıfı kümülatif frekanslar dikkate alındığında toplam
frekansın yarısını içinde bulunduran sınıftır.

o Medyan sınıfı belirlendikten sonra medyan sınıfından bir önceki


sınıfın kümülatif frekansı ve medyan sınıfı frekansı dikkate alınarak
hesaplanır.

i : Medyan sınıfının sınıf aralığı


39
Tanımlayıcı İstatistik (Yer Ölçüleri)

 Sınıflanmış Seriler İçin Medyan:

40
Tanımlayıcı İstatistik (Yer Ölçüleri)
 Mod:
o Bir seride en çok tekrarlanan değere mod adı verilir.

Tanım uyarınca basit serilerde ve frekans serilerinde


mod, en çok tekrarlanan gözlem değerinin
belirlenmesi ile kolayca hesaplanır.
 Bir seride mod olmayacağı gibi birden fazla Mod da
bulunabilir

41
Tanımlayıcı İstatistik (Yer Ölçüleri)
 Sınıflanmış Seriler İçin Mod:
o Sınıflanmış serilerde mod değeri hesaplanırken ilk olarak mod
sınıfı belirlenir.
o Mod sınıfı frekansı en yüksek olan sınıftır.
o Mod sınıfı belirlendikten sonra bu sınıf içerisinde yer alan modun
tam değeri sınıf frekansı ve kendine komşu olan sınıf frekansları
dikkate alınarak hesaplanır.

42
Tanımlayıcı İstatistik (Yer Ölçüleri)

 Sınıflanmış Seriler İçin Mod:

43
Tanımlayıcı İstatistik (Yer Ölçüleri)
 Mod, Medyan ve Aritmetik Ortalama karşılaştırma:

44
Tanımlayıcı İstatistik (Yer Ölçüleri)
 Kartiller:
o Bir veri setini büyükten küçüğe veya küçükten

büyüğe sıraladığımızda dört eşit parçaya ayıran üç


değere kartiller adı verilir.

 İlk % 25’lik kısmı içinde bulunduran


1. Kartil (Q1), % 50’lik kısmı içinde
bulunduran 2. Kartil (Q2), % 75’lik
kısmı içinde bulunduran 3. Kartil (Q2) %25 %25
%25 %25
olarak adlandırılır.
Q1 Q2 Q3
45
Yararlanılan Kaynaklar
• Biyoistatistik Ders Notları, Ankara Ü., Sibel A. Kemaloğlu, Esin K Babacan

• İstatistik Ders Notları, Dokuz Eylül Ü.

• İstatistik Ders Notları, Celal Bayar Ü., Emre Yalamaç

• Olasılık ve İstatistik Ders Notları, İstanbul Teknik Ü., Mehmet Özger

• İstatistik Ders Notları, Balıkesir Ü., Banu Yağcı

• Mühendislikte İstatistik Yöntemler Ders Notları, Erciyes Ü., Murat Çobaner


• İstatistik Ders Notları, Karadeniz Teknik Ü., Murat İhsan Kömürcü, Ömer Yüksek,
Murat Kankal

46
Tanımlayıcı
İstatistikler_2

Doç. Dr. Adem AKPINAR


Tanımlayıcı İstatistik

2
Tanımlayıcı İstatistik (Değişkenlik Ölçüleri)

 Değişim Aralığı (Range):

o Seriyi oluşturan en büyük değer ile en küçük değer


arasındaki fark olarak tanımlanır. Değişim aralığı
kısaca D.A. ile gösterilir.

3
Tanımlayıcı İstatistik (Değişkenlik Ölçüleri)

 Değişim Aralığı (Range):

4
Tanımlayıcı İstatistik (Değişkenlik Ölçüleri)

 Değişim Aralığı (Range):


o Örnek: Fırat nehri üzerinde Keban istasyonunda
ölçülen akım verileri (hm3):

o D.A. (R)= 30800-10100=20700 hm3


5
Tanımlayıcı İstatistik (Değişkenlik Ölçüleri)

 Ortalama mutlak sapma (Mean of deviation):

o Değişkenlerin, aritmetik ortalamadan sapmalarının


(farklarının) mutlak değerlerinin toplamının veri
sayısına oranına ortalama sapma adı verilir

O.S .   x  x / N

o Örneğin, 3, 6, 4 ve 7 sayılarının ortalama sapması;

O.S.  3  5  6  5  4  5  7  5 / 4  2  1  1  2 / 4  1.5
6
Tanımlayıcı İstatistik (Değişkenlik Ölçüleri)

 Varyans (Variance):
o Değişken değerlerinin ortalamadan farklarının
kareleri toplamının veri sayısına oranıdır.

7
Tanımlayıcı İstatistik (Değişkenlik Ölçüleri)

 Varyans (Variance):

8
Tanımlayıcı İstatistik (Değişkenlik Ölçüleri)

 Standart sapma (Standard deviation):


o Varyansın karekökü olan standart sapma değeri;

9
Tanımlayıcı İstatistik (Değişkenlik Ölçüleri)

 Standart sapma (Standard deviation):

10
Tanımlayıcı İstatistik (Değişkenlik Ölçüleri)

 Varyans ve Standart sapma:

11
Tanımlayıcı İstatistik (Değişkenlik Ölçüleri)

 Varyans ve Standart sapma:

855.56 855.56
203.06 609.18
68.06 272.25
3.06 15.31 = 51+3*66+4*72+5*82+7*94
189.06 1323.43 = 80,25

=20
161,9
=3075
12,7 12
Tanımlayıcı İstatistik (Değişkenlik Ölçüleri)

 Varyans ve Standart sapma:

Sınıflar frekans m m*f f*(m-xort)^2


30-36 2 33 66 256.7
36-42 6 39 234 170.4
42-48 10 45 450 4.4
48-54 7 51 357 311.4
54-60 4 57 228 642.1
60-66 1 63 63 348.5
toplam 30 1398 1733.7
ortalama 44.33
varyans 59.78
7.73 13
stand. Sapma
Tanımlayıcı İstatistik (Değişkenlik Ölçüleri)

 Değişim katsayısı (coefficient of variation):


o Standart sapmayı ortalamanın bir yüzdesi olarak
ifade eden ve iki veya daha fazla popülasyondaki
değişkenliği karşılaştırmada kullanılan ölçüye
değişkenlik katsayısı denir.

o Değişim katsayısı, standart sapmanın aritmetik


ortalamaya oranıdır. Genellikle değişkenlik
katsayısı %30’un üzerinde olan araştırma
neticelerine güvenilmez.

14
Tanımlayıcı İstatistik

15
Tanımlayıcı İstatistik (Çarpıklık Ölçüleri)

 Çarpıklık katsayısı:
o Popülasyonları birbirinden ayırmak için her zaman
yalnızca yer ve değişkenlik ölçüleri yeterli olmayabilir.
Aşağıda iki farklı popülasyondan alınmış örnekler için
oluşturulan histogramlar verilmiştir.

16
Tanımlayıcı İstatistik (Çarpıklık Ölçüleri)

 Çarpıklık katsayısı:
o Şekilden görüleceği üzere A ve B örneklerinin aynı
ortalamaya ve yaklaşık olarak aynı değişkenliğe sahip
olmalarına rağmen bu iki örneğin açıkça aynı
popülasyondan gelmediği söylenir.
o Asimetri (çarpıklık) ifadesi simetrik olmayan anlamını
taşımaktadır.

o Şekillere bakıldığında frekansların A’da daha çok sol


tarafta (küçük xi değerlerinde), B’de ise daha çok sağ
tarafta (büyük xi değerlerinde), toplandığı
görülmektedir.

17
Tanımlayıcı İstatistik (Çarpıklık Ölçüleri)

 Çarpıklık katsayısı:

18
Tanımlayıcı İstatistik (Çarpıklık Ölçüleri)
 Çarpıklık katsayısı:

MOMENT ÇARPIKLIK KATSAYISI

o Moment Çarpıklık Katsayısı

Üçüncü derece moment Csx = 0 ise simetrik dağılım


Csx > 0 ise sağa çarpık
Csx < 0 ise sola çarpık
Csx değeri 0’a ne kadar yakınsa
dağılım o kadar simetriktir.
19
Tanımlayıcı İstatistik (Çarpıklık Ölçüleri)

 Çarpıklık katsayısı:

20
Tanımlayıcı İstatistik (Çarpıklık Ölçüleri)

 Çarpıklık katsayısı:

21
Tanımlayıcı İstatistik (Çarpıklık Ölçüleri)

 Çarpıklık katsayısı:

22
Tanımlayıcı İstatistik

23
Tanımlayıcı İstatistik (Basıklık Ölçüleri)

 Basıklık (sivrilik, kurtosis) katsayısı:


24
Tanımlayıcı İstatistik (Basıklık Ölçüleri)

 Moment Kavramı:
o Bir rastgele değişkenin dağılım biçimini, yani o
değişkenin olasılık dağılımının yada olasılık
yoğunluğunun çizimindeki biçimi betimlediklerinden
dolayı momentler istatistikte önemlidir.

25
Tanımlayıcı İstatistik (Basıklık Ölçüleri)

 Moment Kavramı:
o Aritmetik ortalama μ ( ) etrafındaki birinci momenti
sıfır ve ikinci momenti ise varyansı ( ) verir.

26
Problem Çözümü

Doç. Dr. Adem AKPINAR


Yararlanılan Kaynaklar
• Biyoistatistik Ders Notları, Ankara Ü., Sibel A. Kemaloğlu, Esin K Babacan

• İstatistik Ders Notları, Dokuz Eylül Ü.

• İstatistik Ders Notları, Celal Bayar Ü., Emre Yalamaç

• Olasılık ve İstatistik Ders Notları, İstanbul Teknik Ü., Mehmet Özger

• İstatistik Ders Notları, Balıkesir Ü., Banu Yağcı

• Mühendislikte İstatistik Yöntemler Ders Notları, Erciyes Ü., Murat Çobaner


• İstatistik Ders Notları, Karadeniz Teknik Ü., Murat İhsan Kömürcü, Ömer Yüksek,
Murat Kankal

28
Olasılık

Doç. Dr. Adem AKPINAR


Olasılık Kavramı

 Doğa bilimlerinde karşılaşılan problemlerde değişkenlerin değerleri


bilindiğinde probleme kesin ve tek bir çözüm bulunabilir. Bu gibi
olaylarda yasalar deterministik anlamda bilinmektedir.

 Ancak bazı durumlarda değişkenin alacağı değer önceden kesin


olarak bilinemez. Böyle durumlarda probabilistik (olasılıkçı)
yaklaşım gerekir.

 Populasyon hakkında bilgi sahibi olmak amacı ile alınan örneklerden


elde edilen bilgiler, bire bir doğru olmayıp hepsi mutlaka bir hata
payı taşımaktadır.
2
Olasılık Kavramı

 Bu hata payının ortaya çıkmasının sebebi seçilen örneklerin şansa


bağlı olarak farklılıklar göstermesi ve bunun sonucunda her deneyde
farklı sonuçlarla karşılaşılmasıdır.

 Olasılık, herhangi bir deneyin sonucunda gözlenebilecek farklı


durumlar ile hangi sıklıkla karşılaşılacağıdır. Bir başka ifadeyle
ortaya çıkan olayların belirsizliğinin incelenmesi anlamına gelir.

 Diğer bir tanım, Olasılık bir olayın meydana gelme şansının


sayısal ifadesidir.

3
Olasılık Kavramı

 Örnekler;

o Madeni paranın atılması sonucu tura gelme olasılığı ???

o Bir deste iskambil kağıdından çekilen 2 kağıdın en az birinin


papaz olma olasılığı ???

o Nişanlı olan bir çiftin evlenme olasılığı ???

 Olasılık teorisinde bir rastgele olayın meydana gelmesi şansı


olasılık (ihtimal) olarak adlandırılır.

4
Olasılık Kavramı (Tanımlar)

o Bir olaydaki veya deneydeki gözlemlerin toplam sayısına toplam


frekans denir.

o Bir deneyde, herhangi bir gözlemin normal şartlar altında alması


beklenen değerine beklenen frekans, beklenen frekansın,
toplam frekansa oranına da olasılık adı verilir.

 Örnek; bir madeni paranın havaya atılması olayı…

 Bu olayda, normal şartlar altında yazı ve tura gelme


olasılıkları birbirine eşittir. Para 10 kere havaya atıldığında, 5
kere yazı, 5 kere de tura gelmesi beklenir.

 Yazı gelme olasılığı = tura gelme olasılığı = 5/10=0.5 olmaktadır. 5


Olasılık Kavramı (Tanımlar)

o Rastgele değişken büyük harfle (X) bu değişkenin bir


gözlemdeki değeri küçük harfle (x) gösterilirse

P( X  xi )  p i

o Mesela, madeni para örneğinde, yazı gelme olasılığı 0.5 (%50)'tir.


Bu, 10 kere para atılması olayında 5 kere kesinlikle yazı, 5 kere
de mutlaka tura geleceği anlamına gelmez.

o Ancak, olayın çok kere tekrarlanmasında, her iki değerin de


birbirine yakın olması beklenir. Örneğin, olay 1 milyon kere
denense, yaklaşık olarak 500 000 kere yazı, 500 000 kere de tura
6
gelmesi muhtemeldir.
Olasılık Kavramı (Tanımlar)
 Örnek: Bir madeni paranın 10, 100, 1000 ve 10000 kere atılması
olaylarında aşağıdaki sayıda yazı gelmiştir. Her atışta yazı gelmesi
olayının frekansını hesaplayıp atış sayısına göre değişimini çiziniz.

Atış Sayısı (N) : 10 100 1000 10000


Yazı Sayısı (Ni) : 7 45 525 4980

Çözüm: f=Ni/N 0.7 0.45 0.525 0.498

o Görüldüğü gibi, veri sayısı


arttıkça frekans değeri olasılığa
(0.5) yaklaşmaktadır

7
Olasılık Kavramı (Tanımlar)

 Diğer bir basit örnek zar atılması olayıdır.

 Bir zar atışı olayında herhangi bir rakamın görülmesi ihtimali 1/6'dır.

P( X  1)  p1  P( X  2)  P( X  3)  P( X  4)  P( X  5)  P( X  6)  1 / 6

 Olasılık değeri, 0 ile 1 arasındadır. Olasılığın 0 olması o olayın


mümkün olmadığını, 1 olması ise kesinlikle meydana geleceğini
belirtir.

 Örneğin, zar atışında 0 veya 7 gelmesi olasılığı 0, 1 ile 6 arasında bir


sayı gelmesi olasılığı 1'dir.

8
Olasılık Kavramı (Tanımlar)

 Bir olayın meydana gelmesi başarı (veya oluşma ihtimali) ve


gelmemesi de başarısızlık (veya oluşmama ihtimali) olarak
adlandırılır. Başarı ve başarısızlık olasılıkları p ve q ile gösterilirse
aşağıdaki eşitlikler kolayca yazılabilir:

p  q 1

p  1 q

q  1 p

 Mesela, zar atılması olayında 2 gelme olasılığı 1/6, 2 gelmeme


olasılığı ise 1-1/6=5/6’dır.
9
Olasılık Kavramı (Tanımlar)

 OLASILIĞIN İKİ TEMEL KURALI:

1) Tüm basit olayların olasılıkları 0 ile 1 arasındadır.

2) Bir örnek uzayındaki tüm basit olayların ortaya çıkma


olasılıklarının toplamı 1’e eşittir.

DİKKAT!!!!

Hiç bir olayın OLASILIĞI 1’den büyük olamaz!!!!


10
Olasılık Kavramı (Tanımlar)

 Tek bir deneyde tek bir sonuç olarak gerçekleşen olaylara Basit
Olaylar denir.

o Örnek: hilesiz bir zarın atılması sonucu 2 gelmesi P(A),

o Örnek: bir deste iskambil kağıdından çekilen kağıdın maça as


olması P(A)

 İki veya daha çok olayın birlikte veya birbiri ardına meydana gelmesine
Bileşik Olay denir.
o P(A1 ve A2),
o İki zar atılır ve 4 gelmesi
o Bir zar arka arkaya iki defa atılır .Her iki atışta da 4 gelmesi.
o 52 lik desteden as ve aynı zamanda karo gelmesi. 11
Olasılık Kavramı (Tanımlar)

 Eğer A ve B gibi iki olay aynı anda gerçekleşemiyor ise bu olaylara


ayrık (birbirini engelleyen) olaylar denir.

o Örnek: Madeni para atılması sonucunda yazı veya tura gelmesi,

o Örnek: Bir sınavda geçilir veya kalınır.

 Bir olayın ortaya çıkması başka bir olayın ortaya çıkmasını


engellemiyorsa iki veya daha çok olay birlikte meydana gelebiliyorsa
bağdaşır olaydır.

o Zarın atılması sonucu 1 ve tek sayı gelmesi. (Çünkü aynı anda


gerçekleşebilirler.),
o 52 lik desteden çekilen kartın maça olması as olması.
12
Olasılık Kavramı (Tanımlar)

 Bir olayın ortaya çıkması başka bir olayın ortaya çıkmasından


ilişkisiz ise bağımsız olay,

o Örnek: ailede birinci çocuğun erkek olması ikincisinin de erkek


olacağı anlamına gelmez.

 Bir olayın ortaya çıkması başka bir olayın ortaya çıkmasını etkiliyorsa
bağımlı olay,

o 52 lik bir desteden iadesiz arka arkaya iki kart çekiliyor. Kart
sayısı önce 52 sonra 51,

o 6 beyaz, 8 kırmızı top var. 3 top çekiliyor İade edilirse bağımsız,


iade edilmezse bağımlı olaydır. 13
Olasılık Kavramı (Tanımlar)

 Bir örnek uzayındaki tüm basit olayların ortaya çıkma olasılığı eşit
ise bu olaylara eşit olasılıklı olaylar denir.

o Örnek: Bir deste iskambil kağıdından bir adet kağıt çekilmesi.

14
Olasılık Kavramı (Tanımlar)

 Bir örnek uzayındaki tüm basit olayların ortaya çıkma olasılığı eşit
ise bu olaylara eşit olasılıklı olaylar denir.

o Örnek: Bir deste iskambil kağıdından bir adet kağıt çekilmesi.

 Bağdaşır ve bağdaşmaz olaylar Venn Diyagramı ile ifade edilebilmektedir.

o KS LS=Ø
HS S  H = {a,e}
S H L
o S ve H ayrık olmayan iki
K olay,
SH o H ve L ayrık iki olaydır.
15
Olasılık Kavramı (Tanımlar)

 Ayrık (bağdaşmaz) olaylar durumunda toplama kuralı:

o A1 ve A2 bağdaşmaz olaylar ise A1 veya A2 olayının ortaya


çıkması olasılığı

P(A veya B)  P(A  B)  P(A)  P(B)

o Bir zarın 2 veya 6 gelmesi olasılığı nedir?

16
Olasılık Kavramı (Tanımlar)

 Ayrık olmayan (bağdaşır) olaylar durumunda toplama kuralı:

o İki olay bağdaşır olduğunda A1 olayının veya A2 olayının


ortaya çıkması, ya A1 olayının ya A2 olayının ya da A1 ve A2
olaylarının her ikisinin birlikte gerçekleşmesi anlamına gelir.

P(A veya B)  P(A  B)  P(A)  P(B)  P(A  B)

o Zar atılması olayında (tek sayı) veya (3’ten küçük sayı) gelme
olasılığını nedir?

17
Olasılık Kavramı (Tanımlar)

 Bağımsız olayda çarpma kuralı:

o Birden fazla bağımsız olayın aynı anda meydana gelebilmesi


olasılığı, bu olayların ayrı ayrı oluşma olasılıklarının çarpımına
eşittir.
P(A ve B)  P(A  B)  P(A)*P(B)

P(A ve B ve C)  P(A  B  C)  P(A)*P(B)*P(C)

o Bir zarın peş peşe 2 kere atışında da 6 gelmesi olasılığını nedir?

Zarın her atışında 6 gelmesi olasılığı 1/6 olduğundan


P(6,6)=1/6*1/6=1/36 olur.

18
Olasılık Kavramı (Tanımlar)
 Bağımlı olayda çarpma kuralı:
o Bağımlı iki olaydan A2 olayı A1 olayından sonra ortaya çıktığında
olayların birlikte gerçekleşme olasılığıdır.

o 8 boş 2 ikramiyeli bilet var. Bir kişi 2 bilet almış her iki biletinde
ikramiye kazanma olasılığı nedir?
1.bilet: P(A1)=2/10, Geriye 8 boş ve 1 ikramiyeli bilet kaldı.

19
Olasılık Kavramı (Tanımlar)

 Toplama ve Çarpma kuralları:

20
Olasılık Kavramı (Tanımlar)

 Şartlı Olasılık:
o Bağımlı olaylardan birinin (A1) gerçekleştiği bilindiğine göre,
diğerine (A2) bağlı meydana gelme olasılığıdır.

o A1 in gerçekleşmiş olması şartıyla A2 nin gerçekleşme


olasılığıdır. 21
Olasılık Kavramı (Tanımlar)

 Şartlı Olasılık:
o Bir öğrencinin iktisat dersinde başarılı olma olasılığı P(A1)=0.25
olsun. Aynı öğrencinin hem iktisat hem Matematikte başarılı olma
olasılığı P(A1 ve A2)=0.15. Öğrencinin İktisatta başarılı olması
şartıyla Matematikte de başarılı olma olasılığı nedir?

22
Olasılık Kavramı (Şartlı Olasılık)

23
Olasılık Kavramı (Permütasyon)

 Permütasyon:
o Permütasyon, birbirinden farklı N nesnenin hepsi veya bir kısmı
alınarak yapılacak çeşitli dizilişlerden her biridir.

o A, B, C harfleriyle simgelenen üç nesne, birbirinden farklı olarak


altı biçimde düzenlenebilir:

o ABC, ACB, BAC, BCA, CAB, CBA

o Her bir diziliş bir permütasyondur. Birbirinden farklı N=3


nesneden hepsini alarak elde edilecek permütasyon sayısı;

24
Olasılık Kavramı (Permütasyon)

 Permütasyon:

25
Olasılık Kavramı (Permütasyon)

 Permütasyon:
o N tane nesneden bazıları aynıysa, aynı olanların kendi aralarında
yer değiştirmesi permütasyonun şeklini değiştirmez. Örneğin N
nesnede a tanesi birbirinin aynı, b tanesi aynı, c tanesi yine aynı ise,
bu N nesneden elde edilecek permütasyon sayısı;

26
Olasılık Kavramı (Kombinasyon)

 Kombinasyon:
o Kombinasyon, birbirinden farklı N nesnenin bir kısmını seçerek ve
sıra gözetmeksizin oluşturulan gruplardan her biridir.

o Örneğin üç nesne A, B, C harfleri olsun. Bu üç nesneden ikişer tane


alarak sıra gözetmeksizin (birbirinden farklı) yapılan üç ayrı
kombinasyon aşağıda gösterilmiştir:

o AB, AC, BC

o Permütasyon konusunda da aynı örnek verilmişti ama orada AB, BA,


AC, CA, BC, CB permütasyonları oluşturulmuştu.

27
Olasılık Kavramı (Kombinasyon)

 Kombinasyon:
o Permütasyonda AB ile BA ayrı birer diziliş olarak kabul edilmekte
fakat kombinasyonda harflerin diziliş sırasına önem verilmediği için
AB ile BA bir kombinasyon olarak kabul edilmektedir.

o Birinden farklı N nesneden n tane alarak elde edilecek kombinasyon


sayısı:

28
Olasılık Kavramı (Kombinasyon)

 Kombinasyon:

29
Olasılık Kavramı (Kombinasyon)

 Kombinasyon:

30
Olasılık Kavramı (Kombinasyon)

 Kombinasyon:

31
Problem Çözümü

Doç. Dr. Adem AKPINAR


Yararlanılan Kaynaklar
• Biyoistatistik Ders Notları, Ankara Ü., Sibel A. Kemaloğlu, Esin K Babacan

• İstatistik Ders Notları, Dokuz Eylül Ü.

• İstatistik Ders Notları, Celal Bayar Ü., Emre Yalamaç

• Olasılık ve İstatistik Ders Notları, İstanbul Teknik Ü., Mehmet Özger

• İstatistik Ders Notları, Balıkesir Ü., Banu Yağcı

• Mühendislikte İstatistik Yöntemler Ders Notları, Erciyes Ü., Murat Çobaner


• İstatistik Ders Notları, Karadeniz Teknik Ü., Murat İhsan Kömürcü, Ömer Yüksek,
Murat Kankal

33
Rastgele
Değişkenlerin
Olasılık Dağılımları

Doç. Dr. Adem AKPINAR


Rastgele Değişkenlerin Olasılık Dağılımları

o Değerleri sayımla elde


edilen değişkene kesikli
değişken denir. Başka
bir deyişle bir kesikli
değişkenin birbirini
izleyen değerleri
arasında belirli boşluklar
vardır.

o Değerleri ölçüm ya da tartımla elde edilen, bir başka anlatımla


sayımla elde edilemeyen bir değişkene sürekli rassal değişken
denir. Sürekli bir rassal değişkenin değerleri aralıklar halinde
tanımlanır.
2
Rastgele Değişkenlerin Olasılık Dağılımları

o Kesikli rastgele değişken için örnekler: «sayılır»


 Bir madeni para 3 defa atıldığında yazı gelme olasılığı

 İki tavla zarı beraber atıldığında üste gelen yüzlerdeki sayıların toplamı

 Rastgele seçilen bir ailenin çocuk sayısı

 Bir benzin istasyonuna 1 saat içinde gelen araç sayısı

o Sürekli rastgele değişken için örnekler: «ölçülür»


 Henüz doğan bir bebeğin ağırlığı

 Bir otomobil lastiğinin ömrü

 Bir öğrencinin boy uzunluğu

 Bir konutun yıllık elektrik tüketimi

 Bir mesafeyi koşma süresi


3
Rastgele Değişkenlerin Olasılık Dağılımları
 Bu rastgele değişkenlerin olasılık dağılımları bazı olasılık yoğunluk
fonksiyonları ile tanımlanabilir. Üniform dağılım
Normal dağılım
Üstel dağılım
Eksponansiyel dağılım
Ayrık Üniform dağılım Gamma dağılımı
Binom dağılımı Weibull dağılımı
Geometrik dağılım Lognormal dağılım
Poisson dağılımı Rayleigh dağılımı
Bernoulli dağılımı t ve F dağılımları
Negatif binom dağılımı Genelleş. Pareto dağılımı
Hipergeometrik dağılım Ekstrem değer dağılımı
Genelleş. Ekstrem değer d.

Bazı Kesikli Olasılık Dağılımları


4
Bazı Sürekli Olasılık Dağılımları
Kesikli Rastgele Değişkenin Olasılık Dağılımı

 Bir trafik ışığında belirli bir anda durmakta olan araç sayısı X ile
gösterilirse ve yapılan gözlemler sonucu aşağıdaki olasılıkların
belirlenmiş olduğu kabul edilirse, bu değişkene ait olasılık
yoğunluk (histogram) ve eklenik yoğunluk (dağılım) fonksiyonları:
Olasılık yoğunluk
(dağılım)
fonksiyonu (p(x))

5
Kesikli Rastgele Değişkenin Olasılık Dağılımı

 Bir trafik ışığında belirli bir anda durmakta olan araç sayısı X ile
gösterilirse ve yapılan gözlemler sonucu aşağıdaki olasılıkların
belirlenmiş olduğu kabul edilirse, bu değişkene ait olasılık kütle
fonksiyonu (histogram) ve eklenik dağılım fonksiyonunu çiziniz.
Birikimli yoğunluk
(dağılım)
fonksiyonu (F(x))

Rastgele değişken kesikli olduğundan birikimli


6
yoğunluk fonksiyonu kesiklidir.
Sürekli Rastgele Değişkenin Olasılık Dağılımı

Birikimli yoğunluk
(dağılım)
fonksiyonu (F(x))

-4 -3 -2 -1 0 1 2 3 4

Rastgele değişken sürekli olduğundan birikimli


yoğunluk fonksiyonu süreklidir.

7
Kesikli Rastgele Değişkenlerin Olasılık Dağılımları

 Bernoulli Dağılımı:
o Bir şans değişkeninin bernoulli dağılımı göstermesi için ilgilenilen
süreçte bernoulli deneyinin varsayımlarının sağlanması
gereklidir.
o Bernoulli Deneyinin Varsayımları:
 Deneyler aynı koşullarda tekrarlanabilirlik özelliğine sahip
olmalıdır.
 Deneylerin yalnız iki mümkün sonucu olması gereklidir.
 Başarı olasılığı (p), deneyden deneye değişmemektedir
(Başarısızlık olasılığı q = 1-p ile gösterilir)
 Denemeler birbirinden bağımsız olmalıdır. 8
Kesikli Rastgele Değişkenlerin Olasılık Dağılımları

 Bernoulli Dağılımı:
o Bir deneyde başarı ve başarısızlık diye nitelendirilen iki
sonuçla ilgilenildiğinde bu deneye (iki sonuçlu) Bernoulli
deneyi ya da Bernoulli denemesi denir.

9
Kesikli Rastgele Değişkenlerin Olasılık Dağılımları

 Bernoulli Dağılımı:
o Bernoulli dağılışında X şans değişkeni başarı durumu için 1,
başarısızlık durumu için ise 0 değerini alır.

o Bernoulli dağılımının olasılık fonksiyonu:

f (x)  P(X  x)  px *q(1x) x  0,1

10
Kesikli Rastgele Değişkenlerin Olasılık Dağılımları

 Bernoulli Dağılımı:

11
Kesikli Rastgele Değişkenlerin Olasılık Dağılımları

 Binom (Binomial) Dağılımı:


o Birbirinden bağımsız n adet bernoulli deneyinin bir araya gelmesi
sonucunda binom deneyi gerçekleşir.
o Binom deneyinin gerçekleşmesi için bernoulli deneyinin bütün
varsayımlarının sağlanması gereklidir.
o Bir kesikli rastgele değişken için sadece 2 olay mevcutsa (olmak
veya olmamak, ya da gerçekleşmek veya gerçekleşmemek gibi),
ve bunların olasılıkları p ve q = 1- p ile gösterilirse; n elemanlı bir
örnek için olasılığı p olan olayın x defa görülmesi olasılığı:

 N  x Nx N!
P(x)    * p *q  * p x * q Nx x  0,1, 2,..., N
x x!* (N  x)!
12
Kesikli Rastgele Değişkenlerin Olasılık Dağılımları

 Binom (Binomial) Dağılımının Parametreleri:

 Ortalama;
μ  E(x)  np

 Varyans ve Standart Sapma; n = örnek büyüklüğü


p = başarı olasılığı
σ  npq q = (1 – p) = başarısızlık olasılığı
2

σ npq

13
Kesikli Rastgele Değişkenlerin Olasılık Dağılımları

 Binom (Binomial) Dağılımı:


o Birbirinden bağımsız n adet bernoulli deneyinin bir araya gelmesi
sonucunda binom deneyi gerçekleşir.

o Örnek: Bir barajın dolu savağı 20 yıllık taşkın debisine göre


boyutlandırıldığına göre, barajın 50 yıllık ömrü boyunca söz
konusu debinin sırasıyla 0, 1, 2, 3 defa görülmesi olasılıklarını
hesaplayınız?

 Taşkın debisinin herhangi bir yılda görülme olasılığı  p = 1/20 = 0.05


 Taşkın debisinin herhangi bir yılda görülmeme olasılığı;
q = 1 - p = 1 - 0.05 = 0.95
14
Kesikli Rastgele Değişkenlerin Olasılık Dağılımları

 Binom (Binomial) Dağılımı:


 50 yıl boyunca hiç görülmeme olasılığı;

 50  50!
P(0)   0.05 0 . 0.95 500  0.05 0 . 0.95 50  0.077
0 0! (50  0)!

 50 yıl boyunca 1 defa görülme olasılığı;


 50  50!
P(1)   0.051. 0.9550 1  0.051. 0.9549  0.202
1 1! (50  1)!
 50 yıl boyunca 2 defa görülme olasılığı;
 50  50!
P( 2)   0.05 2 . 0.95 50 2  0.05 2 . 0.95 48  0.261
2 2! (50  2)!
 50 yıl boyunca 3 defa görülme olasılığı;
 50  50!
P(3)   0.05 3. 0.95 503  0.05 3. 0.95 47  0.220
3 3! (50  3)! 15
Kesikli Rastgele Değişkenlerin Olasılık Dağılımları

 Binom (Binomial) Dağılımı:

 Bu örneğin olasılık dağılım fonksiyonu ve parametreleri:

μ  np  (50)(.05)  2.5

σ  npq  (50)(.05)(1  .05)


 1.54

16
Kesikli Rastgele Değişkenlerin Olasılık Dağılımları

 Binom (Binomial) Dağılımı:


 Örnek: Trabzonspor Profesyonel Futbol Takımı’nın yaptığı
maçlarda kazanma olasılığı 7/8 olduğu bilinmektedir. 
Trabzonspor’un yaptığı 8 maçtan a) beşini ve b) birden fazla fakat
dört veya daha azını kazanması olasılıklarını hesaplayınız?

17
Kesikli Rastgele Değişkenlerin Olasılık Dağılımları

 Binom (Binomial) Dağılımı:

18
Kesikli Rastgele Değişkenlerin Olasılık Dağılımları

 Binom (Binomial) Dağılımı:

 Bu örneğin olasılık dağılım fonksiyonu ve parametreleri:

μ  np  (8)*(7/8)  7

σ  npq  (8)*(7/8)*(1  (7 / 8) )
 0.936

19
Kesikli Rastgele Değişkenlerin Olasılık Dağılımları

 Poisson Dağılımı:
 Binom Dağılımının limit hali olan Poisson Dağılımı, çok nadir
(olasılıkları çok küçük) olan basit olayların (trafik kazası, taşkın,
deprem vb) meydana gelme olasılıklarını hesaplamada başarıyla
uygulanmaktadır. N denemede x defa başarı görülme olasılığı
şöyle hesaplanır: x
P(X  x)   x  0,1, 2,...
e x!

 Bu dağılımın tek bir parametresi vardır ()

 Poisson Dağılımında, yalnızca başarı (meydana gelme) ihtimali


söz konusudur; Binom Dağılımında olduğu gibi bir başarısızlık
(meydana gelmeme) durumu yoktur. 20
Kesikli Rastgele Değişkenlerin Olasılık Dağılımları

 Poisson Dağılımının Parametreleri:

 Ortalama;
μ

 Varyans ve Standart Sapma;

σ 
2

σ  

λ: gerçekleşen ortalama olay sayısı

21
Kesikli Rastgele Değişkenlerin Olasılık Dağılımları

 Poisson Dağılımı:
 Örnek: Bir barajın dolu savağı 1000 yıllık taşkın debisine göre
boyutlandırıldığına göre, barajın 100 yıllık ömrü boyunca söz
konusu debinin hiç görülmemesi veya 1 defa görülmesi
olasılıklarını hesaplayınız?
n = 100 p = 1/1000 = 0.001
 = n.p = 100 . 0.001 = 0.10

x . e  0.10 0. e 0.10
P(0)    0.905
x! 0!
 x . e  0.101. e 0.10
P(1)    0.090
x! 1!
22
Kesikli Rastgele Değişkenlerin Olasılık Dağılımları

 Poisson Dağılımı:

 Bu örneğin olasılık dağılım fonksiyonu ve parametreleri:

μ    (100)*(0.001)  0.1

σ    (100)*(0.001)  0.316

23
Kesikli Rastgele Değişkenlerin Olasılık Dağılımları

 Poisson Dağılımı:

 Örnek: Bir şehirde bir yıl içinde depremden ortalama ölen kişi
sayısı 4’ dür. Belli bir yıl içinde bu hastalıktan,

a) Hiç kimsenin ölmemesi


b) En az 2 kişinin ölmesi
c) 3 kişinin ölmesi

olasılıklarını hesaplayınız.

24
Kesikli Rastgele Değişkenlerin Olasılık Dağılımları

 Poisson Dağılımı:
X: bir yılda depremden ölenlerin sayısı

25
Kesikli Rastgele Değişkenlerin Olasılık Dağılımları

 Poisson Dağılımı:

 Bu örneğin olasılık dağılım fonksiyonu ve parametreleri:

μ4

σ    4 2

26
Kesikli Rastgele Değişkenlerin Olasılık Dağılımları

 Geometrik Dağılım:

 Arka arkaya n kez tekrarlanan bir Bernoulli deneyinde ilk istenen


sonucun (başarı ya da başarısızlık) olasılığının belirlenmesi için
kullanılan bir dağılımdır.

P(X  x)  qx1 *p x  1,2,3... 0  p 1

27
Kesikli Rastgele Değişkenlerin Olasılık Dağılımları

 Geometrik Dağılımının Parametreleri:

 Beklenen Değer (Ortalama);


1
μ  E(X) 
p

 Varyans ve Standart Sapma;

1 p
 VAR(X) 
2
σ
p2

1 p
σ 2
p 28
Kesikli Rastgele Değişkenlerin Olasılık Dağılımları

 Geometrik Dağılım:

 Örnek: Bir avcı hedefe isabet sağlayana kadar ateş etmektedir.


Avcının hedefi vurma olasılığı 0,75 olduğuna göre avcının hedefi ilk
kez 8 nci atışında isabet ettirme olasılığını hesaplayınız.

29
Kesikli Rastgele Değişkenlerin Olasılık Dağılımları

 Geometrik Dağılım:

x  8, P(X  8)  ?

P(X  8)  (1  0.75)81 *0.75


P(X  8)  4.6*105
1 1
μ   1.33
p 0.75

1  p 1  0.75
σ 
2

2
 2
 0.44
p (0.75)

30
Kesikli Rastgele Değişkenlerin Olasılık Dağılımları

 Kesikli Değişkenlerin Diğer Dağılımları:

31
Kesikli Rastgele Değişkenlerin Olasılık Dağılımları

 Kesikli Değişkenlerin Diğer Dağılımları:

32
Kesikli Rastgele Değişkenlerin Olasılık Dağılımları

 Kesikli Değişkenlerin Diğer Dağılımları:

33
Kesikli Rastgele Değişkenlerin Olasılık Dağılımları

 Kesikli Değişkenlerin Diğer Dağılımları:

34
Kesikli Rastgele Değişkenlerin Olasılık Dağılımları

 Kesikli Değişkenlerin Diğer Dağılımları:

35
Kesikli Rastgele Değişkenlerin Olasılık Dağılımları

 Kesikli Değişkenlerin Diğer Dağılımları:

36
Sürekli Rastgele
Değişkenin Olasılık
Dağılımları

Doç. Dr. Adem AKPINAR


Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Normal Dağılım (Gauss Dağılımı):


o Normal dağılım hem uygulamalı hem de teorik istatistikte kullanılan
oldukça önemli bir dağılımdır.

o Normal dağılımın istatistikte önemli bir yerinin olmasının nedeni,


yapılan birçok gözlem sonucunun, çan biçiminde bir dağılım
vermesi ve çoğu dağılımın denek sayısı arttıkça normal dağılıma
yaklaşmasıdır.

38
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Normal Dağılım (Gauss Dağılımı):

f
1 ( x   ) 2 /( 2 2 )
f ( x)  e   x  
 2

x
 Dağılımın iki parametresi vardır:
  (-  <  < ) (rastgele değişkenin ortalaması)
  ( > 0) (rastgele değişkenin standart sapması)
 N(μ, σ2) şeklinde gösterilir.
39
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Normal Dağılım (Gauss Dağılımı):


 Normal dağılım simetrik bir dağılımdır.
 Cs = 0 (Çarpıklık Katsayısı)
 k=3 (kurtosis (basıklık) katsayısı)
 Modu ve medyanı ortalamaya (μx) eşittir.
 Değerlerin ortalama ile ortalamanın bir σ
1 (x )2 /(22 ) uzağı arasında bulunma olasılığı %34.1 dir.
f(x)  e
f(x)  2

O.Y.F

- x + X
40
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Parametre değişikliklerinin dağılımın şekli üzerindeki etkisi

41
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Normal dağılımda olasılık hesabı

42
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Standart Normal Dağılım

43
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Normal Dağılım (Gauss Dağılımı):


 Bir rastgele değişkenin a ve b b
1 ( x   ) 2 /( 2 2 )
arasında bir değer alma olasılığı: f(x)   2 e dx
a
b
1 ( x   ) 2 /( 2 2 )
  2 e dx
a

 Bu denklemin normal integrasyon


teknikleri ile çözümü oldukça güçtür.
Bu yüzden rastgele değişken, standart - 
değişken haline getirilir. x a b + X

x f ( x) 
1
e ( x   ) /( 2 )    x  
2 2

z standart normal değişken


  2
 Bu durumda normal dağılım f(x), 1 z2 / 2
ortalaması  = 0, standart sapması  = 1 f ( z)  e   z  
2
olan standart normal dağılım f(z) adını 44
alır.
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

45
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

46
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Standart Normal Dağılım Eğrisi Altında Kalan Alan


F(x) =P(X < x) = F(z) = P(Z < z)
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0 z
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
x
z 0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753

0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141

0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517

0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
F(Z=0.23)=0.5910
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224

0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549

0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852

z = 0.23 = 0.23 0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133

0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389

F(Z=0.65)= 0.7422
F(Z=0.81)= 0.7910 47
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

x
f(z) f(z) z f(z)

b b z1 z2
z=0 z z z
z=0 z=0

P(X < a) = P (Z < b) P(x1<X < x2) = P (z1<Z < z2)


P(X > a) = P (Z > b)

48
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Standart Normal Dağılım


1-0,896165

0,2003269

49
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Örnek: Standart normal dağılıma sahip değişkeni için aşağıda


istenilen olasılıkları hesaplayınız.

50
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Çözüm:

51
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Çözüm:

52
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Üniform Dağılım:

o Rastgele değişkenin muhtemel bütün çıktılarının eşit olasılıklara


sahip olduğu bir olasılık dağılımıdır.

o Dağılım fonksiyonu:

1
a xb
ba
f(x) =
0 aksidurum

a = aralığın alt sınırı


b = aralığın üst sınırı
53
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Üniform Dağılım:

o Örnek: 2 ≤ x ≤ 6 aralığındaki üniform olasılık fonksiyonu ?

1
f(x) = 6 - 2 = .25 for 2 ≤ x ≤ 6

f(x)
1
.25 ba

2 6 x

54
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Üniform Dağılımının Parametreleri:

 Ortalama;
ba
μ
2
 Varyans ve Standart Sapma;

 b  a
2
b  a
2

 σ 
2
σ
12 12

55
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Eksponansiyel Dağılım:

o Bir olayın iki oluşması arasında geçen zamanı ölçmek için


kullanılır.

Örnekler:

 Bir boşaltma limanına ulaşan kamyonlar arasında geçen zaman

 Bir ATM makinasındaki işlemler arasında geçen zaman

 Ana işlemciye ulaşan telefon çağrıları arasında geçen zaman

 Yıldırım düşmesi olayının tekrarlanması için geçmesi gereken


zaman

56
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Eksponansiyel Dağılım:

o İki olay arasında geçen zamanların dağılımı için olasılık


fonksiyonu;

P(x)   * eλ*x
o λ: ortalama iki olay arasında geçen zaman

57
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Eksponansiyel Dağılımının Parametreleri:

 Ortalama ve standart sapma birbirine eşittir;

μ    1/ 

 Varyans;
2
2 1
σ  


58
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Eksponansiyel Dağılım:

 Örnek: İngiltere’de yıldırım düşmesi olayından


dolayı yılda ortalama 3 kişi ölmektedir.
a) Bugünden itibaren yıldırım düşmesinden
ölümün gerçekleşmesi için gereken zamanın
1 yıl olma olasılığı
b) Bugünden itibaren yıldırım düşmesinden
ölümün gerçekleşmesi için gereken zamanın
1 yıldan daha az olduğu olasılığı nedir?

59
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Eksponansiyel Dağılım:

o İki olay arasında geçen zamanların dağılımı için olasılık


fonksiyonu;
P(x)   * eλ*x  3* e3*x
a) Bugünden itibaren yıldırım düşmesinden ölümün gerçekleşmesi
için gereken zamanın 1 yıl olma olasılığı

P(1)  3* e3*1  0.149


b) Bugünden itibaren yıldırım düşmesinden ölümün gerçekleşmesi
için gereken zamanın 1 yıldan daha az olduğu olasılığı
1
1 1
 3* e 3x

P(x<1)   f (x) * dx   (3* e ) * dx  
3x 3x 1
   e  0  e  ( 1)  0.95
3

0 0  3  0 60
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Eksponansiyel Dağılımı:

μ    1/   1/ 3  0.333

2
1
    0.111
2
σ
3

61
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Sürekli Değişkenlerin Diğer Dağılımları:

62
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Sürekli Değişkenlerin Diğer Dağılımları:

63
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Sürekli Değişkenlerin Diğer Dağılımları:

64
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Sürekli Değişkenlerin Diğer Dağılımları:

65
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Sürekli Değişkenlerin Diğer Dağılımları:

66
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Sürekli Değişkenlerin Diğer Dağılımları:

67
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Sürekli Değişkenlerin Diğer Dağılımları:

68
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Sürekli Değişkenlerin Diğer Dağılımları:

69
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Sürekli Değişkenlerin Diğer Dağılımları:

70
Sürekli Rastgele Değişkenlerin Olasılık Dağılımları

 Sürekli Değişkenlerin Diğer Dağılımları:

71
Problem Çözümü

Doç. Dr. Adem AKPINAR


Yararlanılan Kaynaklar
• Biyoistatistik Ders Notları, Ankara Ü., Sibel A. Kemaloğlu, Esin K Babacan

• İstatistik Ders Notları, Dokuz Eylül Ü.

• İstatistik Ders Notları, Celal Bayar Ü., Emre Yalamaç

• Olasılık ve İstatistik Ders Notları, İstanbul Teknik Ü., Mehmet Özger

• İstatistik Ders Notları, Balıkesir Ü., Banu Yağcı

• Mühendislikte İstatistik Yöntemler Ders Notları, Erciyes Ü., Murat Çobaner


• İstatistik Ders Notları, Karadeniz Teknik Ü., Murat İhsan Kömürcü, Ömer Yüksek,
Murat Kankal

73
Örnekleme
Dağılımları

Doç. Dr. Adem AKPINAR


Örnekleme Dağılımı Kavramı

o İstatistikte ana kütleden rastgele örnekler seçilerek bu örneklerden


hesaplanacak istatistikler yardımıyla ana kütle parametreleri (μ, σ
veya σ2) hakkında bilgi edinilebilir.

Population

µ 

o Bunun için, ana kütleden eşit büyüklükte rastgele örnek alma


2
işlemine örnekleme adı verilmektedir.
Örnekleme Dağılımı Kavramı

Örnekleme

Basit rastgele örnekleme 3


Örnekleme Dağılımı Kavramı

Örnekleme

Basit rastgele örnekleme 4


Örnekleme Dağılımı Kavramı

Örnekleme

Sistematik rastgele örnekleme 5


Örnekleme Dağılımı Kavramı

Örnekleme
Orantısız sınıflandırılmış Orantılı sınıflandırılmış
örnek örnek

Sınıflandırılmış örnekleme 6
Örnekleme Dağılımı Kavramı

Örneklemenin Hedefleri

o Araştırma Maliyetlerinden (test, muayene vs.) tasarruf


sağlanması

o Zaman tasarrufu sağlanması

o Ana kütlenin tam sayımının pratik olarak imkansız olmasından


dolayı ana kütle hakkında doğru bilgi sağlanması

o Gerçekleştirilecek analizin veya uygulanacak yöntemin zarar


verici etkilerinden korunmak

7
Örnekleme Dağılımı Kavramı

Örnekleme Dağılımı: Aynı ana kütleden aynı büyüklükteki muhtemel


bütün örnekler için belirlenen herhangi bir parametrenin aldığı
değerlerin dağılımıdır.

o Bir ana kütleden N


N=10 olan k adet
büyüklüğünde k adet örnek ve
Örnek ortalamaları
rastgele alınan örneklerin
ortalamalarının dağılımı
bir örnekleme dağılımıdır

Ana kütle
ortalaması (μ=25) 8
Örnekleme Dağılımı Kavramı

Örnekleme Dağılımı, örnek ve ana kütle arasında bir köprü vazifesi


görmektedir.

o 1. ÖZELLİK: Ortalamanın örnekleme dağılımının ortalaması,


ana kütlenin ortalamasına eşittir. x  

o 2. ÖZELLİK: Ortalamanın örnekleme dağılımının standart


sapması, ortalamanın standart hatasına eşittir.

x 
N

9
Örnekleme Dağılımı Kavramı

o 3. ÖZELLİK: Yapısı ne olursa olsun herhangi bir ana kütle için,


ortalamanın örnekleme dağılımı örnek büyüklüğü (N) arttıkça
normal dağılıma yaklaşacaktır.

Bu da «Merkezi Sınır Teoremi» olarak ifade


edilmektedir.

Bu Teorem:

a) Küçük örneklerin (N<30) örnekleme dağılımının şeklinin daha az normal


dağılıma yakınsadığını ve

b) Büyük örneklerin (N>30) örnekleme dağılımının şeklinin daha fazla normal


dağılıma yakınsadığını ifade etmektedir. 10
Örnekleme Dağılımı Kavramı

Örnek Ortalamalarının Dağılımı

10
Standart Sapma = 2.02
Ortalamaların ortalaması = 41.0
8
Ortalamaların sayısı = 21

6
Frekans

0
37 38 39 40 41 42 43 44 45 46
Örnek Ortalamaları 11
Örnekleme Dağılımı Kavramı

Örnek Ortalamalarının Dağılımı

14
Standart Sapma = 1.80
12 Ortalamaların ortalaması = 41.12
Ortalamaların sayısı = 96
10

8
Frekans

0
37 38 39 40 41 42 43 44 45 46

Örnek ortalamaları 12
Örnekleme Dağılımı Kavramı

Örnek Ortalamalarının Dağılımı

30
Standart Sapma = 1.71
Ortalamaların ortalaması = 41.12
Ortalamaların sayısı = 170

20
Frekans

10

0
37 38 39 40 41 42 43 44 45 46

Örneklerin ortalaması
13
Güven Aralığı

Bilinmeyen bir ana kütle parametresinin, hesaplanan istatistik


değerinin etrafında, verilen bir ihtimalle, hangi aralık içinde kalacağı
belirlenebilmektedir.

Bu dağılımın beklenen değeri


E(b)=μ, eldeki örnekten
hesaplanan b0 değeridir

Pc : güven düzeyi,
(b1,b2) aralığı: güven aralığı
α=1- Pc : anlamlılık düzeyi

14
Güven Aralığı

o Güven düzeyi arttıkça güven aralığı da büyür, çünkü β parametresinin


daha geniş bir aralık içinde kalması ihtimali daha büyüktür.

o Örnekleme dağılımının özellikleri,

 ana kütlenin rastgele değişkeninin dağılımına,

 incelenmekte olan parametreye ve

 örneğin büyüklüğüne bağlıdır

15
Ana Kütle Parametrelerinin Tahmini

o Örnekleme dağılımları yardımıyla ana kütle parametrelerinin belirli bir


güven düzeyinde tahmin edilmesinde,

 asimptotik dağılımlar (σ biliniyor ve N30) ve

 kesin dağılımlar (σ bilinmiyor ve N<30) kullanılmaktadır.

o Genellikle, sadece iki önemli parametre olan aritmetik ortalama ve


varyansın (veya standart sapmanın) güven aralıklarının tahmin edilmesi
yeterli olmaktadır.

16
Aritmetik Ortalamanın Güven Aralığının Tahmini

A) Asimtotik Dağılım Durumunda (σ biliniyorsa ve N30)

 Aritmetik ortalamaların örnekleme dağılımının aritmetik


ortalamasının güven aralığı:

Pc  P(b1    b 2 )  P  x  z1 *Sx      x  z 2 *Sx  

Buradan; Aritmetik ortalamanın (μ) Pc ihtimalle güven aralığının (b1,b2)


arasında olduğu sonucu çıkmaktadır.

Sx
Sx 
N 17
Aritmetik Ortalamanın Güven Aralığının Tahmini

A) Asimtotik Dağılım Durumunda (σ biliniyorsa ve N30)

 z değeri, standart normal dağılım tablosundan güven düzeyine (Pc) eşit


olan değer olarak okunur.
• Mesela: Pc=0.95 güven düzeyi için
α/2=%2.5

%95

z1 z2

z 2 değeri P(z 2 )  1  ( / 2)  1  (0.05 / 2)  0.975  z 2  1.96 olarak bulunur.


örnekleme dağılımı, normal dağılıma yakınsadığı için simetriktir ve z1  1.96 'dır. 18
Aritmetik Ortalamanın Güven Aralığının Tahmini

B) Kesin Dağılım Durumunda (σ bilinmiyorsa ve N<30)


o N<30 olması durumunda aritmetik ortalamanın güven aralığı t (student)
dağılımıyla belirlenir.
xx
t
Sx /  N 1 
o t dağılımı, simetrik bir dağılımdır ve t değişkeninin bir t0 değerinden
büyük olması ihtimali, N-1 serbestlik derecesine göre ve çeşitli güven
düzeyleri için tablolaştırılmıştır.

   
Pc  P(b1    b2 )  P  x  t1 *Sx / N  1    x  t 2 *Sx / N  1 
  19
Aritmetik Ortalamanın Güven Aralığının Tahmini

B) Kesin Dağılım Durumunda (σ bilinmiyorsa ve N<30)

α/2=%2.5

Mesela: Pc=0.95 güven düzeyi ve N-1=5 için; %95

t1 t2

t 2 değeri N  1  5 ve  / 2  %2.5 için 2.571 olarak okunur.


örnekleme dağılımı, normal dağılıma yakınsadığı için simetriktir ve t1  2.571'dir. 20
Varyansın Güven Aralığının Tahmini

o Varyansın güven aralığının tahmininde Kikare (2) istatistiğinden


yararlanılır.

o 2 istatistiğinin belirli bir 02 değerini aşması ihtimali tablolaştırılmıştır

 NS 2 x 
 2

Pc  P b1    b2  P 2
NS 2 x
  2
2

   /2  1 / 2 

o α/2 ve 1- α/2 alt indisli 2 değerleri (N-1) serbestlik derecesine göre 2


tablosundan okunur

21
Varyansın Güven Aralığının Tahmini

α/2=%2.5
Mesela: Pc=0.95 güven düzeyi ve N-1=5 için;

%95

21- α/2 2α/2

2 /2 değeri N  1  5 ve  / 2  %2.5 için 12.83 olarak okunur.


21 /2 değeri N  1  5 ve 1  ( / 2)  %97.5 için 0.83 olarak okunur. 22
Problem Çözümü

Doç. Dr. Adem AKPINAR


Yararlanılan Kaynaklar
• İstatistik Ders Notları, Karadeniz Teknik Ü., Murat İhsan Kömürcü, Ömer Yüksek,
Murat Kankal

• Mühendisler İçin İstatistik, Birsen Yayınevi, Mehmetçik Bayazıt, E. Beyhan Yeğen


Oğuz

24
İstatistiksel Hipotez
Testleri

Doç. Dr. Adem AKPINAR


İstatistiksel Hipotez Testleri

 İstatistiğin gayelerinden biri, eldeki küçük örnekten elde edilen


yetersiz veriler yardımıyla ana kütle hakkında doğru tahminlerde
bulunmaktır.
 Bu tahminler yapılırken, başlangıçta "istatistik hipotez" denen bazı
kabuller yapılır ve bunların doğruluğu, çeşitli tekniklerle kontrol
edilerek hipotez kabul veya reddedilir.

 Hipotez: bir veya daha fazla ana kütle parametresi hakkında bir
varsayımda bulunmaktır.

 Örneğin;

«bir çelik fabrikasının, ürettiği çeliklerin dayanımının belirli bir


değere eşit veya bu değerden büyük olduğu iddiası» 2
İstatistiksel Hipotez Testleri

 Hipotez testi: Hipotez olarak ortaya atılan iddianın doğru veya


yanlış olduğunu belirleyen bir süreçtir.

 İki çeşit hipotez vardır:

 Sıfır Hipotezi (H0): çelik fabrikasının iddiası

 Alternatif hipotez (H1): sıfır hipotezinin karşıtı

 Bir hipotezin kabul edilmesi mutlaka doğru olduğunu, reddedilmesi


ise mutlaka yanlış olduğunu belirtmez.

 Hipotezin test edilip doğru veya yanlış olduğu, %90, %99 gibi bir
ihtimalle söylenebilir. 3
İstatistiksel Hipotez Testleri

 Hipotez testlerindeki kararlarda iki türlü hata olabilir:

1. Tip hata
 Gerçekte doğru olan sıfır hipotezinin red edilmesi

2. Tip hata
 Gerçekte yanlış olan sıfır hipotezinin kabul edilmesi

Karar Gerçek Durum


H0 Doğru H0 Yanlış
H0 Kabul Doğru Karar Yanlış Karar (2. Tip
Hata)
H0 Red (H1 Kabul) Yanlış Karar (1. Tip Doğru Karar
Hata)

 Hipotez testine başlamadan önce, bir anlamlılık düzeyi () seçilir.


1. Tip hata ihtimalinin azalması halinde 2. tip hata ihtimali artar.
Bu nedenle,  değeri istenildiği kadar küçük seçilemez. 4
İstatistiksel Hipotez Testleri

Hipotez Testinin Adımları

 1. ADIM: Sıfır hipotezini belirle (H0) β: ortalama veya varyans


gibi bir parametre
 2. ADIM: Alternatif hipotezi belirle (H1)

H0 Ret H0 Kabul H0 Ret H0 Kabul H0 Ret H0 Ret H0 Kabul

α/2 α/2 α α

Kritik 0 Kritik 0 Kritik Kritik 0


değer değer değer değer

H 0 : β = β0 H 0 : β = β0 H 0 : β = β0
H1: β  β0 H 1 : β > β0 H 1 : β < β0
İki uçlu test Bir uçlu test (sağ) Bir uçlu test (sol)
5
İstatistiksel Hipotez Testleri

Hipotez Testinin Adımları

 3. ADIM: Test kriterini belirle

 Bir test istatistiği belirle

 Bir anlamlılık seviyesi (α) seç

 Kritik bölgeye (red/kabul bölgeleri) karar ver.

 4. ADIM: Test istatistiğinin değerini elde et

 5. ADIM: Karar ver ve yorumla

6
İstatistiksel Hipotez Testleri

σ biliniyorsa
Bir ana kütle Ortalaması
z testi
için Hipotez Testi
(H0:  = 0 Hipotezinin Testi)
σ bilinmiyorsa
Ortalama için
t testi
Hipotez Testi
İki ana kütle Ortalaması
için Hipotez Testi z testi
(H0: 1 = 2 Hipotezinin Testi)

Bir ana kütle Varyansı için


Hipotez Testi Ki-Kare testi
(H0: σ = σ0 Hipotezinin Testi)
Varyans (Stand. Sapma) için
Hipotez Testi
İki ana kütle varyansı için
Hipotez Testi F testi
(H0: σ1= σ2 Hipotezinin Testi)
7
Aritmetik Ortalama İle İlgili Testler

 a) H0: x = 0 Hipotezinin Testi

«Dağılımın ana kütlesinin aritmetik ortalamasının (x) belirli bir


0 değerine eşit olup olmadığının testi»

σ biliniyorsa
z testi σ bilinmiyorsa
t testi

 zhesap (zh) değeri;  thesap (th) değeri;

x1   0 x1   0
zh  th 
0 Sx
N N

8
Aritmetik Ortalama İle İlgili Testler

 a) H0: x = 0 Hipotezinin Testi


σ biliniyorsa σ bilinmiyorsa
z testi t testi
İki uçlu test
Z’nin kritik değeri;
t’nin kritik değeri;
H0 :x  0 P(z)=1-(α/2) için
α/2 için t dağılım
H1 :  x   0 standart normal d.
tablosundan okunur
Tablosundan okunur

Bir uçlu test

H0 :x  0 Z’nin kritik değeri; t’nin kritik değeri;


H1 :  x   0 P(z)=1-(α) için standart α için t dağılım
normal dağılım
H0 :x  0 tablosundan okunur
tablosundan okunur
H1 :  x   0 9
Aritmetik Ortalama İle İlgili Testler

 a) H0: x = 0 Hipotezinin Testi σ bilinmiyorsa


t testi
x1   0 71  68 H0 :x  0
th    1.5
Sx 12
H1 :  x   0
N 36
t’nin kritik değeri;

α/2=(0.10/2)=0.05

Serbestlik derecesi=N-1=35 ve α/2=0.05 için

Enterpolasyonla; kritik t değeri= (1.697+1.684)/2=1.69


10
Aritmetik Ortalama İle İlgili Testler

 a) H0: x = 0 Hipotezinin Testi σ bilinmiyorsa


t testi
x1   0 71  68 H0 :x  0
th    1.5
Sx 12
H1 :  x   0
N 36

Ret bölgesi Ret bölgesi


Kabul
 /2 = 0.05  /2 = 0.05
bölgesi

t /2  1.69 0 t /2  1.69

th =1.5 < (t/2)t= 1.69, H0 hipotezi kabul. 11


Aritmetik Ortalama İle İlgili Testler

 a) H0: x = 0 Hipotezinin Testi σ biliniyorsa


z testi
x1   0 12.1  13 H0 :x  0
zh    2.0896
0 3.0456
H1 :  x   0
N 50
Z’nin kritik değeri;

P(z)=1-(α)=1-0.05=0.95 için standart


normal dağılım tablosundan okunur

12
Aritmetik Ortalama İle İlgili Testler

 a) H0: x = 0 Hipotezinin Testi σ biliniyorsa


z testi
x1   0 12.1  13 H0 :x  0
zh    2.0896
0 3.0456
H1 :  x   0
N 50

Ret bölgesi
Kabul
 = 0.05
bölgesi

0 z  1.65

zh =-2.09 < (z)t= 1.65, H0 hipotezi kabul. 13


Aritmetik Ortalama İle İlgili Testler

 b) H0: 1 = 2 Hipotezinin Testi


«İki farklı ana kütlenin aritmetik ortalamalarının (1 ve 2 ) aynı
olup olmadığının testi»

z Testi kullanılır

 her iki ana kütleden N1 ve N2 büyüklüğünde örnekler alınır

 zhesap (zh) değeri;


x1  x 2  (1   2 )
zh 
s12 s 22

n1 n 2 14
Aritmetik Ortalama İle İlgili Testler

 b) H0: 1 = 2 Hipotezinin Testi H 0 : 1   2


İki uçlu test
H 1 : 1   2
x1  x 2  (1   2 ) (2.255  2.140)  (0.0)
zh    0.465
s12 s 22 1 1
 Z’nin kritik değeri;
 677.23
n1 n 2 15 15
P(z)=1-(α/2)=

1-(0.05/2)=0.975

15
Aritmetik Ortalama İle İlgili Testler

 b) H0: 1 = 2 Hipotezinin Testi H 0 : 1   2


zh 
x1  x 2  (1   2 )

(2.255  2.140)  (0.0)
 0.465 H1 : 1   2
s12 s 22 1 1

 677.23
n1 n 2 15 15

Ret bölgesi Ret bölgesi


Kabul
 /2 = 0.025  /2 = 0.025
bölgesi

z/2  1.96 0 z/2  1.96

zh =0.465 < (z/2)t= 1.96, H0 hipotezi kabul. 16


Aritmetik Ortalama İle İlgili Testler

 b) H0: 1 = 2 Hipotezinin Testi H 0 : 1   2


Bir uçlu test
H 1 : 1   2
x1  x 2  (1   2 ) (2.255  2.140)  (0.0)
zh    0.465
s12 s 22 1 1
 Z’nin kritik değeri;
 677.23
n1 n 2 15 15
P(z)=1-(α)=

1-(0.05)=0.95

17
Aritmetik Ortalama İle İlgili Testler

 b) H0: 1 = 2 Hipotezinin Testi H 0 : 1   2


zh 
x1  x 2  (1   2 )

(2.255  2.140)  (0.0)
 0.465 H1 : 1   2
s12 s 22 1 1

 677.23
n1 n 2 15 15

Ret bölgesi
Kabul
 = 0.05
bölgesi

0 z  1.65

zh =0.465 < (z)t= 1.65, H0 hipotezi kabul. 18


Standart Sapma İle İlgili Testler

 a) H0: σ = σ0 Hipotezinin Testi


«Dağılımın ana kütlesinin standart sapmasının belirli bir 0
değerine eşit olup olmadığının testi»

2 Testi kullanılır

  anlamlılık düzeyi seçilir

 2hesap (2h) değeri;

(N  1) *Sx 2 (N  1) * 0 2
Sx  0 ise  2 h  ; Sx  0 ise  2 h 
0 2
Sx 2

19
Standart Sapma İle İlgili Testler

 a) H0: σ = σ0 Hipotezinin Testi


H 0 :   0
(N  1) *Sx 2 (10  1) *1.22 H1 :    0
 2
   12.96
0
h 2 2
1
İki uçlu test
 2tablo (2t): N-1=9 serbestlik derecesine ve /2=0.05/2=0.025’ye
göre tablodan okunur.

20
Standart Sapma İle İlgili Testler

 a) H0: σ = σ0 Hipotezinin Testi


H 0 :   0
(N  1) *Sx 2 (10  1) *1.22 H1 :    0
 2
   12.96
0
h 2 2
1

Ret bölgesi
Kabul
 /2 = 0.025
bölgesi

0 2/2  19.02

2h =12.96 < (2/2)t= 19.02, H0 hipotezi kabul. 21


Standart Sapma İle İlgili Testler

 a) H0: σ = σ0 Hipotezinin Testi H 0 :   0 H 0 :   0


veya H1 :   0
H1 :   0
(N  1) *Sx 2 (10  1) *1.22
 2
   12.96 Bir uçlu test
0
h 2 2
1

 2tablo (2t): N-1=9 serbestlik derecesine ve =0.05’ye göre


tablodan okunur.

22
Standart Sapma İle İlgili Testler

 a) H0: σ = σ0 Hipotezinin Testi H 0 :   0 H 0 :   0


veya H1 :   0
H1 :   0
(N  1) *Sx
2
(10  1) *1.2
2
 2
   12.96
0
h 2 2
1

Ret bölgesi
Kabul
 = 0.05
bölgesi

0 2  16.92

2h =12.96 < (2)t= 16.92, H0 hipotezi kabul. 23


Standart Sapma İle İlgili Testler

 b) H0: σ1 = σ2 Hipotezinin Testi


«İki ayrı ana kütlenin standart sapmalarının (varyans) eşit olup
olmadığının testi»

Fisher (F) Testi kullanılır

 her iki ana kütleden N1 ve N2 büyüklüğünde örnekler alınır.

 bu örneklerin standart sapmaları (S1 ve S2) hesaplanır

 Fhesap (Fh) değeri;

S12 S2 2
S1  S2 ise Fh  2 ; S2  S1 ise Fh  2
S2 S1
24
Standart Sapma İle İlgili Testler

 b) H0: σ1 = σ2 Hipotezinin Testi


H 0 : 1   2
H 0 : 1   2 H 0 : 1   2
H1 : 1   2 veya
H1 : 1   2 H1 : 1   2

Bir uclu test için İki uclu test için


S12 S12
F  2  F F  2  F/2
S2 S2 25
Standart Sapma İle İlgili Testler

 b) H0: σ1 = σ2 Hipotezinin Testi H 0 : 1   2


m  N1  1  10; n  N 2  1  12; ve   0.10 için H1 : 1   2
Tablodan F /2,kritik  2.75
s12 0.025
Fh  2   1.47
s 2 0.017
(n;
Paydanın
serbestlik derecesi ) (m; payın serbestlik derecesi)

26
Standart Sapma İle İlgili Testler

 b) H0: σ1 = σ2 Hipotezinin Testi H 0 : 1   2


m  N1  1  10; n  N 2  1  12; ve   0.10 için H1 : 1   2
Tablodan F /2,kritik  2.75
s12 0.025
Fh  2   1.47
s 2 0.017

Ret bölgesi
Kabul
bölgesi /2 = 0.05

F
0 Fh = 1.47 F/2  2.75

Fh =1.47 < (F/2)t= 2.75, H0 hipotezi kabul. 27


Problem Çözümü

Doç. Dr. Adem AKPINAR


Yararlanılan Kaynaklar
• İstatistik Ders Notları, Karadeniz Teknik Ü., Murat İhsan Kömürcü, Ömer Yüksek,
Murat Kankal

• Mühendisler İçin İstatistik, Birsen Yayınevi, Mehmetçik Bayazıt, E. Beyhan Yeğen


Oğuz

29
Olasılık Dağılım
Testleri

Doç. Dr. Adem AKPINAR


Olasılık Dağılım Testleri

 Olasılık Dağılımına Uygunluk testi, örnek verisinin belli bir olasılık


dağılımına uygun olup olmadığını görmek için sıklıkla
kullanılmaktadır.

 Olasılık dağılımları belirsizliği ele almak için bir araç olarak


incelenebilir:

 ancak, yanlış bir araç kullanılırsa yanlış sonuçlar elde


edilebilir.

 Uygun olmayan bir dağılım seçilir ve uygulanırsa takip eden


hesaplamalar doğru olmayacaktır ve kesinlikle yanlış kararla
sonuçlanacaktır. 2
Olasılık Dağılım Testleri

 Çoğu durumda, gözlemlere iki veya daha fazla dağılım


uydurulabilir, sonuçlar kıyaslanabilir ve en doğru model seçilebilir.

 Uydurulan aday dağılımlar olasılık verisinin yapısına bağlı


seçilebilir.

 Örneğin;

teknik araçların arızaları arasında zamanı analiz etmek istenirse


zamana bağımlı arıza durumu negatif olamayacağından

Gözlem verisine negatif olmayan dağılımlar (Eksponansiyel ve


Weibull) uydurulmalıdır.

3
Olasılık Dağılım Testleri
 Dağılımlar örnek verisine uydurulduktan sonra, seçilen dağılımların
örnek verisine ne kadar iyi uyum sağladığını belirlemek gereklidir.
 Bu, belli olasılık dağılımına uygunluk testleri (goodness-of-fit tests)
kullanılarak veya ampirik (örnek verisine dayanarak) ve teorik
(uydurulmuş) dağılım grafikleri görsel olarak kıyaslanarak
yapılabilir.
 Sonuç olarak, veriyi tanımlayan en doğru model seçilecektir.
 Gözlemlerin bir dağılıma uygunluğunu test etmek için en çok kullanılan
yöntemler:

 Ki-Kare testi

 Kolmogorov-Smirnov testi
4
 Olasılık Çizgisi Korelasyon testi (PPCC)
Olasılık Dağılım Testleri (2 testi )
 Ki- Kare testi, bir örnek verisinin belli bir dağılıma sahip bir ana
kütleden gelip gelmediğini test etmek için kullanılır.

 Ki-Kare testi,

H0 (sıfır hipotezi) : örnek verisi belli bir dağılıma uymaktadır

Ha (alternatif hipotez): örnek verisi belli bir dağılıma uymamaktadır

hipotezleri için daima tanımlanmaktadır.


 Sürekli veri için N elemanlı örnek verisi m sınıfa ayrılmakta ve test
istatistiği aşağıdaki gibi tanımlanmaktadır.
 her bir sınıfta gözlenmiş eleman sayısı Oi, m
 (Oi  ei ) 2 
 seçilen dağılımla tahmin edilmiş eleman sayısı
2h   
i 1  e i 
ei 5
Olasılık Dağılım Testleri (2 testi )

 Hesaplanan 2h değeri,  anlamlılık düzeyi için, 2t tablo değerinden

küçükse veya eşitse (2h <= 2t ise) uygunluk var, büyükse uygunluk
yok, 2h = 0 ise tam uygunluk var demektir.

 serbestlik derecesi m-r-1'dir.


 m; sınıf sayısıdır.
 r değerleri, dağılımın örnek
verisinden tahmin edilen parametre
sayısına bağlıdır:
 Poisson Dağılımı: 1 (λ ‘dan dolayı),
 Binom Dağılımı: 0,
 Normal Dağılım: 2 (μ ve σ ‘dan dolayı)
 Üniform Dağılım: 2 (min ve max
değerden dolayı)
6
 Eksponansiyel Dağılım: 1 (λ ‘dan dolayı)
Olasılık Dağılım Testleri (2 testi )

Normal Dağılım için Ki-Kare Testi:


 Ölçümlerin, ortalaması 50 ve standart sapması 15 olan bir normal
dağılıma uygun olup olmadığının testi:

 Süreç:
 Örnek verisini al.
 Örnek verisini sınıflara ayır

(her sınıftaki tahmini frekans sayısı


%80 ihtimalle 5’ten fazla olmalı)
 Tahmini grup frekansları ile gerçek grup frekanslarını kıyasla

7
Olasılık Dağılım Testleri (2 testi )

 Örnek verisi ve sınıflandırılmış değerler:

150 örnek Sınıf Frekans


ölçüm 30’dan küçük 10
80 30 - 40 21
65 40 - 50 33
36
50 - 60 41
66
50 60 - 70 26
38 70 - 80 10
57
80 - 90 7
77
59 90’dan büyük 2
…vd… TOPLAM 150

8
Olasılık Dağılım Testleri (2 testi )

 μ = 50 ve σ = 15 olan bir normal dağılım için bu sınıfların tahmini


frekansları nedir?
Tahmini
Sınıf Frekans (oi) Frekans (ei)
30’dan küçük 10
30 - 40 21
40 - 50 33 ?
50 - 60 41
60 - 70 26
70 - 80 10
80 - 90 7
90’dan büyük 2
TOPLAM 150 9
Olasılık Dağılım Testleri (2 testi )

Tahmini μ=50, σ=15 olan bir


normal dağılımdan
Değer P(X < Değer) Frekans (ei)
n=150 olan örnek için
30’dan küçük 0.09121 13.68 tahmin edilmiş
30 - 40 0.16128 24.19 frekanslar
40 - 50 0.24751 37.13
Örnek:
50 - 60 0.24751 37.13
 30  50 
60 - 70 0.16128 24.19 P(x  30)  P  z  
 15 
70 - 80 0.06846 10.27  P(z  1.3333)
80 - 90 0.01892 2.84  0.0912
90’dan büyük 0.00383 0.57
TOPLAM 1.00000 150.00 ei=(0.0912)(150)  13.68

10
Olasılık Dağılım Testleri (2 testi )

Gözlenmiş
Frekans Tahmini Test istatistiği;
Sınıf (oi) frekans (ei)
( o  e ) 2
30’dan küçük 10 13.68 2   i i

30 - 40 21 24.19
ei
40 - 50 33 37.13
50 - 60 41 37.13
60 - 70 26 24.19  h 2   2t
ise
10
70 - 80 10.27  H0 reddedilir
80 - 90 7 2.84
90’dan büyük 2 0.57
serbestlik derecesi
TOPLAM 150 150.00
m-r-1=8-2-1=5
11
Olasılık Dağılım Testleri (2 testi )

H0: gözlemler, μ = 50 ve σ = 15 olan bir


normal dağılıma uymaktadır.
HA: gözlemler bu dağılıma uygun değildir.

(oi  ei ) 2 (10  13.68)2 (2  0.57)2


h 2
   ...   12.097
ei 13.68 0.57
8 sınıf var, O halde d.f.=8-2-1=5

(2.05 )= 11.07
Sonuç: =.05
2 = 12.097 > 2 = 11.07
0 2
Bu yüzden, H0 reddedilir. H0 kabul edilir H0 Reddedilir

2.05 = 11.07 12
Problem Çözümü

Doç. Dr. Adem AKPINAR


Yararlanılan Kaynaklar
• İstatistik Ders Notları, Karadeniz Teknik Ü., Murat İhsan Kömürcü, Ömer Yüksek,
Murat Kankal

• Mühendisler İçin İstatistik, Birsen Yayınevi, Mehmetçik Bayazıt, E. Beyhan Yeğen


Oğuz

14
Regresyon Analizi

Doç. Dr. Adem AKPINAR


Regresyon Analizi

 Regresyon: değişkenler arasındaki ilişkileri bulmak için kullanılan


bir istatistiksel prosedürdür.

 Regresyon analizinde; açıklanması denenen bağımlı bir değişken


ve bağımlı değişkenle ilişkili olan bir veya birden fazla bağımsız
değişken mevcuttur.

Bağımlı değişken (y)


 Örneğin, betonun dayanımı
ile çimento oranı; bir
havzadaki yağış ile akış
arasındaki ilişkiler…

Bağımsız değişken (x) 2


Regresyon Analizi

 Bir regresyonun çıktısı, bağımsız değişkenlerin değerlerine


dayanarak bağımlı değişkeni tahmin eden bir fonksiyondur.

 Basit Doğrusal Regresyon: basit regresyon veriye düz bir çizgi


uydurmaktadır.
Bağımlı değişken (y)

Bağımsız değişken (x) 3


Regresyon Analizi

 Basit doğrusal regresyon fonksiyonu her bir gözlem noktası için bir
tahmin verecektir.
Bağımlı değişken (y, y’)

Gözlem: y

Tahmin:y’

Bağımsız değişken (x)

4
Regresyon Analizi

Tahmin hatası: ε

Gözlem: y
Tahmin:y’

5
Regresyon Analizi

 Basit Doğrusal Regresyon Denklemi:

ve olduğundan

 y: gerçek değerler (mavi noktalar)

 y’: tahmin edilen değerler (mavi noktalara karşılık kırmızı çizgi üzerinde okunan noktalar) 6
Regresyon Analizi

 Korelasyon analizi: değişkenler arasında bir ilişkinin olup


olmadığını belirlemektedir. -1 < r <+1

r=0

y y y
r = -1 r=0
r = +1

x x x
Regresyon Analizi

 Korelasyon katsayısı: doğrusal bağımlılığın bir ölçüsüdür.

Pearson Korelasyon katsayısı (r):


n

 ( x  x )( y
i 1
i i  y)

rˆ 
cov ariance( x, y )
 n 1
n n
var x var y
 ( xi  x )
i 1
2
 i
( y
i 1
 y ) 2

n 1 n 1

8
Regresyon Analizi

Doğru ve güvenilir bir regresyon modelinde amaç, gerçek


gözlem değeri ile tahmin değeri arasında fark olmaması yada
farkın minimum olmasıdır. Bunun için çeşitli tahmin yöntemleri
geliştirilmiştir. Bu yöntemlerden biri “En Küçük Kareler”
kriteridir.

Bu yöntem, çizgi ve noktalar arasındaki farkların karelerinin


toplamını en aza indirgeyen düz bir çizgi üretmektedir.

9
Regresyon Analizi

Bu farklar hatalar
olarak
adlandırılmaktadır.

10
Regresyon Analizi

 En Küçük Kareler Çizgisi için b1 ve b0


katsayıları…

11
Regresyon Analizi

İstatistik

Veri Bilgi
Veri Noktaları:

x y
1 6
2 1
3 9
4 5
5 17
6 12 y' = .934 + 2.114x
12
Regresyon Analizi

2
X Y X - Xbar Y - Ybar (X-Xbar)*(Y-Ybar) (X - Xbar)
1 6 -2.500 -2.333 5.833 6.250
2 1 -1.500 -7.333 11.000 2.250
3 9 -0.500 0.667 -0.333 0.250
4 5 0.500 -3.333 -1.667 0.250
5 17 1.500 8.667 13.000 2.250
6 12 2.500 3.667 9.167 6.250
Toplam:
Sum = 21 50 0.000 0.000 37.000 17.500

Xbar = 3.500
Ybar = 8.333
sxy = 7.400 37.00/(6-1)
sx 2 = 3.500 17.5/(6-1)
b1 = 2.114 7.4/3.5
b0 = 0.933 8.33 - 2.114*3.50 13
Regresyon Analizi

 Standart Hata için Kareler Toplamı:

 Standart Hata:

Standart hata sıfır ise, bütün noktalar regresyon çizgisi üzerine


denk gelmektedir.

Hata küçükse lineer model mükemmeldir ve kullanılmalıdır,

hata büyükse model kötü demektir. 14


Regresyon Analizi

 Standart Hata:

 Determinasyon Katsayısı:

İlişkinin gücünü ölçmek için kullanılır.


N

 (y i  y ') 2 y‘: tahmin


R 2  r 2 veya R 2  1  i 1
N
y: gözlem
 i
(y
i 1
 y) 2

15
Regresyon Analizi

 Determinasyon Katsayısı:

16
Regresyon Analizi

 Çok Değişkenli Doğrusal Regresyon:


Birden fazla bağımsız değişken içeren regresyon modelidir

k
y '  b 0  b1x1  b 2 x 2  ....  b k x k  b 0   b i x i
i 1

Bağımsız değişken sayısının 2 olması halinde (k=2),

y'  b0  b1x1  b2 x2

17
Regresyon Analizi

 Çok Değişkenli Doğrusal Regresyon:


Regresyon katsayılarının En Küçük Kareler Tahmini (Normal Denklemler):

y'  b0  b1x1  b2 x 2
Regresyon denklemi önce bütün değerler için oluşturulur ve toplanırsa,

1.Normal Denklem:  y'  N*b 0  b1 *  x1  b2 *  x 2


18
Regresyon Analizi

 Çok Değişkenli Doğrusal Regresyon:


Regresyon katsayılarının En Küçük Kareler Tahmini (Normal Denklemler):

y '* x1  b0 * x1  b1 * x12  b2 * x 2 * x1
sonra b1'in katsayısı x1 ile oluşturulan bütün denklemler çarpılıp toplanırsa,

2. Normal Denklem :  y '* x 1   x1 * b0  b1 *  x12  b2 *  x 2 * x1


19
Regresyon Analizi

 Çok Değişkenli Doğrusal Regresyon:


Regresyon katsayılarının En Küçük Kareler Tahmini (Normal Denklemler):

y '* x 2  b0 * x 2  b1 * x1 * x 2  b 2 * x 2 2
sonra b2'in katsayısı x2 ile oluşturulan bütün denklemler çarpılıp toplanırsa,

3. Normal Denklem :  y '* x 2   x 2 * b0  b1 *  x1 * x 2  b 2 *  x 2 2


20
Regresyon Analizi

 Çok Değişkenli Doğrusal Regresyon:


Regresyon katsayılarının En Küçük Kareler Normal Denklemleri:

 y'  N*b 0  b1 *  x1  b2 *  x 2

 y '* x 1   x1 * b0  b1 *  x12  b 2 *  x 2 * x1

 y '* x 2   x 2 * b0  b1 *  x1 * x 2  b2 *  x 2 2

 Bu üç denklem çözülerek, bilinmeyen b0, b1 ve b2 katsayıları belirlenir ve


regresyon denklemi bulunmuş olur

21
Regresyon Analizi

 Çok Değişkenli Doğrusal Regresyon:

0.5
 S
2  e 2
  y  y '
2
Çoklu korelasyon katsayısı: R  1  2e  Se 
2

 S  N  K 1 N  K 1
 y 

y’ : hesaplanan tahmini değerler

y : gerçek değerler

Sy2 : ygerçek değerlerinin varyansı

K: değişken sayısı

N: veri sayısıdır
22
Regresyon Analizi

 Doğrusal Olmayan Regresyon:

Polinom fonksiyon
y '  b0  b1x  b2 x 2  b3 x 3  ...  bK x K

K=2 olması durumunda polinom “parabol” adını alır:

y'  b0  b1x  b2 x 2

x1=x ve x2=x2 değişken dönüşümleri yapılırsa denklem

y'  b0  b1x1  b2 x2

23
Regresyon Analizi

 Doğrusal Olmayan Regresyon:

Üstel fonksiyon
y  abx
Denklemi doğrusallaştırmak için her iki tarafın logaritması alınırsa;

log y  log a  x log b

Y=logy, A=loga ve B=logb dönüşümleri yapılırsa denklem


doğrusal denkleme dönüşür:

Y  A  Bx
Önce A ve B, sonra da ters logaritmayla (a=10A ve b=10B) a ve b katsayıları
bulunur
24
Regresyon Analizi

 Doğrusal Olmayan Regresyon:

y  ax b
Hiperbolik fonksiyon

log y  log a  b log x


Y=logy, A=loga ve X=logx dönüşümleri yapılırsa denklem
doğrusal denkleme dönüşür:

Y  A  bX
önce A ve b bulunur, sonra da ters logaritmayla (a=10A ) bulunur

25
Regresyon Analizi

 Doğrusal Olmayan Regresyon:

1
y Geometrik fonksiyon
a  bx
1
 a  bx
y
Y=1/y dönüşümü yapılırsa denklem
doğrusal denkleme dönüşür:

Y  a  bx
Bu denklemden a ve b katsayıları bulunur

26
Yararlanılan Kaynaklar
• Biyoistatistik Ders Notları, Ankara Ü., Sibel A. Kemaloğlu, Esin K Babacan

• İstatistik Ders Notları, Dokuz Eylül Ü.

• İstatistik Ders Notları, Celal Bayar Ü., Emre Yalamaç

• Olasılık ve İstatistik Ders Notları, İstanbul Teknik Ü., Mehmet Özger

• İstatistik Ders Notları, Balıkesir Ü., Banu Yağcı

• Mühendislikte İstatistik Yöntemler Ders Notları, Erciyes Ü., Murat Çobaner


• İstatistik Ders Notları, Karadeniz Teknik Ü., Murat İhsan Kömürcü, Ömer Yüksek,
Murat Kankal

27

You might also like