Mat271 Final 2020-2021

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 3

MAT271 –İSTATİSTİK FİNAL ÖDEVİ

BİRİNCİ KISIM:
1. Popülasyon olarak kullanacağınız en az 100 elemanlı bir veri seti bulunuz, tanımını
yazınız ve veriyi tablolaştırınız.
Örnek:
Veri
Değer
No
1 3
2 2.2
3 4
.
.
.
100 7.8

2. Verinin saçılma diyagramını çiziniz ve frekans dağılımını görmek için histogramını


çizdiriniz. Histogram ne tür bir dağılıma benzelik göstermektedir? Belirtiniz.

Örnek:

3. Veri setinin tanımlayıcı bazı önemli parametreleri hesaplayın ve tablolaştırın.


Örnek:

Std. Min. Maks. Çeyrek


Veri tipi N Ortalama Varyans Mod Medyan Ranj Çarpıklık Sivrilik
sapma değer değer kayma

Sürekli/kesikli 100

Dikkat: İlk yukarıdaki 3 maddeyi herhangi bir bilgisayar programı (Excel, Matlab vs.)
kullanarak yapabilirsiniz. Bundan sonraki maddeler elde çözülecek ve grafikleri de elde
çizilecektir.

4. Rastgele seçme metotlarından uygun olanını kullanarak ve belirterek, rastgele


olmak üzere yukardaki veri setinizden, küçük (n<30) ve büyük (n≥30) örnekler alınız.
Listeleyiniz. Bunların tanımlayıcı istatistiklerini hesaplayıp, madde 3’teki gibi iki tablo
halinde tablolaştırınız. (Buradaki istatistik tablolarını bilgisayarda hesaplayabilir ve
oluşturabilirsiniz. Yalnız sonuçları gözden geçirin mantıksızlık olmasın)
5. Kendi seçtiğiniz bir istatistiğe ait (örneğin; ortalama, standart sapma, oran…), %95 ve
%99 güven seviyeleri için yukarıda belirlediğiniz küçük ve büyük örnek gruplarının üst
ve alt güven limitlerini hesaplayınız.
6. Hem küçük hem de büyük örneklerinizden bulduğunuz istatistiklerin popülasyonu her
iki güven seviyesi için nasıl temsil ettiğini bir/birkaç cümlede yorumlayınız.
7. Popülasyona yani başlangıçtaki veri setinize ait bir hipotez yaratınız. (Boş hipotez
veya sıfır hipotezi) Alternatif hipotezinizi belirtiniz. Hipotez olarak sunacağınız şey
ortalama, varyans, oran, ortalamaların farkı veya oranların farkı olabilir.
Ortalamaların farkı kullanacakların örneklerini ikişer tane yaratmaları gerekmektedir.
8. Büyük ve küçük örneklerinizi kullanarak hipotezinizi 0.01 ve 0.005 anlamlılık seviyesi
için test ediniz. Hipoteziniz bu iki anlamlılık seviyesi için kabul edilebilir mi? Yoksa red
mi edilmelidir?
9. Her iki örneğinizle iki anlamlılık seviyesi için yaptığınız test sonuçlarını grafik üzerinde
kabul ve red bölgelerini belirterek gösteriniz.
10. Grafik üzerinde gösterdiğiniz sonuçları yorumlayarak hipotez için bir karara ve sonuca
varınız ve bunu birkaç kelime ile belirtiniz.

Hipotez için örnek iddialar:


• Erkekler kadınlara göre sigara içmeye daha çok meyillidir. Burada sadece sigara içen
iki grup ele alınacaktır. Başarı erkeklerin oranı olarak tanımlanır. Bir oranı test
ediyoruz ve orijinal iddia p= 0,6 olarak yazılabilir.
• Kadınlar erkeklerden 5 yıl daha fazla yaşarlar. Bu, iki ortalama hakkında bir iddiadır
ve kadın ve erkek olarak iki grup vardır. Buradaki orijinal iddia 5 olarak yazılabilir. (Her
iki grubun ortalama ömrünün arasında fark μ = 5 olarak yazılır.)
• Pazartesileri okula gelmeyen öğrenci sayısı Cuma gelmeyenlerden daha fazladır. Bu
iki örnekli bir test gerektirir. μp > μc olup, olmadığı test edilir.
• Amerikan vatandaşlarının %35’i Trump’ın ülkenin ekonomik şartlarını daha
iyileştireceğini düşünmektedir. Burada başarı olarak p = 0.35 belirlenir ve rastgele
seçilmiş vatandaşlar için bu oran test edilir.
• Asyalılar Avrupalılardan daha çok felçten ölürler. Burada Asyalı ve Avrupalı diye iki
grupla çalışılır ve bunların felçten ölme oranları test edilir. pasya > pavrupa.

Bunun gibi daha pekçok konuda veri bulup, iddialar oluşturabilirsiniz. Bunlar arabalar, spor
dalları, yemekler vs gibi ilgi alanınıza giren konular, bölümünüzle ilgili bilimsel konular,
siyaset veya sağlık ile ilgili konular olabilir. Önemli olan gerçekçi bir veri seti bulmanızdır.
İnternetten veri bulabileceğiniz bazı linkler:

1. http://www.statsci.org/datasets.html
2. http://college.cengage.com/mathematics/brase/understandable_statistics/7e/stude
nts/datasets/svls/frames/frame.html
3. http://www.childinfo.org/statistical_tables.html
4. https://dreamtolearn.com/doc/2HDNJH3XJU6CVGKZ7SDM4MCSW
5. http://www.tuik.gov.tr/PreTabloArama.do?metod=search&araType=vt
6. http://ideam.gazi.edu.tr/posts/view/title/istatistiksel-veri-kaynaklari-150234?siteUri=ideam

İKİNCİ KISIM:
A. Aralarında ilişki olup, olmadığını test edeceğiniz iki değişken bulunuz. Verilerin
saçılma diyagramlarını çizdikten sonra uyduracağınız eğriye ait regresyon denklemini
oluşturunuz.
B. Bu iki değişken arasındaki korelasyonu Pearson Momentler Çarpımı ile hesaplayınız.
Bu ilişkinin 0.05 anlamlılık seviyesi için anlamlı olup, olmadığını test ediniz.
C. Determinasyon katsayısını de belirterek ilişkiyi yorumlayınız.
D. Elinizdeki ilk değişken (X) sürekli bir veri ise, diğer değişkeni mümkünse iki kategoriye
ayırın. Mesela nem ve sıcaklık ilişkisine bakıyorsunuz. Sıcaklığı 15 derecenin altı ve 15
derecenin üstü diye iki kategoriye ayırabilirsiniz. Ya da yaşlarla ilgili bir değişkeni 20
yaş altı ve 20 yaş üstü diye iki kategori yaratabilirsiniz. Veya 20-30 yaş arasında olan
ve olmayan diye iki kategori oluşturabilirsiniz. İki kategori yaratamıyorsanız yeni bir
veri seti bulup, onunla devam edin. Çift serili korelasyon katsayısını hesaplayın ve bu
ilişkinin 0.05 anlamlılık seviyesi için anlamlı olup, olmadığını test ediniz.

You might also like