Hafta Gruplararası Ve Grupiçi Karşılaştırma Yöntemleri

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 10

GRUPLARARASI VE GRUPİÇİ KARŞILAŞTIRMA

YÖNTEMLERİ
Uzm. Derya ÖZTUNA –
Yrd. Doç. Dr. Atilla Halil ELHAN

1. ÖNEMLİLİK (HİPOTEZ) TESTLERİ

Önemlilik testleri, araştırma sonucunda elde edilen değerlerin ya da varılan sonuçların


istatistiksel olarak önem taşıyıp taşımadığını bir diğer deyişle anlamlı olup olmadığını test etmek için
başvurulan yöntemlerdir.

Hipotez testlerinin amacı; araştırmacılara evrenden çekilen örneklem(ler) yardımıyla evren


hakkında bir karara varma konusunda yardımcı olmaktır.

 Önemlilik testlerinden elde edilen sonuçlara göre bazı kararlara varıldığı için önemlilik
testlerinin doğru ve uygun olarak seçilmesi çok önemlidir.

1.1. Önemlilik Testleri Hakkında Genel Bilgiler

1.1.1.Hipotezler
Önemlilik testleri hipotezleri test etmek için yapılır. Bu yüzden bazen önemlilik testi yerine
“hipotez testi” de denmektedir.
 İstatistiksel hipotezler örneklemlerin çekildiği evren parametreleri ile ilgili önermelerdir.

İstatistikte kullanılan iki tür hipotez vardır.

H0 Farksızlık hipotezi, Sıfır hipotezi, Yokluk hipotezi


H1 Alternatif hipotez, Seçenek hipotez

Test sonucunda H0 kabul edilirse H1 ret edilir. H0 ret edilirse H1 kabul edilir.

Hipotezler tek yönlü (one-sided) ya da çift yönlü (two-sided) olarak kurulabilir.

Tek yönlü hipoteze örnek;


H0: µ =20 ya da H0: µ =20
H1: µ <20 H1: µ >20

İki yönlü hipoteze örnek;


H0: µ =20
H1: µ ≠ 20

Örneğin;
H0= İki grubun ortalaması arasında fark yoktur.
Yaş ve boy değişkenleri ilişkisizdir.
A ilacı ile B ilacının iyileştirme yüzdeleri arasında fark yoktur.

H1=İki grubun ortalaması farklıdır.


Yaş ve boy değişkenleri ilişkilidir.
A ilacı ile B ilacının iyileştirme yüzdeleri arasında fark vardır.

α)
1.1.2. Yanılma Düzeyi/Önemlilik Seviyesi (α

Tablo1: Araştırma ve Evren Sonuçlarına İlişkin Çapraz Tablo


GERÇEK (Evren)
ARAŞTIRMA SONUÇLARI
Tedaviler Tedaviler farklı
(Örneklem)
farklıdır değildir
Tedaviler farklıdır Doğru Tip I Hata
(1-β ) (α )
Tedaviler farklı değildir Tip II Hata
Doğru
(β )

Yanılma düzeyi / Önemlilik seviyesi, doğru sıfır hipotezinin reddedilmesi (Tip I hata) olup
buna α denir ve genellikle 0.05 olarak alınır.

Gerçekte bir fark olduğu halde yapılan araştırma sonucunda bir fark bulunmamasından
kaynaklanan Tip II hatanın oluşma ihtimalini belirten değere de beta seviyesi denir. Tip II hata yapma
olasılığı genellikle 0.20 olarak alınır. Yani araştırma sonucunda gerçekte olan bir farkı atlama şansı
1/5 oranındadır.

1-Beta= Testin Gücünü ifade eder.


1.1.3. P Değeri
P,
gruplar arasında fark vardır, ya da ilişki vardır derken yapılan hata miktarı,
Ho hipotezi doğru iken onu yanlışlıkla reddetme olasılığı,
evrende olmayan ve örneklemde gözlenen ilişki ya da farklılığın tamamen şans eseri olarak
ortaya çıkma olasılığı

olarak tanımlanabilir.

Örneğin;
30 kişilik bir çalışmada kilo ile kolesterol düzeyi arasındaki ilişki r=0.70 ve p=0.02 olarak
bulunsun. Aslında kitlede (yani gerçekte) r=0 iken r’nin şans eseri olarak 0.70 çıkma olasılığı 0.02’dir.

Burada iki olasılık mümkündür.


1- Gerçekten şans eseri olarak r=0.70 olarak bulunmuştur.
2- H0 hipotezi doğru değildir. Gerçekte ilişki anlamlıdır.

P değeri istatistiksel testin uygulanmasından sonra elde edilir. Paket programların tümü sonuç
aşamasında elde edilen test istatistiklerine ilişkin p değerini direkt olarak verir.

p>0.05 Gruplar arasında fark yoktur.

p<0.05
p<0.01 Gruplar arasında fark vardır.
p<0.001
1.2. Önemlilik Testlerinin Seçiminde Kullanılan Kriterler

Önemlilik testleri en genel anlamda ikiye ayrılır:

1- Parametrik testler
2- Parametrik olmayan testler

Parametrik testlerde ham veriler üzerinden ortalama, varyans gibi ölçütler elde edilerek
işlemler yapılır. Parametrik olmayan testlerde ise ham veriler sıralanır ve sıra numaraları verilir.
İşlemler bu sıra numaraları üzerinden yapılır.

Parametrik testler, parametrik olmayan testlere göre daha güçlü testlerdir. Fakat
kullanılabilmeleri için bazı varsayımların sağlanması gerekir.

Uygun test seçimi aşağıdaki durumlara bağlıdır:

1- Verilerin ölçüm biçimi

Verilerin ölçüm biçimi kullanılacak testin seçimini etkileyen en önemli faktörlerden biridir.
Sunumumuzda testlerin sınıflaması sayımla (nitel) ve ölçümle (nicel) belirtilen değişkenler
için ayrı ayrı yapılmıştır.

Tablo 2: Değişken Türleri


Nitel veriler
Sınıflanabilir nitel veri (Nominal) Sıralanabilir nitel veri (Ordinal)
Kan grupları Eğitim Durumu
1: 0 grubu 1: Okur-yazar değil
2: A grubu 2: İlköğretim
3: B grubu 3: Lise
4: AB grubu 4: Üniversite
5: Yüksek lisans/Doktora
Nicel veriler
Sürekli nicel veri (Metric Continuous) Kesikli nicel veri (Metric
Discrete)
Kan basıncı, boy, kilo, yaş, hemoglobin Çocuk sayısı, geçirilen operasyon
düzeyi sayısı,
Haftada geçirilen astım krizi sayısı

2- İncelenen grupların bağımlı ya da bağımsız olması

İncelenen grupların bağımsız olması grupların ayrı bireylerden oluşması bir diğer deyişle bir
grupta bulunan bir deneğin diğer grupta bulunmaması demektir. Örneğin kadın ve erkeklerde açlık kan
şekeri düzeylerini karşılaştırırken gruplar bağımsızdır.

Bir denek üzerinde birden çok gözlem yapıldığında gruplar bağımlı olur. Örneğin;
kadınlarda açlık kan şekeri ve tokluk kan şekeri düzeyleri karşılaştırılırken gruplar bağımlıdır.
Bağımlılık için bir başka örnek şöyledir. İki doktorun teşhis tutarlılığını ölçmek için aynı hastaların
her iki doktor tarafından muayene edilmesi durumunda gruplar bağımlı olur.
3-Verilerin Dağılımı - Normal Dağılım

İstatistiksel analiz yapılırken dağılımın özelliği çok önemlidir. Çünkü parametrik testlerin
uygulanabilmesi için dağılımın normal ya da normale yakın olması gerekir.

Genellikle
ölçümle elde edilen sürekli veriler normal dağılıma uyma eğilimi gösterirler.
Ancak ölçüm biçimi sıralanabilir nitel olan bir değişkenin kategori sayısı altıdan büyükse ve denek
sayısı yeterliyse normal dağılıma uyma ihtimali büyüktür.

Normal Dağılım

25

20
Frekans

15

10

0
0

0
,0
0

2,

4,

6,
8,

10

-1

-1

-1
1-

1-

,1

,1

,1
6,

8,

10

12

14

Hemoglobin Düzeyi

Grafik 1: Hemoglobin Düzeylerinin Frekans Dağılımı

Hemoglobin düzeyi ölçümlerine ait yukarıdaki histogram incelendiğinde, ölçümlerin büyük


bir bölümünün ortalama etrafında yoğunlaştığı ve ortalamadan uzaklaştıkça frekans sayılarının
azaldığı görülür.

Sürekli nicel veri tipinde olan değişkenlerin çoğu (özellikle denek sayısı arttıkça) bu tür bir
dağılım gösterme eğilimindedir. Şekil olarak “çan”a benzeyen ve simetrik bir yapıya sahip olan bu tür
dağılıma “normal dağılım ” denir.

4- Örneklem büyüklüğü

Gruplardaki denek sayısı arttıkça kullanılan testin gücü ve güvenilirliği artar.


Gruplardaki denek sayısı fazla ise verilerin normal dağılıma uyma ihtimali artar dolayısıyla
Parametrik test kullanma şansı artmış olur. Gruplardaki denek sayısı az olduğunda ise (30’un altında)
genellikle parametrik olmayan testler tercih edilir.
VERİ ÖLÇÜMLE(NİCEL) ELDE EDİLDİĞİNDE VE GRUPLAR BAĞIMSIZ OLDUĞUNDA;

Veri tipi: Ölçüm

Grupların bağımlılık durumu: Bağımsız

Karşılaştırılacak grup sayısı: İki Karşılaştırılacak grup sayısı: Üç ya da daha fazla

Parametrik test Parametrik test Parametrik test Parametrik test


varsayımları varsayımları varsayımları varsayımları
sağlanmadığında sağlandığında sağlanmadığında sağlandığında

Mann Whitney İki ortalama Kruskal Wallis Varyans Analizi


U testi arasındaki Varyans Analizi
farkın önemlilik testi
(Student's t test)

VERİ ÖLÇÜMLE (NİCEL) ELDE EDİLDİĞİNDE VE GRUPLAR BAĞIMLI OLDUĞUNDA;

Veri Tipi : Ölçüm

Grupların bağımlılık durumu: Bağımlı

Karşılaştırılacak grup sayısı: İki Karşılaştırılacak grup sayısı: Üç ve daha fazla

Parametrik test Parametrik test Parametrik test Parametrik test


varsayımları varsayımları varsayımları varsayımları
sağlanmadığında sağlandığında sağlanmadığında sağlandığında

Wilcoxon Testi İki eş arasındaki Friedman Testi Tekrarlı ölçümlerde


farkın önemlilik testi Varyans analizi
(Paired t test)

VERİ SAYIMLA(NİTEL) ELDE EDİLDİĞİNDE;


Grupların bağımlılık durumu: Bağımsız Grupların bağımlılık durumu:
Bağımlı

Karşılaştırılacak grup sayısı: İki Karşılaştırılacak grup sayısı: Üç + Karşılaştırılacak grup sayısı: İki
(2x2) (nx2),(2xm),(nxm) (2x2)

Beklenen değer Beklenen değer Ki-Kare testi


5'den 5'den Mc Nemar Testi
büyükse küçükse

Ki-kare testi veya Fisher Exact


iki yüzde arasındaki
farkın önemlilik testi test

Aşağıdaki hipotezleri test etmek için hangi önemlilik testleri kullanılmalıdır?

Örnek 1. Düşük doğum ağırlıklı 35 ve Normal doğum ağırlıklı 30 bebeğin annelerinin yaş
ortalamaları karşılaştırılmak isteniyor.

Soru 1. Karşılaştırılacak değişkenin ölçüm biçimi nedir?


Sürekli nicel veri

Soru 2. Karşılaştırılacak gruplar arasındaki bağımlılık yapısı?


Bağımsız

Soru 3. Karşılaştırılacak grup sayısı?


İki

Soru 4. Gruplardaki denek sayıları nedir?


35 ve 30 kişi

Soru 5. Her bir grupta yaş değerleri normal dağılıma uyuyor mu?
Normal dağılıma uygun

Bu bilgilere göre gruplarda yaş ortalamalarının İki ortalama arasındaki farkın önemlilik testi
(Student’s t testi) kullanılarak test edilmesine karar verilmiştir.

Örnek 2. Düşük doğum ağırlıklı çocuk sahibi olan 35 kadın ve normal ağırlıklı çocuk sahibi
olan 30 kadında gebelik sayıları karşılaştırılmak isteniyor.

Soru 1. Karşılaştırılacak değişkenin ölçüm biçimi nedir?


Kesikli nicel veri

Soru 2. Karşılaştırılacak gruplar arasındaki bağımlılık yapısı?


Bağımsız

Soru 3. Karşılaştırılacak grup sayısı


İki

Soru 4. Gruplardaki denek sayıları nedir?


Birinci grupta 35, ikinci grupta 30 kişi

Soru 5. Gebelik sayıları normal dağılıma uyuyor mu?


Normal dağılıma uygun değil

Bu bilgilere göre gruplarda gebelik sayısı ortancalarının farklı olup olmadığı Mann Whitney
U testi kullanılarak karşılaştırılmalıdır.

Örnek 3. 30 annenin doğum öncesi ve doğum sonrası kilo ortalamaları karşılaştırılmak


isteniyor.

Soru 1. Karşılaştırılacak değişkenlerin ölçüm biçimi nedir?


Sürekli nicel veri

Soru 2. Karşılaştırılacak gruplar arasındaki bağımlılık yapısı?


Bağımlı

Soru 3. Karşılaştırılacak grup sayısı?


İki

Soru 4. Gruplardaki denek sayıları nedir?


30 kişi

Soru 5. Kilo değerleri arasındaki fark normal dağılıma uyuyor mu?


Normal dağılıma uygun

Bu bilgilere göre doğum öncesi ve doğum sonrası kilo ortalamalarının İki eş arasındaki farkın
önemlilik testi (Paired t testi) kullanılarak test edilmesine karar verilmiştir.

Örnek 4. 25 bebeğin doğumda ve doğumdan 6 ay sonraki Apgar skorları karşılaştırılmak


isteniyor.

Soru 1. Karşılaştırılacak değişkenin ölçüm biçimi nedir?


Sıralanabilir Nitel Veri (10’lu)

Soru 2. Karşılaştırılacak gruplar arasındaki bağımlılık yapısı?


Bağımlı

Soru 3. Karşılaştırılacak grup sayısı


İki

Soru 4. Gruplardaki denek sayıları nedir?


Her grupta 25 kişi
Soru 5. Apgar skorları arasındaki fark normal dağılıma uyuyor mu?
Normal dağılıma uygun değil

Bu bilgilere göre doğumda ve doğumdan 6 ay sonraki Apgar skorlarının ortancalarının farklı


olup olmadığı Wilcoxon testi kullanılarak karşılaştırılmalıdır.
Örnek 5. Dört ayrı hepatit türünde sedimantasyon ortalamaları karşılaştırılmak isteniyor.

Soru 1. Karşılaştırılacak değişkenin ölçüm biçimi nedir?


Sürekli nicel veri

Soru 2. Karşılaştırılacak gruplar arasındaki bağımlılık yapısı?


Bağımsız

Soru 3. Karşılaştırılacak grup sayısı?


Dört

Soru 4. Gruplardaki denek sayıları nedir?


Her grupta 35 kişi

Soru 5. Her bir grupta sedimantasyon değerleri normal dağılıma uyuyor mu?
Normal dağılıma uygun

Bu bilgilere göre hepatit türlerinde sedimantasyon ortalamalarının Varyans Analizi


kullanılarak test edilmesine karar verilmiştir.

Örnek 6. Kanserin 3 değişik evresinde AgNor değerleri karşılaştırılmak isteniyor.

Soru 1. Karşılaştırılacak değişkenin ölçüm biçimi nedir?


Sürekli nicel veri

Soru 2. Karşılaştırılacak gruplar arasındaki bağımlılık yapısı?


Bağımsız

Soru 3. Karşılaştırılacak grup sayısı


Dört

Soru 4. Gruplardaki denek sayıları nedir?


İki grupta 10, iki grupta 8

Soru 5. Her bir grupta AgNor değerleri normal dağılıma uyuyor mu?
Normal dağılıma uygun değil

Bu bilgilere göre evrelerdeki AgNor değerleri ortancalarının farklı olup olmadığı Kruskal-
Wallis Varyans Analizi kullanılarak karşılaştırılmalıdır.

Örnek 7. 32 bireyin diyet öncesi, diyet sonrası ve diyetten 3 ay sonraki beden-kitle indeksi
(BMI) değerleri karşılaştırılmak isteniyor.

Soru 1. Karşılaştırılacak değişkenin ölçüm biçimi nedir?


Sürekli nicel veri

Soru 2. Karşılaştırılacak gruplar arasındaki bağımlılık yapısı?


Bağımlı

Soru 3. Karşılaştırılacak grup sayısı?


Üç

Soru 4. Gruplardaki denek sayıları nedir?


32 kişi

Soru 5. BMI değerleri arasındaki farklar normal dağılıma uyuyor mu?


Normal dağılıma uygun

Bu bilgilere göre diyet öncesi, diyet sonrası ve diyetten 3 ay sonraki beden-kitle indeksi
ortalamalarının Tekrarlı Ölçümlerde Varyans Analizi kullanılarak test edilmesine karar verilmiştir.

Örnek 8. 15 bireyin ameliyat öncesi, ameliyatta ve ameliyat sonrası VAS skorları


karşılaştırılmak isteniyor.

Soru 1. Karşılaştırılacak değişkenin ölçüm biçimi nedir?


Sıralanabilir nitel veri (10’lu)

Soru 2. Karşılaştırılacak gruplar arasındaki bağımlılık yapısı?


Bağımlı

Soru 3. Karşılaştırılacak grup sayısı?


Üç

Soru 4. Gruplardaki denek sayıları nedir?


15 kişi

Soru 5. VAS skorları arasındaki farklar normal dağılıma uyuyor mu?


Normal dağılıma uygun değil

Bu bilgilere göre ameliyat öncesi, ameliyatta ve ameliyat sonrası VAS skorları


ortalancalarının Friedman Testi kullanılarak test edilmesine karar verilmiştir.

Örnek 9. Sigaranın Düşük doğum ağırlığına etkisini incelemek amacıyla Düşük doğum
ağırlıklı çocuk sahibi olan ve olmayanlarda Sigara kullanma yüzdeleri karşılaştırılmak isteniyor.

Soru 1. Karşılaştırılacak değişkenin ölçüm biçimi nedir?


Sınıflanabilir Nitel Veri

Soru 2. Karşılaştırılacak gruplar arasındaki bağımlılık yapısı?


Bağımsız

Soru 3. Karşılaştırılacak gruplarda kategori sayısı


2x2

Soru 4. Beklenen değeri 5’ten küçük bir göze var mı?


Yok
Bu bilgilere göre Düşük Doğum Ağırlıklı çocuk sahibi olan ve olmayanlarda Sigara içme
durumlarının farklı olup olmadığı Ki- Kare testi veya İki yüzde arasındaki farkın önemlilik testi
kullanılarak test edilmelidir.(Beklenen değerin 5’ten küçük olduğu göze olması durumunda Fisher’in
Kesin Ki-kare Testi kullanılarak test edilmelidir.)

Örnek 10. Sosyoekonomik düzeyin Düşük doğum ağırlığına etkisini incelemek amacıyla
Düşük doğum ağırlıklı çocuk sahibi olan ve olmayanların Sosyoekonomik düzeylerine göre dağılımları
karşılaştırılmak isteniyor.

Soru 1. Karşılaştırılacak değişkenin ölçüm biçimi nedir?


Sıralanabilir Nitel Veri

Soru 2. Karşılaştırılacak gruplar arasındaki bağımlılık yapısı?


Bağımsız

Soru 3. Karşılaştırılacak gruplarda kategori sayısı


2x3
Bu bilgilere göre Düşük Doğum Ağırlıklı çocuk sahibi olan ve olmayanların Sosyoekonomik
düzeylerinin farklı olup olmadığı Çok-gözlü düzenlerde Ki- Kare testi kullanılarak test edilmelidir.

Örnek 11. Aynı hastalar üzerinde uygulanan iki farklı yöntemin (PET ve SPECT) benzer tanı
koyma olasılıkları (Pozitif/Negatif) karşılaştırılmak isteniyor.

Soru 1. Karşılaştırılacak değişkenin ölçüm biçimi nedir?


Sınıflanabilir Nitel Veri

Soru 2. Karşılaştırılacak gruplar arasındaki bağımlılık yapısı?


Bağımlı

Soru 3. Karşılaştırılacak gruplarda kategori sayısı


2x2

Bu bilgilere göre PET ve SPECT yöntemlerinde tanı koyma olasılıklarının farklı olup
olmadığı Mc-Nemar testi kullanılarak test edilmelidir.

KAYNAKLAR

1. Akgül, A. (2003). Tıbbi Araştırmalarda İstatistiksel Analiz Teknikleri “SPSS


Uygulamaları” (2. Baskı). Emek Ofset Ltd. Şti., Ankara.
2. Bowers, D. (2002). Medical Statistics from Scratch. John Wiley and Sons, Ltd.,
England.
3. Conover, W., J. (1980). Practical Nonparametric Statistics (2nd Edition), John Wiley &
Sons.
4. Dawson-Saunders B., Trapp, R., G. (1990). Basic and Clinical Biostatistics. Appleton
& Lange.
5. Siegel, S., Castellan, N., J., Jr. (1988). Nonparametric Statistics for the Behavioral
Sciences. McGraw-Hill Inc., New York.
6. Sümbüloğlu, K., Sümbüloğlu, V. (2002). Biyoistatistik (10. Baskı). Hatiboğlu Basım
ve Yayım San. Tic. Ltd. Şti, Ankara.
7. Swinscow, T., D., V. (1997). Statistics at Square One (9th Edition). BMJ Publishing
Group. Erişim: [http://bmj.bmjjournals.com/collections/statsbk/13.shtml].

You might also like