Download as pdf or txt
Download as pdf or txt
You are on page 1of 9

Porównanie dwóch grup pod względem zmiennej liczbowej

Czynności, które dzisiaj wykonamy:


• Wyznaczenie statystyk opisowych (z podziałem na grupy).
• Ocena zgodności rozkładu wybranych zmiennych z rozkładem normalnym (uwaga: oceniamy kształt
rozkładu w każdej z grup osobno).
• Dobór i wykonanie odpowiedniego testu pozwalającego na porównanie badanych grup (klasyczny test t-
Studenta, test Cochrana-Coxa, lub test U Manna-Whitneya).
• Zapisanie wyników, interpretacja otrzymanych wyników, sformułowanie wniosków.

ZADANIE 1

Otwieramy plik „Waga_noworodkow.sta”, który zwiera dane dotyczące wagi urodzeniowej noworodków zebrane
wśród losowo wybranych matek, niepalących i palących dużo w czasie ciąży.

1. Na początku obliczymy statystyki opisowe, aby ocenić, czy mamy podstawy do stwierdzenia, że waga
urodzeniowa noworodka zależy od statusu palenia matek

Statystyka→ Statystyki podstawowe → Statystyki opisowe → OK → Zmienna: Waga urodzeniowa →


Zakładka: Więcej → Zaznaczamy interesujące nas statystyki: Nważnych, średnia, mediana, wariancja →
Po prawej stronie wybieramy opcję: Grupami… → Zaznaczamy zmienną grupującą: Status palenia → OK
→ Odznaczamy opcję: Wykonaj również analizę bez grupowania → Zaznaczamy: Zbierz wyniki w jednej
tabeli → OK → Statystyki

2
7
4

Otrzymujemy w rezultacie:

Wyniki zagregowane Statystyki opisowe (Waga_noworodkow.sta)


Zmienna Status palenia Nważnych Średnia Mediana Wariancja
Waga urodzeniowa Niepaląca 11 3,699091 3,700000 0,056229
Waga urodzeniowa Paląca dużo 13 3,173846 3,270000 0,232376
Widzimy, że przeciętna waga urodzeniowa noworodków u matek, które nie paliły w ciąży w stosunku do matek
palących różni się nieznacznie. Ustalimy jednak, czy występujące tu różnice można uznać za istotne
statystycznie, czyli czy można je uogólnić na całą populację. A może uzyskane różnice są tylko przypadkowe i
można je zaniedbać?

2. Na poziomie istotności α =0,05 ocenimy, czy średnia waga urodzeniowa noworodka zależy od statusu
palenia matki (tzn. czy średnia waga urodzeniowa noworodka, którego matka nie paliła w ciąży różni się
statystycznie od średniej wagi noworodka, którego matka dużo paliła).
3. Wiemy, że mamy dwie grupy niezależne:
• 11 kobiet niepalących
• 13 kobiet palących dużo podczas ciąży
Aby dobrać odpowiedni test do porównanie spośród trzech, które mamy do dyspozycji, należy sprawdzić
normalność rozkładu wagi noworodków w każdej z grup. W celu oceny normalności rozkładu wracamy do
okna „Statystyki opisowe”, które powinno znajdować się w wersji zminimalizowanej w lewym dolnym rogu
ekranu.

Wchodzimy w zakładkę: Normalność → Wybieramy test Shapiro-Wilka (wyłączamy Test normalności K-


S i Lilleforsa) → Klikamy: Histogramy

Otrzymujemy:

Status palenia=Niepaląca
Status palenia=Paląca dużo
Histogram: Waga urodzeniowa
Histogram: Waga urodzeniowa
Shapiro-Wilk W=,98422, p=,98507
Shapiro-Wilk W=,88516, p=,08380
Oczekiwana normalna
Oczekiwana normalna

3
2
Liczba obs.
Liczba obs.

0 0
2,2 2,4 2,6 2,8 3,0 3,2 3,4 3,6 3,8 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 4,1
X <= Granica klasy X <= Granica klasy
Oba wykresy (obrazujące to jak rozkłada się waga noworodków w każdej z grup osobno), oceniając wzrokowo
różnią się kształtem od rozkładu normalnego. Dodatkowo jako podpowiedź mamy przygotowaną czerwoną linię,
tzw. oczekiwaną normalną, a więc krzywą pokazującą jak powinny zachowywać się słupki aby rozkład był zgodny
z rozkładem normalnym. Taka ocena wzrokowa nie jest jednak wystarczająca. Musimy dokonać formalnej
weryfikacji zgodności rozkładu z rozkładem normalnym. Umożliwia to test Shapiro-Wilka.

H0: waga urodzeniowa ma rozkład zgodny z rozkładem normalnym


H1: waga urodzeniowa ma rozkład inny niż normalny

W grupie matek palących: p=0,08380>0,05


W grupie matek niepalących: p=0,98507>0,05

Decyzja: W przypadku obu grup p>0,05, zatem w obydwu sytuacjach nie ma podstaw do odrzucenia hipotezy
zerowej, która mówi o zgodności rozkładu z rozkładem normalnym.
Wniosek: Stwierdzamy, że rozkład wagi urodzeniowej nie różni się istotnie od rozkładu normalnego zarówno w
grupie noworodków matek palących jak i niepalących w trakcie ciąży.

Ponieważ:
1. Próby są niezależne.
2. Mamy do czynienia ze zmiennymi liczbowymi.
3. Badana cecha ma rozkład normalny w obu podgrupach (p>α).

klasycznego testu t-Studenta


To należy użyć testu: …………………………………………………… testu Cochrana-Coxa
lub ……..………………………………
Aby podjąć decyzję należy ocenić wynik testu F (jednorodności wariancji):
H0: występuje jednorodność wariancji
H1: brak jednorodności wariancji

Klikamy kolejno: Statystyka → Statystyki podstawowe (jeżeli jest potrzeba i pojawi się okno z pytaniem
wybieramy: „Uruchom nową”) → Wybieramy opcję: Test t dla prób niezależnych (wzgl. grup) → OK →
Wybieramy odpowiednie zmienne: Zmienna zależna: Waga urodzeniowa, Zmienna grupująca: Status palenia →
OK → Zakładka: Opcje → Zaznaczamy: Test z niezal. estymacją wariancji → Klikamy zakładkę Podstawowe
→ Podsumowanie: testy t

3 4
Otrzymujemy:

Testy t; Grupująca: Status palenia (Waga_noworodkow.sta)


Grupa 1: Niepaląca
Grupa 2: Paląca dużo
p Nważnych Nważnych iloraz F
Średnia Średnia df t oddz. p
t p Niepaląca Paląca dużo
Niepaląca Paląca dużo est.war. df dwustro Wariancj Wariancje
Zmienna n e
Waga
3,7 3,17 3,29 22 0,003 3,46 18 0,0028 11 13 4,13 0,032
urodzeniowa
klasyczny test t-Studenta test Cochrana-Coxa test jednorodności wariancji

Z testu F (jednorodności wariancji):


H0: występuje jednorodność wariancji
H1: brak jednorodności wariancji

0,032
𝑝 = ……….... <………….
0,05 = 𝛼
Decyzja:
Odrzucamy hipotezę zerową H0 na korzyść hipotezy alternatywnej H1.
………………………………………………………………………………………………………….
Brak jednorodności wariancji.
Wniosek: …………………………………………………………………………………………….....
test Cochrana-Coxa.
Należy wykonać …………………………………………………..

Weryfikujemy hipotezę z zadania


Określamy hipotezy dla testu Cochrana-Coxa:
średnia waga urodzeniowa nie różni się istotnie
𝐻0 : _____________________________________________________________
średnia waga urodzeniowa różni się istotnie
𝐻 : _____________________________________________________________
1

Odczytujemy p-value uzyskane w Statistice dla odpowiedniego testu (Coxrana-Coxa):


0,0028
𝑝 = ……….... < 0,05 = 𝛼
………….

Decyzja po wnioskowaniu statystycznym:


Odrzucamy hipotezę zerową H0 na korzyść hipotezy alternatywnej H1.
………………………………………………………………………………………………………….

Zestawienie i interpretacja wyników:


Matki niepalące (n=11) Matki palące dużo (n=13)
p-value
średnia mediana wariancja średnia mediana wariancja
Waga
3,7 3,7 0,056 3,17 3,27 0,23 0,0028
urodzeniowa

Istnieje istotna różnica przeciętnych wag urodzeniowych noworodków, których matki nie paliły oraz
paliły dużo w trakcie ciąży (w opisanym przykładzie różnica wynosiła nieco ponad 0,5kg (3,7-3,17=0,53)).
Ramkowy Waga urodzeniowa grupowane względem Status palenia
Waga_noworodkow.sta 2v*24c
4,4

4,2

4,0

3,8

3,6
Waga urodzeniowa

3,4

3,2

3,0

2,8

2,6

2,4

2,2

2,0 Średnia
Niepaląca Paląca dużo Średnia±Błąd std
Status palenia Średnia±2*Odch.std

Wykres ramka-wąsy potwierdza istotne statystycznie różnice w wadze urodzeniowej noworodków (pudełka są
znacznie oddalone od siebie).

Uwagi:
• test t-Studenta (Cochrana-Coxa) możemy przeprowadzić tylko w sytuacji jeżeli stwierdzimy normalność
rozkładu w obu grupach (w przypadku braku normalności przynajmniej w jednej z badanych grup
przeprowadzamy test U Manna-Whitneya)
• wskazanie na hipotezę zerową (p>0,05) nie oznacza udowodnienia tej hipotezy; oznacza, że różnice
pomiędzy grupami nie są znaczące, nazywamy je wtedy nieistotnymi statystycznie
ZADANIE 2

Otwieramy w programie Statistica plik o nazwie „Wyniki egzaminu.sta”, który zawiera wyniki egzaminu wstępnego
na studia przeprowadzonego wśród 26 studentów. Na poziomie istotności α=0,05 należy ocenić, czy suma punktów
z egzaminów wstępnych uzyskanych przez kobiety (PLEC=2) różni się od sumy punktów uzyskanych przez
mężczyzn (PLEC=1) (tzn. czy płeć kandydata na studia wpływa na sumę punktów uzyskanych z egzaminu
wstępnego).

1. Na początku obliczymy statystyki opisowe, aby ocenić, czy mamy podstawy do stwierdzenia, że średnia
suma punktów z egzaminu wstępnego zależy od płci kandydata:

Statystyka→ Statystyki podstawowe → Statystyki opisowe → OK → Zmienna: SUMA → Zakładka:


Więcej → Zaznaczamy interesujące nas statystyki: Nważnych, średnia, mediana, wariancja → Po prawej
stronie wybieramy opcję: Grupami… → Zaznaczamy zmienną grupującą: PLEC → OK → Odznaczamy
opcję: Wykonaj również analizę bez grupowania → Zaznaczamy: Zbierz wyniki w jednej tabeli → OK →
Statystyki

2
7
4

Otrzymujemy w rezultacie:

Wyniki zagregowane Statystyki opisowe (Wyniki egzaminu.sta)

PLEC Nważnych Średnia Mediana Wariancja


Zmienna
SUMA 2 18 51,44444 48,50000 203,7908

SUMA 1 8 62,25000 60,00000 241,9286

Widzimy, że średni wynik egzaminu mężczyzn jest nieco wyższy niż u kobiet. Ustalimy jednak, czy występujące
tu różnice można uznać za istotne statystycznie, czyli czy można je uogólnić na całą populację. A może
uzyskane różnice są tylko przypadkowe i można je zaniedbać?
2. Na poziomie istotności α =0,05 ocenimy, czy średni wynik egzaminu wstępnego na studia zależy od płci
kandydata
3. Wiemy, że mamy dwie grupy niezależne:
• 18 kobiet
• 8 mężczyzn
Aby dobrać odpowiedni test do porównanie spośród trzech, które mamy do dyspozycji, należy sprawdzić
normalność rozkładu sumy punktów w każdej z grup. W celu oceny normalności rozkładu wracamy do okna
„Statystyki opisowe”, które powinno znajdować się w wersji zminimalizowanej w lewym dolnym rogu
ekranu.

Wchodzimy w zakładkę: Normalność → Wybieramy test Shapiro-Wilka (wyłączamy Test normalności K-


S i Lilleforsa) → Klikamy: Histogramy

Otrzymujemy:

PLEC=2 PLEC=1
Histogram: SUMA Histogram: SUMA
Shapiro-Wilk W=,90948, p=,08424 Shapiro-Wilk W=,97078, p=,90404
Oczekiwana normalna Oczekiwana normalna
7

6 3

5
Liczba obs.
Liczba obs.

4 2

2 1

0 0
20 30 40 50 60 70 80 90 30 40 50 60 70 80 90 100
X <= Granica klasy X <= Granica klasy

Oba wykresy (obrazujące to jak rozkłada się waga noworodków w każdej z grup osobno), oceniając wzrokowo
różnią się kształtem od rozkładu normalnego. Taka ocena wzrokowa nie jest jednak wystarczająca. Musimy
dokonać formalnej weryfikacji zgodności rozkładu z rozkładem normalnym. Umożliwia to test Shapiro-Wilka.

H0: waga urodzeniowa ma rozkład zgodny z rozkładem normalnym


H1: waga urodzeniowa ma rozkład inny niż normalny
W grupie kobiet: p=0,08424>0,05
W grupie mężczyzn: p=0,90404>0,05

Decyzja: W przypadku obu grup p>0,05, zatem w obydwu sytuacjach nie ma podstaw do odrzucenia hipotezy
zerowej, która mówi o zgodności rozkładu z rozkładem normalnym.
Wniosek: Stwierdzamy, że rozkład sumy punktów nie różni się istotnie od rozkładu normalnego zarówno w grupie
kobiet, jak i mężczyzn.

Ponieważ:
4. Próby są niezależne.
5. Mamy do czynienia ze zmiennymi liczbowymi.
6. Badana cecha ma rozkład normalny w obu podgrupach (p>α).

klasycznego testu t-Studenta


To należy użyć testu: …………………………………………………… testu Cochrana-Coxa
lub ……..………………………………
Aby podjąć decyzję należy ocenić wynik testu F (jednorodności wariancji):
H0: występuje jednorodność wariancji
H1: brak jednorodności wariancji

Klikamy kolejno: Statystyka → Statystyki podstawowe (jeżeli jest potrzeba i pojawi się okno z pytaniem
wybieramy: „Uruchom nową”) → Wybieramy opcję: Test t dla prób niezależnych (wzgl. grup) → OK →
Wybieramy odpowiednie zmienne: Zmienna zależna: SUMA, Zmienna grupująca: PLEC → OK → Zakładka: Opcje
→ Zaznaczamy: Test z niezal. estymacją wariancji → Klikamy zakładkę Podstawowe → Podsumowanie:
testy t

3 4

Otrzymujemy:

Testy t; Grupująca: PLEC (Wyniki egzaminu.sta) Grupa 1: 2 Grupa 2 1


Średnia Średnia t oddz. p Nważnych Nważnych Odch.std Odch.std iloraz F p
2 1 t df p est.war. df dwustron 2 1 2 1 Wariancje Wariancje
Zmienna
SUMA 51,44 62,25 -1,73 24 0,0956 -1,676 12,5 0,1185 18 8 14,26 15,55 1,187 0,72156
test jednorodności wariancji
klasyczny test t-Studenta test Cochrana-Coxa
Z testu F (jednorodności wariancji):
H0: występuje jednorodność wariancji
H1: brak jednorodności wariancji

𝑝 = 0,7216
……….... >………….
0,05 = 𝛼
Decyzja:
Nie ma podstaw do odrzucenia hipotezy zerowej H0.
………………………………………………………………………………………………………….
Występuje jednorodność wariancji.
Wniosek: …………………………………………………………………………………………….....
klasyczny test t-Studenta
Należy wykonać …………………………………………………..

Weryfikujemy hipotezę z zadania


Określamy hipotezy dla klasycznego testu t-Studenta:
średnia suma punktów z egzaminu wstępnego na studia nie różni się istotnie
𝐻0 : _____________________________________________________________________________________
średnia suma punktów z egzaminu wstępnego na studia różni się istotnie
𝐻 : _____________________________________________________________________________________
1

Odczytujemy p-value uzyskane w Statistice dla odpowiedniego testu (klasyczny test t-Studenta):
0,0956
𝑝 = ……….... > 0,05 = 𝛼
………….

Decyzja po wnioskowaniu statystycznym:


Nie ma podstaw do odrzucenia hipotezy zerowej H0.
………………………………………………………………………………………………………….

Zestawienie i interpretacja wyników:


Kobiety (n=18) Mężczyźni (n=8)
p-value
średnia mediana wariancja średnia mediana wariancja
Suma
51,44 48,50 203,79 62,25 60,00 241,93 0,0956
punktów

Na poziomie ufności 95% w populacji nie ma istotnego zróżnicowania pomiędzy


przeciętną sumą punktów z egzaminów wstępnych uzyskaną przez kobiety, a
przeciętną sumą punktów uzyskaną przez mężczyzn. Zatem płeć kandydata na studia
nie wpływa na sumę punktów uzyskanych z egzaminu wstępnego.

You might also like