Professional Documents
Culture Documents
Statistica - Test Dla Dwóch Prób Niezależnych-1
Statistica - Test Dla Dwóch Prób Niezależnych-1
ZADANIE 1
Otwieramy plik „Waga_noworodkow.sta”, który zwiera dane dotyczące wagi urodzeniowej noworodków zebrane
wśród losowo wybranych matek, niepalących i palących dużo w czasie ciąży.
1. Na początku obliczymy statystyki opisowe, aby ocenić, czy mamy podstawy do stwierdzenia, że waga
urodzeniowa noworodka zależy od statusu palenia matek
2
7
4
Otrzymujemy w rezultacie:
2. Na poziomie istotności α =0,05 ocenimy, czy średnia waga urodzeniowa noworodka zależy od statusu
palenia matki (tzn. czy średnia waga urodzeniowa noworodka, którego matka nie paliła w ciąży różni się
statystycznie od średniej wagi noworodka, którego matka dużo paliła).
3. Wiemy, że mamy dwie grupy niezależne:
• 11 kobiet niepalących
• 13 kobiet palących dużo podczas ciąży
Aby dobrać odpowiedni test do porównanie spośród trzech, które mamy do dyspozycji, należy sprawdzić
normalność rozkładu wagi noworodków w każdej z grup. W celu oceny normalności rozkładu wracamy do
okna „Statystyki opisowe”, które powinno znajdować się w wersji zminimalizowanej w lewym dolnym rogu
ekranu.
Otrzymujemy:
Status palenia=Niepaląca
Status palenia=Paląca dużo
Histogram: Waga urodzeniowa
Histogram: Waga urodzeniowa
Shapiro-Wilk W=,98422, p=,98507
Shapiro-Wilk W=,88516, p=,08380
Oczekiwana normalna
Oczekiwana normalna
3
2
Liczba obs.
Liczba obs.
0 0
2,2 2,4 2,6 2,8 3,0 3,2 3,4 3,6 3,8 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 4,1
X <= Granica klasy X <= Granica klasy
Oba wykresy (obrazujące to jak rozkłada się waga noworodków w każdej z grup osobno), oceniając wzrokowo
różnią się kształtem od rozkładu normalnego. Dodatkowo jako podpowiedź mamy przygotowaną czerwoną linię,
tzw. oczekiwaną normalną, a więc krzywą pokazującą jak powinny zachowywać się słupki aby rozkład był zgodny
z rozkładem normalnym. Taka ocena wzrokowa nie jest jednak wystarczająca. Musimy dokonać formalnej
weryfikacji zgodności rozkładu z rozkładem normalnym. Umożliwia to test Shapiro-Wilka.
Decyzja: W przypadku obu grup p>0,05, zatem w obydwu sytuacjach nie ma podstaw do odrzucenia hipotezy
zerowej, która mówi o zgodności rozkładu z rozkładem normalnym.
Wniosek: Stwierdzamy, że rozkład wagi urodzeniowej nie różni się istotnie od rozkładu normalnego zarówno w
grupie noworodków matek palących jak i niepalących w trakcie ciąży.
Ponieważ:
1. Próby są niezależne.
2. Mamy do czynienia ze zmiennymi liczbowymi.
3. Badana cecha ma rozkład normalny w obu podgrupach (p>α).
Klikamy kolejno: Statystyka → Statystyki podstawowe (jeżeli jest potrzeba i pojawi się okno z pytaniem
wybieramy: „Uruchom nową”) → Wybieramy opcję: Test t dla prób niezależnych (wzgl. grup) → OK →
Wybieramy odpowiednie zmienne: Zmienna zależna: Waga urodzeniowa, Zmienna grupująca: Status palenia →
OK → Zakładka: Opcje → Zaznaczamy: Test z niezal. estymacją wariancji → Klikamy zakładkę Podstawowe
→ Podsumowanie: testy t
3 4
Otrzymujemy:
0,032
𝑝 = ……….... <………….
0,05 = 𝛼
Decyzja:
Odrzucamy hipotezę zerową H0 na korzyść hipotezy alternatywnej H1.
………………………………………………………………………………………………………….
Brak jednorodności wariancji.
Wniosek: …………………………………………………………………………………………….....
test Cochrana-Coxa.
Należy wykonać …………………………………………………..
Istnieje istotna różnica przeciętnych wag urodzeniowych noworodków, których matki nie paliły oraz
paliły dużo w trakcie ciąży (w opisanym przykładzie różnica wynosiła nieco ponad 0,5kg (3,7-3,17=0,53)).
Ramkowy Waga urodzeniowa grupowane względem Status palenia
Waga_noworodkow.sta 2v*24c
4,4
4,2
4,0
3,8
3,6
Waga urodzeniowa
3,4
3,2
3,0
2,8
2,6
2,4
2,2
2,0 Średnia
Niepaląca Paląca dużo Średnia±Błąd std
Status palenia Średnia±2*Odch.std
Wykres ramka-wąsy potwierdza istotne statystycznie różnice w wadze urodzeniowej noworodków (pudełka są
znacznie oddalone od siebie).
Uwagi:
• test t-Studenta (Cochrana-Coxa) możemy przeprowadzić tylko w sytuacji jeżeli stwierdzimy normalność
rozkładu w obu grupach (w przypadku braku normalności przynajmniej w jednej z badanych grup
przeprowadzamy test U Manna-Whitneya)
• wskazanie na hipotezę zerową (p>0,05) nie oznacza udowodnienia tej hipotezy; oznacza, że różnice
pomiędzy grupami nie są znaczące, nazywamy je wtedy nieistotnymi statystycznie
ZADANIE 2
Otwieramy w programie Statistica plik o nazwie „Wyniki egzaminu.sta”, który zawiera wyniki egzaminu wstępnego
na studia przeprowadzonego wśród 26 studentów. Na poziomie istotności α=0,05 należy ocenić, czy suma punktów
z egzaminów wstępnych uzyskanych przez kobiety (PLEC=2) różni się od sumy punktów uzyskanych przez
mężczyzn (PLEC=1) (tzn. czy płeć kandydata na studia wpływa na sumę punktów uzyskanych z egzaminu
wstępnego).
1. Na początku obliczymy statystyki opisowe, aby ocenić, czy mamy podstawy do stwierdzenia, że średnia
suma punktów z egzaminu wstępnego zależy od płci kandydata:
2
7
4
Otrzymujemy w rezultacie:
Widzimy, że średni wynik egzaminu mężczyzn jest nieco wyższy niż u kobiet. Ustalimy jednak, czy występujące
tu różnice można uznać za istotne statystycznie, czyli czy można je uogólnić na całą populację. A może
uzyskane różnice są tylko przypadkowe i można je zaniedbać?
2. Na poziomie istotności α =0,05 ocenimy, czy średni wynik egzaminu wstępnego na studia zależy od płci
kandydata
3. Wiemy, że mamy dwie grupy niezależne:
• 18 kobiet
• 8 mężczyzn
Aby dobrać odpowiedni test do porównanie spośród trzech, które mamy do dyspozycji, należy sprawdzić
normalność rozkładu sumy punktów w każdej z grup. W celu oceny normalności rozkładu wracamy do okna
„Statystyki opisowe”, które powinno znajdować się w wersji zminimalizowanej w lewym dolnym rogu
ekranu.
Otrzymujemy:
PLEC=2 PLEC=1
Histogram: SUMA Histogram: SUMA
Shapiro-Wilk W=,90948, p=,08424 Shapiro-Wilk W=,97078, p=,90404
Oczekiwana normalna Oczekiwana normalna
7
6 3
5
Liczba obs.
Liczba obs.
4 2
2 1
0 0
20 30 40 50 60 70 80 90 30 40 50 60 70 80 90 100
X <= Granica klasy X <= Granica klasy
Oba wykresy (obrazujące to jak rozkłada się waga noworodków w każdej z grup osobno), oceniając wzrokowo
różnią się kształtem od rozkładu normalnego. Taka ocena wzrokowa nie jest jednak wystarczająca. Musimy
dokonać formalnej weryfikacji zgodności rozkładu z rozkładem normalnym. Umożliwia to test Shapiro-Wilka.
Decyzja: W przypadku obu grup p>0,05, zatem w obydwu sytuacjach nie ma podstaw do odrzucenia hipotezy
zerowej, która mówi o zgodności rozkładu z rozkładem normalnym.
Wniosek: Stwierdzamy, że rozkład sumy punktów nie różni się istotnie od rozkładu normalnego zarówno w grupie
kobiet, jak i mężczyzn.
Ponieważ:
4. Próby są niezależne.
5. Mamy do czynienia ze zmiennymi liczbowymi.
6. Badana cecha ma rozkład normalny w obu podgrupach (p>α).
Klikamy kolejno: Statystyka → Statystyki podstawowe (jeżeli jest potrzeba i pojawi się okno z pytaniem
wybieramy: „Uruchom nową”) → Wybieramy opcję: Test t dla prób niezależnych (wzgl. grup) → OK →
Wybieramy odpowiednie zmienne: Zmienna zależna: SUMA, Zmienna grupująca: PLEC → OK → Zakładka: Opcje
→ Zaznaczamy: Test z niezal. estymacją wariancji → Klikamy zakładkę Podstawowe → Podsumowanie:
testy t
3 4
Otrzymujemy:
𝑝 = 0,7216
……….... >………….
0,05 = 𝛼
Decyzja:
Nie ma podstaw do odrzucenia hipotezy zerowej H0.
………………………………………………………………………………………………………….
Występuje jednorodność wariancji.
Wniosek: …………………………………………………………………………………………….....
klasyczny test t-Studenta
Należy wykonać …………………………………………………..
Odczytujemy p-value uzyskane w Statistice dla odpowiedniego testu (klasyczny test t-Studenta):
0,0956
𝑝 = ……….... > 0,05 = 𝛼
………….