Download as pdf or txt
Download as pdf or txt
You are on page 1of 19

Test t Studenta (dla prób niezależnych).

Test t Studenta służy do weryfikacji hipotezy zerowej o równości dwóch średnich w populacji
H0: µ1=µ2, co jest równoważne logicznie twierdzeniu, że µ1-µ2=0 w populacji. Uwaga! Test ten służy:
 do porównywania średnich w populacji TYLKO w dwóch grupach. Jeśli chcemy porównywać
średnie w trzech lub większej liczbie grup w populacji, to należy zastosować inne testy,
np. ANOVA (test F),
 stosowany jest dla grup małolicznych, czyli 30 lub mniej osób (co zazwyczaj stanowi
liczebność grupy eksperymentalnej).
Porównywane grupy wyróżnione są na podstawie zmienne niezależnej, a cecha która jest
porównywana w wyróżnionych grupach to zmienna zależna. Np. pytanie badawcze: czy
hodowanie szczurów w klatkach lub poza nimi (czyli na wolności) ---/zmienna niezależna/
WPŁYWA na ich sprawność mentalną (zmienna sprawność mentalna została zoperacjonalizowana
za pomocą zmiennej liczba popełnianych błędów przy przejściu przez labirynt-----/zmienna
zależna/). Odpowiedź na tak postawione pytanie: o wpływ środowiska hodowli szczura na liczbę
popełnianych błędów przy przejściu przez labirynt stanowi weryfikacja hipotezy zerowej H0: µ1=µ2
w populacji. Jeśli hipoteza zerowa jest prawdziwa, to związek taki nie zachodzi. Z kolei, o tym, że
związek taki zachodzi mówi hipoteza alternatywna H1: µ1≠µ2 --- bezkierunkowa (to właśnie
zachodzenie prawidła opasanego w postaci hipotezy alternatywnej stara się zazwyczaj
udowodnić badacz) lub kierunkowa (lewo lub prawostronna). Hipotezę alternatywną kierunkową
możemy przyjąć, gdy mamy jakiekolwiek podstawy twierdzić, że zachodzi prawidło opisane jak
H1: µ1>µ2 lub H1: µ1<µ2 (taką podstawą może być teoria, wyniki innych doświadczeń, nasza intuicja,
itp.) Uwaga! Proszę zauważyć, że hipoteza bezkierunkowa H1: µ1≠µ2 jest logicznie równoważna
alternatywie hipotez kierunkowych H1: µ1>µ2 lub H1: µ1<µ2 (jeśli średnia w jednej grupie nie jest
równa średniej w drugiej grupie, to oznacza, że średnia w pierwszej grupie jest większa niż
w drugiej lub odwrotnie - średnia w pierwszej grupie jest mniejsza niż w drugiej).
Test t Studenta jest testem parametrycznym, co oznacza, że zanim zaczniemy go stosować,
musimy sprawdzić czy spełnione są założenia dotyczące stosowania tego testu (jeśli nie są
spełnione, to w zależności od tego, 1. które z założeń nie jest spełnione i 2. czy mamy do czynienia
z próbami zależnymi czy niezależnymi, stosujemy nieparametryczne odpowiedniki testu t (czyli
takie, które nie wymagają spełnienie żadnych założeń)).
Założenia testu t Studenta (oprócz 4) dotyczą zmiennej zależnej (w przykładzie jak wyżej jest nią
– liczba popełnianych przez szczury błędów przy przejściu przez labirynt).
1. Zmienna musi być mierzona na poziomie interwałowym lub stosunkowym (bo
porównujemy średnie, a średnią można obliczać tylko dla takich zmiennych)
2. Zmienna zależna musi mieć rozkład normalny w porównywanych grupach w populacji. To
założenie będziemy badać za pomocą testu Shapiro – Wilka, gdyż hipoteza zerowa tego
testu jest tożsama z założeniem, którego spełnienie badamy (czyli brzmi tak samo, jak to
założenie).
3. Wariancja zmiennej zależnej w dwóch porównywanych grupach w populacji musi być
podobna. Spełnienie tego założenia możemy badań za pomocą kilku testów: Levene’a,
Browna-Forsytha, Fishera, gdyż hipoteza zerowa tych testów jest tożsama z założeniem,
którego spełnienie badamy (czyli brzmi tak samo, jak to założenie). – bo chcemy by na
różnicę średnich wpływała tylko zmienna kontrolowana przez nas – czyli przynależność do
jednej bądź drugiej grupy, a nie czynniki, których nie kontrolujemy, a które mogą również
potencjalnie wpływać na wariancję wyników w grupach. Zatem wariancja
wewnątrzgrupowa powinna być taka sama w porównywanych grupach w populacji, co
oznacza, że czynniki, których nie kontrolujemy wpływają na zróżnicowanie wyników w obu
grupach bardzo podobnie, zatem różnicę między średnimi (wariancję zewnątrzgrupową)
możemy przypisać działaniu czynnika eksperymentalnego (czyli środowisku hodowli
szczura).
1
Wprowadzenie do statystyki (ćwiczenia) Jerzy Gruszka
4. Porównywane grupy powinny być równoliczne. Tego założenia zazwyczaj nie badamy, gdyż
w eksperymencie kontrolujemy to, by porównywane grupy miały taką samą liczność. Jak
wiadomo, test t Studenta zależy od liczebności próby, więc gdyby liczebność grup nie była
taka sama, to wynik w tym teście były zdeterminowany właśnie przez liczebność grup –
a tego nie chcemy. Chcemy uchwycić wpływ czynnika eksperymentalnego na zmienną
zależną. Chcemy, by tylko różnice w poziomie czynnika eksperymentalnego (zmienna
niezależna) wywoływały różnicę na zmiennej zależnej.

Uwaga! Wszystkie testy, którymi badamy czy założenia 2 oraz 3 zostały spełnione są testami
nieparametrycznymi. Gdyby było inaczej, czyli gdyby były testami parametrycznymi, to zanim
byśmy mogli ich użyć, musielibyśmy sprawdzić czy spełnione są założenia tych testów. A te
założenia znowu należałoby przetestować za pomocą odpowiednich testów, itd. itp.

Wykonanie testu t Studenta w Statistica.


 Przykład zostanie wykonany dla danych przykładowych Statistica. Plik --- otwórz przykłady
--- datasets --- plik Rats.sta
Będziemy starali się udowodnić, że istnieje związek między środowiskiem hodowli szczurów a ich
sprawnością mentalną, czyli szukać podstaw do odrzucenia hipotezy zerowej, że taki związek nie
zachodzi, czyli H0: µw=µk w populacji (µw – średnia liczba popełnianych błędów przy przejściu przez
labirynt przez szczury hodowane na wolności; µk - średnia liczba popełnianych błędów przy
przejściu przez labirynt przez szczury hodowane w klatkach).

Zmienna niezależna: podział na


porównywane grupy

Zmienna zależna: liczba błędów przy


przejściu przez labirynt

2
Wprowadzenie do statystyki (ćwiczenia) Jerzy Gruszka
 Przechodzimy na zakładkę Statystyka--- statystyki podstawowe

Do wyboru mamy 4 rodzaje testu t Studenta: dla pojedynczej próby (z tego nie będziemy korzystać
(konieczna jest znajomość średniej w populacji, a tej zazwyczaj nie znamy), test dla prób
zależnych i 2 testy dla prób niezależnych. Pierwszym pytaniem, które przed nami staje jest
pytanie o to, czy porównywane grupy stanowią próby zależne czy niezależne? Liczba błędów
w grupie szczurów hodowanych w klatkach i liczba błędów w grupie szczurów hodowanych na
wolność nie zależą od siebie, więc są to próby niezależne. Zatem musimy wybrać jeden z dwóch
testów dla prób niezależnych. Który? Odpowiedź na to pytanie zależy od układu danych w
arkuszu. Jeśli zmienna niezależna kodowana jest tak, że w jednej kolumnie (czyli w zakresie jednej
zmiennej) znajdują się kody dla dwóch porównywanych grup, to wybieramy test t dla prób

3
Wprowadzenie do statystyki (ćwiczenia) Jerzy Gruszka
niezależnych (wzg. grup), jeśli natomiast wyniki dla dwóch porównywanych grup znajdują się w
dwóch osobnych kolumnach (w dwóch zmiennych) to wybieramy opcję test t dla prób
niezależnych (wzg. zmn.). Wybieramy 1 opcję.
 Zanim zaczniemy analizę za pomocą testu t Studenta warto dokonać oglądu rozkładu
analizowanej zmiennej zależnej w obrębie porównywanych grup za pomocą wykresu
skrzynkowego / wykres ramka – wąsy (tzw. box plot). Choćby po to, by zobaczyć czy nie ma
odstających obserwacji, które przecież mogą mocno wpływać na wartości porównywanych
średnich. W tym celu przechodzimy na zakładkę wykresy ---- 2W ---- wykres ramka – wąsy.

Jako zmienną grupującą/ niezależną wybieramy środowisko, a jako zmienną zależną – błędy.
W polu wartość, zamiast mediany wybieramy – średnią, a w polu styl, zamiast punkt, wybieramy
– linia. Następnie przechodzimy na kartę więcej.

4
Wprowadzenie do statystyki (ćwiczenia) Jerzy Gruszka
5
Wprowadzenie do statystyki (ćwiczenia) Jerzy Gruszka
Na karcie więcej--- ramka odchylenie standardowe z wartością 1 (jeśli zmienna ma rozkład
normalny to w zakresie 1 odchylenie standardowego od średniej leży 68% wszystkich obserwacji.
Zatem prostokąt/ramka na naszym wykresie może obejmować 68% wszystkich pomiarów.
Wąs - odchylenie standardowe z wartością 2 (jeśli zmienna ma rozkład normalny to w zakresie
2 odchyleń standardowych od średniej leży ok. 95% wszystkich wartości zmiennej. Zatem
w zakresie dolnego i górnego wąsa na naszym wykresie leży 95% wszystkich pomiarów.
Odstające – 3
Pokaż dane surowe - ⱱ (oznacza to, że na wykres zostaną naniesione surowe dane ze zmiennej
błędy)
Separacja punktów - losowa (jeśli niektóre dane będą się na siebie nakładać, to program lekko
je odseparuje w sposób losowy, tak by widoczne były wszystkie pomiary).
Klikamy OK!

Otrzymaliśmy dwa wykresy skrzynkowe: jeden dla grupy szczurów hodowanych na wolności, drugi
dla szczurów hodowanych w klatkach. Linia w środku skrzynki / prostokąta to średnia (zgodnie
z legendą obok wykresu). Skrzynka skupia 68% wszystkich pomiarów w jednej i drugiej grupie
(jeśli rozkład zmiennej błędy nie odbiega od rozkładu normalnego), widać że niewiele pomiarów
osiąga wartości większe niż 1 odchylenie standardowe od średniej (czyli mieści się poza skrzynką).
Nie ma też obserwacji odstających, czyli powyżej 3 odchyleń standardowych od średniej (czyli
powyżej górnego i poniżej dolnego wąsa). Można też zaobserwować, że średnia błędów w grupie
szczurów wolnych wyniosła ok. 50 błędów, a w grupie szczurów hodowanych w klatkach – ok.
80 błędów.

6
Wprowadzenie do statystyki (ćwiczenia) Jerzy Gruszka
 Sprawdzamy czy założenia testu t Studenta zostały spełnione
1 . zmienna zależna – błędy – jest mierzona na poziomie co najmniej interwałowym. Jest to
o

zmienna stosunkowa, gdyż 0 oznacza brak cechy.


2o. zmienna zależna – błędy powinna mieć rozkład normalny w dwóch porównywanych grupach
w populacji, co jest tożsame z hipotezą zerową testu Shapiro-Wilka.
Żeby zweryfikować czy spełnione jest to założenie przechodzimy na zakładkę Statystyka –
statystki podstawowe --- wybieramy test t dla prób niezależnych (wzg. grup).

Jako zmienną zależną wybieramy – błędy, a za zmienną grupującą / niezależną podstawiamy –


środowisko. Wówczas w polach kod grupa 1 i kod grupy 2 pojawią się nazwy porównywanych grup,
czyli wolne i ograniczone. Przechodzimy na kartę więcej i klikamy klawisz skateg. wykres
normalności.

7
Wprowadzenie do statystyki (ćwiczenia) Jerzy Gruszka
Otrzymujemy wykres normalności dla dwóch analizowanych grup. Na osi poziomej naniesione
zostały wartości ze zmiennej błędy dla jednej i drugiej grupy. Na osi pionowej naniesiona te same
wartości, tyle że wystandaryzowane wartości zmiennej błędy. Jeśli rozkład zmiennej błędy jest
rozkładem idealnie normalnym to punkty na obu wykresach leżałyby dokładnie na czerwonej
linii. Za pomocą takiego wykresu można zdiagnozować pojedyncze wyniki szczurów, które
powodują, że rozkład w całej grupie nie jest idealnie normlany (czyli najbardziej wpływają na to,
że rozkład w całej grupie nie jest idealnie normalny). Mianowicie, te wyniki, które najbardziej
oddalają się od czerwonej linii prostej powodują, że rozkład w całej grupie może nie być
normalny). *to oddalenie punktu od linii prostej mierzymy rzutem prostopadłym punktu na linię.
Nas jednak interesuje nie tyle to, który pojedynczy wynik zaburza normalność rozkładu w całej
grupie, tylko czy rozkład wyników w całej grupie w populacji jest rozkładem zbliżonym do
rozkładu normalnego. Z tego powodu musimy przywołać wartość w teście Shapiro-Wilka
i oszacować prawdopodobieństwo osiągniecia takiej wartości lub większej (lub takie wartości
ze znakiem minus lub mniejszej). Aby to zrobić klikamy lewym przyciskiem myszy dwukrotnie
w okolicy tytuły wykresu. Pojawia się wtedy następujące okno:

8
Wprowadzenie do statystyki (ćwiczenia) Jerzy Gruszka
W oknie opcje wykresu klikamy statystki, a następnie w oknie statystyki zaznaczymy test Shapiro
– Wilka i klikamy zamknij. Program pyta nas jeszcze, gdzie ma umieścić wyniki testu Shapiro –
Wilka i domyślnie proponuje umieszczenie tych wyników w tytule wykresu. Zgadzamy się na to
klikając OK! i jeszcze raz OK! na dole okna Opcje wykresu. Otrzymujemy wyniki w tytule wykresu.

9
Wprowadzenie do statystyki (ćwiczenia) Jerzy Gruszka
Wynik 0,8622 lub wyższy w teście Shapiro-Wilka możemy uzyskać z prawdopodobieństwem
p=0,0521 (dla grupy szczurów wolnych) oraz wynik 0,873 lub wyższy w teście Shapiro-Wilka
możemy uzyskać z prawdopodobieństwem p=0,0809 (dla grupy szczurów ograniczonych). p dla
obu grup jest >0,05 (błąd I rodzaju, czyli błąd α), zatem NIE MOŻNA ODRZUCIĆ HIPOTEZY ZEROWEJ,
KTÓRA JEST TAKA SAMA JAKA ZAŁOŻENIE (2) TESTU. Zatem założenie zostało spełnione.

3o. wariancję zmiennej zależnej – błędy – powinna być taka sama w obu porównywanych grupach
w populacji. By sprawdzić czy spełnione jest to założenie będziemy używać testu Levene’a i testu
Browna-Forsytha. Domyślnie Statistica zapisuje też wartość testu F (Fishera). Hipoteza zerowa dla
wszystkich tych testów jest taka sama, jak założenie, które sprawdzamy. Przechodzimy na
zakładkę Statystyka – Statystyki podstawowe – wybieramy kartę opcje – zaznaczamy oba testy:
Levene’a i B-F.

10
Wprowadzenie do statystyki (ćwiczenia) Jerzy Gruszka
W Statistica jest też dostępna możliwość oszacowania wartości testu t w sytuacji gdy założenie
3 nie jest spełnione (o jednorodności wariancji). ---należy wtedy zaznaczyć opcję ---- test z niezal.
estymacją wariancji. Klikamy OK!

11
Wprowadzenie do statystyki (ćwiczenia) Jerzy Gruszka
Interpretację uzyskanych wyników zaczynamy od końca, czyli od testów sprawdzających czy
założenie o jednorodności wariancji jest spełnione. W teście B-F p=0,40, w teście Levene’a
p=0,248, w teście F p=0,533, czyli wartości p dla wszystkich testów są znacznie większe od α=0,05,
co NIE POZWALA NA ODRZUCENIE HIPOTEZY ZEROWEJ. Ponieważ hipoteza zerowa brzmi tak samo
jak testowane założenie o jednorodności wariancji w populacji, zatem założenie nie może zostać
odrzucone, zatem jest spełnione.
Dodatkowo widzimy , że obie grupy są równoliczne i liczą po 12 osobników każda, zatem wszystkie
założenia, od 1 do 4 zostały spełnione. Odchylenie standardowe wyników w grupie szczurów
wolnych wyniosła 30 błędów, a w grupie szczurów ograniczonych wyniosła 36,6 błędu.

 Teraz dopiero, po zbadaniu czy założenia testu t Studenta zostały spełnione, przechodzimy do
interpretacji samego wyniku w teście t=-2,205 oraz prawdopodobieństwa uzyskania takiego
wyniku lub mniejszego lub wyniku z plusem, czyli t=2,205 lub większego. To
prawdopodobieństwo p=0,0304, czyli p<α (α=0,05), co oznacza, że możemy z ryzkiem
popełnienia błędu I rodzaju mniejszym niż 0,05 (5%) odrzucić hipotezę zerową, że środowisko
nie wpływa na sprawność mentalną szczurów (czyli że średnia liczba błędów w grupie szczurów
wolnych i ograniczonych w populacji jest taka sama) i w jej miejsce przyjąć hipotezę
alternatywną, czyli że średnia liczba błędów w grupie szczurów wolnych i ograniczonych
w populacji jest różna, a więc środowisko hodowli szczurów wpływa na ich sprawność
mentalną. Szczury hodowane w środowisku bezklatkowym są sprawniejsze mentalnie niż
hodowane w klatkach (pierwsze z nich popełniają średnio mniej błędów niż drugie). To ostatnie
twierdzenie dotyczy całej populacji szczurów, nie tylko tych przebadanych (nie tylko próby
eksperymentalnej). Jeśli wynik w teście t Studenta jest „istotny statystycznie”, czyli p<α, to
program zaznaczy wynik na czerwono!

To jakie prawdopodobieństwo odpowiada wynikowi w teście t Studenta≤-2,205 lub t≥2,205 można


wyliczyć za pomocą odpowiedniego kalkulatora (dokładnie) lub znaleźć w odpowiednich
tablicach (wynik będzie wtedy podany raczej w przybliżeniu). Statistica dysponuje takim
kalkulatorem.

12
Wprowadzenie do statystyki (ćwiczenia) Jerzy Gruszka
Wybierając opcje rozkłady pojawia się okno kalkulatora:

13
Wprowadzenie do statystyki (ćwiczenia) Jerzy Gruszka
W kalkulatorze wybieramy rozkład testu t (Studenta)1

Następnie w polu t wpisujemy wartość testu t Studenta (z tabeli na stronie 12) t=-2,20505; oraz
df2=22 (również na podstawie tabeli na str. 12) , zaznaczamy obustronne oraz 1-p. klikamy oblicz i
otrzymujemy , jak poniżej:

1
Proszę dokładnie zapoznać się z własnościami rozkładu t Studenta na podstawie podręcznika.
2
df to degrees of freedom, czyli liczba stopni swobody. Pojęcie to zostanie omówione na zajęciach poświęconych
testowi ANOVA.
14
Wprowadzenie do statystyki (ćwiczenia) Jerzy Gruszka
W polu p pojawia się wartość p=0,38204, czyli taka sama jak w tabeli na str.12. Dodatkowo, proszę
zwrócić uwagę na wykres – funkcja gęstości, przedstawiający rozkład t Studenta. p=0,038204, to
pole powierzchni liczone od wartości t≥2,20505 plus pole powierzchni liczone od wartości
t≤-2,20505, które jest równe 0,038204, czyli obejmuje 3,82% powierzchni pod krzywą rozkładu
t Studenta.

15
Wprowadzenie do statystyki (ćwiczenia) Jerzy Gruszka
W przypadku, gdy układ danych w arkuszu wygląda tak:

Wybieramy test t dla prób niezależnych (wzg. zmiennych), bo dwie kolumny (zmienne) kodują
dwie porównywane grupy. Klikamy OK!.

16
Wprowadzenie do statystyki (ćwiczenia) Jerzy Gruszka
Dalsza analiza przebiega tak samo, jak w przypadku opisanym na str. 3-12, za wyjątkiem
sprawdzenia czy spełnione jest założenie o normalności rozkładu w populacji.
Założenie to badamy : zakładka Statystka----Statystyki podstawowe---Statystki opisowe:

Klikamy OK!

17
Wprowadzenie do statystyki (ćwiczenia) Jerzy Gruszka
W oknie statystyki opisowe przechodzimy na kartę normalność, zaznaczamy test Shapiro – Wilka
(a odznaczamy test normlaności K-S i Lilleforsa), a następnie klikamy klawisz histogramy.
W efekcie pojawiają się wykres histogramów dla dwóch porównywanych grup, a w tytule
wykresów wartości testu Shapiro – Wilka i odpowiadające im prawdopodobieństwa p. (oczywiście
takie same, ja na str. 10).

18
Wprowadzenie do statystyki (ćwiczenia) Jerzy Gruszka
19
Wprowadzenie do statystyki (ćwiczenia) Jerzy Gruszka

You might also like