Download as ppt, pdf, or txt
Download as ppt, pdf, or txt
You are on page 1of 37

Moduł

Testy statystycznej istotności


Testowanie przy użyciu
oprogramowania SPSS

Mgr Krzysztof Jurek


Sposoby doboru próby
Próby niezależne – porównujemy ze sobą w tym samym czasie dwie zbiorowości,
różniące się poziomem zmiennej niezależnej (np. klienci sklepu, mężczyźni i kobiety
itp.) Obie próby są odzwierciedleniem dwóch różnych populacji a struktura jednej z
nich nie ma żadnego wpływu na strukturę drugiej
Próby zależne –należą do tej samej grupy obiektów badanych, badane są wielokrotnie
w kolejnych jednostkach czasu lub w tym samym czasie gdy dokonujemy pomiaru
wielu zmiennych (np. ta sama grupa przed i po eksperymencie)
Testy statystycznej istotności
Przypuśćmy że dobraliśmy próbę losowo, nie martwimy
się że jest ona skrzywiona. Innym problemem jest błąd z
próby – oznacza on odchylenie charakterystyk próby
w stosunku do populacji (np. średniej, odchylenia
standardowego)
Badamy studentów socjologii pewnej uczelni, jest ich 70%
(mężczyzn), zaś w naszej próbie znalazło się ich 58% i to
jest właśnie błąd z próby (70% - 58%). Statystki z populacji
są niezmienne, statystyki dla każdej wylosowanej próby są
różne. Testy statystycznej istotności pozwolą nam określić,
czy różnica ta wynika z błędu z próby.
Zadaniem testów istotności jest wykrycie
istnienia istotnej różnicy lub jej braku
między wartościami parametrów (np.
wartościami średnimi, wariancjami)
charakteryzującymi różne próbki, wzorce,
metody analityczne.
Testowanie hipotez to systematyczna
procedura służąca do oceny, czy rezultaty
eksperymentu (przeprowadzonego na
próbie) popierają określoną teorię lub
praktyczną innowację (które będą odnosić
się do całej populacji).
Do czego służą testy t – użycie SPSS

• Testy t służą do porównywania średnich.

• Różnice istotne statystycznie - górną,


akceptowalną wartość przyjmuje się
zazwyczaj 5% (5 na 100 przypadków), a
zatem otrzymaną w raporcie SPSSa
istotność statystyczną musimy porównać z
poziomem równym 0,05

Jeśli otrzymana istotność jest niższa od tej


wartości, to znaczy, iż otrzymaliśmy różnice
istotne statystycznie!!!.
Istotność zależy od dwóch czynników:
- Różnica jest bardziej istotna, gdy
zbadamy więcej osób (bo im więcej
obserwacji, tym większa szansa, że nasze
przewidywania są trafne)
- Różnica jest mniej istotna, im większe
rozproszenie (odchylenie standardowe)
wyników w każdej z porównywanych grup
(bo im bardziej zróżnicowane są grupy, tym
mniejsza możliwość przewidywania wyniku
kolejnej osoby w grupie).
Rodzaje testów t
Test t dla prób niezależnych:
Służy do porównywania średnich uzyskanych w zmiennej zależnej przez dwie niezależne
od siebie grupy np. możemy porównać kobiety i mężczyzn pod względem średniej długości
życia.

Test t dla prób zależnych:


W tym przypadku porównujemy dwa wyniki uzyskane przez te same osoby – przykładem
może być klasyczny przypadek powtarzanego w czasie pomiaru: badamy zdolność
logicznego rozumowania przed studiami i po studiach – w badaniu biorą udział te same
osoby. Przy tym teście t możemy porównać też średnie na podstawie informacji
uzyskanych od jednej osoby.

Test t dla jednej próby:


Porównujemy średnią z jakiejś zmiennej z konkretną liczbą: np. chcemy sprawdzić, czy
średnie zarobki naszych badanych różnią się istotnie od 2000.
Test t dla dwóch prób niezależnych
• Większość hipotez badawczych głosi, że dwie
populacje różnią się między sobą.
Przetestowanie tego typu twierdzeń wymaga
odpowiedniej procedury statystycznej
Ćwiczenie 1
• 1. Otwórz w programie SPSS plik
GSS93podzbiór.sav
• 2. Interesować nas będzie porównanie kobiet i
mężczyzn pod względem wieku zawarcia
związku małżeńskiego, zatem nasze pytanie
badawcze będzie brzmiało: czy kobiety i
mężczyźni różnią się wiekiem w momencie
zawierania małżeństwa?
Przyjęcie hipotez badawczych:
(Przykłady - „Do biegu gotowi , start! Wprowadzenie do spss dla Windows”)

• Mężczyźni i kobiety różnią się wiekiem


zawarcia małżeństwa – hipoteza badawcza,
alternatywna
• Mężczyźni i kobiety nie różnią się wiekiem
zawarcia małżeństwa – hipoteza zerowa
• Po wyborze testu pojawi się okno zawierające
listę zmiennych 1) testowanych (zmiennej lub
zmiennych zależnych) – Test Variable(s)
• 2) zmiennej grupującej (zmienna niezależna) –
Grouping Variable

Z racji postawionych hipotez wybieramy


zmienną Płeć respondenta i czynimy ją
zmienną grupującą, zaś Wiek zawarcia
związku małżeńskiego zmienną testowaną
• UWAGA!!! Zmienna testowana powinna być
zmierzona na skali interwałowej albo ilorazowej
(wiek w tym przypadku jest mierzony na skali
interwałowej)

3) Przygotowanie analizy dopełniamy


zdefiniowaniem grupy - Define groups – dzięki
temu określamy, które grupy zostaną porównane

Zmienna płeć zdefiniowana jest następująco 1 –


mężczyzna, 2 – kobieta, grupę pierwszą tworzą
osoby z kodem 1 , grupę druga osoby z kodem 2
4) Klikamy OK, pojawia się Edytor raportów SPSS

5) Najważniejszy etap – Interpretacja wyników


Raport:
I część raportu to statystyki ogólne Syntax dla statystyk opisowych i
tabel krzyżowych

Wszystkie nasze analizy jesteśmy w stanie zrobić bez okienek, dzięki


zastosowaniu specjalnego języka poleceń Syntax.
Syntax dla Testu T dla
prób niezależnych
UWAGA DWA POZIOMY INTERPRETACJI:

• Pierwszy etap interpretacji to ocena


homogeniczności wariancji w obu populacjach

• Standardowa wersja testu zakłada, że wariancja


jest taka sama w obu populacjach. Test t dla prób
niezależnych sprawdza to założenie za pomocą
statystki F i testu Leven’a, poziom
prawdopodobieństwa p czyli
prawdopodobieństwo popełnienia błędu
pierwszego rodzaju.
• Odczytujemy istotność dla testu F: jeśli p jest
mniejsze od 0.05 to przyjmujemy, że
populacje mają różne wariancje (Equal
variances assumed) jeśli p jest większe od 0.05
to założenie równości da się utrzymać (Equal
variances not assumed) – innymi słowy jeśli p>
0.05 to należy oprzeć się na wynikach w
pierwszym wierszu , jeśli p<0.05 w drugim

• Nasz wynik to ,559 a więc jest >0.05, opieramy


się na wynikach w pierwszym wierszu
Interpretacja testu t
• Spoglądamy na poziom p (dwustronny), pozwala
on ocenić prawdopodobieństwo popełnienia
błędu pierwszego rodzaju
• Jeśli p jest mniejsze od założonego poziomu alfa
zwykle 0.05 lub bardziej rygorystycznie 0.01, to
powinniśmy odrzucić hipotezę zerową
• W naszym przypadku wynosi on 0.000 co
powinniśmy zapisać p<0.001, przyjmujemy
hipotezę, że kobiety i mężczyźni różnią się pod
względem wieku zawarcia związku małżeńskiego
a różnica ta jest istotna statystycznie.
ZAPIS: t(1200) = 8,06; p < 0,01
Df = 1202 - 2
Test dla dwóch prób zależnych
• Procedura ta służy do oszacowania, czy średnie
pochodzące z dwóch powiązanych ze sobą
populacji różnią się między sobą. Badacze
formułują często pytania typu: Czy uczestnicy
badania po otrzymaniu określonego
oddziaływania eksperymentalnego będą
zachowywali się inaczej niż przed poddaniem ich
oddziaływaniu?
• Schemat ten określa się jako test/retest
Test t-Studenta dla dwóch prób
zależnych
Czy µ1= µ2? Dwie próby zależne!!!
Czyli dwa razy te same
osoby, np. przed
manipulacją i po lub w
jakimś odstępie czasu

µ1 µ2
Ćwiczenie: Wyobraźmy sobie, że wprowadzamy na rynek reklamę,
przeprowadzamy eksperyment, interesuje nas czy reklama ma wpływ na
odbiorców pokazujemy więc produkt i pytamy o jego cechy, ilość cech
zapisujemy, to samo czynimy po emisji reklamy (po upływie jakiegoś
czas) , pytamy o cechy i zapisujemy ich liczbę. Czy jakiś czas emisji
reklamy zwiększa ilość cech przypisywanych produktowi?

Otwórzmy zbiór reklama.sav

Mamy tutaj do czynienia z dwoma etapami eksperymentu


Hipotezy badawcze jakie możemy postawić mogą być dwie:
Średnie przed i po emisji różnią się między sobą (test dwustronny)
Średnie różnią się między sobą, tak, że jedna jest większa od drugiej
(test jednostronny).

Uwaga: Zmienne muszą być na skali interwałowej lub ilorazowej


Procedura

Zmienna grupująca jest


nam niepotrzebna

Syntax dla naszej procedury


Pierwsza tabela to
statystyki opisowe

Druga tabela zawiera


informacje o korelacji
Syntax dla korelacji pomiędzy zmiennymi w
tym przypadku zależność
jest duża i istotna
statystycznie, r=0,82,
p<0,001
Interpretacja testu t: najważniejsze komórki to t, df, oraz istotność

t= -2,29 (minus dlatego, że średnia pierwszego pomiaru jest mniejsza od


średniej drugiego pomiaru

Df=39 (liczba par pomiarów minus 1 tj. 40-1)

Poziom istotności (dwustronny) = 0,028 odrzucamy hipotezę zerową


bezkierunkową mówiącą że brak jest różnic pomiędzy „przed i po”

Gdybyśmy postawili kierunkową hipotezę uzyskany wynik 0,028/2 = 0,014 i


dopiero wtedy porównujemy z p. W obu przypadkach należy odrzucić
hipotezy zerowe.
W przypadku testu jednostronnego całe
5% kumuluje nam się na jednej stronie
rozkładu stąd łatwiej odrzucić hipotezę
zerową - stąd konieczność rozsądnego
stawiania hipotez kierunkowych
Z dla 0,05 = 1,64

W teście dwustronnym 5% rozkłada się


po obu stronach rozkładu po 2,5 %, to
bezpieczniejsza „droga”. Test
jednostronny stosujemy wtedy, gdy
mamy pewność, że hipotezy zerowa i
alternatywna wyczerpują wszystkie
możliwe hipotezy, tzn.
prawdopodobieństwo, że prawdziwa
jest hipoteza zerowa lub alternatywna
jest równe 1. Użycie testu
jednostronnego w innym przypadku
zwiększa prawdopodobieństwo
przyjęcia hipotezy fałszywej, a więc
zwiększa błąd drugiego rodzaju.
Z dla 0,05 = 1,96
Podsumowanie
• Każdy test statystyczny ma swoje założenia.
Bez ich spełnienia nie powinniśmy go
przeprowadzać. W przypadku testów t,
założenia są takie:

1. Równoliczne grupy
2. Rozkład normalny zmiennej zależnej w
każdej grupie
3. Jednorodne wariancje
4. Ilościowa zmienna zależna
• Testy t są dosyć odporne na złamanie założeń.
Przyjmuje się, że jeśli grupy są równoliczne,
zaburzenie rozkładu oraz jednorodności
wariancji nie wpływa negatywnie na wyniki.
Jednak jeśli mamy istotnie nierównoliczne grupy
(np. liczebność jednej 1,5x przekracza
liczebność drugiej, lub otrzymamy istotny test
chi2), powinniśmy zamiast testu t wybrać jego
nieparametryczny odpowiednik. W psychologii
dosyć często stosuje się także quasi-ilościowe
zmienne zależne (skale Likerta itd.). W
przypadku zmiennych typowo porządkowych, jak
poziom wykształcenia, czy stopień w wojsku,
lepiej stosować testy nieparametryczne.
Aby sprawdzić założenia testów parametrycznych należy dokonać kilku
analiz.
Otwórzmy plik kwiat.sav
Wykorzystując zbiór „kwiaty”, możemy sprawdzić, czy badane grupy są
równoliczne: na skali 1-10 mierzono szerokość uśmiechu kobiet, którym 8
marca wręczono tulipana, lub różę. Okazało się, że tulipany są mniej
popularne i zbadano 17 kobiet z tulipanem i 27 z różą.
Sprawdźmy równoliczność grup testem chi - kwadrat
Zmienną niezależną (grupującą)
przerzucamy do okienka po
prawej stronie.

Domyślnie zaznaczona jest opcja


„wszystkie kategorie są równe”,
zatem SPSS będzie oczekiwał, że
każda kategoria będzie miała taką
samą liczebność. Można jednak
wpisać procentowe wartości dla
każdej kategorii i np. testować
założenie, że jednak kategoria jest
dwukrotnie liczniejsza od drugiej.

Syntax dla testu chi-


kwadrat
Po wykonaniu analizy otrzymujemy raport: Mieliśmy 44 badane kobiety, więc
przy równych kategoriach SPSS
oczekuje 22 kobiet w każdej
grupie. Rozkład otrzymany różni
się jednak od oczekiwanego. Im
większe są reszty, tym większe
różnice.
Mimo sporej różnicy kobiet w
grupach test chi2 okazał się
nieistotny. Możemy założyć, że
grupy są równoliczne.

Otrzymany wynik możemy


zapisać:

2(1) = 2,27; p > 0,05


Rozkład normalny
W przypadku testu t dla prób niezależnych, powinniśmy sprawdzić, czy zmienna zależna ma
rozkład normalny w obu grupach, przy teście t dla prób zależnych, obie zmienne powinny
mieć rozkład normalny.

Normalność rozkładu sprawdzamy np. testem Kołmogorowa-Smirnowa. W naszym przypadku


musimy posłużyć się podziałem na podzbiory, by wykonać test K-S oddzielnie dla kobiet z
różą i tulipanem (dane-podziel na podzbiory-porównaj grupy i wrzucamy zmienną „kwiat”)

Syntax
podziel grupy
Przeprowadzamy test K-S: Analiza – testy nieparametryczne – K-S dla
jednej próby
Przerzucamy zmienną „uśmiech” na prawo i naciskamy OK.

W naszym przypadku w grupie tulipanowej nie


ma żadnego problemu z rozkładem normalnym:
Z = 0,67; p>0,05. W grupie różanej istotność
wynosi Z=0,73: p>0,05.

Pamiętajmy, że im mniej osób, tym trudniej


odrzucić H0, a zatem stosowanie testu K-S, tak
jak przy innych testach statystycznych ma sens,
gdy badamy minimum 20-30 osób w jednym
warunku.

You might also like