SPSS

Moduł
Testy statystycznej istotności

Testowanie przy użyciu
oprogramowania SPSS
Mgr Krzysztof Jurek

Sposoby doboru próby
Próby niezależne – porównujemy ze sobą w tym samym czasie dwie zbiorowości,
różniące się poziomem zmiennej niezależnej (np. klienci sklepu, mężczyźni i kobiety
itp.) Obie próby są odzwierciedleniem dwóch różnych populacji a struktura jednej z
nich nie ma żadnego wpływu na strukturę drugiej
Próby zależne –należą do tej samej grupy obiektów badanych, badane są wielokrotnie
w kolejnych jednostkach czasu lub w tym samym czasie gdy dokonujemy pomiaru
wielu zmiennych (np. ta sama grupa przed i po eksperymencie)
Testy statystycznej istotności
Przypuśćmy że dobraliśmy próbę losowo, nie martwimy
się że jest ona skrzywiona. Innym problemem jest błąd z
próby – oznacza on odchylenie charakterystyk próby
w stosunku do populacji (np. średniej, odchylenia
standardowego)
Badamy studentów socjologii pewnej uczelni, jest ich 70%
(mężczyzn), zaś w naszej próbie znalazło się ich 58% i to
jest właśnie błąd z próby (70% - 58%). Statystki z populacji
są niezmienne, statystyki dla każdej wylosowanej próby są
różne. Testy statystycznej istotności pozwolą nam określić,
czy różnica ta wynika z błędu z próby.
Zadaniem testów istotności jest wykrycie
istnienia istotnej różnicy lub jej braku
między wartościami parametrów (np.
wartościami średnimi, wariancjami)
charakteryzującymi różne próbki, wzorce,
metody analityczne.
Testowanie hipotez to systematyczna
procedura służąca do oceny, czy rezultaty
eksperymentu (przeprowadzonego na
próbie) popierają określoną teorię lub
praktyczną innowację (które będą odnosić
się do całej populacji).
Do czego służą testy t – użycie SPSS
• Testy t służą do porównywania średnich.
• Różnice istotne statystycznie - górną,

akceptowalną wartość przyjmuje się
zazwyczaj 5% (5 na 100 przypadków), a
zatem otrzymaną w raporcie SPSSa
istotność statystyczną musimy porównać z
poziomem równym 0,05
Jeśli otrzymana istotność jest niższa od tej

wartości, to znaczy, iż otrzymaliśmy różnice
istotne statystycznie!!!.
Istotność zależy od dwóch czynników:
- Różnica jest bardziej istotna, gdy
zbadamy więcej osób (bo im więcej
obserwacji, tym większa szansa, że nasze
przewidywania są trafne)
- Różnica jest mniej istotna, im większe
rozproszenie (odchylenie standardowe)
wyników w każdej z porównywanych grup
(bo im bardziej zróżnicowane są grupy, tym
mniejsza możliwość przewidywania wyniku
kolejnej osoby w grupie).
Rodzaje testów t
Test t dla prób niezależnych:
Służy do porównywania średnich uzyskanych w zmiennej zależnej przez dwie niezależne
od siebie grupy np. możemy porównać kobiety i mężczyzn pod względem średniej długości
życia.
Test t dla prób zależnych:

W tym przypadku porównujemy dwa wyniki uzyskane przez te same osoby – przykładem
może być klasyczny przypadek powtarzanego w czasie pomiaru: badamy zdolność
logicznego rozumowania przed studiami i po studiach – w badaniu biorą udział te same
osoby. Przy tym teście t możemy porównać też średnie na podstawie informacji
uzyskanych od jednej osoby.
Test t dla jednej próby:

Porównujemy średnią z jakiejś zmiennej z konkretną liczbą: np. chcemy sprawdzić, czy
średnie zarobki naszych badanych różnią się istotnie od 2000.
Test t dla dwóch prób niezależnych
• Większość hipotez badawczych głosi, że dwie
populacje różnią się między sobą.
Przetestowanie tego typu twierdzeń wymaga
odpowiedniej procedury statystycznej
Ćwiczenie 1
• 1. Otwórz w programie SPSS plik
GSS93podzbiór.sav
• 2. Interesować nas będzie porównanie kobiet i
mężczyzn pod względem wieku zawarcia
związku małżeńskiego, zatem nasze pytanie
badawcze będzie brzmiało: czy kobiety i
mężczyźni różnią się wiekiem w momencie
zawierania małżeństwa?
Przyjęcie hipotez badawczych:
(Przykłady - „Do biegu gotowi , start! Wprowadzenie do spss dla Windows”)
• Mężczyźni i kobiety różnią się wiekiem

zawarcia małżeństwa – hipoteza badawcza,
alternatywna
• Mężczyźni i kobiety nie różnią się wiekiem
zawarcia małżeństwa – hipoteza zerowa
• Po wyborze testu pojawi się okno zawierające
listę zmiennych 1) testowanych (zmiennej lub
zmiennych zależnych) – Test Variable(s)
• 2) zmiennej grupującej (zmienna niezależna) –
Grouping Variable
Z racji postawionych hipotez wybieramy

zmienną Płeć respondenta i czynimy ją
zmienną grupującą, zaś Wiek zawarcia
związku małżeńskiego zmienną testowaną
• UWAGA!!! Zmienna testowana powinna być
zmierzona na skali interwałowej albo ilorazowej
(wiek w tym przypadku jest mierzony na skali
interwałowej)
3) Przygotowanie analizy dopełniamy

zdefiniowaniem grupy - Define groups – dzięki
temu określamy, które grupy zostaną porównane
Zmienna płeć zdefiniowana jest następująco 1 –

mężczyzna, 2 – kobieta, grupę pierwszą tworzą
osoby z kodem 1 , grupę druga osoby z kodem 2
4) Klikamy OK, pojawia się Edytor raportów SPSS
5) Najważniejszy etap – Interpretacja wyników

Raport:
I część raportu to statystyki ogólne Syntax dla statystyk opisowych i
tabel krzyżowych
Wszystkie nasze analizy jesteśmy w stanie zrobić bez okienek, dzięki

zastosowaniu specjalnego języka poleceń Syntax.
Syntax dla Testu T dla
prób niezależnych
UWAGA DWA POZIOMY INTERPRETACJI:
• Pierwszy etap interpretacji to ocena

homogeniczności wariancji w obu populacjach
• Standardowa wersja testu zakłada, że wariancja

jest taka sama w obu populacjach. Test t dla prób
niezależnych sprawdza to założenie za pomocą
statystki F i testu Leven’a, poziom
prawdopodobieństwa p czyli
prawdopodobieństwo popełnienia błędu
pierwszego rodzaju.
• Odczytujemy istotność dla testu F: jeśli p jest
mniejsze od 0.05 to przyjmujemy, że
populacje mają różne wariancje (Equal
variances assumed) jeśli p jest większe od 0.05
to założenie równości da się utrzymać (Equal
variances not assumed) – innymi słowy jeśli p>
0.05 to należy oprzeć się na wynikach w
pierwszym wierszu , jeśli p<0.05 w drugim
• Nasz wynik to ,559 a więc jest >0.05, opieramy

się na wynikach w pierwszym wierszu
Interpretacja testu t
• Spoglądamy na poziom p (dwustronny), pozwala
on ocenić prawdopodobieństwo popełnienia
błędu pierwszego rodzaju
• Jeśli p jest mniejsze od założonego poziomu alfa
zwykle 0.05 lub bardziej rygorystycznie 0.01, to
powinniśmy odrzucić hipotezę zerową
• W naszym przypadku wynosi on 0.000 co
powinniśmy zapisać p<0.001, przyjmujemy
hipotezę, że kobiety i mężczyźni różnią się pod
względem wieku zawarcia związku małżeńskiego
a różnica ta jest istotna statystycznie.
ZAPIS: t(1200) = 8,06; p < 0,01
Df = 1202 - 2
Test dla dwóch prób zależnych
• Procedura ta służy do oszacowania, czy średnie
pochodzące z dwóch powiązanych ze sobą
populacji różnią się między sobą. Badacze
formułują często pytania typu: Czy uczestnicy
badania po otrzymaniu określonego
oddziaływania eksperymentalnego będą
zachowywali się inaczej niż przed poddaniem ich
oddziaływaniu?
• Schemat ten określa się jako test/retest
Test t-Studenta dla dwóch prób
zależnych
Czy µ1= µ2? Dwie próby zależne!!!
Czyli dwa razy te same
osoby, np. przed
manipulacją i po lub w
jakimś odstępie czasu
µ1 µ2
Ćwiczenie: Wyobraźmy sobie, że wprowadzamy na rynek reklamę,
przeprowadzamy eksperyment, interesuje nas czy reklama ma wpływ na
odbiorców pokazujemy więc produkt i pytamy o jego cechy, ilość cech
zapisujemy, to samo czynimy po emisji reklamy (po upływie jakiegoś
czas) , pytamy o cechy i zapisujemy ich liczbę. Czy jakiś czas emisji
reklamy zwiększa ilość cech przypisywanych produktowi?
Otwórzmy zbiór reklama.sav
Mamy tutaj do czynienia z dwoma etapami eksperymentu

Hipotezy badawcze jakie możemy postawić mogą być dwie:
Średnie przed i po emisji różnią się między sobą (test dwustronny)
Średnie różnią się między sobą, tak, że jedna jest większa od drugiej
(test jednostronny).
Uwaga: Zmienne muszą być na skali interwałowej lub ilorazowej

Procedura
Zmienna grupująca jest

nam niepotrzebna
Syntax dla naszej procedury

Pierwsza tabela to
statystyki opisowe
Druga tabela zawiera

informacje o korelacji
Syntax dla korelacji pomiędzy zmiennymi w
tym przypadku zależność
jest duża i istotna
statystycznie, r=0,82,
p<0,001
Interpretacja testu t: najważniejsze komórki to t, df, oraz istotność
t= -2,29 (minus dlatego, że średnia pierwszego pomiaru jest mniejsza od

średniej drugiego pomiaru
Df=39 (liczba par pomiarów minus 1 tj. 40-1)
Poziom istotności (dwustronny) = 0,028 odrzucamy hipotezę zerową

bezkierunkową mówiącą że brak jest różnic pomiędzy „przed i po”
Gdybyśmy postawili kierunkową hipotezę uzyskany wynik 0,028/2 = 0,014 i

dopiero wtedy porównujemy z p. W obu przypadkach należy odrzucić
hipotezy zerowe.
W przypadku testu jednostronnego całe
5% kumuluje nam się na jednej stronie
rozkładu stąd łatwiej odrzucić hipotezę
zerową - stąd konieczność rozsądnego
stawiania hipotez kierunkowych
Z dla 0,05 = 1,64
W teście dwustronnym 5% rozkłada się

po obu stronach rozkładu po 2,5 %, to
bezpieczniejsza „droga”. Test
jednostronny stosujemy wtedy, gdy
mamy pewność, że hipotezy zerowa i
alternatywna wyczerpują wszystkie
możliwe hipotezy, tzn.
prawdopodobieństwo, że prawdziwa
jest hipoteza zerowa lub alternatywna
jest równe 1. Użycie testu
jednostronnego w innym przypadku
zwiększa prawdopodobieństwo
przyjęcia hipotezy fałszywej, a więc
zwiększa błąd drugiego rodzaju.
Z dla 0,05 = 1,96
Podsumowanie
• Każdy test statystyczny ma swoje założenia.
Bez ich spełnienia nie powinniśmy go
przeprowadzać. W przypadku testów t,
założenia są takie:
1. Równoliczne grupy
2. Rozkład normalny zmiennej zależnej w
każdej grupie
3. Jednorodne wariancje
4. Ilościowa zmienna zależna
• Testy t są dosyć odporne na złamanie założeń.
Przyjmuje się, że jeśli grupy są równoliczne,
zaburzenie rozkładu oraz jednorodności
wariancji nie wpływa negatywnie na wyniki.
Jednak jeśli mamy istotnie nierównoliczne grupy
(np. liczebność jednej 1,5x przekracza
liczebność drugiej, lub otrzymamy istotny test
chi2), powinniśmy zamiast testu t wybrać jego
nieparametryczny odpowiednik. W psychologii
dosyć często stosuje się także quasi-ilościowe
zmienne zależne (skale Likerta itd.). W
przypadku zmiennych typowo porządkowych, jak
poziom wykształcenia, czy stopień w wojsku,
lepiej stosować testy nieparametryczne.
Aby sprawdzić założenia testów parametrycznych należy dokonać kilku
analiz.
Otwórzmy plik kwiat.sav
Wykorzystując zbiór „kwiaty”, możemy sprawdzić, czy badane grupy są
równoliczne: na skali 1-10 mierzono szerokość uśmiechu kobiet, którym 8
marca wręczono tulipana, lub różę. Okazało się, że tulipany są mniej
popularne i zbadano 17 kobiet z tulipanem i 27 z różą.
Sprawdźmy równoliczność grup testem chi - kwadrat
Zmienną niezależną (grupującą)
przerzucamy do okienka po
prawej stronie.
Domyślnie zaznaczona jest opcja

„wszystkie kategorie są równe”,
zatem SPSS będzie oczekiwał, że
każda kategoria będzie miała taką
samą liczebność. Można jednak
wpisać procentowe wartości dla
każdej kategorii i np. testować
założenie, że jednak kategoria jest
dwukrotnie liczniejsza od drugiej.
Syntax dla testu chi-

kwadrat
Po wykonaniu analizy otrzymujemy raport: Mieliśmy 44 badane kobiety, więc
przy równych kategoriach SPSS
oczekuje 22 kobiet w każdej
grupie. Rozkład otrzymany różni
się jednak od oczekiwanego. Im
większe są reszty, tym większe
różnice.
Mimo sporej różnicy kobiet w
grupach test chi2 okazał się
nieistotny. Możemy założyć, że
grupy są równoliczne.
Otrzymany wynik możemy

zapisać:
2(1) = 2,27; p > 0,05

Rozkład normalny
W przypadku testu t dla prób niezależnych, powinniśmy sprawdzić, czy zmienna zależna ma
rozkład normalny w obu grupach, przy teście t dla prób zależnych, obie zmienne powinny
mieć rozkład normalny.
Normalność rozkładu sprawdzamy np. testem Kołmogorowa-Smirnowa. W naszym przypadku

musimy posłużyć się podziałem na podzbiory, by wykonać test K-S oddzielnie dla kobiet z
różą i tulipanem (dane-podziel na podzbiory-porównaj grupy i wrzucamy zmienną „kwiat”)
Syntax
podziel grupy
Przeprowadzamy test K-S: Analiza – testy nieparametryczne – K-S dla
jednej próby
Przerzucamy zmienną „uśmiech” na prawo i naciskamy OK.
W naszym przypadku w grupie tulipanowej nie

ma żadnego problemu z rozkładem normalnym:
Z = 0,67; p>0,05. W grupie różanej istotność
wynosi Z=0,73: p>0,05.
Pamiętajmy, że im mniej osób, tym trudniej

odrzucić H0, a zatem stosowanie testu K-S, tak
jak przy innych testach statystycznych ma sens,
gdy badamy minimum 20-30 osób w jednym
warunku.

SPSS

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

SPSS

Uploaded by

Copyright:

Available Formats

Moduł

Testy statystycznej istotności

Mgr Krzysztof Jurek

• Testy t służą do porównywania średnich.

• Różnice istotne statystycznie - górną,

Jeśli otrzymana istotność jest niższa od tej

Test t dla prób zależnych:

Test t dla jednej próby:

• Mężczyźni i kobiety różnią się wiekiem

Z racji postawionych hipotez wybieramy

3) Przygotowanie analizy dopełniamy

Zmienna płeć zdefiniowana jest następująco 1 –

5) Najważniejszy etap – Interpretacja wyników

Wszystkie nasze analizy jesteśmy w stanie zrobić bez okienek, dzięki

• Pierwszy etap interpretacji to ocena

• Standardowa wersja testu zakłada, że wariancja

• Nasz wynik to ,559 a więc jest >0.05, opieramy

Otwórzmy zbiór reklama.sav

Mamy tutaj do czynienia z dwoma etapami eksperymentu

Uwaga: Zmienne muszą być na skali interwałowej lub ilorazowej

Zmienna grupująca jest

Syntax dla naszej procedury

Druga tabela zawiera

t= -2,29 (minus dlatego, że średnia pierwszego pomiaru jest mniejsza od

Df=39 (liczba par pomiarów minus 1 tj. 40-1)

Poziom istotności (dwustronny) = 0,028 odrzucamy hipotezę zerową

Gdybyśmy postawili kierunkową hipotezę uzyskany wynik 0,028/2 = 0,014 i

W teście dwustronnym 5% rozkłada się

Domyślnie zaznaczona jest opcja

Syntax dla testu chi-

Otrzymany wynik możemy

2(1) = 2,27; p > 0,05

Normalność rozkładu sprawdzamy np. testem Kołmogorowa-Smirnowa. W naszym przypadku

W naszym przypadku w grupie tulipanowej nie

Pamiętajmy, że im mniej osób, tym trudniej

You might also like