Seminár VII.

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 10

Seminár VII.

– Porovnanie dvoch ordinálnych / kardinálnych premenných


v medzisubjektovom (between-subject) a vnútrosubjektovom (within-subject) designe

Medzisubjektové porovnanie skupín

Vnútrosubjektové porovnanie skupín


VNÚTROSUBJEKTOVÉ porovnanie dvoch ordinálnych / kardinálnych premenných

V prípade, že sa v našom výskume zaujímame o porovnanie dvoch závislých skupín alebo


podmienok (závislých = v skupinách / podmienkach na nachádzali tí istí ľudia), potom
správnym štatistickým testom pre takéto porovnanie je párový t-test alebo Wilcoxonov test.
Prvý z nich používame v prípade, že robíme vnútrosubjektové porovnanie dvoch podmienok
v kardinálnej normálne rozloženej premennej. Wilcoxonov test používame v prípade, že
robíme vnútrosubjektové porovnanie dvoch podmienok v ordinálnej, alebo kardinálnej no
nenormálne rozloženej premenne. Celý postup analýzy dát pri oboch testoch je ukázaný nižšie
na dvoch príkladoch.

Vnútrosubjektové porovnanie 2 kardinálnych normálne rozložených premenných:


príklad postupu pri výpočte párového t-testu

Povedzme, že by sme sa vo výskume zaujímali o to, ako sa všeobecné znalosti študentov


vyvíjajú počas prvého roku ich vysokoškolského štúdia. Mohli by sme napríklad zostrojiť dva
ekvivalentné testy všeobecných znalostí s 20 otázkami, z ktorých jeden by sme študentom dali
vyplniť na začiatku prvého semestra ich štúdia a druhý by sme im dali vyplniť na konci
druhého semestra ich štúdia. Predpokladali by sme, že skóre študentov v teste všeobecných
znalostí pri druhom meraní („TestVZ2“) bude významne vyššie, ako bolo ich skóre pri prvom
meraní („TestVZ“). Nakoľko všetci participanti absolvovali obe merania, ide
o vnútrosubjektový design, musíme preto použiť test na porovnanie dvoch závislých skupín,
ktorý je všeobecne známy pod názvom „párový“ t-test. Ako prvé si opíšeme naše dve
premenné, v ktorých sa nachádzajú výsledky študentov v teste všeobecných znalostí v rámci
prvého (začiatok roka) a druhého merania (koniec roka). Opis by mohol vyzerať nasledovne:

Participanti (N = 60) vypĺňali dve verzie testu všeobecných znalostí s 20 otázkami – prvú
verziu vyplnili na začiatku roka, druhú na konci prvého roka štúdia. Kolmogorov-Smirnov
test ukázal, že zatiaľ čo skóra participantov boli normálne rozložené pri prvom meraní, D(60)
= 0,094; p = 0,200; v rámci druhého merania boli výsledky testu všeobecných znalostí
rozložené nenormálne, D(60) = 0,124; p = 0,023***. Participanti dosahovali v rámci druhého
testovania lepšie výsledky (M = 11,6; SD = 3,66), ako počas prvého testu všeobecných
znalostí (M = 10,8; SD = 3,92).

*** POZOR! nakoľko v rámci druhého merania boli skóra v teste všeobecných znalostí
rozložené nenormálne, na porovnanie výsledkov v prvom a druhom teste všeobecných
znalostí by sme museli použiť neparametrický Wilcoxonov test (opísaný nižšie). Keďže
v našich skúšobných dátach sa ale nenachádzajú žiadne iné premenné, na ktorých by sme
mohli opísať postup pri výpočte párového t-testu, ukážeme si ho na príklade premenných
„TestVZ“ a „TestVZ2“, napriek tomu, že jedna z nich je rozložená nenormálne. V tomto
príklade sa preto k premennej „TestVZ2“ budeme správať tak, ako keby bola rozložená
normálne (v rámci opisu, vizualizácie, aj výberu štatistického testu). Zapamätajte si však, že
použitie párového t-testu je správne iba v prípade, že sú hodnoty premennej v oboch
skupinách alebo podmienkach rozložené normálne.
Ako vidieť z opisu premenných, participanti skutočne dosahovali počas druhého testovania
lepšie výsledky v teste všeobecných znalostí, ako počas testovania prvého. Na to, aby sme
zistili, či je tento rozdiel štatisticky významný, musíme ale previesť párový t-test. Ten
získame pomocou funkcie Analyze > Compare Means > Paired Samples T Test. Po kliknutí
na túto funkciu sa nám zjaví nasledujúce okno:

Pre získanie výsledkov párového t-testu pre porovnanie výsledkov v teste všeobecných
znalostí pri prvom a druhom testovaní participantov musíme spraviť jedinú vec – vybrať našu
premennú „TestVZ“ a presunúť ju do kolónky „Variable 1“ a následne vybrať druhú
premennú „TestVZ2“ a presunúť ju do kolónky „Variable2“. Ďalej už len stačí funkciu
potvrdiť pomocou „OK“ a v outpute v SPSS by sa nám mala zjaviť nesledujúca tabuľka
s výsledkami párového t-testu:

V tabuľke sa sústredíme najmä na tri hodnoty označené ako „t“, „df“ a „Sig. (2-tailed)“. Tieto
predstavujú hodnotu testovej štatistiky („t“), počet stupňov voľnosti („df“) a štatistickú
významnosť rozdielu medzi dvoma meraniami („p“). Nakoľko párový t-test testuje nulovú
hypotézu, že medzi skupinami, resp. meraniami, neexistuje žiadny rozdiel, hodnota
štatistickej významnosti menšia ako p = 0,05 znamená zamietnutie nulovej hypotézy
a priklonenie sa k výskumnej hypotéze, teda k prítomnosti významného rozdielu. Keďže
hodnota signifikancie je v našom prípade p = 0,002; konštatovali by sme, že medzi prvým
a druhým testovaním študentov v teste všeobecných znalostí naozaj existoval štatisticky
významný rozdiel. Nakoľko už z deskripcie premenných vieme, že participanti zodpovedali
v priemere viac otázok správne v druhom meraní (v premennej „TestVz2“) ako v prvom
meraní („TestVZ“) môžeme povedať, že všeobecné znalosti participantov sa skutočne zlepšili
v priebehu ich prvého roka vysokoškolského štúdia. Ak by výsledná hodnota signifikancie
v tabuľke bola vyššia ako p = 0,05 (napr. p = 0,215), potom by sme nulovú hypotézu
nezamietli a usúdili by sme, že medzi dvoma meraniami neexistuje štatisticky významný
rozdiel.

Uvádzanie výsledkov párového t-testu

Pri uvádzaní výsledkov párového t-testu postupujeme veľmi podobne, ako sme sa naučili
v prípade nezávislého t-testu v osnove z predchádzajúceho seminára. Vo výsledkoch musíme
uviesť označenie testu („t“), stupne voľnosti (stĺpec označený „df“), hodnotu testovej
štatistiky (stĺpec označený „t“) a hodnotu štatistickej významnosti. Okrem výsledkov
samotného testu treba samozrejme uviesť tiež opis premenných, alebo zobraziť rozdiely
medzi dvoma porovnávanými skupinami, resp. podmienkami v grafe (návod na výrobu grafu
pri párovom t-teste sa nachádza nižšie). Príkladom zápisu analýzy z tohto príkladu je:

Participanti (N = 60) vypĺňali dve verzie testu všeobecných znalostí s 20 otázkami – prvú
verziu vyplnili na začiatku roka, druhú na konci prvého roka štúdia. Kolmogorov-Smirnov
test ukázal, že zatiaľ čo skóra participantov boli normálne rozložené pri prvom meraní, D(60)
= 0,094; p = 0,200; v rámci druhého merania boli výsledky testu všeobecných znalostí
rozložené nenormálne, D(60) = 0,124; p = 0,023. V rámci druhého testovania dosahovali
participanti štatisticky významne lepšie výsledky (M = 11,6; SD = 3,66), ako počas prvého
testu všeobecných znalostí (M = 10,8; SD = 3,92), t(59) = –3,212; p = 0,002.

Veľkosť efektu (vecná významnosť)

Okrem hodnoty štatistickej významnosti by sme pri výsledkoch párového t-testu mali uvádzať
tiež hodnotu veľkosti rozdielu medzi podmienkami, teda hodnotu vecnej významnosti, ktorá
sa pri tomto type testu zvykne vyjadrovať pomocou Cohenovho d. Ide o rovnakú mieru vecnej
významnosti ako pri nezávislom t-teste, jej výpočet je však trochu iný, nakoľko v prípade
párového t-testu je potrebné použiť vzorec ktorý počíta s tým, že v dvoch podmienkach
s nachádzajú tí istí participanti (teda, že ide o vnútrosubjektový design). Našťastie, výpočet
Cohenovho d vieme jednoducho získať pomocou online kalkulačky dostupnej na stránke:
https://www.psychometrica.de/effect_size.html kde z ponuky výpočtov musíme v prípade
párového t-testu zvoliť 4. možnosť: Effect size estimates in repeated measures designs. Pre
výpočet vecnej významnosti v tomto prípade musíme do kalkulačky zadať priemery
a štandardné odchýlky skór v prvej a druhej porovnávanej podmienke a taktiež vzájomnú
koreláciu medzi hodnotami získanými v prvej a druhej podmienke. Našťastie, všetky tieto
hodnoty máme jednoducho prístupné v samotnom outpute z funkcie, ktorá nám vypočíta
párový t-test:
Vyznačené hodnoty treba jednoducho prepísať, alebo prekopírovať do príslušných polí
v online kalkulačke podľa príkladu nižšie:

Po prepísaní hodnôt sa nám v kalkulačke automaticky objaví hodnota Cohenovho d


(kalkulačka vypočíta dve hodnoty, stačí si ale všímať druhú z nich, ktorá je vyznačená
v obrázku vyššie). Výslednú hodnotu Cohenovho d môžeme interpretovať podľa rovnakej
tabuľky, ktorá bola uvedená v prípade nezávislého t-testu, teda:

d < 0,2: zanedbateľný rozdiel

d = 0,2 – 0,5: malý rozdiel

d = 0,5 – 0,8: stredne veľký rozdiel

d > 0,8: veľký rozdiel

Teda, výsledná hodnota v našom prípade (d = 0,418) by sa dala interpretovať ako malý
rozdiel medzi prvým a druhým testovaním všeobecných znalostí. Po výpočte tejto hodnoty ju
stačí pri uvádzaní výsledkov nezávislého t-testu jednoducho dosadiť na koniec výsledkov:
V rámci druhého testovania dosahovali participanti lepšie výsledky (M = 11,6; SD = 3,66),
ako počas prvého testu všeobecných znalostí (M = 10,8; SD = 3,92). Rozdiel medzi dvoma
meraniami bol síce malý, ale štatisticky významný, t(59) = –3,212; p = 0,002; d = 0,418.

Grafické zobrazenie rozdielov medzi skupinami – stĺpcový graf s chybovými úsečkami

Vizualizácia rozdielov medzi skupinami, resp. podmienkami, pri párovom t-teste prebieha
veľmi podobne ako v prípade nezávislého t-testu. Správnym typom grafu na porovnanie
rozdielov medzi dvoma podmienkami v prípade že pracujeme s kardinálnymi normálne
rozloženými premennými je stĺpcový graf s chybovými úsečkami, ktorý získame pomocou
funkcie Graphs > Chart Builder. Na rozdiel prípadu, kedy sme medzi sebou porovnávali dve
nezávislé skupiny, pri vytváraní grafu pre porovnanie dvoch závislých skupín musíme vybrať
obe premenné, ktoré chceme porovnať („TestVZ“ a „TestVZ2“) a vložiť ich do kolónky „Y-
axis“. Po vložení dvoch premenných sa nám otvorí dialógové okno, ktoré stačí jednoducho
odkliknúť „OK“. Os X necháme v tomto prípade prázdnu, avšak v okne napravo zaškrtneme
možnosť „Display error bars“ pre získanie chybových úsečiek a túto voľbu potvrdíme
tlačítkom „Apply“. Takto pripravený graf stačí spustiť pomocou „OK“.

V outpute z funkcie by sa nám mal zjaviť stĺpcový graf s chybovými úsečkami zobrazujúcimi
95% interval spoľahlivosti okolo priemeru, ktorý porovnáva rozdiely v skórach v teste
všeobecných znalostí v rámci prvého a druhého merania. Tento typ grafu môžeme, rovnako
ako pri nezávislom t-teste, použiť na vizuálne preskúmanie rozdielov medzi dvoma skupinami
o ktoré sa zaujímame, alebo ho môžeme v práci uviesť ako dodatok k opisu našich
premenných.
Vnútrosubjektové porovnanie 2 ordinálnych, alebo kardinálnych nenormálne
rozložených premenných: príklad postupu pri výpočte Wilcoxonovho testu

Wilcoxonov test pre porovnanie dvoch závislých skupín by sme mohli použiť napríklad
v prípade, že by sme sa v našom výskume zaujímali o to, či existujú rozdiely medzi
participantmi v uvádzanej spokojnosti s vlastným životom v lete (premenná „Spokoj“) a v zime
(premenná „Spokoj2“). Povedzme že by sme napríklad predpokladali, že ľudia zvyknú v zime
uvádzať nižšiu spokojnosť s vlastným životom ako v lete, nakoľko ich trápia kratšie dni,
škaredšie počasie a zvýšený stres spojený s prípravou na vianočné sviatky. Mohli by sme teda
do výskumu nazbierať 60 ľudí, ktorých by sme poprosili, aby zhodnotili svoj vlastnú
spokojnosť so životom na škále od – 4 (úplne nespokojný/á) po 4 (úplne spokojný/spokojná)
najskôr v lete, a potom by sme ich kontaktovali a poprosili ich, aby vyplnili rovnakú škálu
spokojnosti so životom v strede zimy. Následne by sme chceli porovnať, či sa hodnoty, ktoré
rovnakí participanti uvádzali v lete a v zime od seba štatisticky významne líšili. Vzhľadom na
to, že sebaposúdenie spokojnosti so životom bolo merané na vyššie uvedenej škále, ide
o ordinálnu premennú, preto pre porovnanie použijeme Wilcoxonov test. Tak ako pri každom
inom teste je nevyhnutné si naše premenné najskôr opísať. Vzhľadom na to, že ide
o premenné ordinálneho typu, nemusíme zisťovať normalitu ich rozloženia, stačí zistiť
strednú hodnotu a interkvartilové rozpätie pre obe merania (v lete a v zime). Výsledky
deskripcie by sme mohli spísať nasledovne:

Na výskume sa zúčastnilo 60 participantov, ktorí vyplnili rovnakú škálu spokojnosti so


životom najskôr v lete a potom v zime. Na škále od – 4 po 4 uvádzali participanti približne
rovnakú spokojnosť so životom v lete (Mdn = 2; IQR = 2), ako v zime (Mdn = 2; IQR = 2).

Už na základe deskripcie vidíme, že stredné hodnoty spokojnosti so životom sa


u participantov v lete a v zime nelíšili, avšak napriek tomu musíme na zodpovedanie našej
výskumnej otázky spraviť vhodný štatistický test. Wilcoxonov test získame pomocou funkcie
Analyze > Nonparametric Tests > Legacy Dialogs > 2 Related Samples. Po otvorení funkcie
sa nám zjaví nasledujúce okno:
Nakoľko vpravo dole, v kolónke „Test Type“ mám už ako predvolený nastavený správny typ
testu („Wilcoxon“), jediné čo musíme spraviť, je vybrať z ponuky dve premenné, ktoré
chceme pomocou tohto testu porovnať. Aby sme porovnali rozdiely participantov v uvádzanej
spokojnosti so životom merané v lete a zime, vyberieme premennú „Spokoj“ a vložíme ju do
poľa „Variable 1“ a následne vyberieme premennú „Spokoj2“ a vložíme ju do poľa „Variable
2“ podľa obrázku vyššie. Následne stačí funkciu potvrdiť pomocou „OK“. V outpute v SPSS
by sa nám okrem iného mali zjaviť aj nasledujúce výsledky Wilcoxonovho testu:

Tabuľka výsledkov obsahuje dve hodnoty – samotnú hodnotu testovej štatistiky (označenú
ako „Z“) a hodnotu štatistickej významnosti rozdielu medzi dvoma testovanými skupinami
(štatistickú významnosť – „Asymp. Sig (2-tailed)“). Tak, ako tomu bolo pri ostatných testoch
na porovnanie rozdielov medzi dvoma skupinami, aj Wilcoxonov test slúži na otestovanie
nulovej hypotézy, že v stredných hodnotách v dvoch testovaných skupinách neexistuje
významný rozdiel, teda, že neexistuje rozdiel medzi spokojnosťou so životom uvádzanej
v lete a v zime. Hodnoty štatistickej významnosti nižšie ako p = 0,05 preto znamenajú
zamietnutie nulovej hypotézy a usúdenie, že medzi dvoma podmienkami existuje
štatisticky významný rozdiel. Nakoľko hodnota pravdepodobnosti je v našom prípade vyššia
ako p = 0,05 (konkrétne p = 0,146), nulovú hypotézu nezamietame a preto konštatujeme, že
neexistuje významný rozdiel v spokojnosti so životom, ktorú participanti uvádzali v lete
a v zime.

Uvádzanie výsledkov Wilcoxonovho testu

Spísanie výsledkov Wilcoxonovho testu je veľmi ľahké, nakoľko je potrebné uviesť iba
hodnotu testovej štatistiky (označenú ako „Z“) a jej úroveň štatistickej významnosti („p“).
Okrem samotných výsledkov testu však samozrejme treba uviesť aj opis premenných v texte,
alebo prípadne čitateľovi poskytnúť graf v ktorom sú zobrazené rozdiely medzi dvoma
podmienkami. Výsledky porovnania hodnotenia spokojnosti s vlastným životom, ktorú
participanti uvádzali v lete a v zime by teda mohli vyzerať napríklad takto:

Na výskume sa zúčastnilo 60 participantov, ktorí vyplnili rovnakú škálu spokojnosti so


životom najskôr v lete a potom v zime. Na škále od – 4 po 4 uvádzali participanti v lete (Mdn
= 2; IQR = 2) približne rovnakú spokojnosť so životom ako v zime (Mdn = 2; IQR = 2).
Rozdiel v uvádzanej spokojnosti medzi meraním v lete a v zime nebol štatisticky významný,
Z = –1,452; p = 0,146.
Grafické zobrazenie rozdielov medzi skupinami – krabičkový graf

Nakoľko SPSS neponúka možnosť vytvoriť graf zobrazujúci dve ordinálne premenné vo
vnútrosubjektovom designe, je možné si vizualizovať v krabičkovom grafe iba každé z meraní
spokojnosti so životom samostatne. Spravíme to pomocou funkcie Graphs > Chart Builder
kde z ponuky grafov vyberieme kategóriu „Boxplot“ a v rámci nej zvolíme hneď prvý typ
grafu „Simple Boxplot“. Ďalej už stačí iba vybrať prvú premennú „Spokoj“ a vložiť ju do
kolónky „Y-Axis“ a vytvorenie grafu potvrdiť pomocou „OK“. Následne môžeme rovnaký
typ grafu pre druhé meranie spokojnosti so životom získať úplne rovnakým spôsobom,
pričom ale do kolónky „Y-Axis“ vložíme premennú s hodnotami druhého merania
spokojnosti so životom „Spokoj2“. Tento postup nám bohužiaľ prakticky neumožní porovnať
hodnoty v dvoch podmienkach (nakoľko nám vzniknú dva grafy), avšak môžeme ho použiť
aspoň na preskúmanie hodnôt spokojnosti so životom v rámci každého z meraní samostatne.

Vecná významnosť pri Mann-Whitneyho teste a Wilcoxonovom teste

Jedným zo spôsobov, akým sa dá vyjadriť vecná významnosť rozdielov medzi dvoma


skupinami v prípade, že používame neparametrické testy je pomocou prepočtu testovej
štatistiky „Z“ na koeficient vecnej významnosti rm ktorý možno prirovnať ku korelačnému
koeficientu a má taktiež rovnakú tabuľkovú interpretáciu vecnej významnosti (VV):

rm < 0,1: zanedbateľná VV rm = 0,3 – 0,5: stredná VV

rm = 0,1 – 0,3: malá VV rm > 0,5: veľká VV


Výpočet tohto koeficientu je prípade oboch testov rovnaký a môžete si ho sami vypočítať
podľa vzorca: „ Z / √N “ (teda testová štatistika „Z“ deleno odmocnina z celkového počtu
participantov pri danom porovnaní). Zatiaľ čo testovú štatistiku „Z“ uvádzame vo výsledkoch
Wilcoxonovho testu (tabuľka vľavo), v prípade Mann-Whitneyho testu (tabuľka vpravo) ju
síce vo výsledkoch neuvádzame, ale máme ju k dispozícii v outpute z tohto testu:

V prípade oboch testov je po výpočte hodnoty vecnej významnosti jednoducho potrebné toto
číslo dosadiť na koniec výsledkov a uviesť jeho interpretáciu, napr.:

Mann-Whitneyho test:

Vo výskume sa zúčastnilo 37 (61,7%) ateistov a 23 (38,3%) veriacich. Na škále od – 4 po 4


hodnotili ateisti (Mdn = 2; IQR = 2) svoju spokojnosť so životom vyššie ako veriaci (Mdn =
1; IQR = 2), tento rozdiel bol však malý a nedosiahol úroveň štatistickej významnosti, U =
323,0; p = 0,112; rm = 0,205.

Wilcoxonov test:

Na výskume sa zúčastnilo 60 participantov, ktorí vyplnili rovnakú škálu spokojnosti so


životom najskôr v lete a potom v zime. Na škále od – 4 po 4 uvádzali participanti v lete (Mdn
= 2; IQR = 2) približne rovnakú spokojnosť so životom ako v zime (Mdn = 2; IQR = 2).
Rozdiel v uvádzanej spokojnosti medzi meraním v lete a v zime bol malý a nedosiahol
úroveň štatistickej významnosti, Z = –1,452; p = 0,146; rm = 0,187.

You might also like