Download as pdf or txt
Download as pdf or txt
You are on page 1of 11

Seminár V.

– Porovnanie dvoch nominálnych premenných v medzisubjektovom


(between-subject) a vnútrosubjektovom (within-subject) designe

Medzisubjektové porovnanie skupín

Vnútrosubjektové porovnanie skupín


Medzi-skupinové porovnanie kardinálnej, normálne rozloženej premennej v troch
a viacerých skupinách (Jednosmerná analýza variancie – ANOVA)

Na predchádzajúcich cvičeniach sme sa naučili, že keď chceme porovnať dve nezávislé


skupiny v premennej, ktorej rozloženie je v oboch skupinách približne normálne, vhodným
testom je nezávislý T-test. Avšak v prípade, kedy by sme mali viac než dve skupiny, medzi
ktorými by nás zaujímali rozdiely, bolo by vcelku pracné vykonávať porovnania pre všetky
možné kombinácie skupín prostredníctvom nezávislého T-testu.

Predstavme si, že chceme zisťovať, či existujú rozdiely v druhom meraní z testu všeobecných
znalostí [TestVZ2] medzi ľuďmi z rôznych študijných odborov [Skola]. V tomto prípade
používame takzvané „celkové“ (z angl. slova omnibus) testy pre zisťovanie rozdielov, ktoré
nám povedia, či medzi troma skupinami existuje aspoň jeden štatisticky významný rozdiel.
V prípade kardinálnej premennej, ktorá vykázala približné normálne rozloženie vo všetkých
skupinách používame jednosmernú analýzu variancie (ANOVA – analysis of variance). Ak
ANOVA zistí, že medzi skupinami bol zaznamenaný štatisticky významný rozdiel, prejde
k viacnásobným porovnaniam, kde porovnáva každú skupinu s každou a presne indikuje, kde
tento štatisticky významný rozdiel bol.

V tomto cvičení budeme zisťovať rozdiel medzi skupinami podľa študijného odboru [Skola]
v priemernom výkone v druhom meraní testu všeobecných znalostí [TestVZ2]. Ešte predtým,
ako prejdeme k samotnej ANOVE, je nutné skontrolovať, či je premenná TestVZ2 približne
normálne rozložená vo všetkých troch skupinách prostredníctvom testov normality.

• Spoločenské vedy: W(19) = 0,966; p = 0,696


• Prírodné/technické vedy: W(21) = 0,971; p = 0,757
• Iné: W(20) = 0,972; p = 0,802

Vidíme, že vo všetkých troch skupinách nebola premenná významné odchýlená od normality.

K jednosmernej ANOVE sa v SPSS môžeme dostať dvojakým spôsobom. My si však


ukážeme iba jeden, pretože v ňom máme možnosť získať k výpočtom rovno aj mieru vecnej
významnosti, alebo veľkosti efektu. Analyze > General linear model > Univariate.
Dostaneme takéto rozhranie
Do políčka „Fixed Factor(s)“ vložíme premennú, ktorá nám definuje skupiny, medzi ktorými
chceme rozdiel zisťovať, teda v tomto prípade Skola. Tu už nemusíme definovať skupiny ako
v prípade nezávislého T-testu. Do poľa „Dependent Variable:“ vložíme našu závislú
premennú, v ktorej chceme rozdiely zisťovať, teda TestVZ2. V políčku „Post Hoc“ si volíme
spôsob akým chceme korigovať následné viacnásobné porovnania medzi skupinami.
Najčastejšie sa stretávame s Bonferroniho korekciou.

• Čo je Bonferroniho korekcia a prečo ju robíme? V inferenčnej štatistike je častým


problémom to, či v skutočnosti bol, alebo nebol rozdiel štatisticky významný.
Bonferroni si všimol, že čím viac porovnaní (alebo testov) vykonávame na tej istej
vzorke, tým je vyššia šanca, že budeme pozorovať štatisticky významný rozdiel.
Inými slovami povedané, môže sa stať, že nám nabehne aspoň jeden signifikantný
rozdiel aj jednoduchou šancou. Vtedy môže signifikantný rozdiel indikovať chybný
záver, pretože tam naozaj nemusí byť (toto v štatistike označujeme ako chybu prvého
typu – Type I error – zamietnutie nulovej hypotézy tam, kde mala byť ponechaná).
Bonferroni preto navrhol konzervatívny postup a to je, že hodnoty štatistickej
významnosti budú upravené o počet porovnaní (testov). Napríklad keby robíme tri
porovnania, potom už nemáme minimálnu požadovanú p hodnotu 0,05, ale 0,05/3
= 0,016 (až keby bola p hodnota aspoň takáto, vtedy by sme usúdili, že rozdiel je
štatisticky významný). Iný spôsob je vynásobiť hodnotu p počtom porovnaní,
vtedy keby máme pôvodne napr. p = 0,035, po korekcii by bola hodnota p =
0,035*3 = 0,105, čo je nad požadovanou hranicou 0,05 a tým pádom pôvodne
štatisticky významný rozdiel budem brať ako NIE štatisticky významný.

• Bonferroniho korekcia je označovaná za dosť konzervatívnu (prísnu), pretože keby sa


porovnáva dajme tomu 5, alebo 6 a viac skupín, musela by byť vzorka (v každej
skupine) naozaj veľká, aby p hodnota indikovala štatisticky významný rozdiel aj po
korekcii. Často sa preto používajú aj iné korekcie, napr. „Tukey“, alebo „Tukey’s-b“.

Stlačíme „continue“ a prejdeme do políčka „Options“. V poli Display zaškrtneme Descriptive


statistics, čo nám poskytne M a SD pre všetky tri skupiny. Takisto zaškrtneme Homogeneity
tests, čo nám vyráta Levenov test, ktorý testuje, či sa variancia v závislej premennej
štatisticky významne neodlišuje medzi skupinami (inými slovami, či sú štandardné odchýlky
približne rovnaké vo všetkých troch skupinách). Ak by sa v minimálne jednej skupine
štatisticky významne odlišovala štandardná odchýlka, odporúča sa prejsť skôr
k neparametrickej alternatívne jednosmernej ANOVY (Kruskal-Wallis test). Nakoniec
zaškrtneme Estimates of effect size, čo nám poskytne index vecnej významnosti pre
ANOVU.

Stlačíme continue a nakoniec OK. V prvej tabuľke dostávame deskriptívnu štatistku


s priemermi a štandardnými odchýlkami pre všetky tri skupiny.

V ďalšej tabuľke dostávame výsledok testu rovnakosti variancií (Levenov test). Úplne vpravo
nám hodnota „Sig.“ hovorí, že štandardné odchýlky sa v troch skupinách štatisticky
významne neodlišovali (p > 0,05), čo môžeme prakticky vidieť aj v hore uvedenej tabuľke.
V ďalšej tabuľke (Tests of Between-Subjects Effects) dostávame výsledok jednosmernej
ANOVY. Podobne ako T-test používa pri výpočte štatistickej významnosti štatistiku t,
používa ANOVA štatistiku Fisherovho F. Vpravo od hodnoty F je uvedená hladina
štatistickej významnosti (p = 0,225), ktorá ukazuje, že skupiny podľa typu školy sa od seba
v priemere štatisticky významne neodlišovali v teste všeobecných znalostí. V úplne pravom
stĺpci je parciálna umocnená eta (η2𝑝 ), ktorá slúži ako index veľkosti efektu (vecnej
významnosti). Eta sa interpretuje podobne ako pri koreláciách index determinácie (R2) po
vynásobení x100, teda ako percento vysvetlenej variancie v závislej premennej (TestVZ2)
(0,051 * 100 = 5,1%). Parciálna umocnená eta hovorí o tom, koľko percent variability medzi
jedincami môžeme prisúdiť medzi-skupinovému faktoru (teda typu školy).

Benchmarky pre 𝛈𝟐𝒑

0,01 = malý efekt

0,06 = stredne veľký efekt

0,13 = veľký efekt

Keďže ANOVA ukázala nesignifikantný rozdiel, už by ďalej nemalo zmysel prechádzať


k viacnásobným medzi-skupinovým porovnaniam s Bonferroniho korekciou, pretože takýto
výsledok ANOVY indikuje, že štatisticky významne odlišná v TestVZ2 nie je ani jedna
skupina.

Každopádne sa však nato ako vyzerá výstup medzi-skupinových porovnaní môžeme pozrieť
v nižšie uvedenej tabuľke. V tabuľke je uvedené porovnanie každej skupiny s každou inou.
V prvom stĺpci (Mean Difference) máme uvedený rozdiel v priemeroch. Všimnime si, že
v zátvorke je pri ňom (I – J), teda vždy je tento rozdiel vyrátaný ako odčítanie priemeru
skupiny ktorá je v J stĺpci od priemeru skupiny v I stĺpci. Keď je rozdiel pozitívny, znamená
to, že skupina v I stĺpci mal vyšší priemer ako skupina v J stĺpci, opačné platí ak je pred
rozdielom v priemere znamienko mínus. V stĺpčeku Sig. je uvedená hodnota štatistickej
významnosti po Bonferroniho korekcii a môžeme vidieť, že ani jeden rozdiel nebol
signifikantný, pretože p > 0,05.
Pri zápise výsledku ANOVY potrebujeme tri hlavné údaje a dva doplňujúce. Prvým je
Fisherovo F (v tabuľke Tests of Between-Subjects Effects), ku ktorému idú dva doplňujúce
údaje , ktorými sú stupne voľnosti (DF) pre medzi-subjektový faktor (Skola – 2 stupne
voľnosti) a stupne voľnosti, ktoré môžeme prisúdiť variancii, ktorá nie je objasnená medzi-
subjektovým faktorom (Error – 57 stupňov voľnosti). Potom uvádzame hodnotu signifikancie
(p) a nakoniec parciálnu umocnenú etu (η2𝑝 ).

Zápis vyzerá takto: F(2, 57) = 1,530; p = 0,225; η2𝑝 = 0,051

Náš výsledok by sme mohli v celom znení zapísať takto:


• Skupina spoločenských vied (M = 12,05; SD = 3,36), prírodných a technických
smerov (M = 11,43; SD = 3,29) a iných študijných odborov (M = 10,15; SD = 3,76) sa
štatisticky významne neodlišovali v priemernom skóre z druhého merania testu
všeobecných znalostí, F(2, 57) = 1,530; p = 0,225; η2𝑝 = 0,051.

Čo keby bola ANOVA signifikantná a musíme odreportovať viacnásobné porovnania?


Predstavme si, že by nám v tomto príklade vyšla ANOVA signifikantná. Ďalej si predstavme,
že iba skupina spoločenských vied a skupina iných študijných odborov by sa aj po
Bonferroniho korekcii štatisticky významne odlišovala. Výsledok by sme v tomto prípade
mohli odreportovať podobne ako v prvom prípade:
• Skupina spoločenských vied (M = 12,05; SD = 3,36), prírodných a technických
smerov (M = 11,43; SD = 3,29) a iných študijných odborov (M = 10,15; SD = 3,76) sa
štatisticky významne odlišovala v priemernom skóre z druhého merania testu
všeobecných znalostí, F(2, 57) = 2,102; p = 0,031; η2𝑝 = 0,084. Následne viacnásobné
medzi-skupinové porovnania s Bonferroniho korekciou ukázali, že skupina
spoločenských vied skórovala v priemere viac ako skupina iných študijných odborov
(p = 0,028), ale nie signifikantne viac ako skupina prírodných a technických smerov (p
> 0,900), ktorá sa rovnako významne neodlišovala od skupiny iných študijných
odborov (p = 0,732).

Vizualizácia rozdielov medzi troma a viacerými skupinami (kardinálna normálne


rozložená premenná)
Je úplne rovnaká ako v prípade nezávislého T-testu. Zobrazujeme ho teda stĺpcovým, alebo aj
bodovým grafom s chybovými úsečkami (95% intervalom spoľahlivosti), ale nie pre dve
skupiny, ale tri a viac. Graf by po drobných úpravách vyzeral nasledovne.
Medzi-skupinové porovnanie ordinálnej, alebo nie normálne rozloženej kardinálnej
premennej v troch a viacerých skupinách (Neparametrická jednosmerná ANOVA –
Kruskal-Wallis test)

Bohužiaľ v cvičných dátach neboli premenné, v ktorých by sa dal ukázať Kruskal-Wallisov


test, tak aby vyšiel štatisticky významný. V prípade tohto testu nám to neumožní nahliadnúť
na viacnásobné medzi-skupinové porovnania. Z tohto dôvodu budeme v tejto ukážke
pracovať s inými dátami, ktoré budú nahrané na disku [Svedomitost.sav].

V tomto dátovom súbore máme dve premenné: [Škola_zaradenie] je nominálna premenná


určujúca, či je účastník z gymnázia, soš, alebo resocializačného zariadenia. [Svedomitosť] je
kardinálna premenná, ktorá ukazuje hodnotu osobnostného faktoru svedomitosti z Big-Five.
V tomto príklade chceme jednoducho zistiť, či sa skupiny podľa školy a zaradenia odlišujú vo
svedomitosti.

Testy normality nám ukázali, že budeme musieť s kardinálnou premennou zaobchádzať ako
s ordinálnou a teda pre jej porovnanie budeme musieť použiť neparametrickú alternatívu
jednosmernej ANOVY, Kruskal-Wallisov test. Ku testu sa v SPSS môžeme dostať opäť
dvojakým spôsobom, tu a aj všeobecne však použijeme iba prvý, pretože iba ten automaticky
produkuje viacnásobné porovnania v prípade, že Kruskal-Wallisov test vyjde štatisticky
významný. Analyze > Nonparametric Tests > Independent Samples. Po otvorení rozhrania
a prejdení do možnosti Fields vľavo hore určíme, ktorá premenná definuje skupiny, a v ktorej
chceme rozdiely zisťovať.
Potom prejdeme do Settings vľavo hore a rovno zvolíme možnosť Customize tests, čo nám
umožňuje zvoliť si aké testy chceme vykonať (inak by program automaticky určil test podľa
dát). Vpravo zvolíme Kruskal-Wallis 1-way ANOVA a z možnosti Multiple comparisons
zvolíme „all pairwise“, čo znamená, že nám vykoná Post-hoc porovnanie každej skupiny
s každou (iba v prípade, keď vyjde Kruskal-Wallisov test štatisticky významný). Potom
stlačíme „Run“ a pozrieme sa na výstup.

Ako prvý dostaneme sumár testovaných hypotéz, kde máme uvedené znenie nulovej
hypotézy, použitý test pre jej testovanie, hodnotu signfikancie a nakoniec rozhodnutie, či
máme nulovú hypotézu ponechať, alebo zamietnuť. Vidíme, že Kruskal Wallisov test vyšiel
štatisticky významný (p = 0,043), čo hovorí, že minimálne medzi dvoma skupinami existuje
štatisticky významný rozdiel vo svedomitosti. Keď dáme na tabuľu double-click otvorí sa
nám rozhranie pre výsledok testu.
Po rozkliknutí dostávame takýto náhľad, kde v grafe po ukázaní na jednu z krabičiek máme
uvedené priemerné poradie (ako pri Mann-Whitney teste), v tabuľke nižšie máme údaje pre
zápis Kruskal-Wallisovho testu a úplne dole v možnostiach view: si môžeme zvoliť „Pairwise
comparison“, čo nám zobrazí, ktoré konkrétne skupiny sa štatisticky významne odlišovali.

SPSS tak ako v mnohých iných testoch neponúka pre Kruskal-Wallisov test index vecnej
významnosti (veľkosti efektu), ale dá sa získať na spomínanej stránke s online kalkulačkou
(https://www.psychometrica.de/effect_size.html). Na stránke nájdeme index vecnej
významnosti pre Kruskal-Wallisa pod bodom 11. Kruskal-Wallis test má tiež umocnenú etu
(η2𝐻 ) ako index veľkosti efektu. Do kalkulačky zadáme do poľa „Kruskal-Wallis-H“ štatistiku
testu (H), ktorá sa rovná 6,31, do „N“ dáme celkovú veľkosť vzorky a v „Anzahl an Gruppen
(k)“ uvedieme počet skupín, teda 3. V tomto prípade η2𝐻 = 0,031, čo radíme ešte k malému
efektu.
Teraz máme všetky potrebné údaje pre zápis výsledku Kruskal-Wallisovho testu. Výsledok
zapisujeme takto:

• H(2) = 6,310; p = 0,043; η2𝐻 = 0,031 – dvojka v zátvorke za H sú stupne voľnosti.

Avšak pre celý zápis sa budeme držať deskriptívnej štatistiky a rovnako aj post-hoc porovnaní
medzi skupinami. Deskriptívnu štatistiku pre každú skupinu, teda medián a IQR už získať
vieme. Viacnásobné medzi-skupinové porovnania získame vo výsledku Kruskal-Wallisovho
testu, keď v poli view dáme „Pairwise comparisons“.

Dostávame takéto rozhranie s porovnaniami skupín. Zľava máme v prvom stĺpci Test
statistic, čo je jednoduchý rozdiel v priemerných poradiach medzi dvoma skupinami (hore vo
vizualizácii sú ukázané priemerné poradia). Vždy sa odčíta Sample 2 od Sample 1, preto ak je
tento rozdiel záporné číslo znamená to, že skupina, ktorá bola ako Sample 1 mala menej než
skupina, ktorá bola pod Sample 2. Std. Error je štandardná chyba tohto rozdielu. Std. Test
Statistic (Z) je štandardizovanou štatistikou. Sig. (p) je hodnota signifikancie pred
Bonferroniho korekciou a Adj.Sig. je hodnota signifikancie po úprave Bonferroniho
korekciou. Z tejto tabuľky teda vidíme, že iba Gymnazisti mali štatisticky významne nižšiu
mieru svedomitosti od žiakov zo Stredného odborného učilišťa. Výsledok zapíšeme takto:

• Z = -2,477; p = 0,040; r = 0,262

Keď chceme, môžeme k porovnaniu dorátať aj veľkosť efektu (r), ale pamätáme, že do
menovateľa ide odmocnina N, ktoré je súčtom veľkosti vzorky dvoch porovnávaných skupín
−2,477
(√89). Výpočet teda vyzerá takto: r = = -0,262, čo ukazuje, že rozdiel vykazoval malý
9,434
efekt.
Kompletný zápis Kruskal-Wallisovho testu aj s viacnásobnými porovnaniami:

• Skupiny gymnazistov (Mdn = 33,5; IQR = 45,25), strednej odbornej školy (Mdn =
61,00; IQR = 55,00) a resocializačného zariadenia (Mdn = 42,0; IQR = 52,75) sa
štatisticky významne odlišovali v Svedomitosti, H(2) = 6,31; p = 0,043; η2𝐻 = 0,031,
pričom rozdiel vykazoval malý efekt. Následné viacnásobne porovnania
s Bonferroniho korekciou ukázali, že gymnazisti dosahovali štatisticky významne
nižšie hodnoty svedomitosti v porovnaní so strednou odbornou školou, Z = -2,477; p =
0,040; r = 0,262, kde rozdiel dosahoval malý efekt. Rozdiel medzi skupinou zo
strednej odbornej školy a skupinou z resocializačného zariadenia nebol štatisticky
významný (p = 0,327) rovnako ako medzi skupinou gymnazistov a resocializačného
zariadenia (p = 0,948).

Vizualizácia rozdielov medzi troma skupinami v ordinálnej premennej, alebo


v kardinálnej premennej s nie normálnym rozložením.

Používame krabičkový graf ako v prípade Mann-Whitney alebo Wilcoxonvho testu. Po


drobnej úprave by mal graf vyzerať takto:

You might also like