Professional Documents
Culture Documents
Seminár VIII
Seminár VIII
Predstavme si, že chceme zisťovať, či existujú rozdiely v druhom meraní z testu všeobecných
znalostí [TestVZ2] medzi ľuďmi z rôznych študijných odborov [Skola]. V tomto prípade
používame takzvané „celkové“ (z angl. slova omnibus) testy pre zisťovanie rozdielov, ktoré
nám povedia, či medzi troma skupinami existuje aspoň jeden štatisticky významný rozdiel.
V prípade kardinálnej premennej, ktorá vykázala približné normálne rozloženie vo všetkých
skupinách používame jednosmernú analýzu variancie (ANOVA – analysis of variance). Ak
ANOVA zistí, že medzi skupinami bol zaznamenaný štatisticky významný rozdiel, prejde
k viacnásobným porovnaniam, kde porovnáva každú skupinu s každou a presne indikuje, kde
tento štatisticky významný rozdiel bol.
V tomto cvičení budeme zisťovať rozdiel medzi skupinami podľa študijného odboru [Skola]
v priemernom výkone v druhom meraní testu všeobecných znalostí [TestVZ2]. Ešte predtým,
ako prejdeme k samotnej ANOVE, je nutné skontrolovať, či je premenná TestVZ2 približne
normálne rozložená vo všetkých troch skupinách prostredníctvom testov normality.
V ďalšej tabuľke dostávame výsledok testu rovnakosti variancií (Levenov test). Úplne vpravo
nám hodnota „Sig.“ hovorí, že štandardné odchýlky sa v troch skupinách štatisticky
významne neodlišovali (p > 0,05), čo môžeme prakticky vidieť aj v hore uvedenej tabuľke.
V ďalšej tabuľke (Tests of Between-Subjects Effects) dostávame výsledok jednosmernej
ANOVY. Podobne ako T-test používa pri výpočte štatistickej významnosti štatistiku t,
používa ANOVA štatistiku Fisherovho F. Vpravo od hodnoty F je uvedená hladina
štatistickej významnosti (p = 0,225), ktorá ukazuje, že skupiny podľa typu školy sa od seba
v priemere štatisticky významne neodlišovali v teste všeobecných znalostí. V úplne pravom
stĺpci je parciálna umocnená eta (η2𝑝 ), ktorá slúži ako index veľkosti efektu (vecnej
významnosti). Eta sa interpretuje podobne ako pri koreláciách index determinácie (R2) po
vynásobení x100, teda ako percento vysvetlenej variancie v závislej premennej (TestVZ2)
(0,051 * 100 = 5,1%). Parciálna umocnená eta hovorí o tom, koľko percent variability medzi
jedincami môžeme prisúdiť medzi-skupinovému faktoru (teda typu školy).
Každopádne sa však nato ako vyzerá výstup medzi-skupinových porovnaní môžeme pozrieť
v nižšie uvedenej tabuľke. V tabuľke je uvedené porovnanie každej skupiny s každou inou.
V prvom stĺpci (Mean Difference) máme uvedený rozdiel v priemeroch. Všimnime si, že
v zátvorke je pri ňom (I – J), teda vždy je tento rozdiel vyrátaný ako odčítanie priemeru
skupiny ktorá je v J stĺpci od priemeru skupiny v I stĺpci. Keď je rozdiel pozitívny, znamená
to, že skupina v I stĺpci mal vyšší priemer ako skupina v J stĺpci, opačné platí ak je pred
rozdielom v priemere znamienko mínus. V stĺpčeku Sig. je uvedená hodnota štatistickej
významnosti po Bonferroniho korekcii a môžeme vidieť, že ani jeden rozdiel nebol
signifikantný, pretože p > 0,05.
Pri zápise výsledku ANOVY potrebujeme tri hlavné údaje a dva doplňujúce. Prvým je
Fisherovo F (v tabuľke Tests of Between-Subjects Effects), ku ktorému idú dva doplňujúce
údaje , ktorými sú stupne voľnosti (DF) pre medzi-subjektový faktor (Skola – 2 stupne
voľnosti) a stupne voľnosti, ktoré môžeme prisúdiť variancii, ktorá nie je objasnená medzi-
subjektovým faktorom (Error – 57 stupňov voľnosti). Potom uvádzame hodnotu signifikancie
(p) a nakoniec parciálnu umocnenú etu (η2𝑝 ).
Testy normality nám ukázali, že budeme musieť s kardinálnou premennou zaobchádzať ako
s ordinálnou a teda pre jej porovnanie budeme musieť použiť neparametrickú alternatívu
jednosmernej ANOVY, Kruskal-Wallisov test. Ku testu sa v SPSS môžeme dostať opäť
dvojakým spôsobom, tu a aj všeobecne však použijeme iba prvý, pretože iba ten automaticky
produkuje viacnásobné porovnania v prípade, že Kruskal-Wallisov test vyjde štatisticky
významný. Analyze > Nonparametric Tests > Independent Samples. Po otvorení rozhrania
a prejdení do možnosti Fields vľavo hore určíme, ktorá premenná definuje skupiny, a v ktorej
chceme rozdiely zisťovať.
Potom prejdeme do Settings vľavo hore a rovno zvolíme možnosť Customize tests, čo nám
umožňuje zvoliť si aké testy chceme vykonať (inak by program automaticky určil test podľa
dát). Vpravo zvolíme Kruskal-Wallis 1-way ANOVA a z možnosti Multiple comparisons
zvolíme „all pairwise“, čo znamená, že nám vykoná Post-hoc porovnanie každej skupiny
s každou (iba v prípade, keď vyjde Kruskal-Wallisov test štatisticky významný). Potom
stlačíme „Run“ a pozrieme sa na výstup.
Ako prvý dostaneme sumár testovaných hypotéz, kde máme uvedené znenie nulovej
hypotézy, použitý test pre jej testovanie, hodnotu signfikancie a nakoniec rozhodnutie, či
máme nulovú hypotézu ponechať, alebo zamietnuť. Vidíme, že Kruskal Wallisov test vyšiel
štatisticky významný (p = 0,043), čo hovorí, že minimálne medzi dvoma skupinami existuje
štatisticky významný rozdiel vo svedomitosti. Keď dáme na tabuľu double-click otvorí sa
nám rozhranie pre výsledok testu.
Po rozkliknutí dostávame takýto náhľad, kde v grafe po ukázaní na jednu z krabičiek máme
uvedené priemerné poradie (ako pri Mann-Whitney teste), v tabuľke nižšie máme údaje pre
zápis Kruskal-Wallisovho testu a úplne dole v možnostiach view: si môžeme zvoliť „Pairwise
comparison“, čo nám zobrazí, ktoré konkrétne skupiny sa štatisticky významne odlišovali.
SPSS tak ako v mnohých iných testoch neponúka pre Kruskal-Wallisov test index vecnej
významnosti (veľkosti efektu), ale dá sa získať na spomínanej stránke s online kalkulačkou
(https://www.psychometrica.de/effect_size.html). Na stránke nájdeme index vecnej
významnosti pre Kruskal-Wallisa pod bodom 11. Kruskal-Wallis test má tiež umocnenú etu
(η2𝐻 ) ako index veľkosti efektu. Do kalkulačky zadáme do poľa „Kruskal-Wallis-H“ štatistiku
testu (H), ktorá sa rovná 6,31, do „N“ dáme celkovú veľkosť vzorky a v „Anzahl an Gruppen
(k)“ uvedieme počet skupín, teda 3. V tomto prípade η2𝐻 = 0,031, čo radíme ešte k malému
efektu.
Teraz máme všetky potrebné údaje pre zápis výsledku Kruskal-Wallisovho testu. Výsledok
zapisujeme takto:
Avšak pre celý zápis sa budeme držať deskriptívnej štatistiky a rovnako aj post-hoc porovnaní
medzi skupinami. Deskriptívnu štatistiku pre každú skupinu, teda medián a IQR už získať
vieme. Viacnásobné medzi-skupinové porovnania získame vo výsledku Kruskal-Wallisovho
testu, keď v poli view dáme „Pairwise comparisons“.
Dostávame takéto rozhranie s porovnaniami skupín. Zľava máme v prvom stĺpci Test
statistic, čo je jednoduchý rozdiel v priemerných poradiach medzi dvoma skupinami (hore vo
vizualizácii sú ukázané priemerné poradia). Vždy sa odčíta Sample 2 od Sample 1, preto ak je
tento rozdiel záporné číslo znamená to, že skupina, ktorá bola ako Sample 1 mala menej než
skupina, ktorá bola pod Sample 2. Std. Error je štandardná chyba tohto rozdielu. Std. Test
Statistic (Z) je štandardizovanou štatistikou. Sig. (p) je hodnota signifikancie pred
Bonferroniho korekciou a Adj.Sig. je hodnota signifikancie po úprave Bonferroniho
korekciou. Z tejto tabuľky teda vidíme, že iba Gymnazisti mali štatisticky významne nižšiu
mieru svedomitosti od žiakov zo Stredného odborného učilišťa. Výsledok zapíšeme takto:
Keď chceme, môžeme k porovnaniu dorátať aj veľkosť efektu (r), ale pamätáme, že do
menovateľa ide odmocnina N, ktoré je súčtom veľkosti vzorky dvoch porovnávaných skupín
−2,477
(√89). Výpočet teda vyzerá takto: r = = -0,262, čo ukazuje, že rozdiel vykazoval malý
9,434
efekt.
Kompletný zápis Kruskal-Wallisovho testu aj s viacnásobnými porovnaniami:
• Skupiny gymnazistov (Mdn = 33,5; IQR = 45,25), strednej odbornej školy (Mdn =
61,00; IQR = 55,00) a resocializačného zariadenia (Mdn = 42,0; IQR = 52,75) sa
štatisticky významne odlišovali v Svedomitosti, H(2) = 6,31; p = 0,043; η2𝐻 = 0,031,
pričom rozdiel vykazoval malý efekt. Následné viacnásobne porovnania
s Bonferroniho korekciou ukázali, že gymnazisti dosahovali štatisticky významne
nižšie hodnoty svedomitosti v porovnaní so strednou odbornou školou, Z = -2,477; p =
0,040; r = 0,262, kde rozdiel dosahoval malý efekt. Rozdiel medzi skupinou zo
strednej odbornej školy a skupinou z resocializačného zariadenia nebol štatisticky
významný (p = 0,327) rovnako ako medzi skupinou gymnazistov a resocializačného
zariadenia (p = 0,948).