Professional Documents
Culture Documents
Velicina Ucinka Nastavna Skripta
Velicina Ucinka Nastavna Skripta
Veliina uinka
Nakladnik
Sveuilite Josipa Jurja Strossmayera u Osijeku
Filozofski fakultet
Za nakladnika
prof. dr. sc. Loretana Farka
Autori
professor emeritus Vladimir Kolesari
dr.sc. Jasmina Tomai Humer
Recenzenti
dr. sc. Dinka orkalo Biruki, red. prof.
dr. sc. Dragutin Ivanec, izv. prof.
Lektor
Ivan Martini, prof.
ISBN 978-953-314-087-2
Objavljivanje ove sveuiline skripte odobrio je Senat Sveuilita Josipa Jurja Strossmayera u
Osijeku br. 2/16 od 26. sijenja 2016.
ii
Sadraj
Uvod .............................................................................................................................1
to nam pokazuje testiranje nul-hipoteze? ...................................................................2
Veliina uinka .............................................................................................................5
d porodica veliine uinka ............................................................................................7
Upozorenja i jo neki indeksi d-tipa ...........................................................................20
r porodica veliine uinka ...........................................................................................22
2 test........................................................................................................................23
Analiza varijance ........................................................................................................26
Viestruka (multipla) regresija ..................................................................................37
Literatura.....................................................................................................................38
DODATAK A............................................................................................................39
DODATAK B ............................................................................................................40
DODATAK C ............................................................................................................41
iii
Uvod
Glavni cilj ovoga teksta jest pribliiti studentima (ali i psiholozima praktiarima
i istraivaima) smisao i korist od dodatnih statistikih vrijednosti koje su se do sada
relativno rjee koristile.
Dodatni je cilj pokazati da je uvijek dobro ponovno raspravljati o svemu, pa tako
i o upotrebi statistike u psihologiji, zapravo, o njezinoj nedovoljno racionalnoj upotrebi.
Naalost, vrlo se esto zaboravlja da je statistika samo alat i nita drugo. Statistika ne
odgovara na pitanja korisnika, ona samo pomae u interpretaciji rezultata i titi od vrlo
pogrenih i subjektivnih zakljuaka. Ali, statistika nije svemogua i to se esto
zaboravlja ima svojih nedostataka koje je svakako valja poznavati da ne bismo
napravili jo vee i tee pogreke u zakljuivanju.
Na primjer, znaajno i statistiki znaajno nije isto. Statistiki znaajno ima
svoju jasnu statistiku podlogu u logici postavljanja i testiranja nul-hipoteze, ali to ne
mora biti, a esto i nije u skladu sa stvarnom praksom i znaenjem. Poznati primjer:
tjelesna visina ljudi ujutro i naveer statistiki je znaajno razliita, ali nema nikakvo
praktino znaenje. Uvijek, dakle, imati na umu da statistika nije nedodirljiva sveta
krava i da stoga treba u svakom pojedinanom sluaju treba razmisliti o primjerenoj
upotrebi statistikih postupaka i o njihovoj interpretaciji u zadanom kontekstu. Statistika
samo relativno objektivno potkrepljuje postavljene hipoteze, nita vie od toga.
Prelistavajui ne sasvim svjei broj asopisa Theory & Psychology naili smo na
lanak koji se bavi veliinom uinka (Vacha-Hasse, Nilsson, Reetz, Lance i Thompson,
2000). Na poetku toga lanka autori su citirali naputak Amerike psiholoke
asocijacije, objavljen 1994. godine, a koji se odnosi na statistiku opremu lanaka
objavljivanih u asopisima te asocijacije. U tom se naputku istie da sama p vrijednost
pri statistikom testiranju nul-hipoteze nije dovoljno informativan pokazatelj
djelotvornosti uinka koji upuuje na djelovanje nekog ispitivanog faktora. Meutim,
autori u tome lanku upozoravaju na to da se psiholozi tvrdoglavo dre stare prakse u
kojoj nema podatka o veliini uinka.
Navodimo dva vrlo ilustrativna citata dvojice vrlo uglednih autora u podruju
koritenja statistike u psihologiji.
1
G. V. Glass (1984): Statistika znaajnost je najmanje interesantan podatak o
rezultatima. Treba opisati rezultate kao mjere veliine ne samo da je neki tretman
utjecao na ljude, nego koliko je utjecao.
J. Cohen (1988): Primarni produkt istraivanja su jedna ili vie mjera veliine
uinka, ne p vrijednosti.
D. Lakens (2013) istie da standardizirana veliina uinka daje razumljiv i
upotrebljiv podatak bez obzira na skalu mjerenja zavisne varijable. Takva
standardizirana veliina uinka omoguuje da se pokae koje praktino znaenje
dobivenih rezultata tj. koje su praktine posljedice prikupljenih rezultata u
svakidanjem ivotu.
2
temeljne podatke i temeljne ishode osnovne statistike obrade rezultata, a meu te
temeljne podatke pripada, svakako, i veliina uinka. Ti temeljni podaci osim
aritmetikih sredina, standardnih devijacija, minimalnog i maksimalnog postignutog
rezultata jesu odreivanje intervala pomou pogreke aritmetike sredine u kojemu se
nalazi prava aritmetika sredina i podaci o testiranju nul-hipoteze: veliina t-testa i p-
vrijednost.
Navest emo nekoliko upozorenja koja se odnose na upotrebu statistike u
psihologiji.
Poet emo s opim upozorenjem, koje se odnosi na vrlo rairenu upotrebu
jednostavnijih statistikih postupaka. Statistika je, nedvojbeno, neobino korisna i u
psihologijskim istraivanjima i u psihologijskoj praksi. Meutim, naalost, mnogi
psiholozi-istraivai, pa i psiholozi-praktiari, gledaju na statistiku kao na demijurga.
Misle da je rezultat dobiven statistikom obradom nedodirljiv, bez mane, bez
pogreke. No, mnogo je puta to, zapravo, skrivanje iza dobivenih statistikih
vrijednosti: ako je statistika obrada pokazala da postoji statistiki znaajna razlika,
onda je to tako i nikako drugaije, tome nema prigovora. Ili, ako rezultat statistike
obrade rezultata pokae da razlika meu aritmetikim sredinama dviju skupina
ispitanika nije statistiki znaajna, uzima se kao definitivna injenica da je nul-hipoteza
tona.
No, svaki statistiki rezultat treba uzeti cum grano salis. Poznati je primjer s
ispitivanjem korisnosti aspirina u prevenciji sranog napadaja. Vrlo velika skupina
ispitanika podijeljena je po sluaju u dvije skupine: jedna skupina uzimala je jednu
pilulu aspirina dnevno, a druga placebo. Zavisna varijabla bila je pojava sranog
napadaja: je li ga netko imao ili ga nije imao. Statistika obrada rezultata pokazala je da
nema statistiki znaajne razlike u broju sranih napadaja izmeu skupine koja je
uzimala aspirin i one koja je uzimala placebo. Izraunata je korelacija izmeu zavisne i
nezavisne varijable i ona je iznosila r = 0.034, to je objanjavalo samo 0.12%
varijance. Meutim, ipak dovoljno velik broj (iako ne statistiki znaajan) pripadnika
skupine koja je uzimala aspirin nije imao napadaj, pa su istraivai ipak preporuili
uzimanje aspirina (ako nema nekih idiosinkratinih neeljenih nuspojava), tj. prekinuli
su istraivanje i onima koji su uzimali placebo preporuili uzimanje aspirina (prema
Rosnow i Rosenthal, 1989).
3
Testiranje nul-hipoteze, koje poiva na t-testu, postupak je koji daje dihotomni
rezultat. Tu je vrijednost p kljuna. Na temelju nje odluujemo: ili ostajemo pri nul-
hipotezi ili ne prihvaamo nul-hipotezu i prihvaamo nau radnu, prethodno postavljenu
hipotezu. A p izravno ovisi o veliini uzoraka: to je vei N, to je automatski manje p,
pa, prema tome, bez obzira na sve drugo, to je vei N, vea je vjerojatnost da e razlika
meu aritmetikim sredinama biti statistiki znaajna. I obrnuto, to je manji N, razlika
ima manju ansu da bude proglaena statistiki znaajnom. Psiholozi-statistiari misle
da takva strategija ne omoguuje napredak ni znanosti ni prakse.
Cohen (1994) upozorava na glavni problem testiranja nul-hipoteze. Istraiva je
zainteresiran za odgovor na pitanje kolika je vjerojatnost da je nul-hipoteza tona. No,
testiranje nul-hipoteze odgovara na to koliko je vjerojatno da se dobije odreeni skup
podataka ako je nul-hipoteza tona. A Nickerson (2000), pak, upozorava na to da je
testiranje nul-hipoteze velika zabluda jer, gotovo redovito, istraivai na temelju
dobivene p vrijednosti interpretiraju tonost ili vjerojatnost nul-hipoteze.
Prvo, ostajanje na nul-hipotezi ne mora znaiti da je nul-hipoteza zaista tona.
Neki, malo stroi statistiari, tvrde da nul-hipoteza u zbilji nikada nije tona. Zaboravlja
se, meutim, da nul-hipoteza ima ustvari samo radno obiljeje jer je tako postavljena
procedura testiranja znaajnosti razlike.
Drugo, prihvaanje radne hipoteze nema nikakve veze sa statistikim ishodom.
Taj ishod samo kae kolika je vjerojatnost pogreke, ali nita ne govori o tome je li
tona postavljena radna hipoteza ili je tona neka druga, alternativna, hipoteza. Tonost
radne (alternativne) hipoteze ovisi samo o znanju i domiljatosti njezina autora.
Tree, istraivanje se poduzima zato da bi se saznalo ne samo postoji li
djelovanje neke nezavisne varijable, nekoga imbenika, nekoga tretmana, nego i zato da
se utvrdi koliko je to djelovanje. Kako poznavanje veliine djelovanja nije nevano
pokazuje dobro poznati primjer s tjelesnom visinom ujutro i naveer: tjelesna visina
naveer statistiki je znaajno manja nego ujutro, ali to, kako nam pokazuje
svakodnevno iskustvo, nema nikakvih praktinih posljedica.
Ali, zamislimo i ovakav primjer: elimo provjeriti neki novi psihologijski
postupak, recimo za odvikavanje od puenja, i to provjeravamo na dvije skupine puaa;
na jednoj skupini primijenjujemo uobiajeni postupak, na drugoj neki novi postupak.
Rezultat mjerimo pomou dobro konstruiranog upitnika. I, recimo, da je u tom upitniku
4
skupina s novim postupkom postigla statistiki znaajno bolji rezultat, tj. vei rezultati u
upitniku pokazuju bolje odvikavanje od puenja. Taj nam podatak u praktinom smislu
gotovo nita ne znai; znait e nam podatak o tome koliko je ispitanika u skupini s
novim postupkom postiglo bolje rezultate u upitniku od ispitanika u skupini s
uobiajenim postupkom. Ako je od stotinjak ispitanika samo desetak postiglo bolje
rezultate, onda usprkos znaajnom rezultatu, nije opravdano (ni praktino ni teorijski)
zakljuiti da je nova metoda odvikavanja od puenja uspjena. Kad bi barem pedesetak
ispitanika imalo bolji rezultat, tada bi uvoenje nove metode imalo smislenog znaenja.
etvrto, kad se dobije statistiki znaajna razlika izmeu dviju skupina
ispitanika, preutno se prihvaa da se to je redovito vidljivo u daljnjem opisu i
interpretaciji takva rezultata svi ispitanici u tim skupinama meusobno razlikuju, a
obino se razlikuje samo manji broj njih, jer se redovito distribucije meusobno
prekrivaju.
Peto, proces i konani ishod testiranja nul-hipoteze daje samo informaciju o
tome ostajemo li na nul-hipotezi ili ne ostajemo, tj. kolika je vjerojatnost pogreke pri
naputanju nul-hipoteze ili kolika je vjerojatnost ostajanja uz nul-hipotezu.
esto, na kraju, to osobito vrijedi za praktini rad, zanimat e nas pojedinci, a
ne samo cijela skupina. Podaci o cijeloj skupini kojoj neki pojedinac pripada, samo su
kontekst za mjerenu varijablu, a on nam pokazuje gdje je, u odnosu na ostale lanove
skupine, smjeten taj pojedinac.
Veliina uinka
5
dakle, nije samo binarni podatak. Veliina uinka moe biti izraena kao razlika izmeu
dva populacijska parametra, kao odstupanje od neke konstante odnosno neke poznate
vrijednosti te kao veliina povezanosti meu varijablama (koeficijent korelacije) (Petz,
Kolesari i Ivanec, 2012).
Postoje barem, tri vana razloga zbog kojih treba odrediti veliinu uinka u
psihologijskim istraivanjima, kao i u praktinom radu psihologa (Vacha-Hasse i sur.,
2000).
Prvo, p vrijednosti same za sebe ne mogu se upotrijebiti kao pokazatelj veliine
uinka, jer su pod pomijeanim meusobno povezanim utjecajem mnogih svojstava
istraivanja, ukljuujui i veliinu uinka i veliinu uzorka (N).
Drugo, malo vjerojatni rezultati (tj. rezultati s malom p vrijednou) nisu nuno
bitno interesantni u istraivanjima. Neki jako nevjerojatni dogaaji (npr. vjerojatnost da
e netko umrijeti itajui ovaj lanak) ili pak jako vjerojatni dogaaji (npr. da e
podloga na koju pada kia biti mokra), dakle oni dogaaji koji se ekstremno
konsekventno pojavljuju, zapravo su u statistikom smislu potpuno beznaajni. Dakle,
test statistike znaajnosti ne moe se razumno upotrijebiti za razlikovanje vanosti
rezultata hinjenjem objektivnosti. Tome se najbolje narugao J. Cohen u lanku The
earth is round (p < 0.05) (1994) (Zemlja je okrugla, p < 0.05).
Tree, p vrijednosti ne upuuju izravno na kritino pitanje ponovljivosti
(replikabilnosti) rezultata, jer statistiki testovi ne testiraju vjerojatnost dogaanja
rezultata uzorka u populaciji. Umjesto toga, statistika znaajnost pretpostavlja da nul-
hipoteza tono opisuje populacijske parametre (tj. populacijske aritmetike sredine,
populacijske koeficijente korelacije) i tako procjenjuje vjerojatnost rezultata uzorka (tj.
aritmetike sredine uzorka ili koeficijente korelacije uzorka) ili ekstremnijih rezultata u
uzorku odreene veliine, uz uvjet da su uzorci iz pretpostavljene populacije.
Veliina uinka moe se koristiti kao dopuna i potkrepljenje statistikim
testovima (kakav je npr. t-test ili analiza varijance) ili kao opa, generalizirana procjena
veliine djelovanja neke nezavisne varijable ili nekoga tretmana ili, openito, veliine
djelovanja nekoga imbenika.
6
Pokuat emo prikazati najee koritene indekse veliine uinka: to veliina
uinka jest, kako se rauna i kako se moe interpretirati1. Odreivanje snage
statistikoga testa i s tim povezano planiranje veliine uzorka te meta-analiza posebne
su teme pa se ovdje njima neemo baviti.
Veliina uinka jednostavan je nain kvantitativnog izraavanja razlike izmeu
rezultata dviju skupina ispitanika. Taj nain, tj. veliina uinka ima neke prednosti u
usporedbi s testiranjem statistike znaajnosti, ili statistikog testiranja nul-hipoteze.
Veina autora koji govore o veliini uinka stavljaju taj indeks kao dopunu
testiranju nul-hipoteze, uglavnom kada govore o t-testu, o analizi varijance ili o
koeficijentu korelacije. R. Coe (2002), meutim, prikazuje veliinu uinka potpuno
neovisno o testiranju nul-hipoteze pa o tom indeksu govori kao o samostalnoj
statistikoj veliini.
Razlikuju se dvije vrste odnosno dvije porodice veliine uinka. Jedna se temelji
na razlici izmeu statistikih vrijednosti rezultata (najee su to aritmetike sredine)
dviju ili vie skupina ispitanika. Druga se temelji na asocijaciji, korelaciji meu
varijablama.
U prvoj porodici najee se koristi d-indeks, obino nazvan Cohenov d, jer
potjee od J. Cohena. Formula za odreivanje tog indeksa ima ovaj oblik:
ME MK
d (1)
SD
1
Spominjemo kao kuriozitet da smo samo na jednom mjestu nali podatak da postoji izmeu 50 i 100
mjera veliine uinka?! U ovom emo se tekstu, ipak, zadrati na njihovu puno manjem broju.
7
primijenjeno, skupina koja se nalazi u svojem relativno normalnom, uobiajenom
stanju. Istraiva eli vidjeti ima li ta eksperimentalna varijabla takvo djelovanje da se
moe razlikovati od uobiajene situacije s obzirom na mjerenu varijablu, odnosno s
obzirom na neki aspekt ponaanja koji je predmet opaanja ili mjerenja u kojoj se
nalazi kontrolna skupina.
Budui da se u nazivniku koristi standardna devijacija d-indeks postaje
standardizirana, usporediva vrijednost, neovisna o vrsti mjernih jedinica. Ali, postavlja
se pitanje o tome koju standardnu devijaciju upotrijebiti. Loginim se ini da to bude
standardna devijacija kontrolne skupine jer je to nedirnuta skupina s ispitanicima u
uobiajenom stanju i u uobiajenim okolnostima. Moe se, meutim, koristiti i
zajednika standardna devijacija obje skupine, koja se lako izrauna po formuli:
SD12 ( N1 1) SD22 ( N 2 1)
SDz (2)
( N1 1) ( N 2 1)
8
Uz odluku o tome koju emo standardnu devijaciju u ovom primjeru koristiti
kao nazivnik pri odreivanju veliine uinka potreban je odreeni komentar.
Ako su razlike izmeu standardnih devijacija velike, onda nije opravdano
raunati zajedniku (prosjenu) standardnu devijaciju. to je velika razlika? Openito
statistiari toleriraju odnos najvie do 1:3, tj. vea standardna devijacija ne smije biti
vie od tri puta vea od manje standardne devijacije. Vea se razlika ne prihvaa, a
stroi statistiari nee tolerirati ni taj odnos, ve samo manji.
Ako se aritmetike sredine znatno razlikuju, i distribucije rezultata dislocirane su
na apscisi, pa bi zajednika distribucija bila neka bimodalna distribucija, a raunanje
standardne devijacije za takvu distribuciju nije opravdano, a ako bi se i raunala, bila bi
vrlo velika. Zato se nikada zajednika standardna devijacija ne rauna iz tako skupljenih
zajednikih bruto rezultata, nego pomou formule navedene pod (2).
Naglaavamo, polazi se od pretpostavke da je mjerenje (primjena nekoga testa,
upitnika ili nekog drugoga psihologijskog mjerenja) obavljeno u obje skupine u
prihvatljivo slinim uvjetima. Eventualna razlika u aritmetikim sredinama uzrokovana
je nezavisnom varijablom primijenjenom u jednoj skupini (eksperimentalnoj), ili u obje
skupine (ili vie njih), ili primjenom nekoga tretmana u jednoj skupini, ili nekim drugim
sustavnim imbenikom koji je apliciran (ili prisutan) samo u jednoj skupini. Dakle,
mjerenje u obje skupine (ili vie skupina) mora biti obavljeno u prihvatljivo slinim
uvjetima (osim aplikacija nezavisne varijable, ili nekoga tretmana) da bi bilo opravdano
usporeivati ih.
U gornjem primjeru omjer standardnih devijacija iznosi 4.12 : 2.10 = 1.96, dakle
razlika je podnoljiva. No, u ovom sluaju postoji jedna druga komplikacija. Prosjeni
rezultat u poslijepodnevnoj skupini iznosio je 17.9 od 20 moguih bodova. Ovdje se,
dakle, radi o tzv. stropnom efektu, pa je zbog njega rasprenje rezultata u toj skupini
fiziki smanjeno. (Usput govorei, distribucija rezultata poslijepodnevne skupine
sigurno je negativno asimetrina, tj. vee je grupiranje rezultata oko veih vrijednosti,
bliih najveoj moguoj vrijednosti: 20.) Stoga je upitno je li opravdano uzeti
standardnu devijaciju te skupine za odreivanje zajednike standardne devijacije.
Ipak, ako se ne raspolae s veim brojem rezultata i ako standardne devijacije
nisu jako razliite, preporuuje se raunanje zajednike standardne devijacije zbog
opeg statistikoga pravila da su izraunate statistike vrijednosti stabilnije ako su
9
odreene na temelju veeg broja rezultata. Za donoenje zakljuaka na temelju
statistikih vrijednosti jako je vano da su te vrijednosti to stabilnije.
Meutim, preporuuje se, u sluajevima kad je teko donijeti jasnu, nedvojbenu
odluku, prikazati rezultate statistike obrade obavljene na razliite naine. Tako je u
spomenutom primjeru korektno prikazati i d-indeks izraunat pomou zajednike
standardne devijacije i d-indeks izraunat sa standardnom devijacijom samo jutarnje
skupine ispitanika. Ako se koristi samo standardna devijacija jutarnje skupine, koja
iznosi 4.12, tada e d-indeks biti neto manji: d = 2.7 : 4.12 = 0.66. Budui da je
koritena vea standardna devijacija, razumljivo je da je d-indeks u tom sluaju manji.
Openito, standardna devijacija selekcioniranih skupina kao to su
hospitalizirane osobe, recimo alkoholiari u klinici za odvikavanje od ovisnosti, ili
pacijenti neke druge klinike, ili, recimo, izdvojeni uenici bilo zbog osobito dobrog ili
osobito loeg uspjeha u koli itd. redovito je manja nego standardna devijacija
neselekcionirane populacije.
to nam izraunati d-indeks pokazuje, kakve nam informacije prua? Odgovor
na to pitanje vrlo je jasan: d-indeks nam daje informacije o dobivenim rezultatima
kakve nam druge statistike obrade rezultata ne daju, a koje mogu biti vrlo korisne
svakom istraivau, i teoretiaru i praktiaru, a to je prekrivanje distribucija dvije
skupine rezultata. Pokazuje koliko ispitanika, prema njihovim rezultatima u mjerenoj
varijabli, doista pripada samo jednoj ili samo drugoj distribuciji.
Pri testiranju nul-hipoteze pomou, primjerice, t-testa moe se utvrditi statistiki
znaajna razlika, uz odabranu vrijednost, i kad su razlike meu aritmetikim
sredinama vrlo male, praktino zanemarive i kad se distribucije dviju skupina ispitanika
u vrlo velikoj mjeri meusobno prekrivaju, kao na slici 1.
Na slici 1. prikazane su dvije distribucije rezultata dviju skupina uenika sedmog
i osmog razreda u dvije osnovne kole, a rezultati su dobiveni primjenom perceptivnog
testa.
kola A: MA = 33.6, SDA = 4.60, NA = 564
kola B: MB = 34.3, SDB = 4.70, NB = 570
t = 2.53, p < 0.01
10
180
160
140
120
100
80
A
60 B
40
20
0
21 - 23 24 - 26 27 - 29 30 - 32 33 - 35 36 - 38 39 - 41 42 - 44 45 - 47
Slika 1.
Distribucije rezultata dviju skupina uenika. Rezultati su dobiveni primjenom perceptivnog testa.
Prosjena bodovna razlika uenika te dvije kole manja je od 1 boda, samo 0.7,
ali razlika je statistiki znaajna zbog velikoga broja rezultata. Ima li ta statistiki
znaajna razlika ikakav stvarni smisao? Koliki broj uenika po svom rezultatu pripada
samo jednoj ili samo drugoj distribuciji? Moemo li ustvrditi da su uenici kole B
doista bolji u perceptivnom testu?
Budui da d-indeks ima, zapravo, smisao z-vrijednosti, omoguuje nam odrediti
u kojem se postotku dvije distribucije prekrivaju.
Prema tzv. Cohenovoj konvenciji (koja je openito prihvaena) veliine d-
indeksa imaju sljedee znaenje:
mala veliina uinka: 0.2 prekrivanje distribucij je oko 85%
srednja veliina uinka: 0.5 prekrivanje distribucij je oko 67%
velika veliina uinka: 0.8 prekrivanje distribucij je oko 53%
11
Cohenovoj konvenciji u tom se sluaju distribucije prekrivaju oko 85%. Prekrivanje
distribucija na slici 1. ini se veim, meutim, treba kumulativno gledati neslaganja koje
postoje i na lijevoj i na desnoj strani distribucije.
Oito je, dakle, da veliina uinka i statistika znaajnost imaju razliit smisao.
Veliina uinka ne ovisi o tome je li neka razlika statistiki znaajna ili nije, a vrijedi i
obrnuto.
Vratimo se primjeru s uenjem prije i poslije podne. U tom je sluaju, kako smo
izraunali, d = 0.82 (kad smo koristili zajedniku standardnu devijaciju). Dakle,
distribucije se, prema Cohenovoj konvenciji, prekrivaju neto manje od 53%.
Prekrivanje, ili razlikovanje distribucija, moemo, koristei injenicu da d-
indeks ima zapravo svojstva z-vrijednosti, prikazati i malo drugaije. Ako pogledamo u
tablicu normalne distribucije (takva se tablica nalazi u svakom statistikom udbeniku),
u kojoj moemo oitati postotak sluajeva koji se nalaze u pojedinim segmentima
normalne distribucije (u tablicama se ita postotak izmeu aritmetike sredine i
odreene z-vrijednosti), vidimo da je od z-vrijednosti 0.82 oko 79% rezultata nie
(50%+29%). U tome primjeru to znai da je ispod aritmetike sredine poslijepodnevne
skupine (M15 = 17.9) oko 79% uenika prijepodnevne skupine.
Postoji tablica koja pokazuje, za odreene vrijednosti d-indeksa, koliki je
postotak ispitanika u skupini s niom aritmetikom sredinom ispod vie aritmetike
sredine, i koliki je postotak neprekrivanja dviju distribucija (tablica 1.).
Cohenova konvencija pokazuje u kojem se postotku dvije distribucije prekrivaju,
a u treem stupcu tablice 1. nalazi se postotak neprekrivanja. Primjerice, prema
Cohenovoj konvenciji za d = 0.20 prekrivanje distribucija je 85%. U tablici 1. za d =
0.20 neprekrivanje je distribucija 14.7%, ili okruglo 15%. To su, dakle, kongruentni
podaci, a mogu se koristiti jedni ili drugi, ili i jedni i drugi, prema osobnoj preferenciji
ili prema percepciji jasnoe prikazivanja dobivenih vrijednosti. Moemo gledati i
ovako: u sluaju rezultata s perceptivnim testom samo je 58% (stupac Postotak u
tablici 1.) uenika u koli A ispod prosjene vrijednosti u koli B jer je u tom sluaju d
iznosio samo 0.20.
Kad je d = 0, tada se dvije distribucije potpuno prekrivaju ako su obje
normalne i imaju jednake, ili barem podjednake, standardne devijacije. To je, uostalom,
uvjet za koritenje tablice 1. ona je napravljena prema normalnoj distribuciji. Ako ne
12
moemo pretpostaviti da su dobivene distribucije normalne, ili je testiranje normaliteta
distribucije pokazalo da statistiki znaajno odstupaju od normalne distribucije, onda e
se postoci iz tablice razlikovati od stvarnih postotaka to vie to dobivena distribucija
vie odstupa od normalne.
Tablica 1.
Veliine uinka (d) i korespondentni postoci rezultata u skupini s niom aritmetikom sredinom od
vie aritmetike sredine, postotak neprekrivanja distribucija, koeficijent korelacije r te kvadrirani
koeficijent korelacije (iz Becker, 2000)
13
istovrsnim pojavama i mjerenjima, odnosno, u konkretnom znaenju u nekom podruju.
Katkad i mali d-indeks moe upuivati na praktinu korist. Primjerice, pri primjeni
nekog novog terapijskoga postupka, recimo, za uklanjanje ili ublaavanje kronine
glavobolje, ako se vidi poboljanje kod samo nekoliko osoba, premda d-indeks nije
velik, tim je osobama bolje. To znai da uvijek treba gledati dalje od samih statistikih
vrijednosti.
Ali, vratimo se opet primjeru s prijepodnevnim i poslijepodnevnim uenjem. Ako se u
odreivanju veliine uinka (d) uzme zajednika standardna devijacija, dobije se d =
0.82. Meutim, ako se uzme standardna devijacija samo jutarnje skupine (SD9 = 4.60)
dobit emo d = 0.66 i, to je prema Cohenovoj konvenciji, veliina uinka izmeu
srednje i velike, a prekrivanje distribucija iznosi oko 60%. Razlika nije dramatina, ali
nije ni zanemariva, pa se opravdano postavlja pitanje koji od ta dva d-indeksa treba
koristiti. Budui da je distribucija u poslijepodnevnoj skupini najvjerojatnije asimetrina
jer se radi o stropnom efektu, standardna devijacija izraunata iz takvih rezultata nije
pravi pokazatelj rasprenja rezultata, ili, tonije reeno, nije ju sasvim opravdano
raunati, pa ju je zato bolje ignorirati i uzeti samo standardnu devijaciju jutarnje
skupine.
Jo dvije napomene. Prvo, vidimo da numerika veliina d-indeksa nije
ograniena, tj. najmanja je vrijednost nula kad su aritmetike sredine potpuno jednake, a
gornje granice nema. Numerika veliina d-indeksa ovisi o razlici izmeu aritmetikih
sredina i o rasprenju rezultata u jednoj i drugoj varijabli. Ako su distribucije dvije
skupine rezultata potpuno odvojene, uope se ne prekrivaju i ne dodiruju se, tad e d-
indeks biti velik, ovisno o tome koliko se razlikuju aritmetike sredine tih sasvim
razdvojenih distribucija. Treba li u takvom sluaju uope raunati d? Ako imamo
podatak da su distribucije doista potpuno odvojene, odreivanje d-indeksa ne donosi
nikakvu novu informaciju, ali, dakako, moe se raunati (to bi zadrti statistiari i
zahtijevali).
Drugo, vidimo da se zapravo u dosadanjem tekstu govorilo o izravnom
odreivanju d-indeksa, bez prethodnoga testiranja nul-hipoteze, odnosno utvrivanja
statike znaajnosti razlike meu aritmetikim sredinama. To je mogue, ali ima li
smisla? Ako nam je, primjerice, t-test pokazao da nije opravdano naputati nul-
hipotezu, to znai da je dobivena razlika meu aritmetikim sredinama posljedica
14
djelovanja sluajnih imbenika, odreivanje d-indeksa u tom sluaju ima dvojbenu
statistiku vrijednost. Odreivanja d-indeksa, ima smisla tek kad smo utvrdili da glavni
uzrok razlici meu aritmetikim sredinama nije sluajni varijabilitet. Tek kad vidimo da
je razlika statistiki znaajna, na odabranoj razini rizika, , odnosno da su osim
sluajnih imbenika razliku meu aritmetikim sredinama uzrokovali i neki sustavni
imbenici (npr. nezavisna varijabla ili primijenjeni tretman), ima smisla koristiti d-
indeks koji e pokazati koliko je bilo to djelovanje, a to ne omoguuje sama primjena
t-testa.
Jedno od vanih svojstava d-indeksa jest to da on nije ovisan o N-u. Jo jedno
njegovo vano svojstvo jest i to da se normalno distribuira. Ta injenica omoguuje
odreivanje standardne devijacije te distribucije, pa onda i interval u kojemu se s
odreenom (unaprijed odabranom) sigurnou nalazi dobivena vrijednost d. Standardna
devijacija d-indeksa moe se izraunati pomou ove formule:
N1 N 2 d2
SDd (3)
N1 N 2 2( N1 N 2 )
15
1 1
d t (4)
n1 n2
A (eksperimentalna) B (kontrolna)
M A 38.1 M B 35.0
SDA 6.02 SDB 5.81
N A 78 N B 80
SDM A 0.681 SDM B 0.650
16
25.5 23.4 2.1
t 2.72 p < 0.01
0.552 0.54 2 0.771
6.022 77 5.812 79
Zajednika SD za prvo istraivanje: SD prv 5.88
78 80
6.912 157 6.87 2 161
Zajednika SD za drugo istraivanje: SD drug 6.87
158 162
Pa e d-indeksi biti:
38.1 35.0
d prv 0.53
5.88
25.5 23.4
d drug 0.31
6.87
17
Za sluaj zavisnih uzoraka (mjerenje obavljeno na istim ispitanicima u dvije
situacije), posluimo se ovim, ne sasvim izmiljenim, primjerom.
Vrijeme jednostavne senzomotorne reakcije vrlo esto slui kao zavisna
varijabla pri mjerenju doivljajnog intenziteta osjeta. Odnos izmeu intenziteta
podraaja i vremena reakcije zakrivljen je, ali u odreenom opsegu postoji jasna
nelinearna relacija: to je vei intenzitet podraaja, krae je vrijeme reakcije. Mnogi
eksperimenti pokazali su da postoji prilino jasan utjecaj podraajnoga konteksta na
verbalne iskaze o jaini osjetnoga doivljaja. Postoji li utjecaj podraajnoga konteksta i
na vrijeme reakcije?
U eksperimentu u kojemu je provjeravan utjecaj podraajnoga konteksta na
vrijeme jednostavne senzomotorne reakcije sudjelovalo je 11 dobro uvjebanih mukih
mlaih ispitanika (to su, naravno, bili studenti), a njihova je zadaa bila da reagiraju to
bre na zvune podraaje razliitih intenziteta odmakom kaiprsta s tipkala. Bila su
zadavana dva niza od po etiri podraaja razliitih intenziteta: jai niz i slabiji niz.
Kritini podraaj bio je najslabiji u nizu jaih podraaja i najjai u nizu slabijih
podraaja. Eksperimentatore je zanimalo hoe li vrijeme reakcije na taj podraaj biti
dulje u jaem nizu od vremena reakcije na taj isti podraaj u slabijem nizu. Ako
podraajni kontekst ima utjecaja na vrijeme reakcije, onda bi vrijeme reakcije moglo
biti dulje na najslabiji podraaj u nizu jaih podraaja od vremena reakcije na podraaj
tog istog intenziteta kad je on najjai u slabijem nizu podraaja.
Dobiveni rezultati prikazani su u tablici 2.
Tablica 2.
Vrijeme jednostavne senzomotorne reakcije (u milisekundama) 11 ispitanika na zvuni podraaj
istog intenziteta (X) koji se nalazi u jaem nizu podraaja (VR j) ili u slabijem nizu podraaja (VRs).
VRs VRj
169 174
156 162
173 177
178 176
170 172
181 180
167 171
160 168
159 160
164 167
166 165
Mj = 167.6 Ms = 170.2
SDj = 7.79 SDs = 6.38
18
U postupku metode diferencija, kojom emo utvrditi postoji li statistiki
znaajna razlika u prosjenom vremenu reakcije na kritini podraaj, najprije smo
odredili razliku D = VRs VRj, zatim MD = 2.6, potom SDD = 3.17, onda
MD
SDM D 0.957 i, napokon, t 2.72.
SDM D
M poslije M prije
d (5)
SD prije
19
moe se govoriti o utjecaju podraajnoga konteksta na vrijeme reakcije kao o nekakvoj
izrazitoj pojavi.
20
nekom tretmanu za smanjenje puenja, kao veliina uinka moe se uzeti broj manje
popuenih cigareta. Ako netko, ili skupina osoba, nakon tretmana dnevno popui deset
cigareta manje nego prije, onda je taj broj manje popuenih cigareta sam za sebe
koristan pokazatelj veliinu uinka. Znaenje toga smanjenja procjenjuje se prema tome
je li ono pridonosi poboljanju opega zdravstvenoga stanja ili ne pridonosi. Drugim
rijeima, tu veliinu uinka ne treba standardizirati i pretvarati je u neimenovanu
vrijednost dijeljenjem s nekom pogrekom.
Standardizirana veliina uinka (a to je d-indeks i njemu slini indeksi) koristi se
uvijek onda kada je mjerena varijabla izraena na nekoj manje-vie arbitrarnoj brojanoj
ljestvici (kao to su redovito brojane ljestvice dobivene primjenom testova ili
upitnika), pa dobiveni brojevi nemaju sami za sebe neko znaenje. Osobito se koristi u
sluajevima u kojima se usporeuju veliine uinka iz razliitih istraivanja.
* * *
Poznati su jo Glassov delta-indeks (oznaava se grkim slovom delta: ) koji
uzima samo standardnu devijaciju kontrolne skupine, dakle skupine na koju nije
djelovala nikakva nezavisna varijabla jer se pretpostavlja da je ta standardna devijacija
najbolja procjena populacijske standardne devijacije. Odreuje se kao i d-indeks: razlika
meu aritmetikim sredinama dijeli se sa standardnom devijacijom kontrolne skupine.
M1 M 2
(6)
SDkontrol.skupine
21
skupina koje su u istraivanju) pa je tako pogodan za jednostavnu analizu varijance.
Meutim, uz njega se vee pogreka koja se moe ublaiti pomou ove korekcije:
3
g* g 1 (7)
4n1 n2 9
Ta korekcija osobito se preporuuje za male nezavisne uzorke. Analognom
formulom moe se korigirati i d-indeks.
Druga porodica veliine uinka poiva na korelaciji, ili, kako to neki statistiari
kau, na snazi asocijacije. Veliina uinka odreena na temelju korelacije izmeu dvije
ili vie varijabli razlikuje se od veliine uinka koji se temelji na razlici meu
aritmetikim sredinama (d) jer predstavlja procjenu veliine zajednike varijance meu
varijablama.
Sam koeficijent korelacije, Pearsonov r, predstavlja veliinu uinka, a njegov
kvadrat (r2) pomnoen sa sto, pokazuje postotak zajednike varijance dviju varijabli.
Jednako vrijedi i za multiplu korelaciju: R i R2.
Ovdje je konvencija o interpretativnoj kvalifikaciji veliine uinka drugaija:
0.10 je mala veliina uinka, 0.30 srednja i 0.5 i vie (do 1.0) velika veliina uinka.
22
2 test
2
(formula za koeficijent: ). Moe se koristiti i koeficijent kontingencije C,
N
ali u zadnje se vrijeme, zbog prilinih nedostataka, taj koeficijent izbjegava.
Da bi slika o 2-testu, kao bazi za odreivanje asocijacije meu varijablama, bilo
neto jasnija, pogledajmo sljedei primjer.
Jednom, davno, kad je jo bilo mukih studenata u studiju psihologije, u
nekoliko generacija provedena je mala anketa meu studentima koji su sluali statistiki
kolegij. Anketa se sastojala od samo jednoga pitanja: Molim vas da izrazite svoj stav
prema statistici opredjeljujui se za jedan od ovih odgovora volim statistiku; niti je
volim niti ne volim; mrzim statistiku. Naravno, pitanje je koliko su studenti iskreno
odgovarali, ali budui da su odgovarali anonimno, ipak se donekle moe vjerovati
njihovim odgovorima. Rezultata su navedeni u tablici 3.
Tablica 3.
Rezultati ankete o stavu studenata psihologije prema statistici. Odgovor V: volim statistiku;
odgovor nV/nM: niti je volim, niti je mrzim; odgovor M: mrzim statistiku. S f o su oznaene
opaene, a s ft teoretske frekvencije.
V nV/nM M
fo 29 16 101
Studentice 146
ft 33.44 27.01 85.54
fo 23 26 32
Studenti 81
ft 18.56 14.99 47.46
52 42 133 227
23
Vizualna inspekcija tablice 3. pokazuje da je vrlo velik broj studentica, 116 (oko 79%),
izabrao odgovor M. Taj odgovor izabrao je manji broj studenata, samo 31 (oko
38%). Takva distribucija mogla bi, ugrubo, odgovarati realnosti. Iako po uspjehu u tom
predmetu studenti nisu bili bolji od studentica, ipak su manje mrzili statistiku to
vjerojatno ima svoju psiholoku podlogu, no tu interpretaciju ostavimo za druge prilike.
Letimian pogled na opaene i teoretske frekvencije otkriva nam da su najvee
razlike meu njima u kategoriji V i M, a to upuuje na postojanje povezanosti
izmeu varijable spol studenata i varijable stav prema statistici.
Najprije e nas zanimati razlikuje li se distribucija odgovora studentica i
studenata na postavljeno pitanje. Odgovor na to pitanje dobit emo pomou hi-kvadrat
testa kojim testiramo H0 da nema razlike u distribuciji odgovora izmeu studentica i
studenata. Dakle
2
fo ft
2
22.06 (8)
ft
2 22.0567
Cramerov V 0.3117 (9)
N k 1) 227 1
Simbol k u Cramerovu V oznauje manji broj kategorija u tablici kontingencije.
U naem sluaju manji broj kategorija ima varijabla spol: dvije. Znaajnost toga
koeficijenta najlake je utvrditi pomou hi-kvadrat testa: ako je hi-kvadrat znaajan,
znaajan je i Cramerov V. Postoji, dakle, znaajna asocijacija izmeu varijable spol
24
studenata i stav prema statistici. Kvadrirani Cramerov V iznosi 0.097, a to znai da
te dvije varijable imaju priblino 10% zajednikih faktora.
Izraunajmo sada Cohenov w, prema formuli:
w
pt po 2 (10)
pt
25
manji od .01. Budui da nam vrijednost p govori samo o vjerojatnosti kojom moemo
oekivati hi-kvadrat odreene veliine (jednako kao i kod t-testa), ne moemo nita
drugo zakljuiti nego da se u oba sluaja (i u sluaju iz tablice 3 i u sluaju iz tablice 4)
distribucije odgovora studentica i studenata statistiki znaajno razlikuju. Ali ne
moemo nita zakljuivati o tome razlikuje li se sluaj iz tablice 3. i sluaj iz tablice 4.
Ipak, moemo dobiti odgovor na to pitanje ako usporedimo bilo Cramerov V, bilo
Cohenov w izraunat je za oba sluaja.
Tablica 4.
Rezultati ankete o stavu studenata psihologije prema statistici. Odgovor V: volim statistiku;
odgovor nV/nM: niti je volim, niti je mrzim; odgovor M: mrzim statistiku. S f o oznaene su
opaene, a s ft teoretske frekvencije. Malo promijenjeni rezultati iz tablice 3.
V nV/nM M
fo 15 15 116
Studentice 146
ft 34.73 16.72 94.55
fo 39 11 31
Studenti 81
ft 19.27 9.28 52.45
54 26 147 227
Analiza varijance
26
varijabli. Prema nul-hipotezi, ako su eventualno i dobivene neke razlike, one su nastale
samo pod utjecajem sluajnih imbenika. Tih imbenika koji djeluju po sluaju, ali
uvijek, ima mnogo i djeluju pri svakom mjerenju, a imaju razliita izvorita: sluajni
odabir uzoraka, sluajne pogreke pri mjerenju, sluajne varijacije samih ispitanika,
sluajne promjene u neposrednoj okolini mjerenja itd.
Kako je, meutim, znaajan F-omjer neusmjeren, tj. pokazuje samo da postoje
statistiki znaajne razlike, ali ne pokazuje gdje su te razlike, izmeu kojih aritmetikih
sredina (od najmanje tri skupine ispitanika koji se koriste, primjerice, u jednostavnoj
analizi varijance), potrebna su dodatna provjeravanja. To su tzv. usporedbe parova
aritmetikih sredina za to se najee koristi Scheffov test2. Tim se postupkom dobije
podatak o tome postoji li statistiki znaajna razlika izmeu aritmetikih sredina dvije
skupine ispitanika (od tri ili vie skupina) koji su bili podvrgnuti razliitim razinama
nezavisne varijable (ili razliitim istraivakim ili praktinim prilikama odnosno
uvjetima), pa ako ta razlika postoji, zakljuujemo o specifinom ili razliitom
djelovanju tih razina.
Obino se najprije odreuje opa veliina uinka. U jednostavnoj analizi
varijance Cohen (1988) nudi f-indeks ako su sve podskupine podjednake po broju
ispitanika:
SDm
f , (11)
SD
mg mz
2
SDm (12)
g
2
Provedba tih usporedbi nije sasvim jednostavna pa treba konzultirati tekstove koji se detaljnije bave tim
statistikim procesima.
27
U toj formuli mg oznaava svaku pojedinu aritmetiku sredinu, aritmetiku sredinu
svake podskupine u jednostavnoj analizi varijance, mz zajedniku aritmetiku sredinu
svih skupina, i g oznaava broj skupina (grupa) odnosno razina nezavisne varijable.
f-indeks je, da se tako izrazimo, sinkretian, prikazuje openito kolika je veliina
uinka, poput F-omjera u analizi varijance. Interpretativna konvencija za f-indeks je
ova:
0.10 mala veliina uinka, 0.25 srednja i 0.40 (i vie) velika veliina uinka.
Za jednostavnu analizu varijance postoji jo takvih indeksa, poput onoga koji
navodi Howel (2010):
1 M M tot
2
d (13)
g 1 SDtot
2
g oznauje broj grupa, M pojedinane aritmetike sredine svake grupe, Mtot ukupnu,
totalnu aritmetiku sredinu i SDtot, tj. standardnu devijaciju svih ispitanika.
Naalost razliiti indeksi ne daju identine ishode, ak mogu biti vrlo razliiti,
pa unaprijed treba izabrati jedan od njih.
No, postoje dodatni indeksi koji daju vrlo korisne informacije o stupnju
povezanosti varijabli koritenih u analizi varijance, zapravo, o snazi odnosa meu
varijablama.
ZKiz
Najee se koristi kvadrirana eta: 2 (14)
ZKtot
ZKiz je zbroj kvadrata koji se koristi u analizi varijance; ZKtot ukupan je zbroj
kvadrata svih rezultata odnosno rezultata svih ispitanika.
Kvadrirana eta moe se odrediti i pomou F-omjera i stupnjeva slobode:
F ssiz
2 (15)
ssiz F ssun
ssiz su stupnjevi slobode koji se veu uz zbroj kvadrata izmeu grupa (ZKiz) i ssun
stupnjevi su slobode koji se veu uz zbroj kvadrata unutar grupa (ZKun)3.
3
U statistikoj literaturi anglo-amerikog podrijetla obino se umjesto subskripta un koristi subskript
error, ili skraeno e, jer, doista, varijabilitet unutar grupa rezultat je sluajnih pogreaka pri
mjerenju i pri uzorkovanju, a koje se distribuiraju normalno.
28
Citat iz Petzove statistike kae (str. 360): 2, kvadrirano eta, proporcija je
varijance odgovorna za veliinu uinka. Ili, preciznije, 2 proporcija je totalnog
(ukupnog) varijabiliteta rezultata oko zajednike (ope) aritmetike sredine koji je
odgovoran za varijabilitet aritmetikih sredina grupa iji su rezultati podvrgnuti analizi
varijance. Ili: koliki dio ukupne varijance rezultata otpada na utjecaj nezavisne
varijable."
Kvadrirana eta poznata je i kao korelacijski omjer koji se koristi za odreivanje
stupnja povezanosti izmeu varijabli kojima crta regresije nije pravac nego neki stupanj
zakrivljenog odnosa pa se stoga naziva jo i koeficijent zakrivljene korelacije. Vano
svojstvo kvadrirane ete jest, dakle, neosjetljivost na zakrivljenje odnosa meu
varijablama, pa u takvim sluajevima nije opravdano raunati Pearsonov r, koji je
koeficijent linearne povezanosti meu varijablama.
29
recimo, verbalni odgovor ispitanika. Meutim, jo krajem 19. stoljea bilo je poznato da
se na vrijeme jednostavne senzomotorne reakcije moe djelovati na razliite naine, a
jedan od njih je i formuliranje upute ispitanicima.
Temeljem tog staroga podatka proveden je eksperiment (Kolesari, Krizmani i
pehar, 1986) u kojemu je u tri skupine ispitanika mjereno jednostavno vrijeme
senzomotorne reakcije na zvuni podraaj. Svaka skupina imala je malo izmijenjenu
uputu. Jedna skupina dobila je standardnu uputu koja glasi otprilike ovako: Molimo
vas da reagirate to bre moete na zvuni podraaj. Skupina s tom uputom oznaena
je s N (neutralna uputa). Druga skupina dobila je senzornu uputu koja je glasila
otprilike ovako: Molimo vas da reagirate to bre moete, ali budite sigurni da ste uli
podraaj. Ta je skupina oznaena sa S (senzorna uputa). Trea je skupina dobila
motornu uputu koja je glasila otprilike ovako: Molimo vas da reagirate doista to
bre moete im ujete zvuk (oznaena s M). Motorna reakcija bila je to bre
odmicanje kaiprsta s tipkala. Na temelju rezultata tog eksperimenta sloen je primjer,
malo prilagoen potrebi udbenika, te je, u nekoj mjeri i nekom obliku, koriten i u
knjizi Analiza varijance u psihologijskim istraivanjima (Kolesari, 2006) i u Petzovoj
statistici (Petz, Kolesari i Ivanec, 2012).
Osnovni rezultati prikazani su u tablici 5.
Tablica 5.
Vrijeme jednostavne senzomotorne reakcije na zvuni podraaj tri skupine ispitanika izraeno u
tisuinkama sekunde. Skupine su oznaene s N (neutralna uputa), sa S (senzorna uputa) te s M
(motorna uputa).
N S M
M 177.0 183.9 164.1 M = 175.0
SD 14.92 18.84 16.99
n 18 18 18
Tablica 6.
Osnovni podaci potrebni u analizi jednostavne analize varijance u primjeru s jednostavnim
vremenom senzomotorne reakcije za rezultate prikazane u tablici 5. ZK = zbroj kvadrata; ss =
stupnjevi slobode; PK = prosjeni kvadrat ili varijanca.
Izvor ZK ss PK F
varijabiliteta
Izmeu grupa 3668.111 (g 1) = 2 1834.0556
6.35
Unutar grupa 14727.889 (N g) = 51 288.7821
Ukupno (total) 18396.000 N 1 = 53
30
PK je prosjeni kvadrat ili varijanca, dobije se dijeljenjem zbroja kvadrata (ZK) s
odgovarajuim stupnjevima slobode. ee se upotrebljava izraz prosjeni kvadrat
zbog izbjegavanja konfuzije jer su to varijance na razliitim razinama.
Uz 5% rizika dobiveni F-omjer statistiki je znaajan, tj. p < 0.05. Granina
vrijednost u tablicama F-omjera za 5% rizika te 2 i 51 stupanj slobode iznosi 3.18, a
dobiveni je 6.35. Prema tome, ne ostajemo na nul-hipotezi.
Pojedinane usporedbe, pomou Scheffova testa, pokazale su da je razlika
izmeu aritmetike sredine neutralne skupine (MN = 177.0) i aritmetike sredine
motorne skupine (MM = 164.1) statistiki znaajna na razini rizika od 5%, kao i
razlika izmeu senzorne (MS = 183.9) i motorne (MM = 164.1) skupine.
Na temelju tih statistikih vrijednosti moemo zakljuiti, dakle, da postoji
utjecaj sadraja upute na vrijeme jednostavne senzomotorne reakcije. Ali, nemamo ni
jedan podatak o tome kolika je, zapravo, razlika, odnosno, kolike su razlike. Podatak da
je pri odustajanju od nul-hipoteze p 0.01 ne govori nam praktino nita o veliini
razlike, a to je, ipak, podatak koji treba zanimati svakog istraivaa, a osobito
praktiara.
No, poimo korak dalje. Izraunajmo najprije Cohenov f, koji pokazuje veliinu
uinka u jednostavnoj analizi varijance. Izraunat emo ga pomou formula (11) i (12) i
dobit emo f = 0.48. Vii je od 0.40. pa je to, dakle, velika veliina uinka (granine
vrijednosti interpretativne konvencije nalaze se na stranici 28).
Izraunajmo i d koji predlae Howel formula (13), str. 28. Dobije se neto
manja vrijednost, d = 0.41, jer je, oito, ovaj indeks konzervativniji od f-indeksa, ali,
takoer, predstavlja veliku veliinu uinka.
Koji od njih odabrati? Najbolje oba, ali to ovisi o korisniku, o tome eli li stroi
ili malo manje strog kriterij, a ovisi i o vrsti varijabli i cilju istraivanja.
3668.11
Sad odredimo kvadrirano eta prema formuli (14): 2 0.20 . Na str.
18396
29 nalazi se konvencija o interpretativnoj veliini kvadriranog eta. Misli se da je 0.22
velika veliina, a ovdje je dobiveno 0.20, dakle, blizu velike veliine. Proporcija
nezavisne varijable (u ovom sluaju vrsta upute ispitanicima) koja je odgovorna za
razlikovanje aritmetikih sredina tri skupine ispitanika iznosi 0.20 ili 20%.
31
Zato nam je vaan takav podatak? Redovito smo skloni statistiki znaajnu
razliku (dobivenu koritenjem t-testa ili analize varijance) generalizirati i rei otprilike
ovako: skupina ispitanika koja je imala motornu uputu ima krae vrijeme jednostavne
senzomotorne reakcije. A taj zakljuak nije sasvim toan. Ta tvrdnja vrijedi za
prosjean rezultat, a to znai da ima onih ispitanika koji doista imaju krae vrijeme, ali i
onih koji nemaju krae vrijeme reakcije. Meutim, dodatni podaci, Cohenov f i
Howellov d, upuuju na to kolika je zajednika varijanca. Kvadrirano eta pokazuje nam
koliko je snaan utjecaj nezavisne varijable na zavisnu varijablu to se prosjene
vrijednosti u zavisnoj varijabli razliitih skupina ispitanika vie meusobno razlikuju, to
je vei utjecaj nezavisne varijable. Prema tome, nakon ove sloenije obrade rezultata
moemo zakljuiti da ne samo da postoje prosjene razlike izmeu skupina ispitanika
koje su imale razliite upute, nego i da su te razlike velike. Odnosno, oito postoji
znaajan i relativno velik utjecaj uputa ispitanicima na njihovo vrijeme reakcije.
Kvadrirano eta ima jo jedno korisno svojstvo: moe se koristiti kao pokazatelj
parcijalne korelacije pa se tada zove parcijalno kvadrirano eta, a biljei se s parc.2.
Koristi se u sloenoj analizi varijance kad se eli utvrditi veliina uinka pojedinih
nezavisnih varijabli. U jednostavnoj analizi varijance kvadrirano eta i parcijalno
kvadrirano eta jedno su te isto.
Kao primjer odreivanja veliine uinka kod sloene analize varijance posudit
emo opet primjer iz Analize varijance u psihologijskim istraivanjima (Kolesari,
2006, str. 131). Taj je primjer proirenje prethodno opisanog eksperimenta s vremenom
reakcije i razliitim uputama, ali ovaj put ispitanici su podijeljeni na mlae i starije. Kao
to je poznato, mlae i starije osobe razlikuju se, u prosjeku, po brzini reagiranja (stariji
su, naravno, sporiji), pa je svaka skupina od 18 ispitanika podijeljena na mlae i starije
ispitanike, a to znai da sada imamo dvije nezavisne varijable: jedna je vrsta upute, koja
ima tri kategorije, a druga je dob ispitanika, koja ima dvije kategorije. Njihovi su
rezultati, malo prilagoeni edukacijskim potrebama, prikazani u tablici 7.
32
Tablica 7.
Rezultati u 2x3 tablici sloene analize varijance
Tablica 8.
Zavrni rezultati sloene analize varijance
Izvor
ZK ss PK F
varijabiliteta
Dob (ml., st.) 2016.6667 gMl,St - 1 = 1 2016.6667 8.85 p < 0.01
Upute (N, S, M) 3668.1111 gN,S,M -1 = 2 1834.0556 8.05 p < 0.01
Interakcija 1768.7778 (gMl,St-1)( gN,S,M -1)=2 884.3889 3.88 p < 0.05
Unutar grupa 10932.4445 N g = 48 227.7593
Ukupno (total) 18386.0001 N 1 = 53
Za varijablu upute:
ZKupute
parc.upute
2
(16)
ZKtotal ZKdob ZKint erakcija
33
Za varijablu dob:
ZKdob
parc.dob
2
(17)
ZKtotal ZKupute ZKint erakcija
ZKint erakcija
parc.int
2
er (18)
ZKtotal ZKupute ZKdob
parc.upute
2
0.25 parc.dob
2
0.16 parc.int
2
er 0.14
34
prezentiranje upute ima uinka na vrijeme reakcije, kakav tek utjecaj ima na, recimo,
verbalne reakcije, koje su pod znatno veom namjernom ili nenamjernom kontrolom
ispitanika?!
Mogue je, naravno, i spekuliranjem doi do slinih ili jednakih zakljuaka, ali
nae e inventivno rezoniranje biti uvjerljivije ako je potkrijepljeno objektivnim
statistikim argumentima.
I ovdje moemo odrediti, nazovimo ga tako, ukupni kvadrirani eta pomou
formule (14), a iznosi 0.41, dakle vrlo je velika veliina uinka (granini za veliki
uinak jest 0.22, str. 29). Napomena: ovdje emo ZKiz dobiti zbrajanjem vrijednosti iz
tablice 8, ZKupute+ZKdob+ZKinterakcija. Taj kvadrirani eta, meutim, u ovom sluaju nema
neku osobito informativnu vrijednost, jer smo raunali parcijalne indekse koji su nam
vaniji.
Ponavljamo upozorenje statistiara: dobivene vrijednosti nikada se ne smiju
smatrati apsolutnim podacima, koji jednako vrijede u svakom sluaju. Naprotiv, njihovo
i teorijsko i praktino znaenje ovisi o kontekstu, o koritenim varijablama i ciljevima
istraivanja.
Howell (2010) nudi, prema njegovu miljenju, bolji indeks veliine uinka iz
korelacijske porodice, 2 (kvadrirana omega). Osim njega, i mnogi drugi autori tvrde
da se taj indeks najee koristi u analizi varijance. Kvadrirana omega pokazuje kolika
je proporcija varijabiliteta u zavisnoj varijabli u odnosu na odreenu nezavisnu
varijablu. Uobiajeno je da se kvadrirana omega interpretira samo za statistiki
znaajne rezultate. Statistiari kau da je kvadrirana omega bolja od kvadrirane ete zato
to u formuli uzima u obzir stupnjeve slobode. Formula za odreivanje kvadrirane
omege u jednostavnoj analizi varijance:
ZKiz ( g 1) PK un
2 (19)
ZKtot PK un
35
pogreke uzorkovanja (u engl. jeziku najee se oznauje s error); ZKtot ukupan je
zbroj kvadrata za sve rezultate4.
Koristei rezultate, kao i za kvadriranu etu, iz tablice 6: 2 = 0.10. Taj je indeks
konzervativniji od kvadrirane ete i redovito je manji, to se vidi i u naem sluaju.
Interpretira se prema konvenciji kao i kvadrirana eta ili se pomnoi sa 100 i tako se
dobije postotak zajednike varijance, dakle, u ovom sluaju, zajednika varijanca iznosi
10%.
Kvadriranu omegu smije se koristiti samo ako su veliine skupina jednake ili
barem vrlo sline.
Formule za parcijalnu kvadriranu omegu za dvosmjernu analizu varijance (jednu
nezavisnu varijablu oznait emo s A, drugu s B, a interakciju s AB) jesu:
ssizA PK izA PK un
parc. A2 (20)
ZKizA Ntot ssizA PK un
ssizB PK izB PK un
parc.B2 (21)
ZKizB Ntot ssizB PK un
ssAB PK AB PK un
parc. AB
2
(22)
ZK AB Ntot ssAB PK un
4
U Petzovoj statistici, naalost, u formuli za kvadriranu omegu na str. 361. u nazivniku pogreno stoji
minus, a treba biti plus, dakle, tono je ZKtot PK un. Meutim, na str. 362. gdje se raunaju vrijednosti
iz primjera, formula je tono napisana.
36
Viestruka (multipla) regresija
2
RKP je proporcija varijance odgovorna za K i P zajedno, a RP2 je proporcija
varijance odgovorna za P (skup varijabli u multiploj regresiji koji obino nazivamo
2
prediktorima). Stoga brojnik u gornjoj formuli ( RKP RP2 ) pokazuje proporciju varijance
odgovornu samo za varijablu K u odnosu na sve druge varijable (tj. P).
* * *
37
Literatura
Bachmann, C., Luccio, R. i Salvadori, E. (2005). Statistina pomembnost in njen pomen. Psiholoka
obzorja, 14(3), 7-40.
Coe, R. (2002). It's the Effect Size, Stupid. What effect size is and why it is important. Paper presented at
the Annual Conference of the British Educational Research Association.
Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences. Hillsdale, NJ: LEA.
Cohen, J. (1994). The earth is round (p < 0.05). American Psychologist, 49(12), 997-1003.
Ferguson, C.J. (2009). An effect size primer: A guide for clinicians and researchers. Professional
Psychology: Resarch and Practice, 40(5), 532-538.
Gamst, G., Meyers, L.S. i Guariono, A.J. (2008). Analysis of Variance Designs. Cambridge: Cambridge
University Press.
Glass, G.V. & Hopkins K.D. (1984). Test Bank for Statistical Methods in Education & Psychology.
Englewood Cliffs, NJ: Prentice Hall.
Howell, D.C. (2010). Statistical Methods for Psychology. Belmont, CA: Wadsworth, Cengage Learning.
Khberger, A., Fritz, A. i Scherndl, T. (2014). Publication bias in Psychology: A diagnosis based on the
correlation between effect size and sample size. DOI:10.1371/Journal.pone.0105825.
Lakens, D. (2013). Calculating and reporting effect sizes to facilitate cumulative science: a practical
primer for t-tests and ANOVAs. Frontiers in Psychology, 4, 863.
Nickerson, R.S. (2000). Null hypothesis significance testing: A review of an old and continuing
controcersy. Psychological Methods, 5(2), 241.
Petz, B., Kolesari, V. i Ivanec. D. (2012). Petzova statistika. Jastrebarsko: Naklada Slap.
Vacha-Haase, T., Nilsson, J.E., Reetz, D.R., Lance, T.S. i Thompson, B. (2000). Repoting practices and
APA editorial policies regarding statistical significance and effect size. Theory & Psychology,
Vol. 10(3), 413-425.
38
DODATAK A
39
DODATAK B
Granine vrijednosti t-testa
razine rizika
ss 10% 5% 2% 1%
1 6.34 12.71 31.82 63.66
26,431 12.71.34
2.92 12.71
4.30 31.82
6.96 63.66
9.92
3 2.35 3.18 4.54 5.84
4 2.13 2.78 3.75 4.60
5 2.02 2.57 3.36 4.03
6 1.94 2.45 3.14 3.71
7 1.90 2.36 3.00 3.50
8 1.86 2.31 2.90 3.36
9 1.83 2.26 2.82 3.25
10 1.81 2.23 2.76 3.17
11 1.80 2.20 2.72 3.11
12 1.78 2.18 2.68 3.06
13 1.77 2.16 2.65 3.01
14 1.76 2.14 2.62 2.98
15 1.75 2.13 2.60 2.95
16 1.75 2.12 2.58 2.92
17 1.74 2.11 2.57 2.90
18 1.73 2.10 2.55 2.88
19 1.73 2.09 2.54 2.86
20 1.72 2.09 2.53 2.84
21 1.72 2.08 2.52 2.83
22 1.72 2.07 2.51 2.82
23 1.71 2.07 2.50 2.81
24 1.71 2.06 2.49 2.80
25 1.71 2.06 2.48 2.79
26 1.71 2.06 2.48 2.78
27 1.70 2.05 2.47 2.77
28 1.70 2.05 2.47 2.76
29 1.70 2.04 2.46 2.76
30 1.70 2.04 2.46 2.75
35 1.69 2.03 2.44 2.72
40 1.68 2.02 2.42 2.71
45 1.68 2.02 2.41 2.69
50 1.68 2.01 2.40 2.68
60 1.67 2.00 2.39 2.66
70 1.67 2.00 2.38 2.65
80 1.66 1.99 2.38 2.64
90 1.66 1.99 2.37 2.63
100 1.66 1.98 2.36 2.63
125 1.66 1.98 2.36 2.62
150 1.66 1.98 2.35 2.61
200 1.65 1.97 2.35 2.60
300 1.65 1.97 2.34 2.59
400 1.65 1.97 2.34 2.59
500 1.65 1.96 2.33 2.59
1000 1.65 1.96 2.33 2.58
1.65 1.96 2.33 2.58
40
DODATAK C
41