Download as pdf or txt
Download as pdf or txt
You are on page 1of 44

Vladimir Kolesari

Jasmina Tomai Humer

Veliina uinka
Nakladnik
Sveuilite Josipa Jurja Strossmayera u Osijeku
Filozofski fakultet

Za nakladnika
prof. dr. sc. Loretana Farka

Autori
professor emeritus Vladimir Kolesari
dr.sc. Jasmina Tomai Humer

Recenzenti
dr. sc. Dinka orkalo Biruki, red. prof.
dr. sc. Dragutin Ivanec, izv. prof.

Lektor
Ivan Martini, prof.

ISBN 978-953-314-087-2

Objavljivanje ove sveuiline skripte odobrio je Senat Sveuilita Josipa Jurja Strossmayera u
Osijeku br. 2/16 od 26. sijenja 2016.

ii
Sadraj
Uvod .............................................................................................................................1
to nam pokazuje testiranje nul-hipoteze? ...................................................................2
Veliina uinka .............................................................................................................5
d porodica veliine uinka ............................................................................................7
Upozorenja i jo neki indeksi d-tipa ...........................................................................20
r porodica veliine uinka ...........................................................................................22
2 test........................................................................................................................23
Analiza varijance ........................................................................................................26
Viestruka (multipla) regresija ..................................................................................37
Literatura.....................................................................................................................38
DODATAK A............................................................................................................39
DODATAK B ............................................................................................................40
DODATAK C ............................................................................................................41

iii
Uvod
Glavni cilj ovoga teksta jest pribliiti studentima (ali i psiholozima praktiarima
i istraivaima) smisao i korist od dodatnih statistikih vrijednosti koje su se do sada
relativno rjee koristile.
Dodatni je cilj pokazati da je uvijek dobro ponovno raspravljati o svemu, pa tako
i o upotrebi statistike u psihologiji, zapravo, o njezinoj nedovoljno racionalnoj upotrebi.
Naalost, vrlo se esto zaboravlja da je statistika samo alat i nita drugo. Statistika ne
odgovara na pitanja korisnika, ona samo pomae u interpretaciji rezultata i titi od vrlo
pogrenih i subjektivnih zakljuaka. Ali, statistika nije svemogua i to se esto
zaboravlja ima svojih nedostataka koje je svakako valja poznavati da ne bismo
napravili jo vee i tee pogreke u zakljuivanju.
Na primjer, znaajno i statistiki znaajno nije isto. Statistiki znaajno ima
svoju jasnu statistiku podlogu u logici postavljanja i testiranja nul-hipoteze, ali to ne
mora biti, a esto i nije u skladu sa stvarnom praksom i znaenjem. Poznati primjer:
tjelesna visina ljudi ujutro i naveer statistiki je znaajno razliita, ali nema nikakvo
praktino znaenje. Uvijek, dakle, imati na umu da statistika nije nedodirljiva sveta
krava i da stoga treba u svakom pojedinanom sluaju treba razmisliti o primjerenoj
upotrebi statistikih postupaka i o njihovoj interpretaciji u zadanom kontekstu. Statistika
samo relativno objektivno potkrepljuje postavljene hipoteze, nita vie od toga.
Prelistavajui ne sasvim svjei broj asopisa Theory & Psychology naili smo na
lanak koji se bavi veliinom uinka (Vacha-Hasse, Nilsson, Reetz, Lance i Thompson,
2000). Na poetku toga lanka autori su citirali naputak Amerike psiholoke
asocijacije, objavljen 1994. godine, a koji se odnosi na statistiku opremu lanaka
objavljivanih u asopisima te asocijacije. U tom se naputku istie da sama p vrijednost
pri statistikom testiranju nul-hipoteze nije dovoljno informativan pokazatelj
djelotvornosti uinka koji upuuje na djelovanje nekog ispitivanog faktora. Meutim,
autori u tome lanku upozoravaju na to da se psiholozi tvrdoglavo dre stare prakse u
kojoj nema podatka o veliini uinka.
Navodimo dva vrlo ilustrativna citata dvojice vrlo uglednih autora u podruju
koritenja statistike u psihologiji.

1
G. V. Glass (1984): Statistika znaajnost je najmanje interesantan podatak o
rezultatima. Treba opisati rezultate kao mjere veliine ne samo da je neki tretman
utjecao na ljude, nego koliko je utjecao.
J. Cohen (1988): Primarni produkt istraivanja su jedna ili vie mjera veliine
uinka, ne p vrijednosti.
D. Lakens (2013) istie da standardizirana veliina uinka daje razumljiv i
upotrebljiv podatak bez obzira na skalu mjerenja zavisne varijable. Takva
standardizirana veliina uinka omoguuje da se pokae koje praktino znaenje
dobivenih rezultata tj. koje su praktine posljedice prikupljenih rezultata u
svakidanjem ivotu.

to nam pokazuje testiranje nul-hipoteze?

Valja se prisjetiti: u postupku testiranja nul-hipoteze zanima nas razlikuju li se


aritmetike sredine dvaju uzoraka (dva skupa podataka) statistiki znaajno, tj. moemo
li ostati na nul-hipotezi (H0: nema razlike, odnosno, dobivena razlika je rezultat
sluajnih imbenika), ili nam statistike vrijednosti (npr. t-test) pokazuju da je razlika
statistiki znaajna pa vie ne ostajemo na nul-hipotezi. Jedan od poetnih koraka u tom
postupku jest i odreivanje razine rizika, tj. donoenje odluke o vrijednosti alfa (), koja
pokazuje vjerojatnost odbacivanja nul-hipoteze kad je ona uistinu tona, ili vjerojatnost
pogrenosti odluke. Najee istraivai odabiru = 0.05 ili, u novije vrijeme, = 0.01.
Odabirom vrijednosti istraiva pokazuje do koje granice prihvaa rizik pogrene
odluke (da je odbacio nul-hipotezu, a ona je tona). Istraivai odabiru vrijednosti
vlastitom odlukom, koja se, dakako, treba temeljiti na nekim razlozima.
Vrijednost p jest vrijednost realno dobivene razine rizika koja moe biti manja
ili vea od odabrane vrijednosti , a pokazuje vjerojatnost kojom je dobivena konkretna
statistika veliina; ta vjerojatnost vrijedi ako je nul-hipoteza zaista tona. Ako u nekoj
realnoj prilici dobijemo, recimo, p = 0.007, to e znaiti da postoji vrlo mala
vjerojatnost da je nul-hipoteza tona. Ako smo dobili, recimo, p = 0.62, to pokazuje
kako postoji velika vjerojatnost da je H0 tona.
Bez obzira na to do koje razine se u nekom istraivakom postupku koristi
statistiko-matematika obrada rezultata, uvijek je prijeko potrebno najprije prikazati

2
temeljne podatke i temeljne ishode osnovne statistike obrade rezultata, a meu te
temeljne podatke pripada, svakako, i veliina uinka. Ti temeljni podaci osim
aritmetikih sredina, standardnih devijacija, minimalnog i maksimalnog postignutog
rezultata jesu odreivanje intervala pomou pogreke aritmetike sredine u kojemu se
nalazi prava aritmetika sredina i podaci o testiranju nul-hipoteze: veliina t-testa i p-
vrijednost.
Navest emo nekoliko upozorenja koja se odnose na upotrebu statistike u
psihologiji.
Poet emo s opim upozorenjem, koje se odnosi na vrlo rairenu upotrebu
jednostavnijih statistikih postupaka. Statistika je, nedvojbeno, neobino korisna i u
psihologijskim istraivanjima i u psihologijskoj praksi. Meutim, naalost, mnogi
psiholozi-istraivai, pa i psiholozi-praktiari, gledaju na statistiku kao na demijurga.
Misle da je rezultat dobiven statistikom obradom nedodirljiv, bez mane, bez
pogreke. No, mnogo je puta to, zapravo, skrivanje iza dobivenih statistikih
vrijednosti: ako je statistika obrada pokazala da postoji statistiki znaajna razlika,
onda je to tako i nikako drugaije, tome nema prigovora. Ili, ako rezultat statistike
obrade rezultata pokae da razlika meu aritmetikim sredinama dviju skupina
ispitanika nije statistiki znaajna, uzima se kao definitivna injenica da je nul-hipoteza
tona.
No, svaki statistiki rezultat treba uzeti cum grano salis. Poznati je primjer s
ispitivanjem korisnosti aspirina u prevenciji sranog napadaja. Vrlo velika skupina
ispitanika podijeljena je po sluaju u dvije skupine: jedna skupina uzimala je jednu
pilulu aspirina dnevno, a druga placebo. Zavisna varijabla bila je pojava sranog
napadaja: je li ga netko imao ili ga nije imao. Statistika obrada rezultata pokazala je da
nema statistiki znaajne razlike u broju sranih napadaja izmeu skupine koja je
uzimala aspirin i one koja je uzimala placebo. Izraunata je korelacija izmeu zavisne i
nezavisne varijable i ona je iznosila r = 0.034, to je objanjavalo samo 0.12%
varijance. Meutim, ipak dovoljno velik broj (iako ne statistiki znaajan) pripadnika
skupine koja je uzimala aspirin nije imao napadaj, pa su istraivai ipak preporuili
uzimanje aspirina (ako nema nekih idiosinkratinih neeljenih nuspojava), tj. prekinuli
su istraivanje i onima koji su uzimali placebo preporuili uzimanje aspirina (prema
Rosnow i Rosenthal, 1989).

3
Testiranje nul-hipoteze, koje poiva na t-testu, postupak je koji daje dihotomni
rezultat. Tu je vrijednost p kljuna. Na temelju nje odluujemo: ili ostajemo pri nul-
hipotezi ili ne prihvaamo nul-hipotezu i prihvaamo nau radnu, prethodno postavljenu
hipotezu. A p izravno ovisi o veliini uzoraka: to je vei N, to je automatski manje p,
pa, prema tome, bez obzira na sve drugo, to je vei N, vea je vjerojatnost da e razlika
meu aritmetikim sredinama biti statistiki znaajna. I obrnuto, to je manji N, razlika
ima manju ansu da bude proglaena statistiki znaajnom. Psiholozi-statistiari misle
da takva strategija ne omoguuje napredak ni znanosti ni prakse.
Cohen (1994) upozorava na glavni problem testiranja nul-hipoteze. Istraiva je
zainteresiran za odgovor na pitanje kolika je vjerojatnost da je nul-hipoteza tona. No,
testiranje nul-hipoteze odgovara na to koliko je vjerojatno da se dobije odreeni skup
podataka ako je nul-hipoteza tona. A Nickerson (2000), pak, upozorava na to da je
testiranje nul-hipoteze velika zabluda jer, gotovo redovito, istraivai na temelju
dobivene p vrijednosti interpretiraju tonost ili vjerojatnost nul-hipoteze.
Prvo, ostajanje na nul-hipotezi ne mora znaiti da je nul-hipoteza zaista tona.
Neki, malo stroi statistiari, tvrde da nul-hipoteza u zbilji nikada nije tona. Zaboravlja
se, meutim, da nul-hipoteza ima ustvari samo radno obiljeje jer je tako postavljena
procedura testiranja znaajnosti razlike.
Drugo, prihvaanje radne hipoteze nema nikakve veze sa statistikim ishodom.
Taj ishod samo kae kolika je vjerojatnost pogreke, ali nita ne govori o tome je li
tona postavljena radna hipoteza ili je tona neka druga, alternativna, hipoteza. Tonost
radne (alternativne) hipoteze ovisi samo o znanju i domiljatosti njezina autora.
Tree, istraivanje se poduzima zato da bi se saznalo ne samo postoji li
djelovanje neke nezavisne varijable, nekoga imbenika, nekoga tretmana, nego i zato da
se utvrdi koliko je to djelovanje. Kako poznavanje veliine djelovanja nije nevano
pokazuje dobro poznati primjer s tjelesnom visinom ujutro i naveer: tjelesna visina
naveer statistiki je znaajno manja nego ujutro, ali to, kako nam pokazuje
svakodnevno iskustvo, nema nikakvih praktinih posljedica.
Ali, zamislimo i ovakav primjer: elimo provjeriti neki novi psihologijski
postupak, recimo za odvikavanje od puenja, i to provjeravamo na dvije skupine puaa;
na jednoj skupini primijenjujemo uobiajeni postupak, na drugoj neki novi postupak.
Rezultat mjerimo pomou dobro konstruiranog upitnika. I, recimo, da je u tom upitniku

4
skupina s novim postupkom postigla statistiki znaajno bolji rezultat, tj. vei rezultati u
upitniku pokazuju bolje odvikavanje od puenja. Taj nam podatak u praktinom smislu
gotovo nita ne znai; znait e nam podatak o tome koliko je ispitanika u skupini s
novim postupkom postiglo bolje rezultate u upitniku od ispitanika u skupini s
uobiajenim postupkom. Ako je od stotinjak ispitanika samo desetak postiglo bolje
rezultate, onda usprkos znaajnom rezultatu, nije opravdano (ni praktino ni teorijski)
zakljuiti da je nova metoda odvikavanja od puenja uspjena. Kad bi barem pedesetak
ispitanika imalo bolji rezultat, tada bi uvoenje nove metode imalo smislenog znaenja.
etvrto, kad se dobije statistiki znaajna razlika izmeu dviju skupina
ispitanika, preutno se prihvaa da se to je redovito vidljivo u daljnjem opisu i
interpretaciji takva rezultata svi ispitanici u tim skupinama meusobno razlikuju, a
obino se razlikuje samo manji broj njih, jer se redovito distribucije meusobno
prekrivaju.
Peto, proces i konani ishod testiranja nul-hipoteze daje samo informaciju o
tome ostajemo li na nul-hipotezi ili ne ostajemo, tj. kolika je vjerojatnost pogreke pri
naputanju nul-hipoteze ili kolika je vjerojatnost ostajanja uz nul-hipotezu.
esto, na kraju, to osobito vrijedi za praktini rad, zanimat e nas pojedinci, a
ne samo cijela skupina. Podaci o cijeloj skupini kojoj neki pojedinac pripada, samo su
kontekst za mjerenu varijablu, a on nam pokazuje gdje je, u odnosu na ostale lanove
skupine, smjeten taj pojedinac.

Veliina uinka

Veliina uinka koristi se u ovim sluajevima: korelacija izmeu dvije varijable;


regresijski koeficijent (koji pokazuje nagib regresijskoga pravca); razlika izmeu dvije
aritmetike sredine; jednostavna i sloena analiza varijance; odreivanje snage
statistikoga testa; planiranje veliine uzorka; meta-analiza.
Veliina uinka jest procjena stupnja u kojemu je ispitivani fenomen prisutan,
odnosno u kojem stupnju postoji u populaciji, ili stupanj u kojemu je nul-hipoteza nije
tona. Moe se rei i ovako: istraivanje, ili konani rezultat istraivanja ima smisla ako
razlika ili stupanj povezanosti dosegne odreenu veliinu. To je podatak o tome koliki
je bio uinak nezavisne varijable, a ne samo o tome je li postojao neki uinak ili to,

5
dakle, nije samo binarni podatak. Veliina uinka moe biti izraena kao razlika izmeu
dva populacijska parametra, kao odstupanje od neke konstante odnosno neke poznate
vrijednosti te kao veliina povezanosti meu varijablama (koeficijent korelacije) (Petz,
Kolesari i Ivanec, 2012).
Postoje barem, tri vana razloga zbog kojih treba odrediti veliinu uinka u
psihologijskim istraivanjima, kao i u praktinom radu psihologa (Vacha-Hasse i sur.,
2000).
Prvo, p vrijednosti same za sebe ne mogu se upotrijebiti kao pokazatelj veliine
uinka, jer su pod pomijeanim meusobno povezanim utjecajem mnogih svojstava
istraivanja, ukljuujui i veliinu uinka i veliinu uzorka (N).
Drugo, malo vjerojatni rezultati (tj. rezultati s malom p vrijednou) nisu nuno
bitno interesantni u istraivanjima. Neki jako nevjerojatni dogaaji (npr. vjerojatnost da
e netko umrijeti itajui ovaj lanak) ili pak jako vjerojatni dogaaji (npr. da e
podloga na koju pada kia biti mokra), dakle oni dogaaji koji se ekstremno
konsekventno pojavljuju, zapravo su u statistikom smislu potpuno beznaajni. Dakle,
test statistike znaajnosti ne moe se razumno upotrijebiti za razlikovanje vanosti
rezultata hinjenjem objektivnosti. Tome se najbolje narugao J. Cohen u lanku The
earth is round (p < 0.05) (1994) (Zemlja je okrugla, p < 0.05).
Tree, p vrijednosti ne upuuju izravno na kritino pitanje ponovljivosti
(replikabilnosti) rezultata, jer statistiki testovi ne testiraju vjerojatnost dogaanja
rezultata uzorka u populaciji. Umjesto toga, statistika znaajnost pretpostavlja da nul-
hipoteza tono opisuje populacijske parametre (tj. populacijske aritmetike sredine,
populacijske koeficijente korelacije) i tako procjenjuje vjerojatnost rezultata uzorka (tj.
aritmetike sredine uzorka ili koeficijente korelacije uzorka) ili ekstremnijih rezultata u
uzorku odreene veliine, uz uvjet da su uzorci iz pretpostavljene populacije.
Veliina uinka moe se koristiti kao dopuna i potkrepljenje statistikim
testovima (kakav je npr. t-test ili analiza varijance) ili kao opa, generalizirana procjena
veliine djelovanja neke nezavisne varijable ili nekoga tretmana ili, openito, veliine
djelovanja nekoga imbenika.

6
Pokuat emo prikazati najee koritene indekse veliine uinka: to veliina
uinka jest, kako se rauna i kako se moe interpretirati1. Odreivanje snage
statistikoga testa i s tim povezano planiranje veliine uzorka te meta-analiza posebne
su teme pa se ovdje njima neemo baviti.
Veliina uinka jednostavan je nain kvantitativnog izraavanja razlike izmeu
rezultata dviju skupina ispitanika. Taj nain, tj. veliina uinka ima neke prednosti u
usporedbi s testiranjem statistike znaajnosti, ili statistikog testiranja nul-hipoteze.
Veina autora koji govore o veliini uinka stavljaju taj indeks kao dopunu
testiranju nul-hipoteze, uglavnom kada govore o t-testu, o analizi varijance ili o
koeficijentu korelacije. R. Coe (2002), meutim, prikazuje veliinu uinka potpuno
neovisno o testiranju nul-hipoteze pa o tom indeksu govori kao o samostalnoj
statistikoj veliini.

d porodica veliine uinka

Razlikuju se dvije vrste odnosno dvije porodice veliine uinka. Jedna se temelji
na razlici izmeu statistikih vrijednosti rezultata (najee su to aritmetike sredine)
dviju ili vie skupina ispitanika. Druga se temelji na asocijaciji, korelaciji meu
varijablama.
U prvoj porodici najee se koristi d-indeks, obino nazvan Cohenov d, jer
potjee od J. Cohena. Formula za odreivanje tog indeksa ima ovaj oblik:

ME MK
d (1)
SD

ME je aritmetika sredina eksperimentalne skupine ispitanika, MK je


aritmetika sredina kontrolne skupine, a SD je standardna devijacija. Ovdje je
izrazom eksperimentalna oznaena svaka skupina na kojoj je primijenjena neka
nezavisna varijabla, neki tretman, neka varijabla za koju se pretpostavlja da bi mogla
djelovati na neko ponaanje, na neku zavisnu varijablu koja je predmet mjerenja.
Izrazom kontrolna oznaena je svaka skupina ispitanika na kojoj nije nita posebno

1
Spominjemo kao kuriozitet da smo samo na jednom mjestu nali podatak da postoji izmeu 50 i 100
mjera veliine uinka?! U ovom emo se tekstu, ipak, zadrati na njihovu puno manjem broju.

7
primijenjeno, skupina koja se nalazi u svojem relativno normalnom, uobiajenom
stanju. Istraiva eli vidjeti ima li ta eksperimentalna varijabla takvo djelovanje da se
moe razlikovati od uobiajene situacije s obzirom na mjerenu varijablu, odnosno s
obzirom na neki aspekt ponaanja koji je predmet opaanja ili mjerenja u kojoj se
nalazi kontrolna skupina.
Budui da se u nazivniku koristi standardna devijacija d-indeks postaje
standardizirana, usporediva vrijednost, neovisna o vrsti mjernih jedinica. Ali, postavlja
se pitanje o tome koju standardnu devijaciju upotrijebiti. Loginim se ini da to bude
standardna devijacija kontrolne skupine jer je to nedirnuta skupina s ispitanicima u
uobiajenom stanju i u uobiajenim okolnostima. Moe se, meutim, koristiti i
zajednika standardna devijacija obje skupine, koja se lako izrauna po formuli:

SD12 ( N1 1) SD22 ( N 2 1)
SDz (2)
( N1 1) ( N 2 1)

SDz je zajednika standardna devijacija, a subskripti 1 i 2 odnose se, dakako, na


dvije skupine kojima se proizvoljno oni pridjeljuju.
d-indeks je uvijek pozitivnoga predznaka, odnosi se, dakle, na veliinu razlike
izmeu dvije aritmetike sredine. Openito, d-indeks ne pokazuje pozitivnu ili
negativnu razliku, nego jednostavno razliku.
Evo primjera. R. Coe (2002) prikazuje rezultate, koje je realno dobio jedan
istraiva. Istraivako pitanje bilo je: ue li uenici djelotvornije ujutro ili poslije
podne? Skupina od 38 uenika po sluaju je podijeljena u dvije brojano jednake
podskupine. Jedna podskupina sluala je neku priu prije podne (u 9 sati), a druga tu
istu priu poslije podne (u 15 sati). Razumijevanje sadraja prie bilo je provjereno
nizom od dvadeset pitanja (toan odgovor na svako pitanje nosio je 1 bod). Prosjeni
rezultat skupine koja je sluala priu prije podne iznosio je M9 = 15.2, a prosjeni
rezultat skupine koja je sluala priu poslije podne M15 = 17.9. Razlika je, dakle, 2.7
bodova. Ovo je eksperiment u kojemu nema eksperimentalne i kontrolne skupine.
Standardna devijacija jutarnje skupine bila je SD9 = 4.12, a poslijepodnevne
SD15 = 2.10. Primjenom formule za zajedniku standardnu devijaciju (2) dobije se SDz =
3.3. Ako razliku izmeu aritmetikih sredina 2.7 podijelimo s 3.3 dobit emo d = 0.82
(formula 1).

8
Uz odluku o tome koju emo standardnu devijaciju u ovom primjeru koristiti
kao nazivnik pri odreivanju veliine uinka potreban je odreeni komentar.
Ako su razlike izmeu standardnih devijacija velike, onda nije opravdano
raunati zajedniku (prosjenu) standardnu devijaciju. to je velika razlika? Openito
statistiari toleriraju odnos najvie do 1:3, tj. vea standardna devijacija ne smije biti
vie od tri puta vea od manje standardne devijacije. Vea se razlika ne prihvaa, a
stroi statistiari nee tolerirati ni taj odnos, ve samo manji.
Ako se aritmetike sredine znatno razlikuju, i distribucije rezultata dislocirane su
na apscisi, pa bi zajednika distribucija bila neka bimodalna distribucija, a raunanje
standardne devijacije za takvu distribuciju nije opravdano, a ako bi se i raunala, bila bi
vrlo velika. Zato se nikada zajednika standardna devijacija ne rauna iz tako skupljenih
zajednikih bruto rezultata, nego pomou formule navedene pod (2).
Naglaavamo, polazi se od pretpostavke da je mjerenje (primjena nekoga testa,
upitnika ili nekog drugoga psihologijskog mjerenja) obavljeno u obje skupine u
prihvatljivo slinim uvjetima. Eventualna razlika u aritmetikim sredinama uzrokovana
je nezavisnom varijablom primijenjenom u jednoj skupini (eksperimentalnoj), ili u obje
skupine (ili vie njih), ili primjenom nekoga tretmana u jednoj skupini, ili nekim drugim
sustavnim imbenikom koji je apliciran (ili prisutan) samo u jednoj skupini. Dakle,
mjerenje u obje skupine (ili vie skupina) mora biti obavljeno u prihvatljivo slinim
uvjetima (osim aplikacija nezavisne varijable, ili nekoga tretmana) da bi bilo opravdano
usporeivati ih.
U gornjem primjeru omjer standardnih devijacija iznosi 4.12 : 2.10 = 1.96, dakle
razlika je podnoljiva. No, u ovom sluaju postoji jedna druga komplikacija. Prosjeni
rezultat u poslijepodnevnoj skupini iznosio je 17.9 od 20 moguih bodova. Ovdje se,
dakle, radi o tzv. stropnom efektu, pa je zbog njega rasprenje rezultata u toj skupini
fiziki smanjeno. (Usput govorei, distribucija rezultata poslijepodnevne skupine
sigurno je negativno asimetrina, tj. vee je grupiranje rezultata oko veih vrijednosti,
bliih najveoj moguoj vrijednosti: 20.) Stoga je upitno je li opravdano uzeti
standardnu devijaciju te skupine za odreivanje zajednike standardne devijacije.
Ipak, ako se ne raspolae s veim brojem rezultata i ako standardne devijacije
nisu jako razliite, preporuuje se raunanje zajednike standardne devijacije zbog
opeg statistikoga pravila da su izraunate statistike vrijednosti stabilnije ako su

9
odreene na temelju veeg broja rezultata. Za donoenje zakljuaka na temelju
statistikih vrijednosti jako je vano da su te vrijednosti to stabilnije.
Meutim, preporuuje se, u sluajevima kad je teko donijeti jasnu, nedvojbenu
odluku, prikazati rezultate statistike obrade obavljene na razliite naine. Tako je u
spomenutom primjeru korektno prikazati i d-indeks izraunat pomou zajednike
standardne devijacije i d-indeks izraunat sa standardnom devijacijom samo jutarnje
skupine ispitanika. Ako se koristi samo standardna devijacija jutarnje skupine, koja
iznosi 4.12, tada e d-indeks biti neto manji: d = 2.7 : 4.12 = 0.66. Budui da je
koritena vea standardna devijacija, razumljivo je da je d-indeks u tom sluaju manji.
Openito, standardna devijacija selekcioniranih skupina kao to su
hospitalizirane osobe, recimo alkoholiari u klinici za odvikavanje od ovisnosti, ili
pacijenti neke druge klinike, ili, recimo, izdvojeni uenici bilo zbog osobito dobrog ili
osobito loeg uspjeha u koli itd. redovito je manja nego standardna devijacija
neselekcionirane populacije.
to nam izraunati d-indeks pokazuje, kakve nam informacije prua? Odgovor
na to pitanje vrlo je jasan: d-indeks nam daje informacije o dobivenim rezultatima
kakve nam druge statistike obrade rezultata ne daju, a koje mogu biti vrlo korisne
svakom istraivau, i teoretiaru i praktiaru, a to je prekrivanje distribucija dvije
skupine rezultata. Pokazuje koliko ispitanika, prema njihovim rezultatima u mjerenoj
varijabli, doista pripada samo jednoj ili samo drugoj distribuciji.
Pri testiranju nul-hipoteze pomou, primjerice, t-testa moe se utvrditi statistiki
znaajna razlika, uz odabranu vrijednost, i kad su razlike meu aritmetikim
sredinama vrlo male, praktino zanemarive i kad se distribucije dviju skupina ispitanika
u vrlo velikoj mjeri meusobno prekrivaju, kao na slici 1.
Na slici 1. prikazane su dvije distribucije rezultata dviju skupina uenika sedmog
i osmog razreda u dvije osnovne kole, a rezultati su dobiveni primjenom perceptivnog
testa.
kola A: MA = 33.6, SDA = 4.60, NA = 564
kola B: MB = 34.3, SDB = 4.70, NB = 570
t = 2.53, p < 0.01

10
180

160

140

120

100

80
A
60 B
40

20

0
21 - 23 24 - 26 27 - 29 30 - 32 33 - 35 36 - 38 39 - 41 42 - 44 45 - 47

NA = 564; MA = 33,6; SD A = 4,60; NB = 570; MB = 34,3; SD B= 4,70

Slika 1.
Distribucije rezultata dviju skupina uenika. Rezultati su dobiveni primjenom perceptivnog testa.

Prosjena bodovna razlika uenika te dvije kole manja je od 1 boda, samo 0.7,
ali razlika je statistiki znaajna zbog velikoga broja rezultata. Ima li ta statistiki
znaajna razlika ikakav stvarni smisao? Koliki broj uenika po svom rezultatu pripada
samo jednoj ili samo drugoj distribuciji? Moemo li ustvrditi da su uenici kole B
doista bolji u perceptivnom testu?
Budui da d-indeks ima, zapravo, smisao z-vrijednosti, omoguuje nam odrediti
u kojem se postotku dvije distribucije prekrivaju.
Prema tzv. Cohenovoj konvenciji (koja je openito prihvaena) veliine d-
indeksa imaju sljedee znaenje:
mala veliina uinka: 0.2 prekrivanje distribucij je oko 85%
srednja veliina uinka: 0.5 prekrivanje distribucij je oko 67%
velika veliina uinka: 0.8 prekrivanje distribucij je oko 53%

Moe se interpretirati i ovako: kod d = 0.20 objanjeno je 1% varijance, kod d =


0.50 objanjeno je 10% varijance i kod d = 0.80 objanjeno je 25% varijance.
Pogledajmo kako to izgleda u sluaju primjene perceptivnoga testa. Najprije
emo odrediti zajedniku standardnu devijaciju prema formuli (2) i zatim emo pomou
formule (1) odrediti d. Tako emo dobiti d = 0.20, dakle, malu veliinu uinka. Prema

11
Cohenovoj konvenciji u tom se sluaju distribucije prekrivaju oko 85%. Prekrivanje
distribucija na slici 1. ini se veim, meutim, treba kumulativno gledati neslaganja koje
postoje i na lijevoj i na desnoj strani distribucije.
Oito je, dakle, da veliina uinka i statistika znaajnost imaju razliit smisao.
Veliina uinka ne ovisi o tome je li neka razlika statistiki znaajna ili nije, a vrijedi i
obrnuto.
Vratimo se primjeru s uenjem prije i poslije podne. U tom je sluaju, kako smo
izraunali, d = 0.82 (kad smo koristili zajedniku standardnu devijaciju). Dakle,
distribucije se, prema Cohenovoj konvenciji, prekrivaju neto manje od 53%.
Prekrivanje, ili razlikovanje distribucija, moemo, koristei injenicu da d-
indeks ima zapravo svojstva z-vrijednosti, prikazati i malo drugaije. Ako pogledamo u
tablicu normalne distribucije (takva se tablica nalazi u svakom statistikom udbeniku),
u kojoj moemo oitati postotak sluajeva koji se nalaze u pojedinim segmentima
normalne distribucije (u tablicama se ita postotak izmeu aritmetike sredine i
odreene z-vrijednosti), vidimo da je od z-vrijednosti 0.82 oko 79% rezultata nie
(50%+29%). U tome primjeru to znai da je ispod aritmetike sredine poslijepodnevne
skupine (M15 = 17.9) oko 79% uenika prijepodnevne skupine.
Postoji tablica koja pokazuje, za odreene vrijednosti d-indeksa, koliki je
postotak ispitanika u skupini s niom aritmetikom sredinom ispod vie aritmetike
sredine, i koliki je postotak neprekrivanja dviju distribucija (tablica 1.).
Cohenova konvencija pokazuje u kojem se postotku dvije distribucije prekrivaju,
a u treem stupcu tablice 1. nalazi se postotak neprekrivanja. Primjerice, prema
Cohenovoj konvenciji za d = 0.20 prekrivanje distribucija je 85%. U tablici 1. za d =
0.20 neprekrivanje je distribucija 14.7%, ili okruglo 15%. To su, dakle, kongruentni
podaci, a mogu se koristiti jedni ili drugi, ili i jedni i drugi, prema osobnoj preferenciji
ili prema percepciji jasnoe prikazivanja dobivenih vrijednosti. Moemo gledati i
ovako: u sluaju rezultata s perceptivnim testom samo je 58% (stupac Postotak u
tablici 1.) uenika u koli A ispod prosjene vrijednosti u koli B jer je u tom sluaju d
iznosio samo 0.20.
Kad je d = 0, tada se dvije distribucije potpuno prekrivaju ako su obje
normalne i imaju jednake, ili barem podjednake, standardne devijacije. To je, uostalom,
uvjet za koritenje tablice 1. ona je napravljena prema normalnoj distribuciji. Ako ne

12
moemo pretpostaviti da su dobivene distribucije normalne, ili je testiranje normaliteta
distribucije pokazalo da statistiki znaajno odstupaju od normalne distribucije, onda e
se postoci iz tablice razlikovati od stvarnih postotaka to vie to dobivena distribucija
vie odstupa od normalne.
Tablica 1.
Veliine uinka (d) i korespondentni postoci rezultata u skupini s niom aritmetikom sredinom od
vie aritmetike sredine, postotak neprekrivanja distribucija, koeficijent korelacije r te kvadrirani
koeficijent korelacije (iz Becker, 2000)

Veliina Postotak Postotak


r r2
uinka (d) (%) neprekrivanja
0.0 50% 0.0% .000 .000
0.1 54% 7.7% .050 .002
0.2 58% 14.7% .100 .010
0.3 62% 21.3% .148 .022
0.4 66% 27.4% .196 .038
0.5 69% 33.0% .243 .059
0.6 73% 38.2% .287 .083
0.7 76% 43.0% .330 .109
0.8 79% 47.4% .371 .138
0.9 82% 51.6% .410 .168
1.0 84% 55.4% .447 .200
1.1 86% 58.9% .482 .232
1.2 88% 62.2% .514 .265
1.3 90% 65.3% .545 .297
1.4 92% 68.1% .573 .329
1.5 93% 70.7% .600 .360
1.6 95% 73.1% .625 .390
1.7 96% 75.4% .648 .419
1.8 96% 77.4% .669 .448
1.9 97% 79.4% .689 .474
2.0 98% 81.1% .707 .500

Ako je d vei od 2.0, jasno je da se tada mogu interpolirati vrijednosti koje se


pribliavaju 100%.
U tablici 1. uz d = 0 stoji 0.50. Budui da se u tom sluaju distribucije potpuno
prekrivaju i aritmetike su sredine jednake, i ima 50% rezultata manjih od aritmetike
sredine. Kako se distribucije dviju skupina razdvajaju to pokazuje poveanje d-
indeksa i distribucija se s veom aritmetikom sredinom u koordinatnom sustavu na
apscisi pomie udesno, tako sve vei postotak rezultata u distribuciji s manjom
aritmetikom sredinom ostaje lijevo od vee aritmetike sredine.
Statistiari, ipak, upozoravaju da nije uputno koristiti veliine d-indeksa kao neke
apsolutne vrijednosti, koje univerzalno vrijede. Valja ih koristiti samo u usporedbi s

13
istovrsnim pojavama i mjerenjima, odnosno, u konkretnom znaenju u nekom podruju.
Katkad i mali d-indeks moe upuivati na praktinu korist. Primjerice, pri primjeni
nekog novog terapijskoga postupka, recimo, za uklanjanje ili ublaavanje kronine
glavobolje, ako se vidi poboljanje kod samo nekoliko osoba, premda d-indeks nije
velik, tim je osobama bolje. To znai da uvijek treba gledati dalje od samih statistikih
vrijednosti.
Ali, vratimo se opet primjeru s prijepodnevnim i poslijepodnevnim uenjem. Ako se u
odreivanju veliine uinka (d) uzme zajednika standardna devijacija, dobije se d =
0.82. Meutim, ako se uzme standardna devijacija samo jutarnje skupine (SD9 = 4.60)
dobit emo d = 0.66 i, to je prema Cohenovoj konvenciji, veliina uinka izmeu
srednje i velike, a prekrivanje distribucija iznosi oko 60%. Razlika nije dramatina, ali
nije ni zanemariva, pa se opravdano postavlja pitanje koji od ta dva d-indeksa treba
koristiti. Budui da je distribucija u poslijepodnevnoj skupini najvjerojatnije asimetrina
jer se radi o stropnom efektu, standardna devijacija izraunata iz takvih rezultata nije
pravi pokazatelj rasprenja rezultata, ili, tonije reeno, nije ju sasvim opravdano
raunati, pa ju je zato bolje ignorirati i uzeti samo standardnu devijaciju jutarnje
skupine.
Jo dvije napomene. Prvo, vidimo da numerika veliina d-indeksa nije
ograniena, tj. najmanja je vrijednost nula kad su aritmetike sredine potpuno jednake, a
gornje granice nema. Numerika veliina d-indeksa ovisi o razlici izmeu aritmetikih
sredina i o rasprenju rezultata u jednoj i drugoj varijabli. Ako su distribucije dvije
skupine rezultata potpuno odvojene, uope se ne prekrivaju i ne dodiruju se, tad e d-
indeks biti velik, ovisno o tome koliko se razlikuju aritmetike sredine tih sasvim
razdvojenih distribucija. Treba li u takvom sluaju uope raunati d? Ako imamo
podatak da su distribucije doista potpuno odvojene, odreivanje d-indeksa ne donosi
nikakvu novu informaciju, ali, dakako, moe se raunati (to bi zadrti statistiari i
zahtijevali).
Drugo, vidimo da se zapravo u dosadanjem tekstu govorilo o izravnom
odreivanju d-indeksa, bez prethodnoga testiranja nul-hipoteze, odnosno utvrivanja
statike znaajnosti razlike meu aritmetikim sredinama. To je mogue, ali ima li
smisla? Ako nam je, primjerice, t-test pokazao da nije opravdano naputati nul-
hipotezu, to znai da je dobivena razlika meu aritmetikim sredinama posljedica

14
djelovanja sluajnih imbenika, odreivanje d-indeksa u tom sluaju ima dvojbenu
statistiku vrijednost. Odreivanja d-indeksa, ima smisla tek kad smo utvrdili da glavni
uzrok razlici meu aritmetikim sredinama nije sluajni varijabilitet. Tek kad vidimo da
je razlika statistiki znaajna, na odabranoj razini rizika, , odnosno da su osim
sluajnih imbenika razliku meu aritmetikim sredinama uzrokovali i neki sustavni
imbenici (npr. nezavisna varijabla ili primijenjeni tretman), ima smisla koristiti d-
indeks koji e pokazati koliko je bilo to djelovanje, a to ne omoguuje sama primjena
t-testa.
Jedno od vanih svojstava d-indeksa jest to da on nije ovisan o N-u. Jo jedno
njegovo vano svojstvo jest i to da se normalno distribuira. Ta injenica omoguuje
odreivanje standardne devijacije te distribucije, pa onda i interval u kojemu se s
odreenom (unaprijed odabranom) sigurnou nalazi dobivena vrijednost d. Standardna
devijacija d-indeksa moe se izraunati pomou ove formule:

N1 N 2 d2
SDd (3)
N1 N 2 2( N1 N 2 )

N1 i N2 oznaavaju, kako je to uobiajeno, broj ispitanika ili broj rezultata u


jednoj i drugoj skupini. Podatak o standardnoj devijaciji distribucije d-indeksa moe se
iskoristiti za odreivanja intervala u kojemu se s odreenom vjerojatnou nalazi prava
vrijednost d-indeksa. Ako dobivenu vrijednost SDd pomnoimo s 1.96 (granina
vrijednost vjerojatnosti za rizik od 5% odnosno za sigurnost od 95%) i taj umnoak
pribrojimo i oduzmemo od dobivenoga d, dobit emo odgovarajui interval u kojemu se
s vjerojatnou od 95% nalazi pravi d-indeks, odnosno da se uz rizik od 5% nalazi izvan
tog intervala. Ako tako dobiveni interval obuhvaa nulu, to znai da se d-indeks ne
razlikuje od sluajne veliine. Dakako, moemo uzeti rizik od 1% ili 2%, prema
vlastitoj odluci.
Na primjer, kad za eksperiment s jutarnjim i poslijepodnevnim uenjem
izraunamo SDd, dobit emo 0.34; taj broj pomnoimo s 1.96 i dobivamo 0.67, a taj
iznos odbijemo i dodamo na 0.82 i tako dobijemo interval 0.15 1.49. Dakle, u tom se
intervalu s vjerojatnou od 95% nalazi pravi d.
Ako je potrebno, tj. ako je prikazan samo t-test, moemo ipak odrediti d-indeks:

15
1 1
d t (4)
n1 n2

Pogledajmo jo jedan primjer. Problem: utjeu li intenzivno itanje literarnih i


strunih tekstova i raspravljanje o njima na rezultate u testovima inteligencije?
Napravljena su dva istraivanja; u jednom je istraivanju koriten verbalni test, a
u drugom istraivanju neverbalni test. U oba su istraivanja dobiveni statistiki znaajni
rezultati.
Prvo istraivanje: s verbalnim testom. Provedeno je na dvije skupine prethodno
izjednaene po inteligenciji. Jedna skupina (A) tijekom dva tjedna intenzivno je itala i
raspravljala o proitanim razliitim tekstovima (literarnim i strunim). Druga skupina
(B) nije bila posebno angairana u slinoj aktivnosti. Nakon toga obje su skupine
ispitane jednim verbalnim testom (70 zadataka; minimalni mogui rezultat 0;
maksimalni mogui rezultat 70). Dobiveni su ovi rezultati:

A (eksperimentalna) B (kontrolna)
M A 38.1 M B 35.0
SDA 6.02 SDB 5.81
N A 78 N B 80
SDM A 0.681 SDM B 0.650

38.1 35.0 3.1


t 3.29 p < 0.01
0.681 0.650
2 2 0.9414

Drugo istraivanje obavljeno je na gotovo jednak nain na drugim skupinama


ispitanika, ali je koriten neverbalni test inteligencije (48 zadataka; minimalni mogui
rezultat 0; maksimalni mogui rezultat 48) i bilo je neto vie ispitanika. Dobiveni su
ovi rezultati:
A (eksperimentalna) B (kontrolna)
M A 25.5 M B 23.4
SDA 6.91 SDB 6.87
N A 158 N B 162
SDM A 0.550 SDM B 0.540

16
25.5 23.4 2.1
t 2.72 p < 0.01
0.552 0.54 2 0.771

Na temelju t-testova moemo zakljuiti da postoji utjecaj itanja i raspravljanja i


na verbalni i na neverbalni test inteligencije: u oba sluaja dobivena je statistiki
znaajna razlika izmeu eksperimentalne i kontrolne skupine.
Odredimo sada d-indekse za oba dijela istraivanja. Koristit emo zajedniku
standardnu devijaciju.

6.022 77 5.812 79
Zajednika SD za prvo istraivanje: SD prv 5.88
78 80
6.912 157 6.87 2 161
Zajednika SD za drugo istraivanje: SD drug 6.87
158 162
Pa e d-indeksi biti:

38.1 35.0
d prv 0.53
5.88
25.5 23.4
d drug 0.31
6.87

Na temelju provedenih t-testova moemo zakljuiti samo to da i u verbalnom i u


neverbalnom testu postoji statistiki znaajna razlika u prosjenim rezultatima skupina
koje su itale i koje nisu itale. Veliine razlika u testovnim bodovima ne mogu se
koristiti jer je bodovna skala za verbalni i neverbalni test razliita. Zakljuivanje o
veliini razlike pomou p-vrijednosti statistiki, kako smo vidjeli, nije ni opravdano, ni
doputeno, a zapravo nije ni mogue.
Iz izraunatih d-indeksa vidimo da je taj zakljuak o statistikoj znaajnosti u
oba sluaja nepotpun, ak bismo mogli rei povran, jer implicira podjednak utjecaj
itanja na rezultate u verbalnom i u neverbalnom testu.
Prema Cohenovoj konvenciji d od 0.31 pripada meu male veliine uinka, a
0.53 ide prema veim veliinama uinka. Ako sada pogledamo u tablicu 1. vidjet emo
da prekrivanje distribucija za d = 0.31 iznosi oko 78%, odnosno, neprekrivanje oko
22%. Za d = 0.53 prekrivanje je distribucija 65%, odnosno, neprekrivanje 35%. Taj nam
podatak daje prilino drugaiju sliku o rezultatima provedenog eksperimenta.

17
Za sluaj zavisnih uzoraka (mjerenje obavljeno na istim ispitanicima u dvije
situacije), posluimo se ovim, ne sasvim izmiljenim, primjerom.
Vrijeme jednostavne senzomotorne reakcije vrlo esto slui kao zavisna
varijabla pri mjerenju doivljajnog intenziteta osjeta. Odnos izmeu intenziteta
podraaja i vremena reakcije zakrivljen je, ali u odreenom opsegu postoji jasna
nelinearna relacija: to je vei intenzitet podraaja, krae je vrijeme reakcije. Mnogi
eksperimenti pokazali su da postoji prilino jasan utjecaj podraajnoga konteksta na
verbalne iskaze o jaini osjetnoga doivljaja. Postoji li utjecaj podraajnoga konteksta i
na vrijeme reakcije?
U eksperimentu u kojemu je provjeravan utjecaj podraajnoga konteksta na
vrijeme jednostavne senzomotorne reakcije sudjelovalo je 11 dobro uvjebanih mukih
mlaih ispitanika (to su, naravno, bili studenti), a njihova je zadaa bila da reagiraju to
bre na zvune podraaje razliitih intenziteta odmakom kaiprsta s tipkala. Bila su
zadavana dva niza od po etiri podraaja razliitih intenziteta: jai niz i slabiji niz.
Kritini podraaj bio je najslabiji u nizu jaih podraaja i najjai u nizu slabijih
podraaja. Eksperimentatore je zanimalo hoe li vrijeme reakcije na taj podraaj biti
dulje u jaem nizu od vremena reakcije na taj isti podraaj u slabijem nizu. Ako
podraajni kontekst ima utjecaja na vrijeme reakcije, onda bi vrijeme reakcije moglo
biti dulje na najslabiji podraaj u nizu jaih podraaja od vremena reakcije na podraaj
tog istog intenziteta kad je on najjai u slabijem nizu podraaja.
Dobiveni rezultati prikazani su u tablici 2.

Tablica 2.
Vrijeme jednostavne senzomotorne reakcije (u milisekundama) 11 ispitanika na zvuni podraaj
istog intenziteta (X) koji se nalazi u jaem nizu podraaja (VR j) ili u slabijem nizu podraaja (VRs).

VRs VRj
169 174
156 162
173 177
178 176
170 172
181 180
167 171
160 168
159 160
164 167
166 165
Mj = 167.6 Ms = 170.2
SDj = 7.79 SDs = 6.38

18
U postupku metode diferencija, kojom emo utvrditi postoji li statistiki
znaajna razlika u prosjenom vremenu reakcije na kritini podraaj, najprije smo
odredili razliku D = VRs VRj, zatim MD = 2.6, potom SDD = 3.17, onda
MD
SDM D 0.957 i, napokon, t 2.72.
SDM D

U tablicama za t-test nalazimo da je za stupnjeve slobode ss = 10 i = 0.05


granina vrijednost 2.23. Na t-test vei je pa ne ostajemo na nul-hipotezi (koja je
glasila da se ne razlikuje vrijeme reakcije na kritini podraaj u podraajnim nizovima
razliitog intenziteta). Zakljuujemo da postoji utjecaj podraajnoga konteksta na
vrijeme jednostavne senzomotorne reakcije, ali na temelju t-testa ne moemo odgovoriti
na pitanje koliki je taj utjecaj. Tu e nam pomoi d-indeks.
d-indeks za zavisne uzorke moemo odrediti prema formuli:

M poslije M prije
d (5)
SD prije

U naem sluaju nemamo prije i poslije pa je svejedno kojim emo redom


postaviti aritmetike sredine u gornjoj formuli. No, to emo sa standardnom
devijacijom: koju emo od njih uzeti? To pitanje se postavlja zato to je u nacrtu ovog
eksperimenta koritena rotacija: jedan ispitanik je najprije imao jai niz i zatim slabiji, a
drugi najprije slabiji i zatim jai. Dakle, 5 ispitanika imalo je prije jai niz, a 6
ispitanika imalo je prije slabiji niz. Odgovor se namee sam po sebi. Treba izraunati
zajedniku standardnu devijaciju. Budui da je sudjelovao isti broj ispitanika, tj. isti
ispitanici, u jednoj i drugoj eksperimentalnoj situaciji, zajedniku standardnu devijaciju
izraunat emo jednostavno tako da zbrojimo varijance, zbroj podijelimo s 2 i iz tako
dobivene numerike veliine izvadimo drugi korijen. Bit e, dakle:
170.2 167.6
d 0.37
7.792 6.382
2
Ova veliina d-indeksa od 0.37 pokazuje da se distribucije ne prekrivaju samo
oko 26% (tablica 1.). Iako je razlika statistiki znaajna, ipak ona nije vrlo velika i ne

19
moe se govoriti o utjecaju podraajnoga konteksta na vrijeme reakcije kao o nekakvoj
izrazitoj pojavi.

Upozorenja i jo neki indeksi d-tipa

Postoji i nekoliko specifinijih upozorenja koja se odnose na koritenje d-


indeksa.
1. Budui da je d-indeks standardizirana vrijednost neimenovanih jedinica,
dakle, liena konkretnih mjernih jedinica, katkada se neoprezno misli da to omoguuje
usporedbu svega i svaega. Oni koji se koriste meta-analizom dobro znaju da je
potreban veliki oprez pri skupljanju d-vrijednosti i pri njihovoj usporedbi.
2. Ima potekoa s uzorcima ogranienoga ranga, tj. kad su to selekcionirane
grupe koje imaju manji opseg rezultata u mjerenoj varijabli, jer su one samo izdvojeni
dio populacije, kakve su, primjerice, darovita djeca ili djeca s potekoama u uenju, ili
samo osobe mukoga spola ili samo osobe enskoga spola, ili su dio populacije zbog
nekog posebnog obiljeja poput narkomana itd.
3. Potreban je oprez u interpretaciji kad se ne moe pretpostaviti normalna
distribucija ili kad distribucija dobivenih rezultata jako odstupa od normalne
distribucije.
4. Oprez je potreban i kad nije dovoljno pouzdano mjerenje kojim su dobiveni
rezultati.
5. Osobiti je oprez potreban pri usporedbi veliina uinaka koji se temelje na
rezultatima dobivenim razliitim vrstama mjerenja, ili na razliitim
operacionalizacijama istovrsnog ponaanja koje je predmet mjerenja, ili kad se temelje
na razliitim tretmanima u klinikoj psihologiji ili pak pri usporedbi veliina uinaka
dobivenih na razliitim populacijama.
6. Izraz uinak u sintagmi veliina uinka implicira uzrono-posljedini
odnos. Kako je poznato, ne radi se uvijek o uzrono-posljedinu odnosu, ve samo o
veliini razlike, a veliina uinka samo omoguuje interpretaciju eventualnog uzrono-
posljedinog odnosa na temelju znanja o koritenim varijablama.
Ima sluajeva kad je korisnije zadrati se na nestandardiziranoj veliini uinka,
tj. na samoj razlici u prosjenoj vrijednosti ili estini pojavljivanja neega. Primjerice, u

20
nekom tretmanu za smanjenje puenja, kao veliina uinka moe se uzeti broj manje
popuenih cigareta. Ako netko, ili skupina osoba, nakon tretmana dnevno popui deset
cigareta manje nego prije, onda je taj broj manje popuenih cigareta sam za sebe
koristan pokazatelj veliinu uinka. Znaenje toga smanjenja procjenjuje se prema tome
je li ono pridonosi poboljanju opega zdravstvenoga stanja ili ne pridonosi. Drugim
rijeima, tu veliinu uinka ne treba standardizirati i pretvarati je u neimenovanu
vrijednost dijeljenjem s nekom pogrekom.
Standardizirana veliina uinka (a to je d-indeks i njemu slini indeksi) koristi se
uvijek onda kada je mjerena varijabla izraena na nekoj manje-vie arbitrarnoj brojanoj
ljestvici (kao to su redovito brojane ljestvice dobivene primjenom testova ili
upitnika), pa dobiveni brojevi nemaju sami za sebe neko znaenje. Osobito se koristi u
sluajevima u kojima se usporeuju veliine uinka iz razliitih istraivanja.
* * *
Poznati su jo Glassov delta-indeks (oznaava se grkim slovom delta: ) koji
uzima samo standardnu devijaciju kontrolne skupine, dakle skupine na koju nije
djelovala nikakva nezavisna varijabla jer se pretpostavlja da je ta standardna devijacija
najbolja procjena populacijske standardne devijacije. Odreuje se kao i d-indeks: razlika
meu aritmetikim sredinama dijeli se sa standardnom devijacijom kontrolne skupine.

M1 M 2
(6)
SDkontrol.skupine

Prednost je toga indeksa to ne postoji pitanje jednakosti (slinosti) varijanci u


razliitim skupinama ispitanika, a to je osobito korisno kad postoji vie
eksperimentalnih skupina. Gledajui s druge strane, moe se i ovako rei: budui da se
redovito polazi od pretpostavke jednakosti varijanci, opravdanije je odrediti prosjenu
varijancu dviju (ili vie) skupina. Osim toga, u praktinom radu, pa i u mnogim
istraivanjima, esto ne postoje kontrolna i eksperimentalna skupina, nego usporedne
skupine koje su pod pretpostavljenim utjecajem razliitih varijabli ili razliitih razina
iste varijable, npr. pri usporedbi skupine mukih ispitanika i skupine enskih ispitanika.
Tada delta indeks nije primjenjiv.
Spominje se i Hedgesov g-indeks koji za standardnu devijaciju u nazivniku
uzima sve standardne devijacije eksperimentalne i kontrolne skupine (odnosno svih

21
skupina koje su u istraivanju) pa je tako pogodan za jednostavnu analizu varijance.
Meutim, uz njega se vee pogreka koja se moe ublaiti pomou ove korekcije:
3
g* g 1 (7)
4n1 n2 9
Ta korekcija osobito se preporuuje za male nezavisne uzorke. Analognom
formulom moe se korigirati i d-indeks.

r porodica veliine uinka

Druga porodica veliine uinka poiva na korelaciji, ili, kako to neki statistiari
kau, na snazi asocijacije. Veliina uinka odreena na temelju korelacije izmeu dvije
ili vie varijabli razlikuje se od veliine uinka koji se temelji na razlici meu
aritmetikim sredinama (d) jer predstavlja procjenu veliine zajednike varijance meu
varijablama.
Sam koeficijent korelacije, Pearsonov r, predstavlja veliinu uinka, a njegov
kvadrat (r2) pomnoen sa sto, pokazuje postotak zajednike varijance dviju varijabli.
Jednako vrijedi i za multiplu korelaciju: R i R2.
Ovdje je konvencija o interpretativnoj kvalifikaciji veliine uinka drugaija:
0.10 je mala veliina uinka, 0.30 srednja i 0.5 i vie (do 1.0) velika veliina uinka.

Dakle, ako koeficijent korelacije ima veliinu r = 0.10, postotak zajednike


varijance, ili prekrivanje varijanci dviju varijabli, iznosit e 1%. Ako je korelacija r =
0.50, taj e postotak iznositi 25%. Tih 25% jest postotak zajednike varijance koji dijele
dvije varijable. Taj podatak naziva se i koeficijent determinacije i biljei se s r2(100).
U radovima koji se bave tom veliinom uinka mogu se pronai prijedlozi da se
najmanja veliina uinka koja se temelji na r bude 0.20 ili ak 0.30 (a ne 0.10 kao u
navedenoj konvenciji).
U tablici 1. (str. 13) u stupcima oznaenim s r i r2 nalaze se korespondentne
vrijednosti u odnosu na d.
Postoji jo nekoliko koeficijenata asocijacije meu varijablama koji se koriste
kao veliine uinka: kvadrirana eta, kvadrirana omega, Cohenov f i kvadrirani f (f 2).
O njima se govori neto vie u vezi s analizom varijance. Koeficijente asocijacije koji se
koriste za dihotomne varijable spomenut emo u vezi s hi-kvadrat testom.

22
2 test

U psihologiji se vrlo esto koristi 2-test, kojim se utvruje postoji li statistiki


znaajna razlika izmeu distribucija dviju varijabli obino izraenih kvalitativnim (ili
nekim bastardnim kvalitativno-kvantitativnim) kategorijama. Temelj za raunanje 2-
testa jest tablica vezanih frekvencija dviju varijabli. Te tablice mogu biti veliine 2x2,
to znai da su i jedna i druga varijabla izraene samo pomou dvije kategorije (to su
obino dihotomne ili dihotomizirane varijable), ali mogu, naravno, biti i veliine 2x3,
3x3, 3x4, 4x4 itd., kad su varijable izraene u kvalitativnim kategorijama.
Ovdje se veliina uinka moe izraziti pomou Cramerova V koeficijenta ili
pomou Cohenova w koeficijenta. Za 2x2 tablicu moe se koristiti (fi) koeficijent

2
(formula za koeficijent: ). Moe se koristiti i koeficijent kontingencije C,
N
ali u zadnje se vrijeme, zbog prilinih nedostataka, taj koeficijent izbjegava.
Da bi slika o 2-testu, kao bazi za odreivanje asocijacije meu varijablama, bilo
neto jasnija, pogledajmo sljedei primjer.
Jednom, davno, kad je jo bilo mukih studenata u studiju psihologije, u
nekoliko generacija provedena je mala anketa meu studentima koji su sluali statistiki
kolegij. Anketa se sastojala od samo jednoga pitanja: Molim vas da izrazite svoj stav
prema statistici opredjeljujui se za jedan od ovih odgovora volim statistiku; niti je
volim niti ne volim; mrzim statistiku. Naravno, pitanje je koliko su studenti iskreno
odgovarali, ali budui da su odgovarali anonimno, ipak se donekle moe vjerovati
njihovim odgovorima. Rezultata su navedeni u tablici 3.

Tablica 3.
Rezultati ankete o stavu studenata psihologije prema statistici. Odgovor V: volim statistiku;
odgovor nV/nM: niti je volim, niti je mrzim; odgovor M: mrzim statistiku. S f o su oznaene
opaene, a s ft teoretske frekvencije.

V nV/nM M
fo 29 16 101
Studentice 146
ft 33.44 27.01 85.54
fo 23 26 32
Studenti 81
ft 18.56 14.99 47.46
52 42 133 227

23
Vizualna inspekcija tablice 3. pokazuje da je vrlo velik broj studentica, 116 (oko 79%),
izabrao odgovor M. Taj odgovor izabrao je manji broj studenata, samo 31 (oko
38%). Takva distribucija mogla bi, ugrubo, odgovarati realnosti. Iako po uspjehu u tom
predmetu studenti nisu bili bolji od studentica, ipak su manje mrzili statistiku to
vjerojatno ima svoju psiholoku podlogu, no tu interpretaciju ostavimo za druge prilike.
Letimian pogled na opaene i teoretske frekvencije otkriva nam da su najvee
razlike meu njima u kategoriji V i M, a to upuuje na postojanje povezanosti
izmeu varijable spol studenata i varijable stav prema statistici.
Najprije e nas zanimati razlikuje li se distribucija odgovora studentica i
studenata na postavljeno pitanje. Odgovor na to pitanje dobit emo pomou hi-kvadrat
testa kojim testiramo H0 da nema razlike u distribuciji odgovora izmeu studentica i
studenata. Dakle

2

fo ft
2
22.06 (8)
ft

Uz dva stupnja slobode [za hi-kvadrat ss = (broj kategorija jedne varijable 1)


x (broj kategorija druge varijable 1)] i pogledom u tablicu za hi-kvadrat vidimo da je
p < 0.01. Granini hi-kvadrat uz razinu rizika od 1% i 2 stupnja slobode iznosi 9.21.
Dakle, ne ostajemo na nul-hipotezi i konstatiramo da se distribucije odgovora studentica
i studenata statistiki znaajno razlikuju. I to je sve to moemo zakljuiti; moemo jo
rei da su najvee razlike u distribucijama kako smo ve vidjeli u kategorijama V
i M.
Podatak o razlici u distribucijama i podatak o asocijaciji meu varijablama dva
su razliita podatka.
Odredimo najprije Cramerov V kao pokazatelj povezanosti za rezultate iz tablice
3.

2 22.0567
Cramerov V 0.3117 (9)
N k 1) 227 1
Simbol k u Cramerovu V oznauje manji broj kategorija u tablici kontingencije.
U naem sluaju manji broj kategorija ima varijabla spol: dvije. Znaajnost toga
koeficijenta najlake je utvrditi pomou hi-kvadrat testa: ako je hi-kvadrat znaajan,
znaajan je i Cramerov V. Postoji, dakle, znaajna asocijacija izmeu varijable spol

24
studenata i stav prema statistici. Kvadrirani Cramerov V iznosi 0.097, a to znai da
te dvije varijable imaju priblino 10% zajednikih faktora.
Izraunajmo sada Cohenov w, prema formuli:

w
pt po 2 (10)
pt

po = vjerojatnost svake dobivene, tj. opaene frekvencije = fo/N; pt = vjerojatnost svake


teoretske frekvencije u tablici kontingencije iz koje se rauna hi-kvadrat test = ft/N. Da
bi to bilo jasnije evo dio rauna na temelju tablice 3:

fo po=fo/N ft pt=ft/N (pt-po)/pt


29 .127753 33.44 .147313 .002597
16 .070485 27.01 .118987 .019771
101 .444934 85.54 .376828 .012319
23 .101322 18.56 .081762 .004679
26 .114537 14.99 .066035 .035624
32 .140969 47.46 .209075 .022185
N = 227 1.000000 227.00 1.000000 .097175

Dakle w .097175 0.3117 . U ovom sluaju Cramerov V i Cohenov w imaju


identinu numeriku veliinu (na etiri decimalna mjesta). To bi moglo znaiti da je
svejedno koji od njih upotrijebimo. Cramerov V neto je jednostavniji za raunanje; ne
moraju se raunati vjerojatnosti, a njihovo raunanje produuje posao ali, dakako,
svejedno nam je ako to radi neki statistiki raunalni program, recimo, SPSS. Cohenov
w moda je neto statistikiji jer barata s vjerojatnostima opaenih i teoretskih
frekvencija.
Da bismo vidjeli korist od raunanja tih dodatnih pokazatelja, zamislimo da smo
ponovili takvu anketu na novih 227 studenata, 146 studentica i 81 studentu i da smo
dobili rezultate prikazane u tablici 4. (N.B. Ovdje su to, zapravo, samo preureeni
rezultati iz tablice 3).
U ovom sluaju tablica 4. vidimo da ima jo vie studentica koje mrze
statistiku i jo vie studenata koji vole statistiku (u odnosu na frekvencije u tablici 3).
Izraunati hi-kvadrat iznosi 2 = 45.54. Za tu veliinu hi-kvadrat testa sigurno je p puno
manji nego za hi-kvadrat iz tablice 3, iako moemo rei da je u oba sluaja p dosta

25
manji od .01. Budui da nam vrijednost p govori samo o vjerojatnosti kojom moemo
oekivati hi-kvadrat odreene veliine (jednako kao i kod t-testa), ne moemo nita
drugo zakljuiti nego da se u oba sluaja (i u sluaju iz tablice 3 i u sluaju iz tablice 4)
distribucije odgovora studentica i studenata statistiki znaajno razlikuju. Ali ne
moemo nita zakljuivati o tome razlikuje li se sluaj iz tablice 3. i sluaj iz tablice 4.
Ipak, moemo dobiti odgovor na to pitanje ako usporedimo bilo Cramerov V, bilo
Cohenov w izraunat je za oba sluaja.
Tablica 4.
Rezultati ankete o stavu studenata psihologije prema statistici. Odgovor V: volim statistiku;
odgovor nV/nM: niti je volim, niti je mrzim; odgovor M: mrzim statistiku. S f o oznaene su
opaene, a s ft teoretske frekvencije. Malo promijenjeni rezultati iz tablice 3.

V nV/nM M
fo 15 15 116
Studentice 146
ft 34.73 16.72 94.55
fo 39 11 31
Studenti 81
ft 19.27 9.28 52.45
54 26 147 227

Cramerov V iz tablice 3., kao i Cohenov w iznosi 0.31, a iz tablice 4. Cramerov


V iznosi 0.45, a toliko iznosi i Cohenov w.
Konvencija o interpretaciji veliina tih indeksa jednaka je interpretaciji za
korelacije:
mala veliina uinka 0.10; srednja veliina uinka 0.30; velika veliina uinka
0.50.
Cramerov V i Cohenov w za rezultate iz tablice 3. blii su srednjoj veliini
uinka (oba iznose 0.31), a iz tablice 4. blii su velikoj veliini uinka (oba iznose
0.45). Na temelju tih podataka moe se ustvrditi da postoji razlika u asocijaciji rezultata
iz tablice 3. i iz tablice 4. Postotak zajednike varijance u prvom sluaju iznosi priblino
9.6%, a u drugom sluaju priblino 20.2%.

Analiza varijance

Veliina uinka moe se i treba odrediti i u koritenju analize varijance.


Glavna vrijednost dobivena analizom varijance jest F-omjer, koji pokazuje moe li se
ostati na nul-hipotezi, prema kojoj nema razlika meu aritmetikim sredinama razliitih
skupina ispitanika koji su bili pod utjecajem razliitih razina jedne ili vie nezavisnih

26
varijabli. Prema nul-hipotezi, ako su eventualno i dobivene neke razlike, one su nastale
samo pod utjecajem sluajnih imbenika. Tih imbenika koji djeluju po sluaju, ali
uvijek, ima mnogo i djeluju pri svakom mjerenju, a imaju razliita izvorita: sluajni
odabir uzoraka, sluajne pogreke pri mjerenju, sluajne varijacije samih ispitanika,
sluajne promjene u neposrednoj okolini mjerenja itd.
Kako je, meutim, znaajan F-omjer neusmjeren, tj. pokazuje samo da postoje
statistiki znaajne razlike, ali ne pokazuje gdje su te razlike, izmeu kojih aritmetikih
sredina (od najmanje tri skupine ispitanika koji se koriste, primjerice, u jednostavnoj
analizi varijance), potrebna su dodatna provjeravanja. To su tzv. usporedbe parova
aritmetikih sredina za to se najee koristi Scheffov test2. Tim se postupkom dobije
podatak o tome postoji li statistiki znaajna razlika izmeu aritmetikih sredina dvije
skupine ispitanika (od tri ili vie skupina) koji su bili podvrgnuti razliitim razinama
nezavisne varijable (ili razliitim istraivakim ili praktinim prilikama odnosno
uvjetima), pa ako ta razlika postoji, zakljuujemo o specifinom ili razliitom
djelovanju tih razina.
Obino se najprije odreuje opa veliina uinka. U jednostavnoj analizi
varijance Cohen (1988) nudi f-indeks ako su sve podskupine podjednake po broju
ispitanika:
SDm
f , (11)
SD

gdje je SDm standardna devijacija aritmetikih sredina, a SD bi trebala biti standardna


devijacija populacije, koju redovito zamjenjujemo standardnom devijacijom uzorka. U
ovom sluaju moe se uzeti standardna devijacija bilo koje skupine (budui da su n-ovi
u podskupinama podjednaki i, osim toga, analizu varijance opravdano je provoditi samo
ako su standardne devijacije u svim skupinama podjednake, tj. meusobno se ne
razlikuju statistiki znaajno) ili pak zajednika standardna devijaciju svih skupina.
A SDm rauna se po ovoj formuli:

mg mz
2

SDm (12)
g

2
Provedba tih usporedbi nije sasvim jednostavna pa treba konzultirati tekstove koji se detaljnije bave tim
statistikim procesima.

27
U toj formuli mg oznaava svaku pojedinu aritmetiku sredinu, aritmetiku sredinu
svake podskupine u jednostavnoj analizi varijance, mz zajedniku aritmetiku sredinu
svih skupina, i g oznaava broj skupina (grupa) odnosno razina nezavisne varijable.
f-indeks je, da se tako izrazimo, sinkretian, prikazuje openito kolika je veliina
uinka, poput F-omjera u analizi varijance. Interpretativna konvencija za f-indeks je
ova:
0.10 mala veliina uinka, 0.25 srednja i 0.40 (i vie) velika veliina uinka.
Za jednostavnu analizu varijance postoji jo takvih indeksa, poput onoga koji
navodi Howel (2010):

1 M M tot
2
d (13)
g 1 SDtot
2

g oznauje broj grupa, M pojedinane aritmetike sredine svake grupe, Mtot ukupnu,
totalnu aritmetiku sredinu i SDtot, tj. standardnu devijaciju svih ispitanika.
Naalost razliiti indeksi ne daju identine ishode, ak mogu biti vrlo razliiti,
pa unaprijed treba izabrati jedan od njih.
No, postoje dodatni indeksi koji daju vrlo korisne informacije o stupnju
povezanosti varijabli koritenih u analizi varijance, zapravo, o snazi odnosa meu
varijablama.
ZKiz
Najee se koristi kvadrirana eta: 2 (14)
ZKtot

ZKiz je zbroj kvadrata koji se koristi u analizi varijance; ZKtot ukupan je zbroj
kvadrata svih rezultata odnosno rezultata svih ispitanika.
Kvadrirana eta moe se odrediti i pomou F-omjera i stupnjeva slobode:
F ssiz
2 (15)
ssiz F ssun

ssiz su stupnjevi slobode koji se veu uz zbroj kvadrata izmeu grupa (ZKiz) i ssun
stupnjevi su slobode koji se veu uz zbroj kvadrata unutar grupa (ZKun)3.

3
U statistikoj literaturi anglo-amerikog podrijetla obino se umjesto subskripta un koristi subskript
error, ili skraeno e, jer, doista, varijabilitet unutar grupa rezultat je sluajnih pogreaka pri
mjerenju i pri uzorkovanju, a koje se distribuiraju normalno.

28
Citat iz Petzove statistike kae (str. 360): 2, kvadrirano eta, proporcija je
varijance odgovorna za veliinu uinka. Ili, preciznije, 2 proporcija je totalnog
(ukupnog) varijabiliteta rezultata oko zajednike (ope) aritmetike sredine koji je
odgovoran za varijabilitet aritmetikih sredina grupa iji su rezultati podvrgnuti analizi
varijance. Ili: koliki dio ukupne varijance rezultata otpada na utjecaj nezavisne
varijable."
Kvadrirana eta poznata je i kao korelacijski omjer koji se koristi za odreivanje
stupnja povezanosti izmeu varijabli kojima crta regresije nije pravac nego neki stupanj
zakrivljenog odnosa pa se stoga naziva jo i koeficijent zakrivljene korelacije. Vano
svojstvo kvadrirane ete jest, dakle, neosjetljivost na zakrivljenje odnosa meu
varijablama, pa u takvim sluajevima nije opravdano raunati Pearsonov r, koji je
koeficijent linearne povezanosti meu varijablama.

Prema Gamstu i suradnicima (2008) veliina kvadriranog eta kao


veliina uinka od 0.09 je mala, 0.14 srednja, a 0.22 (i vea) je velika.

Pogledajmo kako to izgleda na jednom primjeru posuenom iz knjige Analiza


varijance u psihologijskim istraivanjima (Kolesari, 2006). To je primjer koji je
pripravljen na temelju provedenih istraivanja, ali je malo prilagoen kao udbeniki
primjer.
Kako je ve u jednom prethodnom primjeru spomenuto, psiholozi vrlo esto kao
zavisnu varijablu koriste vrijeme reakcije vrijeme koje je potrebno ispitaniku da
reagira na neki jednostavniji ili sloeniji podraaj (unaprijed dogovoren ili
nedogovoren). Podraaji mogu biti vrlo razliiti vidni, sluni, taktilni, verbalni,
slikovni itd. (psiholozi su smislili razliite jednostavnije ili sloenije podraaje), ali i
reakcije mogu biti razliite, a najee su motorne ili verbalne. Najjednostavnije
koritenje vremena reakcije kao zavisne varijable jest vrijeme jednostavne
senzomotorne reakcije to je vrijeme koje protekne izmeu prezentacije nekog
jednostavnog senzornoga podraaja (npr. svjetlosnoga bljeska ili kratkotrajnoga
zvunoga signala) i dogovorene motorne reakcije (npr. podizanje prsta s nekog tipkala
ili tipke). To je bila, a jo uvijek i jest, meu psiholozima popularna zavisna varijabla
jer se openito misli da je to objektivniji pokazatelj ili mjera psiholokih procesa nego,

29
recimo, verbalni odgovor ispitanika. Meutim, jo krajem 19. stoljea bilo je poznato da
se na vrijeme jednostavne senzomotorne reakcije moe djelovati na razliite naine, a
jedan od njih je i formuliranje upute ispitanicima.
Temeljem tog staroga podatka proveden je eksperiment (Kolesari, Krizmani i
pehar, 1986) u kojemu je u tri skupine ispitanika mjereno jednostavno vrijeme
senzomotorne reakcije na zvuni podraaj. Svaka skupina imala je malo izmijenjenu
uputu. Jedna skupina dobila je standardnu uputu koja glasi otprilike ovako: Molimo
vas da reagirate to bre moete na zvuni podraaj. Skupina s tom uputom oznaena
je s N (neutralna uputa). Druga skupina dobila je senzornu uputu koja je glasila
otprilike ovako: Molimo vas da reagirate to bre moete, ali budite sigurni da ste uli
podraaj. Ta je skupina oznaena sa S (senzorna uputa). Trea je skupina dobila
motornu uputu koja je glasila otprilike ovako: Molimo vas da reagirate doista to
bre moete im ujete zvuk (oznaena s M). Motorna reakcija bila je to bre
odmicanje kaiprsta s tipkala. Na temelju rezultata tog eksperimenta sloen je primjer,
malo prilagoen potrebi udbenika, te je, u nekoj mjeri i nekom obliku, koriten i u
knjizi Analiza varijance u psihologijskim istraivanjima (Kolesari, 2006) i u Petzovoj
statistici (Petz, Kolesari i Ivanec, 2012).
Osnovni rezultati prikazani su u tablici 5.
Tablica 5.
Vrijeme jednostavne senzomotorne reakcije na zvuni podraaj tri skupine ispitanika izraeno u
tisuinkama sekunde. Skupine su oznaene s N (neutralna uputa), sa S (senzorna uputa) te s M
(motorna uputa).

N S M
M 177.0 183.9 164.1 M = 175.0
SD 14.92 18.84 16.99
n 18 18 18

U tablici 6. prikazani su osnovni podaci potrebni u analizi varijance.

Tablica 6.
Osnovni podaci potrebni u analizi jednostavne analize varijance u primjeru s jednostavnim
vremenom senzomotorne reakcije za rezultate prikazane u tablici 5. ZK = zbroj kvadrata; ss =
stupnjevi slobode; PK = prosjeni kvadrat ili varijanca.

Izvor ZK ss PK F
varijabiliteta
Izmeu grupa 3668.111 (g 1) = 2 1834.0556
6.35
Unutar grupa 14727.889 (N g) = 51 288.7821
Ukupno (total) 18396.000 N 1 = 53

30
PK je prosjeni kvadrat ili varijanca, dobije se dijeljenjem zbroja kvadrata (ZK) s
odgovarajuim stupnjevima slobode. ee se upotrebljava izraz prosjeni kvadrat
zbog izbjegavanja konfuzije jer su to varijance na razliitim razinama.
Uz 5% rizika dobiveni F-omjer statistiki je znaajan, tj. p < 0.05. Granina
vrijednost u tablicama F-omjera za 5% rizika te 2 i 51 stupanj slobode iznosi 3.18, a
dobiveni je 6.35. Prema tome, ne ostajemo na nul-hipotezi.
Pojedinane usporedbe, pomou Scheffova testa, pokazale su da je razlika
izmeu aritmetike sredine neutralne skupine (MN = 177.0) i aritmetike sredine
motorne skupine (MM = 164.1) statistiki znaajna na razini rizika od 5%, kao i
razlika izmeu senzorne (MS = 183.9) i motorne (MM = 164.1) skupine.
Na temelju tih statistikih vrijednosti moemo zakljuiti, dakle, da postoji
utjecaj sadraja upute na vrijeme jednostavne senzomotorne reakcije. Ali, nemamo ni
jedan podatak o tome kolika je, zapravo, razlika, odnosno, kolike su razlike. Podatak da
je pri odustajanju od nul-hipoteze p 0.01 ne govori nam praktino nita o veliini
razlike, a to je, ipak, podatak koji treba zanimati svakog istraivaa, a osobito
praktiara.
No, poimo korak dalje. Izraunajmo najprije Cohenov f, koji pokazuje veliinu
uinka u jednostavnoj analizi varijance. Izraunat emo ga pomou formula (11) i (12) i
dobit emo f = 0.48. Vii je od 0.40. pa je to, dakle, velika veliina uinka (granine
vrijednosti interpretativne konvencije nalaze se na stranici 28).
Izraunajmo i d koji predlae Howel formula (13), str. 28. Dobije se neto
manja vrijednost, d = 0.41, jer je, oito, ovaj indeks konzervativniji od f-indeksa, ali,
takoer, predstavlja veliku veliinu uinka.
Koji od njih odabrati? Najbolje oba, ali to ovisi o korisniku, o tome eli li stroi
ili malo manje strog kriterij, a ovisi i o vrsti varijabli i cilju istraivanja.
3668.11
Sad odredimo kvadrirano eta prema formuli (14): 2 0.20 . Na str.
18396
29 nalazi se konvencija o interpretativnoj veliini kvadriranog eta. Misli se da je 0.22
velika veliina, a ovdje je dobiveno 0.20, dakle, blizu velike veliine. Proporcija
nezavisne varijable (u ovom sluaju vrsta upute ispitanicima) koja je odgovorna za
razlikovanje aritmetikih sredina tri skupine ispitanika iznosi 0.20 ili 20%.

31
Zato nam je vaan takav podatak? Redovito smo skloni statistiki znaajnu
razliku (dobivenu koritenjem t-testa ili analize varijance) generalizirati i rei otprilike
ovako: skupina ispitanika koja je imala motornu uputu ima krae vrijeme jednostavne
senzomotorne reakcije. A taj zakljuak nije sasvim toan. Ta tvrdnja vrijedi za
prosjean rezultat, a to znai da ima onih ispitanika koji doista imaju krae vrijeme, ali i
onih koji nemaju krae vrijeme reakcije. Meutim, dodatni podaci, Cohenov f i
Howellov d, upuuju na to kolika je zajednika varijanca. Kvadrirano eta pokazuje nam
koliko je snaan utjecaj nezavisne varijable na zavisnu varijablu to se prosjene
vrijednosti u zavisnoj varijabli razliitih skupina ispitanika vie meusobno razlikuju, to
je vei utjecaj nezavisne varijable. Prema tome, nakon ove sloenije obrade rezultata
moemo zakljuiti da ne samo da postoje prosjene razlike izmeu skupina ispitanika
koje su imale razliite upute, nego i da su te razlike velike. Odnosno, oito postoji
znaajan i relativno velik utjecaj uputa ispitanicima na njihovo vrijeme reakcije.
Kvadrirano eta ima jo jedno korisno svojstvo: moe se koristiti kao pokazatelj
parcijalne korelacije pa se tada zove parcijalno kvadrirano eta, a biljei se s parc.2.
Koristi se u sloenoj analizi varijance kad se eli utvrditi veliina uinka pojedinih
nezavisnih varijabli. U jednostavnoj analizi varijance kvadrirano eta i parcijalno
kvadrirano eta jedno su te isto.
Kao primjer odreivanja veliine uinka kod sloene analize varijance posudit
emo opet primjer iz Analize varijance u psihologijskim istraivanjima (Kolesari,
2006, str. 131). Taj je primjer proirenje prethodno opisanog eksperimenta s vremenom
reakcije i razliitim uputama, ali ovaj put ispitanici su podijeljeni na mlae i starije. Kao
to je poznato, mlae i starije osobe razlikuju se, u prosjeku, po brzini reagiranja (stariji
su, naravno, sporiji), pa je svaka skupina od 18 ispitanika podijeljena na mlae i starije
ispitanike, a to znai da sada imamo dvije nezavisne varijable: jedna je vrsta upute, koja
ima tri kategorije, a druga je dob ispitanika, koja ima dvije kategorije. Njihovi su
rezultati, malo prilagoeni edukacijskim potrebama, prikazani u tablici 7.

32
Tablica 7.
Rezultati u 2x3 tablici sloene analize varijance

Mlai N Mlai S Mlai M Mlai svi


M 175.8 181.0 149.9 168.9
SD 15.62 20.78 9.13 15.90
n 9 9 9 27

Stariji N Stariji S Stariji M Stariji svi


M 178.2 186.9 178.2 181.1
SD 15.03 17.40 8.86 14.23
n 9 9 9 27
Svi N Svi S Svi M
M 177.0 183.95 164.05 175.0
SD 15.33 19.16 9.0 13.50
n 18 18 18 54

Zavrni podaci sloene analize varijance 2x3 nalaze se u tablici 8.

Tablica 8.
Zavrni rezultati sloene analize varijance
Izvor
ZK ss PK F
varijabiliteta
Dob (ml., st.) 2016.6667 gMl,St - 1 = 1 2016.6667 8.85 p < 0.01
Upute (N, S, M) 3668.1111 gN,S,M -1 = 2 1834.0556 8.05 p < 0.01
Interakcija 1768.7778 (gMl,St-1)( gN,S,M -1)=2 884.3889 3.88 p < 0.05
Unutar grupa 10932.4445 N g = 48 227.7593
Ukupno (total) 18386.0001 N 1 = 53

Za oba glavna efekta, tj. za obje varijable F-omjeri statistiki su znaajni;


znaajan je i F-omjer za interakciju. Postojanje razlike meu skupinama koje su imale
razliite upute ve smo utvrdili jednostavnom analizom varijance. Novi podatak, koji
smo dobili sloenom analizom varijance, jest znaajna razlika u brzini reakcije izmeu
skupine mlaih i skupine starijih ispitanika, a kvalitativno novi podatak jest podatak o
interakciji. Opisno, interakcija se u ovom eksperimentu oituje u tome da mlai
ispitanici imaju znaajno krae vrijeme s motornom uputom, ali ne i sa senzornom
uputom.
Na temelju podataka iz tablice 8. moemo odrediti parcijalne kvadrirane ete
pomou formula preuzetih iz Petzove statistike (2012). Parcijalne kvadrirane ete
odreuju se posebno za svaku varijablu i posebno za interakciju.

Za varijablu upute:
ZKupute
parc.upute
2
(16)
ZKtotal ZKdob ZKint erakcija

33
Za varijablu dob:

ZKdob
parc.dob
2
(17)
ZKtotal ZKupute ZKint erakcija

Za interakciju dob * upute:

ZKint erakcija
parc.int
2
er (18)
ZKtotal ZKupute ZKdob

ZK jesu odgovarajui zbrojevi kvadrata koji se mogu oitati iz tablice 8.


Koristei gornje formule dobili smo:

parc.upute
2
0.25 parc.dob
2
0.16 parc.int
2
er 0.14

Proporcija totalnog varijabiliteta koji je odgovoran za veliinu uinka u varijabli


upute iznosi 0.25, a to je velika veliina uinka, vea od granine (koja iznosi 0.22,
str. 29). Za dob iznosi 0.16, to je neto vee od srednje veliine uinka (0.14), a za
interakciju iznosi upravo 0.14. Ti se podaci mogu izravno interpretirati kao proporcija
ili postotak (ako dobivene brojeve pomnoimo sa 100) zajednike varijance, poput r2
(koeficijent determinacije).
Sloenom analizom varijance utvrdili smo da se skupine koje su imale razliite
upute pri provedbi mjerenja vremena jednostavne senzomotorne reakcije meusobno
razlikuju (detaljnijim usporedbama utvrdili smo i koje se skupine meusobno statistiki
znaajno razlikuju), utvrdili smo i da se mlai i stariji ispitanici meusobno razlikuju po
brzini reakcije (mlai su openito bri), te da postoji interakcija: najnii prosjeni
rezultat imala je mlaa skupina s motornom uputom.
Dodatni uvid omoguilo nam je raunanje parcijalnoga kvadriranog eta koji
pokazuje da je varijabla upute odredila relativno najvei dio totalne varijance, a
varijabla dob i interakcija to su odredile puno manje. Taj podatak, da u totalnoj
varijanci dominira nain prezentiranja upute i njezin sadraj, moe imati sasvim
praktinih posljedica u provedbi ispitivanja u kojima se koristi vrijeme reakcije kao
zavisna varijabla, a koristi se i u eksperimentalnim i u praktinim prilikama. Ali, s
prilino velikom vjerojatnou moe se doi i do openitijega zakljuka: nije svejedno
kako formom i sadrajem prezentiramo uputu svojim ispitanicima. Ako razliito

34
prezentiranje upute ima uinka na vrijeme reakcije, kakav tek utjecaj ima na, recimo,
verbalne reakcije, koje su pod znatno veom namjernom ili nenamjernom kontrolom
ispitanika?!
Mogue je, naravno, i spekuliranjem doi do slinih ili jednakih zakljuaka, ali
nae e inventivno rezoniranje biti uvjerljivije ako je potkrijepljeno objektivnim
statistikim argumentima.
I ovdje moemo odrediti, nazovimo ga tako, ukupni kvadrirani eta pomou
formule (14), a iznosi 0.41, dakle vrlo je velika veliina uinka (granini za veliki
uinak jest 0.22, str. 29). Napomena: ovdje emo ZKiz dobiti zbrajanjem vrijednosti iz
tablice 8, ZKupute+ZKdob+ZKinterakcija. Taj kvadrirani eta, meutim, u ovom sluaju nema
neku osobito informativnu vrijednost, jer smo raunali parcijalne indekse koji su nam
vaniji.
Ponavljamo upozorenje statistiara: dobivene vrijednosti nikada se ne smiju
smatrati apsolutnim podacima, koji jednako vrijede u svakom sluaju. Naprotiv, njihovo
i teorijsko i praktino znaenje ovisi o kontekstu, o koritenim varijablama i ciljevima
istraivanja.
Howell (2010) nudi, prema njegovu miljenju, bolji indeks veliine uinka iz
korelacijske porodice, 2 (kvadrirana omega). Osim njega, i mnogi drugi autori tvrde
da se taj indeks najee koristi u analizi varijance. Kvadrirana omega pokazuje kolika
je proporcija varijabiliteta u zavisnoj varijabli u odnosu na odreenu nezavisnu
varijablu. Uobiajeno je da se kvadrirana omega interpretira samo za statistiki
znaajne rezultate. Statistiari kau da je kvadrirana omega bolja od kvadrirane ete zato
to u formuli uzima u obzir stupnjeve slobode. Formula za odreivanje kvadrirane
omege u jednostavnoj analizi varijance:

ZKiz ( g 1) PK un
2 (19)
ZKtot PK un

ZKiz je zbroj kvadrata za odreivanje varijabiliteta izmeu grupa; (g 1) stupnjevi su


slobode s kojima se dijeli ZKiz, tj. broj grupa minus 1; PKun prosjeni je kvadrat
(varijanca) i pokazuje variranje unutar grupa, a ima znaenje pogreke mjerenja i

35
pogreke uzorkovanja (u engl. jeziku najee se oznauje s error); ZKtot ukupan je
zbroj kvadrata za sve rezultate4.
Koristei rezultate, kao i za kvadriranu etu, iz tablice 6: 2 = 0.10. Taj je indeks
konzervativniji od kvadrirane ete i redovito je manji, to se vidi i u naem sluaju.
Interpretira se prema konvenciji kao i kvadrirana eta ili se pomnoi sa 100 i tako se
dobije postotak zajednike varijance, dakle, u ovom sluaju, zajednika varijanca iznosi
10%.
Kvadriranu omegu smije se koristiti samo ako su veliine skupina jednake ili
barem vrlo sline.
Formule za parcijalnu kvadriranu omegu za dvosmjernu analizu varijance (jednu
nezavisnu varijablu oznait emo s A, drugu s B, a interakciju s AB) jesu:

ssizA PK izA PK un
parc. A2 (20)
ZKizA Ntot ssizA PK un

ssizB PK izB PK un
parc.B2 (21)
ZKizB Ntot ssizB PK un

ssAB PK AB PK un
parc. AB
2
(22)
ZK AB Ntot ssAB PK un

Za rezultate iz tablice 8. dobivamo ove vrijednosti parcijalnih kvadriranih


omega:
parc.upute
2
0.21 parc.dob
2
0.13 parc.int
2
er 0.09

Te su vrijednosti manje nego one vrijednosti koje smo dobili raunajui


parcijalne kvadrirane ete, ali zakljuci mogu biti jednaki, moda malo stroi.
Koji od tih indeksa koristiti? ini nam se da se kvadriranu etu ee moe
susresti, ali u novije vrijeme kvadrirana omega, sve vie prodire. Ipak, vrlo esto autori
prikazuju oba indeksa za svaki sluaj!
Postoji jo takvih indeksa. Jedan je od njih kvadrirani epsilon:
ZKiz ssiz PK un
2 (23)
ZKtot

4
U Petzovoj statistici, naalost, u formuli za kvadriranu omegu na str. 361. u nazivniku pogreno stoji
minus, a treba biti plus, dakle, tono je ZKtot PK un. Meutim, na str. 362. gdje se raunaju vrijednosti
iz primjera, formula je tono napisana.

36
Viestruka (multipla) regresija

U modelu viestruke regresije pogodan indeks za odreivanje veliine uinka


jest Cohenov f 2.
R2 2
f2 (24)
1 R2 1 2
R2 = 2 (2 je kvadrirana eta koju smo ve spominjali). To je globalna veliina
uinka i pokazuje proporciju objanjene varijance nasuprot neobjanjenoj varijanci.
No, vanija je specifinija veliina uinka kad se promatra viestruka korelacija
jedne varijable i skupa nekoliko varijabli. Ako se ta jedna varijabla oznai s K, a skup
ostalih varijabli s P formula za odreivanje veliine uinka pomou f 2 bit e:
2
RKP RP2
f
2
(25)
1 RKP
2

2
RKP je proporcija varijance odgovorna za K i P zajedno, a RP2 je proporcija
varijance odgovorna za P (skup varijabli u multiploj regresiji koji obino nazivamo
2
prediktorima). Stoga brojnik u gornjoj formuli ( RKP RP2 ) pokazuje proporciju varijance
odgovornu samo za varijablu K u odnosu na sve druge varijable (tj. P).

* * *

U Dodatku A nalaze se konvencionalne granine vrijednosti za razliite veliine


uinaka, u Dodatku B uobiajena tablica graninih vrijednosti t-testa i u Dodatku C
granine vrijednosti 2 testa.

37
Literatura

Bachmann, C., Luccio, R. i Salvadori, E. (2005). Statistina pomembnost in njen pomen. Psiholoka
obzorja, 14(3), 7-40.

Becker. L.A. (2000). http://web.uccs.edu/lbecker/Psy590/es.htm

Coe, R. (2002). It's the Effect Size, Stupid. What effect size is and why it is important. Paper presented at
the Annual Conference of the British Educational Research Association.

Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences. Hillsdale, NJ: LEA.

Cohen, J. (1994). The earth is round (p < 0.05). American Psychologist, 49(12), 997-1003.

Ferguson, C.J. (2009). An effect size primer: A guide for clinicians and researchers. Professional
Psychology: Resarch and Practice, 40(5), 532-538.

Gamst, G., Meyers, L.S. i Guariono, A.J. (2008). Analysis of Variance Designs. Cambridge: Cambridge
University Press.

Glass, G.V. & Hopkins K.D. (1984). Test Bank for Statistical Methods in Education & Psychology.
Englewood Cliffs, NJ: Prentice Hall.

Howell, D.C. (2010). Statistical Methods for Psychology. Belmont, CA: Wadsworth, Cengage Learning.

Kolesari, V. (2006). Analiza varijance u psihologijskim istraivanjima. Osijek: Filozofski fakultet u


Osijeku.

Kolesari, V., Krizmani, M. i pehar, B. (1986). Uputom inducirane individualne razlike


u "senzornom" i "motornom" stavu pri ispitivanju vremena jednostavne senzomotorne reakcije.
Primijenjena psihologija, 7(1-4), 275-280.

Khberger, A., Fritz, A. i Scherndl, T. (2014). Publication bias in Psychology: A diagnosis based on the
correlation between effect size and sample size. DOI:10.1371/Journal.pone.0105825.

Lakens, D. (2013). Calculating and reporting effect sizes to facilitate cumulative science: a practical
primer for t-tests and ANOVAs. Frontiers in Psychology, 4, 863.

Nickerson, R.S. (2000). Null hypothesis significance testing: A review of an old and continuing
controcersy. Psychological Methods, 5(2), 241.

Petz, B., Kolesari, V. i Ivanec. D. (2012). Petzova statistika. Jastrebarsko: Naklada Slap.

Rosnow, R. i Rosenthal, R. (1989). Statistical procedures and the justification of knowledge in


psyhological science. American Psychologist, 44, 1276-1284.

Vacha-Haase, T., Nilsson, J.E., Reetz, D.R., Lance, T.S. i Thompson, B. (2000). Repoting practices and
APA editorial policies regarding statistical significance and effect size. Theory & Psychology,
Vol. 10(3), 413-425.

38
DODATAK A

Granine vrijednosti za interpretaciju razliitih veliina uinka

Veliina uinka Mala Srednja Velika


Cohenov d 0.20 0.50 0.80
r 0.10 0.30 0.50
r2 0.01 0.09 0.25
f 0.10 0.25 0.40
, Cramerov V,
Cohenov w 0.10 0.30 0.50

Cohenov f2 0.02 0.15 0.35


2, 2 i R2 0.01 0.06 0.14

Primjedba: U razliitim statistikama mogu se nai donekle razliite vrijednosti. Tako,


primjerice, Gamst i suradnici (2008) za interpretaciju veliine kvadrirane ete daju ove
vrijednosti:

veliina uinka od 0.09 je mala, 0.14 je srednja, a 0.22 (i vea) je velika.

39
DODATAK B
Granine vrijednosti t-testa

razine rizika
ss 10% 5% 2% 1%
1 6.34 12.71 31.82 63.66
26,431 12.71.34
2.92 12.71
4.30 31.82
6.96 63.66
9.92
3 2.35 3.18 4.54 5.84
4 2.13 2.78 3.75 4.60
5 2.02 2.57 3.36 4.03
6 1.94 2.45 3.14 3.71
7 1.90 2.36 3.00 3.50
8 1.86 2.31 2.90 3.36
9 1.83 2.26 2.82 3.25
10 1.81 2.23 2.76 3.17
11 1.80 2.20 2.72 3.11
12 1.78 2.18 2.68 3.06
13 1.77 2.16 2.65 3.01
14 1.76 2.14 2.62 2.98
15 1.75 2.13 2.60 2.95
16 1.75 2.12 2.58 2.92
17 1.74 2.11 2.57 2.90
18 1.73 2.10 2.55 2.88
19 1.73 2.09 2.54 2.86
20 1.72 2.09 2.53 2.84
21 1.72 2.08 2.52 2.83
22 1.72 2.07 2.51 2.82
23 1.71 2.07 2.50 2.81
24 1.71 2.06 2.49 2.80
25 1.71 2.06 2.48 2.79
26 1.71 2.06 2.48 2.78
27 1.70 2.05 2.47 2.77
28 1.70 2.05 2.47 2.76
29 1.70 2.04 2.46 2.76
30 1.70 2.04 2.46 2.75
35 1.69 2.03 2.44 2.72
40 1.68 2.02 2.42 2.71
45 1.68 2.02 2.41 2.69
50 1.68 2.01 2.40 2.68
60 1.67 2.00 2.39 2.66
70 1.67 2.00 2.38 2.65
80 1.66 1.99 2.38 2.64
90 1.66 1.99 2.37 2.63
100 1.66 1.98 2.36 2.63
125 1.66 1.98 2.36 2.62
150 1.66 1.98 2.35 2.61
200 1.65 1.97 2.35 2.60
300 1.65 1.97 2.34 2.59
400 1.65 1.97 2.34 2.59
500 1.65 1.96 2.33 2.59
1000 1.65 1.96 2.33 2.58
1.65 1.96 2.33 2.58

40
DODATAK C

Granine vrijednosti 2 testa uz razliite razine rizika

ss / p 0.30 0.20 0.10 0.05 0.02 0.01

1 1.074 1.642 2.706 3.841 5.412 6.635


2 2.408 3.219 4.605 5.991 7.824 9.210
3 3.665 4.642 6.251 7.815 9.837 11.431
4 4.878 5.989 7.779 9.488 11.668 13.277
5 6.064 7.289 9.236 11.070 13.388 15.086

6 7.231 8.558 10.645 12.592 15.033 16.812


7 8.383 9.803 12.117 14.067 16.622 18.475
8 9.524 11.030 13.362 15.507 18.168 20.090
9 10.656 12.242 14.684 16.919 19.679 21.666
10 11.781 13.442 15.987 18.307 21.161 23.209

11 12.899 14.631 17.275 19.675 22.618 24.725


12 14.011 15.812 18.549 21.026 24.054 26.217
13 15.199 16.985 19.812 22.362 25.472 27.688
14 16.222 18.151 21.064 23.685 26.873 29.141
15 17.322 19.311 22.307 24.996 28.259 30.578

16 18.418 20.465 23.542 26.296 29.633 32.000


17 19.511 21.615 24.769 27.587 30.995 33.409
18 20.601 22.760 25.989 28.869 32.346 34.805
19 27.689 23.900 27.204 30.144 33.687 36.191
20 22.775 25.038 28.412 31.410 35.020 37.566

21 23.858 26.171 29.615 32.671 36.343 38.932


22 24.939 27.301 30.813 33.924 37.659 40.289
23 26.018 28.429 32.007 35.172 38.968 41.638
24 27.096 29.553 33.196 36.415 40.270 42.980
25 28.172 30.675 34.382 37.652 41.566 44.314

41

You might also like