METODE

Goran Milas:
ISTRAŽIVAČKE METODE U PSIHOLOGIJI I

DRUGIM DRUŠTVENIM ZNANOSTIMA
Zagreb, Slap, 2009.
SADRŽAJ
1. ZNANOST I ZNANSTVENE METODE...............................................................................................................3
1.1 NAČINI SPOZNAVANJA SVIJETA..............................................................................................................3
1. 1.1 METODA USTRAJNOSTI...................................................................................................................3
1.1.2 METODA AUTORITETA....................................................................................................................3
1.1.3 PREDISKUSTVENA (A PRIORI) METODA............................................................................................4
1.1.4 ZNANSTVENA METODA...................................................................................................................4
1.2 ZNANSTVENI I NEZNANSTVENI PRISTUPI SPOZNAJI...............................................................................4
1.2.1 ZNANOST I METAFIZIČKA SPOZNAJA...............................................................................................5
1.2.2 ZNANOST, PSEUDO-ZNANOST I ZDRAVORAZUMSKO RAZMIŠLJANJE.............................................6
1.3 ULOGA ZNANSTVENE METODOLOGIJE.................................................................................................10
1.4 TEMELJNE PRETPOSTAVKE ZNANOSTI.................................................................................................10
1.5 CILJEVI ZNANOSTI.................................................................................................................................12
1.5.1 OPISIVANJE...................................................................................................................................12
1.5.2 PREDVIĐANJE................................................................................................................................14
1.5.3 RAZUMIJEVANJE...........................................................................................................................15
1.5.4 KONTROLA....................................................................................................................................15
2. TEORIJE I ISTRAŽIVANJA..............................................................................................................................16
1.1 TEORIJA.................................................................................................................................................16
2.1.1 SASTAVNI ELEMENTI TEORIJE.......................................................................................................17
2.1.2 STRUKTURA ZNANSTVENE TEORIJE...............................................................................................23
2.1.3 KRITERIJI DOBRE TEORIJE..............................................................................................................24
2.1.4 PRISTUPI U STVARANJU TEORIJA..................................................................................................27
2.1.5 PROŽIMANJE TEORIJA I ISTRAŽIVANJA..........................................................................................29
2.2 NORMALNA ZNANOST I ZNANSTVENA REVOLUCIJA............................................................................31
2.3 ISTRAŽIVAČKI PRISTUPI........................................................................................................................32
2.3.1 TEMELJNA I PRIMIJENJENA ISTRAŽIVANJA....................................................................................32
2.3.2 NOMOTETSKA I IDIOGRAFSKA ISTRAŽIVANJA...............................................................................32
2.3.3 KVANTITATIVNA I KVALITATIVNA ISTRAŽiVANJA..........................................................................33
3. ETIČKI PROBLEMI ISTRAŽIVANJA................................................................................................................36
3.1 PRIPREMANJE ISTRAŽIVANJA................................................................................................................38
3.1.1 PLANIRANJE ISTRAŽIVANJA...........................................................................................................38
3.1.2 ZNANSTVENA ODGOVORNOST.....................................................................................................38
3.1.3 DOZVOLA USTANOVE....................................................................................................................38
3.2 ODGOVORNOST PREMA ISPITANICIMA...............................................................................................39
3.2.1 SUGLASNOST ISPITANIKA..............................................................................................................39
3.2.2 UPOZNAVANJE SUDIONIKA S PRIRODOM I CILJEM ISTRAŽIVANJA................................................39
3.2.3 KORIŠTENJE ŽIVOTINJA U ISTRAŽIVANJIMA..................................................................................40
3.3 OBMANA U PSIHOLOGIJSKOM ISTRAŽIVANJU.....................................................................................40
3.4 IZVJEŠTAVANJE O ISTRAŽIVANJU.........................................................................................................41
3.5 RECENZIJE............................................................................................................................................43
4. TEMELJNI ELEMENTI ISTRAZIVACKOG PROCESA.........................................................................................44
4.1 ISTRAŽiVAČKI PROBLEM.......................................................................................................................45
4.1.1 IZVORI ISTRAŽIVAČKIH IDEJA........................................................................................................46
4.2 HIPOTEZA.............................................................................................................................................48
5. PISANJE ZNANSTVENOG RADA I ISTRAZIVAČKOG IZVJEŠTAJA....................................................................50
5.1 OSNOVNE SMJERNICE ZA PISANJE IZVJEŠTAJA.....................................................................................50
Ivo V.
5.2 STRUKTURA ZNANSTVENOG IZVJEŠTAJA.............................................................................................52
5.2.1 NASLOV I NASLOVNA STRANICA...................................................................................................52
5.2.2 SAŽETAK........................................................................................................................................53
5.2.3 UVOD............................................................................................................................................53
5.2.4 PROBLEM......................................................................................................................................53
5.2.5 METODA.......................................................................................................................................54
5.2.6 REZULTATI.....................................................................................................................................55
2.2.7 RASPRAVA (DISKUSIJA).................................................................................................................56
5.2.8 ZAKLJUČCI.....................................................................................................................................57
5.2.9 LITERATURA..................................................................................................................................57
5.3 OBILJEŽJA KVALITETNO NAPISANOG RADA..........................................................................................58
5.4 PROCES ZNANSTVENE RECENZJJE........................................................................................................59
EKSPERIMENTALNE METODE.........................................................................................................................61
6. TEMELJI EKSPERIMENTALNE METODE........................................................................................................61
6.1 PROBLEM UZROČNOSTI.......................................................................................................................61
6.1.1 GLEDIŠTA O UZROČNOSTI.............................................................................................................62
6.1.2 EKLEKTIČKI POGLED......................................................................................................................66
6.2 LOGIKA EKSPERIMENTIRANJA..............................................................................................................67
6.3 VARIJABLE U EKSPERIMENTU...............................................................................................................71
6.3.1 NEZAVISNA VARIJABLA.................................................................................................................71
6.3.2 ZAVISNA VARIJABLA......................................................................................................................76
6.4 KONTROLA U EKSPERIMENTU..............................................................................................................77
6.4.1 FIZIČKI ČINITELJI............................................................................................................................78
6.4.2 KONTROLA PRISTRANOSTI SUDIONIKA U EKSPERIMENTU............................................................79
6.4.3 KONTROLA OSOBNIH ČINITELJA....................................................................................................79
6.5 EKSPERIMENTALNA VALJANOST..........................................................................................................80
6.5.1 VALJANOST STATISTIČKOG ZAKLJUČKA.........................................................................................80
6.5.2 UNUTARNJA VALJANOS................................................................................................................88
6.5.3 KONSTRUKTNA VALJANOST..........................................................................................................95
6.5.4 VANJSKA VALJANOST..................................................................................................................100
6.5.5 EKSPERIMENTALNA VALJANOST U ODNOSU NA VALJANOST DRUGIH ISTRAŽIVAČKIH METODA
..............................................................................................................................................................103
7. ISTINSKI EKSPERIMENTI............................................................................................................................104
7.1 EKSPERIMENTALNI NACRTI................................................................................................................104
7.1.1 EKSPERIMENTALNI NACRT NA NEZAVISNIM GRUPAMA.............................................................104
7.1.2 EKSPERIMENTALNI NACRTI UNUTAR ISPITANIKA (NACRTI PONOVLJENIH MJERENJA)..............117
7.1.3 SLOŽENI (FAKTORIJALNI) EKSPERIMENTALNI NACRTI.................................................................125
7.1.4 IZBOR EKSPERIMENTALNOG NACRTA.........................................................................................131
7.1.5 EKSPERIMENTALNI NACRT KAO NAČIN KONTROLIRANJA VARIJANCE........................................133
7.2 ARTEFAKT U EKSPERIMENTU I NAČINI NJEGOVE KONTROLE.............................................................139
7.2.1 ODNOS IZMEĐU EKSPERIMENTATORA I ISPITANIKA...................................................................139
8. KVAZI EKSPERIMENTI................................................................................................................................147
8.1 RAZLIKE U ODNOSU NA ISTINSKI EKSPERIMENT................................................................................147
8.1.1 UPRAVLJANJE NEZAVISNOM VARIJABLOM.................................................................................147
8.1.2 MOGUĆNOST KONTROLE............................................................................................................148
8.1.3 ODNOS UNUTARNJE I VANJSKE VALJANOSTI..............................................................................149
8.1.4 CILJEVI KVAZI-EKSPERIMENATA..................................................................................................149
8.2 KVAZI-EKSPERIMENTI I NE-EKSPERIMENTALNA ISTRAŽIVANJA..........................................................149
8.3 NAČIN ZAKLJUČIVANJA U KVAZI-EKSPERIMENTU..............................................................................149
8.4 OSNOVNI TIPOVI KVAZI-EKSPERIMENTALNIH NACRTA......................................................................150
8.4.1 NACRTI NEUJEDNAČENIH SKUPINA.............................................................................................151
8.4.2 NACRTI PREKINUTIH VREMENSKIH NIZOVA................................................................................172
8.5 NAČINI UNAPREĐIVANJA ZAKLJUČIVANJA U KVAZI-EKSPERIMENTIMA.............................................179
2
Ivo V.
1. ZNANOST I ZNANSTVENE METODE
Upoznavanje istraživačkih metoda što ih koristi suvremena psihologija kako bi se približila
predmetu svog proučavanja, zahtjevna je i opsežna zadaća koja traži primjeren uvod. Pristup koji se
ponegdje njeguje u literaturi i udžbenicima počiva na krajnjem pojednostavljenju ili potpunom
izostavljanju tema općeg metodološkog karaktera, svodeći ih uglavnom na tehničko štivo kojim se
opisuju pojedine istraživačke metode. Takvo usmjerenje ima određenih prednosti jer omogućuje
brži i naoko jednostavniji pristup tematici, ali držimo da su nedostaci s kojima se suočava ipak
brojniji. Metodologija, koju ne valja brkati s pojedinačnim metodama i tehnikama istraživanja,
pridonosi boljem razumijevanju složenog procesa empirijskih istraživanja u psihologiji, nudeći
istodobno, što je čak važnije, podlogu za kritičnost, ne samo prema neznanstvenim već i prema
znanstvenim metodama. Metodologija iz filozofskog očišta otvara brojna pitanja kojih moramo biti
svjesni prilikom izbora metode prikupljanja podataka i njihova tumačenja. U nastavku ćemo
nastojati izmiriti filozofsko-spoznajni i statističko-tehnicistički pristup metodologiji pružajući
slojevitiji uvid u ono što su mnogi skloni nazivati suštinom znanstvenog rada.
Uvodna poglavlja bit će posvećena temeljnim problemima kojima se bavi filozofija znanosti,
disciplina koja nastoji rasvijetliti sastavne elemente znanstvenog istraživanja, vrednujući ih na
osnovi kriterija formalne logike, metodologije i metafizike. Rasprava o metodologiji briše granice
pojedinih disciplina jer su spoznaj ni problemi koji se pojavljuju, najvećim dijelom univerzalni. To
znači da su većina pitanja vezanih uz spoznajne dosege i ograničenja te mogućnosti da se one
prošire, gotovo jednako svojstvena psihologiji kao i prirodnim znanostima. Uvodna će rasprava
nužno biti prekratka i nepotpuna u odnosu na bogatstvo i dubinu problema što ih 1 otvara, filozofija
znanosti, ali, vjerujemo, ipak dostatna za uspostavljanje spona između pojmovne razine i temeljnih
pretpostavki znanosti s jedne strane i metodološke operacionalizacije s druge. Zadaća koju time
nastojimo ostvariti jest postizanje svijesti o prirodnom odnosu, gotovo organskoj cjelini filozofske
osnove znanstvenog pregnuća i metodologije što je koristi ti spoznavanju svijeta.
1.1 NAČINI SPOZNAVANJA SVIJETA

Ubrzo ćemo vidjeti da je znanost tek jedan od mnogih pristupa spoznavanju svijeta oko nas, ali
svakako posve različit od svih ostalih. U životu se ipak mnogo češće oslanjamo na "zdrav razum"
odnosno vlastite, često nepromišljene, pretpostavke ili podjednako malo vjerodostojne ali
općeprihvaćene stavove. Američki filozof Charles Peirce podijelio je načine spoznavanja u četiri
kategorije, koje ćemo ukratko opisati.
1. 1.1 METODA USTRAJNOSTI
U neke stvari vjerujemo jednostavno zato Što smo u njih uvijek vjerovali. Navika je ono što
produžava vijek našim uvjerenjima, katkad usprkos brojnim proturječnim i opovrgavajućim
pokazateljima. Stavove koje imamo oduvijek, jednostavno ne propitujemo ili to činimo vrlo nerado
i samo iznimno. Ako netko dovede u pitanje neko naše čvrsto zastupano uvjerenje, vjerojatno ćemo
takav napad na stavove okarakterizirati kao neznanje, neupoznatost ili jednostavno bezobraštinu. To
je u socijalnoj psihologiji odavna poznat način da se obranimo od mišljenja i stavova protivnih
onima što ih sami zagovaramo. Time osiguravamo stabilnost i dosljednost vlastitih uvjerenja
čuvajući se stresova, neprekidnog prilagođavanja novim shvaćanjima. Ipak, metoda ustrajnosti ne
može zauvijek očuvati nečije stavove odnosno zajamčiti potpunu stabilnost uvjerenja koja nemaju
uporište u zbilji oko nas. Pritisak činjenica ili proturječnih stavova ponekad Je prejak, što nas
navodi na odbacivanje ustrajno održavanih zabluda.
1.1.2 METODA AUTORITETA
U mjesto tvrdoglavog ustrajavanja na oduvijek zagovaranim stavovima, vlastita uvjerenja možemo
stjecati ili braniti pozivajući se na neki autoritet. Velika većina naših znanja takvog je tipa. Želimo li
opravdati vlastiti književni ukus, mišljenje o ekonomskim pitanjima ili filozofsko poziciju, često
1
Milas Goran: Istraživačke metode u psihologiji i drugim društvenim znanostima, Zagreb, Slap, 2009., str. 3.
3
Ivo V.
ćemo se pozvati na neki visoko vrednovani izvor, poput znamenitog literarnog kritičara, uglednog
ekonomista ili cijenjenog filozofa. U nekim slučajevima metoda oslanjanja na autoritet je
neizbježna i opravdana jer smo vrlo često dovedeni u poziciju da sami ne možemo riješiti neki vrlo
stručan problem poput liječenja bolesti, popravljanja automobila ili upravljanja avionom. Autoritet
u tom smislu nipošto nije apsolutan jer se, ako tako2 procijenimo, uvijek možemo odlučiti za drugog
liječnika, automehaničara ili zrakoplovnu tvrtku. U drugim prilikama autoritet podržava neka
vanjska sila izdižući njegove procjene na razinu zakona, zbog čega mu se pripisuje nepogrešivost.
Takav autoritet, često prisutan u-politici i religiji, smatran je apsolutnim i tijekom povijesti je znao
biti korišten li iskorjenjivanju odudarajućih uvjerenja i mišljenja. Poput metode ustrajnosti i metoda
autoriteta trebala bi pružiti stabilnost stavovima i otkloniti potrebu njihova mijenjanja, ali je posve
jasno da u modernom svijetu ne postoji jedan jedinstveni autoritet, nego mnoštvo stručnjaka čiji se
pogledi nerijetko razilaze. Zbog toga se u spoznavanju ne možemo osloniti na metodu autoriteta kao
jedino sredstvo, već se ona mora nadopunili ili posve zamijeniti.
1.1.3 PREDISKUSTVENA (A PRIORI) METODA
Ljudi se u svojim procjenama čest pozivaju na samorazumljive "istine" koje s toliko očigledne da ih
nije potrebno propitivati ni dokazivati. Svijest o njihovoj istinitosti gotovo da je prediskustvena,
odnosno intuitivna. Takva metoda spoznavanja najbliža je onom što ćemo nastavku zvali
zdravorazumskim razmišljanjem. Povijest je, nažalost, prepuna očiglednih "istina" koje su kasnije
opovrgnute, poput toga da je Zemlja ravna ploha ili da se nalazi u središtu svemira. Sloga
očiglednost sama po sebi nije jamstvo da je neka spoznaja istinita, pa se, u potrazi za stabilnijom i
vjeredostojnijom moramo okrenuti drugim metodama.
1.1.4 ZNANSTVENA METODA
Znanstveni pristup spoznaji posljednja je metoda obuhvaćena Peirceovom podjelom, ali ujedno i
ona kojoj ćemo posvetiti središnje mjesto u našem razmatranju. Zasad ćemo naglasiti kako je riječ o
metodi koja se nastoji osloboditi ljudske subjektivnosti i proizvoljnosti i koja je kritična kako prema
tuđim tako i prema vlastitim spoznajama. Po čemu je takav oblik spoznavanja svijeta osobit i koja
su mu obilježja, doznat ćemo u nastavku.
1.2 ZNANSTVENI I NEZNANSTVENI PRISTUPI SPOZNAJI

Ne postoji jednostavno određenje znanosti. Jedni je poistovjećuju s mnoštvom činjeničnih spoznaja
prikupljenih u cjelinu, drugi s objektivnim istraživanjem iskustvenih pojava, a treći s posebnim
stavom što ga zauzima prema stvarnosti. U prvom slučaju naglasak je na znanstvenom produktu, u
drugome na metodologiji, a u trećem na načinu razmišljanja (Marx i Hillix, 1963). Govoreći o
korpusu znanja do kojeg je došla, znanost uistinu zauzima posebno mjesto među načinima
spoznavanja.3 Sistematizacijom činjenične zbilje, njezinom kategorizacijom i prepoznavanjem
zakonitosti kojima je upravlja na, znanost je uvelike pridonijela razumijevanju svijeta oko nas. I ne
samo to. Namećući posebna pravila u prikupljanju iskustvene građe i njezinu analiziranju,
omogućila je nakupljanje spoznaja, odnosno nadovezivanje na ranija znanja. Zbog toga danas i
srednjoškolci znaju mnogo više nego učeni ljudi u prošlosti. Znanstveni stav također je po
mnogočemu poseban i različit od svakodnevnog razmišljanja. U potrazi za činjenicama znanstvenici
se oslanjaju na opažanje smatrajući tako dobivene podatke najvjernijim odrazom zbilje. Pritom
zauzimaju kritičan stav, čak i prema naizgled neupitnim i očiglednim "činjenicama", provjeravajući
ih na isti način kao i posve "nevjerojatne" pretpostavke. Nije rijetkost da iskustvena provjera uputi
na ispravnost upravo potonjih, površnom promatraču sasvim nerazumnih tumačenja. Pored
jedinstvenog stava prema zbilji i znanja obuhvaćenog teorijama što ih izgrađuje znanost se odlikuje
i posve osobitim načinom na koji dolazi do spoznaja - vlastitom metodologijom. Jasan i određen
sustav pravila kojim se obavlja testiranje pretpostavki i dolazi do spoznaja usuglašen je s logičkim
2
4
3
5
4
Ivo V.
načelima te stoga omogućuje izvođenje valjanih zaključaka. Teško je, međutim, do kraja približiti i
opisati znanstveni pristup a da se iznova ne usporedi s drugim oblicima spozna vanja svijeta.
1.2.1 ZNANOST I METAFIZIČKA SPOZNAJA
Poteškoće u definiranju znanosti često su posljedica miješanja njezina sadržaja s metodologijom.
Znanost nema jasno ograničeno područje djelovanja, već se bavi svim pojavama dostupnima
iskustvu. I po tome se, međutim, razlikuje od nekih drugih oblika spoznaje, primjerice filozofije ili
religije čiji predmet izučavanja nadilazi iskustvo.
Unutar filozofskog pravca pozitivizma prvi je put postavljen zahtjev da spoznaja ostane pri
činjenicama te da se ograniči na područja dohvatljiva iskustvenoj provjeri. Začetnik pozitivizma,
francuski filozof Auguste Comte smatrao je da ljudska misao prolazi kroz tri stadija, teološki, meta
fizički i činjenični ili znanstveni. U prvom, teološkom stadiju, objašnjenja počivaju na ponašanju
božanskih bića, dok se u metafizičkom ona traže, u području temeljnih počela svijeta,
nedohvatljivih osjetilom iskustvu. Metafizička faza u nekim slučajevima predstavlja tek obezličenu
teologiju jer se priroda tumači pozivanjem na okultne sile, natprirodne procese, životnu energiju ili
slične pojave. Znanstvenom pristupu svojstvena je metoda koja cijelosti počiva na promatranju, a
zadaća je znanosti, kako je držao Comte, da proučava prikupljene činjenice i, uočavajući pravilnosti
u njihovu pojavljivanju, podvodi cjelokupnu prirodu pod odgovarajuće zakone. Objašnjenja pojava
trebala bi počivati isključivo na okupljanju posebnih slučajeva unutar općih zakonitosti. Comte je,
iskazujući beskrajnu vjeru u znanost, zastupao mišljene kako će čovječanstvo dostići 4 punu zrelost
mišljenja tek kad se oslobodi lažnih tumačenja teologije i metafizike zamjenjujući ih punim
oslanjanjem na znanstvenu metodu. Comteov se doprinos također ogleda u razvrstavanju čistih
znanosti onoga vremena u piramidu kojom se nastojalo razlikovati temeljne discipline od onih koje
znače nadgradnju i nadovezuju se na prve. Primjerice, matematika ne počiva ni na jednoj drugoj
znanosti te joj je mjesto na dnu piramide, a iz nad nje nalaze se astronomija, fizika, kemija,
biologija i sociologija. Svaka hijerarhijski viša, znanost nadopunjava sadržaj onih na kojima počiva
specijaliziranim spoznajama. Pojam redukcionizma o kojem ćemo raspravljati kasnije uveli su
nastavljači Comteove misli, logički pozitivisti, težeći svođenju viših razina na niže, primjerice
tumačeći društvene pojave biološkim zakonitostima ili potonje kemijskim procesima. Posebno je
zanimljiv Comteov stav spram psihologije za koju je držao da bi, s jedne strane trebala potpasti pod
biologiju, a s druge pod sociologiju, anticipirajući neke od ideja što će kasnije biti osnovom
nastanka biheviorizma, jednog od najutjecajnijih psihologijskih teorijskih sustava u povijesti.
Početkom dvadesetog stoljeća skupina filozofa i znanstvenika pod vodstvom Moritza Schlicka
nazvana "Bečkim krugom" pokreće tzv. logički pozitivizam, držeći se doktrine da su sve tvrdnje
neprovjerljive osjetilima, izuzev onih koja se dadu dokazati matematikom ili logikom, bez značenja
i važnosti. Tak prema jednom od najpoznatijih pripadnika Bečkog kruga, Rudolfu Carnapu (1966)
stav ima teorijsko značenje tek po mogućnosti provjeravanja. Lišene mogućnosti zamjedbene
provjere, ideje i pretpostavke su znanstveno bezvrijedne. Njima se bavi meta fizika. Tako su zamisli
o biti, počelu svijeta, supstanciji ili apsolutu predmet izučavanja filozofije. U znanstvenom pogledu
takvi stavovi nisu ni istiniti ni neistiniti već jednostavno ne provjerljivi. Nastojeći dokazati
neplodnost i nepotrebnost meta fizičke spoznaje, pozitivisti su tvrdili kako je ono za čime ona teži
već odavna na mnogo uspješniji način postignuto putem umjetnosti, osobito pjesništvom i glazbom.
Bečki se krug također suprotstavio filozofskoj praksi onoga vremena da kroz pitanje "Zašto?" traga
za metafizičkim uzrocima odgovornima za određene pojave. Umjesto pitanja "Zašto?", potrebno je
pitati "Kako?" odnosno pokušati opisati i protumačiti pojave putem uspostavljenih zakona, držali su
pozitivisti. Takvo stajalište valja sagledati iz povijesne perspektive (Carnap, 1966), jer je ondašnja
filozofska tradicija, uvelike se naslanjajući na idealiste poput Fichtea, Schellinga i Hegela,
odbacivala puko opisivanje kao nedostatno nastojeći potragom za metafizičkim uzrocima doći do
dubljeg razumijevanja zbilje. Na protiv, pozitivisti su bi1i uvjerenja kako empirijski zakoni
predstavljaju konačne granice spoznaje izvan kojih se ne mogu niti trebaju tražiti dodatni odgovori.
4
6
5
Ivo V.
Na temelju upravo iznesenih činjenica moglo bi se pomisliti da znanost i filozofija nemaju dodirnih
točaka. To, međutim, uopće nije točno. Premda je pozitivizam5 osnovna doktrinarna podloga
znanosti, povijest je pokazala da je često upravo odustajanje od strogog pozitivizma vodilo
najvećim znanstvenim dostignućima. Zapravo ekstremni pozitivizam se sve više odbacuje kao nešto
što je bilo neizbježno u ranom stadiju znanosti, ali je zbog naglašene ateoretičnosti, osobito u polju
društvenih disciplina, dovodio do neželjenih posljedica i spoznajnog zastoja. Postavke pozitivizma
relativizirane su post-pozitivizmom, čije ćemo zagovornike, poput filozofa Poppera i Kuhna ili
psihologa Cambella često spominjati u nastavku. Najkraće rečeno, post-pozitivizam je vratio
važnost i značenje teorijskim pojmovima koji nisu izravno izvedivi iz iskustva, uočavajući kako je
odricanje od njih prepreka, a ne prečica prema spoznaji. Odnos filozofije i znanosti najbolje je
pojmiti kao lanac, ilustraciju kakvom se poslužio Frank (1974), koji povezuje osjetilno opažanje s
čisto razumskim razmišljanjem. U sredini se nalazi znanost koja posreduje između "zbrkanih"
pojava zbilje i "razumljivih" općih načela.
1.2.2 ZNANOST, PSEUDO-ZNANOST I ZDRAVORAZUMSKO RAZMIŠLJANJE
Svako bavljenje pitanjima dostupnima iskustvu ne može se nazvati znanošću. Uzmimo za primjer
proučavanje ljudskog ponašanja. Osim psihologije i nekih srodnih disciplina njime se također bave
astrologija i hiromantija (čitanje iz dlana). Prva nastoji uspostaviti vezu između položaja planeta u
trenutku rođenja, osobina ličnosti i kasnijeg životnog puta pojedinca, dok druga isto nastoji
predvidjeti na temelju izbrazdanosti dlana. Premda je predmet izučavanja jedne i druge podudaran s
predmetom izučavanja psihologije, nitko ne smatra da se radi o znanostima. Razlog njihova
odbacivanja kao znanstvenih disciplina leži upravo u metodologiji na kojoj počivaju. Može se stoga
zaključiti kako znanost nije toliko određena samim sadržajima koji čine predmet njezina izučavanja,
već ponajprije metodologijom što je koristi. Znanstvena metodologija je sustav pravila i postupaka
na temelju kojih se obavljaju istraživanja i u skladu s kojima se provjeravaju izvodi različitih
teorija. Sustav nije konačan ni nepogrešiv, na protiv, znanstvena metodologija se neprekidno
usavršava i napreduje.
Razgraničavanje znanosti od pseudo-znanosti počiva na još jednom bitno, načelu koje je uveo
Popper (1959), a odnosi se na mogućnost odbacivanja ili opovrgavanja neke teorije. Prema Popperu
znanstvenost teorije ogleda se u jasnim predviđanjima što iz nje proizlaze, a mogu biti potvrđena,
ali i opovrgnuta. To znači da svaka prava znanstvena teorija može biti opovrgnuta empirijskim
nalazima. Donekle paradoksalno, teorija postaje znanstvena ne onda kada ju je moguće potvrditi,
već onda kada ju je moguće opovrgnuti. Kao primjere ne-znanstvenih teorija Popper navodi
marksističku teoriju i psihoanalizu. Brojni su sljedbenici Marxovu teoriju, usprkos u njoj sadržanim
predviđanjima, učinili neoborivom, čime su je ujedno lišili 6 znanstvenog statusa. Psihoanaliza je
otpočetka bila neprovjerljiva. Premda sadrži niz vrlo pronicljivih, uvjerljivih i potencijalno važnih
pretpostavki o razvoju ličnosti, psihičkim procesima i ponašanju, ona to čini, kako kaže Popper, na
"mitski način". Činjenica da je svako ponašanje lako uklopivo i objašnjivo psihoanalitičkom
teorijom prednost je koliko i slabost, jcr na taj način izvodi teorije nisu provjerljivi, što je, prema
Poperovu načelu, čini neznanstvenom.
Poznati britanski psiholog Eysenck (1953) na sličan je način odijelio znanstvenu od neznanstvene
psihologije. Koristeći se razgraničenjem što su ga načinili njemački filozofi kako bi napravili
razliku između psihologije koja razumije (verstehende) i one koja objašnjava (erklarende), u prvu je
ubrojio psihoanalizu i različite srodne terapijske pristupe a u drugu znanstvenu psihologiju
Psihologija zdravog razuma (još naziva na popularnom psihologijom ili psihologijom
svakodnevice), čiji je produžetak i psihoanaliza, ima dugu prošlost u vremenu u kojem je ljudima
služila kao pomagalo spoznavanja drugih. Zagovornici psihologije razumijevanja, često puta sa
zapanjujućom pronicavošću uspijevaju shvatiti čovjekove motive, ponašanje i razloge djelovanja.
Svoje znanje crpu iz vlastitih zapažanja, literature, filozofije ili introspekcije. No bjelodane "istine"
kojima ih vodi vlastito razmišljanje često su puta, premda zavodljive i logički neoborive, zapravo,
znanstveno gledano, poluistine ili čak posve netočne spoznaje.
5
7
6
8
6
Ivo V.
Dosad smo samo načeli problem razgraničavanja znanosti od ne-znanosti. Ipak srž problema još
uvijek nismo dotakli. Dugo prije pojave moderne civilizacije i znanosti kakvu danas poznajemo,
ljudi su prikupljali znanja o okolini što ih je okruživala. Bez posebne poduke iz znanstvene
metodologije, oni su upoznavali svijet, stječući spoznaje nužne za preživljavanje. Ako takvo krhko
zdravorazumsko razmišljanje može priskrbiti toliku korist, što nam donosi znanost? U čemu se
bitnom razlikuju neznanstveni i znanstveni pogled na svijet? Potonji nastoji objasniti ljudsko
ponašanje i razumjeti ga u kontekstu općevažećih zakonitosti, a ne samo konkretne situacije. Valja
lučiti jedno razumijevanje od drugoga. Stvarno razumijevanje uključuje poznavanje uzroka neke
pojave te omogućuje predviđanje njezina pojavljivanja u budućnosti. Laički shvaćeno,
razumijevanje je obično samo tumačenje specifičnog slučaja ili situacije, bez nalaženja općevažećih
zakonitosti i mogućnosti budućeg predviđanja događanja. Znanost, naprotiv, nastoji istražiti pod
kojim se točno uvjetima javlja neka pojava kako bi mogla formulirati pronađenu pravilnost u obliku
općeg zakona.
Sustav zakona i teorija što ga uspostavlja znanost počiva na provjerljivim pretpostavkama,
dostupnima opažanju. Neznanstvena opažanja i zdravorazumsko razmišljanje korisni su u
svakodnevnom životu, kazuju nam na koga se možemo osloniti, a tko će nas vjerojatno iznevjeriti u
nevolji, kome možemo posuditi novac i tko nam je sklon. Općeniti zaključci izvedeni na taj način
također mogu biti ispravni, no7 njihova je vrijednost u znanstvenom smislu ništavna dok ih ne
potvrde empirijski nalazi prikupljeni znanstveno prihvaćenom metodologijom. Teško da bi itko
koristeći se zdravorazumskim razmišljanjem shvatio kako se Zemlja okreće oko Sunca a ne
obrnuto. Slični primjeri postoje i u psihologiji. Za razliku od laičkih opservacija koje su uvijek
uvjerljive i prirodne, znanstveni nalazi su često naoko apsurdni. Što biste, primjerice, odgovorili
nekome tko bi vas pitao kad će vam netko vjerojatnije priskočiti u pomoć, kad je posve sam, ili kad
se oko vas nalazi čitavo mnoštvo ljudi? Vjerojatno biste, kao i većina osoba koje razmišljaju
zdravorazumski, bili uvjereni ka ko će vam u nazočnosti mnoštva spremnije priskočiti u pomoć
negoli kad se nađete u nevolji pred nepoznatim pojedincem. Istraživanja su, međutim, pokazala
posve suprotno.
Zgranuti ponašanjem brojnih slučajnih promatrača koji su gotovo ravnodušno popratili silovanje i
ubojstvo djevojke Kitty Genovese, američki psiholozi Latane i Darley (1970) su počeli proučavati
utjecaj broja nazočnih na spremnost priskakanja u pomoć u takvim kritičnim situacijama.
Eksperimentalno su pokazali kako je prisutnost većeg broja osoba zapravo smanjilo spremnost na
pomaganje u izuzetnim situacijama. Nastavljajući s istraživanjima zaključili su da brojnost
nazočnih smanjuje vjerojatnost intervencije iz tri razloga: U mnoštvu ljudi svaki pojedinačno ima
manju vjerojatnost uočavanja zbivanja. Ako ga i opazi, manje je vjerojatno da će ga protumačiti
kao kritičnu situaciju, a isto tako će rjeđe sam preuzeti odgovornost za poduzimanje odgovarajuće
akcije. U takvim se okolnostima, smatraju autori, javlja podjela odnosno difuzija odgovornosti
među nazočnima, tako da se svaki pojedinačni svjedok zbivanja osjeća manje odgovornim za
pomaganje nego što bi to bio u slučaju da je sam.
Laička i znanstvena psihologija mogu se ponekad složiti, ali se razilaze kad su u pitanju ponašanja
koja nisu očekivana ni sama po sebi razumljiva. Uobičajena razlika što je uočavamo između laičke i
znanstvene psihologije sastoji se u zadovoljenju prve s objašnjenjem koje upravo udovoljava
trenutnoj znatiželji i specifičnoj situaciji, odnosno potrebi potonje da sistematizacijom činjenica
nadmaši takvo, očito objašnjenje i zajamči ono koje odgovara ne samo ovoj, već i nizu drugih
srodnih situacija. Nadalje, zdravorazumska psihologija ima potrebu objašnjavati samo neuobičajena
ponašanja, dok znanost s podjednakim interesom proučava svakidašnja i nesvakidašnja zbivanja, ne
smatrajući da su i jedna i druga, sama po sebi razumljivima.
Nastojeći objasniti razliku između znanstvenog i neznanstvenog pristupa znanju neki su autori
sistematizirali njihova temeljna svojstva (tablica 1.1).
Temeljno svojstvo neznanstvenog pristupa je, kako smo i ranije pokazali posezanje za prosudbama
koje su, doduše, uvjerljive i bliske svakodnevnom razmišljanju, ali zapravo nisu empirijski
7
9
7
Ivo V.
provjerene. Malo tko bi pomislio da nečija 8 uvjerenja mogu biti odraz ponašanja a ne obrnuto.
Takav zaključak nije logičan ni blizak svakodnevnom razmišljanju.
Ipak, Leon Festinger (1957) je pokazao da su stavovi često uvjetovani ponašanjem. Prema
Festingeru, osobi je psihološki nelagodno pri istodobnom posjedovanju dvaju suprotstavljenih
stavova ili uvjerenja. Isti mehanizam je na djelu kad se sučeljavaju stavovi što ih zastupamo i neko
njima protivno ponašanje. U poznatom eksperimentu Festingera i Carlsmitha (1959) studenti su
uključeni u dosadan eksperiment nakon kojeg je jednima od njih ponuđena "mršava" nagrada od
jednog dolara, a drugima obilnija u iznosit od 20 dolara kako bi druge studente uvjeravali da su
uživali u zanimljivom pokusu. U slabije nagrađenih studenata razvila se disonanca jer su
sudjelovali u dosadnom pokusu i istodobno vlastite kolege uvjeravali u njegovu zanimljivost. Za
razliku od dobro plaćenih kolega svoje laganje nisu mogli opravdati novcem, te su, sukladno
Festingerovim pretpostavkama, promijenili vlastito mišljenje o pokusu. Drugim riječima, da bi
opravdali vlastitu priču o zanimljivosti eksperimenta, studenti su promijenili svoje mišljenje o
njemu i uistinu prihvatili stajalište da je bio (donekle) zanimljiv.
Vidimo stoga da je znanost u ovom slučaju izokrenula zdravom razumu blizak zaključak: "Mislimo
da je eksperiment zanimljiv pa stoga tako govorimo drugima" u:9
"Govorimo drugima da se radi o zanimljivom eksperimentu pa stoga i vlastito mišljenje mijenjamo
u tom smjeru."
Razlike u postupcima što ih koristi znanost kako bi došla do spoznaja u odnosu na neznanstveni
pristup još su izrazitije. Opažanje nam često može pružiti vrijedne podatke o ponašanju, ali ne bilo
kakvo opažanje. U svakom trenutku na nas utječe niz čimbenika koji ugrožavaju objektivnost i
priječe nepristrane zaključke. Bez njihove kontrole, opažanje će pružiti tek osobno, subjektivno
viđenje neke pojave. Opazimo li čovjeka kako leži na cesti, možemo pomisliti kako mu je pozlilo i
priteći mu u pomoć. Ako se radi o nemarno odjevenoj i zapuštenoj osobi, uz koju se nalazi otvorena
boca alkoholnog pića, vjerojatno ćemo pomisliti kako se radi o uličnom pijanstvu. Opažanje u
znanosti uzdržava se donošenja ishitrenih zaključaka i nastoji samo vjerno zabilježiti pojavu. Kad
govorimo o preciznosti i točnosti opažanja, svakodnevno se opažanje nikako ne može mjeriti sa
znanstvenim. Pokušajte se, primjerice, sjetiti kako je bila obučena osoba s kojom ste posljednjom
8
10
9
11
8
Ivo V.
razgovarali ili kakvu je boju očiju imala. Većina od nas takve stvari i ne zapaža. U opažanjima smo
nehajni što je čest izvor netočnosti i iskrivljavanja.
Izvještavanje o nekom ponašanju ili zbivanju također je podložno subjektivizmu. U to se i sami
možemo lako uvjeriti pročitamo li izvještaje različitih izvještača s iste nogometne utakmice. Laici
naime često nadograđuju ono što je objektivno zabilježeno vlastitom interpretacijom. Ako gledajući
film u jednom kadru opazimo na podu koru od banane, a odmah potom, nakon isječenog kadra,
čovjeka koji leži na podu, razumno ćemo zaključiti kako je u taj položaj dospio poskliznuvši se na
koru od banane. No, ne bilježeći upravo i isključivo ono što smo opazili, dolazimo u opasnost da
iskrivimo činjenice. Opazimo li čovjeka koji sjedi s glavom zagnjurenom u ruke, možemo zaključiti
da je umoran, potišten, bolestan, pijan ili zabrinut. Radi li se, međutim, o znanstvenom opažanju,
ostat ćemo samo pri opisu njegova fizičkog položaja i izostaviti bilo kakvo tumačenje. Znanstvenici
pri izvještavanju nastoje odvajati činjenice (ono što je opaženo) od vlastitog tumačenja. Najbolji
način da se provjeri znanstvena objektivnost je usporedba izvještaja više nezavisnih opažača.
Definicije pojmova u svakodnevnom govoru i znanosti bitno se razlikuju. U razgovoru s
prijateljima ili znancima pojmovi se često, a da toga nismo svjesni, koriste u neodređenom
značenju, što naoko nije prepreka u međusobnom razumijevanju. Uzmimo za primjer pojam
depresivnosti. Svi znaju kako je riječ o stanju potištenosti i lošeg raspoloženja. No za znanost to je
ipak preširoko te stoga nedovoljno precizno određenje. Kako bi iz znanstvenih pojmova izbacili
suvišak značenja i uklonili postojeće nejasnoće, znanstvenici pribjegavaju operacionalnim
definicijama. Za takvu vrstu objektivizma prvi se založio američki fizičar, dobitnik Nobelove
nagrade, Bridgman (1927), s ciljem da sadržaj znanstvenih pojmova utemelji na opaženim
činjenicama i operacijama opažanja i mjerenja. U takvim je definicijama, naime,10 sadržaj
znanstvenog pojma posve određen nizom operacija. Pri nastajanju biheviorizma to je bio način da
se iz znanosti izbace metafizički i spekulativni pojmovi opterećeni pridodanim hipotetičkim
značenjem. Depresivnost bismo, primjerice, operacionalno mogli definirati kao rezultat na nekoj
ljestvici depresivnosti, primjerice Beckovoj, ili nekom drugom sličnom psihometrijskom
instrumentu. Operacionalizmu, kao iznimno važnom pokretu unutar psihologije i znanosti uopće
vratit ćemo se kako bismo dodatno podcrtali njegovu ulogu u izgradnji teorije i oblikovanju
konstrukata.
Mjerni instrumenti i sam postupak mjerenja neobično su važni u psihologiji. Dok su u svakodnevici
obično oslanjamo na vlastitu prosudbu i sebe kao mjerni instrument pri procjeni nečijeg ponašanja,
u znanstvenoj psihologiji taj se posao odvija pomoću brojnih standardiziranih psihometrijskih
instrumenata. O njima ovisi preciznost i valjanost naše procjene. U velikom se broju slučajeva
pokazalo kako je prosječan čovjek razmjerno loš i nepouzdan procjenjivač, pogotovo ako za to
prethodno nije uvježban. Testovi, upitnici i objektivne mjere ponašanja samo su neki od mjernih
instrumenata što ih koristi psihologija. Da bi mjerenje ponašanja bilo uspješno, instrumenti moraju
imati zadovoljavajuća metrijska svojstva, ponajprije valjanost i pouzdanost, s kojima ćemo se
upoznati kasnije.
Zaključci prosječna čovjeka su, poput opažanja i prosudbi, također podložni subjektivizmu,
odnosno samo donekle počivaju na dostupnim činjenicama. U svakodnevnom se životu usto ne
služimo zaključivanjem koje se temelji na strogim logičkim načelima te je skliznuće u grešku tim
vjerojatnije. Najčešće se ipak dešava da do greške dođe zbog neprimjerenog korištenja induktivne
metode zaključivanja. Kako ćemo vidjeti, znanost je svjesna nedostataka indukcije (zaključivanja
od pojedinačnog k općem) te takvu slabost nastoji nadomjestiti uključivanjem velikog broja
pojedinačnih opažanja u istraživanje. Naprotiv, u laika su česta pretjerana uopćavanja jer se na
temelju svega nekoliko opažanja donose univerzalni zaključci. Tako ćemo možda zaključiti da su
svi mesari ne pošteni zbog nekoliko slučajeva u kojima je izvagano meso što smo ga kupili težilo
manje od deklariranog, ili ćemo pak tvrditi da su umjetnici malo "uvrnuti" ako se to može reći za
našeg susjeda koji svira violinu.
10
12
9
Ivo V.
Posljednja, ali nipošto ne i najmanje važna, odlika znanstvenog pristupa o kojoj ćemo govorili, jest
skeptičnost. Znanstvenici su svjesni sve složenosti ponašanja, kao i brojnosti čimbenika koji ga
oblikuju. Njihovo otkrivanje često je vrlo težak zadatak. Otuda redovita znanstvena sumnja prema
svakom novom nalazu ili "čudotvornom" otkriću. Objašnjenja što se nude često su prenagljena jer
ne uzimaju u obzir sve činjenice. Znanstvenici su zbog toga spram njih vrlo oprezni. Naprotiv, laici
su skloni prihvatiti različita objašnjenja, često bez ikakve sumnjičavosti i kritičnosti. Ponajbolji 11
dokaz tome su redovita prelistavanja dnevnih i tjednih horoskopa što se nalaze u tisku, bez obzira
na sve pokazatelje njihove problematične vrijednosti.
1.3 ULOGA ZNANSTVENE METODOLOGIJE

Valja odmah ponoviti da pojam metodologije nije, ako se uobičajeno smatra, istovjetan zbirnom
pojmu metoda. To znači da metodologiju ne čine zajedno uzete metode eksperimentiranja,
opažanja, korelacijskog istraživanja i drugih, već ponajprije njihova logička osnova, ili kako drži
Kaplan (1964), opis, objašnjenje i opravdanje metoda, ne one same. Metodologija je kostur
znanosti, ona obuhvaća sustav pravila na temelju kojih se provode istraživački-postupci, izgrađuju
teorije i obavlja njihova provjera. Empirijska građa što je prikupljamo vrijedna je samo ako smo do
nje došli slijedeći metodologijom zacrtane, odnosno znanstveno prihvaćene postupke. Svaki drugi
način dolaženja do podataka znanstveno je bezvrijedan. Međutim, metodologija nije samo to, ona je
i mnogo više od putokaza koji upućuje na to kako prikupljati podatke. Cilj metodologije je opis i
analiza temeljnih metoda što se koriste u različitim znanstvenim disciplinama, upoznavanje s
njihovim prednostima i ograničenjima, pretpostavkama na kojima počivaju i mogućim ishodima
njihove uporabe, najširem smislu, metodologija nam pomaže da shvatimo, ne produkte znanstvenog
istraživanja već postupke dolaženja do njih. Različite znanosti uvelike se razlikuju prema predmetu
svog bavljenja i podacima kojima raspolažu, ali su nerijetko vrlo bliske s obzirom na instrumentarij
i pojmovni aparat kojim dolaze do spoznaja. Ako ćemo stoga tražiti poveznice različitih
znanstvenih disciplina, najčvršća od njih bit će upravo zajednička metodologija.
Pojam metodologije bliski su pojmovi poput epistemologije, metode i tehnike s kojima se ona
katkad neopravdano poistovjećuje. Prvi je povezuje s filozofijom znanosti i načinom na koji se
prema njoj odnose filozofi, dok druga dva predstavljaju njezin odraz na nižoj razini i
operacionalizaciju metodološkog promišljanja u sklopu konkretnih problema pojedine znanstvene
discipline. Epistemologija je filozofska disciplina zaokupljena znanjem i spoznajom, a bavi se,
krajnje pojednostavljeno, temeljnim pitanjima koja mogu biti postavljena u potrazi za istinom. U
prošlosti je temeljni epistemološki problem bilo pitanje izvora spoznaje, odnosno dolazimo li do
znanja iskustvom (empirizam) ili putem urođenih ideja koje zahvaćamo promišljanjem
(racionalizam). Kad govorimo o znanosti, epistemologija okuplja sva bitna problemska područja
filozofije znanosti, poput, primjerice, pitanja determinizma ili neodređenosti svijeta oko nas,
mogućnostima spoznaje na temelju induktivnog zaključivanja, preduvjetima za uspostavljanje
uzročnosti i mnogim drugima. Metode su opći pristupi u provedbi istraživanja i čine široki okvir
unutar kojeg se mogu smjestiti tehnike kao osobiti načini primjene svake od njih. Tako, primjerice,
metoda eksperimenta12 okuplja tehnike poput nacrta ponovljenih mjerenja ili grupnog nacrta,
metoda ankete obuhvaća telefonsko, poštansko i usmeno obraćanje, dok metodi opažanja pripadaju
tehnike poput sudioničkog ili strukturiranog promatranja.
1.4 TEMELJNE PRETPOSTAVKE ZNANOSTI

Znanstveni pristup utemeljen na pozitivističkoj paradigmi počiva na određenim pretpostavkama
koje se provjeravaju. One su nužan preduvjet svakog znanstvenog pregnuća, a same po sebi dio su
epistemologije, ranije spomenute grane filozofije koja se bavi mogućnostima ljudske spoznaje.
Svako bavljenje znanošću podrazumijeva usvajanje načela što ćemo ih navesti, premda ih često puta
ni sami znanstvenici nisu svjesni.
Pozitivizmu je svojstveno uvjerene o postojanju spoznatljive zbilje upravljane nepromjenjivim
prirodnim zakonima. Znanost se, sukladno pozitivističkom učenju, treba baviti otkrivanjem takvih
11
13
12
14
10
Ivo V.
zakona koji su dio objektivne stvarnosti, a ne subjektivna projekcija našeg mentalnog aparata.
Sukladno osnovnim postavkama, pozitivističko se gledište može razložiti na nekoliko temeljnih
načela.
1. Prirodom vlada red
U gornjoj je tvrdnji sadržana osnovna pretpostavka znanstvenog rada. Bez prepoznatljive
pravilnosti i reda u prirodi ne bismo mogli spoznavati svijet. Zbivanja bi se u njemu odvijala posve
slučajno i kaotično, tako da posebne događaje ne bismo mogli podvoditi pod opća načela pa tako ni
predviđati što će se ubuduće dešavati. Čak i u sredini podložnoj izrazitim promjenama očekujemo
stanoviti red ili pak pravilo prema kojem se odvijaju promjene. Pri tome prirodu ne poistovjećujemo
s nadnaravnim silama ili bićima već kako smo ranije naglasili, s pojavama dostupnima iskustvenoj
spoznaji. Primijenjene na psihologiju, načelo bi upućivalo na pretpostavljene zakonitosti koje
vladaju ljudskim ponašanjem.
2. Priroda je spoznatljiva
Tvrdnja o mogućnosti spoznavanja prirode podjednako je neprovjerljiva kao i ona o prirodnom
redu, ali i podjednako nužna za znanost. Kad bi se pokazalo da je priroda nespoznatljiva, znanost bi
svakako bila izlišna. S pomoću nje, naime, u tom slučaju ne bismo mogli predviđati buduće
događaje ni ljudsko ponašanje ništa uspješnije nego nasumičnim pogađanjem. U gornjoj tvrdnji
sadržana je također i pretpostavka o dualnosti istraživača i istraživane pojave. Radi se o zasebnim
entitetima koji tijekom istraživanja ne utječu jedan na drugoga.
3. Znanje je nadmoćno neznanju
Prednost znanja nad neznanjem ono je što daje poticaj cjelokupnoj znanosti. Uvjerenje da je znanje
nadmoćno neznanju nije odraz isključivo ljudske znatiželje, već 13 često i praktične koristi što ju
znanost donosi. Ipak, tvrdnju valja relativizirati. Znanost ne poznaje vječne istine, već samo
trenutno važeće spoznaje koje se, već idućem provjerom, mogu produbiti, preraditi ili posve
odbaciti. Znanje je, u tom smislu, tek manji stupanj neznanja.
4. Sve prirodne pojave imaju prirodne uzroke
Suprotno religiji i misticizmu, znanost počiva na uvjerenju kako svijetom upravljaju prirodni
zakoni, a ne natprirodne sile. Takvo je načelo nužno i nezamjenjivo jer obavlja dvojaku zadaću:
upravlja znanost prema upoznavanju prirodnih zakona i sprečava unošenje nadnaravnih te time i
neprovjerljivih elemenata u teorije. Posve je razumljivo da bi sc pozivanjem u pomoć natprirodnih
uzroka vrlo lako dala objasniti svaka pojava, no to nas ne bi nimalo približilo mogućnosti njihova
predviđanja u budućnosti.
5. Ništa nije samo po sebi razumljivo
Među laicima se često susreće uvjerenje kako je nešto samo po sebi razumljivo. Iskustvo uči da će
predmet bačen u zrak pasti natrag na zemlju, kao i to da ćemo bolje upamtiti nove sadržaje koji su
nam bliski od onih koje slabije poznajemo. Za većinu, ove su pojave samorazumljive, unatoč
činjenici da tek rijetki znaju zašto cio njih dolazi. U znanosti ne postoji ništa što je razumljivo samo
po sebi, svaka pretpostavka mora biti objektivno dokazana. Sve što se tradicionalno ili na temelju
zdravoga razuma drži samorazumljivim istina ma, u znanosti je tek pretpostavka podložna provjeri.
Znanosti se zbog toga pripisuje kritičnost i sumnjičavost.
6. Znanje se usvaja iskustvom

Ako od znanja očekujemo razumijevanje i objašnjavanje stvarnog svijeta, ona mora biti iskustvena
(empirijska), odnosno počivati na osjetilima. Takva je pretpostavka ujedno odgovor na uvjerenje
kako je znanje uređeno čovjeku ili da je čisto promišljanje dovoljno za spoznavanje svijeta. Kako
13
15
11
Ivo V.
smo ranije napomenuli, proučavane pojave moraju biti dostupne iskustvu jer ih drugačije nije
moguće znanstveno provjeriti.
U novije vrijeme u društvenim znanostima javljaju se i pravci koji, odbacujući pretpostavke što ih je
nametnuo pozitivizam, tragaju za razumijevanjem onog što zovu subjektivnom zbiljom. Takve
kvalitativne istraživačke metode koje ne priznaju postojanje "objektivne" stvarnosti i sveobuhvatnih
zakona, bit će opisane na samome kraju našeg bavljenja metodologijom, ali već na ovom mjestu
valja bili svjestan njihova postojanja. Za upravo iznesene tvrdnje o znanosti ne može se reći da su
općeprihvaćene, ali su nedvojbeno izrazito prevladavajuće jer je većina znanstvenika sklona
prihvatiti post-pozitivističko gledanje na svijet. Bilo bi ipak nedopustivo ostaviti raspravu bez
kritičkih osvrta na znanost, koji, u novije vrijeme, potječu uglavnom iz post-modernističke
perspektive, što okuplja pravce poput konstruktivizma, dekonstruktivizma, posr-strukturalizma,
feminizma i sličnih. U biti, post-modernizam i14 njemu srodna gledišta odražavaju sumnju u
postojanje objektivne stvarnosti i mogućnost univerzalnih teorija i objašnjenja što ih nudi znanost
(Kvale, 1992). Nema podatka u znanosti, drže post-pozitivisti, koji predstavlja čist odraz stvarnosti,
svi su u nekoj mjeri prožeti polaznom teorijom, pa se otuda izvodi zaključak da je stvarnost što je
nudi znanost zapravo samo društvena ili jezična konstrukcija. Jezik, smatraju, ne preslikava, već
proizvodi posve novu zbilju. Dovedene do krajnosti takve postavke navode neke (Gergen i Kaye,
1992) da zaključe kako je znanost samo jedan od mnogih žanrova literature u kojem vladaju lokalne
zakonitosti, pa prema tome ne nudi ništa točniju sliku zbilje od fikcijskog štiva. Relativizam,
štoviše, ne pravi nikakvu razliku između objektivno provjeriva znanja i praznovjerja. Iako
spomenute tvrdnje upozoravaju na neke od istinskih problema prisutnih u znanosti, one su ipak
prenaglašene i većim dijelom krajnje problematične. Kako riješiti problem znanstvenika koji
svjesno ili nesvjesno polazi od neke teorije, što prema post-rnodernistima predstavlja početnu
pristranost? Najbolju obranu znanstvene metode ponudio je Popper (1994) priznajući da
znanstvenik pojedinac možda i nije objektivan, da je sklon nekim teorijama više nego drugima te da
njegovi nalazi mogu biti artefakti uzrokovani očekivanjima, ali sam znanstveni proces, koji
uključuje mnoštvo znanstvenika, jest objektivan jer se spram nalaza odnosi kritički, provjerava ih i
odbacuje u slučaju neodrživosti. Prigovor da je znanost velikim dijelom društveno uvjetovana nije
bez osnove, jer se li povijesti mnogo puta pokazalo da su ideologijski, religijski i politički interesi
stavljeni iznad znanstvenih, što je dovelo do (privremenog) odbacivanja otkrića poput Kopernikova,
Galileova ili Darwinova. Takve su intervencije, međutim, redovito bile kratkoga daha, te je i
primjedba o potpunoj isprepletenosti znanstvene misli i društvenog konteksta pretjerana i
neprimjerena.
1.5 CILJEVI ZNANOSTI

Konačni cilj znanosti nedvojbeno je prikupljanje znanja odnosno spoznavanje svijeta kako bi se nad
njime, osobito ad pojavama od važnosti za ljudsku egzistenciju, uspostavio nadzor Ciljevi kojima
neposredno teži su opisivanje, predviđanje i razumijevanje.
1.5.1 OPISIVANJE
Opisivanjem nazivamo postupke kojima različite pojave definiramo, utvrđujemo njihova svojstva
razvrstavamo ih i opisujemo. Logički, opisivanje je uvijek prvi korak u znanstvenom proučavanju
nekog problema. Svaki pokušaj dubljeg razumijevanja pojave počiva ponajprije na njezinu
podrobnom opisu. Tek pošto smo u stanju opisati ono čime se bavimo, možemo se, naime
pozabaviti problemom zašto i15 zbog čega o toga dolazi. Znanstveno s opisivanje u psihologiji
obično odvija se dvojakom svrhom:
(a) klasifikacije različitih pojava ili objekata (taksonomije) i
(b) njihove analize (u slučaju psihologije radi se o opisu i analizi ponašanja) koja bi trebala uputiti
na moguće uzročno-posljedične veze.
14
16
15
17
12
Ivo V.
U potonjem slučaju upućivanje na uzročno-posljedičnu vezu valja jasno razlikovati od njezina
dokazivanja. Opisivanje može u tom smislu biti tek temelj postavljanja razložnih pretpostavki o
međuodnosu istraživanih pojava.
Posve je razumljivo da se pojave u svijetu što nas okružuje mogu razvrstati na tisuće načina,
slijedeći vrlo različita načela razdiobe. Zbog toga je svaka podjela, ma kako se prirodnom činila,
donekle proizvoljna. Ipak, znanost pri klasifikaciji slijedi jasna načela. Najvažnije je izdvojiti ona
obilježja proučavanih pojava (pojedinaca, ponašanja, situacija) koja će biti najkorisnija u
spoznavanju njihove istinske prirode. Na važnost razvrstavanja u znanosti vrlo slikovito
upozoravaju američki filozofi znanosti Cohen i Nagel (1934), suprotstavljajući staru klasifikaciju
organizama na ribe koje žive u vodi, ptice u zraku i životinje koje obitavaju na zemlji kasnije
općeprihvaćenoj taksonomiji u kojoj se takva podjela odbacuje. Znanost pokazuje da sisavci poput
kita ili dupina imaju mnogo više zajedničkih obilježja s psom ili medvjedom negoli sa sardinom ili
skušom. Značajna zajednička obilježja u ovom su slučaju dojenje mladunčadi u odnosu na
polaganje jajašaca koja bi trebala biti oplođena i oba upućuju na razlike mnogo važnije za
razumijevanje njihove prirode od medija u kojem žive.
Primjer klasifikacijskog opisivanja nalazimo u priručniku Američkog psihijatrijskog udruženja
DSM-IV (APA, 1994), koji sadrži podrobne opise svake dijagnostičke kategorije. Takav opis,
dobiven na temelju brojnih studija opažanja, služi kliničarima u praksi za lakšu i objektivniju
kategorizaciju poremećaja s kojima se susreću. Tako se, primjerice, paranoidna shizofrenija
određuje pomoću sljedećih načela,
A. zaokupljenosti jednom ili većim brojem deluzija ili učestalim slušnim halucinacijama i
B. nijedno od sljedećeg ne smije biti naglašeno: nepovezan govor, nepovezano i katatono ponašanje
i prazan ili neprimjeren afekt.
Primjer taksonomije također su i različiti modeli ličnosti koji se bave problemom dimenzionalnosti,
odnosno brojem temeljnih osobina kojima se ovaj široki psihologijski konstrukt dade sažeti. U
novije vrijeme psihologijom "vlada" peterodimenzionalni model koji sveukupnost ponašanja tumači
osobinama ekstraverzijom, emocionalnom stabilnošću, savjesnošću, ugodnošću i kulturom (Hogan i
sur., 1997)
Dobar primjer opisivanja u psihologiji jesu, i Piagetovi stupnjevi kognitivnog razvoja (Papalia i
Olds, 1992) do kojih je došao spajanjem različitih istraživačkih metoda, opažanjem, razgovorom i
eksperimentima. Piaget je u svojim radovima opisao kvalitativno različite stupnjeve kognitivnog
razvoja svojstvene djeci od dojenačke do adolescentne dobi. Pri tom razlikuje faze senzomotoričke
inteligencije, predoperacijsku16 fazu, stupanj konkretnih operacija i stupanj formalnih operacija.
Svaka od njih ovisana je do u potankosti, pa se, primjerice, za stupanj konkretnih operacija, koji
nastupa od djetetove 5. do 7. godine, navodi kako dijete u njemu postaje sposobno za korištenje
simbola i logičko mišljenje, manje je egocentrično, tako da problem može sagledati iz različitih
kuteva, no mišljenje im je još uvijek čvrsto usidreno u dimenziji "ovdje i sada".
Početnici u psihologiji obično poistovjećuju opisivanje s kvalitativnim metodama u psihologiji,
napose kvalitativnim opažanjem i studijom slučaja. To ni približno nije točno jer se podjednako
dobar opis nekih pojava, ako ne i potpuniji i bolji, postiže različitim kvantitativnim metodama
(standardiziranim opažanjem anketiranjem, primjenom upitnika ili testova). Koristeći isključivo
kvalititivne metode, međutim, istraživač će se rijetko naći u prilici pružiti svojim nalazima nešto
više od opisa pojave koju ispituje. To ne znači da takve metode ne mogu uputiti na neke moguće
veze među pojavama i pridonijeti njihovu boljem razumijevanju, ali je izvjesno da su same za sebe
nedovoljne za više od stvaranja razumnih pretpostavki, barem kada se nastojimo izdići iz
pojedinačnog slučaja i donijeti neke općevažeće zaključke.
To svakako nisu jedini primjeri opisivanja u psihologiji. U predizbornim istraživanjima javnoga
mnijenja, primjerice, interes je istraživača saznati namjere glasanja određene populacije. Da bi došli
do takve procjene, istraživači ispitaju manji ali reprezentativan uzorak pučanstva i rezultate, uz
16
18
13
Ivo V.
određene ograde, uopće na cijeli osnovni skup. Istraživanja javnoga mnijenja stoga često puta imaju
isključivo opisni karakter. No provedena na drugi način, ona, kako ćemo ubrzo vidjeti mogu postati
oruđem podjednako i predviđanja i razumijevanja.
1.5.2 PREDVIĐANJE
Drugi cilj znanosti sadržan je u nastojanju da se predvidi neki događaj ili ponašanje. Podroban opis
pojave i poznavanje njezine povezanosti s drugim događajima redovito su dobra osnova za njegovo
ostvarenje. Mogućnost predviđanja od velike je važnosti u psihologiji. Njime se nastoji odgovoriti
na pitanja poput: Znači li veći broj bodova na razredbenom ispitu ujedno i veću vjerojatnost da
netko diplomira s boljim ocjenama? Hoće li djeca koja su odrana bila introvertirana to biti i u
odrasloj dobi? ili Hoćemo li na temelju znanja hrvatskog jezika desetogodišnjaka moći predvidjeti
njegovo znanje iz drugih predmeta? Na sva tri pitanja odgovor je potvrdan, ali, dakako, predviđanje
nije u sva tri slučaja podjednako dobro. Predviđanje ima svoju jasnu praktičnu vrijednost,
primjerice kad na temelju prethodnog testiranja zaključujemo o tome kako će neka osoba obavljati
određeni posao ili hoće li uspjeti na fakultetu, ali se u tome nipošto ne iscrpljuje. Predviđanje je
jedna od temeljnih odrednica znanosti prema kojoj se ona naglašeno razlikuje od pseudo-znanosti.
Potonje,17 naime, vrlo uspješno "tumače" zašto je do nečega došlo, ali je njihova sposobnost
predviđanja sličnih događaja u budućnosti obično vrlo skromna. Predviđanje je usto preduvjet
razumijevanja. Ustvrdimo li da razumijemo neko ponašanje i razloge njegova javljanja, moramo biti
kadri predvidjeti ga u kontekstu budućih događanja.
Jedna varijabla može se koristiti za predviđanje druge samo kada se nalaze u međusobnoj korelaciji,
To zapravo znači da su određeni rezultati jedne od njih povezani s određenim rezultatima druge.
Koeficijent korelacije je kvantitativni indeks zajedničkog variranja dviju varijabli koji može
poprimiti pozitivnu ili negativnu vrijednost. U prvome slučaju više vrijednosti 18 jedne varijable
odgovaraju višim vrijednostima druge, a u drugom, višim vrijednostima prve varijable odgovaraju
niže vrijednosti druge i obrnuto. Za predviđanje nije svejedno koliko su visoko dvije pojave
povezane. Predviđanje ponašanja na temelju neke varijable to je uspješnije što je povezanost među
njima, izražena koeficijentom korelacije, viša. Pri tome se višom korelacijom smatra ona apsolutno
veća neovisno o predznaku. Naše je predviđanje, naime, podjednako dobro bez obzira na to je li
riječ o korelaciji +0.50 ili -0.50. U istraživanju političke naklonosti, istraživači su osobito
zainteresirani za nalaženje onih osobina ili stavova na temelju kojih se može dobro predvidjeti kojoj
će se stranci birač na izborima prikloniti. Predviđa nje je u tom slučaju od prvorazredne važnosti.
Milas i Rihtar (1997) su proveli istraživanje u kojem su utvrdili korelacije između namjere
glasovanja za "lijevi", "desni" i "središnji" politički blok i iskazanih društvenih stavova. Pokazalo se
da je utjecaj ideoloških činitelja, na koje upućuju društveni stavovi, razmjerno ograničen i da se
korelacije, ovisno o uzorku, kreću između 0.25 i 0.48, što je nedovoljno za uspješnu predikciju.
Drugim riječima, čak i uz poznavanje nečijih općenitih društvenih stavova, teško ćemo moći
precizno procijeniti za koju će stranku glasovati. Neke varijable, naprotiv, toliko su povezane da
omogućuju dobro predviđanje jedne na osnovi druge. Tako se korelacija između nečije težine i
visine uobičajeno, ovisno o istraživanju, kreće između 0,70 i 0,80, što omogućuje dobru procjenu
visine uz poznavanje težine i obrnuto. Važno je napomenuti kako uspješnost predviđanja ne ovisi
uvijek o poznavanju uzroka povezanosti, odnosno o razumijevanju odnosa dviju pojava.
1.5.3 RAZUMIJEVANJE
Premda su često važni sami po sebi, opisivanje i predviđanje zapravo su samo početni koraci u
spoznavanju izučavane pojave. Najvažniji znanstveni cilj upravo je razumijevanje. Možemo reći da
smo neku pojavu razumjeli onda kad spoznamo njezine uzroke. Za izvođenje uzročno-posljedičnih
zaključaka nužan je veći broj preduvjeta, od kojih se u novije vrijeme najčešće spominju tri:19
1. međusobna povezanost (kovarijacija) pojava,
2. odgovarajući vremenski slijed (uzrok prethodi posljedici),
17
19
18
Kod govorimo o višim i nižim vrijednostima mislimo na one iznad ili ispod prosjeka.
19
20
14
Ivo V.
3. odbacivanje svih drugih mogućih i uvjerljivih objašnjenja utvrđene povezanosti među
varijablama postupcima logičke analize ili eksperimentalne kontrole.
Klasično poimanje uzročnosti sadrži još i načelo neproturječnosti, poučavajući kako se uzrok nikad
ne pojavljuje bez posljedice. Kako ćemo kasnije vidjeti, takvo načelo uglavnom nije primjenjivo u
psihologiji, a jednako tako ni u modernoj fizici kao temeljnom pokretaču filozofije znanosti jer se
obje u sve većoj mjeri priklanjaju probabilističkom određenju uz ročnosti. Izmaknemo li se iz
glavne znanstvene struje potekle iz pozitivističkog učenja, razumijevanje i uzročnost poprimaju
različita značenja. Kvalitativne istraživačke metode teže „idiografskom razumijevanju'', odnosno
razumijevanju pojedinca u njegovim specifičnim okolnostima i nastoje istražiti "lokalnu uzročnost'~
odnosno ono što pokreće ponašanje upravo tog pojedinca.
Razumijevanje je temeljni preduvjet za uspostavljanje nadzora nad nekom pojavom. Ono također
pridonosi mogućnosti predviđanja, ali tava se zadaća ponekad može postići i bez dubljeg
razumijevanja, o čemu svjedoče brojni utvrđeni zakoni u psihologiji i drugim znanostima koji još
uvijek čekaju na valjana objašnjenja. Vidjet ćemo u nastavku izlaganja koje će se baviti
znanstvenim teorijama da je razumijevanje relativno i nikad konačno i potpuno. Pojave za koje
danas tvrdimo da ih razumijemo u budućnosti mogu biti objašnjene na drugi način. To vrlo slikovito
ilustrira Popper (1973) baveći se pitanjem temeljnog cilja znanosti. Prema nekima to je "konačno
objašnjenje", odnosno objašnjenje one vrste koje ne zahtijeva daljnje objašnjenje. Popper, braneći
tezu kako se svako objašnjenje može dalje objašnjavati putem teorija ili pretpostavki višeg stupnja
općenitosti, navodi primjere iz povijesti nekoć općeprihvaćenih objašnjenja koja su odbačena kad
su se pojavila ona univerzalnija. Tako je Galileo smatrao da se bačeni predmet kreće po paraboli
osim u slučaju vertikalnog slobodnog pada. To je, međutim, zakonitost koja vrijedi u vrlo
ograničenom rasponu situacija, kad je ukupna razdaljina leta zanemariva u usporedbi sa Zemljinim
polu mjerom. Newton je pokazao da se bačeni predmet kreće po elipsi. Galileova teorija samo je
odlična aproksimacija opće Newtonove teorije u posebnim uvjetima.
1.5.4 KONTROLA
Krajnjim ciljem znanosti, pa tako i psihologije, smatra se kontrola odnosno mogućnost utjecaja na
pojave što ga istražuju. Takav utjecaj obično se nastoji postići upravljanjem okolinskih čimbenika,
ali da bi takvo što uopće bilo moguće, potrebno je poznavati uzroke pojave koju želimo kontrolirati.
Primjerice, ako su nam poznati uzroci agresivnog ponašanja, uzmimo da se radi o nesvjesnom
odobravanju okoline očitovanom u pojačanoj pozornosti, možemo na takvo ponašanje utjecati
dokidanjem izvora vanjskih nagrada odnosno informiranjem značajnih osoba o tome 20 kako bi se
trebale ubuduće ponašati (ignorirati ponašanja ili iskazivati otvoreno negativan stav). Iako stajalište
o kontroli kao krajnjem cilju znanosti danas prihvaća većina psihologa, u razdoblju kada ga je
američki psiholog Skinner (1953) po prvi put iznio, izazvao je brojna i žestoka protivljenja,
ponajprije zbog nepotpunog ili površnog tumačenja. Pojam "kontrola ponašanja" poprima u očima
kritičara brojne negativne konotacije, jer ga, prije svega, sagledavaju kroz prizmu ograničavanja
slobode pojedinca. Najvećem broju psihologa kontrola znači samo primjenu odgovarajućih znanja
stečenih znanstvenim metodama u svrhu poboljšanja kvalitete ljudskoga života. Postoje nažalost i
brojni primjeri u kojima kontrola ponašanja nije vođena idejom dobrobiti za pojedinca, no to
svakako nije dovoljan razlog da se kontrola kao temeljni cilj znanosti odbaci ili kompromitira.
Cijela psihoterapijska grana, nazvana behavior terapijom (terapijom ponašanja) sastoji se upravo u
učenju prilagođenog i odučavanju od neprilagođenih oblika ponašanja, što se postiže izvanjskom
kontrolom okoline, odnosno različitim oblicima nagrada i kazni. Zamislimo li se dublje nad
društvom u kojem živimo, prepoznat ćemo niz postupaka kojima ono "kontrolira" način na koji se
ponašamo. Mnoštvo pravila koja se postavljaju pred osobu putem društvenih ustanova poput crkve,
škole ili medija masovnog komuniciranja samo su posebni oblici vanjske kontrole ponašanja.
Roditelj koji nagrađuje dijete nakon što je dobilo dobru ocjenu u školi zapravo pokušava
kontrolirati njegovo ponašanje, kao i onaj koji svoje dijete grdi zbog loših ocjena. Kako kontrola
20
21
15
Ivo V.
može poslužiti u znanstvene svrhe? Gotovo svako znanstveno istraživanje sadrži u sebi namjeru
ovladavanja prirodom na jedan ili drugi način. Istražujemo li društvene uvjete koji prethode
kriminalnom ponašanju, naš konačni cilj nije samo potvrda da stanovite društvene okolnosti
pogoduju njegovu pojavljivanju, već nastojanje da se utječe na prepoznate uzročnike kako bi se
time smanjila stopa kriminaliteta. Bit kontrole upravo i jest mogućnost utjecaja na ponašanje
upravljanjem situacijskim odrednicama. Ako se, primjerice, istraživanjem pokaže da studenti bolje
pamte učeći navečer umjesto ujutro, kontrola njihova ponašanja može se sastojati u pomicanju
termina predavanja od jutarnjih prema popodnevnim satima.21
2. TEORIJE I ISTRAŽIVANJA
1.1 TEORIJA
U najširem značenju, teorija je skup zamisli o tome što je priroda i prema kojim načelima
funkcionira, Shaughnessy i Zechmeister (1994, str. 28-29) određuju je kao "logički ustrojen niz
pretpostavki (tvrdnji) koje služe definiranju događaja pojmova), opisuju veze među njima i
objašnjavaju njihovo javljanje". Za Kapla na (1964), teorija je jednostavno simbolička prerada
iskustva. Sve se definicije uglavnom svode na određenje teorije kao posebne pojmovne organizacije
zbilje sa svrhom njezina objašnjavanja. U pravilu, taj se proces odvija svođenjem pojava na
simbolički obli i njihovim sažima njem u općevažeće zakone. Prema učestalom laičkim shvaćanju,
teorija je nešto što se suprotstavlja iskustvenom doživljavanju. To je, dakako, samo djelomično
točno. Za razliku od neposrednog iskustva, teorija je posredna spoznaja jer znači misaonu razradu
činjenične zbilje. Zbog toga je pojmovna i uopćena, što znači da se odnosi na velik broj
pojedinačnih pojava, ali ni na jednu u cijelosti. Usto, teorija u psihologiji i drugim znanostima samo
jednim dijelom počiva na utvrđenim činjenicama, dok je drugim dijelom hipotetička, odnosno
sazdana od pretpostavki.
Teorija je istodobno cilj znanstvenog pregnuća i pokretač njezina razvitka. U tome se očituje
njezina dvojna priroda (Marx, 1963a). Kako smo prethodno naglasili, konačni cilj znanosti sastoji
se u ovladavanju prirodom, a takvo što, bez dvojbe, ne bi bilo moguće bez dubokog razumijevanja
zbilje. U spoznavanju svijeta teorije su nezamjenjive. One povezuju poznate činjenice i podvode ih
pod opće zakonitosti, koje nam pomažu u predviđanju budućih događaja. Osobito su korisne jer na
ekonomičan način apstrahiraju združuju i pohranjuju podatke prikupljene istraživanjima. Teorija se
u tom smislu može shvatili kao cilj znanosti.22
Teorija je, međutim, redovito i sredstvo daljnjeg napretka znanosti. Prema Melvinu Marxu (1963),
druga temeljna zadaća teorije, pored organizacije empirijskog znanja, je upravljanje istraživanjima.
Fulgosi (1981) drži da teorija uglavnom ima vrijednost samo kao polazište, određena spekulacija ili
hipoteza koju tek treba ispitati i dokazati. Teorija postoji samo dotle dok je ne zamijene činjenice
utvrđene znanstvenim metodama istraživanja. Zbog svog subjektivizma i proizvoljnosti, teorija,
kako drže neki znanstvenici nije, sama po sebi, dio znanosti u užem smislu, već to postaje tek pošto
je potvrde empirijski nalazi.
Nedostatak iskustvenih spoznaja nadopunjuje se pretpostavkama tvoreći teorije. Izvode takvih
teorija moguće je ponovno provjeriti i testirati, čime se one potvrđuju ili opovrgavaju. U svakom
slučaju provjera podastire nove empirijske podatke koji služe nadograđivanju postojećih ili
stvaranju novih teorija, čime pridonose razvitku znanosti.
2.1.1 SASTAVNI ELEMENTI TEORIJE
Građenje teorija počiva na manjem broju temeljnih načela koja propisuju odnose među njezinim
sastavnicama. Bez obzira na disciplinu, teorija redovito obuhvaća nekoliko neizostavnih elemenata
koji se kao pojmovna nadgradnja nadovezuju na opažanjem prikupljene podatke. Najvažniji među
21
22
22
23
16
Ivo V.
njima su konstrukti, hipoteze,zakoni i znanstvena objašnjenja. Ukratko ćemo objasniti značenje
svakog od njih u procesu izgradnje neke teorije.
2.1.1.1 KONSTRUKTI
Psihologija je poput drugih društvenih znanosti osuđena da se bavi konstruktima jer su istinski
predmeti njezina opažanja redovito skriveni. Pokušat ćemo najprije odgovoriti na pitanje što su
uopće konstrukti, kakva je njihova uloga u izgradnji teorija i kako se prema njima odnosi
psihologija. Kao i čitav niz drugih društvenih znanosti i znanost o ponašanju, psihologija, svoj
interes usmjeruje, ne toliko prema izravno zamjetljivim pojavama, koliko prema osobinama o
kojima zaključujemo posredno. Takve osobine, koje nisu podložne izravnom opažanju, već o njima
sudimo neizravno, na temelju različitih pokazatelja nazivaju se konstruktima.
Marx (1963) luči pojmove od konstrukata. Pojmovi se odnose na skupine pojedinačnih objekata,
poput kuće, ulice ili vrta. Pri tome u sebe uključuju istodobno manje i više od opaženog, manje jer
ne kazuju ništa o pojedinačnom, a više jer nastoje apstrahirati sve pojedinačno tvoreći opću
kategoriju. Pojam kuće je na taj način bogatiji značenjem od specifične kuće na određenoj adresi,
jer obuhvaća sve postojeće i nepostojeće kuće, ali istodobno i siromašniji jer ne kazuje ništa o toj
konkretnoj kući, dakle posve ispušta pojedinačnu razinu. Konstrukti su poseban oblik pojmova koji
zahtijevaju mnogo veći stupanj zaključivanja jer obuhvaćaju objekte koji su sami po 23 sebi
apstraktni, Upravo zbog tog svojstva osobito su korisni znanosti. U psihologijske konstrukte
možemo ubrojiti, često spominjane i za znanost iznimno važne elemente psihičkog života,
inteligenciju motivaciju, čuvstva osobine ličnosti, ideologiju, kao i niz drugih činitelja za koje
vjerujemo da utječu na naše ponašanje. Ukoliko je neka pojava apstraktna i skrivena opažanju prije
negoli stvarna i zamjetljiva, utoliko je bliža pojmu konstrukta. Gotovo sve teorije i hipoteze bave se,
zbog potrebe veće općenitosti, konstruktima, umjesto specifičnim zamjetljivim ponašanjima.
Pretpostavka je, naime, da konstrukti okupljaju mnoštvo međusobno povezanih specifičnih
ponašanja ili osobina niže razine općenitosti. Ekstraverzija, kao široki konstrukt iz domene ličnosti
obuhvaća društvenost, govorljivost, ležernost, živahnost, optimizam nestalnost i cijeli niz drugih
ponašajnih sklopova (Eysenck i Eysenck, 1985). Bavljenje konstruktima umjesto zamjetljivim
pojavama, stoga, omogućuje teoriji mnogo višu razinu apstrakcije, što istodobno znači mnogo veću
ekonomičnost i pokrivanje šireg raspona situacija, odnosno područja važenja. Složimo li se s
određenjem teorije kao pojmovne prerade zbilje, tada je još jasnije kako nam konstrukti, sami po
sebi odraz misaone apstrakcije opaženih pojava, mogu pomoći. Oni, dakle, posreduju između
izravno opaženih pojava i teorijom pretpostavljenih zakona. Na kontinuumu koji opisuje kretanje od
iskustvenog prema teorijskom, konstrukti se nalaze na pola puta, predstavljajući simboličku obradu
izravno opaženih pojava. Prema Marxu (1963), konstrukti su temeljne neovisne jedinice koje čine
teorije.
Vrste konstrukata u psihologiji

Vratimo se načas problemu operacionalizma kojim se suvremena znanost suprotstavila meta
fizičkom i nejasnom značenju što su ih poprimali pojmovi kojima se koristila. Zahtjev za
operacionalizmom, koji je prvi postavio Bridgman (19.27), išao je za tim da se svaki pojam ili
konstrukt opiše ili definira putem empirijskih pokazatelja. Time se nastojala izbjeći svaka nejasnoća
i maglovitost pojmova koji nisu upućivali na neke zamjetljive pojave. Takav stav bio je brana
metafizici i spekulativnosti kojima, sukladno pozitivističkom gledištu, nema mjesta u znanosti.
Dakako, udovoljavanje operacionalizmu pojedinih psihologijskih konstrukata više je pitanje stupnja
u kojem ih je moguće svesti na pojave dostupne iskustvu. Tek su rijetki konstrukti potpuno
operacionalno odredivi, a većinu je moguće definirati samo djelomice. Znanost odbacuje uglavnom
samo one koji se opiru bilo kakvoj operacionalizaciji. Nova kvaliteta što ju je operaciona1izam
23
24
17
Ivo V.
ponudio znanosti sastoji se u mogućnosti kritičkog vrednovanja teorijskih konstrukata u odnosu na
vlastitu empirijsku podršku. Prema stupnju u kojem dopuštaju operacionalizaciju, konstrukte u
psihologiji je, sukladno razgraničenju što su ga uveli MacCorquodale i Meehi (1948), moguć
podijeliti na posredujuće varijable i hipotetičke konstrukte.24
Posredujuće (intervenirajuće) varijable
Pojam posredujuće varijable obično se vezuje uz konstrukte čiji se sadržaj posve iscrpljuje
navođenjem niza operacija. Radi se o varijabli koja posreduje ili se umeće između podražaja i
odgovora. Naime, nasuprot učenju klasičnog biheviorizma (Watson, 1924) da je za predviđa nje
ponašanja dovoljno samo poznavati podražaj, kasniji su bihevioristi unaprijedili osnovni obrazac P-
O (podražaj-odgovor), dodajući posredujuću varijablu koju su umetnuli kako bi objasnili različita
ponašanja što slijede nakon istog podražaja (P-O-O ili podražaj-organizam-odgovor). Kad bismo
odgovor mogli predvidjeti isključivo na temelju podražaja, konstrukti, kao ni teorije, nam uopće ne
bi trebali. Redovito, međutim, isti podražaji izazivaju ponešto različita ponašanja. Uzmimo
jednostavan primjer: ispitaniku je više puta u nizu pročitana ista lista riječi, uvijek uz zahtjev da je
reproducira najbolje što može. Vjerojatno ćemo ustanoviti da se nakon istog podražaje ponašanje
mijenja, odnosno da broj reproduciranih riječi raste iz čitanja u (ita nje. U takvom, krajnje
pojednostavljenom, primjeru, posredujuća varijabla je učenje, koju je moguće posve operacionalno
odrediti brojem čitanja, s jedne strane (podražaj) i narastajućim brojem upamćenih riječi, s druge
(odgovor). Možemo stoga utvrditi da mogućnost reprodukcije raste u funkciji broja ponavljanja
zbog procesa koji smo nazvali učenjem. Učenje je konstrukt o kojem zaključujemo na temelju
porasta broja zapamćenih riječi. Ako ga definiramo kao broj ponavljanja, ona postaje posredujuća
varijabla, posve određena operacijama dostupnima opažanju.
Hipotetički konstrukti
Za razliku od posredujućih varijabli koje su potpuno određene na temelju vanjskih podražaje i
odgovora, odnosno njima definiranih operacija, hipotetički konstrukti ne mogu se posve izjednačiti
s operacijama na kojima počivaju već sadrže i određeni "višak" značenja hipotetičkog karaktera.
Kada bismo učenje, umjesto kao pukog posrednika između broja ponavljanja i porasta
reproduciranih riječi definirali kao neurofiziološki proces u mozgu koji takvu pojavu omogućuje,
bila bi riječ o hipotetičkom konstruktu. S jedne strane, dakle, imamo konstrukte koji samo
naznačuju empirijsku povezanost, a s druge one koji uključuju stanovite pretpostavke o pojavama ili
procesima nedostupnima opažanju, Osnovno obilježje drugih, nazvanih hipotetičkim konstruktima,
jest niža razina operacionalne valjanosti i narušavanje načela znanstvene parsimonije (Marx, 1951).
Unatoč tome, njihova uloga u izgradnji teorija je golema, nerijetko veća od posve operacionalno
određenih posredujućih varijabli. Njihovo uvođenje u psihologiju vremenski se podudarilo s
narastajućim prigovorima i teškoćama na koje je nailazio ortodoksni operacionalizam.
Razlozi zbog kojih je uporaba posredujućih varijabli u psihologiji donekle potisnuta u stranu mogu
se sažeti u tri osnovna prigovora takvoj vrsti operacionalizma:25
1. Slabija mogućnost uočavanja
2. Nemogućnosti potpune operacionalizacije svih pojmova
3. Ograničavanje znanstvenog napredovanja.
Nije samo po sebi razumljivo zašto potreba za empirijskom podlogom teorijskih pojmova proizvodi
negativne učinke. No sljedeća rasprava trebala bi pojasniti o čemu se radi. Koliko operacionalizam
pridonosi jednoznačnosti i empirijskoj utemeljenosti, toliko istodobno priječi svako uopćavanje.
Naime, pokazuje se da imamo onoliko konstrukata koliko i operacija kojima ih definiramo.
Definiramo li tjeskobnost jednim mjernim instrumentom (primjerice, ljestvicom manifestne
tjeskobnosti), ona neće biti istovjetna tjeskobnosti definiranoj nekim drugim mjernim
instrumentom, a kamoli onoj na koju upućuju liste procjene, fiziološke mjere ili opažanje.
Jedinstveni konstrukt tjeskobnosti na taj je način ponovno razlomljen, čime znanost gubi ono
24
25
25
26
18
Ivo V.
najvažnije - apstrakciju i podvođenje pod općevažeća načela i zakone. Zbog toga je važno da
pojmovi sadrže određenu količinu hipotetičkog koja bi okupljala ponešto različite
operacionalizacije. Hipotetički konstrukti dopuštaju takvu raznolikost jer se pretpostavlja da se neka
osobina može očitovati na različite načine. Tjeskobnost shvaćena kao hipotetički konstrukt
uključuje vrlo različite pokazatelje, upitničke mjere, objektivna mjerenja fiziološkog stanja i
vanjsko opažanje.
Drugi prigovor vezan je uz poteškoće pri pokušaju operacionalizacije složenijih i apstraktnijih
pojmova. Njih je teško svesti na pojavne pokazatelje, a pogotovo na način na koji to nastoje
posredujuće varijable. Teško je zamisliti posredujuće varijable pojmova poput ličnosti ili motivacije
koji zbog svoje apstrakcije i općenitosti uključuju u sebe niz drugih konstrukata niže razine.
Treći prigovor, donekle paradoksalno, vraća raspravu na početak. Operacionalizam ima svojih
neprijepornih pozitivnih učinaka koji se ogledaju u preciznosti znanja i potpunoj iskustvenoj
utemeljenosti. No time smo, nažalost, usporili znanost u njezinu napredovanju, priječeći je u drugoj
glavnoj funkciji - usmjeravanju istraživanja. U pravo hipotetičnost i neizvjesnost tjeraju znanost
naprijed, jer ako nema nesigurnosti i nagađanja, nema ni potrebe za daljnjim istraživanjem.
Odnos između posredujuće varijable i hipotetičkog konstrukta može se ilustrirati jednostavnim
crtežima prikazanima u slici 2. 1 (Marx, 1963a).
Valja uočiti da je posredujuća varijabla posve određena prethodećim podražajem i kasnijim

odgovorom tjeskobnost tako možemo definirati kao varijablu koja posreduje između anticipacije
stresnog podražaja, primjerice ispitne situacije i rezultata na ljestvici tjeskobnosti. Hipotetički
konstrukti nisu posve svedivi na podražaj i odgovor, pa se tjeskobnost shvaćena u tom smislu može
pojmiti kao snaga vegetativnog živčanog sustava u kojoj ranije spomenuti podražaj i odgovor
sudjeluju samo kao dio njezina određenja, dok su druge odrednice hipotetičke. Raspravi o
posredujućim varijablama i hipotetičkim konstruktima valja dodati još jednu rezervu. Određeni 26
broj filozofa znanosti (Feycrband, 1965) osporio je oštro razgraničenje tzv. opaženih i teorijskih
pojmova. Nema takvih opaženih pojmova, tvrde oni, koji su potpuno lišeni teorijskih pretpostavki.
Takva je kritika naročito pogodila teorijske sustave koji su, povodeći se za pozitivizmom, osobito
naglašava li isključivu empirijsku utemeljenost, poput klasičnog biheviorizma.
Hipotetički konstrukti korisniji su od posredujućih varijabli u početnim stadijima istraživanja kada
je usmjeravanje daljnjeg tijeka istraživanja važnije od preciznosti nalaza. U stadiju veće
razvijenosti, posredujuće varijable mogu se pokazati boljim izborom jer nude razmjerno
jednoznačne rezultate.
2.1.1.2 HIPOTEZE
Dok su konstrukti osnovne sastavnice koje tvore neku teoriju, odnosno njezini građevni elementi,
hipoteze su svakako najvažnije sredstvo kojim se usmjerava proces njezine izgradnje. One su
nepotvrđene tvrdnje, pretpostavke ili provizorna tumačenja odnosno između iskustvenih podataka
26
27
19
Ivo V.
ili teorijskih konstrukata (Mux, 1963a). Po mnogočemu je pojam hipoteze blizak pojmu teorije.
Teorija se u psihologiji i ne može posve jasno odijeliti od hipoteze. I jednoj i drugoj je svojstveno
nagađanje i pretpostavljanje nečeg što nije potpuno dokazano, ali je dovoljno vjerojatno da bi
moglo biti točno. Teoriji se obično pripisuje veći stupanj dokazanosti, ali i veća obuhvatnost od one
što ju posjeduje hipoteza. Dok je, naime, hipoteza sasvim specifična pretpostavka vezana uz
određeno istraživanje, teorija je mnogo šira i obuhvaća niz međusobno isprepletenih pretpostavki
organiziranih u cjelinu. Temeljna zadaća hipoteze je usmjeravanje istraživanja, koja tek
formulacijom takve vrste pretpostavki poprimaju karakter teorijske provjere. Zasad smo se samo
dotakli osnovnih odrednica i funkcije hipoteze te njezina značenja u procesu građenja teorije. To,
međutim, ni približno ne iscrpljuje ovu važnu temu. Pojmu hipoteze vratit ćemo se stoga kasnije pri
bavljenju podjednako važnim pitanjem strukturiranja istraživačkog procesa.27
2..1.1.3 ZNANSTVENI ZAJKONI
Kako kaže Kaplan (1964), ishod svakog uspješnog istraživanja je, ili pojedinačan ili općenit. Za
prvo istraživanje kažemo da je utvrdilo činjenice, a za drugo da je uspostavilo znanstveni zakon.
Unatoč razlikama u mišljenju pojedinih filozofa znanosti, znanstveni se zakoni mogu odrediti kao
iskustveno utemeljene opće tvrdnje koje govore o odnosima među istraživanim pojavama. Još
jednostavniju definiciju nudi Caws (1965, str. 82) određujući zakon kao ''empirijsko uopćavanje
koje se prihvaća kao točno''. Otkrivanje zakona jedna je od osnovnih zadaća znanosti jer, kako smo
ranije istakli, znanost pretpostavlja determinističku narav zbilje pokretane upravo prirodnim
zakonima. U idealnom slučaju zakoni opisuju općenite pravilnosti, one koje se odnose na sve
slučajeve ispitivane pojave i vrijede u svim vremenima, prošlim, sadašnjim i budućim (Radonjić,
1981). Također poželjno je da se zakonom opisuje povezanost u smislu uzročnosti, no to je tek
teško dostižni ideal, pogotovo kad je riječ o društvenim znanostima. U pravilu se radi tek o nekoj
vrsti korelacijske veze koja pokazuje vjerojatnost pojavljivanja jedne varijable pod uvjetom pojave
druge. Važno je naglasiti da zakoni predstavljaju odgovarajuća uopćavanja izvedena na temelju
iskustvenih podataka. Takvo se određenje donekle preklapa s pojmom teorije te je potrebno
napraviti dodatno razgraničenje. Razlika je upravo u većem stupnju hipotetičnosti teorije koja ne
počiva u tolikoj mjeri na empirijskoj građi, već sadrži i zamašnu količinu spekulacije. Radonjić
(1981) ovo svojstvo naziva stupnjem dokazanosti ili potvrđenosti. U zakonima su konstrukti
definirani operacionalno, odnosno potpuno su ili uglavnom svedivi na opažane pokazatelje. Veze
među konstruktima usto su empirijski dokazane. Za razliku od znanstvenih zakona koji su
neraskidivo povezani s podacima neposrednog iskustva, teorije su redovito nešto više odmaknute od
empirijske podloge. One su tek dijelom utemeljene na podacima, dok ostatak počiva na nagađanju,
odnosno pokušaju da se nedoumice i nedorečenosti prevladaju spekulacijom. Zbog tek djelomičnog
prožimanja zakona i teorija, jedan te isti zakon odnosno empirijski utvrđenu pravilnost može
tumačiti mnoštvo različitih teorija. U psihologiji postoji velik broj uopćavanja koje možemo
podvesti pod opće određenje zakona. Međutim, prava je rijetkost da se stručnjaci slažu oko
tumačenja takvih općeprihvaćenih i dobro poznatih zakona.
Ilustrirajmo to primjerom jednog odavno poznatog uopćavanja u psihologiji o odnosu pobuđenost i
uratka koji su utvrdili Yerkes i Dodson (1908). Oni su, nastojeći ispitati odnos između jačine
podražaja i brzine učenja, pokazali kako miševi najbrže usvajaju ponašanje kojim izbjegavaju
električni udar, ako je kazna koja im prijeti umjerene snage. Miševi su, da bi izbjegli kaznu, trebali
izabrati svjetliju kutiju, a nakon tri uspješna pokušaja za redom smatrano je da sutakvo ponašanje
uistinu usvojili. Njihovo je učenje bilo sporije, odnosno zahtijevalo je više pokušaja, ako su im
nakon pogrešaka zadavani bilo preslabi bilo prejaki električni udari.28
Autori su utvrdili još jedno važno pravilo. Uspoređujući uvjete u kojima su miševi mogli teško
razlikovati situacije koje donose kaznu od onih koje ne donose (male razlike u svjetlini kutija) s
onima u kojima su one naglašeno različite (velike razlike u svjetlini kutija), pokazalo se da je u
težem zadatku (male razlike) optimalna razina podražaja nešto niža negoli u lakšemu.
27
28
28
29
20
Ivo V.
Premda se čini da, ovako ukratko opisan, rad ne donosi odveć važne ili neočekivane rezultate,
kasniji su ga nalazi ne samo potvrdili već i omogućili da se utvrđene zakonitosti uvelike prošire i
uopće na druge organizme, tipove zadataka i vrste podražaja. U današnjem, mnogo slobodnijem
tumačenju izvornog zakona, možemo reći da najbolji učinak u rješavanju zadatka imaju osobe
(organizmi) srednje razine pobuđenosti (intenziteta podražaja), odnosno učinkovitosti podjednako
šteti preniska i previsoka pobuđenost (motivacija, napetost, strah). Zakon usto kazuje da je
optimalna razina pobuđenosti obrnuto razmjerna težini zadatka. Oba uopćavanja prikazana su na
slici 2.2.
Yerkes i Dodson međutim nisu ponudili nikakvo teorijsko objašnjenje zašto dolazi do takvog tipa
odnosa između učinka i pobuđenosti. Zakon nudi samo opis, a ne pruža tumačenje, Vidimo stoga da
potvrđene zakonitosti mogu egzistirati i bez teorijskog okvira kojim bivaju protumačene. K tome,
isti zakon mogu tumačiti vrlo različite teorije, što je bila sudbina i s upravo opisanom pravilnošću
što su je utvrdili Yerkes i Dodson. Jedan od svakako uvjerljivijih pokušaja da se zakon teorijski
utemelji jest Easterbrookovo (1959) tumačenje prema kojem povećanje pobuđenosti29
(emocionalnosti, motivacije) dovodi o smanjenja raspona korištenih okolinskih znakova pri
rješavanju zadatka. Pri optimalnoj razini pobuđenosti svi nevažni okolinski znakovi bivaju
zanemareni i osoba je posve usredotočena na zadatak, odnosno njegove ključne odrednice. Pri
daljnjem povećavanju motivacije, raspon korištenih znakova još se više smanjuje, tako da osoba
zanemaruje i neke odrednice važne za pravilno rješavanje zadatka. Upravo opisani zakon, uz
donekle preuzeto Easterbrookovo tumačenje, odigrao je važnu ulogu u izgradnji Eyscnckove teorije
ličnosti (Eysenck i Eysenck, 1985) koja uvelike počiva na konstruktu pobuđenosti, za koji se držalo
da opisuje bio-fiziološke razlike između introverata i ekstraverata.
Zakoni, vidimo, mogu postojati neovisno o teorijama, dok je obrnuto isključeno jer zakon koji
opovrgava teoriju ozbiljan je razlog za njezino odbacivanje ili barem preinačavanje,
2.1.1.4 ZNANSTVENO OBJAŠNJENJE
Jedna od temeljnih zadaća teorije jest pružiti valjana objašnjenja istraživanih pojava. Odrediti
pojam znanstvenog objašnjenja, međutim, nipošto nije lagano. U svakom ga slučaju valja lučiti od
objašnjenja koje se daje u nastojanju da se razjasni neki pojam, odnosno pobliže odredi njegovo
značenje. Takav tip objašnjenja, koji Kaplan (1964) naziva semantičkim, određuje smisao neke
riječi ili pojma. Znanstvena objašnjenja trebala bi osigurati razumijevanje neke pojave otkrivajući
29
30
21
Ivo V.
zakonitosti i mehanizme na kojima počiva. Deutsch (1960) luči dva tipa znanstvenog objašnjenja.
Jedno se sastoji u podvođenju neke pojave pod opći zakon ili pravilo, a drugo u otkrivanju njezinih
uzroka. Prvi je tip nazvao uopćavajućim, a drugi strukturalnim objašnjenjem.
Objašnjenje je u svakom slučaju nešto što nadilazi puko opisivanje. Dok nam opis kazuje samo što
se dogodilo, objašnjenje ide korak dalje, nastojeći odgovoriti na pitanje zašto?, pružajući za
proučavanu pojavu primjerene razloge. Time što odgovara na pitanje zašto?, približava nas
temeljnom cilju znanosti, razumijevanju pojave i otvara put njezinoj kontroli. Psiholozi koji su se
usvojili najstrože pozitivističko gledište, poput biheviorista (Skinner, 1953) smatrali su da je
objašnjavanje nepotrebno držeći ga nečim što nadilazi empirijske podatke te time prelazi granicu
između znanosti i metafizike. Zbog toga su njihova učenja uvelike ateorijska. Ranije smo govorili o
razlici između teorije i zakona. Ona počiva upravo na objašnjenju. Teorije objašnjavaju, a zakoni
opisuju. Na temelju zakona moguće je pojave opisivati, predviđati i donekle kontrolirati, dok su
objašnjenja kao sastavnice teorija one koje nam omogućuju razumijevanje, a u najvećoj mjeri i
kontrolu. pravo objašnjenja u teorije unose primjesu nagađanja, ili kako Kaplan (1964) kaže, one su
"otvorene", koristeći taj termin u smislu nedovršenosti. Takvo određenje doista i pristaje
znanstvenom objašnjenju jer su mu svojstvena barem tri temeljna obilježja:30
1. Djelomičnost - jer uzimaju obzir tek neke činitelje važne za istraživanu pojavu
2. Uvjetnost - jer vrijede samo pod određenim okolnostima
3. Približnost - jer su redovito manje ili više neprecizne u odnosu na opažanje i ne omogućuju
posve točno predviđanje.
Zbog toga, objašnjenja redovito nisu dovoljna za potpuno određenje izučava ne pojave, ograničene
su na uski spektar situacija i zamjenjive su drugim teorijama, što je u povijesti znanosti
mnogostruko pokazano.
Za psihologiju kao razmjerno mladu znanost od posebne je važnosti razlikovanje između dviju vrsta
objašnjenja, reduktivnog i konstruktivnog (Marx, 1963a). Reduktivna objašnjenja sastoje se u
svođenju predmeta izučavanja na pojave osnovnije, temeljnije razine opisa. Primjerice psihološke
pojave i ponašanje često se tumače fiziološkim ili biokemijskim mehanizmima. Konstruktivnim
objašnjenjima zovemo ona u kojima se istraživane pojave opisuju podjednako složenim
konstruktima, odnosne onima koji se nalaze na istoj razini općenitosti. Za primjer možemo uzeti
konstrukt ličnosti, koja prema nekim autorima obuhvaća sve ono što određuje nečije ponašanje
(Cattcll, 1950). Ponašanje možemo pokušati objasniti konstruktima višeg reda, primjerice širokim
dimenzijama ličnosti, poput ekstraverzije, neuroticizma ili psihoticizma (Eysenck, 1970) ili u novije
vrijeme osobinama ekstraverzije,31 emocionalne stabilnosti, ugodnosti, savjesnosti i intelekta
(Goldberg, 1990). Želimo li ponašanja opisati preciznije, koristit ćemo osobine ličnosti niže razine
(Eysenck i Eysenck, 1985; Cesta i ty1cCrae, 1992a). No moguć je i drukčiji pristup, tumačenja
određenih ponašanja ili crta ličnosti fiziološkim i biokemijskim mehanizmima (Eysenck, 1967;
Fulgosi 1994).
30
31
31
32
22
Ivo V.
Redukcionizam je svakako vrijednost kojoj treba težiti jer bi u konačnici mogao dovesti do
sjedinjenja različitih znanosti koje bi pritom našle zajedničko ishodište u temeljnim zakonitostima
prirode. Premda je kao takav konačan cilj znanstvenog objašnjenja, redukcionizam počiva na
određenim pretpostavkama, prije svih, mogućnosti svođenja jednih znanosti na druge (psihologije
na fiziologiju, fiziologije na kemiju i kemije na fiziku) i to bez gubitka informacija (Jessor, 1958).
Takvo što zasad je bez sumnje utopistička zamisao, te će još dugo postojati potreba za
konstruktivnim objašnjenjima. Zbog toga se treba složiti s Marxovorn (I 963a) tvrdnjom kako se
radi o nadopunjujućim, a ne međusobno isključivim pristupima te ih kao takve treba i koristiti.
2.1.2 STRUKTURA ZNANSTVENE TEORIJE
Nakon što smo pobrojili i ukratko opisali sastavnice od kojih se sastoji i na kojima počiva svaka
teorija reći ćemo nešto i o njihovu međusobnom odnosu. Teoriju možemo shvatiti kao hijerarhijski
ustrojenu tvorevinu koja u konačnici počiva na empirijskim podacima. No ona, kako smo vidjeli,
nije svediva na podatke niti iz njih nužno proizlazi. Isti podaci mogu biti osnova za nastanak posve
različitih teorija. Pogledajmo slikovni prikaz koji približava način nastanka teorije, njezin odnos
prema podacima i ulogu u organizaciji nakupljenih spoznaja.
Konstrukti, kao temeljne strukturalne jedinice svake teorije imaju golemu važnost. Umjesto
bavljenja pojedinačnim slučajevima, oni omogućuju apstrakciju i uopćavanje. Rekli smo da oni
posreduju između pojedinačnih podataka i teorija. Veze među konstruktima propituju se na razini
hipoteza, koje, potvrđene ili odbačene, usmjeruju naša istraživanja, utjelovljujući tako drugi
temeljni cilj teorije. Dodatna orijentacijska sredstva svake teorije već su ranije utvrđeni zakoni.
Svaka ih teorija mora respektira ti, jer, kako smo rekli, oni opstaju u odsutnosti ili čak nasuprot
teorijama, dok obrnuto nije slučaj. U prirodnim znanostima, uloga teorija uglavnom se svodi na
povezivanje i tumačenje otprije poznatih zakona. Nažalost, u društvenim znanostima i psihologiji
dobro utvrđeni zakoni su rijetki, što teorijama ostavlja mnogo slobode, zbog čega su mnogo
spekulativnije i prožete hipotetičkim sadržajima.
23
Ivo V.
Na slici 2.4 su shematski prikazane tri različite teorije koje tumače pojave što se djelomično
podudaraju. Valja uočiti da više hijerarhijske razine, one označene svjetlijim 32 nijansama,
predstavljaju višu razinu apstrakcije u odnosu na iskustvenu građu. Osim veće općenitosti, svaka
viša razina nosi i nešto veći stupanj nagađanja, nesigurnosti i hipotetičnosti. Empirijski podaci ne
sadrže nimalo hipotetičnosti, konstrukti i zakoni sadrže je u malom opsegu, dok u hipotezama i
objašnjenjima nagađanje čim suštinski i naglašeno prisutan element. Pogledajmo na primjeru ranije
opisanog Yerkes-Dodsonova zakona kako bi mogla izgledati psihologijska teorija. Prvu razinu čine
opažena ponašanja. Konstrukti opisuju povezanost među njima, primjerice konstrukt tjeskobnosti
može uključivati pokazatelje poput znojenja, krvnog pritiska i pulsa i samo iskaza o tjeskobnosti.
Zakoni su uopćavanja o povezanosti među konstruktima, u našem slučaju konstruktu pobuđenosti
(tjeskobnosti, motivacije) i uratka (operacionaliziranog nizom različito teških zadataka). Hipoteza i
objašnjenje uspostavljaju logički smisleno tumačenje uočene zakonitosti, primjerice ranije
spomenuto da se usporedo s povećanjem pobuđcnosti smanjuje broj znakova iz okoline koji se
koriste pri rješavanju zadataka. Različite teorije mogu ponudit različita objašnjenja istih zakona i
podataka. Otuda preklapanje vidljivo na slici.
2.1.3 KRITERIJI DOBRE TEORIJE
Teorije organiziraju dostupne činjenice i zakone u cjelinu, upravljaj ući znanost u određenom
smjeru. Zbog takve uloge, od velike je važnosti poznavati one odlike33 koje izdižu pojedinu teoriju
iznad ostalih. Iste podatke, naime, mogu tumačiti vrlo različite, nerijetko posve suprotstavljene,
teorije. Dobra bi teorija morala udovoljavati nizu zahtjeva, od kojih se jedni, uvjetno rečeno, mogu
nazvati sadržajnima, a drugi formalnima (Radonjič, 1981), Valja, međutim, imati na umu da
vrijednost neke teorije, kako drži Kaplan (1964), nije predmet službene odluke, već najčešće posve
osobne procjene. U svakom trenutku dio znanstvenika prihvaća jedne, a odbacuje druge teorije, dok
istodobno drugi dio zastupa o njima oprečno stajalište. Kriteriji koje ćemo spomenuti pružaju stoga
tek osnovna mjerila za procjenjivanje teorija.
32
33
33
34
24
Ivo V.
Najčešće se tako navode:
Sadržajni kriteriji
1. Činjenična zasnovanost ili načelo korespondencije
2. Usklađenost s drugim teorijama
Formalni kriteriji
1. Jednostavnost (znanstvena parsimonija)
2. Logička dosljednost (konzistentnost)
3. Preciznost predviđanja
4. Obuhvatnost
5. Mogućnost provjere
6. Oborivost
Što nam zapravo kazuju gornji kriteriji i kako se prema njima treba odnositi? U slučaju da više
različitih teorija objašnjava istu pojavu, primjerice ponašanje pojedinca, priklonit ćemo se onoj koja
to čini na znanstveno najprihvatljiviji način. Pri tome su temeljna gore spomenuta načela. Ukratko
ćemo se pozabaviti svakim od njih.
2.1.3.1 ČlNJENIČNA UTEMELJENOST
Teoriju koja nije utemeljena na činjenicama uopće ne možemo smatrati znanstvenom. Već smo u
uvodnome poglavlju razgraničiti znanost od meta fizike definirajući predmet bavljenja prve kao sve
pojave dohvatljive iskustvu. No teorija može biti znanstvena, počivati na iskustvu, a da joj
istodobno tek manji broj činjenica ide u prilog. Takva teorija ne može se smatrati dobrom. S druge
strane, što je veći broj iskustvenih pokazatelja u skladu s predviđanjima neke teorije, to je
vjerojatnije da je ona točna teorija stoga treba odgovarati činjenicama u što većoj mjeri. To je
osnovni kriterij njezine vrijednosti, nazvan načelom korespodencije (Kaplan, 1964) jer se, očekuje
da teorija korespondira sa (odgovara) stvarnošću. Tome kriteriju teorije udovoljavaju u vrlo
različitoj mjeri. Problem je usto što se nijedna teorija ne može ispitati 34 u potpunosti, odnosno
uvijek ostaju pojedinačni slučajevi koje nismo provjerili ili ispitali. Potvrda teorije uvijek je, dakle,
djelomična, što otvara mogućnost promjenama, ako kasniji podaci pokažu netočnost nekih njezinih
izvoda. Načelo također podrazumijeva da dobra teorija u sebe uključi i otprije poznate zakone koji
vrijede u izučavanom području. Ako empirijski zakoni ne govore u prilog teoriji, za nju se ne može
reći da je činjenično utemeljena niti da odgovara zbilji koju tumači.
2.1.3.2 USKLAĐENOST S DRUGIM TEORIJAMA
Osim udovoljavanja zahtjevu činjenične utemeljenosti, teorija, bi, barem u određenoj mjeri, morala
biti usklađena s drugim teorijama koje potkrepljuj činjenična građa. Neka je teorija, prema tome,
vjerojatna ako je usklađena s drugim otprije potvrđenim teorijama. To znači da potvrdu ne moraju
pružati samo podaci nego i širi i općenitiji sustavi, odnosno druge teorije. Dakako, to ne znači da
valjanost neke teorije mora počivati na slaganju s drugim teorijama. Često se dešava da različite
teorije tumače istu pojavu na sasvim različite načine. U tom slučaju barem neke od njih su netočne.
Usklađenost s drugim teorijama kao kriterij valjanosti koristi se samo onda kada se radi o teorijama
različitog stupnja općenitosti koje zbog toga nisu međusobno suprotstavljene. Razvijajući neku usku
teoriju, nastojat ćemo je uskladiti s otprije poznatom i potvrđenom širom teorijom i obrnuto,
izgradnja općenitije teorije naslanja se na postojeće uže teorije. No dok je činjenična utemeljenost
neizostavan zahtjev, usklađenost s drugim teorijama tek je sekundarno mjerilo kvalitete neke
teorije.
2.1.3.3 JEDNOSTAVNOST
Načelo jednostavnosti, nazvano i kanonom štednje ili zakonom parsimonije, sadržano je još u
naučavanju skolastičkog filozofa Williama od Ockham (1284-1347), a kazuje da bi svaki problem
trebalo svesti na temeljne i najjednostavnije postavke. Sukladno temu, teorija koja na
najjednostavniji način tumači podatke ujedno je najbolja. Opisano načelo naziva se Ockhamovom
34
35
25
Ivo V.
oštricom. Kad neku teoriju ocijenimo kao najjednostavniju moguću, to još ne znači da je ona uistinu
jednostavna. Ponašanje može biti toliko složeno da ne podliježe jednostavnim objašnjenjima. Neka
je teorija jednostavna ako malim brojem temeljnih načela objašnjava cjelokupnu raznovrsnost
pojava iz domene kojom se bavi jednostavnost, međutim, nije presudan kriterij. Primjerice, klasična
bihevioristička teorija kakvu je zastupao Watson (1924) temelji se na vrlo jednostavnoj paradigmi:
P  O (podražaj uzrokuje odgovor)35
No poslije, zbog nemogućnosti utvrđivanja izravnih veza između podražaja i odgovora, neo-
bihevioristi unose i posredujuću varijablu koja se umeće između podražaja i odgovora, čineći njihov
odnos složenijim:
P  Organizam  O
Premda je prvotna jednadžba nedvojbeno jednostavnija, nije se održala upravo zbog nemogućnosti
da se njome valjano tumači ponašanje. Na primjer: istraživač pretpostavlja da će uskraćivanje hrane
na dulje vrijeme (recimo 12 sati) neizbježno dovesti do uzimanja hrane kad se ona ponudi
ispitaniku. No u situaciji u kojoj ispitanik osjeća mučninu ili pak drži redukcijsku dijetu, takva se
očekivanja neće ispuniti. To znači da deprivacija ne uzrokuje uzimanje hrane automatski, već
postoji i posredujući proces u organizmu. Primjer je namjerno grubo pojednostavljen.
Uvijek kad se jednostavnija teorija zamjenjuje složenijem treba dokazati da je ova druga doista
potrebna i nužna, odnosno da jednostavnost ima za cijenu preveliku nepreciznost u predviđanju ili
nemogućnost tumačenja različitih ponašanja na koja se odnosi. Jednostavnost stoga valja ocjenjivati
u skladu s ranije uspostavljenim načelima. No i tu postoje stanovite nesuglasice. Popper (1959),
primjerice, smatra jednostavnijom teorijom onu ko'u 'e lakše opovrgnuti. Načelo jednostavnosti
često se poistovjećuje s Morganovim kanonom štednje, prema kojem neko ponašanje ne treba
tumačiti sposobnostima što se susreću na filogenetski višoj razini ako ih je moguće objasniti onima
s filogenetski niže razine. C. Lloyd Morgan, zoolog i komparativni psiholog s kraja devetnaestog i
početka dvadesetog stoljeća suprotstavio se, naime, antropomorfističkim nastojanjima u tumačenju
životinjskog ponašanja pozivajući se upravo na zahtjev za jednostavnošću. Kao primjer neka
posluži često pozivanje na inteligenciju pri tumačenju ponašanja životinja, unatoč mogućnosti da se
ona objasne instinktom ili navikama.
2.1.3.4 DOSLJEDNOST
Za teoriju je također važna njezina dosljednost i izbjegavanje unutarnjih proturječja. Ako takva
proturječja postoje, teško je naći izvode na temelju kojih bi ona bila testirana. Pretpostavimo li,
primjerice, da osoba A prema osobi B ima neprijateljski odnos i da će se prema njoj ponijeli
agresivno, takva je očekivanja razmjerno lako provjeriti. Pri njihovu međusobnom susretu
očekujemo da osoba A napadne osobu B, da stane na nju vikati ili da izrazom lica pokaže bijes što
ga osjeća. No ako pretpostavimo da se agresivnost može pojaviti u otkrivenom, ali i prikrivenom
obliku, primjerice kroz pretjeranu ljubaznost, putem mehanizma reaktivne formacije, tada teorijske
izvode ni na koji način nije moguće provjeriti. Takva je teorija nedosljedna 36 zbog toga što dopušta
posve različita ponašanja u istoj situaciji. Osim nedosljednosti, takvoj se teoriji može za mjeriti i
neoborivost koju ćemo spomenuti nešto kasnije.
2.1.3.5 PRECIZNOST PREDVIĐANJA
Teorije koje precizno predviđaju događaje smatraju se boljima od onih čija s predviđanja odveć
općenita. Tako je, primjerice, predviđanje da će ekstraverti imati bolje kratkoročno, a intraverti
bolje dugoročno pamćenje općenitije i stoga slabije od predviđanja da će, zbog posebnosti procesa
konsolidacije, introverti u odnosu na ekstraverte slabije pamtiti u prvim minutama, a bolje nakon 30
ili više minuta. Preciznost predviđanja od presudne je važnosti pri testiranju izvoda neke teorije, ali
ima i naglašenu praktičnu važnost. o zbog složenosti pojava što se izučavaju unutar psihologije,
teorijska predviđanja najčešće nisu posve precizna. Načelo preciznosti uvelike se preklapa s ranije
spomenutim načelom činjenične zasnovanosti jer se podrazumijeva da preciznija teorija posjeduje
35
36
36
37
26
Ivo V.
veću podršku empirijskih pokazatelja. No preciznost predviđanja ujedno pokazuje koliko su naša
teorijska objašnjenja otišla daleko u tumačenju uzroka neke pojave. Predviđanje je tim bolje što
smo teorijom obuhvatiti više stvarnih uzroka (shvaćenih u probabilističkom smislu, dakle kao
pojava koje povećavaju vjerojatnost posljedice). To se posebno jasno može vidjeti u postupku
regresijske analize, opisane u kasnijem dijelu teksta, jer se dodavanjem prediktorskih varijabli
popravlja prognoza, a smanjuje greška. I sam pojam greške, kao veličine odstupanja od prognozira
ne vrijednosti, vezuje se uz djelovanje velikog broja neprepoznatih uzročnika koji nisu uzeti u obzir.
2.1.3.6 OBUHVATNOST
S obzirom na to da znanost teži objasniti pojave u što širem opsegu i na što općenitiji način,
obuhvatnost teorije njezina je vrlo važna odlika. Obuhvatnost se očituje u mogućnosti teorije da
objasni velik broj različitih pojava iz neke dom ne. Ona upućuje na snagu i univerzalnost pravila što
ih neka teorija propisuje, te istodobno pruža široku mogućnost provjere ispravnosti iz nje proizišlih
predviđanja. Uske teorije ili one koje objašnjavaju samo jednu specifičnu pojavu redovito posjeduju
tek ograničenu, ili uopće dvojbenu vrijednost.
2.1.3.7 MOGUĆNOST PROVJERE
Jedan od najvažnijih kriterija vrijednosti empirijski utemeljenih teorija svakako je mogućnost
provjere. Bez takve mogućnosti teorije ostaju posve u domeni nagađanja a njihovu stvarnu
vrijednost teško je procijeniti. Mnoge su teorije u vrijeme svoga nastanka bile lišene mogućnosti
(cjelovite; provjere zbog nedostatne razvijenosti raspoloživih metodoloških oruđa, ali se uglavnom
pokazalo da je njihov utjecaj na znanost (ali ne nužno i na laičke razmišljanje) bio upravo razmjeran
njihovoj empirijskoj verificiranosti.37
2.1.3.8 MOGUĆNOST OBARANJA
Kako je rečeno u uvodnome dijelu, teorija koja se ne može oboriti, nema znanstvenu vrijednost.
Ovo je načelo uvelike isprepleteno s prethodno izloženim kriterijem mogućnosti provjere. U
pravilu, teorija je neoboriva kad iz nje ne proizlaze jasna predviđanja o pojavama koje nastoji
protumačiti. To se obično dešava s teorijama koje su: pretjerano uopćene ili apstraktne, neprecizne i
neodređene ili su meta fizičkog karaktera odnosno neprovjerljive iskustvom. U svakom od tri
slučaja, pojavljuju se poteškoće prilikom pokušaja provjere jer takve teorije, u pravilu, omogućuju i
čak olakšavaju dolaženje do potvrdnih nalaza, priječeći istodobno one opovrgavajuće. O takvim,
pseudo-znanstvenim teorijama govorili smo na samome početku te nećemo posebno razrađivati
ranije izneseno Popperovo (1959) stajalište.
2.1.4 PRISTUPI U STVARANJU TEORIJA
Načelno gledano, teorija bi, prije svega, trebala pružiti uvjerljivo objašnjenje obuhvaćenih pojava.
Ono na čemu u konačnici počiva svaka znanstvena teorija jesu empirijski podaci. Teorija, međutim,
ne mora nužno polaziti od podataka. Oni mogu biti polazna točka u građenju teorija, ali se u
povijesti često događalo da služe tek kao oblik iskustvene provjere racionalno domišljenih model .
Nakratko ćemo se osvrnuti na različite pristupe izgradnji teorija.
Marx (1963) razlikuje četiri načina dolaženja do teorije razvrsta na s obzirom na smjer povezanosti
između pojmovno (teorijske) i iskustveno razine (podataka). I sam je autor pritom svjestan kako se
radi o idealnim tipovima koji se u čistom obliku rijetko susreću u znanstvenoj praksi. Autorovu
klasifikaciju ipak prenosimo zbog preglednosti i pojmovne jasnoće. Prema Marxu, dakle, možemo
razlikovati:
1. Model
2. Deduktivnu teoriju
3. Funkcionalnu teoriju
4. Induktivnu teoriju
Model je, prema Marxu (1963) svaka pojmovna analogija koja nalaže empirijsko istraživanje.
Chapanis (1961) obrazlaže kako se radi o sličnosti ili predstavljanju nekog aspekta složenog
37
38
27
Ivo V.
događaja, strukture ili sustava putem simbola koji na neki način nalikuju pojavama u odnosu na
koje služe kao modeli. Jedan od vrlo učestalih primjera modela u psihologiji jesu noviji pristupi
izučava nju ljudskih kognitivnih funkcija kroz analogiju s umjetnom inteligencijom. Takav vid
pojmovne analogije mogao bi se pripisati i "hidrauličkoj" koncepciji agresivnosti (Lorenz, 1970),
prema kojoj do agresivnosti dolazi nakon što nagomila na energija prijeđe određene okvire, bez
obzira na vanjske okolnosti. Ne želeći pretjerano ulaziti u problematiku korištenja38 modela u
psihologiji i širinu primjene kao sredstva u izgradnji teorije (Lachman, 1960), valja samo reći da se
njegova funkcija kreće od čisto ilustracijske, pa sve do interpretacijske.
Na slici je vidljivo da smjer utjecaja ide isključivo od modela prema podacima, odnosno od
pojmovne prema empirijskoj razini. Drugim riječima, istraživanje se provodi tako da se testiraju
pretpostavke proizašle na temelju korištenog modela. Modeli su od ograničene. važnosti u izgradnji
teorije i ako se ne priklonimo nekom od načina koji će naknadno biti opisani, ne možemo računati
na prevelik dobitak, bez obzira na to jesmo li model potvrdili ili ga opovrgli. Ako je istraživač
uistinu zainteresiran za izgradnju teorije, vjerojatno će osnovni model nastojati proširiti
deduktivnim putem.
Deduktivna teorija polazi od manjeg broja logički domišljenih općih načela, iz kojih se dalje izvode
ona manje općenita s namjerom da se u konačnici objasni i svaki pojedinačni slučaj. Ona počiva na
nizu logički izvedenih zakona. pri čemu je naglasak na pojmovnoj strukturi i njezinoj održivosti. U
užem smislu, takva teorija podrazumijeva skromnu empirijsku utemeljenost i snažnu usmjerenost na
stvaranje ustrojenog sustava međusobno isprepletenih zakona koji proistječu iz manjeg broja općih
pravila. Iskustveni podaci nemaju veliku ulogu u izgradnji teorije, ali zato postoji naglašena potreba
njezine empirijske provjere. Otuda strelice koje se kreću od pojmovne prema empirijskoj razini.
Ipak, u konačnici svaka je razumna teorija zasnovana na empirijskim podacima i podložna
modifikaciji nakon empirijske provjere. Na to upućuju ukošene strelice.
Najpoznatiji primjer deduktivnog pristupa izgradnji teorije svakako je Hullov složeni sustav
ljudskog ponašanja (Marx i Hillix, 1963) nastao po uzoru na formalizirane matematičke i fizikalne
teorije poput Euklidove ili Newtonove. Svoju teoriju Hull je započeo iznošenjem određenog broja
postulata na temelju kojih je izvodio teoreme kao deduktivne posljedice.39
Izgradnja teorije koja se posve ili uglavnom temelji na dedukciji nekih općih načela svakako nije
preporučljiva jer takva empirijski slabo utemeljena tvorevina rijetko kad može pružiti veliku
spoznajnu dobit. Usto takav pristup može istraživača učiniti slijepim za drugačije viđenje pojava i,
ako se radi o utjecajnom učenju poput Hullova, usporiti razvoj cijelog znanstvenog područja.
Nažalost, velika većina deduktivnih teorija žrtvovala je zdravu znatiželju sadržanu u empirijskom
pristupu za eleganciju i prividnu koherentnost formaliziranog logičkog sustava.
Induktivna teorija osnovni naglasak stavlja na podatke. U biti, takva se teorija sastoji samo u
povezivanju empirijski potvrđenih veza među pojavama u pravila i zakone. Zbog toga što izbjegava
38
39
39
40
28
Ivo V.
zaključivanje i deduktivnu logiku, zazirući usto od svake hipotetičnosti, takav je pristup zapravo
ateoretičan. Vjerojatno najpoznatiji zagovornik induktivnog pristupa bio je B. F. Skinner (1938 koji
je u vlastitom radu najgorljivije branio načela strogog pozitivizma, ističući sigurnost znanja što ga
jamče utvrđene činjenice i odričući se puta koji se, makar i dijelom, naslanja na spekulaciju. Sam
Skinner (1950) je tvrdio kako teorije koje sadrže elemente nagađanja u psihologiji nisu potrebne niti
poželjne. Čisti induktivni pristup podjednako je problematičan kao i onaj posve deduktivni. Prvi je
njegov problem samo prividna lišenost nagađanja, hipotetiziranja i teoretiziranja. Zapravo, čak i
najstroži pozitivist rukovodi se nagađanjem pri izboru problema i istraživačkog nacrta. Drugo,
izbjegavajući zaključivanje i zaključke koji, doduše, nisu posve izvjesni, ograničavamo se samo na
gole činjenice, što je prilično neučinkovit način spoznavanja (Marx, 1963a). Iako je ispravno reći da
se znanstvena spoznaja, poput mozaika, sastoji od brojnih djelića činjenične građe, teorijski slijepo
gomilanje takvih elemenata prije će sličiti kaotičnoj zbrci nego umjetničkom djelu. Upravo je
teorija ono što cjelokupnom procesu udahnjuje smisao. Nada, svojstvena nekim istraživačima, da će
samo prikupljanje empirijske građe kvalitetno pridonijeti spoznaji slabo je opravdanje za
odustajanje od teorijski vođenih istraživanja. Nagađanje i pretpostavke ne nude potpunu sigurnost,
ali mogu bitno olakšati i ubrzati stjecanje spoznaja o istraživanim pojavama.
Funkcionalna teorija u najvećoj mjeri potiče neprestanu razmjenu između pojmovne razine i
podataka. Ona je najbolja ravnoteža između deduktivnog i induktivnog pristup, jer zadržava snažno
uporište u pojmovnoj i teorijskoj razini, ali poglavito kao sredstvu usmjeravanja empirijskih
istraživanja. Radonjić (1981 drži da je ovakav tip teorije usmjeren k problemu, dok su deduktivni
sustavi usmjereni na sebe, s ciljem izgradnje cjelovite i obuhvatne teorije. Zbog toga su
funkcionalne teorije po opsegu redovito uže. Nasuprot induktivnim teorijama, one funkcionalne
priznaju nagađanje i hipotetičnost koje koriste kako bi ubrzale proces stjecanja spoznaja, ne
robujući isključivo utvrđenim činjenicama. Balansirajući između krajnje deduktivnih i induktivnih
pristupa, funkcionalne teorije izbjegavaju osnovne prigovore upućene objema, zbog čega je takav
model izgradnji teorija tipičan za suvremenu psihologiju.40
Valja na ovom mjestu barem spomenuti i istraživanja koja ne polaze od određenog teorijskog
modela, a podjednako se često, ili čak češće susreću u istraživačkoj praksi. Riječ je o primijenjenim,
akcijskim i evaluacijskim istraživanjima koja se u pravilu usredotočuju na izdvojeni problem, bez
želje za njegovom teorijskom razradom.
2.1.5 PROŽIMANJE TEORIJA I ISTRAŽIVANJA
Upravo smo vidjeli u kakvom sve odnosu mogu biti empirijski podaci i njihova teorijska
nadgradnja. Naglasili smo, međutim, da su teorije koje se temelje isključivo na dedukciji ili
isključivo na indukciji više ustupak privlačno jednostavnoj klasifikaciji nego nešto što se stvarno
često susreće u praksi. Čak i primjeri koje smo ponudili, poput Hullove ili Skinnerove teorije,
uvelike se opiru takvom pojednostavljenom razvrstavanju. Posvetit ćemo se stoga opisivanju
međuodnosa teorija i istraživanja kakav se najčešće susreće u praksi, a po svojim je obilježjima
najbliži funkcionalnom pristupu izgradnji teorije. Znanstveni rad odlikuje se neprekidnim prožima
njem istraživanja (prikupljanja empirijske građe) i teorija (misaonog uobličavanja činjenica). Takvo
se prepletanje odvija prema zakonitostima koje najbolje opisuje spiralni model izmjene induktivnog
i deduktivnog pristupa, donekle preuzet od Cattella (1966), koji ga je nazvao induktivno-
hipotetičko-deduktivnom spiralom. U njemu se neprekidno izmjenjuju izgrađivanje i testiranje
teorija.
Induktivna metoda, zaključivanje od pojedinačnog k općem, u pravilu je početak znanstvenog
pregnuća. Istraživači ga primjenjuju kad god izučavaju probleme koji su dotad bili zapostavljeni ili
malo istraživani. Pri korištenju induktivne metode, istraživač je ponajprije zainteresiran za
bilježenje činjenica i utvrđivanje zakona prema kojima se pojavljuju. To je, može se reći, početak
života svake teorije.
Britanski psiholog Eysenck koji se bavio izučavanjem ličnosti započeo je s istraživanjem u kojem je
prikupio niz podataka o velikom broju osoba (Eysenck, 1947). Analizirani su biografski podaci,
40
41
29
Ivo V.
tjelesne i fiziološke mjere, upitnički i testovni rezultati, samoprocjena i bilješke opažača.
Faktorizacijom41 tako opsežnog skupa podataka, Eysenck je utvrdio dvije temeljne, međusobno
neovisne dimenzije ličnosti, ekstraverziju prema introverziji i neuroticizam prema emocionalnoj
stabilnosti. Eysenckov pristup dobro ilustrira induktivni pristup svojstven početnom oblikovanju
teorijskog okvira.
Nakon prikupljanja određene količine empirijske građe koja dostaje za oblikovanje teorije,
istraživači se služe deduktivnom metodom kako bi ispitali 42 postavljenu teoriju. Slijedeći takvu
metodu, istraživač polazi od teorije, crpući iz nje izvode i implikacije koje potom provjerava kako
bi ispitao njezinu održivost. Kako u praksi izgleda ovaj proces? Početni korak je proučavanje teorije
i to takvo koje će pružiti izvode i implikacije koji iz nje proistječu. Potom se takve implikacije
oblikuju u pretpostavke koje moraju biti empirijski provjerljive, što znači da su otvorene iskustvu i
opažanju, omogućujući podjednako potvrđivanje kao i opovrgavanje teorije. Ako empirijska
provjera pokaže ispravnost pretpostavki, teorijski model se potvrđuje, a u protivnom biva odbačen
ili modificiran.
Kako bi objasnio razlile« među ljudima na dimenziji ekstraverzija - introverzija, Eysenck (1967) je
formulirao teoriju pobuđenosti koja opisuje fiziološke mehanizme na kojima, prema pretpostavci,
one počivaju. Prema toj teoriji, za veću ili manju ekstravertiranost u pojedinca odgovoran je
uzlazni retikularni aktivacijski sustav (URAS). Sukladno autorovim pretpostavkama, pobuđenost
tog sustava je u ekstraverata trajno snižena, a u introverata trajno povišena. Zbog toga, kako drži
Eysenck, ekstraverti stalno teže zabavi, provodima, pustolovinama, seksu i uopće aktivnostima koje
bi njihovu kronično smanjenu pobuđenost podigle na višu razinu. Suprotno vrijedi za introverte,
redovito suzdržane i povučene u društvu. Teorijske implikacije Eysenckove teorije upućuju na to da
poželjna razina podražaja bila niža za introverte u odnosu na ekstraverte. Ova je pretpostavka
testirana u nizu pokusa (Eysenck i Eysenck, 1985). U jednom od njih, primjerice, provjereno je
pamćenje introverata i ekstraverata uz različito vrijeme odgode. U neposrednom pamćenju,
ekstraverti su bili znatno uspješniji, dok su se introverti pokazali nadmoćnima u odgođenoj
reprodukciji (duljoj od 30 minuta). Nalazi su sukladni teoriji jer odgođeno prisjećanje biva
olakšano višom razinom kortikalne pobuđenosti koja unapređuje konsolidaciju upamćenog gradiva.
Isti proces, međutim, ometa kratkoročno pamćenje, što potvrđuju i dobiveni nalazi.
Ponekad se prilikom testiranja i provjeravanja teorija pojavljuju i ozbiljne prepreke. Složene i
obuhvatne teorije često proizvode brojne provjerljive pretpostavke. U tom slučaju jedan
opovrgavajući dokaz obično nije dovoljan za rušenje cijele teorije. U drugim pak slučajevima,
teorije pretpostavljaju složen međuodnos elemenata na kojima počivaju, što ih čini teško
provjerljivima. Njih smo spomenuli kad smo se bavili pitanjima oborivosti teorije. Takve teorije
mogu imati i dug život, ali je njihova istinska vrijednost dvojbena.
Izgradnja teorija samo u idealnom slučaju slijedi korake koje smo upravo opisali. Poput svake
uopćene ilustracije ona ima uglavnom didaktičku vrijednost i znači racionalnu rekonstrukciju nečeg
što je možda nastalo na posve drukčiji način. U kritici onog što je nazvao ortodoksnim gledanjem
na teorije, Herbert Feigl (1970) uvjerljivo argumentira da je takva rekonstrukcija postupak bez
prevelike veze sa43 zbiljskim stvaralačkim procesom. Za većinu istraživača, na primjer, empirijsko
je istraživanje tek drugi korak u izgradnji teorije, a prvi je ideja koja se rađa na temelju intuicije ili
nesustavnog opažanja.
Ukratko možemo ponoviti da se znanstveni rad odvija u neprekidnom prožimanju teorijskog rada i
empirijskih istraživanja. Jedno bez drugog ne može dovesti do osjetnih pomaka u našoj spoznaji.
Same teorije bez istraživanja nisu više od nagađanja, subjektivne konstrukcije ili nepotvrđene ideje.
No ni slijepi empirizam, odnosno istraživanje bez polazne teorije nije strategija dugoga daha.
41
Faktorska analiza je matematičko-statistički postupak kojim se velik broj pokazatelja na temelju međusobne
povezanosti svodi na manji broj temeljnih odrednica (vidi Fulgosi, 1979).
42
42
43
43
30
Ivo V.
Istraživanja moraju imati svoj cilj, teorijsko opravdanje i relevantne probleme kojima se bave. U
protivnome, najčešće znače uzaludan trud. Ustvrdit ćemo stoga da je neprocjenjiva važnost teorije u
organizaciji empirijske građe, tumačenju postojećih činjenica i usmjeravanju istraživanja u
određenom području. Istraživanja služe podjednako44 oblikovanju teorija koliko i njihovu
mijenjanju, modificiranju i neprekidnom provjeravanju.
2.2 NORMALNA ZNANOST I ZNANSTVENA REVOLUCIJA

Jedno od danas šire prihvaćenih gledišta o tome kako znanost napreduje, koje ujedno pokazuje
neraskidivu povezanost teorija i istraživanja, iznio je 1962. Thomas Kuhn. On razlikuje normalnu
znanost, utemeljenu na prethodnim, naširoko prihvaćenim, znanstvenim dostignućima od
znanstvene revolucije, koja naglo mijenja dominantnu istraživačku paradigmu.
Normalna znanost je uglavnom rutinska provjera dominantne teorije u bilo kojem povijesnom
razdoblju. Postojanje dominantne paradigme očituje se u prihvaćenosti određenog teorijskog
modela od većine djelatnika u području te u suglasnosti oko metodologije istraživanja i uvjeta
dokazivanja odnosno odbacivanja hipoteza. Takvi se modeli nadalje predaju kao temeljno gradivo
studentima i čine okosnicu vodećih istraživačkih projekata. No paradigmatski modeli nisu nikada
dokraja savršeni, tako da se redovita znanstvena aktivnost uglavnom sastoji u dopunjavanju i
nadograđivanju teorije kako bi se postojeća odstupanja uklonila. Kada to naposljetku više nije
moguće, odnosno kad postojeći model postane preuzak za nadolazeće spoznaje, nastupa, prema
Kuhnu, revolucija koja iz temelja mijenja paradigmu. Znanstvena revolucija je stoga nagli razvoj
suparničke paradigme koju znanstvena zajednica može tek postupno prihvatiti. ccs odbacivanja
dominantne paradigme započinje njezinom provjerom. Naime, empirijske provjere različitih
teorijskih izvoda i implikacija obično pokažu određena odstupanja od teorijskih očekivanja. Takva
odstupanja Kuhn naziva "anomalijama". One postaju sve očitije i izraženije kako napreduju
44
44
31
Ivo V.
istraživanja. U određenom trenutku postavlja se suparnička teorija koja izučavane pojave tumači na
drugi način. No, kako smatra Kuhn, znanstvene su revolucije razmjerno rijetke. Najveći dio
vremena, istraživači se bave normalnom znanošću.
2.3 ISTRAŽIVAČKI PRISTUPI

Istraživačke pristupe moguće je kategorizirati prema tri osnovna načela. S obzirom na njih,
razlikujemo:
1. temeljna (fundamentalna) i primijenjena istraživanja
2. nomotetska i idiografska istraživanja
3. kvantitativna i kvalitativna istraživanja45
2.3.1 TEMELJNA I PRIMIJENJENA ISTRAŽIVANJA
Temeljni istraživački pristup bavi se prikupljanjem spoznaja o nekom problemu koji nije izravno
primjenjiv niti praktično iskorisriv. Probici takvog pristupa uglavnom su spoznaj ne naravi.
Primijenjena se istraživanja, naprotiv, bave problemima čije rješavanje donosi neku neposrednu
praktičnu korist. Ona se redovito nadovezuju i naslanjaju na temeljnu znanost. Istraživači koji ih
provode redovito konzultiraju temeljne znanstvene spoznaje šireg područja unutar kojeg se nalazi
njihov problem. No i temeljna znanost biva obogaćena nalazima primijenjenih istraživanja. Ona,
naime, znače neizravnu potvrdu izvoda i pretpostavki što potječu od neke teorije, svjedočeći ujedno
o njezinoj praktično] upotrebljivosti, Usku spregu temeljnih i primijenjenih istraživanja
demonstriraju brojni primjeri, a mi ćemo navesti samo neke. Područje istraživanja stavova u
psihologiji, njihova usvajanja, održavanja i mijenjanja te veze s ponašanjem, dominira socijalnom
psihologijom od 1930-ih godina naovamo. Praktičnu primjenu brojne tako prikupljene spoznaje
dobivaju u vrlo učestalim marketinškim istraživanjima (stavovi i ponašanje potrošača) te
predizbornim istraživanjima javnog mnijenja (prognoze rezultata izbora). Sličnih primjera ima u
svim granama psihologije. To je posebice slučaj u kliničkoj psihologiji, gdje se laboratorijski nalazi
o zakonitostima učenja neposredno primjenjuju u svakodnevnoj terapijskoj praksi.
Primijenjena i temeljna istraživanja dijele iste istraživačke "alate", i ne može se govoriti o
metodama koje isključivo koristi samo jedna od njih. Neke metode, međutim, upravo su
prilagođene praktičnim problemima, dok su druge nešto prikladnije za temeljni istraživački pristup.
2.3.2 NOMOTETSKA I IDIOGRAFSKA ISTRAŽIVANJA
Ciljevi nomotetskog istraživačkog pristupa sastoje se u uspostavljanju širokih uopćavanja i zakona
koji vrijede za populaciju u cjelini. Uobičajeno je stoga da se nomotetska istraživanja temelje na
ispitivanju velikog broja ljudi i statističkoj obradi dobivenih podataka. Pokazatelji dobiveni na taj
način razmjerno dobro opisuju ispitivanu populaciju kao cjelinu, iako ne moraju biti svojstvene
svim ili čak većini pojedinaca. Nomotetski pristup je, prema tome, zainteresiran poglavito za
zajednička obilježja svih pripadnika ispitivane populacije. Pritom, dakako, postoji svijest o ponekad
i znatnim razlikama među pojedincima, ali nmotetska su istraživanja usmjerena upravo na traženje
sličnosti. Nasuprot nomotetskom, idiografski pristup počiva na izučava nj u pojedinca i
naglašavanju njegove jedinstvenosti. Allport (1961) je, primjerice, d žao kako je nomoterski pristup
nedovoljan i neprimjeren u spoznavanju pojedinca, te se zalagao za idiografsku metodu kao njegovu
nadopunu. Zbog svoje usmjerenosti na pojedinca, idiografski je pristup pogodan ponajprije u 46
kliničkim uvjetima. Velika većina istraživačkih metoda prilagođena je nomotetskom pristupu, što
znači da se njima nastoje spoznati obilježja-zajednička cijeloj populaciji. Temeljna istraživačka
metoda idiografskog pristupa je studija-slučaja.
2.3.3 KVANTITATIVNA I KVALITATIVNA ISTRAŽiVANJA

Podjela na kvantitativna i kvalitativna istraživanja u velikoj se mjeri poklapa s prethodno opisanom
podjelom nomotetskog i idiografskog pristupa. Kvantitativna istraživanja su ona koja pružaju
45
45
46
46
32
Ivo V.
brojčani opis istraživane pojave, redovito putem statističke analize i sažimanja izvornih podataka.
Za razliku od njih kvalitativna s istraživanja ne oslanjaj u na statističke zaključke, već nude dublji,
ali posve kvalitativan odnosno nenumerički opis pojave koju istražuju te su osobito pogodna za
idiografska istraživanja poput studije slučaja. Sama za sebe, kvantitativna istraživanja mogu
ponekad zavesti i proizvesti netočne zaključke ako istraživač nije posve svjestan svih dimenzija
izučavanog problema. Usto ona ponekad samo površno opisuju istraživanu pojavu, što nas lišava
dublje perspektive i boljeg razumijevanja problema. Stoga se kvalitativna istraživanja često koriste
kao početni korak u upoznavanju i definiranju problema ili nadopuna kvantitativnih istraživanja.
Ona pomažu istraživaču da se usmjeri na ono što ispitanicima doista znači kritičnu točku koju valja
ispitati.
Kao primjer možemo uzeti predsjedničku kampanju za čiju je strategiju vrlo važno neprestano
mjeriti stav javnosti o predsjedničkom kandidatu. No kvantitativna istraživanja raspoloženja
javnosti redovito nisu sama po sebi dovoljna, jer obično nismo posve svjesni razloga pomaka
stavova u jednom ili drugom smjeru. Zbog toga se često organiziraju tzv. fokus grupe - manje
diskusijske grupe koje čine sudionici određenih karakteristika koje raspravljaju o kandidatu,
njegovim kvalitetama i slabostima, osobnom stavu i razlozima sviđanja odnosno nesviđanja. Takvi
podaci mogu uputiti na ono što možda smanjuje kandidatov ugled u javnosti ili prednosti koje ga
uvećavaju. Nalazi su redovito bogatiji, sadržajniji i nemjerljivo živopisniji od onih dobivenih
kvantitativnim istraživanjem, ali su često i posve osobni, pa bez kasnije statističke potvrde imaju
ograničenu vrijednost.
Psihologijom izrazito dominira kvantitativni pristup, a kvalitativna metodologija uglavnom se
koristi kao njegova nadopuna. Ipak u novije vrijeme, kvalitativni pristup zadobiva sve više
poklonika jer se u središte pažnje znanstvenog zanimanja pomalo vraća osobno iskustvo koje je
takvim metodama neusporedivo lakše zahvatiti.
U nastavku je dan slikovit prikaz klasifikacije različitih istraživačkih metoda s obzirom na način
provođenja i spoznaje do kojih mogu dovesti. Slika 2.7 je organizirana rako da metode budu
poredane od onih koje nude manju moć zaključivanja prema metodama "veće snage". Bit će
svakako i onih koji se neće složiti s ovakvom klasifikacijom, držeći da su upravo kvalitativne
metode te koje nude dublje47 razumijevanje. Stoga je potrebno dodatno objašnjenje.
KVALlTATIVNE
1. Kvalitativno opažanje
47
47
33
Ivo V.
I. etnografsko opažanje
II. etološko opažanje
2. Nestandardizirani razgovori
I. fokus grupe
II. dubinski intervju
KVANTITATlVNE
3. Kvantitativno opažanje
4. Analiza sekundarne građe
I. analiza sadržaja
II. analiza arhivskih podataka
III. analiza fizičkih tragova
5. Korelacijske metode i psihologijsko mjerenje
I. testovi (sposobnosti, znanja)
II. ankete (mišljenja, stavova i interesa)
III. upitnici samoprocjene
JEOPISIVAN
ANJEPREDVIĐ
EVANJERAZUMIJ
6. Eksperiment
I.
kvazi-eksperimenti
 nacrt s neujednačenom kontrolnom skupinom
 prekinuti vremenski nizovi
S LI KA 2.7 Podjela istraživačkih metoda
Pojam razumijevanja u ovom slučaju korišten je kao mogućnost spoznavanja jedinstvenog uzroka
neke pojave (ne nužno determinističkog, već probabilističkog ili statističkog karaktera) koji se
može48 primijeniti na cjelokupnu populaciju. Kvalitativne metode nude razumijevanje pojava
spoznavanje uzroka) isključivo na pojedinačnim slučajevima ili manjim skupinama srodnih
pojedinaca.
Također, valja napomenuti da mnogi problemi u društvenim znanostima nisu dostupni
eksperimentalnom pristupu zbog nemogućnosti manipulacije varijablama, ali to ne znači da o
takvim pitanjima ne možemo postići razumijevanje korištenjem ne-eksperimentalnih metoda. Vidjet
ćemo u nastavku da, primjerice, korelacijska istraživanja mogu ponuditi itekako vrijedne nalaze,
osobito potpomognuta logičkom analizom ili modernim statističko matematičkim postupcima
kauzalnog modeliranja. Prikaz stoga ne treba uzimati doslovce, jer ni jedna metoda nije sama po
sebi dovoljna za odgovaranje na sva pitanja i probleme postavljene u nekom području psihologije.
Najbolji je način istraživanja stoga korištenje većeg broja međusobno komplementarnih metoda.
48
48
34
Ivo V.
Prikazana razdioba ipak ne znači savršenu klasifikaciju istraživačkih metoda, ponajprije zbog loga
što se različite strategije, kvalitativna i kvantitativna, često, barem nominalno, služe istim
metodama. Valja, naime, odmah napomenuti da je dio pobrojanih metoda sredstvo prikupljanja
istraživačke građe podjednako u kvalitativno i kvantitativno usmjerenim studijama. Dakako, kako
ćemo ubrzo vidjeti, takve nominalno 49 iste metode zapravo se temeljito razlikuju prema općem
pristupu i usmjerenju. Prikaz na slici 2.8 trebao bi nešto bolje oslikati prepletanje koje se pritom
pojavljuje.
U poglavljima što slijede nastojat ćemo dati opis svih pobrojenih metoda, praćen primjerima iz
prakse kako bismo buduće istraživače opremili nužnim znanjima za provođenje raznovrsnih nacrta.
Zbog nedostatka prostora nećemo preduboko zalaziti ni u jednu od njih. Držimo da je mnogo
važnije studenta uputiti u svu raznolikost i širinu mogućnosti što ih pružaju dostupne metode negoli
nametnuti vlastiti stav favorizirajući jednu od njih na račun drugih. Treba stoga još jednom naglasiti
kako svaka od metoda ima svoju važnost i mjesto u istraživanjima, a tek njihova kombinacija
obično nudi dublju i potpuniju obradu ispitivanog problema, bez obzira o kojem području
psihologije se radi. Za takav se metodski pluralizam založio znameniti metodolog Donald Campbell
i krug psihologa okupljen oko njega (Campbell, 1988; Campbell i Fiske, 1959; Webb i sur., 1966;
1981), držeći da združivanje različitih metoda, ma koliko svaka od njih bila manjkava, pridonosi
ukupnoj valjanosti nalaza jer se pretpostavlja da nedostaci svake od njih bivaju međusobno
kompenzirani. O zamisli višestrukog operacionalizma i načelima na kojima počiva više ćemo ipak
reći nešto kasnije.50
49
49
50
50
35
Ivo V.
3. ETIČKI PROBLEMI ISTRAŽIVANJA
Širenjem interesa znanstvene psihologije na osjetljive društvene probleme i uporaba istraživačkih
metoda koje zadiru tj. pojedinčevu privatnost, pridonijela je snažnom narastanju potrebe za
bavljenjem etičkim pitanjima u okviru istraživačke djelatnosti. Istraživačeva je etička odgovornost
velika te se pred njega postavlja niz zadaća. On je dužan istraživanje provesti u skladu s
a) vladajućim znanstvenim standardima,
b) ne čineći pritom nažao ispitanicima,
c) točno i iscrpno izvijestiti o dobivenim rezultatima poštujući načelo navođenja izvora
te
d) preuzeti punu odgovornost za posljedice što bi ih njegovi napisi mogli izazvati u
društvu.
Etički problemi u psihologijskim istraživanjima nisu, prema tome, jedna i jedinstvena cjelina, već
prije niz odvojenih pitanja i načela za postupanje u različitim istraživačkim etapama. Kako bi
zadovoljio propisana etička načela istraživač ih mora, ne samo dobro poznavati, već i u svakom
trenutku biti svjestan. Etički problemi nisu, naime, vezani uz određenu fazu istraživanja, već se
pojavljuju u svakoj od njih.
Hrvatsko psihološko društvo je popisalo osnovne etičke probleme i usvojilo načela postupanja u
pojedinim situacijama (HPD, 1996), temeljeći vlastiti kodeks na nešto iscrpnijem i potpunijem
američkom predlošku (APA, 1992). Temeljna zadaća psihologa je, prema navedenom izvoru,
širenje valjanih spoznaja o čovjeku i njegovu ponašanju te njihova primjena, s ciljem poboljšanja
kvalitete života pojedinca i ljudske zajednice. Premda publikacija o kojoj je riječ, "Etički kodeks
Hrvatskog psihološkog društva", ne sadrži samo naputke za istraživače već se odnosi na cjelokupno
polje interesa struke, istraživačkoj je problematici posvećen zapažen prostor. Sukladno Kodeksu,
psiholozi prihvaćaju i naglašavaju temeljno značenje slobode istraživanja i izražavanja u znanosti,
podučavanju i publiciranju. Sloboda je, za psihologe,51 temelj znanosti i svekolikog ljudskog
napretka. Psiholozi, nadalje, nastoje zajednici u kojoj djeluju pomagati pri upoznavanju i
razumijevanju pojava koje se tiču ljudskog doživljavanja i ponašanja, pri čemu zagovaraju slobodu
izbora svakog pojedinca, ako njihovo ponašanje ne šteti drugima.
U znanstvenom radu, kao i svakoj drugoj aktivnosti kojom se bave, psiholozi moraju težiti
ostvarenju najviših etičkih standarda. Njihova je osobna odgovornost i mnogo šira od toga jer im
kodeks nalaže da i druge, svoje učenike, studente, suradnike i kolege potiču na pridržavanje takvih
načela. Dio preambule kodeksa posvećen je i ekološkoj problematici, te se od psihologa traži da,
zbog zabrinjavajućeg pogoršanja uvjeta za život u biosferi te drugih nepovoljnih trendova razvoja
na našem planetu, preuzmu dio odgovornosti koju dijele sve znanosti i humanističke discipline u
ostvarivanju projekata održivog razvoja i očuvanja prirode i života na Zemlji.
Temeljna su etička načela rada psihologa, prema Etičkom kodeksu (HPD, 1996):
1. Poštovanje ljudskih prava i dostojanstva osobe
2. Kompetentnost
3. Profesionalna i znanstvena odgovornost
4. Integritet znanosti i struke.
Temeljna načela pružaju tek osnovne smjernice za rad psihologa istraživača. Ukratko, ona obvezuju
istraživača da se u vlastitom radu neprestano bavi različitim aspektima etičnosti, odnosno da se u
svakoj istraživačko] cjelini ponaša na način koji ne šteti ni pojedincu ni društvu ni cjelokupnoj
struci. U najkraćim ćemo crtama iznijeti objašnjenje temeljnih načela u onom njihovu dijelu koji je
posvećen istraživačkim problemima.
Poštivanje ljudskih prava i dostojanstva osobe
U svom radu i profesionalnom djelovanju psiholozi iskazuju bespogovorno poštivanje temeljnih
ljudskih prava, dostojanstva i vrijednosti svih ljudi. U istraživačkoj djelatnosti posebnu pozornost
51
51
36
Ivo V.
valja posvetiti upravo spomenutim ciljevima - očuvanju i nenarušavanju temeljnih ljudskih prava i
dostojanstva. Poštivanje prava na osobnost, povjerljivost, samoodređenje neka su od njih. Usto valja
biti svjestan i poštovati ljudske različitosti, ne dopuštajući da osobna uvjerenja ili stavovi iskrivljuju
zaključke. Osuđuje se također i svako diskriminacijsko ponašanje. Psiholozi istraživači su svjesni
postojanja individualnih i kulturalnih razlika među ljudima s obzirom na dob, spol, rasu,
nacionalnost, etničko porijeklo, religijsku pripadnost, seksualnu orijentaciju, tjelesne osobine, jezik
i socioekonomski status. Postojeće razlike prihvaćaju na otvoren i tolerantan način, nastojeći u
svom radu otkloniti sve oblike diskriminacije.52
Kompetentnost
Psiholozi nastoje ostvariti i zadržati visoku razinu kompetentnosti u svom radu. Svjesni su granica
svojih znanja i vlastite stručnosti. Služe se samo onim istraživačkim metodama i tehnikama za koje
su kvalificirani obrazovanjem ili iskustvom. U onim područjima istraživačkog rada u kojima nisu
utvrđeni pouzdani strukovni standardi, poduzimaju nužne mjere opreza, s ciljem osigura aja od
nestručnog postupanja. Također su svjesni važnosti znanstvenih i profesionalnih dosega u području
kojim se bave. Vode računa o dinamici razvoja psihologije kao znanosti, te se trude pratiti ovu
dinamiku i stalno stjecati i razvijati nove spoznaje i vještine. Ukratko, istraživač bi se trebao
oslanjati na dostupne znanstvene spoznaje, koristiti ih, ne prekoračujući istodobno vlastite
kompetencije, a naglašena je i potreba stalnog stjecanja novih znanja i trajne edukacije.
Profesionalna i znanstvena odgovornost
Ovo se načelo uglavnom odnosi na rad psihologa u praksi, ali su i istraživači dužni obavljati vlastiti
posao prihvaćajući stručnu i znanstvenu odgovornost za njegovu kvalitetu. Osobito je bitno da
vlastitim nestručnim radom ne ugroze ugled cijele psihologijske struke u društvu. Moralni standardi
i ponašanje moraju biti takvi da potiču izgradnju pozitivnog stava javnosti prema psihologiji i
prema psiholozima. Odgovornost se proteže i na druge psihologe istraživače s kojima surađuju.
Kako bi se spriječile ili izbjegle pojave neetičnog ponašanja, preporučuju se savjetovanja i
razgovori s kolegama.
Integritet znanosti i struke
Psiholozi istraživači teže promicanju integriteta psihologijske znanosti. Dužni su obavljati vlastita
istraživanja pošteno i uz poštivanje drugih. Pri izvještavanju, psiholozi ne dovode druge u zabludu,
ne prekrajaju nalaze niti ih krivotvore.
Među temeljnim načelima Hrvatskog psihološkog društva nisu se našla dva iz Kodeksa Američke
psihološke udruge, briga za dobrobit drugih i društvena odgovornost (APA, 1992). Kako ih držimo
podjednako važnima, ukratko ćemo ih opisati, radi potpunijeg upoznavanja s etičkim problemima
koji mogu proisteći iz njihova nepridržavanja. Psiholozi primarno nastoje pridonijeti dobrobiti
drugih. U svakom trenutku valja stoga odvagnuti vrijednost vlastitih istraživačkih nalaza i mogućih
spoznaja u odnosu na narušavanje dobrobiti ispitanika ili eksperimentalnih životinja. Društvena
odgovornost također je, uz stručnu i znanstvenu, itekako važna. Psiholozi bi u svakom trenutku
trebali biti svjesni vlastite odgovornosti zajednici i društvu u kojem žive. Oni provode istraživanja i
objavljuju svoje spoznaje kako bi pridonijeli ljudskom blagostanju te unaprijedili psihologijsku
znanost, nastojeći istodobno izbjeći netočne interpretacije podataka ili njihovu zloporabu.53
Osim vrlo uopćenim temeljnim načelima, psiholozi istraživači se u radu rukovode i nizom
praktičnih etičkih naputaka. Oni su vezani uz određene korake u provođenju istraživanja, a kako
ćemo ubrzo vidjeti, nijedna od faza znanstveno istraživačkog rada nije posve lišena rizika od
neetičnog djelovanja.
52
52
53
53
37
Ivo V.
3.1 PRIPREMANJE ISTRAŽIVANJA
Kako smo rekli, briga oko etičkih načela započinje prije samog istraživanja. Vrlo je bitno
istraživanje zamisliti tako da ono bude u skladu, ne samo sa zadanim zakonskim okvirima, već i
postojećim etičkim kodeksom. Prije samog istraživanja, istraživač je dužan zatražiti dopuštenje
ustanove u kojem provodi istraživanje. Pored toga, istraživač unaprijed mora voditi brigu o etičkoj
prihvatljivosti vlastitog nacrta, ali i vlastitoj sposobnosti i ekipiranosti da istraživanje provede na
stručan način i izvede iz njega valjane zaključke.
3.1.1 PLANIRANJE ISTRAŽIVANJA
Psiholozi bi trebali planirati, provoditi i izvještavati o istraživanju, poštujući načela znanstvene
kompetencije i istraživačke etike. To čine na način koji na najmanju mjeru svodi mogućnost krivih
tumačenja i pogrešnih zaključaka. Usto se stalno propituje etička prihvatljivost nacrta i poduzimaju
odgovarajući koraci kako bi se zaštitila prava i dobrobit ispitanika, drugih osoba uključenih u
istraživanje i eksperimentalnih životinja. Pri planiranju istraživanja psiholozi istraživači moraju se
rukovoditi Kodeksom, a u slučaju nejasnoća oko pojedinih problema savjetuju se s tijelom HPD-a
nadležnim za etička pitanja (Sud časti HPD-a).
3.1.2 ZNANSTVENA ODGOVORNOST
Psiholozi, kako kazuje kodeks, provode istraživanje znalački i poštujući dostojanstvo i dobrobit
sudionika, preuzimajući odgovornost za etičnost istraživanja što ga provode osobno ili osobe pod
njihovim nadzorom. Istraživači i njihovi pomoćnici provode samo one zadaće za koje su primjereno
uvježbani i pripremljeni. Kao oblik pripreme istraživačkog projekta, psiholozi se savjetuju sa
stručnjacima koji se bave istraživanom populacijom ili onom na koju će istraživanje u najvećoj
mjeri utjecati. Istraživanja valja provoditi na način koji se ne kosi sa zakonom niti s načelima
struke, osobito kad je riječ o postupanju s ispitanicima ili eksperimentalnim životinjama.
3.1.3 DOZVOLA USTANOVE
Prije istraživanja potrebno je od ustanove u kojoj bi se ono trebalo obaviti dobiti dozvolu za
njegovo provođenje. tu svrhu podastiru točne informacije o namjeni i 54 planiranom tijeku
istraživanja. Nakon dobivanja odobrenja, istraživanje se provodi u skladu s najavljenim i odobrenim
postupkom.
S obzirom na svu složenost i važnost etičkih pitanja, dobra je praksa pojedinih institucija i fakulteta
da sve istraživačke nacrte prethodno razmotri i odobri neovisni etički komitet. Kad takva instanca
ne postoji, istraživač bi se, prije negoli krene u istraživanje, trebao barem posavjetovati sa starijim
kolegama ili drugim osobama upućenima u problematiku.
Ono što etički komitet, ili, u slučaju da takvo tijelo ne postoji, drugi istraživači trebaju razriješiti,
jest odnos između moguće štete i pogibelji za ispitanike spram očekivane koristi što je donosi
istraživanja. Ta zadaća nije nimalo lagana. U nekim istraživanjima korist je nedvosmislena i
neposredno primjenljiva. Primjerice, pri ispitivanju novih lijekova za uklanjanje negativnih i
pozitivnih simptoma shizofrenije, ispitanici se obično u dvostruko slijepom eksperimentu (onom u
kojem ni osoblje ni ispitanici ne znaju koji lijek primaju) dijele na kontrolnu i eksperimentalnu
skupinu. Prva skupina prima lijek što se uobičajeno koristi, a druga novi lijek. Moguće negativne
posljedice uzimanja novog lijeka pritom su umanjene njegovom prethodnom provjerom na
životinjama. Dobit koju bi mogao proizvesti novi lijek svakako nadmašuje moguće nepovoljne
posljedice. Ponekad je, međutim, teško odvagnuti što je veća dobit. Tako je, primjerice, u kliničkim
uvjetima istraživač neprekidno suočen s etičkom dilemom treba li kontrolnoj skupini davati placebo
(neškodljivu, ali i farmakološki bezvrijednu tvar koja samo imitira lijek) kako bi provjerio tzv.
placebo učinak (utjecaj očekivanja osoba koje primaju neutralno sredstvo očitovan u pozitivnom
pomaku sličnom onom pri uzimanju djelotvornog sredstva ili lijeka). Postavlja se, naime, pitanje je
li etično uskratiti dijelu pacijenata terapiju, ali s druge strane, nalazi takvog istraživanja omogućuju
odbacivanje nedjelotvornih lijekova čiji učinak počiva isključivo na pozitivnim očekivanjima.
54
54
38
Ivo V.
3.2 ODGOVORNOST PREMA ISPITANICIMA
Istraživačka etika traži da se ispitanicima iznesu sve potankosti o istraživanju koje bi u razumnoj
mjeri mogle utjecati na njihovu spremnost na sudjelovanje. Dakako, istraživač pritom ne treba
otkrivati svrhu istraživanja niti vrstu manipulacije ako je ova uključena u nacrt, kako ne bi ugrozio
valjanost istraživanja. Istodobno, istraživač je dužan obavijestiti ispitanike o njihovoj mogućnosti
izbora hoće li ili ne sudjelovati u istraživanju. Obaviješteni pristanak nije potreban u anketnim
istraživanjima niti opažanju li prirodnim uvjetima, ali je nužan u istraživanjima koja ispitanike
izlažu psihičkoj ili fizičkoj pogibelji.55
3.2.1 SUGLASNOST ISPITANIKA
Već je rečeno da se sudionicima mora ponuditi pravo da sami odluče žele li sudjelovati u nekom
istraživanju. Dobivanje suglasnosti sastoji se od
a) pružanja odgovarajućeg objašnjenja,
b) dobivanja pristanka i
c) dobivanja pristanka zakonski nadležne osobe ili ustanove.
Najvažniji dio suglasnosti svakako je obaviješteni pristanak ispitanika za sudjelovanje u
istraživanju. Psiholozi se služe jezikom koji je razumljiv sudionicima kako bi od njih dobili
obaviješteni pristanak. Takav se obaviješteni pristanak potom dokumentira. Psiholozi obavještavaju
sudionike o prirodi istraživanja. Upoznaju ih s mogućnošću slobodnog odlučivanja o vlastitom
sudjelovanju ili nesudjelovanju u istraživanju, obavještavaju o predvidivim posljedicama odbijanja
ili napuštanja sudjelovanja kao i o čimbenicima koji mogu utjecati na njihovu želju za
sudjelovanjem (različiti rizici, neugoda, ograničena povjerljivost podataka, obmana u istraživanju).
Odgovaraju također i na sva druga pitanja mogućih sudionika. Kad se istraživanje provodi na
studentima ili podređenima, psiholozi posebno skrbe kako bi zaštitili sudionike prilikom odbijanja
ili napuštanja sudjelovanja. Kada je sudjelovanje u istraživanju obveza, mogućim sudionicima se
ostavlja pravo da tu obvezu ispune i na drugi način. Za osobu koja nije kadra pružiti obaviješteni
pristanak, psiholozi pribavljaju privolu zakonskog staratelja, ako je takvo što predviđeno zakonom.
Upoznavanje s mogućim rizicima što ih istraživanje nosi, ali i mogućnošću odbijanja sudjelovanja,
ključno je etičko načelo svakog istraživanja. Pri tome, dakako, nije opravdana nikakva vrsta pritiska
na potencijalne ispitanike. Obaviješteni pristanak trebao bi, u pravilu, biti u pismenom obliku i
sadržavati ime i prezime sudionika i potpisani tekst koji govori o cilju i prirodi istraživanja, navodi
glavnog i odgovornog istraživača i matičnu istraživačku ustanovu te sve ostale specifične potankosti
(primjerice, nagradu za sudjelovanje) vezane uz istraživanje. Istraživač je također dužan zaštiti
ispitanikovu osobnost i povjerljivost njegovih podataka. Njegovo se ime ne smije navoditi bez
posebnog odobrenja. Obaviješteni pristanak nije moguće dobiti od određenih kategorija osoba,
poput mentalno retardiranih, duševno poremećenih ili male djece. Njihovo sudjelovanje u
istraživanjima koja nose rizik može biti skopčano s ozbiljnim etičkim problemima. U pravilu valja
tražiti dopuštenje ustanove koja o njima skrbi ili njihove obitelji.
U nuđenju stručnih usluga pri poticanju mogućih ispitanika, psiholozi bi trebali jasno tumačiti
prirodu usluga jednako kao i moguće rizike, obveze i ograničenja. Psiholozi koji poštuju kodeks ne
nude pretjerane ili neprimjerene novčane ili druge nagrade kako bi pribavili ispitanike, pogotovo
ako bi ih one mogle navesti na prihvaćanje nerezonskog rizika.56
3.2.2 UPOZNAVANJE SUDIONIKA S PRIRODOM I CILJEM ISTRAŽIVANJA
Psiholozi se brinu o tome da sudionici u kratkom vremenu budu upoznati s prirodom, ciljem i
rezultatima istraživanja, nastojeći ispraviti njihove moguće pogrdne pretpostavke. Ako znanstveni
nalazi opravdavaju zadržavanje ili uskraćivanje ovih obavijesti, psiholozi se brinu da smanje rizik
od štete koja bi na taj način mogla nastati.
55
55
56
56
39
Ivo V.
Po završetku istraživanja, sudionike je potrebno dodatno obavijestiti o prirodi i cilju istraživanja. To
je osobito potrebno u istraživanjima koja se koriste obmanom ispitanika kako bi s provjerile neke
specifične pretpostavke. Kako ispitanici ne bi i nadalje bili zavedeni početnim uputama, što bi u
nekim slučajevima moglo imati štetnih posljedica, istraživač ih ukratko upozna sa, ovoga puta,
pravom svrhom istraživanja.
U svom klasičnom eksperimentu koji se bavio spremnošću na konformiranje,Asch (1951) je okupio
skupinu studenata kojima je rečeno da sudjeluju u studiji prosuđivanja veličina. Studente su posjeli
oko stola kako bi procjenjivali duljinu različitih crta. Samo je jedan od studenata bio stvarni
ispitanik, dok su svi ostali bili Aschovi suradnici. Prema unaprijed dogovorenom scenariju, svi su
oni davali iste, vidljivo pogrešne procjene duljina, što je ispitanika, koji je bio posljednji na redu za
procjenu, stavljalo u nezavidan položaj - ili će dati točan odgovor i biti potpuno izdvojen u svojem
mišljenju, ili će se pokoriti mišljenju većine. U konačnom zbroju 37% ukupno danih procjena
suglasilo se s očigledno pogrešnim mišljenjem većine.
Dakako, ispitanici su po završetku eksperimenta imali prilike doznati pravu svrhu istraživanja, jer bi
u protivnom bili izloženi vrlo neugodnom propitivanju vlastite percepcije i prosudbi. Usto, ovakvo
upoznavanje ostvaruje i dodatne pozitivne učinke jer se podučavanjem i pridavanjem pažnje
ispitaniku pridobiva njegova naklonost i podrška. Za studente psihologije, koji su vjerojatno
najčešće ispitivana populacija eksperimentalnih studija, to je ujedno i prilika za učenje
metodologije, a posebice same organizacije istraživanja.
3.2.3 KORIŠTENJE ŽIVOTINJA U ISTRAŽIVANJIMA
Etički kodeks jasno propisuje načine postupanja sa životinjama na kojima se provode istraživanja.
Prema njima se valja odnositi humano jer je riječ o nezaštićenim bićima koja ne mogu preuzeti
odgovornost za ono što im se događa tijekom istraživanja. Prije provođenja istraživanja psiholozi su
dužni voditi brigu i nadgledati životne uvjete životinja, poduzimajući pritom sve moguće mjere za
uklanjanje neugodnih podražaje i bolesti. Eksperimentalne postupke koji kod životinja 57 izazivaju
bol, stres ili deprivaciju valja izbjegavati, a opravdano ih je koristiti isključivo onda kad ne postoje,
drugi načini i metode dolaženja do znanstvenih spoznaja iznimne vrijednosti. U laboratorijskim
istraživanjima treba koristiti najmanji mogući broj eksperimentalnih životinja, osiguravajući
statističku snagu na drugi način (eksperimentalnim nacrtom ili odgovarajućim statističkim
postupcima).
3.3 OBMANA U PSIHOLOGIJSKOM ISTRAŽIVANJU

Obmanjivanje ispitanika bit je mnogih psihologijskih istraživanja. Bez njega ona vjerojatno nikad
ne bi bila provedena. Mnogi se s pravom pitaju ima li takvo ponašanje koje očito narušava načela
otvorenosti, poštenja i obaviještenog pristanka svog etičkog opravdanja. Etički kodeks HPD-a ne
posvećuje ovoj tematici veći prostor, ali držimo da je s njome potrebno upoznati buduće istraživače
te smo se u napisu oslonili na naputke što ih propisuje APA.
Ukratko prepričana, pravila Američke psihološke udruge propisuju sljedeća pravila ponašanja
vezana uz obmanjivanje ispitanika. Psiholozi provode istraživanja koja uključuju obmanu samo u
slučaju da utvrde kako su ona opravdanu znanstvenom, obrazovnom ili primijenjenom vrijednošću i
da Jednako učinkovita istraživanja bez uporabe obmane nisu izvediva. Nikad ne obmanjuju
sudionike o važnim aspektima istraživanja koji bi utjecali na njihovu spremnost na sudjelovanje,
poput fizičkog rizika, nelagode ili neugodnih čuvstvenih doživljaja. Svaka druga obmana koja je
značajka nacrta u cjelini ili načina njegova provođenja mora biti objašnjena sudionicima što je prije
moguće, po mogućnosti pri okončanju sudjelovanja, ali ne kasnije od zaključenja istraživanja.
Pri izučavanju određenih problema gotovo je nezamislivo provoditi istraživanje bez obmane
ispitanika. U nekim slučajevima dovoljno je prikriti dio informacija, dok drugi nacrti zahtijevaju
potpunu obmanu odnosno krivo obavještavanje.
57
57
40
Ivo V.
Istraživanje što ga je proveo S. Milgram (1974) dobar je primjer za potpunu obmanu ispitanika.
Autor je odlučio istražiti uvjete koji navode osobe na slijepo pokoravanje autoritetu. U
eksperimentu što ga je proveo na Sveučilištu Yale, sudjelovale su osobe starosti između 20 i 50
godina koje su se javile preko oglasa. Po dolasku u laboratorij, objašnjeno im je da sudjeluju u
istraživanju utjecaja kažnjavanja na uspješnost učenja, Prividno slučajno uvijek im je dodjeljivana
uloga eksperimentatorova pomoćnika koji je trebao kažnjavati netočne odgovore učenika sve jačim
električnim udarima. Osoba "odabrana" za učenje bila je zapravo istraživačev pomoćnik. Zbog
realističnosti, stvarni bi ispitanik prije početka dobio slabiji električni udar, a potom je mogao
gledati kako istraživačeva pomoćnika vezuju za stolicu pričvršćujući mu elektrode uz zapešće. U
glavnoj prostoriji laboratorija,58 stvarni ispitanik je posjednut uz istraživača pred kontrolnu ploču
kojom je navodno mogao zadavati strujne udare stupnjevane od slabijih do izrazito jakih (15-450
volti). Sa svakim pogrešnim odgovorom, istraživač je ispitaniku nalagao primjenu sve snažnijih
električnih udara. Dakako, istraživačev pomoćnik koji je preuzeo ulogu žrtve nije zapravo dobio ni
jedan električni udar, ali ispitanici to nisu mogli prozreti. Kako bi se pojačala iluzija, pomoćnik je
pri slabijim udarima, stenjao, pri jačima zapomagao i tražio da ga puste, da bi prilikom onih
najjačih odgovore zamijenili krikovi, a ako bi ispitanik prešao granicu od 330 volti, pomoćnik bi, u
skladu s prethodnim dogovorom, prividno ostao bez svijesti. Od 40 ljudi koji su sudjelovali u
pokusu, čak je njih 25 ili 63% išlo do kraja, slušajući naloge istraživača i kad se radilo o udarima
od 450 volti. Valja svakako istaknuti da ljudi koji su sudjelovali nisu ni po čemu bili posebni ni
odstupajući. Kasniji pokusi na drugim ljudima potvrdili su dobivene nalaze svjedočeći o
razmjerima koje može poprimiti slijepa poslušnost.
Milgramovo istraživanje, očito ne bi bilo izvedivo bez obmane, niti bi alternativna istraživanja bez
obmanjivanja ispitanika uspjela tako plastične i uvjerljivo opisati pojavu pokoravanja autor itetu.
Milgram se inače zalagao da se negativno konotirani izraz "obmana" zamijeni manje odioznim
terminima poput "maskiranje" ili "tehnička iluzija" kao i to da se psiholozima povremeno dopusti
odstupanje od etičkog načela poštenja i iskrenosti ako bi se time priskrbili znanstveno vrijedni
nalazi. Temeljni je problem da je obmana, s jedne strane, nedvojbeno etički neopravdana a sa druge,
nužna za provođenje određenih psihologijskih istraživanja. Pretpostavlja se, naime, da obmana,
skrivajući pravu svrhu eksperimenta, pruža priliku istraživaču da prati ponašanje ispitanika kakvo bi
uistinu bilo u sličnoj situaciji. Valja napomenuti da je Milgram bio svjestan etičke dvojbenosti
vlastitog istraživanja i nastojao je ublažiti negativne posljedice za uključene ispitanike pažljivo
sročenim završnim razgovorom u kojem bi se ispitanici osvjedočili da "žrtva" zapravo nije
povrijeđena. U razgovoru su ispitanici koji su odbili ići do kraja podržani u vlastitoj odluci, dok su
oni koji su se pokorili autoritet u bili informirani kako je riječ o posve uobičajenom i prirodnom
ponašanju, koje je u većine sudionika popraćeno nelagodom i napetošću. Iako nije riječ o klasičnom
završnom razgovoru u kojem se sudionike upoznaje sa svrhom i ciljem istraživanja, ovakav
postupak zasigurno je pridonio smanjivanju nelagode i tjeskobe kao mogućim posljedicama obmane
tako osmišljenog eksperimenta.
3.4 IZVJEŠTAVANJE O ISTRAŽIVANJU

Prilikom izvještavanja o rezultatima do kojih se došlo provedenim istraživanjem postoje jasna
pravila kojih se psiholozi moraju pridržavati. I ovdje ukratko iznosimo 59 osnovna načela sadržana u
Etičkom kodeksu HPD-a (1996), ali i neka pojašnjenja sadržana u Kodeksu Američke psihološke
udruge (APA, 1992). Istraživači, sukladno etičkim pravilima, točno i precizno izvještavaju o
rezultatima svojih istraživanja nipošto ih ne smiju izmišljati niti prekrajati. Ako otkriju značajne
greške u objavljenim podacima, poduzimaju odgovarajuće korake kako bi ih ispravili ili na njih
upozorili. Jednako tako, psiholozi ne prikazuju tuđe uratke niti njihove dijelove kao svoje, odnosno
ne plagiraju tuđe zamisli. Psiholozi nadalje preuzimaju odgovornost i zasluge za rad samo ako su
sudjelovali u njegovoj izradi i pisanju ili su mu značajno pridonijeli. Prvenstvo među autorima
odražava njihov relativni udio u izradi i pisanju rada, bez obzira na status. Sam položaj u instituciji,
primjerice predstojnika, ne opravdava priznavanje autorstva. Manji doprinosi naznačuju se
58
58
59
59
41
Ivo V.
prikladnim zahvalama u uvodu ili fusnotom. Student se navodi kao prvi autor bilo kojeg rada s
većim brojem potpisanih autora ako se temelji na njegovu diplomskom, magistarskom ili
doktorskom radu.60
Psiholozi ne objavljuju ranije objavljivane podatke kao izvorne. Ponovno objavljivanje mora biti
popraćeno odgovarajućom obavijesti o tome gdje su podaci ili rad izvorno objavljeni. Po
objavljivanju rezultata istraživanja, psiholozi trebaju pružiti drugima uvid u pohranjene podatke, ne
uskraćujući pravo kolegama da ponovnom analizom provjere drugačije pretpostavke. Takav se
postupak dopušta samo u tu svrhu i pod uvjetom očuvanja povjerljivosti odgovora ispitanika.
Rad na istraživačkom izvještaju ili znanstvenom radu potiče, kako vidimo iz iznesenog kratkog
prikaza brojna etička pitanja. Temeljno ili jedno od temeljnih je svakako pošteno iznošenje
podataka. Elementarna istraživačka etika zahtijeva od istraživača da ne izmišlja niti prepravlja poda
k . No istraživač ne smije ni izdvajati i prikazivati samo one rezultate koji su u skladu s njegovim
pretpostavkama. Naprotiv, njegova se etika ogleda u nepristranom iznošenju svih relevantnih
podataka, Poželjno je, nadalje, da istraživač neko vrijeme čuva materijale vezane uz istraživanje
(protokole, testove, upitnike, ankete), a trajno ili dulje vrijeme podatke pohranjene u računalu, kako
bi drugi istraživači mogli provjeriti njegove navode i zaključke. Isto tako, on, na zahtjev, treba
omogućiti drugim znanstvenicima pristup vlastitim podacima kako bi ponovili njegovu analizu ili
provjerili neku vlastitu hipotezu koja bi iste podatke objasnila na drugi način.61
Tako je, primjerice, 1990-ih godina u psihologiji ličnosti postalo izrazito naglašeno pitanje broja
temeljnih dimenzija koje su dovoljno opće, ali i obuhvatne da opišu ličnost u cjelini. Kako bi
dokazali postojanje pet dimenzija modela "Big five", Costa i McCrae (1992) su iznova analizirali
podatke Zuckermana i suradnika (1991) koji su faktorskom analizom brojnih upitnika pokazali kako
se ličnost na najopćenitijoj razini sastoji od 3 ili 5 dimenzija nepodudarnih s onima što su ih
zagovarali pristalice peterofaktorskog modela Smatrajući neke faktore nedovoljno dobro
reprezentiranima u podacima, Costa i McCrae su ponovili analizu koristeći se pritom ciljnom
rotacijom faktora te tako dobili izvjesnu potvrdu da se isti podaci mogu razumjeti i tumačiti na
drukčiji način.
U istraživačkim se radovima, nadalje, treba jasno dati do znanja što jest, a što nije autorova misao
ili rečenica. Svaki od korištenih izvora valja sukladno tomu citirati. Pored toga, ako se radi ne samo
o parafraziranju već doslovnom citatu, nije dovoljno samo navođenje izvora već i stavljanje
navodnih znakova, kako bi se naznačilo citiranje) 62. Svako odstupanje od ovih osnovnih pravila,
nenavođenje izvora. Ili izostavljanje navodnika pri citatu smatra se plagiranje. Nije rijetkost da
studenti, a ponekad i diplomirani psiholozi pripišu sebi ideje ili teorijske zamisli do kojih su prije
njih došli ili ih štoviše istražili drugi istraživači. Pritom se ne radi nužno o plagiranju, već je često
riječ o nemaru i površnom pregledu postojeće literature. Takva je greška podjednako neoprostiva,
ako je literatura dostupna i pristupačna pri elektronskom pretraživanju baza podataka. Istraživači su,
nadalje, dužni naznačiti kada se radi o izravnom, a kada o sekundarnom navođenju. Ako se citira
rad koji nije pročitan, već se o njemu sudi iz knjige ili drugog rada, to treba posebno napomenuti,
navođenjem kako izvorne, tako i sekundarne reference.
Pretražujući domaću stručnu i znanstvenu periodiku, naići ćemo i na radove koje potpisuje desetak
pa i više koautora. Premda neka istraživanja po svojoj složenosti uistinu i zahtijevaju opsežne
napore brojne ekipe, to je razmjerno rijedak slučaj. Češće je riječ o potpisivanju na radove onih koji
nisu sudjelovali u njegovoj izradi ili su to činili u nevelikom opsegu. Takvi se postupci mogu
ocijeniti neetičnima, premda ne podliježu nikakvim sankcijama. Opće je pravilo da se na rad
potpisuju samo istraživači koji su značajno pridonijeli njegovoj izradi, a ne oni koji su se tu našli
zbog svoje visoke funkcije ili su samo prikupljali podatke. Isto je tako važno osobi s najvećim
60
U Kodeksu HPD-a diplomski se radovi u tom kontekstu ne spominju, što vjerojatno odražava uvjerenje kako je
autorski doprinos studenata diplomanata katkad manji od onog njihovih mentora, što opravdava stavljanje mentora na
mjesto prvopotpisanog. Za razliku od Hrvatskog psihološkog društva, Američka psihološka udruga takvu, u nas dosta
čestu, praksu smatra etički nedopustivom.
61
60
62
Način citiranja literature opisan je i objašnjen u poglavlju koje se bavi pisanjem izvještaja i znanstvenog rada.
42
Ivo V.
doprinosom u izradi rada prepustiti prvo mjesto među autorima bez obzira na njegov znanstveni
status. To se posebno odnosi na studente koji u koautorstvu s mentorom objavljuju vlastite
kvalifikacijske radove.63
3.5 RECENZIJE
Dio posla psihologa je i recenziranje (vrednovanja) tuđih radova, prijedloga projekata, kandidatura
za stipendije, radna mjesta i slično. Prilikom recenziranja, psiholozi poštuju povjerljivost podataka i
autorska prava istraživača koji ih je iznio, što znači da ne smiju zloupotrijebiti informacije iz
recenziranog rada kako bi sebi priskrbili korist. Više o samome postupku recenziranja bit će rečeno
u poglavlju koje se bavi pisanjem znanstvenog rada.64
63
61
64
62
43
Ivo V.
4. TEMELJNI ELEMENTI ISTRAZIVACKOG PROCESA
Istraživački proces počiva na nekoliko ključnih elemenata i odvija se u nekoliko faza koje slijede
jedna za drugom. Od početne zamisli do zaključnog izvještaja, istraživanje u pravilu prolazi etape
prikazane na slici 4.1.
U nastavku ćemo se uglavnom baviti istraživačkim metodama, njihovim prednostima i nedostacima

te pojedinostima o kojima moramo voditi računa pri njihovoj primjeni. Važno je još jednom
naglasiti da ne postoje metode koje su same po sebi bolje ili lošije od drugih, već samo one koje su
u većoj ili manjoj mjeri primjerene pojedinom istraživačkom problemu. Stoga se izbor metode,
kako je prikazano na slici 4.1, naslanja na postavljeni problem i iznesene hipoteze. Prije negoli se
posvetimo opisu i obilježjima svake od metoda, zadržat ćemo se načas na elementima zajedničkima
većini istraživanja, a to su problem i hipoteza. Zapravo samo kvalitativna istraživanja ne polaze od
hipoteza niti se bave njihovim testiranjem. Ako istraživač procijeni da odabrani problem može
44
Ivo V.
najbolje istražiti primjenom kvalitativno metodologije, postavljanje polaznih hipoteza se ne
prakticira kako bi se izbjegla moguća pristranost nalaza. U svim kvantitativnim istraživanjima,
važnost problema i hipoteze je golema premda često podcjenjivana. Zajednički čine sponu između
teorijske razine i njezine empirijske provjere, čime uvelike određuju kvalitetu i korisnost
istraživanjem prikupljenih podataka. Bez odgovarajućih problema i smislenih hipoteza istraživanja
ubrzo zapadaju u "slijepu ulicu" pružanja teorijski bezvrijednih nalaza. Upoznajmo se stoga pobliže
s ovim, često ključnim, elementima istraživanja.65
4.1 ISTRAŽiVAČKI PROBLEM

Podjednako u svakodnevnom životu i u znanosti, problem je pitanje koje sadrži odgovor. Za razliku
od svakidašnjice, znanstveni problemi su nedoumice koje imaju svoje teorijsko značenje i čije
rješenje iziskuje uporabu znanstveno-istraživačkih metoda. Svako pitanje nije stoga i problem u
znanstvenom smislu. U psihologiji se problemi obično postavljaju u obliku pitanja kojim se
propituje (najčešće uzročno-posljedična) povezanost između dvije ili većeg broja varijabli. Ako je
naš problem utvrditi utječe li razina osvjetljenja na uspješnost u motoričkom zadatku, tada se on
može iskazati i kao propitivanje povezanosti tih dviju varijabli, osvjetljenja i učinkovitosti. Na
probleme, odnosno neriješena pitanja, nailazimo posvuda, ali samo o nekima od njih možemo
govoriti kao o zbiljskim istraživačkim problemima.
Odlike istraživačkog problema su:
1. Relevantnost (teorijsko značenje)
2. Nedovoljna istraženost ili proturječnost nalaza
3. Provjerljivost
4. Preciznost (specifičnost)
Kad se zapitamo: "Jesu li emocionalno nestabilne osobe sugestibilnije od emocionalno stabilnih?",
"Je li inteligencija važna za uspjeh u studiju psihologije?" ili "Kako utječe lišavanje sna na
psihomotoričku aktivnost?", postavili smo stanoviti psihologijski problem. No nije dovoljno
jednostavno postaviti problem, kako to običavaju početnici. Valja prije svega utvrditi radi li se o
relevantnom problemu, odnosno nosi li njegovo rješavanje kakvu spoznajno-teorijsku ili praktičnu.
korist. Ako je problem trivijalan ili besmislen, nije ga vrijedno rješavati. Primjerice, kad bismo
htjeli provjeriti je li čitanje i kupovanje knjiga povezano s inteligencijom, vjerojatno bismo dobili
očekivan nalaz kako su povezani, jer knjige u pravilu čitaju obrazovanije i inteligentnije osobe. U
Americi je svojedobno provedeno istraživanje koje je trebalo pokazati što donosi sreću, odnosno
koje su odlike sretnih ljudi. Nalazi su pokazali kako su veći stupanj sreće iskazali mladi, zdraviji i
imućniji ispitanici, na što su kritičari zajedljivo primijetili kako je popriličan novac poreznih
obveznika potrošen samo da bi se pokazalo kako je bolje biti mlad, zdrav i bogat negoli star,
bolestan i siromašan.
Temeljni nedostatak većine znanstvenih istraživanja koja dolaze do bezvrijednih ili trivijalnih
spoznaja leži u nedovoljnoj teorijskoj utemeljenosti problema. Ako problem nema odgovarajuće
teorijsko značenje, teško da će njegovo rješavanje dovesti do zamjetljive koristi. Od ovog pravila,
naravno, valja izuzeti brojna primijenjena istraživanja koja se bave društveno relevantnim
problemima, bez primarne želje za unapređenjem teorijskih spoznaja. Druga greška koju obično
čine početnici počiva na uvjerenju kako su upravo oni, po prvi put u povijesti prepoznali određeni 66
problem. Istina je redovito posve drukčija. Velika većina problema kojih se možemo dosjetiti
uglavnom je, ili u potpunosti, istražena Prvi korak u procjeni važnosti i teorijskog značenja nekog
problema svakako je proučavanje kako je on dosada rješavan. Istraživač stoga mora poći od teorije i
ranijih istraživanja podjednako šireg i užeg područja vezanog uz vlastiti problem.
Za okvirno upoznavanje s problemom obično će dostajati opći udžbenik toga područja (primjerice,
socijalne, kliničke ili neke druge grane psihologije), ali za stjecanje dubljeg uvida u istraživanu
tematiku svakako je potrebno pretražiti stručnu i znanstvenu periodiku. U prošlosti je problem
65
63
66
65
45
Ivo V.
prikupljanja literature rješavan obilaženjem ustanova koje se bave pohranom stručnih časopisa i
knjiga, ali danas se na sreću, velikim dijelom, možemo osloniti na kompjutore i osobito Internet.
Najbolji način okvirnog upoznavanja s problemom i pronalaženja stručne literature koja ga obrađuje
je kompjutorsko pretraživanje baza podataka dostupnih putem Interneta ili u pojedinim
specijaliziranim ustanovama (npr. u Nacionalnoj sveučilišnoj knjižnici). U većini slučajeva moguće
je pretraživati znanstvene časopise ili knjige uz zadavanje imena autora ili ključnih riječi. Kako bi
se istraživač okvirno upoznao s radom, naslovu članka pridružen je sažetak rada, a knjizi sadržaj.
Neke baze nude i pregledavanje cjelovitih radova pohranjenih u elektronskom obliku, što dodatno
olakšava pretraživanje literature.
Tek pošto istraživač temeljito prouči ono što je o problemu ranije izrečeno i napisano, može
zaključiti je li i nadalje vrijedan provjere i istraživanja. Ako o problemu postoji jednodušno
slaganje, pitanje je treba li ga ponovno istraživali. Ako se nizom istraživanja pokazalo da
povremeno nagrađivanje u neredovitim vremenskim intervalima ima bolje i dugoročnije učinke na
promjenu ponašanja od redovitog nagrađivanja, tada to prestaje biti istraživački problem. Ako je
problem iscrpno istraživan, ali su nalazi proturječni, nova su istraživanja dobrodošla. Psihologija
ličnosti temeljena na konceptu crta kao razmjerno trajnih i stabilnih dispozicija ponašanja dugo
traga za temeljnim dimenzijama kojima je moguće objasniti ponašanje pojedinca. Istraživanja
započeta još četrdesetih godina pionirskim radovima Cattella (l950) i Eysencka (1947) nastavljena
su nesmanjenim intenzitetom i danas jer još uvijek nije došlo do općeg konsenzusa. Krećući se
između 3 i 16 temeljnih dimenzija, istraživači se danas uglavnom dvoume oko Eysenckova i "Big
five" modela. Prvi zagovara postojanje triju, a drugi pet dimenzija.
Kako je rečeno u uvodnom dijelu, problem koji se ne može istražiti na empirijski način, nema
znanstvenu vrijednost. Problem može biti nedohvatljiv iskustvenoj provjeri na više načina i može se
baviti metafizičkim ili filozofskim pitanjima (poput pitanja "Postoji li bog?" ili "Što je primarno,
um ili materija?") ili pak vrijednosnim sudovima ("Tko je bolji skladatelj, Mozart ili Bethoveen? ili
"Koja je knjiga zanimljivija, Orkanski visovi ili Kvaka 22 ,), za koje je moguće dobiti tek prosječno
ili najučestalije mišljenje.67
Problem pojedinačnog istraživanja mora uza sve prethodno rečeno biti precizan i dovoljno
specifičan, jer ćemo na općenit problem rijetko kad biti u prilici potpuno odgovoriti. Postavimo li
pred sebe problem "Kakva je inteligencija duševnih bolesnika?" zadali smo si nerješivu zadaću.
Duševni bolesnici su izrazito heterogena skupina koja tek u najopćenitijem smislu pripada istoj
kategoriji. Među njima nedvojbeno ima onih čija je inteligencija izrazito narušena ili inicijalno niža
od prosjeka, ali i onih kod kojih je nedirnuta, često i natprosječna. Reći jednostavno da je
inteligencija u takvih bolesnika niža, premašila bi bit problema. Usto, naš problem je nedovoljno
precizan u određenju drugog ključnog pojma, inteligencije. Premda danas prevladava stav kako ona
počiva na jedinstvenoj općoj dimenziji (g faktoru), ipak je riječ o složenom konstruktu koji okuplja
stanovit broj umjereno povezanih nižih faktora, poput verbalnog, numeričkog, spacijalnog i drugih.
Preopćenito i nejasno određen problem vodi isto takvim zaključcima. Podjednako bi neprecizno
bilo odrediti problem kao "Važnost inteligencije u svakodnevnom životu". Takav je problem
izrazito širok i obuhvaća pitanja poput praćenja visokointeligentnih osoba kao i onih niže
inteligencije u različitim životnim situacijama (obrazovanju, poslu, čuvstvenim vezama i općoj
prilagođenosti). a bismo krenuli u istraživanje, problem valja ograničiti na ono što je moguće
testirati jednim istraživanjem. Probleme koji su široki i obuhvaćaju niz manjih, razmjerno neovisnih
istraživačkih cjelina nazivaju se problemska područja.
4.1.1 IZVORI ISTRAŽIVAČKIH IDEJA
Naizgled, nije teško doći do ideje i problema za istraživanje. Prečesto se, nažalost, pokazuje da
zadaća ipak nije nimalo jednostavna. Problem je jedan od ključnih elemenata istraživačkog procesa
i ako je on krivo postavljen cijelo se istraživanje dovodi u pitanje. Studenti i neiskusni istraživači
nerijetko brane vlastiti problem i njegovu relevantnost neprimjerenim argumentima poput: "Bilo bi
zanimljivo ispitati ..... ili "Tako nešto još nije rađeno u nas...". Prvi spomenuti argument svakako
67
66
46
Ivo V.
valja izbjegavati jer samo svjedoči o posvemašnjem manjku bilo kakvih čvršćih razloga za
provođenje istraživanja, dok je drugi argument valjan samo u slučaju u kojem se hrvatsko društveno
i kulturalno okružje značajno razlikuje od onoga u kojem je provedeno usporedivo istraživanje.
Istraživački problemi najčešće su motivirani, uvjetno rečeno, teorijskim ili metodološkim
nedoumicama. Usvojimo li takvu podjelu, izvori istraživačkih ideja se mogu razvrstati na sljedeći
način:
I. Teorijski motivirani problemi
1. Testiranje teorije
2. Nova otkrića i slučajni i sretni (usputni) nalazi68
II. Metodološki motivirani problemi
1. Nedostaci ranijih istraživanja
2. Ponovljene studije
3. Novine u metodologiji ili mjernim instrumentima.
Oko novih otkrića i novih teorija često se grupiraju brojni istraživački projekti. Devedesetih godina
postala je iznimno popularna i istraživana tzv. leksička hipoteza (John, 1990) kao oblik izučavanja
strukture ličnosti. Pošlo se od pretpostavke da su sve osobine ličnosti koje posjeduju važnost u
svakodnevnom životu sadržane i pohranjene u jeziku, te bi sukladno tome, jezična analiza mogla
povratno uputiti na temeljne dimenzije ličnosti. Faktorska analiza pridjeva pokazala je da se izrazi
vezani za osobine ličnosti grupiraju u pet dimenzija. Ova teorija imala je iznimnog odjeka u
svjetskoj javnosti tako da su brojni istraživači nastojali potvrditi dobivene nalaze ili ih provjeriti u
drugim jezičnim kulturama.
Povremeno istraživači, bež intencije, dođu do slučajnog otkrića nevezanog uz osnovni problem
istraživanja. Dobar primjer za to je Pavlovljevo istraživanje probavnog sustava koje je dalo neke od
ključnih nalaza za teoriju učenja (Hothersall, 1990). U tom je istraživanju opaženo da psi luče slinu
kad god vide osobe koje im inače nose hranu. Kako je lučenje sline normalan anticipacijski odgovor
na hranu, zaključeno je da osobe koje nose hranu bivaju uparene s bezuvjetnim podražajem i
postaju sami za sebe dovoljni za izazivanje bezuvjetnog odgovora (slinjenja). To je ujedno i osnova
klasičnog uvjetovanja, kojem su posvećena kasnija istraživanja.
Testiranje teorije najčešći je izvor istraživačkih problema. Ranije smo napomenuli kako je možda i
najvažnija uloga teorije ona u usmjeravanju i poticanju znanstvenih istraživanja. Pristup testiranju
teorije najčešće se odvija u tri koraka:
 upoznavanju s teorijom,
 proučavanjem istraživačkih radova koji su se bavili testiranjem teorije i
 uočavanjem implikacija i izvoda koje valja ispitivati.
Često se puta događa da je problem, doduše, temeljito izučavan, ali su pritom uočljivi i različiti
metodološki propusti koji ugrožavaju valjanost zaključaka koji su na takvim radovima utemeljeni.
U tom slučaju nova istraživanja uz bolju kontrolu i unaprijeđenu metodologiju svakako su
dobrodošla.
Ponavljanje istraživanja nužno je i znanstveno opravdano. Ponavljanjem nalazi dobivaju na težini i
uvjerljivosti. No i u ponavljanju valja imati mjeru. Ponavljanja su uobičajena ako se provode uz
originalnu studiju kako bi se pojačala njezina vjerodostojnost. Kasnija ponavljanja moraju ponuditi
stanovitu količinu novoga da bi mogla računati na objavljivanje.
Novi instrumenti i metodologije stalan su izvor istraživačkih problema. Neprekidno usavršavanje
psihologijskih mjernih instrumenata nudi neiscrpnu mogućnost69 istraživačke provjere. Nakon što je
instrument EPI zamijenjen savršenijem inačicom, EPQ, došle su brojne provjere, kako povezanosti
ranijih operacionalizacija istih konstrukata (E i N) tako i njihove povezanosti s drugim osobinama
ličnosti. Isti postupak primijenjen je i nakon uvođenja novog instrumenta EPQ-R, kojim je dorađena
68
67
69
68
47
Ivo V.
ljestvica psihoticizma. Isto se može reći i za sve druge mjerne instrumente kojima se služe
psiholozi.
4.2 HIPOTEZA
Postavljeni problemi mogu se usporediti s neodgovorenim pitanjima. Njima su u istraživanju
redovito pridružene pretpostavke o tome kako bi se na njih moglo odgovoriti. Takvi, mogući
odgovori na problem nazivaju se hipotezama. Razmišljamo li o problemu kao propitivanju
povezanosti između dviju varijabli, hipoteza predstavlja naše predviđanje o tome koliko je snažna i
kakvog je smjera ta povezanost. U ranijem primjeru odnosa osvjetljenja i učinkovitosti na
motoričkom zadatku, možemo pretpostaviti njihov zakrivljen odnos s optimalnim učinkom vezanim
uz srednju razinu osvjetljenja i njegovim opadanjem kretanjem prema krajnostima. Hipoteze,
dakako mogu biti i mnogo preciznije, izražene kao određene matematičke funkcije.
Prisjetimo se, o hipoteza ma smo već ponešto rekli opisujući nastanak i razvoj teorija. Hipoteza ima
iznimno važnu ulogu u izgradnji teorije, no to je zadaća kojom se ovoga puta nećemo previše baviti.
U ovom slučaju hipoteza nas zanima više kao instrument spoznaje u konkretnom istraživanju. Bez
odgovarajuće hipoteze, nalazi istraživanja vjerojatno će ostati "u zraku" lišeni objašnjenja zašto su
dobiveni upravo rezultati kakvi su dobiveni. Zbog toga se pri postavljanju hipoteze valja rukovoditi
određenim načelima.
Sukladno njima, hipoteza bi morala ispunjavati sljedeće uvjete:
1. Biti primjerena problemu
2. Biti jasna i nedvosmislena, postavljena na način koji dopušta opovrgavanje
3. Biti najjednostavniji mogući odgovor na problem
4. Biti provjerljiva
5. Biti razložna i vjerojatna prije same provjere.
Hipoteza mora odgovarati na postavljeni problem. Ako je naš problem utvrditi zašto osobe
izraženog psihoticizma više teže zločinu, naša hipoteza ne može biti da je to stoga što je zločin
društveno uvjetovan. Hipoteza koja bi u tom, izmišljenom primjeru bila prikladna mogla bi biti:
"Zbog slabije mogućnosti učenja odnosno sociolizacije.'' 70 Takvu hipotezu iznio je Eysenck
(Eysenck i Eysenck, 1976; Eysenck i Gudjonsson, 1989) držeći da je psihoticizam ometajući faktor
u socijalizaciji koji otežava stjecanje društvenih normi i pravila ponašanja. Za isti problem možemo
istodobno postaviti i više različitih hipoteza, pa tako u našem primjeru postavljenoj hipotezi vezanoj
uz učenje možemo pridodati i onu koja psihoticizam i zločin povezuje s većom potrebom za
podražajima ili osjetilnim uzbuđenjima.
Hipoteza nadalje mora biti dovoljno precizna. Ona nipošto ne smije istodobno dopušrati više
različitih mogućnosti, jer ih je u tom slučaju vrlo teško provjeravati. Ako, primjerice, pretpostavimo
da će se osoba u stresnoj situaciji ponašati zaplašeno, tjeskobno ili agresivno, iscrpili smo gotovo
sve mogućnosti ponašanja, pa je takvu hipotezu teško provjeriti i još teže oboriti. Hipoteza koju je
doduše moguće provjeriti, ali ju nije moguće odbaciti, nije primjerena znanstvenom radu. U tom
dijelu, vrijedi isto što i za teoriju, odnosno da mora biti opovrgljiva za što je preduvjet jasnoća i
preciznost predviđanja. Preciznost, međutim, ne znači da hipoteza mora odnos varijabli opisivati u
obliku matematičke funkcije, iako je takva egzaktnost dobrodošla.
Načelo parsimonije, odnosno znanstvene jednostavnosti vrijedi i za hipotezu. Ona mora sadržavati
samo elemente nužne za objašnjenje (ranije spomenuta Ockhamova oštrica).
Načelo o tome da sve što se ne može iskustveno provjeriti ne pripada znanosti na snazi je i pri
postavljanju hipoteze. Pokušamo li provjeriti hipotezu kako na svijet ili nečije ponašanje utječu ili
njime upravljaju duše umrlih, ustanovit ćemo da je ona iskustveno neprovjerljiva. Takve nam
hipoteze nisu od koristi, niti nam pomažu u boljem razumijevanju svijeta. To, međutim, ne znači da
ono što danas nije provjerljivo iskustvom neće biti i u budućnosti. Tako je dugo vremena svijet
70
69
48
Ivo V.
mikroorganizama bio skriven čovjekovu iskustvu, sve do izuma optičkog i kasnije elektronskog
mikroskopa, koji su omogućili opažanje prostom oku nevidljivog svijeta.
Dobra hipoteza, nadalje, mora zvučati uvjerljivo i biti utemeljena na razložnim pretpostavkama već
i prije samog istraživanja. Ako razlike u intelektualnom funkcioniranju muškaraca i žena
(primjerice, razlike u verbalno] ili spacijalnoj inteligenciji) pokušamo objasniti duljinom njihove
kose, nedvojbeno smo na krivome tragu prije nego što je istraživanje i otpočelo. Na malo vjerojatne
ili posve apsurdne hipoteze ne treba gubiti vrijeme. Dobar primjer za to pruža Kaplan (1964)
uspoređujući neumjesne hipoteze s pijančevom potragom za ključevima. Izgubivši ključeve od
kuće, pijanac zastane pred uličnom svjetiljkom i stane ih tražiti. Na upit zašto ih traži na tom
mjestu, a ne na onom na kojem ih je izgubio, odgovara: "Ovdje je svjetlije.". Poput pijanca, i
znanstvenik samo gubi vrijeme tražeći rješenja na "prikladnom" a ne na vjerojatnom mjestu.
Primjeri dobrih hipoteza:71
Problem: Razlikuju li se muškarci i žene prema prosječnom rezultatu na upitničkim
mjerama emocionalne stabilnosti?
Hipoteza: Muškarci i žene razlikuju se na upitničkim mjerama emocionalne stabilnosti.
Problem: Koji lijek uspješnije uklanja depresivnu simptomatologiju među
psihijatrijskim pacijentima, A ili B?
Hipoteza: Nema razlike u učinkovitosti lijekova A i B.
Problem: Postoji li povezanost između društvenog statusa i glasanja za stranku X na
izborima?
Hipoteza: Za stranku X na izborima u prosjeku češće glasaju osobe nižeg društvenog
statusa.
U prvom i trećem slučaju, hipoteza je postavljena u potvrdnom, dok u drugom ima niječni oblik.
Hipoteza postavljena u niječnom obliku naziva se nul-hipoteza i uobičajena je u psihologijskoj
praksi. Naziv nul-hipoteza otječe od toga što takva hipoteza pretpostavlja nultu razliku među
skupinama, u konkretnom slučaju onih koji primaju lijek A u odnosu na one koji primaju lijek B.
Izricanje hipoteze na taj način pomaže u smanjivanju pristranosti kojoj vodi istraživačeva želja da
potvrdi vlastite hipoteze. Usto, takva je hipoteze, u strogom smislu, jedino i provjerljiva statističkim
testovima. Još je Fisher uvodeći pojam nul-hipoteze (1925) ustvrdio kako ne možemo dokazati da je
nešto točno, ali zato možemo dokazati da je nešto netočno. Primjerice, stotinu tamnokosih
prolaznika ne dokazuje da su svi ljudi tamnokosi, ali svega jedan svjetlokosi obara takvu
pretpostavku. Statističko zaključivanje redovito ide u smjeru odbacivanja nul-hipoteze kad je ona
malo vjerojatna u odnosu na dobivene rezultate ili ostajanja pri njoj, kad dobiveni rezultati ne
odstupaju od onih koje bismo očekivali temeljem takve pretpostavke.
Prva i treća hipoteza također se među sobom razlikuju. Obje su potvrdne, ali dok u prvom slučaju
nije jasno u kojem smjeru se kreće razlika između muškaraca i žena, u posljednjem je jasno
specificirano očekivanje o vrsti veze koja postoji između društvenog statusa i namjere glasanja.
Treća hipoteza je, pored toga što je potvrdna, usto i direktivna (usmjerena), jer jasno naznačuje
istraživačeva očekivanja. Premda u tehničko-statističkom smislu valja uvijek poći od nul-hipoteze,
ono što najčešće stvarno želimo provjeriti jest direktivna hipoteza koja se nadovezuje na izvode
naše teorije.72
71
70
72
71
49
Ivo V.
5. PISANJE ZNANSTVENOG RADA I ISTRAZIVAČKOG IZVJEŠTAJA
Jedan od ključnih segmenata znanstvene djelatnosti svakako je pisanje izvještaja ili znanstvenog
rada namijenjenog objavljivanju. Cijela istraživačka djelatnost usmjerena je upravo k tom cilju, jer
se o njezinoj razini i kvaliteti prosuđuje isključivo na temelju objavljenih radova. Pri tome nije
presudan broj radova što ih je neki istraživač napisao koliko ugled i vrsnoća časopisa u kojem su
objavljeni i reakcije koje su izazvali u znanstvenoj javnosti. Sav trud uložen u istraživanje, počevši
od izbora problema, pomno izrađenog nacrta, uzorne provedbe i valjane statističke analize bio bi
uzaludan napor bez objavljivanja. Znanstveni radovi upoznaju stručnu, ali i širu javnost s
rezultatima nekog istraživanja, daju na uvid istraživačeve hipoteze, metodu rada i zaključke te time
pružaju mogućnost kritičkih osvrta, provjera i dodatnih istraživanja. Bez takve razmjene mišljenja i
komunikacije među istraživačima, istraživački proces vjerojatno bi bio bitno usporen ili čak
paraliziran. Zamislimo samo što bi se dogodilo u slučaju neobjavljivanja istraživačkih rezultata
dragocjenih za neko znanstveno područje. Takvi bi rezultati, unatoč važnosti, bili posve zanemareni
i ne bi utjecali na znanost i društvo. Akademska komunikacija, ponovimo još jednom, jamči da
rezultati istraživanja ne ostanu izolirani u krugu pripadnika pojedinog istraživačkog tima.
Zadaća ovog dijela teksta je dvojaka, jedna mu je namjena upoznati čitatelja s pravilima koja
vladaju u objavljivanju radova u svjetski važnim publikacijama, a druga upozoriti na značenje i
potrebu vježbanja i usavršavanja akademskog stila pisanja u okviru studija psihologije. Potonjem su
namijenjeni cijeli kolegiji, ali ne treba zaboraviti da su i pisanje izvještaja ili, u najvećoj mjeri,
diplomskog rada namijenjeni istoj svrsi. Namjeravamo također upozoriti i na niz situacija u kojima
će poseban stil što se njeguje u izdanjima znanstvenog tipa biti poželjniji od literarnog izražavanja 73
kakvom se koristimo u drugim prilikama. Ne treba, naime, zaboraviti da se stil kakav se susreće u
znanstvenim časopisima, uz nevelike razlike, primjenjuje. i u istraživačkim izvješćima, stručni~
napisima, pa čak i redovitoj psihološkoj djelatnosti.
Najveću pažnju ipak zaslužuje pripremanje, pisanje i objavljivanje u časopisima koji određuju
tempo svjetske znanosti. Oni se, gotovo bez razlike, objavljuju u razvijenim zemljama, a jezik
kojim su napisani gotovo je beziznimno engleski. I o tome, dakako, valja voditi računa jer su, zbog
toga, radovi objavljeni čak i u najkvalitetnijim časopisima s područja društvenih znanosti u
Hrvatskoj osuđeni na lokalno značenje, bez mogućnosti da ih znanstvena javnost dokraja upozna.
Drugo važno obilježje objavljivanja u znanstvenim časopisima jest postojanje institucije stručne
recenzije koju pišu probrani stručnjaci, a koja je, kao opća ocjena kvalitete i dosega nekog rada,
temelj odluke o tome hoće li u konačnici biti objavljen ili ne. Sustav recenziranih časopisa služi
brojnim ciljevima od kojih su neki, poput razmjene informacija i ubrzavanja znanstvene
komunikacije, već spomenuti, ali treba upozoriti i na druge, kao što su, uspostavljanje standarda
kvalitete, razvijanja pojedinih znanstvenih domena, pohrane podataka i prepoznavanje vrijednosti
individualnih autora. U svojem ćemo se izlaganju uglavnom oslanjati na format što ga preporučuje
Američka psihološka udruga (1994,2001), koja pod svojim okriljem drži najutjecajnije svjetske
časopise s područja psihologije, nastojeći ipak da opće naputke prilagodimo hrvatskim prilikama
unutar kojih će stvarati većina čitatelja.
5.1 OSNOVNE SMJERNICE ZA PISANJE IZVJEŠTAJA74

Pisanje izvještaja ili znanstvenog rada složena je djelatnost koja od autora traži niz sposobnosti:
1. dobro vladanje jezikom i pismeno izražavanje
2. poznavanje svrhe rada i publike kojoj se obraća
3. stručnu kompetenciju i poznavanje metodologije.
73
73
74
Naputci što se iznose svakako nisu instant recepti koji će nečiji rad učiniti kvalitetnim, već im je svrha upozoriti na
kritične točke na kojima "posrće" nemali broj intencionalno znanstvenih radova. Također, usvajanje pravila nipošto ne
znači da je netko ovladao znanstvenim stilom pisanja, jer je ta vještina mnogo složenija i razvija se poglavito praksom,
ali i studiranjem drugih raspoloživih izvora o načinima oblikovanja teksta i pisanja znanstvenih radova (vidi primjerice
APA, 2001).
50
Ivo V.
Kultura pismenog izražavanja i vladanje književnim jezikom neobično je važno zbog mogućnosti
jasnog i preciznog prenošenja željenih poruka. No valja u svakom trenutku biti svjestan da
znanstveni rad nije isto što i literarno djelo. Pri pisanju treba poštovati određene zakonitosti, a
najvažnije je \l prvi plan staviti jasnoću i preciznost, a u drugi ljepotu izričaja. To ne znači da
znanstveni izvještaj mora biti suhoparan i75 dosadan, ali ga valja, koliko god je to moguće, očistiti
od stilskih ukrasa i detalja koji smanjuju razumljivost ili nepotrebno produljuju tekst. Nije naodmet
upozoriti da gramatičke pogreške, a pogotovo kriva upotreba riječi također mogu čitatelja dovesti u
zabunu i smanjiti prohodnost i razumljivost napisanoga. Autor stoga u svakom trenutku mora dobro
odvagnuti koji će termin upotrijebiti kako bi izbjegao moguće nejasnoće i nesporazume.
O namjeni i svrsi rada umnogome ovisi njegov sadržaj. Izvještaj koji pišemo u nekom
marketinškom istraživanju uvelike će se razlikovati od onih napisanih za objavljivanje u
znanstvenoj publikaciji, a oba će biti bitno drukčija od studentskog izvještaja s vježbi. Isto tako,
pisani izvještaj namijenjen objavljivanju u časopisu ili knjizi bit će različit u odnosu na usmeno
izlaganje. Valja isto tako znati i kome će izvještaj doći u ruke. Radi li se o znanstvenom radu koji će
čitali upućena publika, razinu stručnosti treba prilagoditi njima. To znači da se autor ne treba
upuštati u suvišna objašnjavanja i kojima samo zamara čitatelje upoznate s problematikom, već
naglasak mora staviti na ono što njegovo istraživanje razlikuje od prethodnih. S druge strane, pri
pisanju studentskog izvještaja s vježbe, treba pomno razraditi i objasniti svaku misao kako bi
ocjenjivač mogao utvrditi je li studentov način razmišljanja prihvatljiv i logički održiv, ili
neprimjeren. U izvještaju nekog primijenjenog istraživanja koji se obraća laicima, jezik i stil treba
nastojati pojednostavniti, očistiti rječnik koliko god je moguće od stručnih izraza i pozivali se na
teoriju samo kad je nužno i to ne bez dodatnih objašnjenja. Autor uvijek mora imati na umu da je
primarna zadaća izvještaja da bude razumljiv i da poruka koju nosi bude dohvatljiva osobama
kojima je namijenjena.
U pisanju postoje i neka opća pravila koja pridonose razumljivosti napisa. Osobito je tako važno
služiti se književnim jezikom, a ne dijalektom, jer se na taj način izbjegavaju nesporazumi
uzrokovani nepoznavanjem dijalektalnih izraza. Jednako rako valja izbjegavati kolokvijalne termine
koje čitatelja zbog višeznačnosti ili nepreciznosti mogu navesti na krive zaključke (genijalac, luđak,
manijak, psiha, pomračeni um i dr.).
U potreba odrednica količine (kvantifikatora) poput "prilično" "gotovo svi" ili "vrlo malo" mogu se
različito tumačiti, tako da ako u tekstu stoje samostalno, bez brojčanog opisa, također mogu zavesti
čitatelja. Stoga ih valja izbjegavati, osobito bez jednoznačnog brojčanog određenja.
Strane riječi i izrazi dobrodošli su u izvještaju samo ako pridonose njegovoj razumljivosti. Jezično
čistunstvo koje se svojedobno posebno njegovalo, također, nažalost, može izazvati nesporazume i
nerazumijevanje. Velik broj psihologijskih izraza posuđen je iz engleskog jezika i ima latinski
korijen. No s obzirom na to da su se ti izrazi uvelike udomaćili u hrvatskoj psihološkoj praksi, bilo
bi pogrešno odjednom76 ih početi zamjenjivati hrvatskim riječima. Dobar primjer za to su različiti
statističko-matematički postupci poput faktorske, regresijske ili klaster analize, čija imena doslovce
prevedena zvuče bizarno, ali i nerazumljivo čak i dobrim poznavateljima pobrojenih metoda
(lektorsku se analizu, primjerice pokušalo prevesti izrazom "čimbenička raščlamba", U izvještajima
stoga treba njegovati hrvatski jezik, ali u nekim slučajevima strane su riječi nužne radi boljeg
razumijevanja teksta.
Pri pisanju izvještaj ne preporučuje se korištenje prvog lica jednine (primjerice: "Ja sam istražio,
dobio, otkrio .., itd.") jer se time gubi dojam znanstvene objektivnosti i nepristranosti, a izvještaj
poprima sva obilježja vrlo osobnog štiva, a ne javne publikacije. Ranije preporuke išle su za tim da
se rečenice prebacuju u pasivni oblik trećeg lica (primjerice: "Istraženo je, dobiveno je, otkriveno je
... itd,"), kako bi se time povećao privid znanstvene objektivnosti, no često je zbog toga tekst
postajao stilski nezgrapan, bezličan i lišen duha hrvatskog jezika.
75
74
76
75
51
Ivo V.
Umjesto prvog, u znanstvenim radovima razmjerno je česta uporaba trećeg lica jednine ili množine
pa se tako umjesto formulacije: "Ja sam istražio" koristi neutralnije: "Autor je istražio" ili u slučaju
množine: "Autori su istražili". U novije vrijeme umjesto neutralnog oblika koristi se prvo lice
množine (primjerice: "Istražili smo, dobili smo, otkrili smo ". itd.) kao svojevrstan kompromis
znanstvene nepristranosti i stilske prihvatljivosti.
Duljina rada ovisi o brojnim činiteljima. Opće je pravilo, međutim, učiniti rad konciznim i jasnim
koliko god je to moguće, Autor ne bi trebao nepotrebno duljiti i zamarati čitatelje potankostima bez
kojih rad ne bi izgubio na informativnosti. S druge strane, rad nije telegrafski izvještaj, tako da
načete probleme valja temeljito obraditi, a nikako samo ovlaš spomenuti. U tekstu trebaju biti
sadržane sve informacije bitne za njegovo razumijevanje, što, dakako, ne znači da čitatelja valja
bombardirati podacima koji su mu poznati ili onima koji ne pridonose razumljivosti napisanog.
5.2 STRUKTURA ZNANSTVENOG IZVJEŠTAJA

Znanstveni izvještaji načinjeni su na zada ni način, slijede općeprihvaćenu strukturu i redovito se
sastoje od manje-više istih elemenata. Unaprijed definirana struktura služi dvojakoj svrsi: pruža
okvir unutar kojeg će autor izraziti vlastite misli, nalaze i zaključke i olakšava čitateljev posao
snalaženja u radu. Jasna struktura olakšava na taj način komunikaciju između autora i čitatelja,
usmjerujući ih na elemente o kojima moraju voditi računa. Psihologijski znanstveni rad, u pravilu,
obuhvaća sljedeće elemente:77
1. NASLOVNU SRTRANICU
2. SAŽETAK
3. UVOD
4. (PROBLEM)
5. METODU
(Postupak)
(Nacrt)
(Pribor)
(Mjerenje)
(Ispitanike)
6. REZULTATE
7. RASPRAVU
8. (ZAKLJUČAK)
9. LITERATURU
5.2.1 NASLOV I NASLOVNA STRANICA

Naslovna stranica izvještaja sadrži ime ili imena autora, instituciju u kojoj su zaposleni i naslov
rada. Ona pruža osnovnu informaciju o predmetu rada. Sam naslov vrlo je bitan, premda često
podcjenjivan element znanstvenog rada. U njemu je, na sažet način, iznesena temeljna ideja rada.
Naslov eksperimentalnog istraživanja obično sadržava u sebi nezavisnu i zavisnu varijablu tako da
je jedan od češćih načina njegova izricanja shematiziran prema načelu: zavisna varijabla u funkciji
nezavisne varijable ili utjecaj nezavisne varijable na zavisnu (primjerice: "Glasačko ponašanje u
funkciji političkih stavova", "Divergentno mišljenje u funkciji neispavanosti" ili "Utjecaj
smislenosti riječi na njihovo upamćivanje"). Poželjno je da naslov bude dovoljno informativan, ali
kratak, nipošto dulji od 15 riječi. Kako su istodobni zahtjevi za konciznošću i informativnošću
međusobno suprotstavljeni, potrebno je iznaći stanoviti kompromis. U naslovu nije potrebno
navoditi određenja koja su sama po sebi razumljiva poput "studija", "istraživanje" ili "analiza",
Podjednako valja izbjegavati neodređena ili dvosmislena određenja poput: "Rezultati mjerenja
77
76
52
Ivo V.
stavova", ili "Istraživanje ličnosti ispitanika". Naslov mora, u najvećoj mogućoj mjeri, odražavati
posebnost sadržaja istraživanja.
5.2.2 SAŽETAK
Podjednako kao i naslov, sažetak također nosi izuzetnu važnost pri pisanju znanstvenog rada.
Velika većina istraživača od našeg će rada pročitati samo naslov i78 sažetak jer su oni pohranjeni u
bazama podataka (Psychological abstracts, Current Contents ili usporedivim domaćim bazama) čije
pretraživanje je temelj odluke o izboru radova koji će se koristiti pri nekom istraživanju. Sažetak je
odlomak teksta koji daje vrlo skraćenu informaciju o tome kako je istraživanje rađeno i što je njime
dobiveno. Njime su ukratko obuhvaćeni svi odjeljci znanstvenog rada, uvod, metoda, rezultati i
rasprava. U sažetku treba naznačiti osnovnu svrhu istraživanja, opisati populaciju iz koje je izvučen
uzorak ispitanika, navesti korišteni istraživački nacrt, spomenuti mjerne instrumente i način
prikupljanja podataka te ukratko pobrojiti osnovne istraživačke nalaze i zaključke. Budući da je
sažetak za mnoge i temelj odluke hoće li ili ne neki rad dokraja pročitati, neobično je važno da bude
jasan i informativan. Najbolje ga je stoga napisati na kraju, kao završni dio izvještaja i to tako da u
njemu ne bude sadržano ništa što ne postoji u osnovnom tekstu.
5.2.3 UVOD
Uvodom se postižu tri osnovne zadaće:
a. Upoznavanje čitatelja s problemom
b. Obrazlaganje problema u kontekstu teorije dosadašnjih istraživanja
c. Opis pristupa problemu, iznošenje hipoteza i teorijskih očekivanja.
Važna pitanja na koja autor(ica) mora odgovoriti u uvodnome dijelu odnose se na svrhu
istraživanja, teorijsko značenje problema, kritički pregled dosadašnjih istraživanja problemskog
područja, način na koji njegovo (njezino) istraživanje pridonosi rješavanju problema i teorijske
implikacije do kojih bi ono moglo dovesti. Važnost uvoda je iznimno velika jer se njime obrazlaže
autorov izbor problema i teorijsko značenje istraživanja. Napisati kvalitetan uvod nije nimalo laka
zadaća, jer on, više nego drugi dijelovi izvještaja, traži konciznost i jasnoću izražavanja.
Prema svojoj unutarnjoj strukturi, uvod bi trebao nalikovati lijevku, odnosno misaono slijediti od
šireg i općenitijeg prema sve užem i specifičnijem problemskom području. Ako je, primjerice,
predmet našeg izučavanja odnos ličnosti i kriminalnog ponašanja, krenut ćemo možda od toga što
uopće utječe na kriminalno ponašanje. Ako je naše problemsko područje uže, primjerice odnos
ekstraverzije i nasilnih zločina, pokušat ćemo ga situirati u širi prostor ukupnog odnosa ličnosti i
zločina. Dakako, univerzalni recepti za pisanje uvoda ne postoje, a osnovni naputci korisni su samo
u ograničenoj mjeri. Konačno obrazloženje izabranog problema mora biti motivirano ra nij im
argumentima, koje uvod mora obuhvaćati u najsažetijoj, ali ipak dovoljno informativnoj mjeri.
Uvodom ćemo čitatelja upoznati s onim što nas je navelo na bavljenje određenim problemom i
naznačiti s koje teorijske pozicije mu nastojimo pristupiti. Za 79 kvalitetan uvod neophodno je
izvrsno poznavanje teorije i istraživanja koja su dotad o problemu obavljena. Kratki pregled
najvažnijih radova nužan je kako bi autor opravdao vlastitu racionalu za bavljenje upravo tim
problemom. Pregled literature se, međutim, svakako ne bi trebao svoditi na pojedinačnu analizu
svakog rada, već prije na skupnu obradu tema vezanih uz problem. U dobro osmišljen om radu,
istraživački problem izložen je već u prvom odjeljku, zajedno s razlozima njegova izučavanja
(Calfee, 1985). Preostatak uvoda otpada u pravilu na sažet pregled literature i prikaz teorijskih
modela važnih za područje. Usvojimo li pri pisanju uvoda sve pobrojene naputke, čitatelj bi nakon
njegova čitanja trebao znati što ga očekuje u nastavku rada.
5.2.4 PROBLEM
U znanstvenim radovima najčešće nije potrebno zasebno izložiti problem jer je on naznačen već u
uvodnome dijelu. Stoga znanstveni časopisi većinom ne ostavljaju mjesta za izdvojen odjeljak
78
77
79
78
53
Ivo V.
namijenjen problemu. Za početnike i studente je, međutim dobra praksa pokušati vlastiti problem
jasno izraziti jednom rečenicom. Na taj način se vježbaju jasno razmišljati i precizno izraziti vlastite
misli. Istodobno, čitatelju je olakšan posao praćenja rada jer tipičan studentski uvod često nije
dovoljno jezgrovit i izravan u opisivanju problema. Problemi izdvojeni u posebnom odjeljku moraju
biti precizno izneseni u onom obliku u kojem će naknadno (u zaključcima) na njih biti odgovoreno.
Primjer takvih problema su:
Razlikuju li se osobe različitog stupnja naobrazbe u stavu prema religiji?
Je li na temelju tjednog horoskopa moguće predvidjeti nečije raspoloženje bolje nego
nasumičnim pogađanjem?
Pamte li studenti bolje smislene ili besmislene slogove? itd.
5.2.5 METODA
Odjeljak naslovljen "metoda" podastire čitatelju sve potankosti o tome kako je istraživanje
provedeno. Takav opis omogućuje vrednovanje nacrta, kritički odnos spram njegove primjerenosti i
prosudbu o opravdanosti izvedenih zaključaka. Istodobno on omogućuje svakom istraživaču
ponavljanje istraživanja kako bi provjerili iznesene n vod i vjerodostojnost rezultata.
Odjeljak bi trebao sadržavati sve informacije nužne za potpuno razumijevanje studije i njezino
eventualno ponavljanje. Kvaliteta istraživačkog izvještaja, odnosno znanstvenog rada može biti
ozbiljno narušena kako preoskudnim, tako i preopsežnim opisom korištene metode. Najbolji način
da se odredi koliko je potrebno zalaziti u potankosti jest čitanje i studiranje objavljenih radova. Kao
i pri pisanju80 ostalih dijelova znanstvenog rada i ovdje je moguće pružiti samo osnovne smjernice,
dok se znanje i rutina stječu isključivo praksom Najčešće se odjeljak metode razlaže na zasebne
cjeline nazvane: Ispitanici, Nacrt, Pribor i Postupak.
5.2.5.1 ISPITANICI (SUDIONICI)
Prvi je pododjeljak posvećen sudionicima, odgovara na pitanja: "Tko je sudjelovao u istraživanju?",
"Koliko je ukupno ispitanika bilo?" i "Kako su birani iz populacije?" Istraživač je dužan iznijeti
podatak koliko je ukupno ispitanika sudjelovalo u istraživanju i tko su oni bili s obzirom na socio-
demografske, spolne i dobne karakteristike. Ako se radilo o eksperimentu, treba reći koliko je
ispitanika podvrgnuto svakom od eksperimentalnih uvjeta. Čitatelja također treba izvijestiti o
odustajanju ili osipanju ispitanika. Ako se radilo o anketnom istraživanju, treba navesti način
odabira uzorka (probabilistički ili neprobabilistički kao najgrublje određenje a potom i preciznije:
kvotni, stratificirani, prigodni, jednostavni slučajni ili slično) i koliko odstupa od populacijskih
vrijednosti. Valja također navesti razlog odabira upravo takvog uzorka te način na koji udovoljava
istraživanju postavljenog problema. U nekim situacijama uzorak se nameće sam po sebi, primjerice,
pri ispitivanju problema vezanih uz određene duševne poremećaje (poput psihoza) razložno je
uključiti upravo ispitanike koji ih posjeduju. U drugim su prigodama ispitanici uključeni u
istraživanje samo zbog svoje raspoloživosti (takvi se uzorci obično sastoje od učenika ili studenata).
Valjanost rezultata dobivenih na prigodnim uzorcima ponekad je neupitna, ali takvi uzorci ipak
češće zahtijevaju autorovo obrazloženje o tome na koji način utječu na rezultate i u kojoj mjeri
smanjuju uvjerljivost zaključaka.
5.2.5.2 NACRT
Premda neobavezan, odjeljak o nacrtu često je puta koristan i čini rad preglednim, osobito ako je
korišteni istraživački nacrt složen. pravdu informacije o nacrtu sadržane su u opisu postupka. Ako
se istraživač odluči odijeliti nacrt od postupka ili je tako traženo u časopisu u kojem objavljuje rad,
tim odjeljkom, ako je riječ o eksperimentu, treba obuhvatiti podatke o zavisnoj i nezavisnoj varijabli
(njihove operacionalne definicije), načinu kojim manipulira nezavisnom varijablom i općoj shemi
istraživanja. Ako je riječ o nekom drugom tipu istraživanja, valja ga također podrobno opisati,
primjerice, navesti radi li se o opažačkoj studiji, longitudinalnom, ili nacrtu poprečnog presjeka te
na koji je način nacrt organiziran.
80
79
54
Ivo V.
5.2.5.3 PRIBOR
Također neobavezan, odjeljak o priberu sadržava podatke o korištenoj aparaturi, ako ona čini bitan
dio istraživačkog projekta. Ako je sve što je potrebno za 81 istraživanje papir i olovka ili su korišteni
aparati inače dobro poznati (primjerice poligraf), sekciju je bolje potpuno ispustiti.
5.2.5.4 MJERENJE (INSTRUMENTI)
Za većinu istraživanja važno je iznijeti podatke o načinu prikupljanja podataka i mjernim
instrumentima koji su u tu svrhu uporabljeni. Odjeljak posvećen mjerenju trebao bi sadržavati
informacije o konstruktima od interesa i načinu njihove operacionalizacije, metrijskim svojstvima
mjernih instrumenata i drugim podacima od važnosti za mjerenje (primjerice, utjecaju načina
odgovaranja ili društvene poželjnosti, slaganju procjenjivača ili sličnom).
5.2.5.5 POSTUPAK
Najvažniji odjeljak koji govori o metodi je postupak. U njemu se od početka do kraja opisuje
procedura kojom je obavljeno istraživanje. Opisivanje je u pravilu kronološko. Iz odjeljka o
postupku, čitatelj treba steći jasnu sliku što je i na koji način rađeno. Ako je riječ o eksperimentu,
valja precizno opisati što se s ispitanicima dešavalo od početka do kraja sudjelovanja. Opisivanje
postupka u korelacijskom ili anketnom istraživanju obično je znatno oskudnije, jer se u pravilu
koriste standardne upute i procedure.
5.2.6 REZULTATI
Iza opisa metode u izvještaju slijede rezultati istraživanja. Oni bi u određenoj mjeri trebali
odgovoriti na probleme postavljene u uvodnom dijelu. Odjeljak s rezultatima sažeto opisuje
prikupljene podatke i njihovu statističku analizu, i mora sadržavati;
1. svrhu uporabljene statističke analize
2. podatke deskriptivne statistike
3. naznake i upozorenja na ključne nalaze istraživanja
4. podatke inferencijalne statistike ako su korišteni
5. zaključke koji slijede neposredno iz statističkih analiza, ali ne i njihove šire
implikacije.
Navedena pravila primjenjiva su na većinu radova, ali ne na sve. Primjenom kvalitativne
metodologije statistička analiza postaje nepotrebna, tako ela odjeljak o rezultatima poprima drukčiji
oblik. U nekim drugim kvantitativnim istraživanjima potrebno je uključiti i neke potankosti vezane
za obradu ili tretman podataka. Mnoga se anketna i korelacijska istraživanja, primjerice, suočavaju s
ozbiljnim problemom nedostajućih podataka (izostankom odgovora na pojedina pitanja), u kojem
slučaju82 se od autora očekuje da opiše način na koji ga je otklonio (uključivanje samo cjelovito
ispunjenih anketa i upitnika, obrada na svim dostupnim podacima, zamjenjivanje nedostajućih
podataka srednjim vrijednostima ili neko regresijsko rješenje) i obrazloženje zašto je tako postupio.
Odjeljak započinje iznošenjem svrhe statističkih postupaka, odnosno odgovara na pitanje: "Zašto
smo koristili upravo te statističke postupke?". Od autora se ne očekuje posebno dugo obrazloženje.
Dovoljno je, primjerice, reći da je t-rest upotrijebljen kako bi se provjerila hipoteza o nepostojanju
razlike u brzini reakcije u muškaraca i žena. Iznošenje svrhe analize ima dvojaku zadaću, pomaže
čitatelju u praćenju racionale i logičkog toka istraživanja, a autora, posebno onog neiskusnog,
sprečava da koristi statističke metode koje ne poznaje ili ih ne zna protumačiti.
U drugom koraku se određuju mjere deskriptivne statistike kojima će podaci biti prikazani. Za svaki
od eksperimentalnih uvjeta mjere se iskazuju zasebno. Mjere središnje tendencije valja redovito
popratiti odgovarajućim mjerama varijabiliteta. Primjerice: "prosječan rezultat- aritmetička sredina
na skali anksioznosti za eksperimentalnu grupu iznosi 13,6 uz sd=2,1, dok su za kontrolnu grupu
dobivene vrijednosti aritmetičke sredine 11,4 i sd = 2,2".
81
80
82
81
55
Ivo V.
Ako je podataka više, odnosno ako smo koristili više upitnika ili drugih mjera ponašanja, ili je broj
eksperimentalnih grupa veći, podatke ćemo, zbog preglednosti, morati iznijeti u tablici, a ne u
tekstu. Svaka je tablica zasebna cjelina i mora biti obilježena brojem i preciznim naslovom. Usto
mora biti jasno naznačeno što se nalazi u kojem stupcu i kojem retku. Umjesto tablice ili uz nju,
podatke možemo nacrta ti na grafičkom prikazu. Tablice daju precizniji uvid u podatke, ali je
grafikon slikovitiji i brže upoznaje čitatelja s trendom ili općim odlikama podataka. Tablice i
grafikoni trebali bi biti nadopuna, a ne ponavljanje informacija već sadržanih u tekstu.
Po iznošenju opisnih odrednica prikupljenih podataka slijede obrazloženja i rezultati primijenjenih
testova statističkog zaključivanja. Potrebno je navesti zašto se koji test koristi i što bi trebao
pokazati. Radi lakšeg snalaženja korisno je prije analize navesti okvirne hipoteze koje statističke
postupke vezuju za uvodom spomenuta teorijska pitanja. Osim imena testa (redovito se radi o t ili F
omjeru te x2), navode se stupnjevi slobode i dobivena vrijednost testa. Uz rezultat se navodi ishod
testiranja značajnosti, odnosno vjerojatnost da dobivena vrijednost ukazuje na statistički značajnu
razliku. Primjerice: "Žene su na testu verbalnog faktora postigle 24.7 bodova, što je statistički
značajno više od muškaraca (20.3). Dobiveni t-omjer (ss=764)iznosi 4.2 p<0.01". U radu je
poželjno navesti veličinu učinka (prosječnu razliku među grupama podijeljenu standardnom
devijacijom) kako bi čitatelj mogao prosuditi o razmjerima djelovanja nezavisne varijable, a ne
samo njihovoj različitosti od nule. Ponekad valja skrenuti pozornost na statistički neznačajne razlike
koje su takve83 možda samo zbog manjka statističke snage (premalenog uzorka). Za takav osvrt
međutim, valja imati dobre argumente (zamjetljivu veličinu učinka i brojno skroman uzorak).
Zadnji korak u pisanju odjeljka o rezultatima je iznošenje kratkog zaključka o svakom
primijenjenom testu. Ako to pokazuju statistički testovi, treba jasno napisati: "Žene su postigle
statistički značajno veći rezultat na testu verbalnog faktora u odnosu na muškarce". Dakako, pri
takvom zaključivanju treba se pozivati na ranije iznesene rezultate deskriptivne statistike.
2.2.7 RASPRAVA (DISKUSIJA)
Po iznošenju rezultata, u odjeljku rasprave treba ih misaono proanalizirati procijeniti i pokušati
protumačiti njihove implikacije, osobito u svjetlu postavljenih hipoteza. U raspravi je stoga
potrebno podrobno proučiti dobivene rezultate, pokušati ih protumačiti i izvući zaključke iz njih.
Logički se rasprava nadovezuje na uvod i rezultati se tumače kao opovrgavanje ili potvrda
postavljenih hipoteza. U pravilu, rasprava obuhvaća pregled glavnih nalaza, njihovo ugrađivanje i
tumačenje u kontekstu ranije izloženih teorija i prethodnih istraživanja, te slabosti koje su mogle
utjecati na greške u prosudbama. U raspravi znanstvenih radova više se ne iznose niti se ponavljaju
statistički podaci izneseni u rezultatima, ali se od tog pravila, iz didaktičkih razloga, ponekad
odstupa u studentskim radovima. Ako dobiveni rezultati osporavaju postavljene hipoteze, valja za to
pokušati naći primjereno objašnjenje. Kako u slučaju opovrgavanja tako i pri potvrđivanju polaznih
hipoteza, rasprava mora sadržavati usporedbu s drugim sličnim istraživanjima i pokušati
protumačiti eventualne razlike među njima.
Rasprava bi trebala sadržavati i dio koji se odnosi na uočene ili potencijalne slabosti provedenog
istraživanja. Drugim riječima, autor bi trebao predvidjeti kritike i biti svjestan mogućih nedostataka
koji ugrožavaju valjanost njegovih zaključaka. Poželjno je također iznijeti vlastiti sud o tome kako
bi se istraživanje moglo unaprijediti Ih kakav bi smjer daljnja istraživanja trebala zauzeti. Nije,
međutim, dovoljno reći da bi istraživanje valjalo ponoviti i primjenom nekog drugog testa verbalne
inteligencije. Potrebno je naime jasno naznačiti što smo u istraživanju propustili, što bi se moglo
popraviti i, što je najvažnije, kakve rezultate u tom slučaju očekujemo. Možemo, primjerice,
zaključiti kako su žene doduše iskazale veću verbalnu sposobnost, ali su ih korištene mjere verbalne
fluentnosti dovodile u prednost. U slučaju korištenja nekog drugog testa koji bi, primjerice, mjerio
verbalno razumijevanje, razlike možda ne bi bilo.
Rasprava je, kako neki drže, svojevrsna među igra u kojoj se povezuju i isprepliću uvod,
metodologija i rezultati (Kazdin, 1995). Često se dešava da objašnjenja ponuđena u raspravi odlaze
83
82
56
Ivo V.
predaleko u odnosu na dobivene rezultate ili korištenu 84 metodologiju, što je čest razlog nepovoljnih
recenzija. Autor svakako treba pokušati dobivene nalaze protumačiti sa sviješću o ograničenjima
nacrta, ali ne i služeći se njima kao izlikom za izostanak očekivanih nalaza.
5.2.8 ZAKLJUČCI
U znanstvenim se časopisima ne prakticira posebno izdvajanje zaključaka, niti izdvajanje problema.
No radi jasnoće u konceptualizaciji, za studente je dobro dodatno istaknuti zaključke istraživanja.
To je posebno važno zbog prirode odjeljka rasprave koja se dijelom temelji na dobivenim
rezultatima, a dijelom je spekulativna i hipotetička, Zaključci uglavnom sadržavaju samo ono što
jasno i nedvosmisleno proizlazi iz rezultata. Zaključci su koncizan odgovor na postavljene
probleme posve utemeljeni na dobivenim rezultatima. Ako se u zaključcima iznose neka
uopćavanja ona također moraju počivati na činjenicama.
5.2.9 LITERATURA
U dijelu izvještaja u kojem se spominje ili opisuje neki znanstveni članak, knjiga ili poglavlje iz
knjige, potrebno je naznačiti autora i godinu izdanja. Nakon opisa ili tvrdnji koje su preuzete iz tog
rada u zagradi se upisuje prezime ili prezimena autora i, poslije zareza, godina izdanja. Primjerice:
Odstupanja istraživačke prognoze od stvarnih izbornih rezultata često se pripisuju različitim
metodološkim razlozima (Lamza, 1992).
U iznesenom primjeru, tvrdnja nije doslovni citat autorice, već određena prerada jednog njezina
zaključnog nalaza. Zato je dovoljno prezimenom autorice i godinom izdanja naznačiti u zagradi da
se ne radi o našem zaključku, već o nalazu tuđeg istraživanja.
U slučaju doslovnog citata, kao u primjeru:
"Neka pojedinačna odstupanja od ostvarenih izbornih rezultata objašnjena su različitim, pretežno
metodološkim razlozima ..." (Lamza, 1992 str. 242) \
potrebno je citat staviti u navodne znake i uz referencu pridružiti i broj stranice na kojoj se citirana
izjava nalazi.
Prilikom citiranja rada koji su napisala dva autora, uobičajeno je spominjanje oba imena, primjerice
(Leong i Austin, 1996), ali kad je broj autora tri ili veći, spominje se samo prvo prezime uz dodatak
i sur. (što znači: suradnici), primjerice (Larnza i sur., 1992).
Svu literaturu koju je autor spomenuo u tekstu, valja u odjeljku literature napisati u punom obliku,
ali opća pravila o tome kako to valja učiniti ne postoje.85
Znanstveni časopisi traže da literatura bude navedena prema određenim pravilima koja se razlikuju
od struke do struke i od časopisa do časopisa (abecedni redoslijed ili redoslijed spominjanja li
tekstu, skraćen i ili puni nazivi časopisa, godina izdanja na početku ili kraju reference). Autori se
zbog toga u navode nju literature uvijek moraju prilagođavati pravilima pojedinog časopisa u kojem
namjeravaju objaviti članak. Valja također napomenuti da se pravila o načinima navođenja
literature povremeno mijenjaju i u istim publikacijama, tako da obrazac koji je prije vrijedio može
biti zamijenjen novim. Većim časopisa u kojima objavljuju psiholozi rukovodi se u većoj ili manjoj
mjeri pravilima što ih je ustanovila APA (2001), a ta ćemo pravila, u neznatno izmijenjenom obliku
zbog jezične prilagodbe ukratko predstaviti na ovom mjestu. Pisanje literature je ponešto različito
za znanstvene radove u odnosu na knjige, poglavlja u knjigama ili elektroničke izvore. Iznosimo
načine pisanja referenci za sve pobrojene mogućnosti.
Radovi u časopisima
prezime autora, inicijal imena. (godina izdanja). naslov rada. ime časopisa, volumen, broj stranica
od-do.
84
83
85
84
57
Ivo V.
Larnza Posavec, V. i Rimac, r. (1997). Dio koji nedostaje: problem neizjašnjavanja u istraživanjima
namjera glasovanja. Društvena istraživanja, 6, 729-745.
Knjige
prezime autora, inicijal imena. (godina izdanja). naslov knjige. mjesto izdanja: izdavač.
Bujas, Z. (1981). Uvod u metode eksperimentalne psihologije. Zagreb: Školska knjiga.
Poglavlje u knjizi
prezime autora, inicijal imena. (godina izdanja). naslov poglavlja. U: inicijal imena urednika.
prezime urednika (ur), ime knjige (stranice od-do u kojima se nalazi citirano poglavlje). mjesto
izdanja: izdavač.
Anić, N. (1985). RET i druge psihoterapije. U: N. Anić (ur.), Praktikum iz bihevior terapije II (str.
195-205). Zagreb: DPH.
Navođenje elektroničkih izvora
prezime autora, inicijal imena. (godina izdanja). naslov rada. ime časopisa, volumen,86
broj članka.
Datum pribavljanja,
internet adresa
Jakab, Z. (2003). Phenoruenal projection. Psyche 9, članak 04.
Pribavljeno 15. svibnja 2003. s adrese
http// psyche.cs. monash.edu.au/v9/ psychc- 9-04 - jakab.html
Poseban je slučaj s citiranjem literature iz sekundarnog izvora. Ako o nekom radu prosuđujemo, ne
na temelju njega samoga, nego putem mišljenja nekog trećeg autora, to trebamo naznačiti
drukčijim navođenjem. Primjerice, ako o radu I. Rimca, Socijalni status i politička odluka - izbori
1992. zaključujemo na temelju rada G. Milasa Razlozi nedosljednosti: tko i zašto mijenja glasačku
odluku?, u tekstu ćemo navesti primarnu i sekundarnu referencu: Društveni status je prepoznat kao
važna odrednica biračkog ponašanja u Hrvatskoj (Rimac, 1992 prema navodu Milasa, 2000), ili U
istraživanju Rimca provedenom 1992., društveni je status prepoznat kao važna odrednica biračkog
ponašanja (prema navodu Milasa, 2000), dok ćemo u literaturi navesti samo referencu sekundarnog
izvora:
Milas, G. (2000). Razlozi nedosljednosti: tko i zašto mijenja glasačku odluku?, Društvena
istraživanja, 9, 473-495.
5.3 OBILJEŽJA KVALITETNO NAPISANOG RADA

Iako je poznavanje strukture. poželjnog stila i načina pisanja važno za stvaranje općeg dojma o
radu, presudnu ulogu u ukupnoj ocjeni imaju suštinski čimbenici. Nedovoljna pismenost, slabo
opremljene tablice i grafikoni ili krivo navođenje literature česti su problemi početničkih radova, ali
nijedan od njih ruje po sebi dovoljan za stvaranje nepovoljnog suda ili u slučaju uredničke odluke,
odbacivanje rada kao neprihvatljivog za objavljivanje. Ključne elemente zbog kojih radovi bivaju
slabo ocijenjeni vrlo iscrpno je nabrojio Bartol (1983):
1. Neprimjeren pregled literature (preopširan ili preoskudan)
2. Navođenje referenci nebitnih za temu
3. Nejasan uvod koji zamagljuje izlaganje problema
4. Nejasna istraživačka pitanja
5. Neprimjeren opis uzorka
6. Neprimjeren opis metodologije, nedovoljan za ponavljanje
86
85
58
Ivo V.
7. Nedovoljno vođenje računa o mjerama, osobito novim instrumentima87
8. Neprimjerena ili upitna statistička analiza
9. Slabo osmišljena rasprava, ne mnogo bogatija od ponavljanja rezultata
10. Rasprava koja odlazi predaleko i nudi neopravdane zaključke
11. Pretjerana duljina
Osim pitanju stila, istraživač mora posvetiti osobitu pažnju suštini i metodologiji. Oba su područja
temeljito obrađena u izdavačkom priručniku Američke psihološke udruge (Publication Manual of
the APA, 2001), a mi ćemo se osvrnuti na najvažnije dijelove.
Najveći utjecaj na odluku o prihvaćanju ili odbijanju ponuđenog rukopisa, odnosno na stvaranje
suda o njemu, imaju njegove suštinske odrednice vezane uz proučavani problem. Budući da je
pitanje vec uvelike obrađeno u poglavlju o istraživačkom problemu i njegovu znanstvenom
značenju, nećemo se na njega vraćati.
Na ovome ćemo se mjestu ograničiti na praktične upute o tome kako učinkovito prenijeti
istraživačku poruku u okvirima što ih nudi zada na znanstvena forma. U priručniku (APA, 2001) se
tako spominju sljedeći naputci:
1. Istraživački problem treba izložiti već na početku teksta
2. Potrebno je pokazati kako je problem utemeljen, oblikovan i usmjerivan teorijom
3. Problem valja povezati s prethodnim radovima u primjerenom, informativnom, ali i
konciznom pregledu literature
4. Istraživačke hipoteze valja izrijekom navesti
5. Zaključci ne smiju izlaziti izvan okvira rezultatskih nalaza
6. Valja pokazati na koji način je istraživanje pripomoglo razrješavanju izvornog problema
7. Na koncu treba prepoznati i raspraviti teorijske i praktične implikacije koje proizlaze iz
istraživanja.
Recenzenti umjesto fokusiranih primjedbi često uopćeno primjećuju da rad što im je dan na
prosudbu ne sadrži ništa novo, ništa što na bolji način već ranije nije istraženo ili ništa od veće
teorijske važnosti. U takvim situacijama nikakvi formalni napuci ne mogu nadomjestiti manjak
suštinskog značenja.
Druga temeljna značajka dobro napisanog rada o kojoj uvelike ovisi njegova daljnja sudbina jest
suvisla metodologija. Ona mora biti primjerena problemu, ali i podrobno opisana kako bi omogućila
ponavljanje. Metodološka suvislost počiva na svemu onome Što se u dosadašnjim poglavljima
zagovaralo, zdravom nacrtu, dobroj eksperimentalno] kontroli, odgovarajućem uzorku, solidnim
mjernim instrumentima i primjerenoj statističkoj analizi.88
5.4 PROCES ZNANSTVENE RECENZJJE

Recenzije su neizostavan element znanstvenog procesa. One su vrednovanje na temelju kojeg se
donosi odluka o tome hoće li rad u konačnici biti objavljen ili odbačen. Obavljaju ih ugledni
stručnjaci iz područja kojim se rad bavi, a recenzije su, u pravilu, slijepe, što znači da ni recenzent
ni autori ne znaj"; jedni za druge. Dužnost je recenzenata da
1) donesu sud o objavljivanju nekog rada,
2) temeljito obrazlože vlastito mišljenje,
3) ponude korisne preporuke autorima prihvatljivih radova kako da ih preprave i učine boljima,
a ponekad i
4) razvrstaju rad smještajući ga u jednu od ponuđenih kategorija (u Hrvatskoj, primjerice, rad
može biti klasificiran kao izvorni znanstveni, pregledni, stručni ili prethodno priopćenje).
Jednom kad je rad odaslan uredništvu časopisa, otpočinje proces recenziranja. Prva instanca koju
rad prolazi jest uredničko čitanje koje za dio poslanih rukopisa koje formom, sadržajem, stilom ili
metodološkom razinom ne zadovoljavaju ni najblaže standarde, rezultira i završnom (negativnom)
87
86
88
87
59
Ivo V.
ocjenom. Radovi za koje se procijeni da su posve neprimjereni za objavljivanje u nekom časopisu,
odbijaju se prije slanja recenzentima. Većina poslanih rukopisa prolazi prvu prepreku i dolazi u
ruke recenzentima, koji obraćaju pozornost na stil i duljinu rada, ali se uglavnom usredotočuju na
suštinske elemente, poput sadržaja i problemskog područja te metodologije. Konačna recenzija
može biti pozitivna, negativna i uvjetno pozitivna. Radovi za koje se drži da ne dosežu
odgovarajuće standarde i nije ih moguće poboljšati niti temeljitim preuređenjem, bivaju odbijeni.
Dio radova biva prihvaćen pod uvjetom većih ili manjih preinaka što ih preporučuju recenzenti.
Preostatak se prihvaća neovisno o prepravkama, no to je, u ozbiljnim časopisima, prava rijetkost.
Čitav proces recenziranja zna potrajati i duže, ali se autorima obično unutar dva mjeseca daje do
znanja je li njihov rad prihvaćen ili odbijen. U svjetski poznatim časopisima, poput onih koje izdaje
APA, tek jedan od četiri poslana rukopisa može računati na objavljivanje. U Hrvatskoj su kriteriji
mnogo blaži, ali u najkvalitetnijim časopisima, negativna recenzija nije rijetkost.89
89
88
60
Ivo V.
EKSPERIMENTALNE METODE
6. TEMELJI EKSPERIMENTALNE METODE

6.1 PROBLEM UZROČNOSTI
Prije negoli se pozabavimo temeljnim problemima opravdanosti pridavanja nekom odnosu svojstva
uzročnosti, umjesno je postaviti dva pitanja. Zbog čega problem uzročnosti uopće zaslužuje prostor
u tekstu posvećenom istraživačkim metodama i zašto upravo na ovom mjestu, kao uvod u opisivanje
eksperimentalnih metoda? Ukratko ćemo odgovoriti na oba pitanja.
Pripisivanje uz ročnosti toliko je uobičajeno u svakodnevnom govoru ela se čini kako se toj temi
nema što nadodati. I doista, svijet ne sagledavamo kao neorganiziranu skupinu događanja već
redovito kao splet zbivanja među kojima vladaju uzročno-posljedične veze. Unatoč prividnoj
prirodnosti i očiglednosti kojom u svakodnevnim situacijama odnos među pojavama proglašavamo
uzročno-posljedičnim, pitanje uz ročnosti od davnina je zaokupljalo filozofe, a u novije vrijeme i
znanstvenike, izazivajući pritom naglašen prijepor. Mišljenja su se pritom kretala u širokom
rasponu od posvemašnje sumnje u mogućnost dokazivanja uzročno-posljedičnih veza pa do
naglašeno pragmatičnog gledanja na tu vrstu prosudbi. To je ponukalo poznatog filozofa znanosti
Nagela (1965) na zaključak kako ne postoji jasna niti općeprihvaćena definicija uzročnosti, što se,
bez dvojbe, može ustvrditi i danas. Zbog toga će se naša rasprava sastojati, ne toliko u navođenju
uvjeta koji moraju biti zadovoljeni kako bi se neka veza mogla proglasiti uzročno-posljedičnom,
koliko u iznošenju stava o tome kojem ćemo se gledištu prikloniti i što ćemo smatrati dokazom
uzročno-posljedične povezanosti izvan granica razumne sumnje. Kao takva, obrada pitanja
uzročnosti je neizostavna. Dakako, ona je nezaobilazna iz još jednog razloga.90
Ranije smo rekli da je temeljni cilj znanosti razumijevanje zbilje, pri čemu smo razumijevanje.
definirali kao spoznavanje uzroka istraživanih pojava. Zbog toga se pitanje uz ročnosti javlja kao
stožerno pitanje cjelokupne znanosti.
Drugo pitanje koje smo si postavili, zašto ćemo o uzročnosti raspravljati upravo na ovome mjestu,
također je od velike važnosti. Tu bismo raspravu s podjednakim opravdanjem mogli smjestiti u
opći, metodološki neutralni odjeljak jer se radi o nečem na što se pozivaju sve istraživačke metode,
ili pak iznova raspravljati o uzročnosti u kontekstu svake posebne metode. Usvojili smo stajalište
kako je upravo eksperimentalna metoda najbliža operacionalizacija iskustvene provjere uzročnosti,
jer se izravno nadovezuje na filozofsku misao Johna Stuarta Milla, a neizravno i na njegove
prethodnike, u prvome redu Davida Humea. No time ipak nismo razriješili sve probleme jer bi nas
takvo usmjerenje, kojem se priklanjaju mnogi udžbenici, navelo na razmjerno jednostranu i plošnu
raspravu o uzročnosti koja je neprimjerena znanstvenoj disciplini što ipak svojim većim dijelom
počiva na ne-eksperimentalnim nacrtima. Recimo odmah, tretman uzročnosti uvelike se razlikuje u
psihologa koji se bave eksperimentiranjem i onih koji se služe korelacijskim metodama, da i ne
spominjemo zagovornike kvalitativnih metoda. Svaka od metoda teži spoznavanja zbilje i uzročno-
posljedičnih veza među pojavama. Neke od njih u tome su svakako učinkovitije od drugih. Bez
dvojbe, eksperiment je, ponovit ćemo, najmoćnije sredstvo dokazivanja uzročno-posljedične
povezanosti i kao takav je nezamjenjiv. Međutim, važan doprinos mogu pružiti i ne-
eksperimentalne metode te je stoga bitno odrediti i njihove spoznajne mogućnosti, ali i
epistemološko polazište u okviru kojeg tragaju za uzročnošću. Zastupajući takvo, metodski
nepristrano usmjerenje, glavni dio rasprave o uzročnosti smjestit ćemo uz opis eksperimentalnih
metoda, ali ćemo se pitanju vraćati u nekoliko navrata rasvjetljavajući dodatno one njegove aspekte
koje ćemo u narednom izlaganju propustiti ili nedostatno pokriti.
6.1.1 GLEDIŠTA O UZROČNOSTI
Pišući o epistemologiji uzročnosti i znanstvenoj metodologiji koja se na nju oslanja, Cook i
Campbell (1979) su još mnogo godina ranije stanje ocijenili kaotičnim. Tema je uistinu toliko
90
91
61
Ivo V.
složena, a mišljenja toliko nesukladna da nijedan pregled ne može računati na iscrpnost niti
konačnost u zaključcima. Namjera nam je stoga pružiti tek okvir za razmatranje kao neku vrstu
pragmatično osnove bavljenja metodama što nude mogućnost uzročno-posljedičnih zaključaka.
6.1.1.1 ARISTOTELOVO UČENJE
Povijest ozbiljnijih filozofskih rasprava o uzročnosti seže čak do Aristotela koji je držao da uzročna
situacija sadrži materijalni i formalni aspekt. Formalni se dodatno dijeli na tri dijela, formalni u
užem smislu, djelatni i konačni. U situaciji u kojoj se91 skupocjena porculanska vaza početno nalazi
na stolu nakon čega se nečijom nespretnošću sruši na tlo, možemo razlikovati navedena četiri
aspekta. Materijalni uzrok je sam materija1 od kojeg je vaza sačinjena, dakle porculan, formalni
uključuje položaj i visinu stola u odnosu na tlo i smještaj vaze na stolu, djelatni uzrok je nespretnost
kojom je vaza srušena, a konačni uzrok je "težnja" vaze da traži položaj bliži tlu uslijed Zemljine
gravitacijske sile. Od sva četiri aspekta, moderna znanost prihvaća tek djelatni uzrok kao mogući
uzrok neke pojave, u našem primjeru nehotični pokret kojim je vaza srušena. Materijalni i formalni
nužni su uvjeti da bi se nešto dogodilo, a konačni odražava teleološko stajalište kako se sve stvari
odvijaju s određenom svrhom. Ni jedan od ta tri aspekta u filozofiji i znanosti više se ne smatra
uzrokom u užem smislu.
6.1.1.2 HUMEOVA NAČELA I NJIHOVO TUMAČENJE
Na novi značajan pomak u učenju o uzročnosti trebalo je čekati više od dva tisućljeća. David Hume
(1711-1776) filozof empirist u svojem je poznatom djelu "Rasprava o ljudskoj prirod?" (A trcatise
ofhuman nature)"postavio temelje modernom pogledu na uzročnost. Sva kasnija gledanja određivala
su se i pozivala na mišljenje što ga je iznio Hume. Odbacujući racionalističko učenje argumentima
kako znanje o uzroku nije odraz stvarne povezanosti pojava, nego prije subjektivno viđenje, Hume
je ponudio određenje uzročnosti koje naglašava elemente provjerljive opažanjem. Od osam pravila
prema kojima se može suditi o uzročnosti, ovdje ćemo spomenuti samo najvažnija. Prema Humeu,
X uzrokuje Y ako:
1. mu prethodi u vremenu (načelo prethođenja)
2. se X i Y nadovezuju (dodiruju) u vremenu i prostoru (načelo dodira)
3. se X i Y uvijek pojavljuju zajedno (načelo stalne povezanosti)
Uz tri osnovna načela, Hume navodi i neka koja nalikuju onima što će ih John Stuart Mili domisliti
tek stotinjak godina kasnije. Prema njima, isti uzrok uvijek stvara istu posljedicu, različite
posljedice upozoravaju na različite uzroke, a postojanje većeg broja uzroka praćenih istom
posljedicom kazuje da oni u sebi sadrže nešto zajedničko. Premda se čini da su Humeova načela
logički neoboriva, svako od njih sadrži stanovite nedorečenosti i moguće slabosti s kojima ćemo se
samo ukratko upoznati.
Prvo načelo nužno za izvođenje uzročno-posljedičnog zaključka kazuje kako pretpostavljeni uzrok
mora prethoditi pretpostavljenoj posljedici. Zaključak je prirodan i blizak svakodnevnom iskustvu,
no u nekim slučajevima nailazimo na određene poteškoće. Ponekad se čini kao da nema
prethođenja, odnosno uzrok i posljedica pojavljuju se gotovo istodobno. Osoba koja sjedi u
naslonjaču izaziva njegovo uleknuće. Sjedenje i ugibanje naslonjača odvijaju se pritom istodobno
(zanemarimo načas trenutak li kojem osoba sjeda), iako je posve jasno da upravo težina osobe
izaziva92 uleknuće. U tom slučaju prethođenje nije potrebno za izvođenje uzročne povezanosti. No
veće poteškoće nastaju ako se prethođenje uzima kao jedini ili osnovni kriterij uzročnosti. Ozbiljan
problem velikog broja istraživanja koja na temelju vremenskog slijeda zaključuju o uzročno-
posljedičnim vezama jest rezoniranje prema pogrešnoj pretpostavci Post hoc ergo propter hoc
(poslije toga, dakle zbog toga). Valja uvijek znati da je prethođenje najčešće nužan (osim u rijetkim
ranije spomenutim situacijama istodobnosti), ali ne i dovoljan preduvjet uz ročnosti.
U nekim je slučajevima lako zaključivati o vremenskom slijedu. Primjerice nema dvojbe da
depresivnost prethodi samoubojstvu, a nedovoljno poticajna intelektualna sredina u djetinjstvu,
91
92
92
93
62
Ivo V.
slabijoj inteligenciji u odrasloj dobi. No u nekim drugim situacijama otkrivanje vremenskog slijeda
je gotovo nemoguće. U istraživanju koje se bavilo odnosom društvenog statusa i osobina ličnosti
(Milas i Rimac, 1996) utvrđena je statistički značajna korelacija između materijalnog statusa i
izraženosti neuroticizma. Bilo bi, međutim, neopravdano zaključiti kako slabiji materijalni uvjeti
dovode do povišenog neuroticizma, iako se čini da mu prethode. Podjednako je moguće da su
emocionalno nestabilniji pojedinci manje uspješni u stjecanju materijalnih dobara, što bi ovu vezu
učinilo obrnutom, dajući neuroticizmu ulogu uzroka slabijeg materijalnog stanja. Dakako, moguće
je da je povezanost između neuroticizma i materijalnog statusa zapravo samo odraz njihove
uvjetovanosti nekom trećom varijablom, primjerice neuroticizmom, naobrazbom ili drugim
obilježjima roditelja.
Načelo prostornog i vremenskog dodira uzroka i posljedice također je nešto blisko svakodnevnom
iskustvu, premda je posve nejasno kakvu ćemo prostorno vremensku udaljenost smatrati "dodirom''.
U slučaju planetarnih gravitacijskih utjecaja to, primjerice, mogu biti milijuni kilometara, a svjetlo s
udaljenih zvijezda vidljivo je još tisućama godina nakon njihova kolapsa. Stoga načelo dodira,
posebno u kontekstu suvremenih fizikalnih nalaza, valja shvatiti uvjetno, No slično je i s nekim
psihologijskim teorijama, poput psihoanalize koja uzroke ponašanja traži u dalekoj prošlosti ranog
djetinjstva. Zbog nedovoljne određenosti pojma "dodir" i njegove prevelike rastezljivosti, gornje
načelo nije od velike koristi pri prosuđivanju uzročnosti.
Treće načelo, na kojem u najvećoj mjeri počiva Humeovo učenje, izazvalo je najviše nedoumica,
Pretpostavimo li da je jedna pojava uzrok drugoj, one se u vremenu moraju mijenjati usporedno,
odnosno promjene u jednoj od njih moraju biti popraćene promjenama u drugoj. Prema jednom
tumačenju, radi se o stalnoj povezanosti, pri čemu je jedna varijabla dovoljan preduvjet javljanja
druge. Primjerice, otkazivanje bubrega dovoljan je, premda ne i nužan uvjet smrti. Prema dugom,
strožem tumačenju, radi se o poimanju uzroka kao nužnog i dovoljnog preduvjeta pojavljivanja
posljedice. Temperatura niža od nula stupnjeva Celziusa nužan je i dovoljan preduvjet leđenja vode.
Treće tumačenje poistovjećuje ovo Humeovo načelo s korelacijom među varijablama (Cook i
Campbell, 1979). U sva tri slučaja, načelo je sporno i zahtijeva neke dodatne pretpostavke.93
Pogledajmo najprije zašto načelo nužnog i dovoljnog uvjeta ne zadovoljava moderno poimanje
uzročnosti. Pristup koji uz ročnost vezuje uz nužnost i dovoljnost nije moguć ako se uvaži načelo
neodređenosti. Naime, ako uz postojanje potencijalnog 'uzroka nije posve sigurno da će doći do
ishoda, taj se događaj ne može smatrati njenim nužnim i dovoljnim preduvjetom. Kažemo li da
dugotrajna izloženost suncu uzrokuje rak kože, mi zapravo ne mislimo da će se karcinom nužno
razviti, čak i kod osoba koje na suncu provode cijele dane. Ono što pritom želimo reći jest da će
takve osobe vjerojatnije razviti rak od onih koje se drže hlada.
Jednako tako nužnost i dovoljnost ne mogu se primijeniti u situacijama višestruke uzročnosti. Što
primjerice može biti uzrok prometne nesreće? Rijetko ćemo biti u mogućnosti izdvojiti tek jedan
jedini uzrok. Najčešće se radi o mnoštvu povezanih pojava poput klizavog kolnika, nesigurnosti
vozača, nepregledne ceste, gustog prometa, magle, dotrajalosti guma, pripitosti. Nijedan od njih
sam za sebe vjerojatno ne bi doveo do nesreće, ali svaki u određenoj mjeri povećava vjerojatnost
njena javljanja. U današnje vrijeme shvaćanje o uzroku kao nužnom i dovoljnom uvjetu posljedice
sve se više zamjenjuju uvjerenjem o probabilisiičkoj uzročnosti, odnosno nastojanjem da se odnos
između uzroka i posljedice opiše pomoću teorije vjerojatnosti (Suppes, 1970). Zamisao o uzrocima
kao događajima koji samo povećavaju vjerojatnost posljedice središnje je mjesto teorija
probabilističke uzročnosti. Na taj se način dopušta pojavljivanje posljedice bez uzroka, kao i
pojavljivanje uzroka uz izostanak posljedice. Takve uzroke uglavnom jedino i možemo susresti u
psihologiji i društvenim znanostima. Depresivnost je zasigurno jedan od uzroka samoubojstava, ali
nipošto nije nužan i dovoljan preduvjet. Niti sve depresivne osobe (ma koliko izražena bila njihova
depresivnost) pribjegnu samoubojstvu, niti su svi samoubojice depresivni. Posve je, međutim,
sigurno da naglašena depresivnost povećava vjerojatnost samoubilačkog ponašanja,
93
94
63
Ivo V.
Cook i Campbell (1979) drže da treće načelo zapravo kazuje o potrebi visoke korelacije između
pretpostavljenog uzroka i pretpostavljene posljedice. Takvo načelo slijedi teoriju probabilističke
uzročnosti jer korelacija među varijablama upravo naznačuje da javljanje određenih vrijednosti
jedne, povećava vjerojatnost pojavljivanja određenih vrijednosti druge. Načelo kovarijacije, nužan
je, ali nedovoljan preduvjet proglašavanja uzročno-posljedične veze. Mnogi laici, ali nažalost i
stručnjaci često puta uzročno-posljedičnom proglašavaju vezu koja je zapravo samo korelacijski
potvrđena.
U velikom se broju istraživanja pokazalo da zločinu mnogo češće pribjegavaju osobe iz nižih
društvenih slojeva. Prirodan je zaključak da siromaštvo i oskudica u određenom stupnju uzrokuju
zločinačko ponašanje. Znanost, međutim, ne poznaje "prirodne" zaključke, pa tako ni postojeća
istraživanja, ma koliko brojna i uvjerljiva bila, ne dokazuju stvarnu uzročnost. Moguće je, naime,
pretpostaviti i alternativno,94 da na sklonost zločinu i siromaštvo utječe treća varijabla, primjerice
genetski prenosivi konstitucijski faktori poput niže inteligencija ili ncsocijaliz.iranosti
(antisocijalnog poremećaja ličnosti) roditelja.
Postoje, međutim, i drastičniji primjeri, u kojima zdravorazumski zaključak izokreće stvarnu
uzročno-posljedičnu vezu. U takvoj se opasnosti može naći istraživač koji, primjerice, neko
ponašanje uvijek smatra odrazom stavova. Ako kažemo da netko glasuje za stranku A jer o njoj ima
dobro mišljenje, možda i griješimo. On možda ima dobro mišljenje o njoj jer stalno za nju glasuje.
Na dvosmjerni povezanost stavova i ponašanja među prvima je upozorio već spomenuti američki
psiholog Festinger (1957), dokazujući da ponekad i posve nemotivirano ponašanje može dovesti do
značajnih promjena u našim stavovima. Načeli smo dva osnovna problema pri proglašavanju
korelacijske veze uzročno-posljedičnom, problem treće varijable koja uzrokuje obje proučava ne i
smjer uzročnosti koji iz korelacije nije jasan jer obje varijable mogu biti smatra ne kako uzrokom
tako i posljedicom. U stručnoj se literaturi ove pojave nazivaju lažnom (spurioznom) korelacijom i
korelacijskom simetrijom.
Izjednačavajući visoku korelaciju s uzročnošću, približavamo se, kako primjećuju Cook i Campbell
(1979), pozitivističkom gledanju jer odbacujemo sve ono što je nedostupno opažanju. Pojasnimo.
Još je Hume, protiveći se racionalističkim postavkama, govorio kako se uzrok opire opažanju jer
sve što je vidljivo, čak i u krajnje jednostavnom primjeru bilijarskih kugli koje udaraju jedna u
druge, jest da se kugle miču nakon što bivaju udarene. Ako netko i zapazi nešto više od podudaranja
u vremenu i prostoru pripisujući udarcu uzročnost, to je za Humea problem psihologije, a ne logike.
Istina je, doduše da se poimajući uzročnost kao nešto što nadilazi korelaciju, izlažemo mogućnosti
pogrešnog zaključaka jer takvi uzroci nisu izravno zamjetljivi. Ipak, ono što preostaje nakon
odbacivanja svega nezamjetljivog, jest, ne samo reducirano, nego i iskrivljeno viđenje uzročnosti.
Dovedena do krajnosti, pozitivistička pozicija sklona je čak i ukinuti pojam uzročnosti. Bertrand
Russell (1913) je, kao pristalica takvog gledišta, ustvrdio kako je sve za čim znanost treba težiti
funkcionalna povezanost između varijabli po uzoru na neke fizikalne zakone. Primjerice u čuvenoj
Einsteinovoj formuli E=mc2, svaka od tri varijable, energija, masa ili brzina svjetlosti može biti
prebačena na lijevu stranu jednadžbe, tradicionalno sačuvanu za "uzrok". Takva vrsta funkcionalnih
zakona izostavlja potrebu za uzrokom. Odbacujući Russellovo mišljenje, Suppes (1970) je pokazao
da se i fizika vrlo često služi pojmom uzroka naznačujući u pojedinim funkcionalnim relacijama što
se smatra uzrokom, a što posljedicom.
Jedan od načina da se premosti jaz između krajnjeg pozitivističkog gledišta koji zagovara
odbacivanje uzroka nedostupnih opažanju i stajališta da je uzrok nešto što se ne može izjednačiti s
pukom korelacijom ponudio je Simon (1977). Njegovo mišljenje, 95koje su osobito spremno
prihvatili zagovornici kauzalne analize na temelju korelacijskih podataka (James i sur., 1982),
sastoji se u pridavanju uz ročnosti obilježja ''asimetrične funkcionalne povezanosti''. Pritom, doduše,
korelacija upućuje na uzročnost, ali je razlikovanje uzroka i posljedice jasno jer se radi o
asimetričnoj povezanosti. Simon drži da se o uzročnosti može zaključivati ako se unutar zatvorenog
sustava funkcionalnih jednadžbi variranje jedne skupine varijabli (posljedica) može objasniti
94
95
95
96
64
Ivo V.
variranjem druge skupine (uzrocima). Za razliku od simetrične funkcionalne povezanosti, u kojoj
varijable s obje strane mogu predstavljati, kako uzroke, lako i posljedice, asimetrična povezanost
koju zagovara Simon definirana je matematički, sustavom (linearnih) jednadžbi. No potankosti
ovog gledišta ipak ćemo ostaviti za kasniju raspravu o dosezima korelacijskih istraživanja u
pružanju mogućnosti uzročnog zaključivanja.
6.1.1.3 MILLOVA NAČELA
Važan doprinos boljem razumijevanju uzročnosti dao je John Stuart Mill (1806-1873), koji je držao
da zaključivanje o uz ročnosti počiva na tri faktora:
1. Prethođenju (uzrok mora prethoditi posljedici)
2. Povezanosti (uzrok i posljedica moraju biti povezani)
3. Ostala moguća objašnjenja povezanosti uzroka i posljedice moraju biti isključena
Vidimo da su prva dva preduvjeta preuzeta od Humea, ali je zato u trećemu sadržana suština
Millova doprinosa, ne samo epistemologiji uzročnosti nego i eksperimentalnoj metodi. Upravo je
ona ključna za operacionalizaciju pravila što ih je Mill ponudio kako bi s većom sigurnošću sudio o
uz ročnosti. Kao takva čine temelj logike eksperimentalne metode i bit će podrobno opisana kasnije.
Zasada recimo samo da je pri donošenju zaključaka o uzročno-posljedičnoj povezanosti na temelju
eksperimenta upravo treća točka odlučujuća. Najteže je, naime, isključiti druga moguća objašnjenja
pojavljivanja pretpostavljene posljedice nevezana uz pojavljivanje pretpostavljenog uzroka. Da bi u
tome uspio, istraživač pribjegava različitim postupcima eksperimentalne kontrole, uvođenju
kontrolne grupe, stabilizaciji ili uravnoteživanju, koji odstranjuju ili čine neuvjerljivima druge
moguće pretpostavke.
6.1.1.4 PRINOSI NOVIJEG DATUMA
Na načelo odbacivanja drugih mogućih tumačenja kao način dokazivanja uzročnosti, nadovezao se i
Karl Popper (1959). Njegov kriterij oborivosti, naime, moguće je primijeniti ne samo na teorije u
cjelini, nego i na izvode koji pretpostavljaju uzročnost. Krajnje pojednostavljeno, ako smo
opovrgnuli sve druge uzročne pretpostavke, tada se ona koja nije opovrgnuta može smatrati
dokazanom. Popper, međutim, kako su uvjerljivo pokazali Cook i Campbell (1979), polazi od
idealističkog96 gledanja da se različite teorije mogu vlastitim izvodi ma koji sadrže jasno određene
uz ročne pretpostavke sučeliti u istom eksperimentu, što u stvarnosti nije odveć čest slučaj.
Jedno od gledišta vezuje pojam uz ročnosti uz pojam manipulacije. Prema Collingwoodu (1940),
uzrok je ono čime možemo upravljati kako bismo postigli da se nešto dogodi. To je, primjerice,
paljenje svjetla pritiskom na prekidač ili zaustavljanje automobila stiskanjem pedale kočnice. još
užem značenju, uzročnost s povezuje samo s pojavama koje dopuštaju ljudsku manipulaciju
(Holland, 1986), čime se ovaj pojam izjednačuje s eksperimentom. Bollen (1989) pak drži da
manipulacija kakvu susrećemo u eksperimentu može biti od velike pomoći u izolaciji varijabli i
uspostavljanju smjera utjecaja, ali da sama po sebi nije ni nužan ni dovoljan uvjet uzročnosti.
Argumentacija kojom pritom brani vlastito stajalište na prilično je čvrstim osnovama. Ljudske
osobine poput spola, dobi ili rasne pripadnosti ne mogu u takvom poimanju biti uzroci. Ili, još
plastičnije, mjesec ne uzrokuje plimu i oseku, a uragani ne pustoše krajeve kojima prolaze i slično.
Naposljetku valja upozoriti na evolucijsko gledište kritičkog realizma što ga opisuje Campbell
(1974; Cook i Campbell, 1979) koje potrebu za uzročnošću pripisuje jakoj i tvrdoglavoj psihološkoj
predispoziciji utemeljenoj na biološkom ustrojstvu i evolucijskom razvoju. Ljude, sukladno tom
gledištu, karakterizira naglašena potreba da svijet sagledaju kao smislen i objašnjiv u terminima
uzročnoposljedičnih odnosa. To, međutim, ne znači da je subjektivna uzročnost posve nevezana uz
objektivnu. Naprotiv, subjektivna zbilja najčešće vjerno odražava događanja u vanjskome svijetu,
ali ponekad dolazi i do nesuglasja.
96
97
65
Ivo V.
6.1.2 EKLEKTIČKI POGLED
Kratki pregled inače vrlo bogate i raznorodne skupine filozofskih djela, napisa i znanstvenih radova
o problematici uzročnosti upućuje na jasan zaključak kako se mišljenja sučeljavaju oko temeljnog
poimanja uzroka i načina njegova dokazivanja. Pritom većina stajališta zauzima mjesto između
dviju krajnjih pozicija, pozitivističke, koja odbacuje pojam uzročnosti kao nešto što nepotrebno
opterećuje znanost metafizičkim sadržajem i esencijalističke, koja prihvaća samo istinske i
najbliže uzroke, shvaćene kao nužne i dovoljne uvjete pojavljivanja posljedice. Dosadašnja
rasprava jasno pokazuje da nijedno od dva gledišta, niti pozitivističko ni esencijalističko ne nude
mnogo psihologiji. Prvo praktički izbacuje pojam uz ročnosti iz znanosti, čime je čini spoznaj no
neučinkovitom. Valja se složiti da je korelacija često jedino o čemu u psihologiji možemo
zaključivati, ali to svakako nije opravdan razlog niti izjednačavanju uzročnosti s korelacijom, niti
potpunom odbacivanju toga pojma. Drugi pristup također je neprimjeren jer prilikom prepoznavanja
uzroka nameće, za društvene znanosti, teško dostižne kriterije. Naizgled nepomirljivi, različiti
pristupi ipak97 dopuštaju eklektički pogled, vođen više znanstvenim pragmatizmom negoli
misaonom čistoćom i logičkom izbrušenošću filozofske doktrine.
Sličan stav zauzimaju Cook i Campbell (1979) zadovoljavajući se, za psihologiju dostatnim,
uspostavljanjem i dokazivanjem uz ročnosti na molarnoj (višoj) razini. Poslužimo se primjerom što
ga iznose sami autori kako bismo ilustrirali njihov eklektički stav. Pritisnemo li prekidač na
svjetiljci, žarulja će zasvijetliti. Pritiska nje prekidača jest uzrok više razine. Na mikrorazini radi se
o uspostavljanju strujnog kruga kojim električna energija dotječe do žarulje. U strogom smislu,
kakvim ga pojme neke teorije, uzroci više razine nisu stvarni uzroci nego odraz subjektivne
percepcije. Ipak i kao takvi su korisni jer pridonose našem znanju i dopuštaju provjeru. Pored toga,
makro razina nam nalaže korištenje probabilističke uzročnosti jer nepoznavanje krajnjih uzroka čini
da prepoznati uzroci više razine nisu nužni i dovoljni uvjeti. Pritisak na prekidač nije nužan ni
dovoljan uvjet paljenja svjetla. Ako je strujni krug prekinut ili je žarulja pregorjela, njime nećemo
moći upaliti svjetlo (prema tome nije dovoljan preduvjet). Ako pak uspostavimo strujni krug na
drugi način, a ne pritiskom prekida ča, možemo proizvesti isti učinak kao i prekidačem (nije niti
nužan preduvjet). Manipulacija i kontrola uvjeta što ih nude eksperimenti poželjno su sredstvo
dokazivanja uz ročnosti, ali nam nisu uvijek na raspolaganju niti su neizostavno potrebni za
uspostavljanje uzročnosti na molarnoj razini. Opisano gledište osobito je dragocjeno za psihologiju
jer je za nju i druge društvene znanosti redukcionizam potreban za "stvarnu" uzročnost u smislu
nužnog i dovoljnog preduvjeta predstavlja teško dostižan ideal. Uzmimo za primjer kriminalno
ponašanje. Na molarnoj razini možemo ga pokušati objasniti osobinama ličnosti, inteligencijom i
društvenim statusom. No to je dostatno tek za probabilističko određenje ove pojave. Manja
socijaliziranost, agresivnost i niža inteligencija samo uvećavaju nečije izglede da se nađe u sukobu
sa zakonom. Pravi uzroci leže možda u biokemizmu živčanog sustava, ali njihovo prepoznavanje
zasada je samo daleki san.
Uvelike dijelimo mišljenje Cooka i Campbella (1979) oko potrebe zauzimanja ragmatične pozicije
koja će ubrzati, a ne zakočiti razvoj psihologijske znanosti. Zbog toga ćemo se samo nadovezati,
eklektički preuzimaj ući elemente različitih pristupa kako bismo ojačali snagu zaključaka o
uzročnosti, ne dovodeći međutim cijelo pitanje do krajnosti i potpunog skepticizma. Pritom ćemo se
ograditi od obje ekstremne pozicije, pozitivističke koja isključuje potencijalne uzroke nedostupne
opažanju i esencijalističke, koja teži samo istinskim, nužnim i dovoljnim uzrocima.
Načela koja se stoga nameću kao ključna jesu:
1. Humeovo i Millovo načelo međusobne povezanosti (kovarijacije) pojava
2. Humeovo i Millovo načelo prethođenja uzroka posljedici98
3. Millovo načelo odbacivanja svih drugih mogućih objašnjenja (kontrole).
97
98
98
99
66
Ivo V.
Gornja načela dopuštaju i nameću koncept probabilističke uzročnosti kao jedino prihvatljivo
rješenje suvremenih društvenih znanosti. Time ujedno priznajemo i prihvaćamo ograničenja
molarnih objašnjenja kakva nam pritom stoje na raspolaganju.
Sredstva koja pomažu u demonstraciji uzročno-posljedične veze, ali nisu neizostavna poput ranije
nabrojenih jesu:
 Mogućnost manipulacije uzrokom.
 Mogućnost izolacije potencijalnog uzroka i posljedice.
 Mogućnost ponavljanja demonstracije uzročno-posljedične povezanosti.
Prva dva su uobičajeni elementi eksperimentalnog pristupa koje ćemo ubrzo upoznati dok je o
posljednjem, trećem sredstvu, potrebno reći nešto više. Ono kazuje kako vezu između
pretpostavljenog uzroka i pretpostavljene posljedice valja više puta demonstrirati kako bismo u nju
bili sigurniji. Dakako i ovdje se javljaju problemi uvjetovani pokušajem da se induktivnim putem
izvode zaključci o uzročnosti. Ako zaključke izvodimo deduktivno, iz premisa, možemo biti sigurni
da će valjani zaključci iz istinitih premisa biti isto tako istiniti. Na primjer, iz premisa:
a) Svi diplomirani psiholozi studirali su psihologiju i
b) svi studenti psihologije polagali su prijemne ispite,
možemo zaključiti da su svi diplomirani psiholozi polagali prijemne ispite. Takvu sigurnost
nemamo pri induktivnom zaključivanju. Broj pojedinačnih slučajeva, na temelju kojih izvodimo
zaključke je u pravilu ograničen, u odnosu na cjelokupnu populaciju mogućih slučajeva koja je
neiscrpna. Ako zaključimo da prestanak rada srca uzrokuje smrt, mi zapravo tvrdimo da će svaka
osoba kojoj srce prestane kucati (i dakako ne bude nadomješteno drugim srcem donatora) umrijeti.
Premda bi takav zaključak malo tko problematizirao, tek podatak da su svi ljudi za koje znamo da
im je srce prestalo kucati umrli, ne jamči njegovu istinitost, jer postoje pojedinačni slučajevi
(odnosno živi ljudi) za koje, strogo gledano, nije sigurno hoće li se podvesti pod opće pravilo.
Induktivnim načinom, stoga, na temelju ograničenog broja slučajeva nastojimo doći do
općevrijedećih zaključaka. I premda smo, logički gledajući, bespomoćni pred neizvjesnošću takvih
zaključaka, znanstveni pragmatizam nalaže da se pretpostavljena uzročna veza demonstrira u
onoliko slučajeva koliko je dovoljno za dokaz ivanje izvan granica razumne sumnje.
6.2 LOGIKA EKSPERIMENTIRANJA

Premda druge istraživačke metode, poput opažanja ili korelacijskih tehnika mogu ponekad pružiti
vrlo dragocjene spoznaje o različitim pojavama, mogućnosti99 opisnih metoda ipak su razmjerno
ograničene. Na temelju njih nije moguće izvesti konačne zaključke o izučavanoj pojavi niti je
dokraja razumjeli. Za neku pojavu možemo reći da smo je razumjeli tek onda kad spoznamo njene
uzroke. Koliko je problem dokazivanja uzročnosti ozbiljan i nesiguran, upravo je pokazala
prethodna rasprava, upućujući nas na korištenje onih metoda koje nas najviše štite od pogrešaka ili
ishitrenih zaključaka.
Eksperiment je primarno, a prema nekima i jedino istinsko znanstveno istraživačko sredstvo
prilagođeno-uspostavljanju uzročno-posljedičnih veza. Njime se, u kontroliranim uvjetima nastoji
provjeriti utječe li mijenjanje jedne ili više nezavisnih varijabli na promjene u zavisnoj varijabli.
Eksperiment se obično sastoji od promatranja i mjerenja ponašanja osoba koje su bile izložene
određenim uvjetima, nakon čega ih se uspoređuje s onima kojim nisu bili izloženi. Drugi je način da
iste osobe opažamo u dvjema različitim situacijama, nastojeći eventualne promjene u ponašanju
pripisati osobitostima situacije.
Pri donošenju zaključaka o uzročno-posljedičnoj povezanosti najteže je isključiti druga moguća
objašnjenja pojavljivanja izučava ne pojave. Da bi u tome uspio, istraživač pribjegava različitim
postupcima eksperimentalne kontrole kojima takva, alternativna objašnjena odstranjuje ili čini
neuvjerljivima. Temeljni problem eksperimentalnog nacrta upravo se i sastoji u tome da se
99
100
67
Ivo V.
istraživanje organizira tako da dopusti izvođenje logičkih zaključaka o postojanju ili nepostojanju
pretpostavljene uzročnosti.
Osnovna načela logičkog dokaza u eksperimentalnom istraživanju postavio je još John Stuart Mill
(1874) i ona još i danas, uz određene preinake i poboljšanja, čine temelj eksperimentalne metode.
Njegova analiza pruža četiri glavne metode uključene u izvode nje eksperimentalnog dokaza:
1. Metoda slaganja.
2. Metoda razlike.
3. Zajednička metoda slaganja i razlike
4. Metoda zajedničkog variranja.
Metoda slaganja podrazumijeva opažanje više situacija u kojima se pojavljuje izučavano
ponašanje. Ako se ponašanje uvijek pojavljuje u situaciji koja sadrži određeni element, bez obzira
na izostanak drugih situacijskih okolnosti, možemo zaključiti da taj element koji je, i izdvojen od
ostalih, vezan uz pojavljivanje ponašanja, njezin uzrok. Možemo stoga reći da ako dva ili više
slučaja pojavljivanja izučavanog ponašanja dijele jedan i samo jedan zajednički element, taj bi
element mogao bili njegov uzrok.100
situacija posljedica
ABC  H
ECD  H
FCG  H
Zaključak: C uzrokuje H
pritiskanje prekidača, lupkanje po svjetiljci, pritiskanje žarulje  paljenje svjetla

pritiskanje prekidača, kuckanje žarulje, trljanje svjetiljke  paljenje svjetla
pritiskanje prekidača, navlačenje kabela, okretanje svjetiljke  paljenje svjetla
Zaključak: pritiskanje prekidača uzrokuje paljenje svjetla
Uzmimo da dijete pokušava upaliti svjetlo na stolnoj svjetiljci. Njegova se nastojanja najbolje mogu
opisati kao metoda pokušaja i greške. Ono čini sve ne bi li se svjetlo upalilo, lupka, okreće, kucka i
manipulira svjetiljkom, a naposljetku, slučajno, pritisne prekidač. I svjetlo se pali. U više takvih
navrata dijete već uspostavlja uzročan odnos između pritiska na prekidač i paljenja svjetla. To je
grubo pojednostavljena bit metode slaganja. No zaključak izveden samo na temelju uočavanja
zajedničkog elementa u više pojavljivanja nekog događaja premda prirodan, prepun je slabosti i
zapravo nevaljan. Dva su temeljna problema takve metode:
1) često je nemoguće pobrojiti sve elemente neke situacije, zbog čega nam se može
dogoditi da neki zajednički element promakne i
2) uzroci iste pojave mogu biti različiti.
Neki elementi situacije dakle nisu uopće morali biti uzeti u obzir unatoč njihovoj važnosti za
izučavano ponašanje. Primjerice, ako opazimo da se neka osoba napije svaki put kad pije mineralnu
vodu, možemo pogrešno zaključiti da pijenje mineralne vode uzrokuje napitost. Pritom smo možda
ispustili važan detalj da ta osoba pije mineralnu vodu isključivo pomiješanu s vinom. Nadalje, isto
ponašanje može u svakoj situaciji imati različite uzroke. Jedanput jedemo zbog gladi, drugi put
zbog dosade, a treći put zbog tjeskobe ili depresivnosti. Očito je stoga da metoda slaganja nema
100
101
68
Ivo V.
preveliku vrijednost kao dokazne sredstvo uzročnosti. Ali ima itekakvu vrijednost u odbacivanju
nevaljanih pretpostavki, odnosno isključivanju za pojave nevažnih situacijskih okolnosti. Naime,
nešto što se ne pojavljuje kao popratna okolnost barem u većini slučajeva neke pojave vjerojatno
nije njezin uzrok. Ipak valja biti rezerviran, jer probabilističko određenje uzročnosti dopušta da se
uzrok pojavljuje razmjerno rijetko, a da ipak pridonosi povećanju vjerojatnosti neke pojave.
Ako se izloži u niječnom obliku, načelo slaganja kazuje da vezivanje nepojavljivanja određenog
ponašanja uz nepojavljivanje određenog faktora okoline može biti posljedica njihove uzročno-
posljedične veze.101
AB (ne-C)  ne-H
ED (ne-C)  ne-H
FG (ne-C)  ne-H
Zaključak: C uzrokuje H
ne-pritiskanje prekidača, lupkanje po svjetiljci, pritiskanje žarulje  svijetlo se ne pali

ne-pritiskanje prekidača, kuckanje žarulje, trljanje svjetiljke  svijetlo se ne pali
ne-pritiskanje prekidača, navlačenje kabela, okretanje svjetiljke  svijetlo se ne pali
Zaključak: pritiskanje prekidača uzrokuje paljenje svjetla
Ako u situacijama u kojima nismo gladni nikad ne jedemo, moguće je usvojiti kauzalan odnos
između gladi i jedenja. No kao i u slučaju pozitivnog slaganja, zaključak je nevaljan i oboriv na više
načina. S obzirom na istu logičku strukturu, metoda dijeli iste slabosti kao i one prethodno iznijete.
Važni faktori mogli su biti izostavljeni iz situacije. Primjerice, nejedenje može biti posljedica
držanja redukcijske dijete ili lošeg raspoloženja. Isto tako izostajanje ponašanja moglo je imati
različite uzroke u svakom pojedinom slučaju. U jednom slučaju uzdržavanje od hrane može biti
posljedica sitosti, u drugome probavnih smetnji.
Metoda razlike ima najveću važnost od svih postupaka što ih je predložio Mili, jer čini logičku
osnovicu eksperimentalne metode. Ona kazuje da ako neka situacija u kojoj se očituje određena
pojava i neka druga u kojoj se ona ne očituje imaju zajedničko sve izuzev jedne pojedinosti, ta je
pojedinost možda uzrok izučava ne pojave. Zamislimo da smo u istom dućanu kupili dvije istovrsne
biljke. Obje smo odnijeli u stan i jednako zalijeva li i gnojili, ali smo jednu stavili na sunce, a drugu
u sjenu. Ako prva biljka uvene, a druga počne dobro napredovati, skloni smo zaključiti da je ta
biljna vrsta vjerojatno sklonija sjenovitom okružju, odnosno da je izloženost suncu uzrokovala
uvenulost. Zamislimo li se ipak malo bolje, uočit ćemo da ne možemo biti posve sigurni u naš
zaključak. Biljke su, premda naoko istovjetne, možda otpočetka bile različite kvalitete, ili zasađene
u drukčiju zemlju ili se njihova mjesta u stanu razlikuju i po drugim obilježjima, a ne samo
izloženosti suncu, primjerice blizini tehničkih uređaja, umjetnom svjetlu ili nasrtljivim kućnim
ljubimcima. Shematski se metoda može prikazati kao:
ABC  D
AB ne-C  ne-D
Zaključak: C uzrokuje D102
sunce, zalijevanje, gnojenje  biljka vene
101
102
102
103
69
Ivo V.
sjena, zalijevanje, gnojenje  biljka napreduje

Zaključak: izloženost suncu uzrokuje uvenuće
Metoda je u operativnom smislu najbliža onome što je moderna znanost prihvatila kao
eksperimentalni obrazac. Kako bi se uklonio nedostatak što smo ga ranije spomenuli, vezan uz
nemogućnost nalaženja uvjeta koji su posve izjednačeni u svemu osim po jednoj pojedinosti,
služimo se različitim postupcima eksperimentalne kontrole koji će biti opisani kasnije,
raspoređivanjem u grupe po slučaju, standardizacijom uvjeta, uklanjanjem nebitnih ili ometajućih
situacijskih čimbenika i sl. Usto se u eksperimentu nikad ne testira razlika u ponašanju dviju jedinki
stavljenih u različite uvjete. Statističko zaključivanje utemeljeno na induktivnom pristupu zahtijeva
testiranje većeg broja ispitanika, a razlika među grupama proglašava se značajnom samo ako su
izgledi da je do nje moglo doći slučajno iznimno maleni.
Zajednička metoda slaganja i razlike kombinira prethodno iznesene metode pružajući zaključcima
veću težinu. Podsjetimo se, metoda slaganja uključuje dvije ili veći broj situacija koje sadrže samo
jedan zajednički element, dok metoda razlike pretpostavlja situacije u kojima je tek jedan element
različit. Zajednička metode slaganja i razlike kazuje da ako dvije ili više situacija u kojima se javlja
neka pojava imaju tek jedan zajednički element, dok se istodobno situacije pojavljivanja i
nepojavljivanja pojave razlikuju samo po njegovoj prisutnosti odnosno odsutnosti, ta je pojedinost
uzrok ili neophodni dio uzroka pojave. Premda, gledano strogo logički, metoda sadrži određene
slabosti, pogotovo ako se shvati doslovce (Cohen i Nagel, 1934), ona ipak ide korak dalje od
metode razlike, usmjerujući je još više u pravcu znanstveno prihvaćenog načina testiranja uz
ročnosti. U ranijem primjeru naš je zaključak o utjecaju sunca na napredovanje biljke još uvijek
prilično krhak. Mogli smo se sjetiti još mnoštva razloga zašto je biljka uvenula, nevezanih za
izloženost suncu. Ako smo, međutim, svjesni da je za slabije ili bolje napredovanje biljke zaslužna
neka vanjska okolnost, možemo postupiti na sljedeći način, dio biljaka izložiti različitim
čimbenicima i pratiti koje od njih pogoduju rastu. Uočimo li da je ono što odlikuje biljke koje dobro
napreduju sjenovito okružje, možemo pristupiti drugom dijelu pokusa. Biljke ćemo podijeliti u dvije
grupe koje ćemo tretirati na posve jednak način, osim što ćemo jednu izložiti suncu, a drugu držati u
hladu. Ako se i tu pokaže da druga grupa bolje napreduje, naše će indicije biti osnažene, a uzročni
će zaključci dobiti na težini. Cijela je procedura, nažalost teško ostvariva u formaliziranim uvjetima.
iako se, kao svojevrsni obrazac mišljenja, često susreće u znanosti. U početnoj fazi, naime,
istraživač, induktivnom metodom prati pojave (ishode) i pripisuje im moguće uzroke na temelju
međusobnog podudaranja (korelacije). što je vrlo blisko metodi slaganja. Potom moguće uzroke, za
koje se pokazalo da su posebno često103 prisutni kod određenih ishoda, testira eksperimentalnom
metodom kako bi egzaktno provjerio vlastite pretpostavke.
Četvrto Millovo načelo nazvano metodom zajedničke varijacije, kazuje da je neka pojava koja se
mijenja usporedo s nekom drugom, njen uzrok, posljedica ili s njome povezana preko nekog
uzročnog čimbenika. Načelo je podložno različitim tumačenjima, od kojih neka idu za tim da ga
povežu s tipom eksperimenata u kojima se nezavisna varijabla stupnjevito mijenja kako bi se
provjerio njezin utjecaj na zavisnu.
Druga pak tumačenja drže da načelo opisuje korelacijska istraživanja, koja, sama po sebi jesu tek
nužan preduvjet a nipošto dokaz uzročno-posljedične veze.
Mill je uz navedena četiri načela dokazivanja uzročne povezanosti uveo i peto, nazvano metodom
ostatka, koje, međutim, istraživaču može biti od koristi tek u rijetkim situacijama. Suština je metode
da se, na temelju ranijih indukcija, isključe one pojave iz situacije čiji su uzroci poznati. Preostale
pojave rezultat su preostalih uzroka. Za razliku od metoda što smo ih ranije upoznali, čiji način
rezoniranja je bio induktivan, metoda ostatka u cijelosti počiva na dedukciji. Cohen i Nagel (1934)
nude kao ilustraciju metode izvrstan primjer otkrića planeta Neptuna. Astronomi su, nastojeći
103
104
70
Ivo V.
izračunati putanju Urana sukladno Newtonovoj teoriji i poznavanju dotad poznatih nebeskih tijela u
Sunčevu sustavu uočili stanovite nepravilnosti, koje nisu mogle biti objašnjene. Pretpostavili su da
do poremećaja dolazi zbog gravitacijske sile dotad nepoznatog planeta i bili su u pravu. Tako je
otkriven Neptun. Metoda ostatka zahtijeva nešto što je tek rijetko ostvarivo izvan prirodnih
znanosti, poznavanje zakona prema kojem se odvijaju pojave. Takvo što u psihologiji jedva da se
može i zamisliti.
6.3 VARIJABLE U EKSPERIMENTU

U nastavku ćemo često spominjati pojam "varijabla". Radi se o svojstvu ispitanika, podražaja ili
situacije koje može poprimati različite vrijednosti. Tjelesna visina je varijabla jer se radi o obilježju
koje poprima različite vrijednosti od osobe do osobe. Na jednak način varijable su i inteligencija,
depresivnost, intenzitet svijetla ili jačina buke. Varijabli suprotan pojam je ''konstanta", obilježje
koje poprima samo jednu vrijednost. Broj glava u čovjeka je konstanta, kao i broj bioloških roditelja
(izuzmemo li klonirane osobe) ili duljina maratonske staze. Varijable možemo podijeliti na
kvalitativne i kvantitativne. Prvima pripadaju one koje variraju u kvaliteti (svojstvu koje se ne da
brojčano izraziti), dok se druge razlikuju prema nekom količinskom (brojčanom, kvantitativnom)
svojstvu. Kvalitativne ili kategorijalne varijable su, primjerice, boja očiju, psihijatrijska dijagnoza
ili mjesto rođenja, dok su kvantitativne, tjelesna težina, brzina reakcije ili kvocijent inteligencije.
Potonje se nadalje dijele na diskretne (isprekidane) i kontinuirane varijable. Prve mogu poprimiti 104
samo cjelobrojne vrijednosti, dok druge zauzimaju cjelokupnu ljestvicu, pa tako i vrijednosti
između cjelobrojnih. Broj članova obitelji, broj novina koje netko redovito kupuje ili broj kućnih
ljubimaca odreda su diskretne, dok su visina, težina i brzina trčanja redom kontinuirane varijable.
Svaki se psihologijski eksperiment može opisati kao pokušaj utvrđivanja učinka varijable X na
ponašanje Y. Prva varijabla, nazvana nezavisnom, jest ona kojom eksperimentator upravlja,
mijenjajući joj vrijednosti, a druga, koju nazivamo zavisnom, je ona čije promjene opaža, bilježi i
mjeri. Izbor zavisne i nezavisne varijable od goleme je važnosti i izravno utječe na ishod i kvalitetu
podataka dobivenih nekim eksperimentom. U nastavku ćemo stoga ukratko iznijeti preduvjete koje
svaka od njih mora zadovoljavati kako bismo iz eksperimenta bili kadri izvući odgovarajuće
spoznaje.
Eksperimentalna metoda nalaže da se nezavisna i zavisna varijabla unaprijed precizno odrede i
operacionalno definiraju kako bi se izbjegli svi mogući nesporazumi i omogućilo ponavljanje
istraživanja. Dodatni problem koji zahtijeva takvu vrstu određenja jest izučavanje pojava koje nisu
izravno dostupne opažanju i mjerenju. Prilikom proučavanja učenja, pamćenja, rješavanja problema
ili inteligencije o njima zaključujemo posredno, na temelju različitih neizravnih mjera. Potreba
operacionalne definicije varijabli stoga ne može biti prenaglašena, iako, kako smo ranije rekli,
problemi operacionalizma donekle stoje u opreci s drugim važnim aspektom varijabli u
eksperimentu - njihovom konstruktnom valjanošću.
6.3.1 NEZAVISNA VARIJABLA
Nezavisna ili eksperimentalna varijabla je svojstvo kojim eksperimentator upravlja sustavno ga
mijenjajući kako bi provjerio njegov utjecaj na proučavano ponašanje. Pritom se pretpostavlja da će
nezavisna varijabla utjecati na neko ponašanje koje se opaža i mjeri (zavisnu varijablu). Naziv
nezavisna znači samo da ni jedna druga varijabla u eksperimentu ne utječe na nju, odnosno da je
eksperimentator mijenja nezavisno od ostalih varijabli. Nezavisne varijable mogu, primjerice, biti:
intenzitet rasvjete pri psihomotoričkoj aktivnosti, smislenost riječi u zadatku pamćenja, fizička
aktivnost u tretmanu mršavljenja, čitanje, slušanje ili gledanje poruke pri ispitivanju mogućnosti
utjecanja na stavove, uzimanje određenog lijeka u liječenju glavobolje ili slično. Da bismo ne u
vanjablu mogli nazvati nezavisnom, on mora ispunjavati najmanje dva uvjeta:
a) imati odlike varijable, odnosno mogućnost poprimanja različitih vrijednosti
(varijacije)
104
105
71
Ivo V.
b) njene promjene moraju biti pod kontrolom eksperimentatora.105
6.3.1.1 RASPON VRIJEDNOSTI NEZAVISNE VARIJABLE
Ako nas zanima problem "Utječe li gledanje televizijskog programa koji sadrži agresivnost, na
agresivno ponašanje?", naša je nezavisna varijabla gledanje agresivnog televizijskog programa. Na
koji je način moguće varirati i manipulirati takvom varijablom? Najčešći način je da se jednoj
skupini ljudi prikaže agresivni TV program, a drugoj neagresivni te da se prati njihovo ponašanje u
situaciji koja dopušta agresivnost. U našem slučaju, nezavisna varijabla ima samo dva stupnja:
agresivni i neagresivni TV program, ili ako ih svedemo na istu dimenziju - prisutnost prema
odsustvu agresivnosti. U takvim slučajevima govorimo o dihotomnim nezavisnim varijablama
odnosno onima koje poprimaju samo dvije različite vrijednosti, postojanja ili nepostojanja određene
kvalitete. One dopuštaju samo zaključak utječe li ili ne nezavisna varijabla na zavisnu.
Ponekad nam je, međutim, važno utvrditi u kojoj mjeri nezavisna varijabla utječe na zavisnu, U tom
slučaju, nezavisna varijabla mora biti kvantitativna, odnosno količinska. Ako bismo, primjerice
htjeli provjeriti kako intenzitet buke utječe na koncentraciju, ne bi bilo dovoljno ispitati samo
koncentraciju li prisutnosti i odsutnosti neugodnih zvučnih podražaje. U takvom eksperimentu
nezavisna bi varijabla morala pokriti širok raspon vrijednosti, od buke niskog, srednjeg, visokog i
izrazito visokog intenziteta
Ponekad nezavisna varijabla može poprimiti vrijednosti koje nisu količinske prirode niti se mogu
svesti na dihotomnu kategoriju prisutno-odsutno. U tom slučaju radi se o kvalitativnim ili
kategorijalnim varijablama. U kliničkoj psihologiji česta je praksa ispitivanja učinkovitosti
različitih terapijskih pristupa. U tom slučaju jedna se terapija ispituje li odnosu na druge. Primjerice,
ispitivanje učinkovitosti bihevioralne, kognitivno-bihevioralne i geštalt terapije moglo bi se obaviti
na trima nezavisnim grupama od kojih bi svaka primala samo po jednu od njih.
6.3.1.2 UPRAVLJANJE NEZAVISNOM VARIJABLOM
Kao što je rečeno, eksperimentalna metoda počiva na mogućnosti upravljanja nezavisnom
varijablom. To se ne postiže uvijek na isti način. Dva su osnovna načina upravljanja (Christensen,
1997):
1. eksperimentalna manipulacija,
2. upravljanje individualnim razlikama.
Eksperimentalna manipulacija podrazumijeva situaciju u kojoj eksperimentator odmjerava veličinu
nezavisne varijable izlažući pojedinim njezinim razinama različite grupe ispitanika ili iste ispitanike
u različitim vremenskim intervalima Primjeri eksperimentalne manipulacije mogu biti mijenjanje
intenziteta svjetla, zvučnih podražaja, broja sati bez jela ili sna itd.106
Eksperimentalna manipulacija
Manipuliranje uputom jedna je vrsta eksperimentalne manipulacije, a sastoji se u davanju različitih
uputa kontrolnoj u odnosu na eksperimentalnu skupinu. U istraživanjima koja provjeravaju utjecaj
društvene poželjnost i na ponašanje, često se koriste upute kako bi se varirao intenzitet poželjnosti.
Jednoj grupi se, primjerice, kaže da će njihov rezultat u upitniku samoprocjene biti odlučujući pri
upisu na fakultet ili dobivanju radnog mjesta, dok se drugoj zajamči anonimnost i povjerljivost
dobivenih rezultata. Pretpostavka je da će se prva grupa pružati odgovore znatno više u skladu s
društvenom poželjnošću negoli druga. U određenim situacijama, manipulacija uputom može se
pokazati manjkavom metodom, ponajprije ako je uputa dvosmislena i izaziva oprečne reakcije u
ispitanika. Zbog toga je potrebno u najvećoj mjeri pojednostaviti poruku kako bi bila jednoznačna i
pristupačna svima. Usto valja osigurati pozornost sviju prilikom njena iznošenja, jer u protivnom
osnovni zahtjev potreban za manipulaciju neće biti ostvaren.
Manipuliranje događajima drugi je oblik uspostavljanja kontrole nad nezavisnom varijablom. U
njemu se vrijednosti eksperimentalne varijable mijenjaju na mnogo prirodniji i realističniji način
105
106
106
107
72
Ivo V.
negoli je slučaj s uputama. Na primjer, pri proučavanju razlike li učenju smislenog u odnosu na
besmisleni materijal grupama se zadaju sadržaji različitog stupnja smislenosti. Želi li se provjeriti
djelovanje nekog lijeka, manipulacija se sastoji u davanju lijeka jednoj grupi i uskraćivanju drugoj.
Upravljanje osobnim razlikama
Upravljanje osobnim razlikama odlikuje eksperimente u kojima nezavisnu varijablu čine neka
obilježja ispitanika, primjerice spol, dob, inteligencija, stupanj ekstravertiranosti i tome slično. U
njima se "manipulacija postiže izborom ispitanika u grupe prema stupnju izraženosti unaprijed
utvrđenih osobina. Zanima li nas, primjerice, kako će smisleni i besmisleni materijal učiti
ekstraverti, a kako introverti, podijelit ćemo ispitanike prema izraženosti ekstraverzije u dvije
skupine i potom ih usporediti prema količini naučenih sadržaja. Problem takve vrste manipulacije
leži u nemogućnosti slučajne raspodjele ispitanika u skupine, što, kako ćemo ubrzo vidjeti ugrožava
unutarnju valjanost eksperimenta i otežava pripisivanje promjena u ponašanju nezavisnoj varijabli.
U takvoj je situaciji, naime, moguće da neka druga osobina, korelirana s ekstraverzijom, proizvede
razlike u učenju i dovede do pogrešnih zaključaka. Pri korištenju manipulacije što se temelji na
izboru ispitanika, ne govorimo o istinskim već o kvazi-eksperimentima (Cook i Campbell, 1979).
Iznimno je važno da nezavisnom varijablom bude moguće neovisno manipulirati, odnosno da
promjene u nezavisnoj varijabli ne uključuju i promjene neke druge varijable osim zavisne. Kod
upravljanja osobnim razlikama, to je katkad iznimno 107 teško ostvariti. Želimo li utvrditi kako
obrazovanje utječe na rješavanje problemskih zadataka, bit će nam posebno teško razdvojiti učinke
obrazovanja od inteligencije. U prosjeku su, naime, obrazovaniji ljudi ujedno i inteligentniji. U
takvom bi eksperimentu bilo potrebno naći skupine ljudi različitog obrazovanja i podjednako
inteligencije, što je gotovo neizvedivo.
6.3.1.3 PRIKLADNOST NEZAVISNE VARIJABLE
Konstruktna valjanost
Izbor nezavisne varijable mnogo je složeniji nego se naizgled čini. Neprimjerenim odabirom,
istraživač može ugroziti cijelo istraživanje izlažući se riziku da pribavi podatke koji su nevaljani ili
bezvrijedni. Osnovno je pritom voditi računa o konstruktnoj valjanosti nezavisne varijable
odnosno njenoj operacionalnoj primjerenosti u odnosu na konstrukt koji bi intencijski trebala
predstavljati. O pojmu konstrukta govorili smo ranije, opisujući sastavne elemente od kojih se
sastoji teorija. Nezavisna varijabla redovito je operacionalizacija nekog konstrukta čiji nas utjecaj
na ponašanje zanima. Ako nas zanima kako glad u štakora utječe na brzinu rješavanja labirinta, tada
konstrukt gladi predstavlja nezavisnu varijablu. Uzmimo da smo se odlučili za operacionalizaciju
gladi kao vremena proteklog od prethodnog uzimanja određene količine hrane. Čini se da pritom ne
griješimo mnogo. Štakor koji nije nahranjen 12 sati vjerojatno je gladniji od onog koji je uzimao
hranu prije 6 ili 3 sata, unatoč nekim mogućim odstupanjima vezanima za međusobne razlike u
podnošenju gladi ili količini pojedene hrani pri zadnjem obroku. No rijetko kad smo u mogućnosti
baviti se tako jednoznačno odredivim konstruktima. Složenije pojave opiru se operacionalizaciji.
Želimo li utvrditi kako razina pobuđenosti utječe na točnost rješavanja zadatka, nastojeći provjeriti
navode Yerkes-Dodsonova zakona, naći ćemo se u teškoćama nastojeći operacionalno odrediti
konstrukt pobuđenosti. Hoćemo li ispitanicima puštati glasnu glazbu kako bismo ih doveli u stanje
pobuđenosti, odvesti ih u zubarsku čekaonicu ili ih jednostavno pustiti da rješavaju zadatke uz
nazočnost publike? Za svaku od tri situacije može se reći da povećava pobuđenost, ali isto tako da
tek nesavršeno operacionalizira taj pojam. Povećava li glazba uistinu pobuđenost? Za osobe navikle
da rade uz glazbu, ona će možda biti sredstvo smirivanja. Zubarska čekaonica izaziva strah i
tjeskobu. Jesu li one istovjetne ili barem čvršće povezane s pobuđenošću? Kakva publika izaziva
pobuđenost? Bilo kakva, poznate ili nepoznate osobe, nadređeni ili pak privlačne osobe suprotnog
spola? Postavljena pitanja ostaju bez odgovora, ali bi trebala naznačiti da jednoznačna i savršena
operacionalizacija najčešće ne postoji. Ona je samo više ili manje vjeran odraz izučavanog
konstrukta. Nažalost, dok jednim dijelom opisuje konstrukt kojim se bavimo, drugim dijelom
zahvaća neke druge konstrukte. Pri analiziranju konačno dobivenih rezultata nekog eksperiment»
107
108
73
Ivo V.
moramo biti svjesni mogućnosti da je na zavisnu 108 varijablu djelovao ne samo konstrukt koji smo
željeli istražiti nego i neki za nas nevažni konstrukti koje smo, silom prilika, zbog problema
operacionalizacije, uglavnom nehotično uvrstili u istraživanje.
Vratimo se na primjer operacionalizacije konstrukta pobuđenosti. Recimo da smo se odlučili za
glasnu techno glazbu kao nezavisnu varijablu i došli do rezultata kako mlađe osobe rješavaju
zadatke bolje od starijih u situaciji velike pobuđenosti. Naš zaključak mogao bi biti posve pogrešan.
Drugo moguće tumačenje jest da mlađi ispitanici jednostavno bolje rade uz dobro poznate zvuke
techno glazbe koja je starijima bilo nepoznata bilo odbojna. Primjena druge operacionalizacije istog
konstrukta proizvela bi možda posve različite rezultate. Vidimo do kakvih problema može doći ako
nezavisna varijabla sadrži, osim operacionalizacije željenog konstrukta i teorijski nevažan dodatak,
koji, međutim, može itekako utjecati na zavisnu varijablu.
Uzmimo drugi primjer. Recimo da smo zainteresirani za to hoće li svakodnevna fizička aktivnost
popraviti raspoloženje depresivnih osoba. Da bismo mogli kontrolirati jesu li ispitanici
eksperimentalne grupe uistinu fizički aktivni, vježbanje ćemo provoditi pod nadzorom u dvorani,
teretani ili na otvorenom. Ako se konačno pokaže da su osobe obuhvaćene programom vježbanja
doista manje depresivne od kontrolne skupine, mi još uvijek moramo zadržati rezervu. Umjesto da
brzopleto zaključujemo o onome što smo sami zamislili da bi trebala biti nezavisna varijabla
(fizičku aktivnost), moramo biti svjesni i onoga što ta varijabla predstavlja neovisno o našim
početnim hipotezama. Možda je tako fizička aktivnost posve nevažna u smanjenju depresivnosti, a
sve zasluge za poboljšanje psihičkog stanja pripadaju redovitom ljudskom kontaktu, druženju i
ispunjenosti vremena.
Dosad smo se mogli uvjeriti da problemi s konstruktnom valjanošću nezavisne varijable nastaju
onda kad ona sadrži određeni "suvišak" u odnosu na izučavani teorijski konstrukt. No jednako su
opsežni problemi i zbog njezine "manjkavosti". Ako iz toga što depresivne osobe ostaju podjednako
dosljedne svojim tmurnim raspoloženjima nakon višemjesečnog znojenja u teretani zaključimo da
fizička aktivnost ne utječe na smanjenje depresivnosti, možemo ozbiljno pogriješiti. Jednostruka
operacionalizacija konstrukta "fizička aktivnost" samo na temelju rada u tereta ni svakako je
manjkava. Možda bi terapijski uspjeh donio neki drugi oblik aktivnosti poput, šetnje, trčanja,
plivanja, rimskih sportova ili nekog od brojnih oblika rekreacije koji nam stoje na raspolaganju.
Razlika među razinama
I drugi problemi vezani uz nezavisnu varijablu mogu imati ozbiljnih posljedica, no ni približno
koliko neprikladna operacionalizacija teorijskog konstrukta. Sa stajališta eksperimentalne snage od
velike je važnosti da utjecaj nezavisne varijable na109 zavisnu bude znatan, kako bismo ga bili kadri
registrirati. Na prvi se pogled čini kako je takva vrsta utjecaja izvan naše moći, naime nezavisna
varijabla ili utječe ili ne utječe na zavisnu, a taj je utjecaj snažan ili slab, kako je to već priroda
odredila. Zapravo ništa ne može biti u većoj mjeri pogrešno od gornje tvrdnje. Ne zaboravimo da je
eksperiment umjetna situacija koju stvaramo kako bismo provjerili određene hipoteze. Zbog toga
što smo u mogućnosti upravljati nezavisnom varijablom, u velikoj smo prednosti nad prirodom.
Vratimo se načas eksperimentu u kojem je nezavisna varijabla bila glad operacionalizirana kao
vrijeme proteklo od zadnjeg hranjenja. Ako usporedimo štakore koji su netom jeli s onima koji nisu
jeli dva sata, možda nećemo dobiti nikakvu razliku u brzini ovladavanja labirintom. Iz toga bi,
dakako, bilo pogrešno zaključiti kako glad ne utječe na zavisnu varijablu. Razlika između
eksperimentalnih i kontrolnih uvjeta mora biti naglašena jer ćemo u protivnom potvrđivati nul-
hipotezu čak i kad ona u zbilji nije točna. Kada bismo doista bili u situaciji da utjecaj gladi
provjeravamo samo na temelju dviju ekstremnih situacija (pretpostavimo načas poučnost
realističnosti primjera), onda bismo svakako situaciju gladi definirali s 12 ili više sati nehranjenja.
O pitanju razlika među razinama nezavisne varijable postoje i drukčija mišljenja kojima se zagovara
korištenje situacija što se susreću u stvarnost (Brunswik, 1955). Takav "ekološki" nacrt pruža
korisne spoznaje o veličini učinka u zbilji i njegovoj praktičnoj važnosti. Ako su situacije u
108
109
109
110
74
Ivo V.
eksperimentu toliko ekstremno odijeljene da se izrazito rijetko ili nikada ne susreću u stvarnome
životu, od kakve su nam vrijednosti lako dobiveni rezultati? Uzmimo da želimo ispitati kakvog
utjecaja ima nespavanje na rješavanje testova inteligencije. Želeći utvrditi kako se uspješnost i način
rješavanja mijenja u funkciji vremena nespavanja, istraživač bi mogao ispitati skupinu osoba nakon
jednog, dva, tri ili više dana nespavanja. Zanemarimo načas etičku stranu takvog istraživanja i
moguću štetu koju bi od toga mogli imati ispitanici, ali netko bi mogao primijetiti da se višednevno
nespavanje vrlo rijetko susreće u realnim okolnostima, možda samo u kliničkim slučajevima
nesanice. Ne ulazeći u moguće praktične koristi koje bi od takvog istraživanja mogle imati tvornice
sa smjenskim radom ili specijalne vojne postrojbe, valja ipak reći da je takav nacrt ne samo
statistički snažniji (zbog usporedbe ekstremnijih razina) nego i teorijski vredniji jer nas vodi do
same srži problema. Mišljenja smo stoga, da se u određivanju razine ekstremnosti ne bi trebalo
slijepo rukovoditi realističnošću uvjeta, što uglavnom zagovaraju i drugi autori (Mook, 1983;
Smith, 2000).
Broj razina
Nipošto nevažno nije pitanje koliko ćemo razina nezavisne varijable koristiti u eksperimentu,
Hoćemo li uspoređivati samo ekstremne vrijednosti ili čitav mogući raspon (ako se radi o
kontinuiranoj varijabli)? Nije jednostavno odgovoriti na pitanje 110 tim prije što se odgovori razlikuju
ovisno o vrsti eksperimentalnog nacrta. Koristeći se samo dvjema razinama nezavisne varijable,
izlažemo se riziku da zanemarimo stvarnu kvalitetu povezanosti nezavisne i zavisne varijable,
primjerice u slučaju njihova zakrivljenog odnosa. Međutim, korištenjem nacrta na nezavisnim
grupama, veći broj razina nezavisne varijable uz isti broj ispitanika bitno smanjuje statističku snagu
nacrta (McClelland, 1997). O pitanjima različitih nacrta i statističke snage govorit ćemo kasnije,
stoga ostavimo zasad otvorenim pitanje broja razina.
Uspješnost manipulacije
Razlika među uvjetima ni·e jedino o čemu treba voditi računa kako bismo dobili vjerodostojne
rezultate. Ako se radi o nezavisnim varijablama koje se uvode u prikrivenom obliku, kao dio
svojevrsne istraživačke obmane, cjelokupna situacija mora posjedovati ono što su Aronson i
Carlsmith (1968) nazvali eksperimentalnim realizmo ili, jednostavnije, psihološku uvjerljivost.za
ispitanike.
U eksperimentu što gaje proveo Stanley Schachter (1959) nastojeći provjeriti utjecaj anksioznosti
na sklonost druženju (afilijativnost), valjalo je proizvesti situaciju u kojoj će biti moguće
manipulirati anksioznošću. Da bi to postigao, autor je podijelio ispitanike u dvije skupine,
stavljajući jedne u situaciju visoke, a druge u situaciju niske anksioznosti. Prvima je rečeno
otprilike to da će sudjelovati u eksperimentu vezanom uz učinke električnih šokova. Najavljeno je
također da će šokovi biti izrazito jaki kako bi mogli pružiti vrijedne spoznaje i pomoći humanosti.
Potom je eksperimentator pokazao na koji će način šokovi biti zadavani. U situaciji niske
anksioznosti najavljeni su blagi elektrošokovi, a eksperimentator je izrazio uvjerenje kako će
ispitanici uživati u eksperimentu. Pokazalo se da su ispitanici u situaciji visoke anksioznosti bili
skloniji čekati eksperiment u društvu, pokazujući na taj način veću afilijativnost, dok oni iz situacije
niske anksioznosti uglavnom nisu marili za društvo. Važno je uočiti pristup kojim je Schachter
osigurao eksperimentalni realizam situaciji. Da bi dodatno provjerio je li u tome uspio, zapitao je
ispitanike kako se osjećaju s obzirom na predstojeće šokove. U skladu s eksperimentalnom
nakanom, prosječna procjena anksioznosti bila je statistički značajno veća u uvjetima "visoke
anksioznosti".
6.3.2 ZAVISNA VARIJABLA
Zavisna varijabla je pojava koja se u eksperimentu opaža i mjeri. Njene vrijednosti, sukladno
očekivanju, ovise o manipulacijama eksperimentalnom varijablom i otuda naziv "zavisna" varijabla.
Ona je kriterij ili standard prema kojem se procjenjuju rezultati eksperimenta, pa se još naziva i
"kriterijskom" varijablom. Za promjene u zavisnoj varijabli pretpostavlja se da jesu ili bi barem
110
111
75
Ivo V.
dijelom mogle biti posljedica111 promjena nezavisne varijable. Zavisna varijabla mora zadovoljavati
dva temeljna uvjeta, da, poput nezavisne varijable, bude valjana reprezentacija izučavanog
konstrukta i da može pouzdano mjeriti i opažati.
6.3.2.1 PRIKLADNOST ZAVISNE VARIJABLE
Konstruktna valjanost
Za zavisnu je varijablu, jednako kao i za nezavisnu, ključno pitanje njezine konstruktne valjanosti.
Tek rijetko ćemo se u istraživanju odlučiti ispitivati zavisnu varijablu koja se može neposredno
promatrati. U velikoj većini slučajeva naša je zavisna varijabla (ili više nj ih istodobno) tek
nesavršen pokazatelj nekog šireg konstrukta. Ako, primjerice, proučavamo učinkovitost nekog
farmakološkog sredstva na smanjenje depresivnosti, morat ćemo pomno odabrati pokazatelje na
temelju kojih ćemo suditi o depresivnosti. Nije svejedno hoćemo li pritom upotrijebiti mjere
samoprocjene, procjenu ponašanja temeljenu na opažanju ili neke druge pokazatelje. Pri korištenju
manjeg broja mjera moglo bi nam se dogoditi da zbog slabe konstruktne valjanosti pogrešno
protumačimo rezultate. Ako kao mjere depresivnosti uzmemo samo gubitak apetita i nesanicu,
morat ćemo suziti izučava ni problem (samo na pojedine simptome), ili će u protivnome, naši
zaključci biti pogrešni. U najširem smislu, valjanost se odnosi na problem jesmo li doista mjerili
ono što smo namjeravali mjeriti. Pitanju valjanosti zavisne varijable često se puta uopće ne poklanja
pažnja, držeći da je ono riješeno usvajanjem operacionalnih definicija. Definiramo li, primjerice,
depresivnost kao rezultat na Beckovoj skali, primijenili smo operacionalnu definiciju. No takva
mjera nipošto, ni u najboljem slučaju, nije idealan ni potpuni odraz izučavanog konstrukta.
Ustanovljavanje i unapređivanje konstruktne valjanosti obrađeno je nešto potpunije na drugome
mjestu, ali za širi uvid valja se upoznati s nekim temeljnim radovima iz toga područja (Cronbach i
Meehi, 1955; Campbell i Fiske, 1959).
Pouzdanosti
Više je načina definiranja pojma pouzdanosti u psihometriji, no mi ćemo potpuniju raspravu ostaviti
za kasnije kako ne bismo nepotrebno opterećivali odjeljak posvećen zavisnoj varijabli. Pouzdanost
se uglavnom može poistovjetiti s preciznošću mjerenja Svaka mjera, naime, opterećena je
određenom greškom. Čak i antropometrijske mjere za koje očekujemo da u odrasloj dobi ne
variraju, primjerice visina, nesustavno se kolebaju ako uspoređujemo veći broj mjerenja u nekom
kraćem vremenskom razmaku. Greškom mjerenja su li još većoj mjeri opterećene psihološke
osobine, mjerene ne toliko preciznim instrumentima poput metra ili vage. Preciznost shvaćena kao
odsutnost greške mjerenja pridonosi konstantnosti, stabilnosti ili dosljednosti 112 mjerene osobine.
Sve su to različiti oblici iste mjerne osobine - pouzdanosti. Već i zdrav razum bez pomoći stručnog
znanja upućuje na potrebu veće pouzdanosti mjera zavisne varijable. Poslije ćemo vidjeti da o
pouzdanosti uvelike ovisi statistička snaga nekog nacrta. Što je pouzdanost manja, to je, zbog velike
greške aritmetičke sredine, teže odbaciti nul-hipotezu kad je ona netočna. U tom slučaju nužno je da
razlika između eksperimentalnih i kontrolnih uvjeta nadmaši vlastitu grešku, često
predimenzioniranu zbog visoke ne pouzdanosti.
Osjetljivost
Ključno obilježje eksperimenta jest mogućnost da njime testiramo određene pretpostavke iskazane,
u pravilu, nul-hipotezom. Nažalost, ako razlike između eksperimentalnih i kontrolnih uvjeta
pokušamo mjeriti na nekoj pretjerano gruboj ljestvici, sva je prilika da nećemo uočiti razliku ni
onda kad je ona uistinu prisutna. U tom slučaju, naime, niti naglašena manipulacija nezavisnom
varijablom neće dovesti do razlike koju je naša, neosjetljiva ljestvica kadra registrirati. Druga strana
istog problema odražava neprimjerenost zavisne varijable za određenu skupinu ispitanika. U tom
slučaju govorimo o djelovanju učinaka stropa i poda. Zavisna varijabla ponekad ograničava
količinu moguće promjene, što je problem podjednako kod grupnih nacrta i nacrta ponovljenih
mjerenja. Ako pokušamo provjeriti učinkovitost različitih metoda učenja u ovladavanju vještinom
111
112
112
113
76
Ivo V.
rješavanja matematičkih problema u djece, zadatke moramo prilagoditi dobi. Ako su zadaci
preteški, djeca ih većinom neće moći riješiti bez obzira na metodu kojom su učila. Razlike između
skupina koje su učile jednom, u odnosu na one podučavane drugom metodom, bit će male ili
neznačajne. U tom slučaju govorimo o učinku poda. Ako su zadaci kojima ispitujemo isti problem
prelagani, govorimo o učinku stropa. U tom će slučaju, naime, djeca većinom riješiti zadatke,
također bez obzira na kvalitetu i prednosti metode.
6.4 KONTROLA U EKSPERIMENTU

U eksperimentu se nastoje postići uvjeti koji dopuštaju jasno razabiranje učinaka nezavisne
varijable na zavisnu. Najvažnije je pritom osigurati unutarnju valjanost, odnosno sigurnost u
zaključku da je upravo nezavisna varijabla, a ne nešto drugo, dovelo do promjena što smo ih
registrirali u eksperimentu. Tome služi kontrola, vjerojatno najvažnija sastavnica eksperimenta. Ona
obuhvaća niz postupaka koji u razumnim granicama omogućavaju izvođenje uzročno-posljedičnih
zaključaka. Za utvrđivanje učinka što ga ima nezavisna varijabla na zavisnu, potrebno je na neki
način izolirati taj utjecaj, odnosno odstraniti sve druge činitelje koji bi također mogli utjecati na
promatrano ponašanje. Takva se zadaća rijetko može obaviti u 113 cijelosti. Neke vanjske faktore 114
nije moguće odstraniti te oni i nadalje djeluju na ponašanje. U takvim situacijama, kontrola se
sastoji u njihovu pravilnom raspoređivanju na sve uvjete u eksperimentu ili, u slučaju grupnog
nacrta, podjednako na eksperimentalnu i kontrolnu skupinu. Na taj se način, doduše, takvi vanjski
faktori ne uklanjaju iz eksperimenta, ali se osigurava njihova podjednaka prisutnost u različitim
uvjetima (kontrolnim i eksperimentalnim), što omogućuje pripisivanje kasnijih razlika u zavisnoj
varijabli upravo djelovanju nezavisne varijable. Kontrolom je dakle, prije svega potrebno izbjeći
sustavno podudaranje varijacije nezavisne varijable s promjenama neke vanjske varijable. Ne
učinimo li to, dolazi do isprepletenosti njihovih učinaka, što otklanja mogućnost izvođenja
jednoznačnih zaključaka o samostalnom djelovanju nezavisne varijable.
Uzmimo za primjer situaciju ispitivanja učinka posebne upute (nezavisna varijabla) na uspješnost
rješavanja testa inteligencije. Kontrolna grupa dobiva standardnu uputu, a eksperimentalna uputu od
koje se očekuje da ispitanike bolje navede na pravilno ispunjavanje. No, recimo da ispitivanje
provodimo tako da kontrolnu grupu uvijek ispitujemo prije podne, a eksperimentalnu redovito u
poslijepodnevnim satima. Kontrola u takvom slučaju nije dobro provedena, čime naši kasniji
zaključci bivaju dovedeni u pitanje. Naime, očito je da se nezavisna varijabla pojavljuje uvijek
poslije podne. Ako su uvjeti testiranja različiti u prijepodnevnim satima, primjerice zbog veće
gužve i buke na ulicama, gušćeg prometa i jačeg svjetla, tada nije jasno čemu pripisati kasnije
razlike među skupinama. Bolji rezultat eksperimentalne grupe može odražavati kvalitetniju uputu,
ali i bolje fizičke uvjete ispunjavanja (manja buka).
Možemo razlikovati tri osnovne skupine vanjskih činitelja koji su prijetnja valjanosti našeg nacrta
(Myers i Hanson, 1997):
 fizičke
 društvene
 osobne
Kako bismo kontrolirali različite tipove vanjskih činitelja, koristimo se različitim postupcima:
Kontrola fizičkih činitelja
1. uklanjanje vanjskih činitelja
2. stabilizacija uvjeta
3. uravnoteženje uvjeta115
Kontrola pristranosti sudionika u eksperimentu
1. slijepi eksperiment
113
114
114
Opći naziv za čimbenike koji pored nezavisne varijable utječu na zavisnu.
115
115
77
Ivo V.
2. dvostruko slijepi eksperiment
Kontrola osobnih činitelja
1. homogeniziranje ispitanika
2. slučajni izbor ili slučajno raspoređivanje u skupine
3. uparivanje
6.4.1 FIZIČKI ČINITELJI
Bit eksperimentalne kontrole, kako smo rekli, sastoji se u nastojanju da se, nacrtom i organizacijom
istraživanja kao i njegovom pomnom provedbom isključe sve druge alternativne pretpostavke o
promjenama zavisne varijable osim kao posljedice manipulacije nezavisnom varijablom. Druga,
gotovo podjednako važna zadaća sastoji se u smanjivanju eksperimentalne greške, odnosno svih
neželjenih izvora varijabiliteta koji zamagljuju učinak nezavisne varijable, Kasnije ćemo, u raspravi
o statističkoj snazi vidjeti da neuspjeh u dokazivanju djelovanja nezavisne varijable može biti
posljedica nedovoljno velikog uzorka ili skromnog učinka nezavisne varijable, ali također i
prevelikog varijabiliteta pojave koju opažamo. Početni korak u postizanju obaju spomenutih ciljeva,
unapređivanju unutarnje valjanosti i statističke snage, jest nalaženje i prepoznavanje onih činitelja
koji bi pored nezavisne varijable mogli utjecati na zavisnu. Pošto se takvi činitelji utvrde, potrebno
ih je ukloniti ili stabilizirati. Eksperimentalni uvjeti često puta traže da se neki fizički činitelji poput
okolinskih podražaja (buka, svjetlo, vibracije) odstrane, a drugi, koje nije moguće odstraniti, drže
postojanima (temperatura, vlaga, doba dana, godišnje doba i dr.) kako ne bi različito djelovali u
različitim eksperimentalnim (kontrolnim) uvjetima.
U klasičnom eksperimentu Muzafer Sherif (1937) je u laboratorijskim uvjetima pokušao utvrditi
način na koji se stvaraju društvene norme. Ispitanike bi posjeo u zamračenu sobu bez ikakvog
izvora svjetla ili drugog orijentira. Podražaj je bila mala točka svjetla. Ispitanicima je rečeno da će
nakon pojave svjetlosne točke ona, nakon nekog vremena, početi kretati. Čim bi spazio njeno
kretanje, ispitanik je trebao stisnuti prekidat nakon hga bi se svjetlo izgubilo. Potom je morao
procijeniti udaljenost koju je svjetlosna točka prešla. U stvarnosti točka se uopće nije kretala.
Radilo se o tzv. autokinetičkom učinku, odnosno prividnom kretanju svjetlosne točke u uvjetima bez
osvjetljenja. Točka se prividno kreće u različitim smjerovima. Ispitanici sami, nakon nekog
vremena, subjektivno uspostavljaju određene standarde kretanja, vrlo raznolike za različite osobe.
U situaciji kad su ispitivani pojedinačno, ispitanici su se među sobom bitno razlikovali u
procjenama.116
Kad bi, međutim, bili ispitivani po dvojica ili trojica istodobno, svoje su početne procjene dane
ranije bitno promijenili, tako da se međusobno više nisu razlikovali. U nestrukturiranoj situaciji
poput ove, zaključuje Sherif, na djelu je uspostavljanje grupnih, normi koje reguliraju standarde
prilagodljivog ponašanja.
Kontrola u eksperimentu obuhvaćala je niz postupaka. Soba u kojoj se eksperiment odvijao morala
je biti potpuno zamračena da omogući pojavljivanje autokinetičkog učinka. Također, svi drugi
izvori podražaja, poput zvukova, morali su biti uklonjeni kako ne bi remetili eksperiment unoseči
nepotrebnu varijancu u rezultate. Autor je nadalje morao paziti da uvjeti u prostoriju budu uvijek
isti (temperatura, vlaga) kako bi smanjio eksperimentalnu grešku i izbjegao opasnost da kontrolna i
eksperimentalna grupa budu izložene ponešto različitim situacijskim okolnostima nevezanima uz
nezavisnu varijablu. U eksperimentu su naglašeno prisutna dva postupka kontrole: uklanjanje
(svjetla i mogućih vizualnih orijentira te drugih podražaja) i stabilizacija (svih drugih faktora poput
doba dana, temperature itd.).
Ponekad je, da bismo bili u mogućnosti promjene u zavisnoj varijabli pripisati promjenama
nezavisne varijable, potrebno uravnotežiti uvjete koji prijete da ugroze naše zaključke. Ako,
primjerice, eksperiment provodimo u dvjema prostorijama, jednoj na sjevernoj, a drugoj na južnoj
strani zgrade, zbog ujednačavanja uvjeta, morat ćemo isti broj ispitanika u svakom od
eksperimentalnih i kontrolnih uvjeta ispitati u svakoj od prostorija. Time se učinci različitih
116
116
78
Ivo V.
prostorija podjednako raspoređuju na svaki uvjet u eksperimentu. Ta vrsta postupka je, kako ćemo
vidjeti, posebno važna prilikom kontrole učinaka vježbe i umora u eksperimentima ponovljenih
mjerenja. Ako pretpostavimo da bi na uradak ispitanika u nekom testu pamćenja koji predstavlja
zavisnu varijablu mogli utjecati vježba ili umor, nećemo uvijek kretati s istim rasporedom
eksperimentalnih uvjeta već ćemo ga mijenjati, o čemu će više riječi biti poslije. No
uravnoteživanje je važno također i za grupne eksperimente. Ako zbog opsežnosti posla eksperiment
provodi dvoje eksperimentatora, bilo bi pogrešno jednog od njih zadužiti za kontrolnu, a drugu za
eksperimentalnu grupu jer će na taj način učinci nezavisne varijable biti pomiješani sa spolom i
osobnošću eksperimentatora. U tom slučaju uravnoteživanje se sastoji u tome da se pojedinci ili
manje skupine iz K i E grupe po slučaju rasporede svakom od eksperimentatora, što će zajamčiti da
osobna jednadžba svakog od njih bude podjednako prisutna u oba uvjeta.
Kontrola fizičkih činitelja u eksperimentu ima, kako vidimo, dvojaku zadaću,
a) osiguravanja jednakih uvjeta za eksperimentalnu i kontrolnu grupu (odnosno više njih) i
b) odstranjivanja svih izvora smetnji ili nestabilnosti koje bi mogle dovesti do povećanog
nesustavnog varijabiliteta u ponašanju unutar eksperimenta.
Prvom se zadaćom nastoji, kako ćemo kasnije vidjeti, osnažiti unutarnja valjanost, a drugom
valjanost statističkog zaključka.117
6.4.2 KONTROLA PRISTRANOSTI SUDIONIKA U EKSPERIMENTU
Zbog posebnosti eksperimentalne situacije, konačni rezultati mogu biti zamagljeni pristranosti ma
vezanim uz ispitanike, eksperimentatora ili njihovu međusobnu interakciju. Na rezultate mogu,
pored nezavisne varijable utjecati i činitelji poput očekivanja ispitanika, nesvjesnog utjecaja
eksperimentatora na ispitanike ili njegova pristranost zbog želje da potvrdi polazne hipoteze. Prirodi
ove pojave i načinima a koje se takve prijetnje eksperimentalnoj valjanosti mogu ukloniti
posvećeno je cijelo poglavlje koje govori o artefaktu u eksperimentu. Reći ćemo samo da ova vrsta
kontrole služi poglavito unapređenju konstruktne valjanosti.
6.4.3 KONTROLA OSOBNIH ČINITELJA
Kako ćemo kasnije vidjeti, za mogućnost izvođenja zaključaka u eksperimentu ključno je postići
usporedivost ispitanika koji su izloženi različitim tretmanima. Izjednačavanje ispitanika stoga je
iznimno važan dio kontrole u eksperimentu. Ako se koriste dvije skupine, od kojih je jedna izložena
djelovanju nezavisne varijable, a druga nije, prije svake njihove usporedbe, moramo imati određena
jamstva ili dovoljno čvrsta uvjerenja da su prethodno izjednačene prema svim relevantnim
obilježjima. U protivnome, ne možemo zaključiti jesu li razlike do kojih je došlo, posljedica
nezavisne varijable ili početne neujednačenosti grupa. O načinima njihova ujednačavanja, kao i
drugim vrstama kontrole osobnih činitelja mnogo će više riječi biti u narednim poglavljima.
Izjednačenost grupa, odnosno njihovo raspodjeljivanje u grupe po slučaju, jedan je od osnovnih
zahtjeva eksperimentalnih nacrta i temelj unutarnje valjanosti. No kontrolu osobnih činitelja
možemo provoditi i s drugom namjerom, primjerice kad uključivanjem u eksperiment sudionika sa
sličnim obilježjima nastojimo smanjiti nesustavni varijabiliret uzrokovan osobnim razlikama, čime
povećavamo statističku snagu popravljajući valjanost statističkog zaključka. I tu ćemo raspravu,
međutim, ostaviti za poslije.
6.5 EKSPERIMENTALNA VALJANOST

Pitanje kontrole o kojoj smo upravo govorili usko je povezano s pojmom valjanosti u eksperimentu,
Eksperimentalni nacrt je svojevrstan logički okvir za izvođenje zaključaka o utjecaju nezavisne
varijable na zavisnu. Nacrtom se njihov odnos izolira, tako da utjecaj nezavisne varijable može biti
praćen neovisno o utjecaju mnoštva čimbenika koji inače djeluju na izabrani predmet opažanja, u
pravilu neki aspekt ponašanja. Kako bi se osigurala jednoznačnost rezultata, eksperimenti se
provode u pomno kontroliranim uvjetima. U slučajevima koji ne dopuštaju potpunu kontrolu nad
uvjetima provođenja eksperimenta, naknadno se provodi tzv. statistička 118 kontrola koja također
117
117
118
118
79
Ivo V.
služi razdvajanju utjecaja činitelja koji su predmet izučavanja od svih preostalih, koji proučavanu
vezu zamagljuju. Bez takvih predostrožnosti, koje služe pojednostavljenju i izolaciji proučava ne
veze nezavisne i zavisne varijable, iz eksperimenta ne bi bilo moguće izvući jednoznačne zaključke.
Iste bi nalaze moglo objasniti čitavo mnoštvo različitih tumačenja.
Eksperimentalnom kontrolom na taj način isključujemo ili činimo manje vjerojatnima sva druga
moguća objašnjenja izučavane pojave nevezana uz utjecaj nezavisne varijable, No eksperimentalni
nacrt gotovo nikad nije tako savršen da isključi sva druga objašnjenja. Radi se više o stupnju u
kojem udovoljava toj zadaći. Sa stajališta metodologije, nacrt je to bolji što se više približava idealu
da se promjene predmeta opažanja mogu jednoznačno pripisati promjenama nezavisne varijable.
Osnovna je, dakle, svrha eksperimenta omogućavanje istinitih zaključaka o učincima nezavisne
varijable na opažano ponašanje i o uvjetima pod kojima se takav utjecaj odvija. Kako je konačna
istina nerijetko teško dokučiva, Campbell i Stanley (1966) uveli su pojam valjanosti u smislu
najboljeg približnog određenja istinitosti zaključaka. Tako shvaćena, valjanost znači stupanj u
kojem je neki eksperimentalni nacrt primjeren logički okvir za izvođenje odgovarajućih
zaključaka. Četiri su osnovna tipa eksperimentalne valjanosti (Cook i Campbell, 1979):
1. unutarnja valjanost
2. vanjska valjanost
3. konstruktna valjanost
4. valjanost statističkog zaključka
Prva dva tipa valjanosti, unutarnja i vanjska, početno su zamišljeni općenitijima nego danas
(Campbell i Stanley, 1966), ali su poslije razdijeljeni svaki na dva zasebna aspekta. Kao posebna
kategorija unutarnje valjanosti, koja u cjelini predstavlja opravdanost zaključivanja o uzročnosti,
izdvojila se valjanost statističkog zaključka koja se bavi istinitošću zaključaka o povezanosti
nezavisne i zavisne varijable. Vanjska je valjanost razlomljena na onu u užem smislu, koja kazuje o
mogućnosti uopćavanja uzročnih zaključaka, i na konstruktnu valjanost kao opravdanost prijenosa
utvrđenih zaključaka s iskustvene na teorijsku razinu.
6.5.1 VALJANOST STATISTIČKOG ZAKLJUČKA
Da bismo uopće bili u mogućnosti izvoditi uzročno-posljedične zaključke iz eksperimenta, najprije
moramo dokazali da su nezavisna i zavisna varijabla povezane. No, kako znamo, zaključivanje o
povezanosti nije tako jednostavno kako se čini površnom promatraču i ne svodi se samo na
unaprijed definirani računski postupak. Ubrzo ćemo vidjeti da je riječ, ne toliko o nepromjenjivom
statističkom pravilu,119 koliko O prosudba ma koje uvelike počivaju na uporabljenom nacrtu i
metodologiji. Valjanost statističkog zaključka odnosi se na donošenje sudova o odnosu nezavisne i
zavisne varijable temeljem statističkog vrednovanja. Taj bismo aspekt valjanosti mogli definirati
kao mogućnost statističkog dokazivanja povezanosti nezavisne i zavisne varijable koje proizlazi iz
primijenjenog nacrta i korištene metodologije. Za razliku od unutarnje valjanosti koja predstavlja
"otpornost" nacrta na greške pristranosti (sustavnih vanjskih utjecaja na zavisnu varijablu),
valjanost statističkog zaključka odraz je neosjetljivosti na nesustavne utjecaje, koje se primjerenom
brigom oko eksperimentalnog postupka, uzorka i statističke analize, nastoji u najvećoj mjeri
isključiti iz konačnih nalaza. Osnovna pitanja koja si pritom postavljamo su: je li nacrt dovoljno
osjetljiv da pruži vjerodostojne podatke o povezanosti nezavisne i zavisne varijable, i ako da,
postoji li kakva veza među njima i koliko je naglašen? Istraživači koji statističkom zaključivanju i
mogućim problemima što iz njega izviru ne pristupaju dovoljno ozbiljno mogu time ozbiljno
poljuljati vjerodostojnost vlastitog istraživanja. Činitelji koji mogu pridonijeti zamagljivanju odnosa
zavisne i nezavisne varijable zbog premale pozornosti posvećene pitanjima statističkog
zaključivanja, nazivaju se prijetnjama valjanosti statističkog zaključka.
119
119
80
Ivo V.
6.5.1.1 OSNOVNE ZNAČAJKE STATISTIČKOG TESTIRANJA

Eksperimentalna metodologija počiva svojim velikim dijelom na statistici zaključivanja.
Statističkim se testom u pravilu pokušava utvrditi može li se dobivena razlika između kontrolne i
eksperimentalne skupine pripisati slučajnim kolebanjima, ili je odraz stvarne razlike koja postoji i
81
Ivo V.
na populacijskoj razini120. Ako su razlike između skupina velike u toj mjeri da se ne mogu, uz
razumnu vjerojatnost, pripisati slučajnim koleba njima, odbacujemo početnu nul-hipotezu o
nepostojanju razlike. Međutim, hoćemo li ostati pri nul-hipotezi ili je odbaciti, ovisi također o
usvojenom stupnju rizika da ćemo pogriješiti li zaključku. Četiri su moguća ishoda s obzirom na
stvarnu situaciju i našu odluku temeljenu na statističkom zaključivanju. U tablici 6.2 prikazane su
moguće kombinacije naše odluke, odnosno vrednovanja statističkog testa i objektivne stvarnosti
koja kazuje kakve stvari doista jesu. Cilj je eksperimenta doći do zaključka koji odražava
objektivnu stvarnost. No to, kako pokazuje tablica, nismo uvijek kadri činiti. Ponekad učinimo
grešku tipa I, zaključujući o razlici koja u stvarnosti ne postoji, odnosno onu tipa II izvodeći
zaključak o tome kako razlika ne postoji, iako objektivno postoji. Pitanje valjanosti statističkog
zaključka aktualizira se upravo u slučajevima u kojima zbog manjkave 121 naobrazbe istraživača
može doći do nedovoljno osviještene ili pogrešne uporabe statističkih testova.
6.5.1.2 PRIJETNJE VALJANOSTI STATISTIČKOG ZAKLJUČKA

Statistička snaga
Statistička snaga je vjerojatnost odbacivanja hipoteze o nepostojanju razlika među skupinama
(nul-hipoteze) kad je ona u stvarnosti netočna. Ili drukčije, snaga je vjerojatnost nalaženja razlike
među skupinama kad ona uistinu (na populacijskoj razini postoji). Pri analizi rezultata nekog
eksperimenta osobito je važno statističkim testom utvrditi razliku uzrokovanu eksperimentalnom
manipulacijom. To je, međutim, rijetko kad moguće precizno učiniti. Redovito imamo problema s
dokazivanjem da su nezavisna i zavisna varijabla uopće (u bilo kojoj mjeri) povezane. Statistička
snaga ovisno o:
1. usvojenom kriteriju značajnosti (alfa)
2. broju ispitanika
3. varijabilitetu (varijanci) zavisne varijable
4. razlici među populacijama (veličini učinka)
5. korištenom statističkom testu
Zbog malog uzorka, zahtjevnog kriterija značajnosti (1 % ili 5%), velikog varijabiliteta i nevelike
razlike među skupinama, statistička snaga može biti niska, tako da je eksperimentom gotovo
nemoguće dokazati učinkovitost eksperimentalne122 manipulacije. Umjesto potpune usredotočenosti
na izbjegavanje greške vezane uz odbacivanje točne nul-hipoteze, koja je obilježila prvo razdoblje
120
Sintagma "populacijska razina'' znači da propitujemo pretpostavku o postojanju razlika između populacije izložene
nezavisnoj varijabli i one neizložene.
121
121
122
122
82
Ivo V.
psihologijske znanosti, autori, prije svih Jacob Cohen (1988; 1992), upozoravaju na veliku opasnost
od greške ostajanja pri netočnoj nul-hipotezi do koje dovodi slaba statistička snaga. Odgovornost za
zanemarivanje greške tipa II uvelike snosi, kako drži Cohen, sam Fisher (1966), čije su zamisli bile
itekako utjecaj ne, ne samo u uskom krugu statističkih stručnjaka, već i među psiholozima i
znanstvenicima uopće. Za Fishera je bilo važno samo dokazivanje ispravnosti ili neispravnosti nul-
hipoteze, a direktivnoj hipotezi nije poklanjao veću pozornost. Ali stvari su se u novije vrijeme
itekako promijenile.
Podsjetimo se za početak načina izvođenja statističkih zaključaka ti eksperimentu. Uspoređujemo

dobivenu razliku među grupama s raspodjelom razlika dobivenom pod pretpostavkom ispravnosti
nul-hipoteze. Pogledajmo sliku 6.1. Raspodjelu na lijevoj strani slike 6.1 dobili bismo pod
pretpostavkom ispravnosti nul-hipoteze, odnosno nepostojanja razlika među grupama. Njena
aritmetička sredina (μ0) iznosi nula. Odsječak označen s α predstavlja preuzeti stupanj rizika od
odbacivanja ispravne nul-hipoteze. U ovom slučaju riječ je o jednosmjernom testu, a u slučaju
dvosmjernog odsječak bi bio upola manji i nalazio bi se s obje strane raspodjele. Raspodjela na
desnoj strani ima aritmetičku sredinu (μ1) veću od nule, jednaku stvarnoj razlici među grupama.
Uzmimo sada da je naša nul-hipoteza netočna i da se rezultati grupiraju u skladu s desnom
raspodjelom. Odsječak označen s β upućuje na 123 grešku pristajanja uz netočnu nul-hipotezu. S
obzirom na preklapanje raspodjela, većina teoretski očekivanih rezultata potpala bi pod ovu
kategoriju, što znači da je vjerojatnost odbacivanja nul-hipoteze razmjerno mala. Na to upućuje i
treći odsječak koji se odnosi na snagu. U slučaju neistinitosti nul-hipoteze, ovaj odsječak, naravno,
obuhvaća i područje koje inače zauzima rizik od odbacivanja ispravne nul-hipoteze (α). Na snagu
ne otpada mnogo više od četvrtine svih mogućih ishoda našeg eksperimenta. Razmotrimo sad i
jedan posve konkretan istraživački primjer. Nastojimo ispitati hoće li se pod utjecajem neke nasilne
kompjutorske igre povećati agresivnost u djece, mjere na opažanjem u prirodnoj situaciji.
Pretpostavimo također da konkretna igra doista utječe na agresivnost i da su njeni učinci razmjerni
onima prikazanima u prethodnoj slici (aritmetička sredina agresivnosti djece koja je igraju je μ 1 a
one koja igraju neku drugu "nenasilnu" igru μ0. Unatoč našoj dobroj volji i netočnosti nul-hipoteze,
našim je pokusom vjerojatno nećemo moći odbaciti, ili preciznije vjerojatnost da se to dogodi bit će
svega 1/4. Nažalost, takva nemogućnost ima i praktičnih posljedica jer se ostajanje pri nul-hipotezi
često, osobito među laicima, poistovjećuje s njenom ispravnošću. Važno je, međutim, znati da
statistička snaga nije nikakva nepromjenjiva veličina, već se na nju može utjecati.
123
123
83
Ivo V.
Jedan od načina da se snaga poveća jest preuzimanje većeg rizika od odbacivanja ispravne nul-
hipoteze (α). Uočimo na prethodnoj slici da bi pomicanje granične crte koja označava razinu rizika
ulijevo ujedno povećalo statističku snagu. Zbog konvencije, međutim, je tek u posve iznimnim
situacijama veći od 0,05.
Statistička snaga u velikoj mjeri ovisi o stvarnoj populacijskoj razlici između kontrolnih i
eksperimentalnih uvjeta. Što je ova razlika naglašenija, to je i vjerojatnost da ćemo odbaciti nul-
hipotezu veća. Za potrebe daljnjeg izlaganja potrebno se stoga upoznali s pojmom veličine učinka,
Radi se zapravo o razlici u zavisnoj varijabli između eksperimentalne i kontrolne skupine
podijeljenoj pripadajućem standardnom devijacijom. Ili formulom:
Uzmimo za primjer ela je razlika između eksperimentalne i kontrolne skupine u testu kojim se
procjenjuje učinak nezavisne varijable 38-33 = 5, uz standardnu devijaciju 10. Veličina učinka u
tom je slučaju 5/10 ili 0.5. Na veličinu učinka možemo djelovati uglavnom samo posredno. U
određenoj mjeri, naime, razlike su zadane prirodom pojave koju istražujemo. Na primjer, razlike u
brzini reakcije na zvučne i svjetlosne podražaja na uzorcima ispitanika slučajno izabranima iz
populacije, razmjerno su postojane i na njih ne možemo značajnije utjecati. U nekim drugim
slučajevima ipak smo u mogućnosti učiniti eksperimentalne uvjete toliko različitima124
U odnosu na kontrolne da povećamo veličinu učinka. Primjerice, ispitujemo li kako utječe
neispavanost na brzinu u psihomotornom zadatku, možemo, da bismo razliku između kontrolne i
eksperimentalne skupine učinili naglašenijom, usporediti grupu onih koja je normalno spavala
prethodnu noć s onom koja nije spavala dvije noći za redom, umjesto da ispitamo one koji su
spavali 8 sati s onima koji su spavali svega četiri. Takav pristup nije uvijek moguć, niti je idealno
rješenje u svim situacijama, ali valja znati da nismo bespomoćni čak i kad je u pitanju veličina
učinka koju mnogi smatraju fiksne zadanom vrijednošću. Pogledajmo sad kako se mijenja snaga u
funkciji povećanja razlike među uvjetima.
Osim o razlici između skupina, veličina učinka ovisi tako, jer o stupnju variranja istraživane pojave
koji se iskazuje standardnom devijacijom. Sto je standardna devijacija veća, to je veličina učinka
manja. Zbog toga je u eksperimentu od velike važnosti smanjiti na minimum sve neželjene izvore
varijacije, to jest sve one nevezane uz nezavisnu varijablu. Na standardnu devijaciju možemo
utjecati, smanjujući varijabilitet ovisan o heterogenosti ispitanika ili nestandardiziranosti procedure.
O načinima na koji to činimo govorit ćemo nešto kasnije.
124
124
84
Ivo V.
Unatoč važnosti koju pridajemo veličini razlike i stupnju variranja (varijanci), valja ipak naglasiti
da statističku snagu možemo unaprijediti ponajprije povećavanjem uzorka ispitanika. Što je stvarna
razlika (veličina učinka) između različitih skupina manja, tim je veći uzorak potreban za
dokazivanje razlike. Povećanje uzorka je najlakši i najčešći način povećavanja statističke snage.
Povećavanje uzorka, znamo, smanjuje standardnu grešku aritmetičke sredine o kojoj je ovisan t-
trest. Ta se greška smanjuje usporedo s drugim korijenom iz veličine uzorka. Zbog toga uz istu
razliku125 među grupama i jednaku standardnu devijaciju, ali uz veći uzorak imamo mnogo veću
vjerojatnost odbacivanja netočne nul-hipoteze. Isti bi učinak proizvelo i odgovarajuće smanjenje
varijabiliteta, ali je na njega mnogo teže utjecati nego na veličinu uzorka. Pogledajmo sliku 6.3.
Zbog povećanja uzorka (ili smanjenja varijance zavisne varijable) smanjuje se standardna greška
aritmetičke sredine (a time i standardna greška razlika među aritmetičkim sredinama), te se time
posredno povećava t-omjer. Raspodjele razlika su, zbog manje standardne greške aritmetičke
sredine "zgusnutije" oko prave aritmetičke sredine razlika.
Za istraživački rad je najvažnije utvrditi koliki nam je uzorak potreban za dokazivanje neke razlike.
Lako je pokazati da je t-rest umnožak veličine učinka i veličine studije (Rosenthal i Rosnow, 1991):
Ako otprilike, na temelju ranijih istraživanja znamo koliko bi mogla iznositi razlika među
eksperimentalnim uvjetima podijeljena standardnom devijacijom, možemo razmjerno egzaktno
odrediti veličinu uzorka koja bi dopuštala statističko dokazivanje učinka nezavisne varijable.
Pretpostavimo li da su eksperimentalna kontrolna skupina podjednako velike, gornja se formula
može pojednostavniti:126
pri čemu d označava veličinu učinka, a ss stupnjeve slobode (N 1 +N2 - 2). Lako je pokazati da u
tom slučaj u N potreban za dokazivanje značajnosti na razini od p <0.05 i uz vjerojatnost
dokazivanja 50%, mora iznositi:
125
125
126
126
85
Ivo V.
Uzmimo da nam je iz literature dostupan podatak da su ranije studije utvrdile kako uvježbavanje na
nekom testu inteligencije povećava prosječan rezultat za tri boda (sa 100 na 103) uz standardnu
devijaciju koja u oba slučaja iznosi 15. Veličina učinka d iznosi 0,2. Recimo da nam je poznato
kako se radi o populacijskim vrijednostima, a ne o slučajno dobivenom nalazu. Problem je koliki bi
trebao biti uzorak da bismo uspjeli dokazati razliku te veličine. Koristeći se gornjom formulom lako
se može pokazati da veličina kontrolne i eksperimentalne skupine moraju biti tek nešto manje od
200 ispitanika (ili precizno 192) da bismo učinkovitost nezavisne varijable uspjeli statistički
dokazati uz razinu rizika od 5% u 50% provjera. Uzorci manji od toga uopće ne bi trebali doći u
obzir jer će upućivati na statistički neznačajnu razliku u proporciji većoj od 0,50. Zbog male
veličine učinka, potreban uzorak je vrlo velik (gotovo 400 ispitanika), što je teško ostvarivo. No i za
to postoji lijek. Naime veći broj studija s brojem ispitanika manjim od potrebnog za dokazivanje
učinka nezavisne varijable može, korištenjem postupka meta-analize, koji će biti opisan u kasnijim
poglavljima, biti združen u zajednički pokazatelj, kao da smo proveli jedno istraživanje na vrlo
velikom broju ispitanika.
Dosad izrečeno dostaje tek za ilustraciju problema i načela kojima se valja poslužiti kako bi se
izbjegla greška zbog manjka statističke snage. Međutim, treba biti svjestan da je cjelovito rješavanje
problema mnogo složenije i računski zahtjevnije. Svaki statistički zaključak može biti ugrožen
manjkom statističke snage. S obzirom na različitost formula koje se koriste u statističkom
dokazivanju (t-test, F-omjer, x2), i načini dolaženja do potrebnog broja ispitanika ili izračunavanje
statističke snage su različiti. Za one koji žele produbiti svoje spoznaje o statističkoj snazi izvrsna
Cohenova (1988) knjiga svakako je nezaobilazan izvor. Valja ipak dodati ponešto za one koji žele
saznati kako izračunati veličinu učinka koja će im zajamčiti odbacivanje nul-hipoteze. U primjeru je
statistička snaga, zbog jednostavnosti, zadržavana na razini od 50%. Često nas zanima što učiniti da
našim nacrtom bude moguće odbaciti neistinite nul-hipoteza u 80% ili 90% slučajeva. Račun u tom
slučaju postaje složeniji, a kao pomoćno sredstvo nužne su posebne tablice iz kojih se dade iščitati
statistička snaga. I tu se Cohenova (1988) knjiga pokazuje nezamjenjivom, iako mnoge moderne
statistike nude nešto pristupačnija rješenja (Howell, 1997).
Spomenuta rasprava morala bi biti poučna za svakoga tko se upušta u istraživanje. Prije svega, valja
relativizirati načelo odbacivanja nul-hipoteze. Zaključci127 doneseni na temelju značajnosti
statističkih testova nisu apsolutne istine, nego pragmatični kriterij kojim se služimo u nedostatku
boljega. Možemo pogriješiti odbacujući točnu nul-hipotezu, ali, što je još vjerojatnije, ostati pri
netočnoj, zbog strogog kriterija značajnosti i niske statističke snage. Nismo međutim posve
bespomoćni. Znamo Ii do kakvih su razlika između kontrolne i eksperimentalne skupine u sličnim
istraživanjima došli naši prethodnici, možemo odrediti veličinu uzorka vjerojatno dovoljnu za
dokazivanje eventualno postojeće razlike. Statistička neznačajnost dobivena na nezadovoljavajuće
malom uzorku ne kazuje nam zapravo ništa i upitno je treba li uopće takva istraživanja, unaprijed
osuđena na ostajanje pri nul-hipotezi provoditi.
Nesustavne varijacije u postupku
Slučajne varijacije u postupku, kako smo rekli, mogu na posredan način otežati dokazivanje
povezanosti nezavisne i zavisne varijable. Veličina učinka u pravilu ovisi o stvarnoj razlici između
uvjeta u kojima je djelovala u odnosu na one u kojima nije djelovala nezavisna varijabla. No osim o
njoj, veličina učinka također ovisi i o varijabilitetu. Što je varijabilitet veći, to će i razlika između
eksperimentalne i kontrolne skupine morati biti izraženija da bismo je mogli proglasiti statistički
značajnom. Ukupnoj varijanci pridonose osobne razlike medu ispitanicima, slučaj na kolebanja u
rezultatima, razlike među eksperimentatorima, način na koji se uvodi nezavisna varijabla, kao i
čitav niz drugih činitelja. Razlog zašto postupak mora biti standardiziran, eksperimentatori
127
127
86
Ivo V.
uvježbani, a upute uvijek jednake, nije formalne već suštinske naravi. O tome, naime, izravno ovisi
valjanost statističkog zaključka. Ako postupak nije jasno određen, sadržava slučajna kolebanja ili je
odraz različitih osobnih jednadžbi eksperimentatora, u eksperiment se unosi dodatni varijabilitet
koji otežava dokazivanje uzročno-posljedične veze nezavisne i zavisne varijable. Smanjimo li,
naprotiv, varijabilitet uzrokovan slučajnim varijacijama u postupku, povećavamo vjerojatnost
dokazivanja razlike na populacijskoj razini ako takva postoji.
Uzmimo, primjerice, da provjeravamo dvije metode učenja stranih jezika pretežno konverzacijsku i
pretežno pismenu. Pretpostavimo također da nastavu drži veći broj nastavnika. Ako ne definiramo
sasvim precizno što uključuje koji postupak, moguće je da velike varijacije u načinu provođenja
nastave ugroze naše zaključke. Pojavit će se, naime, velika varijanca unutar grupa (koja se običava
zvati eksperimentalnom greškom), što znači da razlike među skupinama moraju biti još daleko veće
da bi bile značajne128'. Naprotiv, ako u nacrt unesemo nužno potrebnu preciznost,129 varijanca
uzrokovana nejasno definiranom procedurom bit će svedena na minimum, a time će se automatski
povećati veličina učinka.
Različitost ispitanika
Razlike medu ispitanicima li obilježjima povezanima s ishodom, također mogu predstavljati
prepreku u dokazivanju učinkovitosti nezavisne varijable na sličan način kao i slučajne varijacije u
postupku. Ispitanici se mogu razlikovati prema velikom broju osobina, spolu, dobi, naobrazbi,
nacionalnosti, inteligenciji i drugima. U pravilu, što je veća različitost, to je teže dokazati
učinkovitost intervencije, jer se povećava eksperimentalna greška odnosno varijabilitet unutar
skupina. No da bi različitost uopće utjecala na valjanost statističkog zaključka, ispitanici se moraju
razlikovati s obzirom na neku osobinu povezanu s ishodom. Pri ispitivanju pamćenja, visina
ispitanika vjerojatno neće imati osobitog značenja. Stoga na raznolikost u tjelesnoj visini u takvom
slučaju ne treba obraćati preveliku pozornost. Naobrazba, s druge strane, može imati znatan utjecaj
na pamćenje. Ako skupine među sobom nisu izjednačene s obzirom na naobrazbu (početna
neujednačenost kontrolne i eksperimentalne skupine), govorimo o problemu unutarnje valjanosti.
Ako smo se pobrinuli da se grupe s obzirom na naobrazbu u prosjeku među sobom ne razlikuju, ali
unutar svake skupine postoji velika, problem se odnosi na valjanost statističkog zaključka.
Pri ispitivanju utjecaja mnemotehnike na zapamćivanje, može nam se dogoditi da, unatoč našoj želji
da svi ispitanici eksperimentalne skupine postignu bolje, a svi oni iz kontrolne slabije rezultate,
naobrazba pridonese velikim unutargrupnim razlikama, remeteći opće pravilo i jednoznačnost
zaključka. U takvom slučaju, različitost ispitanika zna smanjiti veličinu učinka (povećavajući
varijancu) u tolikoj mjeri da onemogući odbacivanje nul-hipoteze.
Problem različitosti moguće je riješiti na nekoliko načina. Prvi se sastoji u biranju istovrsnih
ispitanika. Valja reći da je istovrsnost pitanje stupnja, odnosno da je potpuna identičnost ispitanika
unutar skupine neostvariva zadaća. Usto takav je postupak upitne vrijednosti sa stajališta vanjske
valjanosti. Drugi, bolji način,sastoji se u uključivanju različitog uzorka u istraživanje, ali uz
istodobno osiguravanje mogućnosti odvajanja učinaka uzrokovanih raznovrsnošću ispitanika. To se
postiže faktorijalnim nacrtima, u kojima se raznovrsnost ispitanika uključuje kao jedna od
nezavisnih varijabli - faktora. Najbolji je način svakako korištenje nacrta ponovljenih mjerenja u
kojem osobna obilježja i njima prouzročena varijanca bivaju isključene iz analize bez porasta
eksperimentalne greške.
Nepouzdanost zavisne varijable
128
Rasprava je zapravo mnogo složenija, ali ćemo je ostaviti za kasnija poglavlja u kojima ćemo izložiti osnovne
logičko postavke analize varijance, te će kroz to postati mnogo jasnije zašto varijancu unutar grupa valja u najvećoj
mjeri ograničiti.
129
128
87
Ivo V.
Nepouzdanost mjera često dovodi do podcjenjivanja veličine učinka nezavisne varijable.
Pouzdanost nekog mjernog instrumenta definira se obično kao proporcija 130 istinske varijance u
cjelokupnoj varijanci. Pojednostavljeno rečeno, što je instrument manje pouzdan, to je neki rezultat
više posljedica nesistematskog i slučajnog varijabiliteta, a manje stvarne vrijednosti mjerene
osobine. Zbog toga ispitanik koji primjerice ima kvocijent inteligencije 100 (uzmimo da se radi o
nečem što možemo egzaktno utvrditi) može na pouzdanom testu dobiti rezultate između 95 i 105,
ali na manje pouzdanom testu, njegov se rezultat može kretati između 80 i 120. Manje pouzdane
mjere su znatnije opterećene slučajnim varijabilitetom, koji se izravno odražava na povećanje općeg
varijabiliteta te time i manju vjerojatnost dokazivanja učinkovitosti intervencije. Stoga istraživač pri
izboru instrumenata mora voditi računa o njihovoj pouzdanosti.
Višestruke usporedbe
Višestruke usporedbe ili "pecanje" mogu povećati razinu statističke greške ako istraživač o njima ne
vodi dovoljno računa. Koristi li istraživač veći broj mjera zavisne varijable kako bi dokazao utjecaj
nezavisne varijable, primjerice 10 različitih ljestvica anksioznosti umjesto jedne, mora biti svjestan
da vjerojatnost nalaženja statistički značajne razlike, ako ona u stvarnosti ne postoji, nije više 1
nego čak 10%. Valja naime razlikovati razinu greške pri pojedinačnoj usporedbi (vjerojatnost da će
neka razlika biti proglašena značajnom kad ona to nije) od razine greške u eksperimentu (očekivani
broj pogrešaka u eksperimentu). Najjednostavnije rješenje problema jest Bonferronijev postupak, u
literaturi također znan kao Dunnov test (Dunn, 1961), koji se sastoji u dijeljenju preuzetog stupnja
rizika (alfa) s brojem mogućih usporedbi. Pri tome korigirani alta iznosi α' = α/c. Ako, primjerice
pri usporedbi kontrolne i eksperimentalne skupine koristimo 10 mjera zavisne varijable uz α od .01,
nova će razina rizika biti .0l/10 ili .001. To znači da ćemo, nastojeći dokazati učinkovitost neke
nezavisne varijable na većem broju pokazatelja, to morati učiniti služeći se mnogo većim graničnim
vrijednostima inferencijalnog testa od onih koje bismo koristili pri samo jednoj usporedbi.
Narušene pretpostavke statističkih testova
U poznatim svjetskim publikacijama relativno se rijetko može uočiti odstupanje od pretpostavki
koje nalažu korištene statističke metode, ali takve greške su toliko učestale u radovima početnika da
ih svakako valja spomenuti kao moguću prijetnju valjanosti statističkih zaključaka. Da bismo uopće
mogli koristiti neki od testova inferencijalne statistike, poput t-testova, analize varijance, i,ili
drugih, moraju biti zadovoljeni određeni preduvjeti vezani uz podatke. To mogu biti nezavisnost
mjerenja, normalnost raspodjele rezultata, jednaka veličina varijanci, kao i brojni drugi uvjeti što ih
spominju standard ni statistički udžbenici. Narušavanje takvih pretpostavki, osobito ako se radi o
manje robusnim testovima, može dovesti do rezultata bitno131 različitih od onih što bismo ih dobili
njihovom adekvatnom primjenom. Na primjer, ako smo zanemarili koreliranost podataka u
kontrolnoj i eksperimentalnoj skupini i upotrijebili t-test za nezavisne umjesto onog za zavisne
uzorke, dobit ćemo nerealno mali t-omjer zbog nekorigirane standardne greške razlike među
grupama.
6.5.2 UNUTARNJA VALJANOS
Jednom kada smo statistički potvrdili povezanost nezavisne i zavisne varijable, predstoji nam teži
dio posla, dokazivanja da upravo prva uzrokuje promjene u drugoj. Sjetimo se, dokazivanje uz
ročnosti podrazumijeva da odbacimo druga moguća objašnjenja, poput onog da su promjene
zavisne varijable uzrokovane nekim vanjskim faktorom. Eksperimentalni nacrt nikad nam ne
omogućuje da s potpunom sigurnošću zaključimo kako je upravo nezavisna varijabla uzrokovala
promjenu izučavanog ponašanja. Međutim, ako je nacrt brižljivo planiran i proveden, promjene
zavisne varijable mogu se s velikom vjerojatnošću pripisati eksperimentalnoj manipulaciji. U tom
slučaju, kada se s razmjerno malim rizikom može tvrditi kako su promjene u zavisnoj varijabli
odraz promjena u nezavisnoj, govorimo o eksperimentu koji posjeduje visoku unutarnju valjanost.
Unutarnja valjanost stoga se može definirati kao stupanj u kojem je pojedinim eksperimentalnim
nacrtom promjene izučavanog ponašanja moguće pripisati manipulaciji nezavisnom varijablom
130
129
131
130
88
Ivo V.
odbacujući pritom sva druga objašnjenja za uočene promjene. Prisjetimo li se uvjeta nužnih za
zaključke o uzročnosti, razabrat ćemo da su nam, pošto smo utvrdili povezanost nezavisne i zavisne
varijable, preostala još dva, odgovarajući redoslijed (uzrok prethodi posljedici) i odbacivanje drugih
tumačenja (lažne povezanosti uzrokovane nekim vanjskim faktorom). Prvi ćemo eksperimentom
lako zadovoljiti jer se registracija zavisne varijable uvijek obavlja nakon manipulacije nezavisnom
Drugi će nam značiti itekakvu poteškoću i upravo njemu posvećujemo započetu cjelinu. Činitelji ili
utjecaji koji su osim nezavisne varijable mogli utjecati na ishod eksperimenta nazivaju se vanjskim
faktorima. Ako korištenjem nekog nacrta nismo kadri razlučiti utjecaje nezavisne varijable od
vanjskih faktora, kažemo da takav nacrt ne posjeduje visoku unutarnju valjanost, odnosno da njime
nisu otklonjene prijetnje unutarnjoj valjanosti. U svom klasičnom radu, Campbell i Stanley (1966)
navode niz takvih prijetnji koje ugrožavaju valjanost naših zaključaka.
6.5.2.1 PRIJETNJE UNUTARNJOJ VALJANOSTI
Ako se u eksperimentalnom nacrtu primjereno ne kontroliraju, različiti "vanjski" utjecaji mogu
zamagliti odnos zavisne i nezavisne varijable te onemogućiti ili otežati donošenje bilo kakvih
zaključaka. Vanjski faktori korelirani s nezavisnom varijablom mogu, što je češće, utjecati na
zavisnu, stvarajući lažan dojam djelotvornosti intervencije, ili djelovati u suprotnom smjeru,
poništavajući djelovanje manipulacije.132 Prijetnje se mogu podijeliti na one koje utječu na nacrte
bez kontrolne grupe i one koje ugrožavaju nacrte s kontrolnom grupom. U prvu se kategoriju
ubrajaju prijetnje vezane za povijest, sazrijevanje, testiranje, instrumentaciju, osipanje ispitanika i
statističku regresiju, dok drugoj pripadaju one izazvane različitim interakcijama s izborom
ispitanika, difuzijom tretmana i nevaljanostima u kontrolnoj grupi.
Povijest
Povijest uključuje svaki događaj koji se pojavljuje između prvog i drugog testiranja usporedo s
nezavisnom varijablom. O povijesti je stoga moguće govoriti samo u eksperiment ima koji
obuhvaćaju dvokratno testiranje ponašanje prema shemi:
pri čemu O označava opaža nje, a E eksperimentalnu (nezavisnu varijablu). U takvoj je situaciji vrlo
nezahvalno zaključiti kako je eventualna razlika između prvog i drugog opažanja posljedica
djelovanja upravo nezavisne varijable. Na takav ishod mogao je utjecati i čitav niz faktora koji su
djelovali usporedo s nezavisnom varijablom, ali nezavisno od nje. U tom slučaju nije jasno čemu
pripisati promjene u opažanom ponašanju, samoj eksperimentalnoj intervenciji ili događajima koji
su se odvijali nevezano od nje. Kako bi ih kontrolirao, istraživač nastoji odstraniti sve vanjske
utjecaje iz eksperimentalne situacije (primjerice, buku, vibracije, predmete 133 koji odvlače pažnju i
sl.) ili izjednačiti njihov intenzitet po skupinama ili uvjetima (primjerice, testirati eksperimentalnu i
kontrolnu grupu u podjednakom broju termina prije i poslije podne). No to je teško ili nemoguće
postići izvan laboratorija.
Na slici 6.4 valja uočiti kako pored nezavisne varijable, tijekom vremenskog razmaka između dvaju
opažanja utječe i čitav niz vanjskih faktora kojih moramo biti svjesni u takvom, manjkavom tipu
nacrta s mjerenjem prije i poslije uvođenja nezavisne varijable bez kontrolne skupine. Ako smo
ispitivali utjecaj gledanja nasilnog filma na stavove o potrebi strožeg kažnjavanja zločinaca i pritom
proveli mjerenje prije i poslije gledanja u razmaku od nekoliko dana, ne možemo biti sigurni da je
do promjene došlo upravo zbog prikazanog filma. U danima između dva opažanja, ispitanici su
mogli doći pod utjecaj različitih drugih faktora, primjerice međusobnih razgovora, gledanja drugih
nasilnih ili nenasilnih filmova na televiziji, pročitanih članaka u novinama ili tjednicima ili nekih
drugih dovoljno uvjerljivih izvora podataka.
132
131
133
132
89
Ivo V.
Ako smo provjeravajući neku terapijsku intervenciju ustanovili da se grupi pacijenata stanje bitno
popravilo nakon njene primjene, još uvijek ne možemo zaključiti da je do toga došlo upravo zbog
nje. Suparničke hipoteze i ovoga puta su vezane uz faktore koji se odvijaju usporedo s terapijskom
intervencijom ali ne zbog nje. To mogu biti razgovori s članovima obitelji, pojačana briga okoline,
pročitana knjiga, odgledana emisija na televiziji kao i sve drugo što je moglo proizvesti stanovite
terapijske učinke. Prijetnje vezane uz povijest uklanjaju se, gotovo bez iznimke, uvođenjem
kontrolne skupine, jer je to praktički jedini način da se utvrde promjene do kojih dolazi zbog nekih
usporednih događanja nevezanih za intervenciju.
Sazrijevanje
Ova se prijetnja odnosi na sve procese koji se odvijaju unutar ispitanika tijekom provođenja
eksperimenta. Iako to nije sugerirano samim imenom, sazrijeva nje obuhvaća sve vremenski
uvjetovane promjene ispitanika biološke ili psihološke naravi poput starenja, umaranja, učenja,
dosade, intelektualnog razvoja, stjecanja obrazovanja i drugih, koji su pored nezavisne varijable
mogle utjecati na zavisnu, maskirajući time odnos na koji se eksperimentom nastojimo usredotočiti.
U širem smislu, sazrijeva nje obuhvaća i sve slične, kontinuirane promjene zavisne varijable
nevezane za ispitanike.
Želimo li, primjerice, provjeriti kako će ekološki apel za štednju vode utjecati na potrošnju po
stanovniku u nekom razdoblju, možemo ustanoviti da se potrošnja doista smanjuje, ali bi pomnija
analiza možda pokazala da se ona kontinuirano smanjuje i bez apela. Takav rezultat moguća je
posljedica izrade sve štedljivijih kućanskih pomagala (perilica rublja i suđa) i globalnog narastanja
ekološke svijesti.
Podjednako kao i povijest, sazrijevanje također prijeti nacrtima koji u sebe uključuju dvokratna ili
višekratna testiranja istog ponašanja. Ako želimo provjeriti 134 kako na vizualno-motoričku
koordinaciju djecu utječe vježba crtanja i u tu svrhu skupinu šestogodišnjaka testiramo dva puta u
razmaku od dva mjeseca, eventualne promjene očitovane u testu nećemo sa sigurnošću moći
pripisati učincima vježbe. Djeca su, naime, u dva mjeseca dodatno sazrela, pa bi njihov učinak na
testu i bez ikakve vježbe morao biti bolji. Poput prijetnji vezanih uz povijest, kontrola sazrijevanja
najčešće počiva na kontrolnoj skupini, a u nacrtu unutar ispitanika na variranju rasporeda uvjeta.
Testiranje
Višekratno mjerenje zavisne varijable psihologijskim testovima može ponekad biti ozbiljna prijetnja
unutarnjoj valjanosti eksperimenta. Pri tome, naime, sama primjena nekih testova dovodi do
promjena u narednim primjena ma zbog pojave uvježbavanja i upoznatosti sa situacijom. Ako
bismo neki obrazovni program vrednovali na temelju testiranja istim mjernim instrumentom prije i
134
133
90
Ivo V.
poslije njegova provođenja, utvrđeni napredak u znanju bio bi istodobno odraz nezavisne varijable,
ali i upoznatosti s testom i većom naviknutošću na testovnu situaciju. Poput prethodno navedenih
prijetnji i učinak testiranja je moguće isključiti jedino uvođenjem kontrolne grupe.
Instrumentacija
Instrumentacija je promjena zavisne varijable do koje dolazi zbog preinačavanja mjernog
instrumenta između dva testiranja, a ne manipulacije nezavisnom varijablom. Premda mnogi toga
nisu dokraja svjesni, u psihologiji je razmjerno učestala uporaba mjernih tehnika podložnih
mijenjanju tijekom istraživanja. Mjerenje fizikalnih pojava vjerojatno ne ulazi u tu kategoriju, ali to
vrijedi za gotovo sve mjere zavisne varijable temeljene na subjektivnoj procjeni. To se, primjerice,
dešava kad opažači steknu veću vještinu i iskustvo u opažanju prije drugog testiranja, tako da su u
stanju zamijetiti i ona ponašanja koja nisu zabilježili u prvom navratu (iako su postojala).
Na primjer, prilikom provođenja programa koji za cilj ima povećavanje učestalosti prosocijalnog
ponašanja djece, možemo primijeniti nacrt dvokratnog opažanja. Prije primjene programa izmjerit
ćemo, na temelju opažanja, početnu razinu prosocijalnog ponašanja, što ćemo ponoviti po njegovu
okončanju. Eventualnu razliku, međutim, nećemo moći pripisati (isključivo) programu. Osim
povijesti i sazrijevanja, o kojima smo upravo govorili, na rezultate je mogla utjecali pojava
instrumentacije. U početku, osobito ako opaža nju nije prethodilo uvježbavanje, opažači možda nisu
zamjećivali ili tumačili određene geste kao oblike prosocijalnog ponašanja, da bi tek naknadno,
upoznajući bolje situaciju, širili lepezu takvih pokazatelja. Dakako, kasnija razlika u broju opaženih
pokazatelja možda je posljedica isključivo 135 izoštravanja i povećavanja osjetljivosti mjernih
instrumenata, u ovom slučaju ljudi - procjenjivača. Međutim, to nije i jedina situacija u kojoj dolazi
do instrumentacije. Ako istraživanja obavljamo longitudinalno koristeći se pritom upitnikom koji
stalno usavršavamo (dodajući metrijski bolje i odbacujući slabije čestice), barem dio uočenih
promjena odražava: će razlike do kojih dolazi zbog preinaka na instrumentima.
Zamislimo istraživanje u kojem mjerimo napredak u znanju učenika testom koji stalno dorađujemo,
popravljajući njegova metrijska obilježja. Samim usavršavanjem testa valja očekivati da će se
razlika između dobrih i loših učenika produbljivati jer će se test nadopunjavati česticama koje ih
bolje razlikuju, odnosno mjere znanje uz manji stupanj greške. Izbjegavanje instrumentacije postiže
se najbolje tako da se mjerni instrumenti, bilo da se radi o procjenjivačima, testovima ili upitnicima,
uvježbaju ili dorade i usavrše prije testiranja i potom za vrijeme eksperimenta ne mijenjaju. Dakako,
kao i koci prethodno opisanih prijetnji, kontrolna skupina je mjera koja takvu pojavu uklanja iz
rezultata, jer su joj na jednak način izloženi u kontrolnoj i eksperimentalnoj grupi.
Statistička regresija
Pojava da krajnji rezultati izmjereni na bilo koji način teže u ponovljenim mjerenjima vraćanju
prema prosjeku, naziva se statističkom regresijom. Do toga dolazi zbog veće opterećenosti greškom
izrazito visokih ili niskih rezultata, pogotovo ako je korišteni mjerni instrument niske pouzdanosti.
Ako, primjerice, primijenimo test znanja i razvrstamo učenike na one s osobito loši ma ili osobito
dobrim rezultatima, među njima će biti mnogo onih koji su, prema svojim pravim sposobnostima,
bliži prosjeku, ali su različiti slučajni činitelji pridonijeli većem odstupanju od očekivanih
vrijednosti (zastupljenost gradiva koje je učenik naročito dobro naučio ili uopće nije učio, umor ili
odmorenost, raspoloženje, gubitak koncentracije i sl.).
Pokažimo to izmišljenim primjerom. U tablici 6.3 rezultati desetorice ispitanika na primijenjenom
testu razloženi su na njihovo stvarno znanje i ono što se tome oduzima ili dodaje zbog različitih
slučajnih faktora (umor, raspoloženje, pokrivenost gradiva, sreća itd.). Nakon nekog vremena isti su
ispitanici testirani po drugi put. Dakako, faktori vezani uz trenutna raspoloženja ili sreću nisu tada
djelovali na isti način kao pri prvom testiranju. Njihovo osnovno određenje je upravo nesustavnost,
odnosno uvjetovanost slučajem.
135
134
91
Ivo V.
Valja uočiti razliku između aritmetičkih sredina prvog i drugog testiranja ispitanika koji su postigli
ekstremne rezultate. Uzmimo da su to tri najbolja i tri najslabija rezultata (osjenčani). Tri najbolja
ispitanika postigli su u prvom testiranju prosječan rezultat 84.3, a u drugome 73.0, dok su oni
najslabiji imali prosjeke 61.7 i 68.3. Do promjene je došlo isključivo zbog drukčijeg utjecaja
slučajnih faktora na136 rezultate. Isto bi se dogodilo i kad bismo kojim slučajem zamijenili raspored
testiranja te izabrali najbolje i najslabije na temelju drugog testiranja i gledali što se dešava u
prvome. Ponovno bismo se osvjedočili da prosječni rezultat najbolje trojice opada (sa 83.7 na 78.0),
a najslabije trojice raste (sa 62.3 na 66.3). Dakako, preduvjet za pojavu statističke regresije jest
nesustavni varijabilitet odnosno nepouzdanost rezultata. Da smo kojim slučajem bili u mogućnosti
savršeno izmjeriti znanje (pri čemu bi nesustavni faktori koji se pribrajaju i odbijaju uvijek bili
jednaki nuli), prosječne vrijednosti ekstremnih skupina uvijek bi bile iste (jednake stvarnim
prosječnim vrijednostima). Pristup opisivanju statističke regresije kao pojave koja počiva na grešci
mjerenja uobičajen je koliko i blizak svakodnevnom iskustvu. Međutim, nije dokraja točan.
Ispravnije je reći da se radi o sveprisutnoj pojavi uvijek kad nastojimo predvidjeti rezultate na
temelju nesavršene korelacije (manje od jedinice). Statistička regresija katkad je toliko teško
zamjetljiva da i iskusni istraživači upadaju u njenu zamku, zaključujući, naravno posve pogrešno,
da, primjerice, kazna popravlja ponašanje zločeste djece, nagrada nepovoljno utječe na dobru djecu,
dodatna nastava uvijek pomaže, a teškim duševnim bolesnicima stanje se popravlja samo od sebe. U
svakom od navedenih slučajeva, statistička regresija zaslužna je za veći dio promjena u naknadnom
mjeren ju. Zločesta djeca bila bi nešto bolja i bez kazne, ona osobito dobra malo će se "pokvariti"
unatoč nagradi, a stara je istina da se neurotičnim pacijentima stanje popravlja naoko samo od sebe
(Eysenck, 1952). Zapravo, ispravno je reći da većina stanja u koja zapadamo ovisi o mnoštvu
stabilnih, ali i mnoštvu nesustavnih čimbenika. Krajnost je najčešće rezultat izražene dispozicije ili
sposobnosti, ali i slučajnih faktora koji su se "posložili" tako da pridonesu ekstremnosti. O važnosti
fenomena137 svjedoči i izvrsna knjiga Campbella i Kennyija (\999) u kojoj su mu pristupili iz
različitih kuteva upozoravajući na sveprisutnost i zavodljivost pogrešnih zaključaka kojima vodi
statistička regresija.
Praktične posljedice zakona statističke regresije su da će ispitanici s ekstremnim rezultatima
postignuti ma u predispitivanju i bez utjecaja nezavisne varijable u drugom testiranju postići
rezultate prosječno bliže prosjeku (ekstremno visoki rezultati će se u prosjeku smanjiti, a ekstremno
niski povećati). Zbog toga je zaključak o različitom učinku neke nezavisne varijable na skupine s
ekstremnim rezultatima na nekom testu, često puta odraz isključivo statističke regresije. Općenito
govoreći, statistička regresija vodi povećanju rezultata osoba koje su u predispitivanju postigle
ekstremno niske vrijednosti i smanjenju rezultata onih s ekstremno visokim vrijednostima. Stupanj
136
135
137
136
92
Ivo V.
u kojem će ova pojava biti izražena ovisi o visini korelacije dvaju mjerenja (test-retest pouzdanosti
mjernog instrumenta) i udaljenosti rezultata od mjere središnje tendencije. Što je test-retest
korelacija manja, a rezultati udaljeniji od prosječne vrijednosti, to će statistička regresija biti
naglašenija. Želimo li ukloniti utjecaj prijetnji vezanih uz statističku regresiju, moramo osigurati da
ona podjednako djeluje u kontrolnoj i eksperimentalnoj skupini, odnosno da način izbora ispitanika
(njihova ekstremizacija) bude u oba slučaja jednaka.
Izbor ispitanika
Pristranost pri izboru ispitanika ozbiljna je prijetnja unutarnjoj valjanosti eksperimenta. O učincima
nezavisne varijable na zavisnu može se, naime, suditi samo onda kada postoje jamstva da se grupe
što se uspoređuju nisu razlikovale među sobom prije početka eksperimenta. Kako bi se na najmanju
moguću mjeru svela mogućnost pristranog izbora, najčešće se provodi tzv, slučaj na raspodjela u
skupine. Često nam, međutim, to ne dopuštaju praktične okolnosti. Pri ispitivanju uspješnosti neke
psihoterapije istraživač je obično \I prilici koristiti kao kontrolnu skupinu osobe koje se nalaze na
listi čekanja. Ako odluka o tome koji će pacijent bili podvrgnut psihoterapiji, a koji će biti ostavljen
na listi čekanja, počiva na slučajnom, probabilističkom izboru, unutarnja valjanost nije ugrožena.
Ako, međutim, postoje neki racionalni razlozi zašto nekome pružiti terapiju prije negoli nekom
drugom (primjerice, težina simptoma, nesklonost samog pacijenta ili čak ocjena primjerenosti za
pojedinu psihoterapiju), tada izbor ne može biti smatran nepristranim, što znači da ne postoje
jamstva o prethodnoj izjednačenosti grupa prema odlikama koje su mogle utjecati na ishod i
zaključke eksperimenta.
Uzmimo, primjerice, da smo se, svrstavajući ispitanike u kontrolnu i eksperimentalnu skupinu,
rukovodili njihovim stupnjem inteligencije. Inteligentnije osobe svrstali smo u eksperimentalnu, a
one manje inteligentne u kontrolnu skupinu. Pokaže li se da prva skupina nakon psihoterapije ima
manje psihičkih tegoba u138 usporedbi s kontrolnom skupinom, takav ishod ne moramo nužno
pripisati terapiji, već je to možda odraz inteligencije. Drugim riječima, psihičko stanje
inteligentnijih osoba možda bi se popravilo i u odsutnosti psihoterapije, zbog, primjerice, bolje
strategije suočavanja s problemima, većeg uvida u vlastito psihičko stanje ili bržeg rješavanja
praktičnih problema.
Osipanje ispitanika
Poznato je da dio osoba koji na početku pristupi nekom eksperimentu poslije iz različitih razloga
odustane (bolest, nedostatak vremena, zamor, monotonija ili sl.). Takvo osipanje ispitanika može
prouzročiti promjene u konačnim vrijednostima zavisne varijable nevezane uz utjecaj nezavisne
varijable. Ako je skupina opažana dva ili više puta tijekom trajanja eksperimenta, zamijećene
promjene u općem ponašanju mogu biti odraz odustajanja stanovitog broja osoba koje su postigle
rezultate pomaknute u određenom smjeru, jednako kao i posljedica same eksperimentalne
manipulacije. Isto tako, uspoređujemo li dvije po svemu izjednačene skupine, kontrolnu i
eksperimentalnu na početku nekog tretmana, a na kraju osobe iz kontrolne skupine usporedimo
samo s onima iz eksperimentalne koji u međuvremenu nisu odustali, ne možemo polagati pravo na
unutarnju valjanost takvog nacrta.
Uzmimo za primjer procjenu uspješnosti nove dijete u smanjivanju prekomjerne težine. U tretman
je uključeno 20 osoba koje su podvrgnute novoj dijeti, a 20 standardnoj dijeti. Skupine su
izjednačene prema broju kilograma i količini masnoga tkiva. Program stroge dijete traje šest
tjedana, međutim dio osoba iz eksperimentalne skupine odustaje. U konačnici, prosječan broj
skinutih kilograma veći je za eksperimentalnu nego za kontrolnu skupinu. Što možemo zaključiti o
uspješnosti nove dijeti? Zapravo ne mnogo. Da su, kojim slučajem, oni koji su odustali ustrajali na
dijeti, možda rezultati ne bi išli u prilog novoj dijeti. Možda su odustale upravo one osobe kod kojih
se nova dijeta nije pokazala učinkovitom. U svakom slučaju, preostale ispita nike ne možemo
smatrati reprezentativnim uzorkom eksperimentalne grupe (a time ni reprezentativnim uzorkom
populacije podvrgnute eksperimentu), pa je, na taj način, ugrožena i slučajnost raspodjele u skupine,
iako je ona na početku poštovana. U takvim slučajevima principijelnost nalaže da pokušamo
138
137
93
Ivo V.
testirati sve ispitanike eksperimentalne skupine bez obzira na to jesu li pohađali seanse ili nisu,
odnosno čak i ako su u međuvremenu odustali. "Nepravda" koju pritom činimo tretmanu svakako je
manje opasna od ugrožavanja unutarnje valjanosti zbog osipanja.
Interakcija s izborom ispitanika
Različiti aspekti interakcije s izborom ispitanika dolaze do izražaja onda kad pojedina od prethodno
navedenih prijetnji unutarnjoj valjanosti djeluje u kombinaciji sa sastavom skupina. U tom slučaju
dolazi do različitog djelovanja povijesti, 139 sazrijevanja, instrumentacije ili nekog drugog činitelja
na eksperimentalnu u odnosu na kontrolnu skupinu. Kažemo da povijest, sazrijevanje ili neka od
drugih prijetnji stupa u interakcija s izborom ispitanika. Interakcija povijesti i izbora ispitanika
očituje se onda kad skupine potječu iz različitih sredina i doživljavaju različita iskustva.
Ako različite obrazovne programe provjeravamo u dvjema lokalnim zajednicama, teško možemo
kontrolirati specifična iskustva koja doživljavaju djeca iz jedne zajednice u odnosu na onu iz druge.
Isto tako, ako se proučava neka nastavna metoda, uspješnost eksperimentalne ili kontrolne skupine
može ovisiti o interakciji te metode i nastavnika koji je prakticira. Ako pak proučavamo utjecaj
kazne i nagrade na usvajanje poželjnog ponašanja u djece, možemo doći do zaključka da je kazna
učinkovitija kod manje inteligentne, a nagrada kod inteligentnije djece. Do interakcije izbora
ispitanika i sazrijevanja može doći kad, primjerice, testiramo djecu nekim razvojnim testom
(inteligencija, sposobnosti), ali tako da eksperimentalnu i kontrolnu skupinu ne testiramo istodobno,
već s vremenskim pomakom (primjerice, dva ili tri tjedna). U tom je slučaju moguće da razlike
među njima budu plod, ne djelovanja nezavisne varijable, već duljeg vremena sazrijevanja jedne od
skupina. Do takve interakcije, međutim, može doći i onda kad jedna od grupa posjeduje izraženije
neko obilježje koje jamči brže sazrijevanje. Primjerice, inteligentnija grupa će brže sazrijevati bez
obzira na tretman, dok će ona fizički spretnija ovladavati motoričkim vještinama brže, također
neovisno o intervenciji. Interakcija izbora ispitanika s instrumentacijom nije toliko učestala, iako i
do nje može doći ako se o tome ne vodi računa. Na primjer, kad bismo promatrali učinke igranja
računalne igre koja sadrži nasilje na dječje ponašanje, a pritom zavisnu varijablu operacionalizirali
kao broj registriranih agresivnih akata, morali bismo paziti da procjenjivači zaduženi za K i E grupu
budu podjednako uvježbani u svojoj zadaći. U slučaju nejednake uvježbanosti moglo bi se dogoditi
da razlika između grupa u konačnici više ovisi o "izoštrenosti" ljudskih mjernih instrumenata nego
o učincima nezavisne varijable.
Difuzije ili imitacija tretmana
Do difuzije ili imitacije tretmana dolazi obično onda kad su ispitanici iz kontrolne skupine ti
mogućnosti komunicirati s ispitanicima iz eksperimentalne, ali također i u svim drugim slučajevima
u kojima je, ne samo eksperimentalna, već i kontrolna skupina zbog određenog propusta, izložena
učinku nezavisne varijable. U slučaju međusobne komunikacije pripadnika različitih skupina, neke
od specijalnih uputa ili poduka namijenjena samo eksperimentalnim uvjetima može postati
zajednička i kontrolnim uvjetima, što, dakako, ugrožava unutarnju valjanost eksperimenta. Ako
bismo, primjerice, htjeli provjeriti kako utječu različite informacije na stavove, morali bismo vrlo
dobro paziti ela osobe iz eksperimentalne i kontrolne skupine ne dođu u dodir tijekom
eksperimenta. U protivnom, informacije namijenjene140 samo jednoj skupini saznat će i oni iz druge.
Do slične pojave došlo bi također u slučaju da provjeravamo kako podučavanje o zdravom životu
utječe na smanjenje krvnožilnih bolesti. Eksperimentalna skupina slušala bi predavanja kao
nezavisnu varijablu, ali nitko ne bi mogao zajamčiti da i ispitanici kontrolne skupine ne dobivaju
iste ili slične informacije kroz sredstva javnog priopćavanja u kojima se upravo provodi kampanja
za zdraviji život. Difuzija tretmana vodi grešci umjetnog smanjivanja učinka neke intervencije.
Izvori nevaljanosti u kontrolnoj skupini
Određene pojave u kontrolnoj skupini također mogu proizvesti umjetno smanjenje ili povećanje
učinaka nezavisne varijable. Među izvore nevaljanosti mogu se ubrojiti kompenzacijsko
139
138
140
139
94
Ivo V.
izjednačavanje, suparništvo s eksperimentalnom skupinom i obeshrabrenje zbog primanja manje
poželjnog tretmana.
Kompenzacijsko izjednačavanje dio je nastojanja da se kontrolnoj skupini na neki način nadoknadi
uskraćivanje tretmana. To se najčešće dešava u bolnicama pri provjeri neke nove psihoterapijske
intervencije. Dok je eksperimentalna grupa obuhvaćena terapijom koja se općenito smatra
poželjnom, pripadnicima kontrolne skupine ona se uskraćuje, ali im se to obično nadoknađuje
nekim drugim povlasticama (novcem, češćim pregledima, pojačanom njegom ili sl.). Premda to nije
isto što i terapija, takve kompenzacije mogu imati terapijske učinke, što, dakako, ugrožava
unutarnju valjanost prividno smanjujući učinke psihoterapije.
U nekim slučajevima, kad se javno objave organizacije koje sudjeluju u eksperimentu kao kontrolna
i eksperimentalna skupina, dolazi do suparništva i međusobnog natjecanja. Kontrolna skupina, od
koje se u pravilu očekuje slabiji učinak, može biti motivirana smanjiti razliku ili čak izokrenuti
očekivane rezultate u odnosu na eksperimentalnu skupinu. U školama koje služe kao kontrola za
neki novi posebni program nastave može se javiti dodatna motivacija među nastavnicima kako bi
dokazali da su podjednako dobri kao i novi program. Poput kompenzacijskog izjednačavanja,
suparništvo također vodi urnjetnorn smanjenju utjecaja nezavisne varijable.
Osim pojačane motivacije, medu sudionicima kontrolne grupe može se pojaviti i rezignacija zbog
uskraćivanja poželjnog tretmana. U tom slučaju njihov učinak, zbog negativnih očekivanja, opada
i ispod onoga što bi pružili. ne znajući da im je tretman uskraćen. Zbog nerealno slabih rezultata
kontrolne grupe, u takvom slučaju može doći do precjenjivanja učinaka tretmana.
6.5.3 KONSTRUKTNA VALJANOST
Briga za konstruktnu valjanost započinje onog trenutka kad se prestanemo baviti pitanjem unutarnje
valjanosti. Međusobna isprepletenost konstruktne i unutarnje valjanosti zahtijeva, međutim, da
pobliže raščlanimo njihov odnos i značenje.141
U nutarnja valjanost nam omogućuje da s visokim stupnjem sigurnosti zaključimo kako se
promjene opaženog ponašanja (zavisne varijable) odvijaju zbog eksperimentalne manipulacije
nezavisnom varijablom, a ne niza drugih činitelja koji su do takvih promjena mogli dovesti u
slučaju slabije kontrole, Nasuprot tome, konstruktna valjanost se odnosi na tumačenje biti uzročne
veze utvrđene eksperimentom. Do greške dolazi ako nezavisna varijabla u sebi sadrži više od
jednog konstrukta (što je, kako smo ranije pokazali. teško moguće izbjeći), a mi za promjenu
zavisne varijable proglasimo zaslužnim onaj ili one koji to zapravo nisu.
Uzmimo, primjerice, da se razlike zabilježene u dvokratnom mjerenju nekog ponašanja, ili one
uočene pri usporedbi kontrolne i eksperimentalne skupine nisu nastale kao posljedica povijesti,
sazrijevanja, instrumentacije ili neke druge prijetnje unutarnjoj valjanosti, već ih možemo pripisati
nezavisnoj varijabli. Još uvijek, međutim ne znamo čemu zapravo pripisati promjenu. To je pitanje
ključno za konstruktnu valjanost. Prisjetimo se rasprave s početka o ulozi konstrukata u izgradnji
teorija i važnosti provjere primjerenosti nezavisne i zavisne varijable. Provodeći eksperiment,
obično se ne bavimo izravno zamjetljivim varijablama, već konstruktima čiju operacionalizaciju
one predstavljaju. Čak i kad mislimo da svojim eksperimentom zaobilazimo "teorijske vode", može
se pokazati da griješimo. Vidjet ćemo u nastavku kako su eksperimentatori jednog čuvenog
istraživanja bili u zabludi misleći da je njihova nezavisna varijabla intenzitet rasvjete i fizički uvjeti
rada. Bila je zapravo mnogo više od toga, što nam nalaže da si uvijek iznova postavimo pitanje:
"Što je nezavisna142 varijabla i zbog čega, kojim mehanizmom, ona dovodi do promjene?" Oba
pitanja dotiču se bitnih aspekata konstruktne valjanosti. Počiva li veza između nezavisne i zavisne
varijable na onom konstruktu (objašnjenju) koje je pružio autor ili su mehanizmi promjene možda
posve drukčiji? Konstruktna valjanost propituje održivost pretpostavljenog uzroka odnosno
teorijskog tumačenja uzročne veze eksperimentalne manipulacije i promjene u ponašanju. Takva
su pitanja izrazito važna jer prevođenje nekog teorijskog konstrukta u oblik dohvativ iskustvu
141
140
142
141
95
Ivo V.
(postupak koji smo nazivali operacionalizacijom) nikad nije dokraja savršeno. Svaka je
operacionalizacija donekle manjkava (preuska) u odnosu na konstrukt što ga predstavlja, a
istodobno i preširoka jer sadrži neke, za konstrukt, nebitne sastavnice.
Pogledajmo kakvu važnost ima pitanje konstruktne valjanosti pri provođenju eksperimenta. Naše
tumačenje ishoda eksperimenta koje se oslanja na utjecaj određenog konstrukta može nerijetko biti
problematizirano. Obično kažemo da je eksperiment pomiješao ili pobrkao istinske uzroke
promjene. Do toga dolazi ako je u intervenciji sadržana sastavnica koja nije dio izučava noga
konstrukta, odnosno nije dio psihologijske osobine ili procesa kojem istraživač pripisuje opažen i
utjecaj na zavisnu varijablu.
Jedno od prvih i vjerojatno najpoznatije istraživanje koje se suočile s problemom konstruktne
valjanosti eksperimenta provedeno je tijekom dvadesetih i tridesetih godina ovoga stoljeća u
pogonu izrade releja zvanom Hawthorne kompanije Western Electric (Roethlisberger i Dickson,
1939). Skupina istraživača predvođena Eltonom Mayoni ispitivala je načine kojima bi unaprijedili
proizvodnju u elektrani. Proučavajući vezu između intenziteta rasvjete i produktivnosti, došli su do
neočekivanih nalaza. Kakve god bi mjere poduzeli, proizvodnja bi rasla. Da apsurd bude veći,
produktivnost je rasla i onda kad bi istraživači smanjili intenzitet svjetla vidljivo ispod optimalne
razine. Drugim riječima, produktivnost je rasla neovisno o promjenama rasvjete. Porast
proizvodnje bilo je moguće pripisati, ne promjenama u osvjetljenju, koje su trebale predstavljati
nezavisnu varijablu, već općenito povećanoj pozornosti i brizi za radnike tijekom studije.
Da su istraživači, kojim slučajem, zaključili da na produktivnost utječe intenzitet rasvjete,
istraživanje bi bilo konstruktno nevaljano, jer, premda je intervencija utjecala na povećanje
proizvodnje, agens koji je bio istinski mehanizam promjene nije bilo variranje intenziteta
osvjetljenja, već pojačana briga za radnike, kojom su popraćene manipulacije nezavisnom
varijablom.
Pitanje konstruktne valjanosti usko je povezano s pojmom artefakta u eksperimentu, o kojem će
više riječi biti nešto kasnije. Pod pojmom artefakta podrazumijeva se krivo protumačeni nalaz
eksperimenta u kojem agens promjene nije izučavani konstrukt, već nebitna sastavnica tretmana
koja nije u dovoljnoj mjeri kontrolirana.143
U kategoriju artefakata ponajprije se ubrajaju greške vezane uz ljudsku dimenziju eksperimenta,
bilo da se radi o eksperimentatoru, ispitanicima ili njihovu međuodnosu. Premda čine prirodnu
cjelinu, pojmovi konstruktne valjanosti i artefakta zbog svoje su važnosti obrađeni zasebno.
143
142
96
Ivo V.
Značajke povezane s eksperimentalnom manipulacijom koje poslije mogu ugroziti zaključke o
prirodi uočenih promjena opažanog ponašanja nazivaju se prijetnjama konstruktnoj valjanosti.
Jedne od njih odnose se na situacije u kojima bilo zavisna bilo nezavisna varijabla manjkavo i
nedostatno predstavljaju izučavani konstrukt, a druge na one eksperimente u kojima uporabljene
operacionalizacije sadrže, u odnosu na izučavani konstrukt, teorijski nevažne sastojke. U prvom
slučaju varijabla ne sadržava sve bitne sastavnice proučavanog konstrukta, pa se takve prijetnje
podvode pod opći naziv nedovoljne predstavljenosti konstrukta, dok se u drugom slučaj li radi o
suvišku nevezanom uz konstrukt.
6.5.3.1 PRIJETNJE KONSTRUKTNOJ VALJANOSTI
Jednostruka operacionalizacija
Pristranost zbog jednostruke operacionalizacije može postati prijetnja valjanosti zbog nedovoljne
reprezentacije konstrukta i sadržanih nevažnih sastojaka koji u tom slučaju više dolaze do izražaja.
Pod jednostrukom operacionalizacijom smatra se definiranje bilo nezavisne bilo zavisne varijable
na temelju samo jednog pokazatelja. Svođenje opažanog ponašanja na samo jedan pokazatelj rijetko
ima opravdanja, jer dodatni pokazatelji ne otežavaju eksperimentalni postupak. Ako smo,
primjerice, odlučili ispitati utječe li intenzivno učenje potpomognuto suvremenim nastavnim
pomagalima na razvoj inteligencije u djece, bit će dobro da inteligenciju definiramo 144 većim
brojem testova ili preciznije odredimo zavisnu varijablu. U protivnom se može dogoditi da dođemo
do zaključka kako učinak postoji, iako smo ga zapravo potvrdili samo na, primjerice, bogatstvu
rječnika kao mjeri verbalne inteligencije. Ilustrirajmo takav slučaj slikom (6.6).
Uočavamo da nezavisna varijabla djeluje tek na jedan aspekt inteligencije, dok o drugima ne
posjedujemo nikakve informacije. Želimo li učiniti naš nacrt konstruktno valjanim, odredit ćemo
zavisnu varijablu kao bogatstvo rječnika ili ćemo među pokazatelje dodati veći broj različitih mjera
inteligencije.
Jednakih problema možemo imati i prilikom jednostrukog ili preuskog određenja nezavisne
varijable. U nastojanju da odredimo utječe li tjeskobnost na altruističko ponašanje, odnosno
priskakanje drugima u nevolji, možemo se naći u nedoumici kako definirati tjeskobnost, jer ona
zasigurno ima mnogo aspekata. U čuvenim Schachterovim (1959) eksperimentima, tjeskobnost je
izazivana pokazivanjem velikih injekcija ili najavom snažnih elektro-šokova. No je li u tom slučaju
riječ o strahu ili tjeskobnosti? I nadalje, ponašaju li se ljudi isto kad su nervozni zbog prometne
gužve, predstojećeg ispita ili sjedenja u zubarskoj čekaonici? Zbog toga je uvijek preporučljivo
sasvim jasno odrediti nezavisnu varijablu kako ne bi došlo do pomutnje i konstruktne nevaljanosti.
No do jednostrukog određenja nezavisne varijable može doći i na drugi način. Provjeravamo li
uspješnost nove nastavne metode za usvajanje gradiva iz određenog područja, moramo paziti da
144
143
97
Ivo V.
upravo ona bude ono što razlikuje eksperimentalnu od kontrolne skupine. Ako novu metodu
usporedimo sa starom tako da ih koristi isti nastavnik s različitim učenicima, postoji opasnost da
jedna od metoda (obično ona nova) bude slabije reprezentirana zbog nedovoljne uvježbanosti
nastavnika. U tom slučaju opažena razlika u naučenom gradivu jedne od skupina može biti odraz,
ne same metode, već stupnja u kojem je nastavnik njome ovladao. Ako u istu svrhu istraživanje
organiziramo s dva nastavnika, konačan rezultat može biti odraz kvalitete nastavnika, a ne metode.
U tome je slučaju nezavisna varijabla također jednostruko definirana jer je provodi svega jedan
nastavnik. Jedini ispravan pristup takvom problemu je istraživanje u kojem bi najmanje dva (a po
mogućnosti i veći broj) nastavnika sudjelovala u poučavanju objema metodama. Tom bi se
prilikom, na temelju analize varijance, moglo utvrditi koji je nastavnik bio (naj)bolji, koja nastavna
metoda je učinkovitija i postoji li interakcija nastavnika i metode (odnosno koliko kojem nastavniku
"leži" određena metoda). No za konstruktnu je valjanost u konkretnom slučaju najvažnije da metoda
i nastavnik nisu nerazdruživi, odnosno da nezavisna varijabla nije opterećena nastavnikovom
osobnom jednadžbom.
Korištenje manjeg broja podražajnih situacija kojima je određena nezavisna varijabla prijetnja je
podjednako vanjskoj i konstruktnoj valjanosti. Želi li istraživač uopćiti vlastite rezultate, primjerice
na cijelu populaciju nastavnika, tada je mali broj145 nastavnika koji su sudjelovali u istraživanju
problem vanjske valjanosti. Želi li, međutim, utvrditi zašto je do boljeg učenja došlo, obraća se
konstruktnoj valjanosti jer nije u mogućnosti odvojiti proučava ni konstrukt (nastavnu metodu) od
uvjeta u kojima se primjenjuje (nastavnik).
Višestruki tretmani
Osobito u primijenjenoj psihologiji vrlo su uobičajene intervencije koje čini veći broj sastavnica.
Primjerice, terapijski se tretman može sastojati od upoznavanja, razumijevanja, savjetovanja,
pružanja podrške, ohrabrivanja, zadavanja zadaća i drugog. Program za prevenciju ovisnosti može
sadržavati savjetovanje, besplatna predavanja, televizijske emisije, publikacije, otvaranje centara za
rekreaciju ili zabavu i sl. U takvim situacijama, konstruktna je valjanost posebno ugrožena jer smo
tek rijetko kadri prepoznati stvarni agens promjene. Konačnom učinku, naime, mogu pridonijeti sve
tretmanske sastavnice, samo neke od njih, kao i njihove različite interakcije. Teorijski gledano,
takva je situacija nezavidna, jer je prepoznavanje konstrukta zaslužnog za promjene izuzetno
otežano.
Međudjelovanje kod višestrukih tretmana razmjerno je često ako se ispitanicima izmjenjuje više
različitih tipova intervencija. i anje koje se nameće jest koliko je moguće izvlačiti zaključke o
tretmanu koji se primjenjuje u kontekstu drugog tretmana? Pitanje o jednom tretmanu moglo bi,
stoga, biti ograničeno uporabom drugog tretmana. Uzmimo za primjer program poboljšanja općeg
fizičkog stanja organizma. Recimo da su programu dvomjesečnog vježbanja prethodila dvotjedna
predavanja o tome kako treba pravilno vježbati, hraniti i zdravo živjeti. Ako je konačni rezultat
povoljan za one koji su sudjelovali u programu (bolje fizičko stanje), mi ga ne možemo automatski
pripisati programu vježbi, čak i znajući da početna predavanja sama za sebe nisu postigla nikakve
učinke. Moguće je, naime, da bi učinci fizičkih vježbi bili bitno manji kad im ne bi prethodila
teorijska predavanja, odnosno da je za konačan rezultat u nekoj mjeri odgovorna interakcija
nezavisnih varijabli.
No problem višestrukih tretmana, odnosno preširoko određene nezavisne varijable koja sadrži
teorijski "suvišak" može biti i mnogo trivijalniji. Uzmimo da nastojimo pronaći najbolji način za
liječenje glavobolje. Naša se terapija, recimo, sastoji u ispijanju velike količine ruskog čaja,
uzimanju oveće doze C vitamina, umivanju hladnom vodom i - tableti aspirina. Utvrdimo li
učinkovitost lako osmišljene terapije, hoće li to biti zeleno svjetlo za njenu širu primjenu? Dakako
da neće. U našem pomalo karikiranom primjeru vjerojatno jedini djelatni terapijski sastojak je
aspirin, dok su ostali najvjerojatnije nepotrebni suvišak. Naša je nezavisna varijabla u tom slučaju
preširoko određena, a jedini način da dođemo do teorijski relevantne spoznaje jest uporaba
145
144
98
Ivo V.
strategije razlaganja kako bismo uzročnu vezu terapije i pozitivnog ishoda sveli isključivo na
stvarni agens promjene.146
Prijetnje vezane uz sudionike u eksperimentu147
Reaktivnost na eksperiment isključiva je posljedica svijesti ispitanika o tome da sudjeluju u
istraživanju. Sama spoznaja o tome može promijeniti njihovo uobičajeno ponašanje i navesti ih da
se ponašaj u neprirodno ili da nastoje udovoljiti eksperimentatorovim očekivanjima. Valjanost
eksperimenta zbog toga je ugrožena jer nije zajamčeno da bi rezultati bili isti i u slučaju da
ispitanici ne znaju za eksperiment. U istraživačkoj praksi često se puta dešava da rezultati nisu
istovjetni u studijama u kojima je ispitanicima poznato da sudjeluju u eksperimentu u odnosu na
one u kojima takvih spoznaja nema. Za prividno bolje učinke prvih studija vjerojatno su zaslužna
pozitivna očekivanja i nastojanje da se udovolji istraživaču.
Pažnja i odnos prema ispitaniku u mnogim slučajevima mogu ugroziti naše zaključke o stvarnim
uzročnicima promjene zavisne varijable. Njima možemo pripisati već opisani hothornski učinak,
ali ga još češće susrećemo u nizu istraživanja provedenih na kontrolnoj i eksperimentalnoj skupini.
Intervencija je, naime, mogla biti uspješna i donijeti razlike između eksperimentalne i kontrolne
skupine, ne zbog njenih specifičnih odlika, već zbog pojačane brige i pažnje koja je uz nju pružena
ispitanicima eksperimentalne skupine.
Uz mimo za primjer psihoterapiju čija se uspješnost provjerava u odnosu na skupinu pacijenata s
liste čekanja. Pritom nas zanima utječe li terapija onim svojim dijelom kojim se razlikuje od niza
drugih psihoterapija. Ako nakon provedene psihoterapije i uočimo razliku u psihičkom stanju
eksperimentalne i kontrolne skupine, ne možemo biti sigurni' da je upravo taj dio intervencije
proizveo takav učinak. U takvim slučajevima aktualiziraju se neke prijetnje unutarnjoj valjanosti
(primjerice, obeshrabrenje), ali se istodobno javljaju i ozbiljne prijetnje konstruktnoj valjanosti.
Provedena je psihoterapija, naime, mogla biti uspješna, ne zbog specifičnih elemenata koje sadrži,
već zbog povoljnog djelovanja redovitog ljudskog kontakta, odnosno elementa koji ni po čemu nije
specifičan samo izučavanom psihoterapijskom pravcu. Da bismo takve prijetnje izbjegli, uz
klasičnu kontrolnu skupinu potrebno je u istraživanje uključiti i jednu koja ostvaruje redovite
kontakte s terapeutom, ali bez intervencije specifične za izučavanu psihoterapiju (tzv. placebo
grupu). Potrebno je, naime, biti svjestan da psihoterapija sadrži više od jednog, onog teorijski
važnog, elementa. Cook i Campbell (1979) nazivaju ovu prijetnju nagađanjem pretpostavki unutar
eksperimenta, koje ispitanicima nude mogućnost da se ponašaju u skladu s očekivanjima. Ovaj tip
prijetnje konstruktnoj valjanosti prisutan je u svim istraživanjima u 148 kojima pažnja, briga, samo
susreta nje s ispitanicima ili njihova očekivanja mogu dovesti do promjene izučavanog ponašanja.
Ako istraživač želi dokazati da je učinke proizveo upravo onaj dio intervencije vezan uz izučavani
teorijski konstrukt, činitelje poput pažnje ili kontakta kao moguće agense promjene mora logički
isključiti.
Eksperimentatorova očekivanja često puta utječu na ponašanje ispitanika, čak i onda kad za to ne
postoji nikakva svjesna namjera. Očekivanja se mogu očitovati na različite načine, kroz promjenu
tona glasa, izraz lica, način čitanja uputa ili pridržavanje pravila postupka. Učinak očekivanja
ozbiljna je prijetnja konstruktnoj valjanosti jer često nudi uvjerljivo objašnjenje za promjenu u
ponašanju, prvotno pripisanu eksperimentalno] manipulaciji. Eksperimentatorova očekivanja su,
prema tome, poseban slučaj događaja vezanih uz eksperimentalnu intervenciju ali nevezanih uz
istraživani konstrukt.
Strah od vrednovanja mogući je izvor konstruktne nevaljanosti jer je potreba za dobrim
samopredstavljenjem svojstvena većini ljudi. Takva je potreba osobito naglašena u situacijama
procjene od strane stručnjaka psihologa, kad su ispitanici posebno motivirani da se prikažu u
146
145
147
U narednom odjeljku samo je dotaknuta tema prijetnji konstruktnoj valjanosti vezanih uz sudionike u eksperimentu.
Opsežniji prikaz dan je u poglavlju o eksperimentalnom artefaktu. Razlog za izdvajanje ove teme iz njene prirodne
cjeline jest želja da se ovoj iznimno važnoj tematici da primjereno i izdvojeno mjesto.
148
146
99
Ivo V.
povoljnijem svjetlu. U tom slučaju potreba za boljim samoprikazivanjem može utjecati na ishod
eksperimenta. Ispitanici se ponašaju u skladu, ovaj put ne s eksperimentatorovim očekivanjima, već
s onim što vide kao društveno poželjno. Budući da to najčešće nije konstrukt od interesa u većini
eksperimenata, radi se o prijetnji konstruktnoj valjanosti.
6.5.4 VANJSKA VALJANOST
Vanjska valjanost je stupanj u kojem se nalazi nekog eksperimenta mogu proširiti na populacije,
okolnosti i uvjete drugačije od onih pod kojima su dobiveni. U pravilu, rezultati eksperimenta nisu
nam osobito korisni ako ih ne možemo uopćiti na neku širu populaciju ili na ponešto izmijenjene
uvjete u odnosu na one što smo ih imali u laboratoriju. Eksperimentom nastojimo upoznati neke
općevažeće zakonitosti na temelju ograničenog broja opažanja. Takav pristup u znanosti je jedino i
moguć jer zasigurno nikada nećemo biti u mogućnosti ispitati vlastite pretpostavke na cjelokupnoj
populaciji ili u svim zamislivim uvjetima. Vanjska valjanost okuplja pitanja koja se odnose na
mogućnost uopćavanja eksperimentalnih nalaza. Sve što bi moglo ograničiti takvo uopćavanje
smatra se prijetnjom vanjskoj valjanosti.
6.5.4.1 PRIJETNJE VANJSKOJ VALJANOSTI
Vanjsku valjanost ugrožavaju različite vrste interakcija tretmana s načinom odabira ispitanika ili
uvjetima kakvi vladaju u eksperimentu. Primjerice, kad zaključujemo o učinkovitosti psihoterapije
testirane na dobrovoljcima, možda zanemarujemo149 međudjelovanje tretmana i njihove atipičnosti,
očitova ne poglavito u naglašenoj motivaciji za sudjelovanjem. Sličan oprez nalažu i posebne
okolnosti u kojima su rezultati dobiveni. Primjerice, pokaže li se da je neka metoda usvajanja
vještina učinkovita u vojnoj obuci, to ne mora jamčiti jednaku djelotvornost u radnoj organizaciji,
čak i kad se radi o istim osobama. Različite sredine nameću različite zahtjeve i aktiviraju različite
motive, što vodi uvijek posebnoj interakciji s tretmanom.
6.5.4.2 VRSTE VANJSKE VALJANOSTI
Uobičajeno je da se nalazi uopćavaju na različite osobe, situacije i vremena u odnosu na ona
svojstvena konkretnom eksperimentu. Otuda i podjela na:
1. Populacijsku valjanost.
2. Ekološku valjanost.
3. Temporalnu valjanost.
Populacijska valjanost
Pri provođenju istraživanja uvijek nas zanima vrijede li utvrđene zakonitosti u podjednakoj mjeri i
za osobe različite po spolu, dobi, obrazovanju, nacionalnosti ili drugim obilježjima od sudionika
obuhvaćenih eksperimentom. Strogo gledano, eksperimentom se dokazuje učinkovitost tretmana na
određenom uzorku. Umjesno je stoga pitanje u kojoj se mjeri dobiveni rezultati mogu proširiti i na
populacije različitih obilježja. Koliko se, primjerice, nalazi dobiveni na studentima mogu primijeniti
na starije osobe, koliko oni dobiveni na pripadnicima jedne etničke skupine na neku drugu, ili
koliko oni prikupljeni na obrazovanima vrijede za osobe niže obrazovne razine. U pravilu, takvo što
ne možemo znati prije negoli rezultate pokušamo provjeriti i na uzorcima iz različitih populacija.
No slijepo eksperimentiranje i ponavljanje studije na uvijek ponešto različitim uzorcima ne bi nam
priskrbilo odveć veliku korist.
Pri ponavljanju je uvijek dobro predvidjeti moguće razlike (primjerice, da će žene reagirati na
tretman različito od muškaraca), ali također i zašto takvo što očekujemo (primjerice, stoga što
slobodnije iskazuju čuvstva). Osim problema uopćavanja s jedne populacije na drugu, dodatni je
problem reprezentativnost uzorka za izučavanu populaciju. Ako je uzorak prigodan jer uključuje
samo one koji pristaju na određeni eksperiment, imaju dovoljno vremena ili im je potreban novac,
uvijek postoji velika opasnost da se radi o pristranom uzorku, čija svojstva ne odgovaraju populaciji
koju bi trebao predstavljati. U tom slučaju rezultate neće biti moguće uopćiti niti na cijelu
populaciju iz koje je uzorak izvučen, da o drugim populacijama ine govorimo. Prema Brachtu i
149
147
100
Ivo V.
Glassu (1968), valja razlikovati ciljnu populaciju od populacije dostupne eksperimentu. Prva je
ona na koju se rezultati nastoje uopćiti (primjerice, studenti), a druga ona koja je istraživaču stajala
na raspolaganju (na primjer, studenti150 nekog konkretnog fakulteta). Pitanje reprezentativnosti za
dostupnu populaciju rješava se probabilističkim uzorkom, dok je uopćavanje na ciljnu populaciju
mnogo ozbiljniji i nikad dokraja rješiv problem, Valja reći da velik broj eksperimentalnih
istraživanja ne uspijeva postići ni reprezentativnost u odnosu na dostupnu populaciju, već se temelji
na posve prigodnim uzorcima. Poseban problem psihologijskih istraživanja je učestalo uključivanje
studenata na temelju čijeg ponašanja se nastoje izvlačiti dalekosežni zaključci o cjelokupnoj (ne
samo studentsko] populaciji). McNemar je na taj problem upozorio još daleke 1946., tvrdeći da se
znanost o ljudskom ponašanju temelji na izučavanju ponašanja studenata. Situacija se otada nije
znatnije mijenjala. Primjerice, od sedamdesetih godina naovamo čak u sedamdeset ili više posto
studija su studenti uključivani kao ispitanici (Christensen, 1997). Sears (1986) je pokazao da
studenti u odnosu na opću populaciju imaju veće kognitivne sposobnosti, manje izgrađenu
samosvijest, u većoj mjeri naginju pokoravanju autoritetu, i posjeduju mnoštvo drugih razlikovnih
obilježja. Zbog svega toga mogućnost uopćavanja tako dobivenih nalaza je ograničena, o čemu
istraživači svakako moraju voditi računa.
Ekološka valjanost
Premda često zapostavljan, problem mogućnosti uopćavanja nalaza na drukčije okolnosti od onih
koje su bile zastupljene u eksperimentu, podjednako je ozbiljan kao i uopćavanje s jedne populacije
na drugu.
Odlike situacije (interakcija okolnosti i tretmana) - Nije svejedno provodimo li istraživanje na
fakultetu, laboratoriju ili klinici. Svaka od institucija ima svoje posebnosti koje ispitanika stavljaju u
sklop specifičnih okolnosti. Zakonitosti utvrđene u jednim okolnostima, ne moraju važiti i u
drugima. Ispitujemo li određenu vrstu psihoterapije, ona može pokazivati različitu djelotvornost
provodimo li je u ambulanti ili na bolničkom odjelu. Situaciju i okolnosti ne čini, međutim, samo
prostor. Ovamo spada i čitav niz drugih činitelja koji mogu ograničiti vanjsku valjanost neke
studije. U kliničkoj praksi na uspješnost tretmana među ostalim, znatno utječu terapeut, tip
problema i vrsta intervencije (Kazdin, 1998). Poželjno je da se nalazi dobiveni u jednoj situaciji
pokušaju ponoviti i u drugima.
Drugo značenje pojma "ekološke valjanosti" odnosi se na pitanje vrijede li nalazi utvrđeni nekim
eksperimentom također i u stvarnim životnim okolnostima (Brewer, 2000). Takvom se dvojbom
problematizira značenje što ga nalazi, često naglašeno izvještačenih, pokusa imaju u svakodnevnom
životu. Mook (1983) je, međutim, pokazao da nalazi mogu biti važni i valjani čak i kad
eksperimentalna situacija ne nalikuje ničemu što bismo mogli sresti u svakodnevnom životu. Ipak,
vezu što bi je eksperiment trebao imati sa svakodnevnim životom ne treba podcjenjivati. Ako su
zakonitosti ponašanja u laboratoriju sve što nam istraživanje može ponuditi, treba iskreno
posumnjati u njegovu korisnost. U svakom slučaju, valja zaključiti151 kako sličnost sa stvarnim
životom nije za eksperiment neophodna, ali utvrđivanje nekih zakonitosti koje vrijede podjednako u
laboratoriju i stvarnosti svakako jest.
Temporalna valjanost
Na dobivene rezultate često utječu ne samo posebnosti ispitanika i situacije u kojoj se eksperiment
odvijao, već i vrijeme u kojem je proveden. To znači da se iz različitih razloga može dogoditi da
zakonitosti utvrđene u jednom eksperimentu prestanu vrijediti nakon nekog vremena. Do promjene
u povezanosti nezavisne i zavisne varijable dolazi zbog vremenski uvjetovanih varijacija trenutne
ili trajnije naravi.
U trenutne varijacije mogu se ubrojiti sezonske i cikličke promjene (Christensen, 1997). Prve
opisuju razlike do kojih dolazi u pravilnim i predvidljivim vremenskim intervalima, a zahvaćaju
populaciju u cjelini. Takve su varijacije uzrokovane izmjenom godišnjih doba, dana i noći, dana u
150
148
151
149
101
Ivo V.
tjednu itd. Primjerice, moglo bi se pokazati da je antidepresivna terapija učinkovitija ako započinje
u jesenjim mjesecima, a završava u proljetnim nego obratno. Poznato je, naime da sezonske
promjene utječu na stanja potištenosti i tjeskobe, koja su najizraženija za tmurnih jesenjih i zimskih
dana. Drugu vrstu trenutnih varijacija čine cikličke promjene koje se odvijaju unutar organizma.
Radi se poglavito o dnevnim (tzv. cirkadiurnim) ritmovima o kojima ovisi aktivnost i ponašanje
organizama.
Promjene trajnije naravi odvijaju se najčešće u jasno predvidljivom smjeru, mijenjajući ponašanje
pojedinaca zbog biološkog starenja ili društvenih promjena. Poznato je da se osobine ličnosti,
premda držane razmjerno stabilnima i vremenski postojanima, mijenjaju tijekom života pojedinca.
Starenjem, primjerice, osobe prosječno postaju više introvertirane i emocionalno stabilnije (Eysenck
i Eysenck, 1985). S druge strane, neke promjene na globalnoj, društvenoj razini mogu posve
izmijeniti prirodu ranije utvrđene povezanosti. Ponašanje koje je društveni ideal ili nametnuti
kulturalni okvir obično je povezano s konformizmom ili pribjegavanjem društvenoj poželjnosti,
Međutim, što ako se u međuvremenu društvena ideologija promijenila, kao što je to slučaj s
Hrvatskom od 1990. naovamo? U ranijim istraživanjima religioznost je bila negativno povezana s
društvenom poželjnošću (Milas, 1991), da bi novija istraživanja, posve logično, pokazala kako se
ona s vremenom prometnula u čvrstu pozitivnu povezanost (Milas, 1998). Stoga zaključak da su
društveno zagovara ne vrijednosti pozitivno povezane s društvenom poželjnošću ima temporalnu
vanjsku valjanost, ali ne i zaključak o prirodi veze poželjnosti i religioznosti.
6.5.4.3 NAČINI ZA POVEĆAVANJE VANJSIKE VALJANOSTI
Najsigurniji način da se odstrane prijetnje vanjskoj valjanosti jest višekratno provođenje
eksperimenta uvijek u ponešto izmijenjenim uvjetima ili na različitim 152 grupama ispitanika.
Populacijsku valjanost najbolje će zajamčiti izbor reprezentativnog uzorka iz proučava ne (cilj ne)
populacije (to npr. može biti populacija studenata, punoljetnog stanovništva, mlađih žena,
shizofrenih bolesnika ili djece između 8 i 12 godina). Nepristranost uzorka valjalo bi osigurati
probabilističkim (slučajnim) izborom ispitanika. :Temeljna je pretpostavka takve metode da svatko
iz populacije ima ne-nultu i poznatu vjerojatnost ulaska u eksperimentalnu ili kontrolnu skupinu. Uz
obraćanje pozornosti uzorku, potrebno je naglasiti i važnost ponavljanja istraživanja na različitim
ispitanicima, u različitim uvjetima i različitim vremenima. Robusnost nalaza na koju upućuje
neovisnost o specifičnim uvjetima u kojima su utvrđeni, najjasniji je pokazatelj vanjske valjanosti
istraživanja.
6.5.4.4 ODNOS RAZLIČITIH TIPOVA VALJANOSTI
Različiti vidovi eksperimentalne valjanosti često su međusobno suprotstavljeni, tako da unapređenje
jednoga znači smanjenje drugoga. Posebno se to odnosi na unutarnju i konstruktnu valjanost, s
jedne, i vanjsku, s druge strane. Unutarnju i vanjsku valjanost teško je pomiriti jer se nalaze u
obrnuto razmjernom odnosu. Naime, u nastojanju da popravi vanjsku valjanost, istraživač će,
provodeći eksperiment na različitim ispitanicima, raznovrsnim situacijama i u različitim
vremenima, ugroziti unutarnju valjanost jer će unijeti velik broj vanjskih utjecaja što će pridonijeti
umnažanju alternativnih pretpostavki o uzrocima promjene zavisne varijable. Usto će, zbog
povećanja nesustavne varijance (nastale kao posljedice heterogenosti ispitanika ili uvjeta
provođenja) smanjiti statističku snagu, otežavajući postupak dokazivanja djelotvornosti nezavisne
varijable. Stroga kontrola u eksperimentu koji se provodi na homogenoj skupini ispitanika u
umjetnom okružju laboratorija služi upravo smanjenju utjecaja vanjskih faktora i jačanju statističke
snage. Bez toga je često puta teško ili nemoguće dokazati utjecaj eksperimentalne varijable, što je
nedvojbeno najvažniji cilj svakog eksperimenta. Zaključimo stoga da je vanjska valjanost, premda
važna, sekundarna u odnosu na unutarnju, o čemu će još biti riječi prilikom usporedbe
eksperimentalnih i ne-eksperimentalnih istraživanja. Konstruktna valjanost u većini je slučajeva
podjednako važna kao i unutarnja. Uspješno provedeni eksperiment podrazumijeva, ne samo
dokazivanje učinkovitosti nezavisne varijable, nego pripisivanje utjecaja upravo konstruktu kojim
se bavimo. Značenje konstruktne valjanosti nešto je slabije u primijenjenim istraživanjima, koja su,
152
150
102
Ivo V.
ako se bave programskim "paketima", manje zainteresirana za pojedinačne učinke svake od
sastavnica, a više za cjelovitu djelotvornost. Premda često rabljen, takav pristup ne može se
preporučiti zbog teorijske kratkovidnosti i ograničenih spoznajnih dosega te se sve više odbacuje i u
praksi. U novije vrijeme podjednako teorijska i praktična istraživanja nastoje jasno prepoznati
"djelotvorne" konstrukte, izjednačavajući time važnost unutarnje i konstruktne valjanosti. Premda
"prezrena" u temeljnim znanstvenim istraživanjima, vanjska valjanost nalazi svoje mjesto u
primijenjenim153 projektima U kojima problem uopćavanja na dio populacije kojim se neka
intervencija bavi (bili to zločinci, narkomani, siromašni, nezaposleni ili drugi) nema stvarne
alternative i nužno ga je uzeti u obzir, čak i pod cijenu slabljenja unutarnje valjanosti.
6.5.5 EKSPERIMENTALNA VALJANOST U ODNOSU NA VALJANOST DRUGIH ISTRAŽIVAČKIH
METODA
Korisno je već sada napomenuti da se većina onog što je upravo rečeno o valjanosti može
podjednako dobro primijeniti i na druge istraživačke metode i nije oSigurano isključivo za
eksperiment. Zapravo je samo pojam unutarnje valjanosti neraskidivo vezan upravo i isključivo za
eksperimentalna i kvazi-eksperimentalna istraživanja. Drugi aspekti valjanosti, poput konstruktne,
vanjske i valjanosti statističkog zaključka u jednako], ako ne i većoj, mjeri utječu na upotrebljivost
nalaza neeksperimentalnih kvantitativnih istraživanja, korelacijskih, anketnih, opažačkih
nenametljivih.154
7. ISTINSKI EKSPERIMENTI
"Pripisivanje promjena u zavisnoj varijabli djelovanju nezavisne varijable najmanje je dvojbeno u
tzv. istinskim eksperimentima. Njih odlikuje mogućnost upravljanja nezavisnom varijablom,
početna izjednačenost eksperimentalne i kontrolne grupe ili, u slučaju nacrta unutar ispitanika,
primjereno uravnoteživanje različitih uvjeta s obzirom na redoslijed izlaganja, sve s ciljem da se
unutarnja valjanost uzdigne na najviši stupanj. U literaturi se takvi nacrti najčešće poistovjećuju s
153
151
154
152
103
Ivo V.
poštivanjem načela slučajnog raspoređivanja ispitanika u eksperimentalnu i kontrolnu grupu, što je
osnova za otklanjanje najvećeg broja prijetnji unutarnjoj valjanosti. Istinski eksperimenti je ideal
eksperimentalnog obrasca u kojem je kontrola vanjskih faktora na najvišoj razini. Slabija kontrola,
koja ne otklanja u potpunosti mogućnost da su na ishod donekle. ili presudno utjecali neki vanjski
faktori nevezani za nezavisnu varijablu, odlikuje kvazi-eksperimentalne nacrte, o kojima ćemo
govoriti u narednom poglavlju.
7.1 EKSPERIMENTALNI NACRTI

Kako bi provjerio vlastite hipoteze, istraživač usvaja plan istraživanja koji nazivamo
eksperimentalnim nacrtom. U njemu je sadržana opća struktura eksperimenta i okvirno su
naznačeni različiti segmenti, poput načina prikupljanja podataka, izbora ispitanika, provedbe
istraživanja i analize podataka. Jedna od osnovnih zadaća eksperimentalnog nacrta je kontrola svih
neželjenih izvora varijacije koja nam dopušta utemeljene zaključke o uzročnoj povezanosti
nezavisne varijable sa zavisnom. Pri odluci o tome koji će nacrt upotrijebiti istraživač se u najvećoj
mjeri rukovodi trima odrednicama. To su:155
1. broj nezavisnih varijabli
2. broj eksperimentalnih i kontrolnih uvjeta potrebnih za provjeru hipoteze
3. mogućnost ili nemogućnost izvođenja istraživanja na istim ispitanicima u svim
eksperimentalnim uvjetima
7.1.1 EKSPERIMENTALNI NACRT NA NEZAVISNIM GRUPAMA
Grupni nacrt vjerojatno je najčešće korištena eksperimentalna metoda u psihologiji. U njoj se
uspoređuju skupine ispitanika izložene različitim uvjetima kojima upravlja eksperimentator. Logika
nacrta je jasna i u osnovi slijedi Millovu metodu razlike. Ako su kontrolna i eksperimentalna grupa
usporedive (izjednačene) prema svim relevantnim odlikama prije samog eksperimenta, a tretirane su
potpuno jednako u svakom pogledu osim prema izloženosti eksperimentalnoj (nezavisnoj) varijabli,
tada se razlike među njima nakon intervencije mogu pripisati upravo djelovanju nezavisne varijable.
7.1.1.1 KONTROLNA GRUPA
Kontrolna grupa okuplja osobe koje nisu izložene nezavisnoj varijabli, ali po svemu drugom
odgovaraju osobama iz eksperimentalne skupine. Ona je nezaobilazan način da se uklone prijetnje
unutarnjoj, ali i konstruktnoj valjanosti u grupnim eksperimentalnim nacrtima. Njome se
kontroliraju prijetnje vezane za povijest, sazrijevanje, instrumentaciju, testiranje, statističku
regresiju, osipanje i neprikladnu operacionalizaciju nezavisne varijable. Takav se cilj ostvaruje pod
pretpostavkom da su kontrolnoj i eksperimentalnoj skupini osigurani posve isti uvjeti uz jedinu
razliku u stupnju izloženosti nezavisnoj varijabli. Usto se zahtijeva da skupine budu uparene ili
raspodijeljene po slučaju, što bi trebalo zajamčiti izjednačenost prema svim potencijalno važnim
individualnim osobinama. Moguće je razlikovati nekoliko temeljnih modaliteta kontrolnih grupa,
među kojima neki služe uklanjanju prijetnji unutarnjoj, a drugi konstruktnoj valjanosti.
Netretirana kontrolna grupa
Jedina razlika između eksperimentalne i netretirane kontrolne grupe jest prisutnost odnosno
izostanak tretmana (nezavisne varijable). U svakom drugom pogledu skupine moraju biti
izjednačene i s njima se postupa na posve jednak način. Uloga kontrolne grupe je dvojaka, ona
istodobno služi kao okvir za usporedbu i sredstvo provjere pretpostavki o utjecaju vanjskih faktora.
Pri nastojanju da utvrdimo djelovanje neke nezavisne varijable, potrebno se je najprije zapitati
koliko bi se opažano ponašanje promijenilo u odsutnosti bilo kakve intervencije. U pravo je to
osnovna zadaća netretirane kontrolne skupine.156
Pretpostavimo da želimo ispitati hoće li razgovor sa svećenikom smanjiti potištenost u vjernika.
Dokazujući da se osoba osjeća bolje svaki put nakon takvog razgovora, nije istodobno dokaz da do
toga dolazi upravo zbog razgovora. Moguće je naime da bi se potištenost smanjila sama od sebe jer
155
153
156
154
104
Ivo V.
je poznato da takva stanja u zdravoj populaciji nisu trajne naravi. Kontrolna grupa koja ne bi išla
svećeniku mogla bi služiti kao pokazatelj onoga što bi se dogodilo u odsutnosti razgovora. U
kliničkoj praksi nisu rijetka poboljšanja u pacijenata do kojih dolazi bez ikakvog posebnog
tretmana. Takve se pojave nazivaju spontanim remisijama, iako je razumljivo da taj sveobuhvatni
pojam uključuje sve ranije navedene prijetnje unutarnjoj valjanosti (prije svih statističku regresiju,
ali također povijest, sazrijevanje i druge). Netretirana skupina nije, međutim, jedini, a često ni
najbolji način uklanjanja prijetnji koje ugrožavaju eksperimentalnu valjanost.
Kontrolna grupa standardnog tretmana
Ponekad, osobito u kliničkim uvjetima, nije etički opravdano lišavati ispitanike (u tom slučaju
pacijente) tretmana koji bi ublažio ili uklonio njihove simptome. Slično je i u obrazovnim
ustanovama, gdje se testiranje novog nastavnog programa nikad ne provodi uz klasičnu kontrolnu
grupu. U takvim i sličnim situacijama pribjegava se kontrolnim grupama standardnog tretmana.
Novi nastavni program testira se tako da se primijeni na slučajno izabranom uzorku ispitanika, koji
se potom uspoređuje s drugim slučajnim uzorkom izloženom standardnom nastavnom programu.
Pitanje na koje, u tom slučaju, odgovara kontrolna skupina nije: "Što bi se dogodilo u odsutnosti
tretmana?", već: "Koji od dva tretmana proizvodi veći učinak, standardni ili unaprijeđeni?" Kako
smo rekli, takav tip nacrta posebno je prilagođen kliničkim uvjetima, gdje je potpuni izostanak
tretmana često etički neprihvatljiv.
Kontrolna grupa nespecifičnog tretmana
Kontrolne grupe u najvećem broju služe otklanjanju prijetnji unutarnjoj valjanosti. Grupa
nespecifičnog tretmana, međutim, obraća se, u prvom redu, prijetnjama vezanima za konstruktnu
valjanost. Uz mirno samo najjednostavniji primjer. Testiramo li novu tabletu protiv glavobolje
uspoređujući procjenu bola prije i nakon njena uzimanja, možemo itekako pogriješiti proglašavajući
je djelotvornom na temelju potvrđene razlike u provedenim mjerenjima. Čak i pošto zanemarimo
ostale prijetnje unutarnjoj valjanosti (prije svih povijest i sazrijevanje), preostaje nam da se
zamislimo nije li uočena razlika možda samo posljedica pozitivnih očekivanja ispitanika. Placebo
učinak odnosi se upravo na pojavu pri kojoj do promjene dolazi isključivo zbog uvjerenja ispitanika
ela bi nezavisna varijabla trebala djelovati na određeni način. U našem primjeru ispitanici su
uvjereni da će im tableta pomoći i zbog toga se osjećaju bolje čak i bez njene istinske učinkovitosti.
Da bismo utvrdili 157 stvarni učinak novog lijeka, neovisan o očekivanjima, podijelit ćemo ispitan
ike u dvije skupine, onu koja će dobiti tabletu u kojoj je on uistinu sadržan i onu koja će primiti
izgledom istovjetnu tabletu posve nedjelotvornog sadržaja.
Često puta nezavisna varijabla sadrži mnogo međusobno neovisnih sastojaka od kojih svaki u
stanovitoj mjeri može biti zaslužan za promjenu ponašanja. Problem je posebno naglašen u
kliničkoj praksi pri provjeri učinaka psihoterapijskog tretmana. Nespecifični sadržaj takve
intervencije sastoje se ti obraćanju pozornosti, slušanju ispitanika, razgovoru, hrabrenju,
pokazivanju interesa i drugim oblicima interakcije svojstvene svakoj ili većini psihoterapija. Kad
govorimo o učinkovitosti nekog određenog tretmana, nastojimo pritom isključiti takve elemente,
zajedničke svim sličnim intervencijama. Upravo tome služi grupa nespecifičnog tretmana koja
prima određeni oblik pseudo-tretmana (placebo). Njome se iz konačnog ishoda nastoje isključiti
faktori zajednički nekoj široj kategoriji u odnosu na nezavisnu varijablu. Da bismo to ilustrirali,
vratit ćemo se na raniji primjer provjere učinkovitosti razgovora sa svećenikom. Pokaže li se
razgovor sa svećenikom učinkovitijim u smanjivanju potištenosti u odnosu na jednostavan protok
vremena, bliži smo zaključku o njegovoj djelotvornosti. Isto tako, međutim, možemo se zapitati nije
li ono što smanjuje potištenost sam razgovor, a ne nužno razgovor sa svećenikom. Kontrolna grupa
mogla bi stoga u stanjima potištenosti razgovarati s nekom drugom osobom, prijateljem ili nekim
članom obitelji kako bi se uklonile druge pretpostavke o promjeni zavisne varijable, nevezane uz
nezavisnu. Takva grupa, koja bi vodila razgovor s osobom koja nije svećenik, mogla bi se smatrati
grupom nespecifičnog tretmana i njome bi se kontrolirale prijetnje konstruktnoj valjanosti, odnosno
one vezane uz pripisivanje promjena upravo određenom konstruktu.
157
155
105
Ivo V.
Kontrolna grupa sparenih ispitanika
Poseban oblik kontrolne grupe nespecifičnog tretmana je grupa sparenih ispitanika. Razlike u
postupcima ili događajima kojima su ispitanici izloženi mogu nastati tijekom provođenja
istraživanja zbog specifičnosti intervencije. Takve razlike najčešće nisu slučajne već slijede
određeno pravilo. Također, razliku može proizvesti vremenski raspored podražaja. Kako bi se takva
razlika uklonila, ispitanici se uparuju I tretman pružen ispitaniku eksperimentalne grupe po svemu
se, osim po pretpostavljenom agensu promjene, izjednačuje s njegovim (njezinim) parom iz
kontrolne grupe.
U poznatom Bradvjevu istraživanju. (1958) kojim je na majmunima provjeravan međuodnos
čuvstvenog stresa i razvoja čira korišten je takav postupak. Brady je uvježbao majmune da pritisnu
polugu najmanje jednom svakih 20 sekundi čime bi izbjegli električni udar. Kako bi pod kontrolom
držao fizički stres uzrokovan nagomilanim učinkom električnih udara kao mogući izvor nastanka 158
čira na želucu, autor je morao uvesti kontrolnu grupu koja bi primila istovjetnu dozu udara kao i
eksperimentalna grupa majmuna. To je, doduše, bilo lako izvedivo, ali ne i dostatno. Valjalo je
zajamčiti istodobnost udara kod kontrolne i eksperimentalne grupe jer je možda upravo njihov
vremenski slijed, a ne sami udari doveo do razvoja čira. Brady je majmune združio u parove. Jedan
od njih (eksperimentalni) upravljao je polugom kojom je mogao spriječiti udar, a drugi je bio
bespomoćan i svaki put kad bi prvi propustio stisnuti polugu pretrpio bi istodobno s njime
električni udar. Jedina razlika među njima ležala je u mogućnosti prvoga da utječe na pojavljivanje
udara. Istraživanje je pokazalo da se čir razvio samo kod eksperimentalne grupe, što je autora
navelo na zaključak o psihičkom stresu kao uzroku razvoja čira. U konkretnom primjeru
združivanje je trebalo osigurati vremensko podudaranje vanjskih utjecaja.
U kliničkoj praksi duljina i učestalost terapijskih intervencija često variraju ovisno o brzini
postizanja nekog terapijskog cilja poput ovladavanja posebnom vještinom, usvajanja određenog
ponašanja, stjecanju boljeg samouvida ili drugog. Zbog toga ispitanici u tretmanskoj grupi imaju
priliku pohađanja seansi sve dotle dok se ne postigne određeni terapijom zahtijevani cilj. S obzirom
na znatne međusobne razlike broj i duljina seansi bitno se razlikuje od pojedinca do pojedinca.
Kako u tom slučaju s njima izjednačiti kontrolnu grupu? Kontrolni ispitanici mogli bi biti izloženi
nekoj vrsti placebo tretmana, ali također varijabilnog trajanja na način da svaki eksperimentalni
ispitanik ima svojeg para u kontrolnoj skupini i bude s njime izjednačen po broju i učestalosti
seansi. Svrha uvođenja kontrolne grupe sparenih ispitanika jest, kako pokazuju gornji primjeri,
osiguravanje izjednačenosti grupa s obzirom na neko potencijalno važno, ali pojmovno (teorijski)
nevažno svojstvo koje bi moglo proizvesti razlike u konačnim rezultatima. Ciljevi kojima se obraća
takav oblik kontrole vezani su poglavito za konstruktnu valjanost.
7.1.1.2. IZBOR I RASPODJELA ISPITANIKA U GRUPE
Regrutacija ispitanika i njihovo raspoređivanje u grupe, dva su ključna problema od kojih zavisi
uspješnost grupnog eksperimenta i izvođenje pravilnih zaključaka. Način izbora ispitanika usko je
povezan s vanjskom, a njihovo raspoređivanje u skupine, s unutarnjom valjanošću. Da bismo bili u
mogućnosti rezultate eksperimenta uopćiti, potrebno je u istraživanje uključiti što reprezentativniji
uzorak populacije kojom se bavimo. Prečesto smo, nažalost, upućeni na prigodne uzorke koji su
nam dostupni, ali ne pružaju veliku mogućnost generalizacije. Izbor ispitanika je stoga usko
povezan s vanjskom valjanošću eksperimenta.
Temeljno pitanje vezano za grupni nacrt odnosi se na raspoređivanje ispitanika po grupama. Razlike
među skupinama nakon unošenja nezavisne varijable čine 159 osnovu zaključka o postojanju
uzročno-posljedične veze eksperimentalne intervencije i opažanog ponašanja. Zbog toga moramo
posjedovati čvrste argumente o izjednačenosti skupina prije eksperimentalne manipulacije. Riječ je
o problemu unutarnje valjanosti. Podsjetimo da se jedna od prijetnji odnosi na mogućnost
pogrešnog zaključka o utjecaju nezavisne varijable na zavisnu, iako je za razliku odgovorna početna
neujednačenost grupa. Uzmimo za primjer da proučavamo kako duljina psihoterapije utječe na
158
156
159
157
106
Ivo V.
njenu učinkovitost. Ako ne vodimo računa o slučajnom raspoređivanju, može se dogoditi da
ispitanici u jednim i drugim uvjetima ne budu međusobno izjednačeni prema težini poremećaja.
Razumno je pretpostaviti da oni s ozbiljnijim poremećajima budu uključeni u dulju, a oni s lakšima
u kraću psihoterapiju, Konačni rezultati mogu, paradoksalno, upućivati na veću učinkovitost kraćeg
tretmana jednostavno zbog činjenice da su pacijenti uključeni u nju i prije njega bili psihički
zdraviji. Jedini ispravan pristup je stoga zajamčiti izjednačenost ispitanika u svakoj od
eksperimentalnih i kontrolnih skupina. a bismo uklonili prijetnje unutarnjoj valjanosti vezane uz
izbor ispitanika, potrebno je raspodjeljivanje obaviti na jedan od sljedećih načina:
1. slučajnim odabire
2. raspoređivanjem po slučaju (randomizacijom)
3. uparivanjem
Slučajni odabir je ona vrsta regrutacije ispitanika u kojoj svatko iz populacije ima nenultu (pri
jednostavnom slučajnom odabiru, jednaku) vjerojatnost pojavljivanja u uzorku i svakoj od grupa.
Takav izbor unapređuje vanjsku valjanost eksperimenta jer se zaključci do kojih dolaze istraživanja
što ga koriste mogu uopćiti na cjelokupnu uzorkom predstavljanu populaciju. Eksperiment je u
psihologiji samo iznimno rijetko moguće organizirati tako da u njega uključimo slučajan uzorak
neke populacije. Ako bismo željeli provesti eksperiment čiji bi se rezultati mogli uopćiti na
populaciju punoljetnih građana Hrvatske, morali bismo izabrati uzorak u kojem bi svaki stanovnik
Hrvatske stariji od 18 godina imao jednaku ili barem nenultu vjerojatnost da se nađe u njemu.
Takvo što bi, bez dvojbe, bilo vrlo teško izvedivo i iznimno skupo. Slučajni odabir ispitanika
razložan je tek onda ako se radi o vrlo ograničenoj i jasno definiranoj populaciji ili je pak
istraživanje takvo da bi svako drugo rješenje bilo bespredmetno (primjerice istraživanja javnog
mnijenja ili epidemiološke studije). Ako bismo se ograničili na populaciju svih hrvatskih studenata
psihologije, morali bismo voditi računa da svaki od polaznika svih postojećih studija ima određenu
vjerojatnost izbora. Takav bi nacrt također bio teško ostvariv, ali ipak moguć.
Iako je slučajni izbor možda i najprimjereniji način izjednačavanja skupina, zbog praktičnih razloga
i često nepremostivih poteškoća, on se gotovo nikad ne koristi. Za razliku od opisnih istraživanja,
poput onih epidemioloških ili istraživanja160 javnog mnijenja gdje je presudno da uzorak bude posve
reprezentativan za populaciju na koju se odnosi, u eksperimentu se reprezentativnost nikad ne
smatra ključnom, niti se njena odsutnost drži propustom. Naprotiv, psihologijski eksperimenti
najčešće se provode na prigodnim uzorcima ispitanika poput studenata psihologije. Prigodnost
uzorka pruža osnovu za dvojbu u mogućnost uopćavanja nalaza. Ipak opća je pretpostavka da se
zakonitosti utvrđene u eksperimentu na uzorku iz jedne populacije mogu, barem u određenoj mjeri,
proširiti i na druge slične populacije. Primjerice, nešto što vrijedi za studente psihologije, vjerojatno
vrijedi i za studente ostalih studija, a možda i za sve osobe mlađe dobi. Međutim, mnoga svojstva
smatrana nevažnima mogu se pokazati odlučujućima u konačnom ishodu eksperimenta. Primjerice,
uopćimo li nalaze studenata na sveukupnu mladež, može se pokazati da griješimo. Isto tako,
međutim, neka svojstva za koja držimo da utječu na rezultate mogu se poslije pokazati nevažnima.
Većina se istraživača ipak drži pravila da neku eksperimentalnu intervenciju za koju je dokazano da
utječe na ponašanje jedne skupine ljudi, smatra djelotvornom i za druge, slične skupine. Ako, na
primjer, utvrdimo da studenti besmislene riječi tijekom ponavljanja uče krivuljom negativnog
ubrzanja, imamo razloga vjerovati da se isto dešava i na drukčijim uzorcima (starijih, manje
obrazovanih). Osnova za takve zaključke ponekad su izravna eksperimentalna proširenja na
različitim uzorcima ili logička analiza koja upućuje na manju vjerojatnost da bi utvrđeni mehanizmi
bili različiti u slučaju drugih populacija. Ipak, svako širenje zaključaka na druge populacije trebalo
bi biti empirijski dokazano. Nikad, međutim, nismo u mogućnosti provesti eksperimente na svim
mogućim populacijama. Teorija i logička analiza moraju, stoga, biti putokaz koji upućuje gdje i
zašto bi valjalo očekivati podudarne ili različite rezultate.
160
158
107
Ivo V.
Drugo nepovoljno svojstvo slučajnog odabira jest slabljenje statističke snage. Zbog različitosti
ispitanika kao posljedice njihova biranja iz neke šire populacije, varijance unutar grupa redovito su
veće, što otežava odbacivanje netočne nul-hipoteze.
Primjenom raspoređivanja po slučaju ili randomizacije, ispitanici se razvrstavaju u grupe i to tako
da svaki od njih ima jednaku vjerojatnost da bude raspoređen bilo u eksperimentalnu bilo u
kontrolnu skupinu. Ispunjenje takvog zahtjeva ima presudnu ulogu u grupnom eksperimentalnom
nacrtu jer se na taj način statističkim putem osigurava da znane i neznane vanjske varijable ne
utječu sustavno na rezultate ijedne grupe, odnosno pridonosi tome da one među sobom budu
izjednačene. Prema Cochranu i Coxu (1957), slučajno raspoređivanje nalikuje polici osiguranja jer
služi kao jamstvo protiv nedaća koje mogu i ne moraju nastupiti, jednako kao što mogu i ne moraju
imati ozbiljne posljedice. Raspoređivanje ispitanika je zbog toga središnje pitanje eksperimentalne
kontrole, jer svaka pristranost može ugroziti unutarnju valjanost.161
Na koji način slučajno raspoređivanje uklanja pristranost? Valja se prisjetiti nekih osnovnih
statističkih načela. Ako svaka osoba ima jednaku vjerojatnost uključivanja bilo u eksperimentalnu
bilo u kontrolnu skupinu (ili više njih), tada bi se i vanjske varijable vezane uz osobne razlike
trebale raspodijeliti slučajno, što u konačnici pridonosi da na svaku grupu imaju približno jednak
utjecaj. Valja ipak upozoriti da su oba načina izbora (slučajan izbor i slučajno raspoređivanje)
probabilističkog karaktera, odnosno zasnovani na teoriji vjerojatnosti te je i izjednačenost skupina
koja bi na temelju njih trebala proizići, također probabilistička (Trochim, 1999). To znači da
kontrolna i eksperimentalna grupa vjerojatno nikad neće biti potpuno izjednačene, ali ćemo biti u
mogućnosti procijeniti vjerojatnost njihove različitosti. Jesu li dvije grupe od kojih jedna sadrži
52% žena, a druga 54% izjednačene? Ako postoji velika vjerojatnost da slučajno raspodijeljeni
uzorci te veličine poprime takve vrijednosti, grupe se mogu smatrati probabilistički izjednačenima.
Ako se takvo što može očekivati u iznimno malom postotku slučajeva, tada se vjerojatno ne može
govoriti o izjednačenosti. Najjednostavniji način provjere probabilističke izjednačenosti je
računanje t-testa. U slučaj u istodobne provjere većeg broja relevantnih obilježja (primjerice, spola,
dobi, naobrazbe, materijalnog statusa ili drugoga) valja primijeniti Bonferronijevu korekciju, jer u
se u takvoj situaciji pukim slučajem može dogoditi da jedna ili dvije razlike budu veće od granične
vrijednosti za jednostruku usporedbu.
Slučajno raspoređivanje nosi dvostruku dobit, prvu koja se odnosi na mogućnost statističkog
zaključivanja i drugu, koja omogućuje kontrolu vanjskih faktora. Prvom se koristimo primjenjujući
načela koja opisuju varijaciju uzoraka oko prave središnje vrijednosti populacije, temeljem kojih
zaključujemo o razlikama što mogu ili ne mogu u razumnim granicama biti pripisane slučajnim
kolebanjima. Drugim riječima, bez takve mjere opreza, ne bismo imali na raspolaganju postupke
poput t-testova ili analize varijance koji čine okosnicu statističkog zaključivanja. Druga prednost
slučajnog raspodjeljivanja još je i naglašenija, jer osigurava izjednačenost skupina s obzirom na
vanjske utjecaje vezane uz obilježja, što je nužna pretpostavka njihove kasnije usporedbe. Za
razliku od slučajnog odabira pri kojem iz populacije po slučaju biramo ispitanike kontrolne i
eksperimentalne skupine, pri slučajnom raspoređivanju dostupni uzorak (koji ne mora i redovito
nije slučajan, već prigodan) po slučaju raspodjeljujemo u grupe. Različiti pristupi ova dva načina
biranja ilustrira ni su slikom 7.1.
U slici valja uočiti da je slučajni odabir jamstvo nepristranosti (reprezentativnosti) uzorka koji, u
tom slučaju, sadrži sve populacijske elemente u približno jednakom omjeru kao i populacija.
Raspoređivanje po slučaju ne jamči reprezentativnost jer pojedini populacijski elementi mogu biti
izostavljeni iz dostupnog uzorka (naznačeni zelenim kruž ićirna ), ali zato jamči probabilisričku
izjednačenost grupa s obzirom na obilježja elemenata.162
161
159
162
160
108
Ivo V.
Pokušajmo na temelju primjera vidjeti kakva je razlika između slučajnog izbora i slučajnog
raspoređivanja, te kakvom se riziku izlažemo ako ih zanemarimo. Recimo da nas zanima kakav će
utjecaj na znanje iz metodologije imati duljina predavanja. Dulja predavanja obično su
informativnija i potpunija, ali je pitanje koliko dugo studenti mogu održavati koncentraciju, tako da
duljina ponekad može biti kontraproduktivna. Problem možemo ispitati dijeleći ispitanike u dvije
skupine od kojih će jedna slušati dulja, a druga kraća predavanja. Našu populaciju čine studenti
prve godine psihologije, ali kako neki od njih ne dolaze na predavanja, a drugi ne žele sudjelovati u
istraživanju, naš je uzorak nužno prigodan, sastoji se samo od onih koji redovito pohađaju
predavanja i pristaju na istraživanje. Mogućnost slučajnog izbora ispitanika time je isključena jer
svaki student nema nenultu vjerojatnost da bude izabran u uzorak istraživanja (oni koji ne dolaze na
predavanja, a čije sposobnosti učenja mogu biti različite od onih koji pohađaju predavanja, nemaju
nikakvu vjerojatnost da budu uključeni u istraživanje). Recimo da od ukupno 45 studenata koji
pohađaju predavanja raspolažemo s njih 30 koji su pristali na istraživanje i koje ćemo podijeliti u
dvije skupine. To možemo učiniti tako da one u prvim klupama rasporedimo u eksperimentalnu
grupu (kraća predavanja), a one u zadnjim u kontrolnu (dulja). Takva raspodjela, međutim, nipošto
nije slučajna. Oni u prvim klupama163 možda su bolje motivirani, iskazuju veći interes i mogu
pokazati bolje znanje čak i unatoč objektivno slabijim i nepotpunim predavanjima. Slučajno
raspodjeljivanje pretpostavlja takvu raspodjelu u kojoj svatko od 30 studenata ima potpuno jednaku
vjerojatnost izbora u svaku od skupina. U protivnom, kako vidimo, zabilježene razlike na kraju
istraživanja ne možemo sa sigurnošću pripisati nezavisnoj varijabli (duljina predavanja) jer je do
njih mogla dovesti početna neujednačenost skupina.
Raspoređivanje po slučaju redovito se obavlja uporabom tablica slučajnih brojeva. Ako naš
eksperiment zahtijeva tri skupine, iz tablice slučajnih brojeva ćemo redom očitavati brojeve od I do
3, zanemarujući preostale. Raspored, primjerice, može biti 3, 3,2, I, 1,3,1,1,2. Ispitanici će, kako
dolaze ili se prijavljuju, biti raspoređeni u skupinu prema unaprijed određenom broju (prvi će biti
raspoređen u treću grupu, drugi također, treći u drugu itd.). Takva vrsta raspoređivanja jamči
slučajnost dodjeljivanja grupi, odnosno može se reći da svaki ispitanik ima posve jednake izglede
naći se u svakoj od njih pod uvjetom njihove jednake brojnosti.
Izvlačenje slučajnih brojeva, međutim, ne jamči da će sve skupine imati jednak broj ispitanika. U
gornjem primjeru, broj I se pojavio više puta nego 2 i 3, tako da će više ispitanika biti raspoređeno u
163
161
109
Ivo V.
prvu nego u preostale grupe. Kako neujednačenost broja ispitanika utječe na smanjivanje snage
statističkih testova i time ugrožava valjanost statističkog zaključka, valja ga izbjeći, posebice kad
raspolažemo manjim brojem ispitanika. To se može postići bez narušavanja načela slučajnog
raspodjeljivanja, grupiranjem ispitanika u blokove. Svaki blok se sastoji od onoliko ispitanika
koliko ima grupa. Ako su u eksperimentu sadržana četiri uvjeta (grupe), primjerice A, B, C i D, tada
će prvih četvero ispitanika, ali i svaka sljedeća četvorka, biti raspoređena tako da svaki ispitanik iz
nje bude raspoređen u jedan od njih. Raspoređivanje se obavlja probabilističkim putem, baca njem
kocke, kompjutorskim programom ili na temelju tablice slučajnih brojeva. Ako niz iz tablice sadrži
sljedeće brojeve: 4 5 9 2 3 2 5 6 4 9 8 3 1, tada ćemo izdvajajući samo brojeve koji se ne ponavljaju
i one manje od 5 (jer imamo 4 grupe) zadržati 4 2 3 1. To znači da će prvi ispitanik biti raspoređen
u grupu D, drugi u B, treći u C, a četvrti u A. Ponavljanjem istog postupka raspodijelit ćemo i sve
preostale ispitanike.
Premda slučajno raspodjeljivanje u grupe još uvijek ne jamči da će one doista biti izjednačene, ono
je najbolji način izbjegavanja prijetnji unutarnjoj valjanosti (vezanih za izbor ispitanika ili njegovu
interakciju s drugim prijetnjama, prije svih s poviješću ili sazrijevanjem). Slučajno raspodjeljivanje
je metoda izbora u najvećem broju istraživanja, no nažalost, često puta ga iz praktičnih razloga
nismo u mogućnosti obaviti, bilo stoga što postoji potreba da neki ispitanici budu raspoređeni u
tretmansku grupu (primjerice, teži pacijenti u bolnicama), ili se pak suočavamo s problemom
postojećih i nedjeljivih cjelina (razredi u školama). To ne znači da su takva istraživanja, koja zbog
nemogućnosti udovoljavanja strogim zahtjevima164 eksperimentalne kontrole nazivamo kvazi-
eksperimentima, nužno loša ili manje vrijedna, ali istraživač se u takvim slučajevima mora u mnogo
većoj mjeri služiti metodološkim znanjima i logičkom analizom kako bi izbjegao moguće greške u
zaključivanju.
Uparivanje je postupak pri kojem se grupiranje ispitanika u skupine obavlja prema podudarnosti ili
sličnosti određenih osobina. Uparivanjem se postiže da osobe duž cijelog raspona nekog obilježja
budu jednako zastupljene u svakoj od grupa. Ono što se može dogoditi nakon slučajnog
raspoređivanja, da grupe budu neujednačene s obzirom na neko, za eksperiment, važno svojstvo,
nastoji se izbjeći uparivanjem. Ako istraživač raspolaže razmjerno malim brojem ispitanika
(četrdesetak ili manje), može opravdano posumnjati da će se grupe sastavljene na temelju slučajnog
raspoređivanja razlikovati prema nekom važnom svojstvu (uzmimo, primjerice, da je to svojstvo
naobrazba). Da bi takvo što izbjegao, istraživač pristupa uparivanju, pa ispitanika nižeg obrazovanja
raspoređenog u kontrolnu grupu, uparuje s drugim ispitanikom istovrsne naobrazbe kojeg
raspoređuje u eksperimentalnu grupu. Kad radimo s kontinuiranim rezultatima tražene osobine,
primjerice inteligencijom, teško ćemo adekvatno upariti sve ispitanike, jer nekome kome je
izmjeren IQ od 95. vjerojatno nećemo naći par posve istog kvocijenta. U tom slučaju ispitanike
možemo prvo rangirati prema inteligenciji, a potom ih metodom blokova podijeliti u skupine. Ako
istraživanje provodimo na samo dvjema grupama, prvi blok činit će prva dva ispitanika, koja ćemo
slučajno (primjerice, bacanjem novčića) rasporediti u kontrolnu ili eksperimentalnu. Isto ćemo
učiniti i sa svakim od preostalih parova ispitanika. Pri uparivanju, ispitanici se izjednačavaju prema
varijabli za koju je ili poznato ili se pretpostavlja da bi mogla utjecati na zavisnu varijablu. Ako
pretpostavljamo da na rezultate eksperimenta značajno djeluje samo jedna vanjska varijabla, ona
prema kojoj smo proveli uparivanje, tada je takva metoda u prednosti pred slučajnim
raspoređivanjem. Uparivanjem se također uvećava osjetljivost eksperimenta, odnosno njegova
statistička snaga jer se u većoj mjeri kontrolira varijabilitet vezan uz varijablu uparivanja. Prisjetimo
se, u takvim se nacrtima greška razlike aritmetičkih sredina korigira naniže uzimajući u obzir
korelaciju među parovima ispitanika (t-rest za zavisne uzorke). Unatoč tomu, raspoređivanje po
slučaju se općenito smatra primjerenijom metodom izjednačavanja skupina jer jamči slučajnu
raspodjelu svih vanjskih faktora vezanih za ispitanike.
7.1.1.3 IZJEDNAČENOST GRUPA
Mnogo je činitelja koji, uz nedovoljnu ili neprimjerenu kontrolu, mogu umjetno proizvesti razliku
između grupa bez obzira na stvaran utjecaj nezavisne varijable. Među njima posebno mjesto
164
162
110
Ivo V.
zauzimaju razlike u osobnim obilježjima ispitanika prije provođenja eksperimenta. Slučajno
raspoređivanje je način da se pojedinci165 različitih obilježja nesustavno rasporede u svaku grupu,
čime se grupe, statistički, ujednačuju prema svim potencijalno značajnim svojstvima. Prednost je
takvog postupka da istraživač ne mora unaprijed biti svjestan osobina koje mogu biti prijetnja
unutarnjoj valjanosti (primjerice, radi li se o spolu, dobi, obrazovanju ili drugom), jer metoda teži
da grupe izjednači prema svima njima. To se i dešava ako raspolažemo s velikim brojem ispitanika.
No pri manjim brojevima, izjednačenost grupa dolazi u pitanje. Ako su grupe sastavljene od manje
od 20 ispitanika, vjerojatno je da će postojati osjetne razlike medu njima u nekoj od relevantnih
odlika, unatoč slučajnom raspoređivanju. Upućuje li to na zaključak kako iznimno mali uzorci
(manji od 20 po grupi) ne osiguravaju izjednačenost grupa nakon slučajnog raspoređivanja? I da i
ne. Rekli smo da poštujući načela slučajnog izbora jamčimo probabilističku izjednačenost. No to,
nažalost, ne znači da obilježja koja razlikuju grupe neće utjecati na zavisnu varijablu prijeteći
unutarnjoj valjanosti. U praksi stoga treba izbjegavati posve male uzorke ili biti svjestan mogućih
pogrešaka u zaključivanju. Imajmo na umu da slučajno raspoređivanje ne jamči izjednačenost
grupa prema utjecaju različitih vanjskih faktora, ali takav postupak leži njihovu izjednačavanju, što
naročito dolazi do izražaja pri uporabi većih uzoraka. Na isti način kao što ne možemo očekivati da
se u 18 bacanja kocke svaki od šest brojeva pojavi po tri puta, ili da se u deset bacanja novčića
pismo i glava pojave po pet puta, lako ne možemo očekivati niti savršenu uravnoteženost malih
grupa prema dobi, motivaciji, ekstravertiranosti, inteligenciji ili nekom od drugih znanih ili
neznanih faktora koje želimo kontrolirati. No bacimo li novčić ili kocku stotinu i više puta,
vrijednosti će se posve približiti teorijski očekivanim učestalostima, što će se isto dogoditi i s
osobinama koje čine osnovu međusobnih razlika ispitanika.
Recimo također da je raspoređivanje ispitanika na slučajan način jedan od ključnih elemenata
istinskih eksperimentalnih nacrta. Prema tom i nekim drugim svojstvima kojima je omogućena
kontrola činitelja koji ugrožavaju unutarnju valjanost, istinski eksperimenti razlikuju se od tzv.
kvazi-eksperimenata koji se odlikuju slabijom kontrolom i manjom mogućnošću jednoznačnog
pripisivanja promjena zavisne nezavisnoj varijabli.
7.1.1.4 TIPOVI GRUPNIH EKSPERIMENTALNIH NACRTA
Zadržat ćemo se na nekoliko osnovnih grupnih eksperimentalnih nacrta koji se najčešće rabe u
psihologijskim istraživanjima. Opisat ćemo njihove prednosti i nedostatke te najčešća područja
primjene. Notacija kojom su označeni slijedi onu što su je u praksu uveli Campbell i Stanley (1966).
Slovom S naznačeno je da su grupe sastavljene raspoređivanjem ispitanika po slučaju. Opažanje je
obilježeno slovom O, a odnosi se na svaku registraciju zavisne varijable (opaža nje, mjerenje,
samoprocjena i166 dr.), i konačno slovom E označena je eksperimentalna intervencija odnosno
unošenje nezavisne varijable.
Grupni nacrt s kontrolnom skupinom i opažanjem prije i poslije tretmana
Ovaj tip nacrta sadrži najmanje dvije grupe, eksperimentalnu i kontrolnu. U pravilu, prva je
izložena nezavisnoj varijabli (tretmanu), a drugoj je ona uskraćena. Ispitanici su opažani (ispitani,
testirani) prije i poslije intervencije, tako da se o utjecaju nezavisne varijable može suditi temeljem
promjene između prvog i drugog testiranja eksperimentalne grupe, a li i razlike između kontrolne i
eksperimentalne grupe u naknadnom testiranju. Pretpostavka je nacrta, kao i svakog drugog
istinskog eksperimenta da su ispitanici slučajno raspodijeljeni u grupe. Opća shema nacrta je
sljedeća:
Nacrt ima široku primjenu u psihologiji zbog mogućnosti kontrole najvećeg broja prijetnji
unutarnjoj valjanosti. Njime je također moguće razmjerno dobro procijeniti veličinu promjene do
165
163
166
164
111
Ivo V.
koje dovodi intervencija, što je od posebne važnosti u kliničkoj psihologiji pri provjeri
psihoterapije. Podrobnija rasprava o načinu na koji ovaj nacrt udovoljava načelima unutarnje
valjanosti sadržana je na drugom mjestu (Campbell i Stanley, 1966), tako da ćemo njegove
prednosti navesti samo ukratko.
Povijest kao moguća prijetnja unutarnjoj valjanosti rješava se dvokratnim testiranjem kontrolne i
eksperimentalne grupe. Činitelji neovisni o tretmanu koji proizvode razliku između O 1 i O2, na isti
način utječu na razliku između O3 i O4. Pri tome, međutim, valja biti oprezan jer se zbog nedovoljne
kontrole i u naizgled besprijekornom nacrtu mogu dogodili propusti koji ugrožavaju unutarnju
valjanost. Ako se svi ispitanici eksperimentalne grupe testiraju ili su izloženi nezavisnoj varijabli u
istom navratu, ili se to odnosi na sve ispitanike kontrolne grupe, tada jedinstveni događaji u tim
situacijama postaju specifični za svaku grupu i mogu ugroziti unutarnju valjanost. Pokušamo li,
primjerice, provjeriti uspješnost neke metode učenja, ali to učinimo tako da sve ispitanike iz
eksperimentalne skupine učimo i testiramo zajedno, kao i sve ispitan ike iz kontrolne skupine, tada
svaka opaska eksperimentatora izrečena u jednoj prigodi, a prešućena u drugoj može predstavljati
suparničku hipotezu o krajnjoj razlici u naučenom gradivu između grupa. Na sličan način prijetnja
mogu biti i osobiti događaji koji su se zbili samo pri testiranju jedne grupe ma kako trivijalno
izgledali na prvi pogled (prometna nesreća koja se dogodila pod prozorom, nevrijeme, nestanak
struje, slabiji rad centralnog grijanja i sl.). Svaka od tih pojava ili 167 vanjskih faktora može se
odraziti na rezultate, djelujući na njih povoljno ili nepovoljno, a problem se javlja ako djeluju samo
na jednu skupinu, a ne na obje podjednako. Najbolji način uklanjanja takve prijetnje je zasebno
testiranje svakog pojedinca, pri čemu se ujedno nastoje izjednačiti ili slučajno rasporediti faktori
koji osim nezavisne varijable mogu utjecati na zavisnu. U prethodnom primjeru to bi mogli biti do
ha dana, dan u tjednu, blizina ispita ili sl.
Učinci testiranja i sazrijevanja nadziru su eksperimentalnim nacrtom tako što se očekuje da budu
podjednako prisutni u kontrolnoj kao i eksperimentalnoj grupi. To znači da razlika između O 2 i O1
koju možemo pripisati sazrijevanju i testiranju približno odgovara razlici između O 4 i O3. Govorimo
li o sazrijevanju, valja biti posebno oprezan u istraživanjima koja se bave zavisnim varijablama
naglašeno podložnima promjeni. Primjerice, u razvojnim studijama moramo osobitu pozornost
posvetiti vremenskom podudaranju opažanja u eksperimentalnoj i kontrolnoj grupi. Kod djece i
mali vremenski pomaci jedne u odnosu na drugu (npr. testiranje eksperimentalne grupe tjedan dana
prije kontrolne) mogu proizvesti određen u razliku u zavisnoj varijabli prijeteći na taj način
unutarnjoj valjanosti. Pokušavamo li, primjerice, provjeriti kako posebno osmišljena vježba utječe
na brzinu čitanja sedmogodišnje djece, razmak od tjedan dana između testiranja u kontrolnoj i
eksperimentalnoj grupi dovest će, zbog sazrijevanja, do smanjivanja ili povećavanja stvarnih
učinaka, ovisno o tome koja je grupa prije testirana.
Instrumentacija, tj. prividna promjena između dva testiranja nastala kao posljedica promjena u
mjernom instrumentu najlakše se izbjegava uporabom standardiziranih testova. Ako to nije moguće,
ili primjereno konkretnom istraživačkom problemu, potreban je poseban oprez. To osobito vrijedi
za slučaj u kojem se koriste procjene opažača. Tada nije dovoljno samo rasporediti svakog opažača
ravnomjerno na eksperimentalne i kontrolne uvjete kako bi se poništila njegova osobna jednadžba,
već i držati ih u neznanju koja grupa prima koji tretman. U tom se slučaju radi o dvostruko slijepom
eksperimentu, u kojem ni ispitanici, ni eksperimentatori ne znaju tko prima kakav tretman, pa stoga
njihova očekivanja o uspješnosti pojedinog tretmana ne mogu utjecati na ishod eksperimenta
(Rosenthal, 1969).
Problem statističke regresije nadilazi se nacrtom tako da se ispitanici u eksperimentalnu i kontrolnu
grupu biraju na posve isti način, odnosno istom vrstom ekstremizacije. Ako nas zanima nastavni
program primjeren najslabijim učenicima, probrat ćemo ih na temelju pred-testiranja. No kako je
ranije rečeno, takvi su, najslabiji, rezultati prosječno opterećeni većom greškom naniže, tako da će
drugo testiranje proizvesti pseudo-pomak prema višim vrijednostima, iako je zapravo riječ o tome
da će se rezultati, prosječno gledano, samo približiti svojim stvarnim vrijednostima. Ako, dakle,
167
165
112
Ivo V.
biramo među najslabijim učenicima, moramo ih slučajno rasporediti u kontrolnu i eksperimentalnu
grupu, kako bi se učinci regresije podjednako odrazili na obje vrste uvjeta.168
Izbor ispitanika, kao i u svakom pravom eksperimentalnom nacrtu, mora biti slučajan, na temelju
jedne od navedenih metoda (poželjno slučajnim izborom ili raspoređivanjem po slučaju) kako ne bi
bilo dvojbe oko toga treba li rezultate pripisati intervenciji ili početnoj neujednačenosti skupina.
Pitanje osipanja ispitanika može biti ozbiljan problem prilikom primjene ovakvog eksperimentalnog
nacrta ako eksperimentator ne postupa principijelno. U praksi su česti eksperimenti koji se sastoje
od pred-testiranja, tretmana i posttestiranja. Između dva testiranja ispitanici iz eksperimentalne
skupine izloženi su tretmanu u jednoj ili većem broju prilika, dok se oni iz kontrolne često puta ne
moraju niti pojavljivati prije zaključnog testiranja. To znači da je vjerojatnost izostajanja ili
nepotpunog pohađanja mnogo veća za pripadnike eksperimentalne grupe. Ako je eksperimentator
neosviješten glede moguće greške zbog različitog osipanja i s time povezane neujednačenosti
uzoraka, može jednostavno zanemariti takve činjenice i usporediti rezultate samo onih ispitanika
koji su od početka do kraja bili u eksperimentu. U tom slučaju, oni koji su bili zainteresiraniji za
tretman (bilo da se radi o učenju, terapiji, fizičkom vježbanju ili dijeti) bit će više zastupljeni u
eksperimentalnoj negoli kontrolnoj grupi (jer su oni manje motivirani u većoj mjeri odustajali), tako
da se utvrđene razlike neće moći pripisati samom tretmanu. Konačno preostali ispitanici iz
eksperimentalne skupine neće predstavljati nepristran uzorak iz grupe koja je započela tretman, što
znači da neće biti usporedivi s kontrolnom grupom. Jedan, naoko radikalan, način rješavanja
problema različitog odustajanja jest da se usporede svi dostupni rezultati bez obzira na nazočnost
pri provođenju tretmana. Primjerice, osoba iz eksperimentalne skupine koja je bila nazočna samo
prvom i završnom testiranju, a ne i eksperimentalnoj intervenciji, bila bi uključena u statističku
analizu kao pripadnik eksperimentalne grupe. Čini se da je ovakav pristup nepravedan prema
tretmanu jer osobu koja mu uopće nije bila izložena smješta u eksperimentalnu grupu. Iako umjetno
smanjuje učinkovitost tretmana, ovaj postupak uklanja pristranost uzorka kontrolne i
eksperimentalne grupe kao potencijalno mnogo opasniju grešku u konačnom zaključivanju.
Najveća moguća slabost nacrta s dvokratnim mjerenjem kontrolne i eksperimentalne grupe je
međudjelovanje testiranja i tretmana (nezavisne varijable). Glavno ograničenje odnosi se na
predispitivanje, odnosno njegovu interakciju s tretmanom. Predispitivanje, naime, često, može
senzibilizirati, odnosno učiniti ispitanika osjetljivijim prema tretmanu. No mogući su i drugi
problemi, primjerice postojanje ili odsutnost potrebe ispitanika da se pokažu dosljednima.
Želimo li tako provjeriti kakav će učinak imati provedba odgovarajućeg seminara i radionice na
povećanje međunacionalne snošljivosti i suradnje, nije zajamčeno da će promjena stava biti
istovrsna kod osoba koje su sudjelovale na seminaru i radionici bez prethodnog testiranja i onih
koje su prethodno ispunjavale ljestvicu međunacionalne snošljivosti. Predispitivanje, u pravilu,
može djelovati na dva načina:169 potaknuti ispitanike da se ponašaju prema očekivanjima
eksperimentatora ili ih, naprotiv, obvezati da ostanu dosljedni prvotno izrečenim sudovima. U
prvom slučaju predispitivanje posredno upoznaje ispitanika sa svrhom istraživanja i nudi smjernice
za ponašanje u skladu s prepoznatim zahtjevima eksperimentalne situacije. U drugom slučaju,
promjena do koje bi, pod utjecajem nezavisne varijable, u "normalnim" okolnostima došlo, izostaje
zbog tvrdoglave ustrajnosti ispitanika da ostanu dosljedni prvotno izrečenom mišljenju. Mogući
ishodi djeluju u različitom smjeru pa se čini da se međusobno poništavaju i uklanjaju temeljni
problem. Nažalost, to nije posve izvjesno jer jedna od dviju pojava može prevladati, što postaje
prijetnjom unutarnjoj valjanosti. Čak i u najpovoljnijem slučaju, moramo se suočiti s povećanjem
eksperimentalne greške (različiti učinci nezavisne varijable povećavaju varijancu), koja smanjuje
statističku snagu nacrta.
Ako je riječ o nekoj, za ispitanike, manje važnoj tematici, pred-testiranje ih može učiniti
osjetljivijima na nju u odsutnosti nezavisne varijable ili u interakciji s njome. Želimo li, na primjer,
provjeriti hoće li neki dokumentarni film o porastu zločina učiniti ljude sklonijima smrtnoj kazni,
168
166
169
167
113
Ivo V.
početno testiranje može ih, na određeni način, pripremiti na ono što slijedi. Prethodno testirana
skupina ce, vjerojatno, biti mnogo više usmjerena na aspekte mjerene primijenjenom skalom, u
odnosu na prvu, koja film može shvatiti i pogledati kao posve običan dokumentarni prilog. U prvoj
skupini učinci gledanja možda će biti snažniji upravo zbog prethodno razvijene osjetljivosti na
mjereni problem.
Osnovna poteškoća nacrta jest da isključivo na temelju njega nije moguće procijeniti koliki je
učinak senzibilizacije uzrokovan predispitivanjern. Vjerojatnost uvećane osjetljivosti ovisi o
nekoliko činitelja. Ako predispitivanje i tretman nisu vremenski, situacijski ni prostorno povezani,
manje je izgled no da će doći do takve pojave nego ako se veza među njima može jasno uspostaviti
na temelju temporalnog ili bilo kojeg drugog vezivanja. Vjerojatnije je stoga da ce senzibilizacija
nastupiti ako predispitivanje neposredno prethodi eksperimentalnoj intervenciji nego ako je ono
obavljeno prilikom, primjerice, prijemnog ispita, a eksperiment mjesecima kasnije. Međutim, što je
pred ispitivanje udaljenije, (o je manja vrijednost mjerenja u registraciji početnog stanja. Događaji
koji se odvijaju u međuvremenu (povijest ili sazrijevanje) između prvog i drugog testiranja mogu
posve zamagliti učinke koji bi se u drugim okolnostima (manjeg vremenskog odmaka početnog i
naknadnog ispitivanja) pripisali nezavisnoj varijabli.
Statistički postupci za testiranje značajnosti razlike među dvokratno testiranim grupama
Nacrt s dvjema grupama i dvokratnim opaža njem nalaže uporabu ponešto različitih metoda
statističke obrade, a i one koje je moguće preporučiti nose određene 170 slabosti kojih istraživač mora
biti svjestan. U takvoj prilici nipošto ne bi trebalo računati t-testove između prvog i ponovljenog
mjerenja za svaku skupinu, pa ih potom uspoređivati. Istraživač nevičan statistici može zaključiti da
je tretman proizveo odgovarajuće učinke ako je t-test u eksperimentalnoj grupi značajan, a u
kontrolnoj neznačajan. Zapravo, često se dešava da t-rest u eksperimentalnoj grupi bude jedva
značajan, a u kontrolnoj skoro značajan, pa bi ispravniji postupak, poput računanja na temelju
razlika pokazao kako zapravo ne postoje statistički značajne razlike između kontrolne i
eksperimentalne skupine.
Drugi način na koji možemo doći do statističkog zaključka o učincima nezavisne varijable sastoji se
u provođenju dvaju t-testova na nezavisnim uzorcima (usporedba K i E grupe u prvom mjerenju, a
potom i u drugom). Ako je razlika između K i E grupe u pred-testiranju neznačajna, što je vrlo
izgledno zbog provedbe raspoređivanja po slučaju, odnosno probabilističke izjednačenosti, a u
drugom testiranju značajna, možemo suditi o djelotvornosti nezavisne varijable. Nažalost i takav
postupak, iako mnogo prihvatljiviji, samo u ograničenoj mjeri uzima u obzir početne rezultate, što
katkad može dovesti do nepreciznosti i manjka statističke snage.
Mnogo bolja iako ne uvijek preporučljiva metoda analize sastoji se u računanju temeljenom na
razlikama među rezultatima prvog i drugog testiranja umjesto samim rezultatima. Pritom se razlike
računaju kao:
Potom se na tako dobivenim razlikama računaju t-testovi između kontrolne i eksperimentalne

grupe. No i računanje temeljeno na razlikama krije određene nedostatke poput njihove veće
opterećenosti greškom mjerenja, što neke autore navodi da odbace i ovu metodu, ili barem da prema
njoj iskažu naglašenu rezervu (Cronbach, 1990).171
170
168
171
169
114
Ivo V.
Njihovo rezoniranje pritom slijedi jednostavnu logiku. Ako su testovne mjere u visokoj korelaciji,
što bi trebao biti slučaj s dvokratnom primjenom istog pokazatelja, tada razlika među njima većim
dijelom sadržava grešku mjerenja. Pokažimo to primjerom. Uzmimo ela mjera zavisne varijable ima
komunalitet (zajedničku varijancu) 0.70, varijancu greške 0.20, a preostatak otpada na istinsku
varijancu osjetljivosti na nezavisnu varijablu. U tom slučaju pouzdanost testovnog rezultata iznosi
0.80 (0.70 +0.10). što je ukupni udio varijance bez greške mjerenja. Nažalost, pouzdanost razlike
između dvokratne primjene takvog testa iznosi svega 0.33, jer je udio istinske varijance u onom
njezinu dijelu koji čini različitim dva mjerenja (0.60) svega jedna trećina (odnosno 0.20).
Zbog navedenih razloga, neke složenije analize, primjerice analiza kovarijance u kojoj bi kovarijate
bile rezultati pred-testiranja, svakako su primjerenije rješenje i mogu pružiti preciznije i
vjerodostojnije podatke, te ih stoga valja koristiti kad god je to moguće.
Grupni nacrt s kontrolnom skupinom i opažanjem samo poslije tretmana
Ovaj tip nacrta u svemu se podudara s prethodno opisanim eksperimentalnim nacrtom uz jedinu
razliku odsutnosti početnog opažanja. Učinak tretmana stoga se procjenjuje samo na temelju
naknadnog mjerenja. Shematski se nacrt može prikazati na sljedeći način:
Iako naoko slabiji od prethodno opisanog, nacrt koji uključuje samo naknadno opažanje zapravo
podjednako dobro kontrolira sve prijetnje unutarnjoj valjanosti. Premda je svijest o potrebi pred-
testiranja među psiholozima izrazito snažna, a ponekad, kako ćemo ubrzo vidjeti i opravdana, ona u
nizu slučajeva nije posve racionalna, jer za istinski eksperiment prethodno opažanje nije nužno.
Problem koji se nameće u ovakvom tipu nacrta odnosi se na početnu izjednačenost grupa o kojoj ne
postoji nikakva informacija. Taj je problem, međutim, samo prividan. Za izjednačavanje grupa,
kako smo ranije opisali, posve je dovoljan postupak slučajnog raspoređivanja, koji će grupe, osobito
ako su dovoljno velike. izjednačiti probabilističkim putem. Testiranje izjednačenosti grupa. napose
ako se radi o malim uzorcima, više je samozavaravanje istraživača koje mu pruža lažnu sigurnost.
Nepostojanje statistički značajne razlike među grupama nije nikakvo jamstvo njihove izjednačenosti
zbog oskudne snage statističkih testova pri malim uzorcima.172
Odsutnost predispitivanja ima, suprotno prvom dojmu, neporecivih prednosti. To je jamstvo da
utjecaj nezavisne varijable (eksperimentalne intervencije) nije posljedica početne senzibilizacije,
odnosno da se dobiveni rezultati ne mogu primijeniti isključivo na one koji su podvrgnuti pred
ispitivanju. U istraživačkoj praksi takav je nacrt zbog toga poželjan. a često i nezamjenljiv.
Primjerice, ti eksperiment u kojim se nastoji ispitati utjecaj prikazivanja filma na agresivnost, često
172
170
115
Ivo V.
puta nije poželjno ispitati ispita nike prije projekcije jer bi li tom slučaju mogli vidjeti film drugačije
negoli bez takve vrste senzibilizacije. Ako pri tome imamo na raspolaganju velik broj ispitan ika i
mogućnost da ih slučajno rasporedimo u grupe, tada je vjerojatnost da će grupe biti početno
izjednačene razmjerno visoka. U takvim prilikama nacrt temeljen samo na naknadnom opažanju je
metoda izbora.
U drugim, podjednako čestim, prigodama ne raspolažemo rezultatima predispitivanja ili ga nismo u
mogućnosti obaviti. Ponekad je takav postupak dug, skup ili stresan i naporan ispitanicima, osobito
kad se ispitivanje obavlja nizom testova. I u tim prilikama, opisana je metoda dobro rješenje. U
drugim pak slučajevima, primjena dvokratnog testiranja je nespretna, primjerice u testiranju u školi
gdje se tretman i naknadno testiranje mogu uklopiti u jedinstvenu cjelinu. Ponekad predispitivanje i
potreba da se upare rezultati prvog i naknadnog testiranja ugrožava potrebu ispitanika za
anonimnošću, što u nekim istraživanjima koja se bave osjetljivim pitanjima nije prihvatljivo.
U pravilu, nacrt koji se temelji samo na naknadnom opaža nju u stanovitoj je prednosti pred
nacrtom s dvokratnim mjerenjem, izuzev u slučaju kad postoji dvojba oko izjednačenosti grupa, ili,
još više kad su grupe neupitno različite (dakle, u kvazieksperimentima). U nekim situacijama
pojavljuje se i dodatni problem. U kliničkoj praksi, potrebno je poznavati razinu funkcioniranja
pacijenata ili stupanj njihove bolesti prije primjene tretmana (Kazdin, 1998). Primjerice da bismo
bili u mogućnosti provjeriti neki terapijski pristup za ublažavanje depresivnosti, moramo utvrditi
zadovoljavaju li uopće naši ispitanici dijagnostičke kriterije depresije. U takvim situacijama, nacrt
temeljen samo na naknadnom testiranju nije primjeren. I neki drugi specifični problemi umanjuju
vrijednost nacrta bez predispitivanja. Ostavljajući po strani moguću neujednačenost grupa, koja se u
najvećem broju slučajeva rješava slučajnim raspoređivanjem, ostaju problemi:
 nemogućnosti utvrđivanja veze između početnog rezultata i veličine promjene (primjerice,
djeluje li neka metoda unapređivanja sposobnosti čitanja više na slabe ili na bolje čitače),
 nemogućnosti utvrđivanja veze između početnih rezultata i odustajanja (primjerice, odustaju
li u nekom programu fizičkog vježbanja u većoj mjeri fizički manje ili više spremne
osobe)173
 slabije statističke snage testova što se koriste u takvim nacrtima (jednostavni t-rest ili
ANOVA)
 nemogućnosti utvrđivanja stope "spontane" promjene nevezane uz eksperimentalnu
varijablu.
Solomonov nacrt s četiri grupe
Ranije je mnogo raspravljano upravo o važnosti, ali i mogućim nedostacima primjene
predispitivanja. Kako bi na primjeren način kontrolirao proces senzibilizacije (odnosno interakcije
početnog mjerenja i eksperimentalne intervencije), Solomon (1949) je u istraživačku praksu uveo
nacrt s četiri grupe. U suštini, nacrt povezuje prethodno opisane nacrte u jedinstvenu cjelinu.
Shematski se može prikazati na sljedeći način:
Nacrt podjednako dobro kontrolira sve moguće prijetnje unutarnjoj valjanosti kao i nacrti od kojih
je sastavljen. Usto pruža brojne mogućnosti analize i nadvladava sve slabosti prethodno opisanih
nacrta. Solomonov nacrt omogućuje istraživaču da utvrdi učinke samog predispitivanja ispitujući
kontrolne grupe međusobno (O4 prema O6). Ako se pokaže da je kontrolna grupa koja je bila
dvokratno opažana, postigla statistički značajno različite rezultate od jednokratno opažane grupe,
može se zaključiti kako je tu razliku proizvele upravo predispitivanje. Takav je zaključak moguć
173
171
116
Ivo V.
zbog raspodjele ispitanika po slučaju koja jamči njihovu početnu izjednačenost. Zbog
probabilističkog karaktera te izjednačenosti, pretpostavka je ispravna uglavnom samo uz dovoljan
broj ispitanika.
Što je još važnije, nacrt omogućuje provjeru interakcije testiranja i tretmana, us poredbom
eksperimentalnih grupa koje su bile ili nisu bile početno ispitane (O2 prema O5). Razliku između tih
dviju grupa, međutim, moguće je tumačiti samim predispitivanjem ili njegovom interakcijom s
tretmanom. Da bi se provjerile obje pretpostavke, potrebno je provesti dvosmjernu analizu varijance
samo na rezultatima naknadnog ispitivanja. U tom slučaju u analizu se uključuju mjere O 2, O4, O5,
O6.
Faktori u analizi su:
 Tretman (O2 i O5 kao opažanje grupa koje su izložene tretmanu prema O4 i O6 kao
opažanja grupa kojima je tretman uskraćen)174
 Testiranje (O2 i O4 kao opaža nje grupa koje su podvrgnute početnom mjerenju prema
O5 i O6 kao opažanja grupa koje nisu).
O interakciji tretmana i testiranja može se ugrubo zaključiti na temelju veličine razlike između
grupe koja je istodobno izložena predispitivanju i tretmanu (O 2) s onima koje su izložene bilo
samom tretmanu (O5) ili samom predispitivanju (O4). Precizniji način podrazumijeva ipak računski
postupak koji će biti opisan u kasnijim poglavljima.
Nacrt nadalje omogućuje višestruku provjeru učinka eksperimentalne intervencije, putem
ponovljenog mjerenja na istim ispitanicima i na temelju usporedbe s kontrolnom grupom.
Učinkovitost neke nezavisne varijable može se naime provjeriti:
 usporedbom prvog i drugog mjerenja prve eksperimentalne grupe O1 prema O2
 usporedbom drugog mjerenja eksperimentalne i kontrolne grupe O2 prema O1
 usporedbom testiranja eksperimentalne i kontrolne grupe bez početnog mjerenja, O5 prema
O6
 usporedbom mjerenja prethodno neispitane eksperimentalne grupe i prvog mjerenja
eksperimentalne ili kontrolne grupe O5 prema O3 ili O1
Ako sve navedene usporedbe dosljedno upućuju na učinkovitost eksperimentalne intervencije, tako
izveden zaključak mnogostruko je vjerodosrojniji od onog temeljenog na nacrtu koji dopušta samo
jednu usporedbu kontrolne i eksperimentalne grupe. Dobitak na snazi nacrta i vjerodostojnosti
zaključaka ima i svoju cijenu. Solomonov nacrt kako smo ranije istaknuli, zapravo je spoj nacrta s
dvokratnim testiranjem i onog samo s naknadnim testiranjem. To znači da umjesto jednog,
provodimo dva eksperimenta, kako po broju ispitanika, tako i po cijeni i utrošku vremena. Takav,
dvostruki trud i izdatak moraju imati svoje opravdanje, a ono, prije svega, počiva na uočavanju
važnosti predispitivanja. Ako iz bilo kojeg razloga vjerujemo da bi početno testiranje senzibiliziralo
ispitanike i na taj način bilo potencijalna prijetnja vanjskoj i konstruktnoj valjanosti, dobro je to
provjeriti Solomonovim nacrtom. Ako, naprotiv, za to ne postoje teorijski razumna očekivanja,
istraživanje valja obaviti jednostavnijim i manje zahtjevnim eksperimentalnim nacrtom.
7.1.2 EKSPERIMENTALNI NACRTI UNUTAR ISPITANIKA (NACRTI PONOVLJENIH MJERENJA)
Grupni nacrti nisu uvijek prikladna eksperimentalna tehnika. Ponekad odbacivanje takvog nacrta
nalaže manjak statističke snage dok je u drugim slučajevima on jednostavno neprimjenjiv. Za
razliku od grupnih nacrta, u kojima su ispitanici izloženi samo po jednoj vrsti uvjeta, u nacrtu
unutar ispitanika, svaki od njih izložen 175 je svim eksperimentalnim uvjetima. Budući da se opaža
nje obavlja u više navrata, naziva se još i nacrtom ponovljenih mjerenja. Pritom se uspoređuje
ponašanje istih ispitanika unutar različitih uvjeta. Ako nezavisna varijabla uistinu utječe na zavisnu
(opaža no ponašanje), očekuje se da će ona poprimati različite vrijednosti u različitim
eksperimentalnim uvjetima, odnosno da će jedna s drugom biti u međusobnoj korelaciji.
174
172
175
173
117
Ivo V.
Nacrtom unutar ispitanika obično je lakše dokazati utjecaj nezavisne varijable jer on nije zamagljen
razlikama među ispitanicima. Uključivanje istih ispitanika li sve eksperimentalne uvjete donosi
dvostruku dobit:
1) uklanja osobne razlike iz međugrupnog razlikovanja, čime osnažuje unutarnju valjanost i
2) kontrolira varijancu osobnih razlika unutar grupa, smanjujući eksperimentalnu grešku, čime
unapređuje valjanost statističkog zaključka.
Prisjetimo li se kako je bit eksperimenta upravo u stvaranju situacije u kojoj je nezavisna varijabla
jedini čimbenik koji poprima različite vrijednosti u različitim eksperimentalnim uvjetima, lako
ćemo zapaziti da se u nacrtu na nezavisnim grupama, usporedo s njome mijenjaju i ispitanici. Iako
bi slučajno raspoređivanje trebalo zajamčiti izjednačenost grupa, takva je zadaća, prisjetimo se
rasprave o probabilističkoj prirodi izjednačavanja, uvijek tek djelomično postignuta. Zbog toga
ponekad nije izvjesno koliko je do promjene u ponašanju dovela nezavisna varijabla, a koliko je
riječ o prividu zbog početnih razlika među grupama.
Osnovna prednost eksperimentalnog nacrta unutar ispitanika leži u njegovoj većoj statističkoj snazi.
Njime je, naime, lakše otkriti učinke nezavisne varijable ako takvi uistinu postoje. U nacrtu unutar
ispitanika eksperimentator nastoji otkriti promjene u ponašanju istih ispitanika u različitim
situacijama. Naprotiv, u eksperimentu između ispitanika, posao je složeniji. Potrebno je otkriti
promjenu u ponašanju različitih ispitanika u različitim uvjetima, što je, dakako, mnogo teže jer se
različiti ispitanici između sebe razlikuju mnogo više od istih ispitanika u odnosu na sebe same.
Početne razlike među ispitanicima (primjerice, u inteligenciji, brzini reakcije, pamćenju ili nekoj
drugoj kvaliteti) najveći su dio eksperimentalne greške, odnosno u najvećoj mjeri zamagljuju
konačne rezultate. Uspijemo li ih odstraniti, učinit ćemo vlastiti nacrt mnogo djelotvornijim
sredstvom provjere hipoteza. Takvo odstranjivanje možemo postići i u nacrtu s nezavisnim
grupama, ispitivanjem homogene skupine ispitanika (uklanjanjem osobnih razlika prije provođenja
eksperimenta) ili uparivanjem (izjednačavanjem prema nekom unaprijed određenom obilježju), ali
ni jedna od ovih metoda nije savršena. Najbolji je način izjednačiti ispitanike prema svim mogućim
obilježjima koje ih međusobno razlikuju, a to je izvedivo samo s ispitanicima koji su sami sebi
kontrola. Kažemo stoga da nacrti unutar ispitanika u potpunosti kontroliraju varijancu osobnih
razlika, odnosno stupanj u kojem se ispitanici početno međusobno razlikuju. Utvrdimo li razlike u
ponašanju176 unutar različitih eksperimentalnih uvjeta, ne moramo brinuti jesu li one možda
posljedica razlika u ponašanju jedne grupe ispitanika u odnosu na drugu. Na neki način, nacrti
unutar ispitanika su grupni nacrti u kojima su ispitanici savršeno upareni jer svaki od njih sam sebi
služi kao kontrola. Upravo način na koji odstranjuju varijancu osobnih razlika iz varijance greške,
čini takve eksperimente osjetljivijima, odnosno statistički snažnijima. Ako razlike u
eksperimentalnim uvjetima postoje, takvi su nacrti mnogo uspješniji u njihovu otkrivanju. Zbog
veće statističke snage što je posjeduju, nacrti unutar ispitanika pogodni su i u onim istraživanjima u
kojima je očekivana veličina učinka mala. Također su dragocjeni pri bavljenju zavisnim
varijablama prema kojima se sudionici eksperimenta bitno međusobno razlikuju, jer takav
varijabiliret statistički potpuno uklanjaju iz nacrta, baveći se samo preostalom varijancom.
Zbog veće statističke snage, nacrti unutar ispitanika su i mnogo ekonomičniji. Ako želimo ispitati
ponašanje u dvjema eksperimentalnim situacijama, primjenom nacrta između, umjesto unutar
grupa, bit će nam, ovisno o korelaciji prvog i drugog mjerenja u potonjem, potrebno značajno veći
broj ispitanika za jednaku vjerojatnost odbacivanja netočne nul-hipoteze, Prednost nacrta
ponovljenih mjerenja još je vidljivija pri testiranju većeg broja eksperimentalnih uvjeta, jer se u tom
slučaju broj ispitanika ne mijenja značajnije, dok za nacrte s nezavisnim grupama valja imati
onoliko grupa koliko i različitih uvjeta. Kada na raspolaganju imamo malen broj ispitanika, nacrti s
ponovljenim mjerenjima idealan su izbor.
U nekim slučajevima, nacrti unutar ispitanika jedina su razumna odluka. Tako se, primjerice,
eksperimenti u području percepcije ili psihofizike često temelje na usporedbama procjena danih u
različitim eksperimentalnim uvjetima, ali je vrijeme koje je potrebno ispitanicima da obave takvu
176
174
118
Ivo V.
zadaću iznimno kratko. Želi li provjeriti brzinu jednostavne psihomotorne reakcije na svjetlosne u
odnosu na zvučne podražaje, eksperimentator će svakako pribjeći nacrtu unutar ispitanika jer bi bilo
nerazborito za takvo kratko i nezahtjevno istraživanje koristiti nezavisne grupe i dvostruko veći broj
ispitanika nego što je doista potrebno.
7.1.2.1 OGRANIČENJA NACRTA UNUTAR ISPITANIKA
Iako se na prvi pogled čini kako je nacrt unutar ispitanika općenito nadmoćniji u odnosu na grupni
nacrt zbog svoje ekonomičnosti, mogućnosti brže izvedbe i veće osjetljivosti pri malim učincima
nezavisne varijable, treba reći da takva tehnika istodobno posjeduje i stanovite slabosti zbog kojih
je nije moguće primijeniti u svim situacijama. Katkad je takav nacrt neizvediv jer jedna
eksperimentalna situacija nepovratno mijenja ispitanike, što onemogućuje njihovo testiranje u
drugim eksperimentalnim uvjetima, dok u drugim prigodama njihovo izostavljanje nalažu posve
praktične okolnosti.177
Međusobno ometanje tretmana
Često smo suočeni s problemom da jedan ispitanik može biti izložen samo jednom
eksperimentalnom uvjetu. Njegovo izlaganje većem broju uvjeta, kako to traže nacrti unutar
ispitanika je ili nemoguće, ili mijenja učinke kasnijih uvjeta, što je sa stajališta unutarnje valjanosti
podjednako neprihvatljivo.
Prenošenje učinka
Učinci neke eksperimentalne intervencije mogu potrajati dulje vrijeme i ostati na snazi i pošto je
intervencija okončana. U slučaju eksperimenta unutar ispitanika takva pojava može biti velik
problem jer nipošto ne želimo da se promjene što ih je proizveo jedan eksperimentalni uvjet prenesu
i nastave na onaj sljedeći te time zamagle njegovu samostalnu učinkovitost. Ispitujemo li,
primjerice, okus nekoliko vrsta bezalkoholnih pića različite slatkoće, sva je prilika da će ispitanik
nakon kušanja slađeg napitka zadržati okus u ustima te će mu se sljedeći napitak činiti manje
slatkim nego što bi bio da ga je kušao samog za sebe. Isto tako nakon kušanja manje slatkog
napitka, drugi će se činiti još slađim nego što uistinu jest.
Valja razlikovati učinke redoslijeda od nastavljanja djelovanja učinka određenog eksperimentalnog
uvjeta. Učinci redoslijeda očituju se kao posljedica položaja jednog uvjeta unutar niza drugih
uvjeta. Nebitno je pritom o kakvom se uvjetu radi jer se učinci redoslijeda uvijek očituju na isti
način (uvježbavanjem, umaranjem) neovisno o njegovu sadržaju. Prenošenje učinka pojavljuje se,
naprotiv, upravo kao posljedica sadržaja uvjeta. Ako se radi o piću izrazite slatkoće, ono će uvijek,
bez obzira na redoslijed, imati istovjetan utjecaj, smanjivanja osjetljivosti okusnih receptora na
slatko. Uz pretpostavku podjednakog međusobnog utjecaja različitih eksperimentalnih uvjeta
jednog na drugi, kontrola prenošenja učinaka obavlja se na neki od načina koji će biti opisani
kasnije, višekratnim testira njem ili potpunim uravnoteženjem te uravnoteženim latinskim
kvadratom.
U drugim prilikama jedan se tretman suprotstavlja drugome tako da je njihovo sukcesivno testiranje
na istim ispitanicima neizvedivo bez obzira na vremenski slijed. Zanimaju li nas učinci različitih
televizijskih emisija dječjeg programa, onih što sadrže veću količinu nasilja i onih koja nude samo
različite oblike društveno poželjnog ponašanja, na sadržaj i oblik igre, nećemo biti u mogućnosti
takav eksperiment obaviti na istim ispitanicima prikazujući im uzastopce oba tipa emisija.
Prikažemo li im bilo agresivnu bilo društveno poželjnu emisiju kao prvu, ona će utjecali na njihovu
igru ne samo početno, već i nakon gledanja druge, oprečne emisije. Učinci pojedinih situacijskih
varijabli su, kako možemo zaključiti, postojani i njihovo djelovanje perzistira i nakon fizičkog
uklanjanja. U tim situacijama uopće nije uputno koristiti nacrt unutar ispitanika.178
U trećem slučaju sudjelovanje u više različitih uvjeta je posve besmisleno jer intervencija trajno
mijenja ispitan ike. Primjerice, usporedba različitih metoda učenja čitanja ne može se provesti na
grupi koja prvo uči jednom, a potom drugom metodom jer se jednom na uče ne vještine ne mogu
177
175
178
176
119
Ivo V.
odučiti. Isti je slučaj s učenjem drugih vještina, ali i s nekima od učestalih psihologijskih
intervencija, primjerice, psihoterapijom. Dakako, u takvoj su situaciji nacrti ponovljenih mjerenja
posve isključeni i prepuštaju mjesto grupnim nacrtima.
Različiti transfer
Premda sličan prethodno opisanom prenošenju učinaka, različiti transfer odnosi se na ponešto
drukčiju pojavu. Učinak nekog tretmana može, naime, ovisiti o tome što mu prethodi. Neki
eksperimentalni uvjeti mogu, naime, promijeniti (popraviti ili pokvariti) učinak u onima koji slijede
nakon njih.
Uzmimo, primjerice, da nas zanima mogućnost pamćenja složenih geometrijskih likova samo na
temelju vizualno percepcije ili potpomognuto verbalnim opisom. Ispitanici koji su pamtili
kombinirane vizualno i verbalno, što je općenito učinkovitija metoda, neće se moći "odučiti'' od
toga kako bi pristupili drugom dijelu eksperimenta u kojem se od njih traži samo zapamćivanje na
temelju vizualne zamjedbe. Očekuje se da će i nadalje pamtiti potpomažući se unutarnjim govorom,
što, dakako, ugrožava osnovne zaključke tako provedenog eksperimenta. U iznesenom primjeru,
jedan od eksperimentalnih uvjeta utječe na ponašanje u drugim uvjetima, zamagljujući njihove
stvarne učinke. Istraživač bi stoga morao na svim ispitanicima prvo ispitati metodu pamćenja samo
na temelju vizualne percepcije i tek potom uputiti ispitan ike kako mogu unaprijediti vlastito
pamćenje dvojnim kodira njem vizualnih podražaja. No takav je postupak povezan s drugim
velikim problemom nacrta unutar ispitanika koji ćemo raspraviti u nastavku, a odnosi se na učinke
vezane za redoslijed izloženosti eksperimentalnim uvjetima.
Može se vjerovati je da će dvojno kodiranje unaprijediti pamćenje u idućem uvjetu, ali ne i obrnuto,
odnosno ne očekujemo ela će istovjetan učinak proizvesti uvođenje jednostrukog kodiranja prije
dvostrukog. Zbog toga takvu pojavu zovemo različitim (diferencijalnim) transferom. Ako
jednostruko kodiranje označimo s A, a dvostruko s B tada će u situaciji AB razlika među
tretmanima odražavati stvarne vrijednosti, dok će u situaciji BA, ona biti povoljnija za uvjetA nego
što bi trebala biti. Takva pojava dovodi u pitanje unutarnju valjanost eksperimenta umjetno
smanjujući razlike među tretmanima. Premda postoje načini ela se takva pojava prepozna i smanji,
najbolja preporuka za istraživača suočenog s različitim transferom jest okretanje grupnom nacrtu.179
Praktičnu ograničenja
Ekonomičnost nacrta ponovljenih mjerenja koja se ogleda u potrebi za manjim brojem ispitanika u
odnosu na nacrte s nezavisnim grupama često je umanjena praktičnim problemima koji se pritom
pojavljuju. U pravilu, takvi se nacrti bave ispitanicima mnogo intenzivnije, zahtijevajući od svih da
provedu dulje vrijeme li eksperimentu, ponekad i više dana uzastopce. Nažalost, takvi eksperimenti
mogu ubrzo postati zamorni ili dosad ni ispitanicima, što će bez dvojbe utjecati na njihove odgovore
i ponašanje. U mjesto uobičajenih reakcija, ispita nici mogu postupati nestrpljivo, ubrzano,
nemotivirano ili na drugi atipičan način koji će smanjiti valjanost njihovih odgovora i ograničiti
vjerodostojnost nalaza. Valja stoga dobro odvagnuti praktične prednosti u odnosu na moguće
nedostatke takvih nacrta.
Često nacrti unutar ispitanika nisu opterećujući samo za ispitanike, već i za eksperimentatora. Ako
različiti eksperimentalni uvjeti nalažu prilagođavanje aparature ili posebnu pripremu,
eksperimentator gubi mnogo vremena prilagođavajući je svakom ispitaniku onoliko puta koliko ima
uvjeta. Isti problem rješava se unutar grupnog nacrta mnogo lakše, tako da se grupa koja sudjeluje u
istom eksperimentalnom uvjetu ispita u cjelini, jedan ispitanik za drugim.
7.1.2.2 KONTROLA U EKSPERIMENTIMA UNUTAR ISPITANIKA
Učinci redoslijeda: uravnoteživanje
Eksperimenti unutar ispitanika strukturirani su tako da se isti ispitanik višekratno testira u svakom
eksperimentalnom uvjetu koji predstavlja različitu razinu ili kvalitetu nezavisne varijable. Kad smo
raspravljali o prijetnjama unutarnjoj valjanosti, naglasili smo da testiranje samo po sebi može
179
177
120
Ivo V.
dovesti do promjene u ponašanju ili uratku ispitanika, bez ikakvih promjena eksperimentalnih
uvjeta. Jednake učinke može proizvesti i sazrijevanje, odnosno sve unutarnje promjene ispitanika
uvjetovane protokom vremena. Ispitanici tako mogu postajati sve bolji i uspješniji zbog
uvježbavanja i veće upoznatosti s testovnom situacijom ili pak sve slabiji zbog umora i dosade.
Budući da ispitanici neminovno bivaju dovedeni u jedne uvjete prije nego u druge, svaka
povezanost između redoslijeda i tretmanskog uvjeta može biti prijetnja unutarnjoj valjanosti.
Promjene koje se odvijaju u vremenu, neovisno o mijenjanju eksperimentalnih uvjeta, nazivaju se
učincima redoslijeda, progresivnom greškom ili serijalnim učincima. Progresivna greška najčešće se
očituje-u pojavama uvježbavanja ili umaranja ispitanika.
Slično kao i kod grupnih nacrta, u kojima se varijanca greške u eksperimentu, nastala kao posljedica
individualnih razlika ispitanika, kontrolira njihovim slučajnim raspoređivanjem u skupine. u
nacrtima unutar ispitanika progresivna greška nastala samim protokom vremena mora se
uravnotežiti kako bi podjednako180 opteretila sve eksperimentalne uvjete i osigurala visoku
unutarnju valjanost. U protivnome se može dogoditi da dođemo do posve krivih zaključaka o
utjecaju nezavisne na zavisnu varijablu. Ispitujemo li tako dva različita rasporeda kontrolnih
instrumenata u novom automobilu i njihov utjecaj na brzinu i sigurnost vožnje, bolji rezultati s
rasporedom koji je davan uvijek drugi po redu neće nam dopustiti jasan zaključak, jer ne možemo
isključiti učinke redoslijeda. Nije vjerojatno da su vozači između dviju vožnji popravili svoju
vozačku vještinu, ali je gotovo sigurno da im je uvježbavanje na novom automobilu tijekom prve
vožnje pomoglo i popravilo učinak u drugoj. Ili su, možda, ako je pokus predugo trajao, nakon prve
vožnje izgubili motivaciju, umorili se ili se počeli dosađivati, što im je umjetno smanjilo učinak pri
kasnijoj vožnji. Vidimo da progresivni učinci poprimaju čas pozitivne, a čas negativne vrijednosti.
Ponekad je na djelu uvježbavanje te učinak s vremenom raste, dok u drugim slučajevima, naročito
kod monotonih zadataka, očekujemo snižavanje učinka usporedo s trajanjem eksperimenta zbog
zamora i opadanja koncentracije.
Nacrti unutar ispitanika dijele se primarno s obzirom na to kako rješavaju problem učinaka
progresivne greške. Sukladno tome, razlikujemo dva temeljna tipa nacrta.
1. Višekratno testiranje po eksperimentalnom uvjetu
 Zadavanje nizova obrnutim redom
 Testiranje prema slučajnim blokovima
2. Jednokratno testiranje po eksperimentalnom uvjetu
 Potpuni nacrt
 Nepotpuni nacrt
U nacrtu unutar ispitanika s ponovljenim testiranjem učinci redoslijeda jednoliko se raspoređuju
višekratnom primjenom eksperimentalnih uvjeta svaki put drugim vremenskim slijedom.
Uravnoteženje se na taj način postiže za svakog ispitanika. Naprotiv, u nacrtu jednokratnog
mjerenja, ispitanici se samo po jednom susreću sa svakim eksperimentalnim uvjetom, a redoslijed
uvjeta uravnotežuje se skupno za sve ispitanike, a ne svakog od njih pojedinačno.
7.1.2.3 VIŠEKRATNO TESTIRANJE PO EKSPERIMENTALNOM UVJETU
Prvi od načina uravnoteživanja progresivne greške obavlja se za svakog ispitanika pojedinačno.
Osnovna zamisao nacrta sastoji se u raspoređivanju učinaka progresivne greške podjednako za sve
uvjete svakog ispitanika.
Zadavanje nizova obrnutim redom
Ne možemo očekivati da će se učinci redoslijeda pravilno rasporediti ako jedan od eksperimentalnih
uvjeta uvijek prethodi drugome (primjerice, eksperimentalni 181 uvjet A uvijek prethodi uvjetu B
prema shemi AB). U tom slučaju progresivna će greška uvijek biti manja za eksperimentalne uvjete
prve po redoslijedu (A). Kako je uravnoteživanje nemoguće postići samo jednim izlaganjem
eksperimentalnoj situaciji, ispitanici joj bivaju izloženi višekratno, onoliko koliko je potrebno da bi
180
178
181
179
121
Ivo V.
se neutralizirali učinci redoslijeda. Umjesto nacrta AB ili BA, istraživač će u tom slučaju pribjeći
nacrtu ABBA. U takvom nacrtu, svi će ispitanici prvo biti izloženi uvjetu A, potom dvaput za
redom uvjetu B' i naposljetku ponovno uvjetu A. Očekuje se pritom da će uvjeti A i B biti
podjednako opterećeni progresivnom greškom koja vodi linearnom povećanju ili smanjenju učinka.
Poslužimo se jednostavnim računom da bismo približili logiku takvog nacrta. Uzmimo da učinci
umora u nekom eksperimentu rastu pravocrtno i da poprimaju vrijednost 0,1,2,3 ... na način da
svaka sljedeća seansa biva njima opterećena za jedinicu više. U nacrtu AB prvi eksperimentalni
uvjet (A) posve je neopterećen greškom, a drugi (B) je opterećen jediničnom razinom greške.
Uvjeti, prema tome, nisu izjednačeni jer je uvjet B opterećeniji utjecajem redoslijeda nego A. U
nacrtu ABBA, međutim, oba su uvjeta podjednako opterećena greškom (A: 0+ 3=3 i B: 1+2 =3), što
nam dopušta da eventualne razlike u ponašanju pripišemo uvjetima, a ne njihovom redoslijedu. Ako
očekujemo da će vrijeme pridonijeti uvježbavanju više negoli umoru, opterećenost progresivnom
greškom različitih uvjeta ići će od najvećih prema manjim vrijednostima, npr. 3, 2, 1, 0, jer se
početno snažni učinci uvježbavanja postupno gube u vremenu.
Preduvjet za ovakvo razmišljanje jest pretpostavka o linearnosti porasta progresivne greške. U
praksi je to rijetko dokraja točno jer porast greške ne mora biti pravocrtan, U nekim slučajevima,
štoviše, opterećenost progresivnom greškom raspodjeljuje se prema krivulji, a ne pravcu. Uzmimo
za primjer učenje besmislenih slogova kod kojeg su u početnim serijama vidljivi učinci
uvježbavanja, a u kasnijima umora. Zbog toga je iznimno važno posvetiti osobitu pozornost
planiranju eksperimenta koji uključuje ponovljena mjerenja kako bi se unaprijed predvidjelo načine
kontroliranja učinaka progresivne greške. Dodatni problem slične naravi jest pojavljivanje
progresivne greške samo na početku testiranja. Pri obavljanju nekih zadataka postiže se nagli
napredak na samome početku zbog uvježbavanja, dok je kasniji prirast zanemariv. U tom slučaju
uravnoteživanje nije dovoljno, već se pribjegava zanemarivanju početnih serija u kojima se
ispitanici samo uvježbavaju.
Uravnoteživanje prema shemi ABBA najjednostavniji je oblik kontrole učinaka redoslijeda koji se
koristi u prilici kad postoje samo dva tipa eksperimentalnih uvjeta. Ako nas zanima pamte li se
bolje dulje ili kraće riječi, poslužit ćemo se nacrtom u kojem će ispitanik najprije učiti listu duljih
riječi (A), potom za redom dvije liste kraćih (BB) te naposljetku ponovno listu duljih riječi (A).
Iako je takav nacrt problematičan zbog drugih razloga (primjerice pojave transfera i kontra-
transfera), zadovoljava kao ilustracija temeljne ideje ABBA nacrta.182
Uz veći broj eksperimentalnih uvjeta osnovni nacrt može se koristiti uz minimalno prilagođavanje,
a sastoji se u neprekidnom izmjenjivanju nizova obrnutim redom. U slučaju ispitivanja triju uvjeta,
A, B i C, istraživač će, primjenjujući istu logiku, ispitanicima odrediti sljedeći raspored testiranja:
ABCCBA. Uz četiri uvjeta nacrt poprima oblik ABCDDCBA itd.
Tijekom primjene nacrta prema osnovnoj shemi ABBA može doći do problema predviđanja. To se
pojavljuje u trenutku kaci ispitanici razviju očekivanja o tome koji će se od eksperimentalnih uvjeta
pojaviti kao sljedeći u nizu. U tom slučaju ispitanikovo ponašanje može biti više odraz njegovih
očekivanja negoli stvarnog učinka eksperimentalne situacije. Kad bismo, primjerice, nekim
eksperimentom htjeli provjeriti uočavaju li ispitanici bolje ljudska lica (A), životinje (B) ili
predmete (C), mogli bismo im ih sukcesivno rahistoskopski (u vrlo kratkom vremenu ekspozicije
koje ne dopušta potpuno prepoznavanje) prikazivati redom ABC-CBA-ABC-CBA itd. Ako bismo
tako nastavili nizanje, ispitanici bi mogli odgovarati u skladu sa svojim očekivanjima, a ne
stvarnom zamjedbom. U pravilu, učinak predviđanja nije ozbiljan problem jer je broj nizova
ponavljanja obično nedovoljan da bi ispitanici prepoznali načelo prema kojima je određen
redoslijed. Ipak svakako zaslužuje da se uzme u obzir i, ako to opravda bojazan od greške vezane za
predviđa nje, odstupi od sheme ABBA i primijeni neki prikladniji nacrt.
Testiranje prema slučajnim blokovima
182
180
122
Ivo V.
Postupak koji uključuje ovaj nacrt posve je usporediv s prethodno opisanim načinom slučajnog
raspoređivanja ispitanika u skupine pri korištenju grupnih nacrta. Temeljno pravilo je da se svaki
eksperimentalni uvjet pojavljuje jednom prije nego što se bilo koji drugi uvjet ponovi po drugi put.
Unutar svakog bloka poredak uvjeta je slučajan, određen tablicom slučajnih brojeva, bacanjem
kocke ili drugom metodom izbora po slučaju. Takvom strategijom uspješno se rješava problem
predviđanja nadolazećeg eksperimentalnog uvjeta o kojem je prethodno raspravljano. Za razliku od
zadavanja nizova obrnutim redom, koje u prethodnom primjeru ima sljedeće odlike:
ABC-CBA-ABC-CBA ...
slučajni blokovi mogu izgledati ovako:
CAB-BCA-ACB-ABC ...
7.1.2.4 JEDNOKRATNO TESTIRANJE PO EKSPERIMENTALNOM UVJETU
Jedan od ozbiljnih nedostataka upravo opisanog nacrta svakako je potreba da se ispitanici više puta
testiraju u istim eksperimentalnim uvjetima. Usporedo s povećanjem broja različitih
eksperimentalnih uvjeta, raste i broj nizova kojima su ispitanici izloženi. Nerijetko se stoga dešava
da eksperiment postane vremenski opsežan, skup183 ili pretjerano dosada n ispitanicima. Kako bi se
takve posljedice izbjegle, pristupa se različitoj strategiji kontrole učinaka redoslijeda. Umjesto da ih
kontrolira na svakom ispitaniku posebno, to se čini na svima zajedno.
Takva vrsta uravnoteživanja služi istoj svrsi kao i ono pri višekratnom testiranju raspoređivanju
učinaka progresivne greške podjednako na sve uvjete sadržane u eksperimentu. Obično u
eksperimentu nismo toliko zainteresirani za svakog pojedinačnog ispitanika koliko za skupni
rezultat cijelog eksperimenta, odnosno usporedbu prosječnih vrijednosti za svaki od
eksperimentalnih uvjeta. Stoga nam jednokratno testiranje pruža sasvim dostatne informacije.
Potpuni nacrt
U potpunom nacrtu uravnoteživanje se postiže jednokratnom primjenom svih mogućih rasporeda
(permutacija) eksperimentalnih uvjeta. Pri ispitivanju samo dva uvjeta, polovica ispitanika bi se
ispitala redoslijedom AB, a druga polovica redoslijedom BA. Ukupni broj nizova potrebnih za
obavljanje eksperimenta može se izračunati kao E! (pri čemu je E broj različitih eksperimentalnih
uvjeta, a ! je oznaka za faktorijele).
Ako eksperiment uključuje tri eksperimentalna uvjeta, A, B i C, broj mogućih rasporeda iznosi 3!
(3 X 2 X 1) ili 6. To su:
ABC BAC
ACB CAB
BCA CBA
Za potpuno uravnoteženi nacrt svojstveno je da:

1. se svaki eksperimentalni uvjet pojavljuje jednako često u svakom položaju u nizu
2. svaki uvjet prethodi i nastavlja se na neki drugi uvjet jednako često
3. svaki uvjet prethodi i nastavlja se na neki drugi uvjet jednako često u svakom položaju u
nizu
Najveći problem potpunog uravnoteživanja jest eksponencijalno povećanje broja mogućih
rasporeda usporedo s povećanjem broja eksperimentalnih situacija. Dok je, kako smo vidjeli, za tri
uvjeta potrebno 6 nizova, za 4 ih je potrebno već 24, za pet 120, a za šest već 720. Treba naglasiti
da je za potpuno uravnoteženi nacrt potreban najmanje jedan ispitanik u svakom eksperimentalnom
nizu, što znači da je za tri uvjeta dovoljno svega šest ispitanika, ali ih za pet uvjeta moramo sakupiti
najmanje 120. Dakako, svega šest ispitanika vjerojatno ne bi omogućilo dovoljnu statističku snagu
183
181
123
Ivo V.
eksperimentu. Povećanje broja ispitanika mora biti umnožak minimalno potrebnog broja, pa tako za
tri uvjeta možemo imati 12, 18,24 ili više ispitanika (umnošci broja 6), a na isti način postupamo i
kod većeg broja uvjeta.184
Nepotpuni nacrt
Kad god se u eksperimentu pojavljuje samo dio mogućih nizova, radi se o nacrtu nepotpunog
uravnoteživanja. Takav je nacrt nužno koristiti u prilikama u kojima se testira veći broj
eksperimentalnih uvjeta. U mjesto da, testirajući 6 uvjeta, izvedemo 720 nizova na 720 ispitanika,
možemo postupiti drukčije, ograničavajući se na samo manji broj mogućih permutacija, ali pazeći
istodobno da redoslijed prezentacije bude slučajan za svakog ispitanika. Taj postupak, doduše, ne
kontrolira učinak redoslijeda u mjeri u kojoj to čini potpuni nacrt, ali je s druge strane mnogo bolji
od ponavljanja istog niza za sve ispitanike. Da bi kontrola učinaka redoslijeda bila na prihvatljivoj
razini, potrebno je uključiti u eksperiment barem onoliko nizova koliko ima različitih
eksperimentalnih uvjeta (pa tako u eksperimentu sa 6 uvjeta valja uključiti najmanje 6 nizova, što je
još uvijek mnogo manje od 720).
Uzorkovanje iz populacije mogućih nizova strategija je koja se primjenjuje kad nam je na
raspolaganju manje ispitanika, vremena ili novaca nego što bi zahtijevalo provođenje potpunog
nacrta. Osim uzorkovanjem, istraživač se pri uporabi nepotpunog nacrta može poslužiti tzv.
latinskim kvadratom, koji je dobio ime prema starorimskoj slagalici u kojoj su se latinska slova
pojavljivala samo po jednom u stupcu i retku.
Uz pomoć savršeno uravnoteženog latinskog kvadrata osigurava se da:
1. se svaki eksperimentalni uvjet pojavljuje jednako često na svakom položaju u nizu
2. svaki uvjet prethodi i nastavlja se na neki drugi uvjet jednako često (to vrijedi samo za
uravnoteženo latinske kvadrate)
Primjer savršeno uravnoteženog latinskog kvadrata za 6 uvjeta:
Uvjerimo se da zadovoljava navedene uvjete. Pogledajmo, primjerice, uvjet A. Na svakom mjestu u

nizu (prvom cio šestom) pojavljuje se po jednom. Podjednako često mu prethode i nastavljaju se na
nj svi ostali uvjeti (B, C, D, E i F). Pošto na temelju latinskog kvadrata izabere nizove, istraživač će
rasporediti ispitanike po slučaju kako bi svaki bio izložen jednome od njih.185
7.1.3 SLOŽENI (FAKTORIJALNI) EKSPERIMENTALNI NACRTI
Dosad smo raspravljali o eksperimentima u kojima je provjeravana samo jedna nezavisna varijabla.
Njima se nastoji istražiti kako se neko ponašanje mijenja u funkciji promjene vrijednosti izučava ne
nezavisne varijable. Kako bi se taj utjecaj izolirao, preostali faktori koji bi mogli utjecati na
ponašanje se odstranjuju, drže stabilni ma ili uravnotežuju prethodno opisanim postupcima
eksperimentalne kontrole. U stvarnom životu, međutim, utjecaji se nikad ne očituju izolirano. Stoga
je u pravilu mnogo poželjnije i bliže svakodnevici istodobno ispitivati veći broj nezavisnih varijabli.
Nacrti kojima to postižemo nazivaju se složenima ili faktorijalnima. Osvjedočit ćemo se u narednim
poglavljima da vanjski faktori u jednom istraživanju 'mogu postati nezavisne varijable u drugom,
184
182
185
183
124
Ivo V.
odnosno da ono što jednom povećava eksperimentalnu grešku i ugrožava unutarnju valjanost, drugi
put može biti varijabla čiji utjecaj nastojimo istražiti.
Uzmimo da ispitujemo učinkovitost različitih vrsta nagrada pri usmjeravanju dječjeg ponašanja.
Koristeći se jednostavnim eksperimentalnim nacrtom, mogli bismo prvo provjeriti kako na
ponašanje utječu verbalne pohvale i odobravanja. U drugom bismo eksperimentu potom provjerili
kako na isto ponašanje utječu materijalne nagrade poput slatkiša, igrački ili slikovnica. Takav
pristup problemu, međutim, razmjerno je neučinkovit. On zahtijeva mnogo više vremena, iziskuje
veće troškove, a u pravilu traži i veći broj ispitanika. Osim toga je manjkav i u spoznajnom pogledu.
Pri provođenju takvih nacrta ne znamo ništa o tome kakav je odnos među nezavisnim varijablama,
odnosno postoji li među njima ikakva interakcija. Može se pokazati da su i jedna i druga vrsta
nagrade učinkovite u mijenjanju ponašanja, ali ono što istraživaču ostaje skriveno jest, na primjer,
hoće li istodobno davanje materijalne nagrade povećati ili smanjiti učinkovitost verbalnih.
Nema načina da provjerimo takve pretpostavke ako zasebno izučavamo odnos svake nezavisne
varijable. Potreban nam je nacrt u kojem će istovremeno biti uključene obje. Složeni ili faktorijalni
nacrt bavi se istodobno dvjema ili većim brojem nezavisnih varijabli. Uz osnovnu informaciju o
tome kako djeluje svaka od njih zasebno, takav nacrt nudi i zaključke o njihovim međusobnim
interakcijama. Zbog toga je nadmoćan u odnosu na jednostavni nacrt i poželjan u najvećem broju
psihologijskih istraživanja. Djelovanje svake pojedine eksperimentalne varijable naziva se glavnim
učinkom, a njihov združeni doprinos koji se ogleda u tome da se utjecaj jedne nezavisne varijable
mijenja ovisno o razini druge (drugih) naziva se interakcijskim učinkom.
7.1.3.1 GLAVNI UČINCI
Traganje za glavnim učincima blisko je postupcima što ih rabimo u jednostavnom eksperimentu. Pri
tome nastojimo odgovoriti na pitanje: Jesu li promjene 186 nezavisne varijable utjecale na mijenjanje
opaženog ponašanja? Ako je eksperiment temeljen na proučavanju samo jedne nezavisne varijable,
sve što njime nastojimo provjeriti svodi se na glavne učinke, iako, kad se radi o jednostavnim
eksperimentima, nije uobičajeno koristiti taj naziv. Kada Je, naprotiv, u eksperiment uključeno više
od jedne nezavisne varijable, za svaku od njih moguće je izračunati glavne učinke. To znači da ima
onoliko glavnih učinaka koliko nezavisnih varijabli. Izračunavanje glavnih učinaka odnosno
izoliranog djelovanja svake nezavisne varijable prvi je korak u analizi složenog eksperimentalnog
nacrta. U našem primjeru, prvi bi problem bio odrediti zasebne učinke verbalnog i materijalnog
nagrađivanja na povećanje učestalosti željenog ponašanja. Glavne učinke moguće je u tom slučaju
definirati kao:
 Koliko je verbalno nagrađivanje (pohvale i odobravanje) utjecalo na povećanje učestalosti
poželjnog ponašanja.
 Koliko je materijalno nagrađivanje (slatkiši, igračke i slikovnice) utjecalo na povećanje
učestalosti poželjnog ponašanja.
Da bismo utvrdili glavne učinke, potrebno je primijeniti odgovarajuću statističku metodu, a u
slučaju složenog nacrta to je analiza varijance187. Odgovore o glavnim učincima dobili bismo, kako
smo ranije naglasili, također i provođenjem dvaju jednostavnih eksperimenata, no oni bi nas lišili
mogućnosti prosuđivanja o međusobnoj interakciji nezavisnih varijabli.
7.1.3.2 INTERAKCIJSKI UČINCI
Pored toga što su ekonomičniji, složeni nacrti su, kako smo rekli, spoznajno nadmoćniji u odnosu
na jednostavne. Jednostavni su, naime, potpuno slijepi za međusobni odnos i zajednički učinak
dviju ili većeg broja nezavisnih varijabli. Moguće je, primjerice, pretpostaviti da verbalno
nagrađivanje djeluje, odnosno povećava učestalost poželjnoga ponašanja djece, ali samo u
odsutnosti materijalnih nagrada, ili, s druge strane, da obje nagrade zajedno imaju veći učinak nego
186
184
187
Analiza varijance i širi regresijski model iz kojeg se može izvesti podrobnije su opisani u zasebnim poglavljima, dok
se na ovom mjestu daje krajnje pojednostavljena logika neopterećena matematičkim pristupom.
125
Ivo V.
njihov prosti zbroj. U oba slučaja radi se o stanovitom obliku međudjelovanja ili interakcije među
eksperimentalnim varijablama.
Pokušajmo na jednostavan način pokazati što zapravo znači interakcija. Pretpostavimo da zasebno
uzeti, učinci verbalnog i materijalnog nagrađivanja Iznose u oba slučaja 100. Ili drukčije rečeno,
učestalost se poželjnog ponašanja kako pod utjecajem verbalnog, tako isto i materijalnog
nagrađivanja povećava faktorom 100. Ako između dva načina nagrađivanja ne postoji nikakva
interakcija, onda bi istodobna188 primjena verbalne i materijalne nagrade imala učinak od 200 (100
+ 100). No u slučaju postojanja interakcije, učinak će biti bilo manji bilo veći od 200. Primjerice,
ako verbalna nagrada tek malo povećava učestalost poželjnog ponašanja u prisutnosti materijalne
nagrade (ako je dijete dobilo čokoladu, to mu je nagrada bliska maksimalnoj, tako da mu dodatna
pohvala neće mnogo značiti), zajednički učinak može biti tek 110. U drugom krajnjem slučaju,
nijedan od načina nagrađivanja sam za sebe nije u dovoljnoj mjeri učinkovit, ali uzeti zajedno oni
dovode do izrazitih promjena, tako da njihov zajednički učinak može iznositi, ne 200, nego 300.
O interakciji, prema tome, zaključujemo ako učinak jedne nezavisne varijable ovisi o razini druge.
Uzmimo banalan primjer kako bismo to pokazali. Svatko od nas je mnogo puta bio u prilici
pokisnuti zbog kišobrana ostavljenog kod kuće, ali i nositi ga nepotrebno po lijepom vremenu.
Zapitajmo se koliko na to hoćemo li se ponašati neprilične (ostaviti kišobran kad nam je potreban ili
ga nositi u situaciji koja to ne zahtijeva) utječe nošenje kišobrana, a koliko vremenske prilike.
Nijedan od faktora sam za sebe neće utjecati na to da dođemo u neugodnu situaciju. To će se
dogoditi samo ako se poklope dva događaja, kiša padne upravo na dan kad smo zaboravili ponijeti
kišobran ili se oblaci raziđu upravo onda kad smo, očekujući kišu, ponijeli kišobran. U
najjednostavnijem obliku, to je zapravo suština interakcije. Na to hoćemo li se naći u nepriličnoj
situaciji ne utječe ni nošenje kišobrana, ni vremenski uvjeti sami za sebe, odnosno naše probleme
neće riješiti niti stalno nošenje kišobrana niti sušno razdoblje.
Dosad smo koristili primjere sa samo dvjema nezavisnim varijablama u kojima postoji tek jedna
moguća interakcija. Broj interakcija ovisi o broju nezavisnih varijabli. Unošenjem više od dviju
nezavisnih varijabli, nacrt se dodatno usložnjava interakcijama više razine. Uključimo li u
eksperiment tri nezavisne varijable, uz interakcije faktora AxE, AxC i BxC, moguća je interakcija
svih triju, odnosno AxBxC. U slučaju nacrta s više od tri nezavisne varijable broj interakcija
mnogostruko se povećava, a neke od njih jedva da je moguće protumačiti (primjerice, interakcije
AxBxCxD ili AxBxCxDxE) te se stoga takvi nacrti susreću iznimno rijetko.
7.1.3.3 OPISIVANJE FAKTORIJALNOG NACRTA
Faktorijalni nacrt običava se opisivati notacijom koja istodobno naznačuje nezavisne varijable i broj
njihovih mogućih razina. Nacrt koji smo opisali, vezan za provjeru učinkovitosti različitih metoda
nagrađivanja, mogao bi se opisati kao 2 x2 (dva puta dva), što nam kazuje da imamo dvije
nezavisne varijable, verbalno nagrađivanje X materijalno nagrađivanje, sa po dvije moguće razine
(u oba slučaja prisutno - odsutno). Nacrt označen s 2 x 3 x 3 podrazumijevao bi tri nezavisne
varijable (brojke 2, 3 i 3 predstavljaju svaka po jednu nezavisnu varijablu), sa po 2, 3 i 3 razine.189
odnosno uopćene:
188
185
189
186
126
Ivo V.
Takav nacrt može, primjerice biti ispitivanje zapamćivanja riječi u funkciji njihove smislenosti
(smislene i besmislene), duljine (4,5 ili 6 slova) i mjesta u nizu (početak, sredina i kraj). Grafički se
takvi nacrti mogu prikazati kao u tablici 7.1.
Glavne ćemo učinke provjeriti uspoređujući mjere zavisne varijable u svim situacijama u kojima je
nezavisna varijabla imala jednu vrijednost u odnosu na one u kojima je imala drugu vrijednost.
Zaključke o glavnim učincima izvodimo na sljedeći način:

1. U slučaju da je prosjek iz A1B1 i A1B2 statistički značajno veći ili manji od prosjeka iz A2B1 i
A2B2 zaključujemo da postoji glavni učinak nezavisne varijable A.
2. U slučaju da je prosjek iz A 1B1 i A2B1 statistički značajno veći ili manji od prosjeka iz A 1B2
i A1B2 zaključujemo da postoji glavni učinak nezavisne varijable B.190
Opisani način zaključivanja vrijedi samo u najjednostavnijem slučaju, kada je broj I:pltamk.a u
svakoj skupim potpuno jednak, dok se u drugim slučajevima račun ponešto usložnjava, ali načelo
ostaje isto. Glavni učinci odražavaju razlike između marginalnih aritmetičkih sredina, odnosno
možemo reći da se radi o učincima faktora uprosječenima prema različitim razinama drugog
(drugih) faktora.
Pogledajmo shematski prikaz našeg ranijeg primjera. Zavisna varijabla u našem slučaju je
nepriličnost ponašanja koja, uzmimo, može poprimiti vrijednost 0 ili 1.
1. Budući da je (A1B1 + A1B2)/2 = (A2B1 + A2B2))/2=0,5, zaključujemo da ne postoje glavni

učinci nezavisne varijable A (nošenje kišobrana) na nepriličnost ponašanja.
2. Budući da je (A1B1+A2B1)/2= (A1B2+A2B2)/2=0,5, zaključujemo da ne postoje ni glavni
učinci nezavisne varijable B (vremenski uvjeti) na nepriličnost ponašanja.
Kao što smo već rekli, osim glavnih učinaka, u složenom smo nacrtu također zainteresirani za
međusobnu interakciju faktora. Pritom sebi postavljamo pitanje: Kakva god bila ukupna razlika u
ponašanju mjerenom na nizu različitih razina jedne varijable, ostaje li ona postojana na svim
razinama druge varijable?" Zamislimo situaciju u kojoj nacrtom 3x2 ispitujemo zapamćivanje u
funkciji dviju nezavisnih varijabli, stupnja poznatosti riječi i načina njihove prezentacije. Razine
prve nezavisne varijable obuhvaćaju kategorije: "potpuno nepoznate (besmislene) riječi'',
djelomično poznate (manje uvriježeni izrazi)" i "dobro poznate riječi", dok se prezentacija odvija na
dva načina, auditivno i vizualno. Recimo da smo utvrdili kako se poznate riječi bolje pamte od
manje poznatih. U prosjeku, ispitanici nakon pet ponavljanja zapamte 4 nepoznate, 7 manje
190
187
127
Ivo V.
poznatih i 10 dobro poznatih riječi. Ono što nam kazuje interakcija jest - hoće li se ovakva razlika
zadržati bez obzira na način prezentacije. Ako je razlika postojana, interakcije nema. Naprotiv, ako
se razlika između broja zapamćenih nepoznatih u odnosu na poznate riječi smanjuje ili povećava u
funkciji načina prezentacije, govorimo o interakciji.
Govorimo li o najjednostavnijem faktorijalnom nacrtu 2x2, gruba prosudba o interakciji može se
izvesti na temelju vrlo jednostavnog postupka. Oduzmemo li vrijednosti iz istog retka i učinimo li
isto za drugi redak, dobit ćemo razlike čija će usporedba dati stanovite naznake o tome postoji li
interakcija ili ne. Ako razlike znatno međusobno odudaraju, interakcija vjerojatno postoji, a ako se
radi o približno191 istim vrijednostima, ne post oj i. Sljedeći primjer upućuje na vjerojatnu
interakciju jer razlike prvog retka u odnosu na drugi (jednako kao prvog stupca u odnosu na drugi)
odudaraju z a četiri jedinice. Dakako, vlastite indicije ipak nisu dovoljne za konačan zaključak o
značajnosti interakcije, što će pokazati tek odgovarajući statistički test sadržan u analizi varijance.
Iz gornjeg, izmišljenog, primjera može se zaključiti kako se smislene riječi pamte lakše od
besmislenih i kako, općenito gledano, nema razlike u zapamćivanju s obzirom na način
prezentacije. Međutim, postojeća interakcija kazuje da se besmislene riječi bolje pamte ako su
prezentirane auditivno, dok se smislene bolje pamte nakon vizualne prezentacije. Zaključke o
interakciji između faktora uključenih u istraživanje najlakše je ipak očitati iz grafičkog prikaza u što
ćemo se uvjeriti nešto kasnije.
Gornji primjeri opisuju samo krajnje pojednostavljenu logiku i temeljna načela pristupa koja se
koristi pri faktorijalnim nacrtima. Sama obrada podataka daleko je složenija i na ovom mjestu
nećemo je opisivati.
7.1.3.4 GRAFIČKI PRIKAZ REZULTATA SLOŽENOG NACRTA
S obzirom na velik broj elemenata na koje treba obraćati pozornost pri tumačenju nalaza
faktorijalnog nacrta, kao i brojnost različitih ishoda, najbržu i najekonomičniju informaciju o
rezultatu nude grafički prikazi. Potrebno je stoga da se istraživači i studenti unaprijed upoznaju s
takvim oblikom iznošenja rezultata kako ne bi imali problema niti pri razumijevanju znanstvenih
radova u kojima je ova tehnika primijenjena niti prilikom pisanja samostalnih radova. Dakako,
konačan sud o značajnosti učinaka može počivati isključivo na računskom dijelu analize varijance,
a ne na opisnim podacima sadržanima u tablicama ili grafikonima. Ipak potonja metoda nudi
mogućnost lakšeg razumijevanja temeljnih načela ovog postupka. To je u najvećoj mjeri vidljivo
kod interakcije. Opće je pravilo da usporedne crte na grafikonu upućuju na izostanak interakcije,
dok neparalelne (one koje se međusobno približavaju, udaljavaju ili križaju) sugeriraju njeno
postojanje.
O svoj složenosti tumačenja rezultata fakrorijalnog nacrta svjedoči čak 8 mogućih ishoda na temelju
najjednostavnijeg 2x2 nacrta. To su:
1. Samo glavni učinak A
2. Samo glavni učinak B192
3. Glavni učinak A i glavni učinak B
4. Glavni učinak A i interakcija AxB
5. Glavni učinak B i interakcija Ax B
6. Glavni učinak A, glavni učinak B i interakcija AxB
7. Samo interakcija AxB
8. Neznačajni glavni efekti i neznačajna interakcija
191
188
192
189
128
Ivo V.
Prije nego što spomenemo na neke svojstvene ishode složenih nacrta, valja ponešto reći o
organizaciji grafikona. Budući da su u njima sadržane dvije nezavisne varijable, konvencija je da se
jedna od njih prikazuje na apscisi, a različite razine druge punom ili isprekidanom crtom. Na
ordinati su pritom iskazane vrijednosti zavisne varijable.
Uzmimo za primjer ponovno najjednostavniji faktorijalni eksperiment s dvije nezavisne varijable sa
po dvije razine. Zanima nas, primjerice, kako će neka poruka utjecati na mijenjanje stavova s
obzirom na obilježja komunikatora. Naše nezavisne varijablc u ovom izmišljenom primjeru, mogle
bi biti spol (muški i ženski) i autoritet komunikatora (niski i visoki).
U slici 7.3 je prikazana situacija u kojoj ni spol ni opaženi autoritet komunikatora (osobe koja
prenosi poruku) nemaju utjecaja na promjenu stava. Stavovi se, naime, mijenjaju u jednakoj mjeri
pod utjecajem poruke čita ne od osoba različitog spola i različitog autoriteta.
U slici 7.4 značajan je samo glavni učinak spola komunikatora. To znači da se, u našem
izmišljenom primjeru, stavovi mijenjaju u većoj mjeri ako poruku prenosi muškarac negoli ako to
čini žena.193
Stavovi se u hipotetičkoj situaciji prikazanoj u slici 7.5 mijenjaju pod utjecajem autoriteta
prenositelja. Što je on viši, to je i promjena izrazitija.
Mogući ishod prikazan u slici 7.6 opisuje situaciju s oba značajna glavna učinka. Stavovi se u većoj
mjeri mijenjaju ako poruku prenosi muška osoba i osoba višeg autoriteta.
193
190
129
Ivo V.
Uz glavne učinke spola i autoriteta komunikatora, u situaciji prikazanoj na slici 7.7, značajna je i
njihova interakcija, tako da bismo u tom izmišljenom primjeru194 mogli zaključiti kako, ne samo da
muški spol i autoritet utječu na izraženost promjene stavova, nego je ona najizrazitija upravo za
njihovu kombinaciju. Ili, drugim riječima, visoki autoritet je manje učinkovit u promjeni stavova
ako je komunikator žena nego ako se radi o muškarcu.
U posljednjem prikazu našeg izmišljenog eksperimenta (slika 7.8), prikazana je značajna interakcija
spola i autoriteta komunikatora bez značajnih glavnih učinaka. To znači da ni spol ni autoritet ne
utječu sami po sebi, već isključivo njihova interakcija. Do promjene stavova u većoj mjeri dovode
muškarci niskog autoriteta odnosno žene visokog autoriteta.
7.1.3.5 RAZLIČITI MODALITETI FAKTORIJALNOG NACRTA
Složeni nacrti mogu biti organizirani kao nacrti na nezavisnim grupama, nacrti unutar ispitanika, ali
također, što je njihova posebnost, kao kombinirani ili miješani nacrti. Primjer nacrta na
nezavisnim grupama je provjera uspješnosti rješavanja laganih ili teških logičkih zadataka nakon
dobivanja različitih uputa. Shematski, nacrt 2 x 2 izgledao bi ovako:
Ako umjesto slučajno izabranih ili po slučaju raspoređenih grupa koristimo prirodne grupe (poput
onih definiranih spolom, dobi, osobinama ličnosti ili sl.), nacrt gubi svojstva istinskog eksperimenta
i postaje kvazi-eksperiment s neujednačenim grupama. U tom slučaju ne možemo dokazati
kauzalnost između faktora i ponašanja, ali naše pretpostavke mogu biti donekle osnažene
izjednačavanjem grupa prema nekim drugim relevantnim odlika ma (primjerice ako ih podijelimo
po spolu, izjednačimo ih prema dobi i obrazovanju ili sl.)
Složeni nacrti također mogu biti provedeni kao nacrti unutar ispitanika. Uzmimo za primjer
ispitivanje prepoznavanje čuvstava na licima muškaraca i žena. Recimo da se ispitanicima prikaže
niz podražajnih fotografija muškaraca i žena različitih čuvstvenih izražaja.
Nacrt (2 x 4) bi imao sljedeći oblik:195
194
191
195
192
130
Ivo V.
Složeni nacrt, kako smo ranije rekli, ne mora biti osmišljen kao isključivo između niti isključivo
unutar ispitanika, već može poprimiti oblik njihove kombinacije. Ako, primjerice, iz nekog razloga
pretpostavimo da će stanoviti trening u prepoznavanju čuvstava utjecati na rezultate, možemo kao
dodatak nacrtu uključiti i nezavisne grupe od kojih je jedna uvježbava na u prepoznavanju čuvstava,
a druga nije. U tom bi slučaju nacrt poprimio oblik 2 x 2 x 4 (miješani). Nezavisne varijable bi bile
A: uvježbavanje (grupna varijabla), B: spol na fotografiji i C: prikazano čuvstvo.
7.1.4 IZBOR EKSPERIMENTALNOG NACRTA

Dosad smo se upoznali s tri osnovna tipa istinskih eksperimentalnih nacrta:
 nacrtom među ispitanicima (grupnim nacrtom),
 nacrtom unutar ispitanika (ponovljena mjerenja)
 složenim (fakrorijalnim) nacrtom
Svi nacrti, bez razlike, posjeduju određene prednosti, ali i nedostatke, koji ih u pojedinim
situacijama nameću kao razložan plan testiranja postavljenih hipoteza, a u drugima posve
obezvređuju. Pogledajmo ukratko načela na kojima se temelje naše odluke o izboru odgovarajućeg
eksperimentalnog nacrta i obilježjima koja se pritom pokazuju odlučujućima.
U slici je prikazana pojednostavljena shema odlučivanja o eksperimentalnom nacrtu. Ključno i
osnovno pitanje je hoćemo li eksperimentom ispitati djelovanje samo jedne ili više nezavisnih
varijabli. U prvom slučaju odlučujemo se za (I) klasični, bivarijatni nacrt, a u drugome za (II)
složeni. Prednosti drugog već su ranije navedene. On je bliži stvarnoj situaciji utoliko što
pretpostavlja istodobni utjecaj većeg broja činitelja na opaža no ponašanje. Usto je ekonomičniji i
spoznaj no nadmoćniji jer pruža uvid u interakciju među pretpostavljenim uzročnicima ponašanja.
Klasični nacrt, naprotiv, razmjerno je jednostavna tehnika koja ne zahtijeva osobito složene metode
statističke obrade.196
S obzirom na broj eksperimentalnih uvjeta kojima je izložen ispitanik, razlikujemo nacrte (I)
između ispitanika (grupne nacrte) i (2) unutar ispitanika (ponovljena mjerenja). U prvima je svaki
ispitanik izložen samo jednom eksperimentalnom uvjetu, a učinak nezavisne varijable provjerava se
usporedbom grupa koje su bile izložene različitim eksperimentalnim (ili kontrolnim) uvjetima.197
196
193
197
194
131
Ivo V.
Nacrt unutar ispitanika temelji se na višekratnom izlaganju svakog ispitanika različitim

eksperimentalnim uvjetima, kao i višekratnom mjerenju ponašanja. Zbog toga što u takvom nacrtu
svaki ispitanik sam sebi služi kao kontrola, čime se iz eksperimentalne greške uklanja varijanca
osobnih razlika, on je statistički snažniji, odnosno njime je lakše otkriti učinak nezavisne varijable
ako takav uistinu postoji. Usto je i ekonomičniji jer je za dokazivanje djelovanja nezavisne varijable
potrebno manje ispitanika negoli u grupnom nacrtu. Osnovno ograničenje takvog nacrta jest
nepovratnost promjena do kojih dovode neke nezavisne varijable.
U takvim prilikama koriste se grupni nacrti, čija je glavna značajka i preduvjet raspoređivanje
ispitanika u skupine po slučaju. Ako to nije moguće provesti ili su ispitanici podijeljeni s obzirom
na neko osobno svojstvo (spol, dob, obrazovanje, inteligenciju), početna ujednačenost grupa nije
postignuta te se govori o tzv. kvazieksperimentalnom nacrtu.
Dok se u grupnim nacrtima eksperimentalna kontrola najviše bavi slučajnim raspoređivanjem kao
načinom ujednačavanja grupa, u nacrtima unutar ispitanika pitanje od najveće važnosti jest
redoslijed izlaganja eksperimentalnim situacijama. Kako bi se izbjegao utjecaj redoslijeda,
pribjegava se različitim tehnikama koje u konačnici određuju kakav će oblik poprimiti nacrt.
132
Ivo V.
7.1.5 EKSPERIMENTALNI NACRT KAO NAČIN KONTROLIRANJA VARIJANCE
Nacrt je, kako smo već naglasili, plan istraživanja koji omogućuje odgovaranje na postavljene
probleme. To je najjasnije, ali ne i jedino moguće gledanje na eksperimentalni nacrt. Prema nekim
autorima (primjerice, Kerlinger, 1986), osnovna uloga nacrta je kontrola varijance198. Ne radi se
pritom o suštinski različitim određenjima nacrta koliko o kutu gledanja što ga zauzimaju autori. Iz
logičke perspektive, nacrt je ponajprije oruđe zaključivanja u skladu s napucima što ih je još
sredinom devetnaestog stoljeća oblikovao i razradio John Stuart MilI. No sa stajališta matematičara
i statističara, nacrt je prije svega način da se utvrdi količina promjene zavisne varijable uzrokovana
promjenama u nezavisnoj varijabli. Takva zadaća u potpunosti počiva upravo na kontroli varijance
odnosno utvrđivanju njezinih različitih izvorišta. Ukratko ćemo objasniti takav stav. Nacrt bi
istraživaču trebao pomoći da uspostavi199 kontrolu nad trima temeljnima izvorima varijabiliteta,
eksperimentalnom, izvanjskom i nesustavnom. Da bismo bolje objasnili što to zapravo znači,
moramo se vratiti malo unatrag i potpomognuti se statističkim pojmovima. Varijanca je mjera
variranja rezultata, odnosno formulom:
No varijanca, premda jasno određena formulom nema jedno i jedinstveno logičko značenje. Pojam
varijance naširoko se koristi li stručnoj literaturi, ali za sadašnju je raspravu potrebno razlikovati
njezine različite aspekte. Da bismo lakše objasnili smisao eksperimentalnog nacrta, moramo se
stoga najprije pozabaviti različitim modalitetima u kojima se koristi termin varijance.
7.1.5.1 SUSTAVNA VARIJANCA I VARIJANCA GREŠKE
Jedan od najopćenitijih načina na temelju kojih razlikujemo varijancu jest onaj prema kojem je
dijelimo na sustavnu i nesustavnu (nazvanu još i varijancom greške). Sustavna varijanca je
mijenjanje (varijacija) mjera u određenom smjeru zbog nekih znanih ili neznanih utjecaja. Svaki
utjecaj, poput nezavisne varijable u eksperimentu, koji utječe na to da se određeno ponašanje odvija
u nekom predvidljivom smjeru je sustavna varijanca. Smislenost građe učinit će njeno
zapamćivanje bržim u odnosu na zapamćivanje podjednako opsežne, ali besmislene građe. Isto će
tako psihoterapija sustavno utjecati na bolje društveno funkcioniranje emocionalno nestabilnih
osoba, a bogata i raznovrsna prehrana sustavno će, u usporedbi s siromašnom i jednoličnom,
utjecati na brži razvoj djeteta. To su samo neki oblici utjecaja koji dovode do sustavne varijance,
Valja, zbog preciznosti, napomenuti da postoji i sustavna varijanca greške koju u tom slučaju
nazivamo pristranošću. Primjerice, loše namještena vaga koja uvijek pokazuje 5% veću težinu
proizvodi sustavnu, ali pogrešnu varijancu. &d govorimo o varijanci greške, uglavnom
zanemarujemo postojanje pristranosti, a tako ćemo se ponašati i ovoga puta izjednačujući grešku s
nesustavnom varijancom.
Eksperimentalna varijanca
U istraživanjima smo poglavito zainteresirani za eksperimentalnu varijancu, odnosno onaj dio
varijabiliteta koji možemo pripisati utjecaju nezavisne varijable. Pri korištenju grupnog nacrta to su
razlike između mjera zavisne varijable u eksperimentalnoj i kontrolnoj skupini, dok u nacrtu unutar
ispitanika takva varijanca opisuje promjene u ponašanju u različitim eksperimentalnim uvjetima.200
Varijanca greške
Slučajne varijacije rezultata odnosno ne sustavna kolebanja oko neke središnje vrijednosti čine
varijancu greške. Budući da nisu odraz nekog jedinstvenog, usmjerenog utjecaja, slučajne varijacije
198
U jednom od kasnijih poglavlja podrobno se raspravlja o statističkoj analizi eksperimentalnih nacrta, temi koja se
izravno naslanja na ovdje iznesena razmišljanja. Zapravo, riječ je o istoj problematici sagledanoj jednom iz očišta
eksperimentatora, a drugi put statističara. I u jednom i u drugom slučaju njegujemo logički pristup, kloneći se
šabloniziranih recepata za provedbu eksperimenta i njegove statističke obrade.
199
195
200
196
133
Ivo V.
čas smanjuju, a čas povećavaju rezultate te se u konačnici međusobno poništavaju. Naziv varijanca
greške zapravo je prilično nespretne izabran jer je riječ o rezultanti mnoštva sustavnih činitelja koji
djeluju u različitim pravcima, međusobno se poništavajući. Ono što se u jednom eksperiment u drži
varijancom greške, u drugome je dio sustavne varijance. Ispravno je reći kako su sve varijacije u
rezultatima koje nije moguće pripisati znanim utjecajima niti ih kontrolirati dio varijance greške. To
zapravo znači da je veličina varijance greške ovisna o našem znanju. Što je naše poznavanje izvora
varijabliteta bolje i što smo više u mogućnosti kontrolirati ga, to će rezultati manje nesustavno
varirati. Uzmimo za primjer eksperiment u kojem ispitujemo učenje smislenog verbalnog materijala
u funkciji njegove prezentacije (pismene ili usmene). Recimo da smo grupnim nacrtom u kojem je
jednoj grupi materijal čitan, a drugoj dan ispisan na papiru, došli do rezultata u kojima se pokazalo
kako pismena prezentacija vodi boljem učenju i zapamćivanju. Razlike između skupina pripisujemo
nezavisnoj varijabli, a one unutar skupina varijanci greške. Želimo li smanjiti varijancu greške,
potrebno je identificirati dodatne izvore varijabiliteta unutar skupina. To mogu biti spol,
inteligencija, dob i sl. Homogeniziramo li skupine s obzirom na navedena svojstva, smanjit ćemo
varijancu greške.
7.1.5.2 NAČINI KONTROLIRANJA VARIJANCE U EKSPERIMENTU
Na istraživački nacrt može se gledati kao na metodu kontrole varijance. Tri su načina da se to
postigne:
1. povećavanje eksperimentalne sustavne varijance
2. kontrola vanjske sustavne varijance
3. smanjivanje varijance greške
Zamislimo li se malo bolje nad upravo spomenutim načinima kontroliranja varijance, u njima ćemo
prepoznati dobro nam znane metode unapređivanja statističke snage i otklanjanja prijetnji
unutarnjoj valjanosti. Povećavanje eksperimentalne varijance i smanjivanje varijance greške dva su
ranije opisana sredstva povećavanja statističke snage, dok se prijetnje unutarnjoj valjanosti
uklanjaju upravo pomnom kontrolom sustavne varijance za koju nije odgovorna nezavisna
varijabla.
Povećavanje eksperimentalne varijance
Kao što smo rekli, eksperimentalna varijanca je onaj dio razlikovanja u mjerama opaženoga
ponašanja koji se može pripisati nezavisnoj varijabli. Jedan od glavnih201 eksperimentatorovih
zadaća jest povećanje te vrste varijance. No što to zapravo znači? Ako se nezavisna varijabla ne
mijenja bitno u eksperimentalnim ti odnosu na kontrolne uvjete, teško je vjerovati da će njen utjecaj
doći do izražaja u odnosu na cjelokupno variranje zavisne varijable. Razlike u eksperimentalnim
uvjetima koji opisuju različite razine nezavisne varijable stoga valja naglasiti, kako bi proizveli
značajnu varijancu odnosno razlikovanje među rezultatima. Ispitujemo li učinkovitost odgođenog i
neposrednog potkrjepljenja (nagrađivanja) na učestalost poželjnog ponašanja u djece, različite
razine nezavisne varijable moraju biti jasno odvojene. To, primjerice, znači da u drugom slučaju
interval od poželjnog ponašanja neće biti 10 sekundi, ako je u prvome 5, jer je vjerojatno da djeca
neće praviti razliku između tako bliskih vremenskih odmaka. No ako u drugom slučaju odgoda
bude 2 minute, vjerojatno je da će se razlika u uvjetima odraziti i na zavisnu varijablu. Kao opće
pravilo može se reći da istraživač mora različite eksperimentalne uvjete napraviti što je moguće
različitijima te na taj način povećati eksperimentalnu varijancu. Uzmimo i drugi primjer. Pri
usporedbi dviju različitih vrsta psihoterapije, moramo dobro paziti hoćemo li svaku od njih valjano
operacionalizirati (zajamčiti visoku konstruktnu valjanost) jer će samo tako do izražaja doći i
razlike među njima odnosno njihov specifičan sadržaj koji nije dio zajedničke baštine svih
terapijskih pravaca (poput komunikacije, pokazivanja zanimanja, podrške i slično). Tek na taj način
možemo računati na javljanje razlike u njihovoj učinkovitosti jer će u protivnom njihovi brojni
zajednički elementi smanjiti eksperimentalnu varijancu.
Kontrola vanjskih činitelja
201
197
134
Ivo V.
Eksperimentalna kontrola o kojoj je ranije mnogo toga rečeno, zapravo je način da se smanji ili
potpuno odstrani varijanca što je proizvode sustavni utjecaji koji nisu predmet eksperimentalnog
ispitivanja, ili, što je još češće, da se oni ravnomjerno rasporede na različite uvjete radi mogućnosti
usporedbe. Takav način kontrole u službi je postizanja unutarnje valjanosti, ali također i
unapređivanja statističke snage. Tri su osnovna načina na koji se postiže kontrola nad vanjskom
sustavnom varijancom:
1. odstranjivanje
2. slučajno raspoređivanje i uravnoteženje
3. uključivanje kao nezavisne varijable
Pokušamo li eksperimentom provjeriti pretpostavku o utjecaju motivacije na učinak na nekom testu
inteligencije, moramo biti svjesni činjenice ela će uz površnu kontrolu, osim naše nezavisne
varijable, još čitav niz drugih činitelja utjecati na rezultate. Ako smo, želeći popraviti vanjsku
valjanost eksperimenta, ispitanike u skupine sabrali tako da pokrivaju cjelokupan spektar populacije
(prema spolu, dobi, obrazovanju, regionalnoj pripadnosti i veličini naselja u kojem žive), učinili
smo mnogo da se rezultati mogu proširiti izvan granica konkretnog uzorka, no istodobno 202 smo u
eksperiment unijeli i mnogo varijance vanjskih utjecaja. Činitelji koji čine skupine heterogenima
(raznolikima) poput spola, dobi, obrazovanja i drugih, nedvojbeno utječu na učinak u testu
inteligencije, primjerice, žene uspješnije rješavaju zadatke verbalnog, a muškarci prostornog tipa,
mlađi su općenito brži i bolje se snalaze u zadacima što zahvaćaju tzv. fluidnu inteligenciju, dok
osobe višeg obrazovanja posjeduju veću količinu znanja, što im pomaže u uspješnijem rješavanju
gotovo svih tipova zadataka. Odstranjivanje vanjske varijance putem homogenizacije ispitanika ima
dvojaku zadaću:
a) snaženja unutarnje valjanosti i
b) povećanja statističke snage putem smanjivanja eksperimentalne greške.
Ako smo zabrinuti neće li neki od vanjskih faktora utjecati na zavisnu varijablu zamagljujući učinak
nezavisne varijable, najjednostavniji način da se to spriječi jest izdvojiti ispitanike koji su
izjednačeni prema tom obilježju (primjerice, samo one muškog spola, samo visokoobrazovane,
samo one iz Zagreba itd.) ili značajno suziti varijancu tog obilježja u odnosu na populaciju
(primjerice, izdvajanje samo osoba s inteligencijom između 90 i 110 ili 203 dobi između 20 i 22
godine). Time ćemo ujedno u potpunosti ili barem značajnoj mjeri otkloniti utjecaj tih faktora na
konačan ishod eksperimenta. Izaberemo li samo ispitanike ženskog spola, možemo biti sigurni da
spol nije pridonio učinku nezavisne varijable. Jednako tako, ispitamo li sve ispitanike u istoj
prostoriji, uz stalnu temperaturu i razinu osvjetljenja, izvjesno je da ti čimbenici neće pridonijeti
promjenama u zavisnoj varijabli. No zbog tog gubimo na mogućnosti uopćavanja podataka na
različite populacije, podjednako osoba, fizičkih uvjeta i drugih vanjskih činitelja.
202
198
203
199
135
Ivo V.
Heterogenost također utječe da varijanca unutar skupina bude veća, a kako smo već rekli, to je
osnovica za procjenu varijance greške. Jedan od načina eksperimentalne kontrole ide stoga za tim
da smanji ili odstrani heterogeno st, kako bi se smanjila varijanca greške. To se postiže na
prethodno spomenuti način, biranjem ispitanika izjednačenih prema većini relevantnih obilježja.
Tako postignuta kontrola varijance vrlo je učinkovita, ali pati od već spomenutog nedostatka,
manjkave vanjske valjanosti.
Drugi način kontrole vanjskih činitelja već je naširoko raspravljan. Riječ je o slučajnom
raspodjeljivanja i uravnoteživanju kojima se nastoje postići ujednačenost skupina (grupni nacrti) i
jednolika raspoređenost učinaka redoslijeda (nacrti unutar ispitanika) na rezultate. Premda je
ovakva metoda najbolji mogući izbor za kontrolu vanjskih činitelja i jedino stvarno jamstvo
unutarnje valjanosti eksperimenta, ona je ipak manjkava utoliko što ne kontrolira varijancu unutar
skupina. Heterogenost ispitanika kao izvor greške nije uklonjena. već je samo podjednako
raspoređena u grupe izložene različitim eksperimentalnim uvjetima. Ako utvrdimo razliku u tako
kontroliranom eksperimentu, mi je s visokim stupnjem sigurnosti možemo pripisati nezavisnoj
varijabli. No u velikom broju slučajeva. zbog velike varijance greške, nećemo biti u stanju dokazati
učinkovitost nezavisne varijable kad ona uistinu postoji. Heterogenost ispitanika, dakle, umanjuje
snagu-i osjetljivost eksperimentalnog nacrta. Za nacrte u kojima koristimo heterogene skupine, bit
će stoga potreban znatno veći broj ispitanika za dokazivanje djelovanja nezavisne varijable negoli
za istraživanja na homogenim uzorcima.
Treći i najbolji način kontrole jest uključivanje vanjskih varijabli kao nezavisnih u istraživanje.
Ako stoga, pretpostavljamo da osim naše nezavisne varijable na ponašanje djeluje i neki drugi
činitelj koji nije poželjno odstraniti niti prema njemu izjednačiti skupine, valja ga uključili u nacrt.
Vratimo se na prethodno izneseni primjer ispitivanja utjecaja motivacije na rješavanje testa
inteligencije. Pretpostavimo li da na rezultat djeluje spol ispitanika, najbolje rješenje kojim
raspolažemo bit će uključivanje spola u nacrt, odnosno primjena faktorijalnog nacrta u kojem je
spol jedan od faktora.
136
Ivo V.
7.1.5.3 SMANJIVANJE VARIJANCE GREŠKE
Varijanca greške je razlikovanje među rezultatima nastalo kao posljedica slučajnih kolebanja čas u
jednom čas u drugom pravcu, sad prema višim, sad prema 204 nižim vrijednostima. Zbog toga što
nisu odraz jedinstvenog sustavnog utjecaja, već mnoštva njih, slučajne greške se međusobno
uravnotežuju i njihova je prosječna vrijednost jednaka nuli. Kako je ranije rečeno. varijanca greške
obuhvaća svaki varijabilitet izvan eksperimentalne kontrole. Zašto je ona toliko važna pri planiranju
i provođenju eksperimenta? Upravo o njoj ovisi osjetljivost eksperimenta odnosno izglednost
dokazivanja djelotvornosti nezavisne varijable. Prisjetimo se, primjerice, samo najjednostavnije
formule t-testa koja glasi:
Nazivnik izraza ovisan je o veličini standardne devijacije, na temelju koje i veličine uzorka se
izračunava standardna greška aritmetičke sredine. Što je standardna devijacija (drugi korijen iz
varijance) veća. to će i standardna greška aritmetičke sredine biti veća, a time i cijeli izraz u
nazivniku (standardna greška razlike među aritmetičkim sredinama). Povećanje varijance greške
smanjuje t-omjer i otežava dokazivanje djelovanja nezavisne varijable ako ono uistinu postoji.
Varijanca greške stoga izravno utječe na smanjenje vjerojatnosti odbacivanja nul-hipoteze kad je
ona netočna, te se pokušaj uklanjanja takvog varijabiliteta nameće kao vrlo razborit način
povećavanja statističke snage eksperimenta.
Više je glavnih izvora varijance greške, među kojima su tri najvažnija:
1. individualne razlike među ispitanicima,
2. slučajne varijacije u tretmanima ili uvjetima testiranja i
3. nepouzdanost mjera zavisne varijable.
Svi oni odražavaju se na rezultatima povećavajući varijancu greške. U nastavku ćemo ih ukratko
opisati.
Osobne razlike među ispitanicima u nekim slučajevima čine sustavnu varijancu koja se kontrolira,
dok je u drugima ona zanemarena i znači grešku mjerenja. U faktorijalnom eksperimentu kojim
ispitujemo utjecaj motivacije na rješavanje testova inteligencije spol može biti jedna od nezavisnih
varijabli. On je u tom slučaju prepoznat kao relevantan utjecaj na ponašanje i koncipiran je kao
činitelj koji proizvodi sustavnu, eksperimentalnu varijancu opažanog ponašanja. U drugom slučaju,
ti kojem, zbog nekog razloga (primjerice, manjka ispitanika), eksperimentator nije u mogućnosti
spol uključiti u nacrt niti ga eliminirati homogenizacijom, on i dalje utječe na rezultate, ali ne više
kao kontrolirana varijabla, već kao generator nesustavnog varijabiliteta. Upravo spomenuto
uključivanje kao nezavisne varijable i homogenizacija prema nekom obilježju načini su ne samo
povećanja unutarnje valjanosti eksperimenta nego i smanjenja varijance greške. Istu je zadaću još
potpunije moguće obaviti korištenjem nacrta unutar ispitanika kojim se varijanca osobnih razlika
uklanja podjednako iz međugrupnog i unutar grupnog varijabiliteta.205
Primarni izvor varijance greške je, međutim, tzv. greška mjerenja, odnosno niz trenutnih utjecaja i
stanja koja čas smanjuju, a čas povećavaju istinske vrijednosti opaženog ponašanja. Grešci mjerenja
podjednako pridonose nekontrolirane varijacije u postupku ili uvjetima mjerenja, sam mjerni
instrument, kao i unutarnja stanja ispitanika. U takvu vrstu greške mogu se ubrojiti nevaljanost ili
nerazumljivost pitanja u testu, trenutni umor, emocionalna stanja, glavobolja, pokrivenost građe
koju ispitanik dobro ili slabo poznaje itd. Zbog greške mjerenja nečiji izmjereni rezultat oscilira
unutar određenog raspona, a s obzirom na to da se učinci greške međusobno u velikom broju
mjerenja poništavaju, aritrnetička sredina svih mjerenja predstavlja istinsku vrijednost mjercne
osobine. Uzmimo da osobi čiju inteligenciju unaprijed znamo (što u praksi nikada nije slučaj)
dajemo niz testova. Premda njena stvarna inteligencija odgovara kvocijentu IQ 100, dobiveni će
204
200
205
201
137
Ivo V.
rezultati varira ti unutar nekog raspona, ovisno o vrsti testa, stanju ispitanika, vremenu testiranja i
nizu drugih činitelja, ali je vjerojatno da će prosjek iz niza testiranja biti blizak istinskoj vrijednosti,
100. Varijanca oko stvarne vrijednosti ili istinskog rezultata upravo je varijanca greške.
Smanjivanje varijance greške uključuje dvojaku zadaću:
1. kontroliranje eksperirnentalnih uvjeta
2. povećavanje pouzdanosti korištenih mjera ponašanja (zavisne varijable)
Što je eksperimentalna kontrola bolja, to je manji broj činitelja koji mogu utjecati na povećanje
varijance greške. To je ujedno i glavni razlog potrebe za pomnim planiranjem, kontrolom' i
potpunom standardizacijom eksperimentalnih uvjeta. Valja uvijek imati na umu da nijedan ispitanik
nema posve istovjetan tretman u istom eksperimentalnom uvjetu. Uvijek su prisutne makar male
razlike. Eksperimentator ne mora biti posve dosljedan niti uvjeti posve jednaki. Primjerice, slaba
zvučna izolacija u prostoriji u kojoj se provodi eksperiment može unijeti dodatni varijabilitet u
situaciju zbog vanjske buke koja varira ovisno o dijelu dana u kojem se testiranje provodi.
Strpljenje eksperimentatora također se može mijenjati u funkciji doba dana. Svaka takva sitna
razlika može se odraziti na vrijednost pojedinačnog rezultata, proizvodeći slučajne varijacije
odnosno varijancu greške.
Povećanje pouzdanosti nekog mjernog instrumenta jest istoznačnica za smanjivanje njegove greške
mjerenja. Pouzdanost u najširem smislu znači točnost ili preciznost nekog mjernog instrumenta.
Slično značenje pojmu pouzdanosti imaju i nazivi dosljednost, postojanost, stabilnost ili
konstantnost. Pitanju pouzdanosti je moguće pristupiti na dva načina, koji naglašavaju njezine
naizgled različite, ali zapravo usko povezane aspekte:
1. stabilnost i dosljednost mjera
2. odsutnost greške mjerenja206
Prvi aspekt pouzdanosti odražava očekivanje da se u nizu primjena istog ili usporedivog mjernog
instrumenta na istoj osobi dobiju isti ili slični rezultati. Pouzdanost se na taj način odreduje kao
postojanost i dosljednost rezultata. Takvo određenje ujedno je i najčešće koje se pridaje pojmu
pouzdanosti. Drugi aspekt pouzdanosti jest njena povezanost s varijancom greške. Pouzdanost se
sukladno tome definira kao inverz na mjera greške mjerenja, odnosno, još preciznije, kao omjer
prave varijance i ukupne varijance nekog mjernog instrumenta. Kažemo da je instrument to
pouzdaniji što manje na njega utječu slučajne varijacije. Uzmimo za primjer elektronsku i
mehaničku štopericu. Mjereći deset vremena sprinteva istog trkača u deset sukcesivnih dana, uočit
ćemo dvije pojave. Prvo, nećemo dobiti deset istih rezultata. To ne znači da naš trkač čas napreduje,
a čas nazaduje u svojoj vještini. Njegove stvarne sposobnosti vjerojatno se ne mijenjaju, ali slučaj
na kolebanja poput trenutne indisponiranosti, vjetra u leđa ili u prsa, kiše ili sunca, žuljanja obuće ili
odmorenosti utječu da rezultat odstupi od stvarne vrijednosti, čas naviše, čas naniže. To je ukupna
varijanca greške. Dio te varijance otpada na varijancu greške mjerenja. Ako je trkač otrčao dionicu
za 10 sekundi, štoperica može pokazati 10.05 ili 9.95, ovisno o vlastitoj kalibriranosti, Elektronska
štoperica u pravilu je preciznija. Ako mehanička ima dopuštenu grešku od ± .05 sekundi, a
elektronska ±.01 sekundu, kažemo da ova druga sadrži manju grešku mjerenja.
Podjednako je važno da budemo svjesni oba činitelja koji povećavaju varijancu greške
eksperimenta, nedovoljno kontroliranih uvjeta i nepouzdanih mjernih instrumenata. Utječući na njih
možemo povećati izglede da dokažemo učinkovitost neke nezavisne varijable ako on uistinu
postoji. To znači da povećavajući pouzdanost mjera zavisnc varijable i boljom eksperimentalnom
kontrolom možemo bolje sagledati ekspcrirncntalnu varijancu, čineći nacrt osjedjivijim i statistički
snažnijim.
7.2 ARTEFAKT U EKSPERIMENTU I NAČINI NJEGOVE KONTROLE

Pojam artefakta usko je povezan s pojmom eksperimentalne valjanosti. U najširem smislu, svaki
zaključak temeljen na pogrešnim pretpostavkama o tome što je utjecalo na promjene u zavisnoj
varijabli je artefakt. Radi se, drugim riječima, o ishodima eksperimenta do kojih su doveli činitelji
206
202
138
Ivo V.
različiti od onih koje je istraživač proučavao, u pravilu nedovoljno konrrolirani vanjski utjecaji.
Premda je o prijetnjama valjanosti eksperimenta već dosta govoreno, uz zaključak kako svaka
pojedina dionica u njegovoj provedbi krije u sebi opasnost od iznošenja neutemeljenog nalaza, na
neke od prijetnji valjanosti potrebno je dodatno skrenuti pozornost zbog njihove sveprisutnosti i
lakoće kojom prolaze neopažene. To su u prvome redu one207 prijetnje koje izviru iz odnosa
eksperimentatora i ispitanika (Rosenthal i Rosnow, 1991) ili su odraz svijesti o provođenju
eksperimenta (Campbell, 1969). Može se reći da se tako shvačen artefakt u eksperimentu najviše
odnosi na prijetnje vezane za konstruktnu valjanost. Podsjetimo se, radi se o mogućoj zamjeni
učinaka nebitnih sastavnica tretmana s učinkom konstrukta čiju bi operacionalizaciju tretman trebao
predstavljati. Na ovaj aspekt ugrožavanja konstruktne valjanosti među prvima je upozorio i pobliže
ga proučavao američki psiholog Rosenthal (1966; Rosenthal i Rosnow, 1969).
Svijest o sudjelovanju u eksperirnentu može ispitanike navesti da se ponašaju na način koji odstupa
od uobičajenog. Njihove reakcije na eksperimentalne podražaje obično su drukčije od onih koje
popračaj u slične situacije u stvarnom životu. Zato govorimo o artefaktu ili neprirodnoj reakciji.
Riječ je najčešće o interakciji ispitanikove svijesti o sudjelovanju u eksperirnentu i nezavisne
varijable koja se ispituje. Mehanizmi interakcije mogu biti raznoliki i brojni, a mi ćemo se
ograničiti samo na one najvažnije, vezane poglavito uz odnos eksperimentarora i ispitanika.
Opsežniji prikaz takvih vrsta prijetnji eksperimentalnoj valjanosti dostupan je na drugome mjestu
(Rosenthal i Rosnow, 1969).
7.2.1 ODNOS IZMEĐU EKSPERIMENTATORA I ISPITANIKA
Na ishod eksperimenta često utječe međusobni odnos ispitanika i eksperimentatora. Jedan od
činitelja koji naglašeno djeluje na zavisnu varijablu jest pojava različitih očekivanja o tome što bi se
trebalo odvijati u eksperimentu. Takva očekivanja svojstvena su podjednako ispitanicima i
eksperimentatoru. Ako eksperimentator nesvjesno prenosi vlastita očekivanja na ispitanike, konačan
ishod eksperirnenta može biti odraz, ne utjecaja nezavisne varijablc, već nastojanja ispitanika da
ispune prepoznata očekivanja. Drugim riječima, ono što istraživač tumači kao povezanost dviju
varijabli, nezavisne i zavisne, često puta je samo odraz ispitanikova nastojanja da ispuni povjerenu
mu ulogu. Na prepoznavanje artefakta vezanog za interakciju ispitanika i eksperimentarora među
prvima je skrenuo pozornost Rosenzweig (1933), tada tek stasa li psiholog koji je upozorio kako je
eksperimentalna situacija psihološki problem za sebe. Analizirajući takvu posebnu situaciju došao
je do uvjerenja kako ispitanici, u pravilu, nastoje pogoditi svrhu eksperimenta i pružiti željene
rezultate, dok im eksperimentator često nesvjesno otkriva vlastite pretpostavke. Artefakte
uzrokovane međusobnim odnosom ispitanika i eksperimentatora možemo podijeliti u tri široke
kategorije:
1. one poglavito vezane uz ispitanike
2. one poglavito vezane uz ponašanje eksperimentarora
3. one koji odražavaju interakciju ispitanika i eksperimentatara208
7.2.1.1 ISPITANICI
U eksperirnentalnoj situaciji ispitanici se rijetko ponašaju posve prirodno, kako bi to činili u
stvarnosti. Razlog tomu je u njihovim očekivanjima. Svaki ispitanik nastoji proniknuti u svrhu
eksperirnenta. Ali to nije sve. Orne (1969) je utvrdio kako eksperimentalna situacija postavlja
određeni nciz rečen i zahtjev pred ispitanike i oni se nastoje ponašati u skladu s njime. Takvo je
ponašanje slično i u određenim društvenim okolnostima izvan laboratorija. Primjerice, pri odlasku u
kazalište ljudi se u pravilu oblače bolje nego pri odlasku u kino, na večeri s nepoznatim ljudima
nastoje koristiti samo pristojne izraze, a pred goste će iznijeti kvalitetnije piće nego što ga
uobičajeno piju sami. Ukratko, ljudi se ponašaju u skladu s onim što drže očekivanim ili od situacije
zahtijevanim ponašanjem. Pri tome ne moraju biti posve svjesni načina na koji u pojedinim
situacijama mijenjaju svoje uobičajeno ponašanje.
207
203
208
204
139
Ivo V.
Slično se događa i u eksperirnentu. U pravilu, kako smo rekli, ispitanici nastoje odgonetnuti hipotez
e i ponašati se sukladno njima. Pristranost može nastati na nekoliko načina, ovisno o očekivanjima
ispitanika i njihovu uvjerenju o ulozi koju bi u eksperimentu trebali preuzeti. Sama spoznaja o
sudjelovanju u eksperimentu utječe na ispitanike, vodeći tzv. hothornskom učinku o kojem je već
govoreno. Prisjetimo se, riječ je o promjenama ponašanja koje nisu posljedica nezavisne varijable,
već pojačane brige eksperimenratora ili saznanja o sudjelovanju u eksperimentu.
Mnogi ispitanici, nastojeći nesvjesno pomoći eksperimentatoru, preuzimaju ulogu "dobrog"
ispitanika, ponašajući se onako, kako drže da se od njih očekuje (Orne, 1962). U pravilu, kako je
pokazao Orne, ispitanici su spremni na suradnju do te mjere da bez oklijevanja obavljaju posve
besmislene zadaće, sve kako bi udovoljili eksperimentatoru i pridonoseći znanstvenoj spoznaji.
U duhovitom eksperimentu Orne je ispitanicima zadao da zbrajaju nizove slučajnih brojeva. Kako
bi zadaću učinio uistinu besmislenom i potpuno neizvedivom, svaki je ispitanik dobio 2000 takvih
lista ispunjenih brojevima. Uz riječi: "Nastavite raditi, vratit ću se", eksperimentator bi napustio
prostoriju i ne bi se pojavljivao sljedećih pet sati. Većina ispitanika nastoljala je raditi sve dok im
eksperimentator ne bi dao znak da prestanu. U sljedećem eksperimentu, ispitanici su dobili istu
uputu uz napomenu da nakon svake ispunjene liste uzmu karticu koja će im reći što moraju učiniti
sljedeće. Sve su kartice sadržavale istu poruku, da upravo ispunjenu listu razderu u najmanje 32
komada. Ni takav, još besmisleniji zadatak, nije većinu ispitanika naveo da samoinicijativno
prekinu rad. Po završetku eksperimenta, ispitanici bi svoju ustrajnost objašnjavali razlozima koji su
postavljenoj zadaći ulijevali smisao (primjerice: "Mislio sam da se radi o testu izdržljivosti"). 209
Pristranost je, kako smo napomenuli, još naglašenija kad ispitanici misle da su proniknuli u
eksperimentatorove pretpostavke i nastoje se ponašati u skladu s njima, otprilike onako kao da
slijede neki neizrečeni zahtjev ili nepisano pravilo.
Orne i Scheibe (1964) su proveli eksperiment kako bi procijenili utjecaj takvog imaginarnog
zahtjeva u istraživanju osjetilne uskraćenosti. Ispitanici su za potrebe eksperimenta trebali provesti
neko vrijeme u prostoriji koja je bila prikladna za sve prije negoli za ispitivanje spomenutog
fenomena. Boravak u ne osobito skučenom prostoru u kojem su se ispitanici slobodno kretali, mogli
slušati zvuke izvana, bez rukavica ili poveza preko očiju trebao je imitirati eksperiment osjetilnog
uskraćivanja. Sudionicima je, usto, za slučaj gladi i žeđi, ostavljeno nešto hrane i pića. O istinskoj
osjetilnoj uskračenosti stoga nije moglo biti govora. lspitanike iz eksperimentalne grupe prije
početka je pregledala osoba u liječničkom ogrtaču, izmjerila puls i krvni pritisak te upoznala s
mogućnošću uzbunjivanja osoblja u slučaju da dođu u kritično stanje. U sobi su se nalazili lijekovi
i liječnički instrumenti i sve je učinjeno kako bi situacija izgledala ozbiljna i potencijalno opasna.
U ispitanika kontrolne skupine stvoren je pak dojam kako se radi o bezazlenoj situaciji. Opuštenost
je postignuta eksperimentatorovom svakodnevnom odjećom, uklanjanjem lijekova i alarmnog
gumba iz sobe, a ispitanicima je rečeno da, žele li izići, jednostavno pokucaju na prozor. Orne i
Scheibe su, kako vidimo, kroz različite upute i opću situaciju manipulirali zahtjevom sadržanim u
eksperimentu. Kako se moglo i pretpostaviti, ispitanici eksperimentalne grupe doista su i osjetili
učinke osjetilne deprivacije. U njih je, kako objašnjavaju autori, stvoren dojam izvanredne i opasne
situacije, a kasniji simptomi bili su odraz njihovih na tome temeljenih očekivanja.
U nizu studija koje su dodatno potkrijepile spoznaje o nastojanjima ispitanika da se ponašaju onako
kako to eksperimentator od njih očekuje. Orne je pokazao da su ispiranici svjesni zahtjeva situacije.
Oni se ponašaju poput altruista, nastojeći udovoljiti očekivanjima. Međutim, to nije jedini način na
koji se ispitanici mogu ponašati u eksperirnentalnoj situaciji.
Neki autori drže da pri sudjelovanju u eksperimentu ispitanici nisu toliko motivirani željom da
ispune stvarne ili umišljene zahtjeve što ih postavlja situacija koliko nastojanjem da budu pozitivno
procijenjeni (Rosenberg, 1969) odnosno da se prikažu boljima (Christensen, 1981). Ispitanici, kako
drže autori, na temelju vlastitog viđenja eksperimenta nastoje utvrditi koje će ih ponašanje prikazati
u društveno poželjnijern svjetlu i ponašaju se u skladu s time. Potreba za boljim samo-
prikazivanjem u tom je slučaju nadređena i važnija od one za ispunjavanjem zahtjeva
209
205
140
Ivo V.
eksperimentalne situacije. U najvećem broju slučajeva te se dvije potrebe preklapaju i teško je, čak i
logički, napraviti razliku između motivacije da se bude "dobar" ispitanik i da se prikaže u "boljem
svjetlu".210
Pristupajuči problemu analitički, Rosenthal i Rosnow (1991) su ustvrdili da se ponašanje u
eksperimentu može okarakterizirati kao:
 udovoljavanje
 ne-udovoljavanje
 protivno udovoljavanju
Udovoljavanje je ponašanje u skladu sa zahtjevima situacije, ne-udovoljavanje ono koje nije
potaknuto specifičnim zahtjevima situacije, a moguće je i ponašanje protivno udovoljavanju.
Na to kakvo će ponašanje bili, drže autori, utječu tri činitelja:
 razumijevanje (pronicanje) eksperimenta i zahtjeva situacije
 motivacija
 sposobnost
Tek pošto pravilno shvati zahtjeve situacije, ispitanik je u mogućnosti ponašati se u skladu s njima.
Ako takve zahtjeve ne uspije prozreti, ne dolazi do artefakta odnosno udovoljavajućeg ponašanja.
Ispitanik, nadalje, može pokazivati motivaciju da se ponaša u skladu s postavljenim zahtjevom
situacije ("dobar ispitanik"), može biti nemotiviran glede zahtjeva, a može biti motiviran za
ponašanje protivno zahtjevu. Njegova motivacija još uvijek ne znači da će se tako i ponašati.
Ponašanje, naime, u konačnici ovisi i o tome je li se ispitanik u stanju ponašati onako kako bi želio.
Premda motiviran za udovoljavanje zahtjevima situacije, ispitanik ponekad nije kadar pružiti ono
što se od njega očekuje.
Kontrola pristranosti ispitanika
Dva su pristupa kontroli pristranosti ispitanika. Jednim se nastoji otežati ispitanicima razumijevanje
zahtjeva situacije, odnosno pretpostavki koje se propituju, a drugim ih se nastoji ohrabriti u
iskrenom odgovaranju.
Uklanjanje ili maskiranje znakova koji upućuju na zahtjeve situacije
Najbolji način da se u ispitanika izbjegne prepoznavanje zahtjeva eksperimenta jest da ih se liši bilo
kakvih nagovještaja o tome čemu bi eksperiment trebao poslužiti. Na svaki je način potrebno
izbjeći da ispitanici svjesni eksperimentalne hipoteze utječu na konačni ishod. Kako bismo
zajamčili naivnost ispitanika, provodimo tzv. slijepe eksperimente, u kojima ispitanici nisu svjesni
kojem su tretmanu izloženi. Takav je postupak osobito čest u kliničkoj praksi pri ispitivanju
lijekova. U tom slučaju jednoj grupi ispitanika daje se pravi lijek, a drugoj neškodljivi, ali
beskorisni pripravak, koji se naziva placebo. Nakon popijene tablete, pacijent se može ponašati u
skladu s očekivanjem kako će tableta djelovati, a ne sukladno njenim stvarnim učinkom. Damo li
ispitanicima novi lijek protiv migrene, velik broj njih će naknadno 211 izjaviti kako su osjetili
određeno poboljšanje i smanjenu glavobolju. To još uvijek ne znači da lijek uistinu djeluje. Učinak
poboljšanja postigla bi i neutralna tableta upravo zbog višekratno dokazane snage uvjerenja i
očekivanja. Takva pojava naziva se, kako smo ranije rekli, placebo učinak. Provjera i procjena
svakog lijeka morala bi se zbog toga obavljati u odnosu na placebo. U slijepom eksperimentu
moguće je reći ispitanicima kako se radi o testiranju nove tablete protiv migrene. Pritom ispitanici
ne znaju koji će od njih primiti istinske tablete, a koji placebo, tako da će njihova očekivanja vezana
za ishod biti jednaka, što će omogućiti da se kasnije razlike pripišu isključivo stvarnom djelovanju
tablete.
210
206
211
207
141
Ivo V.
Druga mogućnost kontrole pristranosti ispitanika jest obmana uvjerljivom, ali lažnom informacijom
o tome što se istražuje eksperimentom. Na taj način nastoji se postići veća prirodnost ponašanja i
izbjeći djelovanje u skladu sa zahtjevima eksperimenta.
Artefakt vezan uz ispitanika moguće je također smanjiti mjerenjem zavisne varijable vremenski
odmaknuto od eksperimentalne varijable ili u okružju koje nije izravno vezano uz eksperiment. Na
taj način ispitanici neće vezivati mjerenje uz eksperiment, što isključuje mogućnost
udovoljavajućeg ponašanja. Istraživači često nastoje domisliti kako ispitanike navesti da o dva
dijela istraživanja (primjeni eksperimentalne varijable i testiranju) razmišljaju kao o nezavisnim,
međusobno nepovezanim cjelinama, koje pripadaju različitim istraživanjima. Ponekad je to teško
izvesti, ali u drugim prigodama vremenska ili prostorna odmaknutost sasvim je dovoljna mjera
opreza koja na zadovoljavajući način rješava pitanje artefakta eksperimentalnog zahtjeva. Dobra je
praksa, isto tako, da eksperiment i testiranje provode različiti eksperimentatori, kako bi se time
dodatno izbjegla mogućnost povezivanja.
Povećavanje iskrenosti
Jedan od načina da se ispitanike navede na iskrenost je uporaba predeksperimentalnog postupka
kojim se takvo ponašanje potkrepljuje. Ako se ispitanika stavi do znanja da je njegovo
udovoljavajuće, ali neiskreno, ponašanje lako razotkriti, time će ga se potaći na iskrenost. S tom
svrhom razvijene su različite metode. Metoda povratne informacije (Levin i Montag, 1987) u kojoj
se ispitanici nakon ispunjavanja kraće ljestvice društvene poželjnosti izvještavaju o vlastitoj
tendenciji samouljepšavanja, samo je svojevrsni produžetak tzv. strategije "lažne cijevi" u kojoj se
ispitanici na duhovit način bivaju uvjereni kako se mehaničkom napravom dade otkriti govore li
istinu ili ne. Postupci počivaju na uvjerenju kako će ispitanici biti skloniji iskrenim odgovorima kad
drže da će se njihovo laganje ili težnja samo-uljepšavanju otkriti. Hvatanje u laži bi ih, niaime,
moglo dovesti u još neugodniji položaj od iskazivanja društveno nepoželjnih, ali iskrenih, odgovora
o vlastitom ponašanju.212
Iskrenost se može povećati i tako da se situaciju učini manje prijetećom, kako bi se omogućilo
slobodnije i iskrenije odgovaranje. Takvi se postupci često rabe pri ispitivanju osjetljivih i
vrijednosno zasićenih ponašanja. U pravilu, za iskrenije odgovore o delikatnim temama dovoljno je
ispitanicima zajamčiti anonimnost ili povjerljivost informacija. Istraživanja govore da već i tako
jednostavni postupci pridonose prirodnijim i iskrenijim odgovorima.
7.2.1.2 EKSPERIMENTATOR
Greške u zaključivanju nastale kao posljedice ponašanja eksperimentatora moguće je, prema nekim
autorima, podijeliti u dvije široke kategorije, ne-interakcijske i interakcijske (Rosenthal i Rosnow,
1991). Međutim, u užem smislu, samo neinrerakcijske greške znače isključivu "odgovornost"
istraživača. Interakcijske greške podjednako su odraz međusobno povezanih pojava koje se odvijaju
zbog eksperimentatorovih očekivanja i nastojanja ispitanika da im udovolje. Stoga smo ovu drugu
kategoriju, radi pojmovne jasnoće, odijelili kao zaseban aspekt artefakta.
Ne-interakcijske greške odnose se na iskrivljavanje rezultata zbog pristranosti ili osobne jednadžbe
eksperimentatora, a da se pritom ne utječe na ispitanika. Tri najvažnija tipa ne-interakcijske greške
su:
1. pristranost opažača,
2. pristranost tumačenja
3. namjerna pristranost
Pojava osobne jednadžbe ili pristranosti opažača po prvi je put zamijećena u 18. stoljeću kada je
astronom Griničkog opservatorija, Maskelyne otkrio da je njegov pomoćnik, Kinebrook, dosljedno
prespor u svojim opažanjima prolaska zvijezda na nebu. Nakon što ni upozorenja da radi grešku
nisu urodila plodom, Kinnebrook je otpušten. Tek 20 godina potom, konigsberški astronom Bessel
je pokazao da Kinnebrookova greška vjerojatno nije bila namjerna. Proučavajući opažanja prolaska
212
208
142
Ivo V.
zvijezda čitavog niza astronoma, otkrio je kako su razlike među njima pravilo, a ne iznimka
(Boring, 1950). Greške opažača najčešće nisu osobito naglašene. Radi se naime, o tek manjim
nepreciznostima koje ne ugrožavaju odveć pouzdanost mjerenja i same po sebi tek su manja
smetnja izvođenju istraživačkih zaključaka. Problem nije toliko u nepreciznosti što ih proizvode,
koliko u pristranosti. Pokazalo se, naime, da takve greške i silne nepreciznosti češće idu u smjeru
postavljenih pretpostavki te u pravilu znače rezultate u nekoj mjeri pomaknute prema
istraživačevim očekivanjima (Rosenthal, 1969). Poučan primjer takve pristranosti nudi istraživanje
Cordara i Isona (1963), koji su je demonstrirali pri opažanju pokreta crva planaria. U polovice
opažača stvoreno je očekivanje velikog broja kontrakcija tih crva, a polovica je dovedena u
uvjerenje kako će crvi biti razmjerno nepokretni. Konačni rezultati u velikoj su mjeri odgovarali
očekivanjima.213
Druga vrsta ne-interakcijske greške odnosi se na tumačenje rezultata i znači sustavnu grešku zbog
subjektivizma koji se tom prilikom neizbježno pojavljuje. Često se tako dešava da različiti
istraživači posve oprečno tumače iste podatke. Istraživačka etika nalaže da podaci na temelju kojih
se izvode zaključci budu dostupni za obradu i analizu drugim istraživačima koji drže da su njihova
izvorna tumačenja pogrešna. Pristranost nastala kao posljedica subjektivnog tumačenja rezultata
nije u toj mjeri ozbiljna kao ona vezana uz opažanje jer znanost nudi kontrolne mehanizme za njeno
uklanjanje i ispravljanje putem reakcija drugih istraživača. Zaključci znanstvenog rada za koje drugi
istraživači drže da nisu opravdani postojećim podacima izazvat će kritičke reakcije, dok greške u
opažanju najčešće prolaze nezamijećene. I pored toga, kako napominju Rosenthal i Rosnow (1991),
prečesto se dešava da istraživači ustraju na vlastitim, pogrešnim, teorijama i tumačenjima duže nego
što bi to trebali na temelju dostupnih podataka.
Uz nenamjerne greške vezane za opažanje i tumačenje rezultata, pojavljuju se i namjerna
iskrivljavanja koja najčešće izbijaju na vidjelo kad su podaci "presavršeni" da bi bili istiniti. Dio je
etike znanstvenog rada da se podaci ne fabriciraju, niti prekrajaju već iznose onako kako su
dobiveni. Nažalost, nastojanje da se potvrde vlastite teorije ili dobiju smislen i rezultati prečesto su
zavodljivi ne samo studentima ili početnicima, već i priznatim stručnjacima. Slučaj koji je možda
najviše u povijesti uzburkao psihološku zajednicu vezan je uz britanskog psihologa Cyrila Burta,
podaci kojeg su snažno upućivali na genetsku određenost inteligencije. Nakon njegove smrti
rezultati su problematizirani zbog statistički malo vjerojatnih podudarnosti (Kamin, 1974), te se
danas općenito drži da su izmišljeni.
7.2.1.3 INTERAKCIJA EKSPERIMENTATORA I ISPITANIKA
Interakcijski učinci uključuju sve činitelje koji na rezultate ne djeluju izravno, već znače posredan
utjecaj nastao u međudjelovanju eksperimentatora i ispitanika. U njih ubrajamo biosocijalne i
psihosocijalne osobine istraživača, odlike situacije, modeliranje i eksperimentatorova očekivanja
(Rosenthal, 1969).
Biosocijalne osobine poput spola i dobi eksperimentatora mogu u znatnoj mjeri utjecati na rezultate
(Rosenthal, 1966). To se dešava na dva načina, različitim reakcijama ispitanika na osobine
eksperimentatora (primjerice, spol ili dob), ili eksperimentatorovim različitim ponašanjem
uvjetovanim osobinama što ih posjeduje. Rosenthal (1966) navodi za primjer kako se tek 12 posto
eksperimentatora smiješilo ispitanicima muškarcima, a ženama čak njih 70 posto. Pokazalo se
također da ovakav različit pristup ima utjecaja na konačne rezultate. Sličnan utjecaj u pojedinim je
istraživanjima imala i dob eksperimentatora. U jednom koje navodi Rosenthal (1966) adolescentice
su ispitane projektivnim testom u kojem se od njih tražilo da kažu kako bi postupile u određenoj
situaciji. Jedna od sličica prikazivala je skupinu djevojaka iz214 koje je jedna predložila da rade
nešto što otac druge ne dopušta. Odgovori djevojaka starijih od 15 godina značajno su ovisili o
tome tko ih ispituje. Što je starost eksperimentatora bila veća, to su društveno nepoželjni odgovori
(sudjelovanje u zabranjenim aktivnostima) bivali rjeđi.
213
209
214
210
143
Ivo V.
Psihosocijalne osobine koje razlikuju istraživače mogu također proizvesti promjene u ponašanju
ispitanika nevezane uz proučavanu nezavisnu varijablu. Najviše istraživane među njima su
tjeskobnost, potreba za odobravanjem, status i osobna toplina (Rosenthal, 1966). Pokazalo se da
svaka od tih osobina utječe na način na koji eksperimentator stupa u interakciju i komunicira s
ispitanicima. Primjerice, eksperimentator povišenog stupnja tjeskobnosti, govori manje
dominantnim glasom i pokazuje veće znakove tjelesnog nemira od prosječne osobe. Istraživanja
koja su se bavila čuvstvenom hladnoćom, odnosno toplinom što je eksperimentator iskazuje pri
interakciji s ispitanicima, također su upozorila na veliku važnost koju takve osobine mogu imati na
konačan ishod. Provjeravajući dopadljivost deset mrlji tinte, Luft (1953) je pokazao da broj mrlji
koje se doživljavaju povoljno ovisi o toplini eksperimentatora. Ako je njegovo ponašanje upućivalo
na hladnu udaljenost, ispitanici su uglavnom odgovarali kako im se mrlje ne sviđaju, dok je njihov
odgovor za iste mrlje bio suprotan kad se prema njima vladao s toplinom i pažnjom. Jedna od
važnih kulturoloških varijabli koja također može imati velik utjecaj na ponašanje ispitanika svakako
je jezik (žargon, narječje, semantika) kojim se služi istraživač. U većini istraživanja valja se služiti
književnim jezikom jer je uporaba dijalekta moguć izvor nesporazuma, odbojnosti ili prevelike
bliskosti istraživača i ispitanika, što sve može pridonijeti zamagljivanju odnosa izučavanih varijabli.
Situacija koja karakterizira interakciju eksperimentatora i ispitanika isto tako može utjecati na
rezultate. Pod pojmom situacije prije svega se misli na psihološko, subjektivno ozračje, koje
obuhvaća neposredna i odgođena iskustva eksperimentatora i njegovo eventualno ranije poznanstvo
s ispitanicima. S obzirom na ranije iskustvo u provođenju eksperimenta istraživačevo će se
ponašanje razlikovati, primjerice zbog učinaka uvježbavanja, ali i zamora i dosade. Nadalje,
eksperimentatori koji poznaju ispitanike dobit će različite rezultate od onih kojima su nepoznati.
Moguće je, primjerice, očekivati da će uvježban i iskusan eksperimentator izvući više iz ispitanika,
odnosno dobiti rezultate koji upućuju na njihovo brže učenje, bolje pamćenje, veće psihomotoričke
sposobnosti u odnosu na uradak u istim aktivnostima uz manje uvježbanog i neiskusnijeg
istraživača.
O učinku modeliranja govorimo onda kad postoje znakovi da se ponašanje ispitanika na neki način
prilagođava ponašanju eksperimentatora. Njihova su ponašanja u tom slučaju korelirana. U
klasičnom radu Escalone (1945), ispitivana je sklonost pojedinim sokovima beba do godine starosti.
Rezultati su upućivali na to da među bebama postoje jasne razlike u preferencijama izmedu soka od
naranče ili od rajčice.215
Pokazalo se, međutim, da su žene koje su djecu hranile također imale jasne sklonosti i da su ih
prenijele na djecu. Kad su bebe povjerene ženama s preferencijama za drugi sok, promijenilo se i
njihovo prvotno zabilježeno ponašanje.
Eksperimentatorova očekivanja
Često puta, bez stvarne namjere, eksperimentator nagovještava ispitanicima na koji bi način želio da
se ponašaju. Ispitanici, s druge strane, u skladu s onim što je ranije izneseno, redovito izlaze ususret
takvom neizrečenom zahtjevu, ponašajući se upravo onako kako procjenjuju da to eksperimentator
od njih traži. Kako bi se opisala eksperimentatorova pristranost i mehanizam na temelju kojeg se
ona odražava na opažano ponašanje, često se navodi slikovit primjer konja "pametnog Hansa"
(Pfungst, 1911/1965).
Na prijelazu stoljeća u Berlinu je jedna od najvećih atrakcija bio konj Hans, čije su umne
sposobnosti naizgled bile veoma razvijene. Kad bi mu njegov vlasnik, Wilhelm von Osien postavio
pitanje, primjerice da pomnoži 3 sa 3, konj je prednjim kopitom lupio 9 puta. Pametni Hans je usto
"znao" i čitati koristeći se brojem udaraca prednjim kopitom kao slovima. Premda je stručno
povjerenstvo provjerilo vlasnika i utvrdilo da se ne radi o prijevari, Pfungst je posumnjao da
vlasnik možda daje nesvjesne znakove konju o tome što bi trebao odgovoriti. Pokazao je nizom
duhovito osmišljenih eksperimenata da Hans pravilno odgovara uglavnom samo onda ako osoba
koja mu postavlja pitanje ujedno zna i njegov odgovor. Ako kartica s pitanjem nije bila pokazana
osobi koja je postavljala pitanje, odgovor bi u pravilu bio netočan. Isto se pokazalo za matematičke
215
211
144
Ivo V.
i jezične zadaće. Moglo se stoga zaključiti kako "pametni" Hans ne raspolaže iznimno razvijenim
intelektualnim sposobnostima, već mu točan odgovor prenosi ispitivač. Pfimgst je kasnije pokazao
da je konj reagirao na dva znaka. Kad bi mu postavio pitanje, ispitivač bi se gotovo neprimjetno
nagnuo prema naprijed, što je bio znak za početak udaranja kopitom. Kad bi konj došao do
ispravnog broja, ispitivač bi se isto tako neprimjetno uspravio, što je za Hansa bio znak da
prestane s udaranjem.
Slično kao što je vlasnik konju nesvjesno davao jedva primjetne znake klimanjem glave i
naginjanjem prema naprijed i natrag, tako i moderni eksperimentatori svoje ispitanike ponekad
upućuju na odgovore u skladu s polaznim hipotezama. Eksperimentator može potaknuti ispitanike
da odgovaraju na određeni način time što će se sam ponašati različito u raznim eksperimentalnim
uvjetima. Uzmimo primjer iskušavanja novog sredstva za umanjivanje tjeskobnosti.
Eksperimentalnoj grupi dan je lijek, a kontrolnoj neškodljivo sredstvo bez učinka. Kako bi se
vidjelo utječe li lijek uistinu na smanjenje tjeskobnosti, nakon stanovitog vremena provodi se
testiranje i razgovor kojim se nastoji utvrditi učinak lijeka. Ako mu je poznato koja skupina uzima
lijek, a koja placebo, eksperimentator može vlastito znanje nesvjesno prenijeti 216 na ispiranikc.
Primjerice, može mu biti žao što kontrolnoj grupi daje nedjelotvorno sredstvo i svojim tako
stvorenim neraspoloženjem signalizirati ispitanicima da ne očekuje poboljšanje njihova stanja.
Suprotno se može očekivati u eksperimentalnoj grupi. Interakcija s njima može biti vedra,
optimistička i ohrabrujuča, što će se očitovati u njihovim pozitivnim očekivanjima. Pri završnom
razgovoru, ekspenmentator također može sitnim znacima pokazati od kojih ispitanika očekuje
pozitivne pomake, a od kojih ne očekuje. To mogu biti smiješak, rnrštenje, dizanje obrva ili
nabiranje čela.
Premda se čini vjerojatnim da eksperimentaror vlastitim raspoloženjem i očekivanjima može
utjecati samo na ljudske ispitanike, istraživanja su iste učinke zabilježile i kad su pokusi prevođeni
na životinjama.
Roscruhol i Fode (1963) su proveli istraživanje tako da su studentima povjerili po pet štakora za
učenje labirinta. Polovici studenata je rečeno da štakori potiču iz inteligentnog legla, a polovici
kako je riječ o štakorima dobivenima iz legla koja su slabije učila labirint. Među štakorima,
dakako, nije bilo nikakve stvarne razlike.Istraživanje je pokazalo da su "inteligentni" štakori učili
mnogo brže i uz mnogo manje pogrešaka, te da su studenti prema njima imali mnogo bolji odnos,
ponašali se pažljivije i bili nježniji.
Ono što su uočili na štakorima, Rosenthal i Jacobson (1966) su potvrdili i na učenicima u razredu.
Na početku godine primijenili su test inteligencije te su nastavnicima rekli od kojeg djeteta može
očekivati osobito dobar napredak u učenju tijekom godine. Djeca su zapravo izabrana posve
slučajno i nisu se razlikovala od kontrolne skupine ni prema čemu, izuzev prema očekivanju na koja
su o njima imali nastavnici. Nakon osam mjeseci, autori su utvrdili veći napredak na testovima
inteligencije upravo u djece označene kao nadarene i napredne. Mehanizam pozitivnih promjena do
kojih su dovela očekivanja Rosenthal objašnjava toplijim i emotivnijim odnosom prema učenicima,
ulaganjem većeg truda i davanjem većeg broja povratnih informacija, naučavanjem veće koičine i
težeg gradiva te pružanjem većeg broja prilika za iskazivanjem naučenog.
Učinak eksperimentatorovih očekivanja na konačne nalaze više nije dvojben. Njega je potvrdila i
meta-analitička studija što su je proveli Rosenthal i Rubin (1978) na 345 radova koji su se bavili
učinkom očekivanja.
Kontrola pristranosti eksperimentatora
1. Eksperimentatorovu pristranost moguće je odstraniti na više načina:
2. Povećanjem broja eksperimentatora
3. Smanjivanjem kontakata eksperimentatora i ispitanika217
216
212
217
213
145
Ivo V.
4. Potpunom standardizacijom postupka, objektivizacijom mjerenja i lišavanjem
eksperimentatora bilo kakve slobode i improvizacije
5. Primjenom dvostruko slijepog eksperimentalnog nacrta
6. Primjenom kontrolne grupe znanih očekivanja
Povećavajući broj eksperimcntatora smanjujemo broj ispitanika s kojima svaki pojedini
eksperimentator dolazi u dodir. Budući da različiti eksperimentatori mogu imati različita očekivanja
o ishodu eksperimenta, njihov se utjecaj ne ispitanike najčešće međusobno poništava. Usto se
povećava mogućnost uopćavanja rezultata jer se tako pokazuje da oni ne ovise o osobi koja provodi
eksperiment.
Smanjivanje broja i duljine kontakata s ispitanicima ujedno smanjuje mogućnost prenošenja
očekivanja i utjecanja na njih. Zbog toga je razumno očekivati i manje očitovanje različitih
artefakata vezanih uz očekivanja. No izostanak kontakta s eksperimentatorom može također
umanjiti realizam situacije i pridonijeti slabijoj vanjskoj valjanosti.
Utjecaj eksperimentatora uklanja se također jasnim uputama o tome kako treba provoditi
eksperiment, bilježiti rezultate i opažati izučavano ponašanje. Eksperimentatorova interakcija s
ispitanicima nastoji se pritom svesti na najmanju mjeru. Ni takve mjere opreza, međutim, nisu
jamstvo da se pristranost u nekom obliku neće "uvući" u eksperiment. Stoga je primjena dvostruko
slijepog eksperimenta svakako najbolji način kontrole takve vrste pristranosti.
U dvostruko slijepom eksperimentu ni ispitanici ni eksperimenrator ne znaju tko je izložen kojim
eksperimentalnim uvjetima. Ako se testira određeni lijek u odnosu na placebo, ni ispitanici ni
eksperimentatori ne znaju tko prima jedno, a tko drugo. S time su upoznati samo voditelji
istraživanja koji ne dolaze u dodir s ispitanicima te nema bojazni od njihove pristranosti.
Naposljetku, kontrolu učinka očekivanja moguće je obaviti uvođenjem očekivanja kao nezavisne
varijable u eksperiment. Ako smo zainteresirani kako će u školi napredovati učenici koji su na
testiranju pri upisu imali bolji ili slabiji rezultat, a usto želimo biti sigurni da na rezultate neće
utjecati nastavnikova očekivanja, možemo provesti faktorijalni nacrt 2 x 2 s nezavisnim varijablama
očekivanjem i izmjerenom inteligencijom. Ispitanici bi, bez obzira na stvarno zabilježenu
inteligenciju,218 nasumice bili podijeljeni u skupine za koje bi nastavnicima bilo rečeno da pripadaju
skupini boljih ili slabijih učenika.
U tablici je shematski prikazan mogući nacrt istraživanja. Stvarno bolji učenici su oni označeni s N 2
i N4, a stvarno slabiji N1 i N3. Skupine su podijeljene po slučaju kako varijable očekivanja i stvarnog
intelektualnog potencijala ne bi bile u korelaciji. Analiza varijance, kao primjerena statistička
obrada tako definiranog problema, pokazala bi utječu li na rezultate više sposobnosti, očekivanja ili
njihova interakcija.219
8. KVAZI EKSPERIMENTI
Prilikom upoznavanja s metodom eksperimenta, ustvrdili smo kako se radi o najmoćnijem
istraživačkom sredstvu spoznavanja uzročno-posljedičnih odnosa. Prednosti eksperimenta pred ne-
eksperimentalnim metodama posve su neupitne u svim istraživanjima čiji su ciljevi vezani za
218
214
219
215
146
Ivo V.
otkrivanje uzroka promatranih pojava. No kontrolu uvjeta kakvu zahtijeva eksperimentalna metoda
rijetko je moguće ostvariti izvan laboratorija. To, međutim, ne znači da se eksperimentalni nacrti ne
primjenjuju u prirodnim uvjetima Često je, naime, potrebno ispitati je li neka društvena intervencija
bila učinkovita ili ne (primjerice, poboljšani školski program, mjere za smanjenje broja prometnih
nezgoda ili program pomoći socijalno ugroženim slojevima). Primjena eksperimentalnih metoda u
takvom prirodnom okružju izbjegava artificijelnost svojstvenu laboratorijskom eksperimentu i
jamči mnogo bolju vanjsku valjanost. No preduvjete za provođenje istinskog eksperimenta rijetko
je, u primijenjenim projektima, moguće do kraja osigurati. Zbog toga se u takvim situacijama
primjenjuju nacrti koji slijede eksperimentalnu metodologiju, ali uz nepotpunu kontrolu vanjskih
varijabli, što slabi njihovu unutarnju valjanost.
Kvazi-eksperimenti220 (kvazi od lat. quasi, što znači tobožnji, navodni) imaju većinu odlika
istinskog eksperimenta, ali je zbog nemogućnosti kontroliranja nekih vanjskih varijabli njihova
spoznajna snaga manja, a na taj način izvedeni kauzalni zaključci nesigurni. Prisjetimo se da se
istinski eksperimenti odlikuju mogućnošću upravljanja nezavisnom varijablom, početnom
izjednačenošću eksperimentalne i221 kontrolne grupe ili, u slučaju nacrta unutar ispitanika,
primjerenim uravnoteživanjem različitih uvjeta s obzirom na redoslijed izlaganja. Sve što je manje
od toga naziva se kvaz i-eksperimentom (Goodwin, 1995). Pod tim se pojmom ipak najčešće
podrazumijevaju nacrti u kojima grupa izložena tretmanu (eksperimentalna) i ona koja mu nije
izložena (kontrolna) nisu početno izjednačene, odnosno osobe u njima nisu raspodijeljene po
slučaju (Cook i Campbell, 1979), što je preduvjet probabilističke ujednačenosti. Zbog toga se u
kvazi-eksperimentima, u pravilu, uspoređuju grupe koje se međusobno razlikuju prema čitavom
mnoštvu obilježja nevezanih uz nazočnost ili odsutnost intervencije koja se takvom metodom
provjerava. Zbog takve, manjkave, kontrole, zaključci o utjecaju nezavisne (tretmanske) varijable
na zavisnu ugroženi su nizom drugih mogućih objašnjenja.
8.1 RAZLIKE U ODNOSU NA ISTINSKI EKSPERIMENT

Istinske eksperimente odlikuju dva neizostavna svojstva: mogućnost upravljanja nezavisnom
varijablom i visok stupanj kontrole nad eksperimentalnim uvjetima. U odnosu na kvazi-
eksperimente, oni se još razlikuju prema uspostavljenoj ravnoteži između unutarnje i vanjske
valjanosti i temeljnim ciljevima koje slijede.
8.1.1 UPRAVLJANJE NEZAVISNOM VARIJABLOM
Kako je ranije rečeno, mnogi znanstveni problemi opiru se eksperimentalnom pristupu zbog
nemogućnosti upravljanja nezavisnom varijablom, ponekad je takva manipulacija neprovediva jer je
nezavisna varijabla neko osobno svojstvo nad kojim nemamo kontrolu, primjerice spol,
emocionalna stabilnost, inteligencija ili religioznost. Takvi nacrti počivaju na usporedbi skupina s
različito izraženim obilježjima koja čine nezavisnu varijablu, ali time je jasno narušeno načelo
slučajnog raspoređivanja ispitanika u skupine. Uzmimo da želimo ispitati utjecaj spola i intenziteta
buke na sposobnost koncentriranja. Radi se o faktorijalnom nacrtu u kojem jednom nezavisnom
varijablom (intenzitetom buke) možemo upravljati, dok drugom (spolom) ne možemo. Ako se u
takvom eksperimentu pokaže da je spol povezan s boljom mogućnošću zadržavanja pozornosti, tom
nalazu još uvijek ne možemo pridati svojstvo uzročno-posljedične povezanosti. Budući da izbor u
skupine nije obavljen po slučaju, već sustavno (svi ispitanici pridijeljeni su u jednu, a sve ispitanice
u drugu), ne može se odbaciti alternativna pretpostavka kako na dobivene rezultate nije presudno
utjecao spol, već neka varijabla povezana sa spolom (primjerice, savjesnost ili emocionalna
stabilnost). U tom slučaju možemo govoriti tek o korelaciji sa spolom, a ne o uzročno-posljedičnoj
vezi, jer je problem treće varijable, odnosno lažne ili spuriozne povezanosti prisutan u gotovo
jednakoj mjeri kao u neeksperimentalnom nacrtu.222
220
Izraz "kvazi-eksperiment" posve je uvriježen u psihološkoj literaturi, dok se istu metodu u sociologiji običavno
nazivati i terenskim eksperimentom. Budući da je određenje "terenski" donekle neprecizno, jer, kako ćemo vidjeli,
kvazi-eksperimenti se ne provode isključivo u "terenskim" ili "prirodnim" uvjetima, odlučili smo se za izraz, koji
utjelovljuje veću pojmovnu jasnoću.
221
217
222
218
147
Ivo V.
U drugim prilikama nezavisnom je varijablom nedopustivo i neopravdano manipulirati iz etičkih
razloga. Mogli bismo se, primjerice, zapitati kako na sposobnost društvene prilagodbe rnjerenu
mnoštvom pokazatelja samoprocjene i procjene drugih, utječe izloženost ratnom stresu. Za istinski
eksperimentalni nacrt bilo bi nužno ispitanike po slučaju raspodijeliti u skupine od kojih će jedna
biti izložena intenzivnim ratnim aktivnostima, a druga neće. Međusobna usporedba tako definiranih
i dovoljno velikih skupina upućivala bi na kauzalan odnos ratnog stresa na društveno
funkcioniranje. No takva vrsta manipulacije kosi se s etičkim načelima o kojima je ranije mnogo
govoreno. Ista vrsta problema pojavljuje se prilikom ispitivanja utjecaja nezavisne varijable koja na
neki drugi način nepovoljno utječe na ljude ili šteti njihovome zdravlju, poput droge, otrova,
zračenja ili sličnog. U eksperimentima nikad nije opravdano nanositi štetu sudionicima ili im
ugrožavati zdravlje. No naknadne usporedbe onih koji su, igrom slučaja, bili izloženi ratnom stresu
ili nekoj toksičnoj tvari i onih koji to nisu, moguće su i opravdane te čine srž kvazi-eksperimentalne
metode.
U praktičnim uvjetima, nadalje, nismo u mogućnosti stupnjevati nezavisnu varijablu onako kako to
činimo u laboratoriju. Zbog toga, najčešće, ostajemo bez potpunijih podataka o načinu na koji se
zavisna varijabla mijenja u funkciji nezavisne. Možemo, na primjer, biti zainteresirani za
učinkovitost propagandne poruke u mijenjanju prehrambenih navika. No za razliku od
laboratorijskih uvjeta, u kojima možemo precizno pratiti kako na opažano ponašanje i promjenu
stavova utječu različita svojstva poruke, poput, duljine, medija prenošenja, komunikatora ili drugog,
u praktičnim uvjetima takvo variranje je nemoguće. U kontroliranim uvjerima može se, primjerice,
pokazati da prekratka i preduga poruka nemaju velikog učinka na promjenu prehrambenih stavova i
navika. U primijenjenim istraživanjima takvo što često puta nije jednostavno ili uopće moguće
provjeriti.
8.1.2 MOGUĆNOST KONTROLE
Druga važna odrednica kvazi-eksperimentalnih nacrta jest, više puta spomenuta, slabija kontrola
nad prijetnjama koje ugrožavaju unutarnju valjanost. U najvećem broju slučajeva radi se o
nepoštivanju slučajnog raspoređivanja ispitanika u kontrolnu i eksperimentalnu skupinu. U
prirodnim uvjetima rijetko smo u mogućnosti po slučaju odrediti koji će ispitanici biti izloženi
kojem tretmanu. Često smo, naime, prinuđeni poštovati već uspostavljene, prirodne grupe, poput
školskih razreda, odjela, ustanova, organizacija, stambenih jedinica ili širih lokaliteta. Nastojimo li,
primjerice, ispitati učinkovitost nekog obrazovnog programa, iz praktičnih nam razloga neće biti
omogućeno da po slučaju odredimo uzorak ispitanika koji će mu biti izložen. U pravilu, prema
novom će programu raditi cijeli razredi ili čak škole, koje ćemo potom uspoređivati s drugim
razredima ili školama. To, međutim, 223 nipošto nije nacrt koji bi na zadovoljavajući način riješio sve
prijetnje valjanosti vezane uz selekciju ispitanika, tako da se završna razlika među skupinama ne
može sa sigurnošću pripisati korištenom programu. Potrebno je uočiti da nemogućnost upravljanja
nezavisnom varijablom i smanjena kontrola znaju biti i često jesu samo različiti nazivi za isti
problem. Nemogućnost upravljanja nezavisnom varijablom često je neraskidivo povezana s
neizvedivošću raspodjeljivanja u grupe po slučaju. Zbog toga se o razdvojenosti tih obilježja kvazi-
eksperimenta može govoriti tek uvjetno.
Nemogućnost istinske kontrole u kvazi-eksperimentima se nastoji nadomjestiti statističkom
kontrolom, obično putem analize kovarijance (opisane u poglavlju o statističkoj analizi) kako bi se,
barem na taj način, procijenio i držao pod nadzorom (odstranio) utjecaj inače nekontroliranih
vanjskih faktora na ishod istraživanja. Iako se tako znatno popravlja vjerodostojnost kvazi-
eksperimenata, njihove slabosti ipak ostaju, jer učinkovitost analize kovarijance uvelike ovisi o
tome jesu li značajne vanjske varijable prepoznate i izmjerene, što su preduvjeti njihova
uključivanja u analizu kao kovarijata.
8.1.3 ODNOS UNUTARNJE I VANJSKE VALJANOSTI
Kvazi-eksperirnenti se obično provode u prirodnim uvjetima sa zadaćom rješavanja praktičnih
problema poput učinkovitosti zakonske uredbe, obrazovnog programa, psihoterapijske metode ili
223
219
148
Ivo V.
propagandne poruke. Zbog toga je, kako smo već rekli, mogućnost kontrole vanjskih varijabli u
njima znatno manja nego u pravim eksperimentima, što osjetno ugrožava njihovu unutarnju
valjanost. S druge strane, njihova je vanjska valjanost u pravilu veća jer su okolnosti u kojima se
provode bliže stvarnosti. Može se stoga reći da umjetno, laboratorijsko, okruženje istinskog
eksperimenta jamči visoku kontrolu i popravlja unutarnju valjanost, no uopćavanje takve,
artificijelne situacije, na stvarne uvjete vanjskoga svijeta često nije opravdano. Kvazi-eksperimenti
se stoga nerijetko provode kako bi se nalazima prethodnih laboratorijskih istraživanja osigurala
vanjska valjanost.
8.1.4 CILJEVI KVAZI-EKSPERIMENATA
Istinski i kvazi-eksperimenti redovito imaju ponešto različite ciljeve. Dok su prvi usmjereni
ponajprije na spoznaju radi spoznaje same, drugi se u pravilu provode s određenom praktičnom
svrhom. Ponekad je, kako smo rekli, kvazi-eksperiment samo nastavak laboratorijskog
eksperimenta kojim se nastoji utvrditi mogućnost uopćavanja nalaza. No češće je upravo neka
društvena intervencija čija se učinkovitost propituje, razlog za organizaciju i provođenje kvazi-
eksperimenta.224
8.2 KVAZI-EKSPERIMENTI I NE-EKSPERIMENTALNA ISTRAŽIVANJA

Kvazi-eksperimente valja lučiti od istraživanja koja nastoje proniknuti u uzročno-posljedične veze
isključivo na temelju opažanja i uočenih korelacija među varijablama u njihovu prirodnom
pojavljivanju, odnosno bez primjene bilo kakve manipulacije. Takva istraživanja opisana su na
drugome mjestu i nazvana krajnje udomaćenim terminom, korelacijska, premda im se pridaju i
drugi, primjereniji, ali manje uvriježeni nazivi, poput "pasivnog opažanja" ili "neeksperimentalnih
nacrta" (Cook i Campbell, 1979). Kvazi-eksperimenti nalaze se zapravo na pola pluta između
pasivnog opažanja i istinskog eksperimenta. Zaključci o uzročno-posljedičnim vezama obično se u
njima izvode na temelju manipulacije nezavisnom varijablom, čime nalikuju istinskim
eksperimentima, ali ih slaba mogućnost kontrole približava pasivnom opažanju. Postoje također i
takvi kvazi-eksperimenti u kojima upravljanje nezavisnom varijablom, kako je ranije rečeno, nije u
rukama istraživača, ali je njen utjecaj moguće, u određenoj mjeri, izolirati u odnosu na sve drugo
što je u tom trenutku utjecalo na opažanu pojavu. Premda, primjerice, ne možemo manipulirati
ratnim stresom kojem je osoba izložena, mi o njegovu utjecaju sudimo usporedbom neujednačenih
grupa koje jesu ili nisu bile na bojišnici, nastojeći pritom logički isključiti ili uzeti u obzir ostale
utjecaje. Takva misaona razrada daje, u osnovi korelacijskom nacrtu novu kvalitetu i veću snagu
zaključaka te se s pravom govori o kvazi-eksperimentu.
8.3 NAČIN ZAKLJUČIVANJA U KVAZI-EKSPERIMENTU

Premda nalik onome u istinskim eksperimentima, zaključivanje u kvazieksperimentu nosi i
određene posebnosti. Ranije je rečeno da kvazi-eksperimenti ne uspijevaju razriješiti sve prijetnje
unutarnjoj valjanosti, te su zbog toga zaključci što ih nude u nekom stupnju nesigurni, a rezultati
podložni različitim tumačenjima. Provodeći kvazi-eksperiment istraživač nikad ne može biti posve
siguran da je upravo intervencija, a ne neki vanjski faktor proizveo promjene opažanog ponasanja.
To, međutim ne znači da je oprez i rezerva u zaključivanju jedino što mu preostaje po obavljenoj
studiji. Naprotiv, istraživač mora prijetnje koje korištenim nacrtom nisu do kraja otklonjene,
pokušati učiniti manje vjerojatnima loglčkom analizom. Da bi u tome uspio, mora poznavati
nedostatke konkretnog nacrta, odnosno one prijetnje koje njime nisu otklonjene. Ako preostala
tumačenja pregledom podataka ili logičkom analizom učiniti neuvjerljivima, zaključci dobivaju na
snazi, a slabosti nacrta bivaju nadoknađene. Osim samim nacrtom i logičkom analizom, prijetnje
unutarnjoj valjanosti mogu biti umanjene ili uklonjene još i mjerenjem i opažanjem te 225
statističkom analizom. U slučajevima u kojima predviđamo neke moguće prijetnje unutarnjoj
valjanosti, prije svega one vezane uz povijest, možemo, da bismo ih isključili kao vjerojatna
alternativna objašnjenja, posegnuti za dodatnim mjerenjem i opažanjem. Pri ispitivanju nekog
psihoterapijskog postupka, nastojeći isključiti mogućnost da je do promjene u ponašanju došlo zbog
224
220
225
221
149
Ivo V.
nekih maskiranih terapijskih učinaka na odjelu (terapijski razgovori s drugim osobljem, grupna
interakcija), korisno je pratiti ponašanje i u vrijeme kad ispitanici nisu podvrgnuti tretmanu. U
drugim prilikama možemo se potpomoći statističkom analizom kako bismo neke prijetnje
unutarnjoj valjanosti učinili manje vjerojatnima. Analizom kovarijance, o kojoj će više riječi biti
poslije, možemo statističkim putem isključiti one činiteije prema kojima grupe što ih uspoređujemo
nisu ujednačene, a razumno se dade pretpostaviti da utječu ili mogu utjecati na konačan ishod
eksperimenta.
8.4 OSNOVNI TIPOVI KVAZI-EKSPERIMENTALNIH NACRTA

Kvazi-eksperimente valja razlikovati od pred-eksperimentalnih nacrta koji u pravilu ne dopuštaju
razumne uzročno-posljedične zaključke. Takvim nacrtima manjka bilo:
kontrolna (usporediva) skupina koja nije izložena intervenciji kao u nacrtu:
dvokratno mjerenje zavisne varijable (ako grupe nisu raspodijeljene po slučaju)
ili oboje, u nacrtu poput:
Pred-eksperimentalni nacrti sami po sebi ne jamče ispravnost zaključaka i mogu pridonijeti

stanovitom razumijevanju pojave isključivo ako se brojna suprotstavljena tumačenja rezultata
odbace ili učine neuvjerljivima na temelju ranijih spoznaja ili logičke analize. S obzirom na brojne
slabosti, istraživače svakako treba odgovoriti od njihova korištenja.
Čitavo mnoštvo kvazi-eksperimentalnih istraživačkih nacrta može se svesti na svega dvije široke
kategorije (Cook i Campbell, 1979), nacrte na neujednačenim skupinama i nacrte prekinutih
vremenskih nizova. U nastavku ćemo upoznati najčešće korištene nacrte iz obiju kategorija:226
I. NACRTI NEUJEDNAČENIH SKUPINA
1. Dvokratni nacrt s netretiranom skupinom
 Nacrt s netretiranom kontrolnom skupinom i zamjenskom mjerom u predistraživanju
 Dvokratni nacrt s netretiranom skupinom na odvojenim uzorcim
2. Nacrti s usporedbom različitih zavisnih varijabli
3. Nacrti ponovljenih tretmana
4. Kohortni nacrti
5. Nacrt regresijskog prekida
II. NACRTI PREKINUTIH VREMENSKIH NIZOVA
1. Jednostavni nacrt
2. Nacrt vremenskih nizova s neujednačenom kontrolnom skupinom
3. Nacrt prekinutih vremenskih nizova s različitim zavisnim varijablama
8.4.1 NACRTI NEUJEDNAČENIH SKUPINA
Provjera učinkovitosti neke intervencije redovito počiva na usporedbi skupina od kojih je jedna bila
izložena nezavisnoj varijabli, a druga nije. Takav klasični tip istinskog eksperimentalnog nacrta
zahtijeva, međutim, raspodjeljivanje ispitanika u kontrolnu i eksperimentalnu grupu po slučaju. Kad
to nije moguće, govorimo o kvazi-eksperimentalnom nacrtu neujednačenih skupina. U takvom se
nacrtu međusobno uspoređuju grupe čija je početna izjednačenost upitna te je moguće da se
razlikuju ne samo prema izloženosti nezavisnoj varijabli nego i mnoštvu drugih obilježja. Zadaća
226
222
150
Ivo V.
dokazivanja uzročnosti pri korištenju takvih nacrta mnogo je nezahvalnija, jer se učinci intervencije
moraju odijeliti od posljedica početne neujednačenosti.
Nacrt se najčešće primjenjuje na prirodnim i nedirnutim skupinama poput razreda neke škole,
zemljopisnom lokalitetu, primjerice gradu, općini, županiji ili široj regiji, posebnom odjelu, npr. u
bolnici ili tvrtki ili u drugim prigodama gdje bi zanemarivanje već oblikovanih grupa bilo teško
izvedivo ili nepoželjne. Njih u nacrtu uspoređujemo s grupama koje u najvećoj mjeri posjeduju
podudarne odlike, primjerice drugi razredi, druge škole, drugi gradovi ili drugi odjeli, ali, kako je
unaprijed rečeno, njihova međusobna izjednačenost nije zajamčena raspodjeljivanjem po slučaju.
8.4.1.1 DVOKRATNI NACRT S NETRETIRANOM SKUPINOM
Nacrt u kojem se neki oblik tretmana ili intervencije procjenjuje mjerenjem prije i poslije izlaganja
te usporedbom s neujednačenom netretiranom skupinom, jedan je 227 od najčešćih kvazi-
eksperimentalnih nacrta u psihologiji. Shematski se može prikazati kao:
Isprekidana crta upućuje na tek djelomičnu usporedivost prethodno neujednačenih skupina. Velikim
slovom O, kao i prije označeno je opažanje, a slovom E (kao eksperimentalna varijabla) tretman ili
intervencija čija se učinkovitost ispituje. Koristi se u slučajevima koji traže uporabu
eksperimentalnih metoda, ali istodobno iz nekog razloga nije moguće provesti raspodjelu u skupine
po slučaju. Uzmimo za primjer istraživanje koje izlazi izvan okvira psihologije, ali je ilustrativno za
pristup što se koristi u kvazi-eksperimentalnim nacrtima.
Salcedo je 1954. (prema navod u Benneta i Lurnsdainea, 1975) proveo istraživanje u kojem je
proučavan svojedobno vrlo relevantan medicinski problem. Studijom provedenom na Filipinima
nastojalo se provjeriti hoće li obogaćena riža, u odnosu na običnu bijelu, pridonijeti smanjenju broja
oboljelih od bolesti beri-beri koja je u to vrijeme harala zemljom. Kako je poznato, bolest beri-beri
izazvana je manjkom vitamina B1 ili tiamina, koji se procesom prerade odstranjuje iz riže. U
populaciji poput filipinske u kojoj se većina pučanstva razmjerno jednolično prehranjuje bijelom
rižom učestalost bolesti bila je u to vrijeme visoka. Razmotrimo najprije zašto su se autori odlučili
za kvaz i-eksperimentalni pristup. Laboratorijsko istraživanje u svakom slučaju nije dolazilo u obzir
iz dva razloga. Prvi razlog je duljina trajanja eksperimenta, koja bi bila neprihvatljiva sa stajališta
ekonomičnosti. Uz to, javlja se i drugi razlog, razmjerno niska učestalost obolijevanja od bolesti čak
i u populaciji niskog unosa tiamina koja bi nalagala vrlo velik broj ispitanika za dokazivanje
učinaka nezavisne varijable. Zbog ta dva razloga istraživanje je valjalo provesti u prirodnim
uvjetima. Umjesno je pitanje zašto se problem nije pokušao istražiti spoznajno jačom metodom
istinskog eksperimenta. Takav pristup nalagao je raspodjelu u skupine po slučaju, što je bilo
nemoguće postići. Podjela po slučaju, naime, pretpostavlja da izbor jedinica u kontrolnu odnosno
eksperimentalnu skupinu bude međusobno neovisan. Primjerice, ako su jedinice kućanstva, to bi
značilo da netko može primati obogaćenu rižu, dok njegov susjed istodobno prima običnu bijelu.
Kako biti siguran da susjedi međusobno ne razmjenjuju, dijele ili prodaju rižu ili pak ne jedu jedni
kod drugih? Da bi se izbjegao takav tip problema, istraživači su podijelili poluotok Bataan na dva
dijela od kojih je jedan primao obogaćenu rižu, dok se drugi prehranjivao uobičajenom dijetom
temeljenom na bijeloj riži. Uzorci su bili usporedivi, ali početno neujednačeni odnosno njihova
izjednačenost nije zajamčena slučajnim izborom. Unutar godine dana, smrtnost zbog bolesti beri-
beri smanjila se za 56% u eksperimentalnom 228 području, dok se u kontrolnom istodobno povećala
za 10%. Prikazani grafički, podaci o incidenciji bolesti prije i nakon uvođenja tretmanske varijable
(izmijenjene prehrane) prikazani su na slici 8.1.
227
223
228
224
151
Ivo V.
Rezultati, čini se, nedvosmisleno upućuju na zaključak o uspješnosti intervencije. Premda je u

konkretnom slučaju takav zaključak teško osporiti, postoje brojne situacije u kojima privid
učinkovitosti proizvode prijetnje unutarnjoj valjanosti zbog početne neujednačenosti ispitanika.
Ukratko ćemo se na njih osvrnuti. Prema Cooku i Campbellu (1979), nacrt s neujednačenom
kontrolnom skupinom otklanja sve prijetnje unutarnjoj valjanosti, izuzev onih vezanih uz različite
oblike interakcije s izborom ispitanika. To su, prije svih, interakcije:
 sa sazrijevanjem
 s poviješću
 s instrumentacijom
 sa statističkom regresijom
S obzirom na to da je riječ o interakciji, znamo da sazrijevanje, povijest, instrumentacija i statistička
regresija ne djeluju same po sebi, nego njihova važnost biva potaknut početnim razlikama među
grupama. Ubrzo ćemo objasniti suštinu svake prijetnje, nastojeći pokazati u kojim situacijama
najčešće dolaze do izražaja i kako je mogla utjecati na rezultate u prethodno iznesenoj studiji.
Autori svjesni mogućlh izvora nevaljanosti vlastitog nacrta moraju ponuditi logički utemeljene
argumente zašto drže da različite prijetnje nisu presudno utjecale na rezultate, ugrožavajući
vjerodostojnost iznesenih zaključaka.229
Prva od prijetnji vezana uz nacrt s neujednačenom kontroinom skupinom odnosi se na interakciju
izbora ispitanika i sazrijevanja. Do nje dolazi ako isptanici iz jedne skupine postaju iskusniji,
umorniji, zreliji ili učeniji brže nego oni u drugoj što, neovisno o intervenciji, može dovesti do
povećanja ili smanjenja prvotne razlike među njima. Uzmimo za primjer istraživanje u kojem se
neki novi nastavni program testira u jednoj školi, dok druga, slična škola služi kao kontrola i u njoj
se primjenjuje klasični nastavni program. Recimo da škole nisu do kraja izjednačene prema
sposobnostima učenika. Školu u kojoj se provodi eksperimentalni program i koja se nalazi u nešto
boljoj četvrti pohađaju u prosjeku intelektualno sposobniji učenici, dok se kontrolna škola nalazi u
nešto siromašnijoj četvrti i njeni polaznici nemaju u toj mjeri izražene intelektualne sposobnosti.
Ako je novi program učinkovitiji od starog, možemo očekivati veću razliku u iskazanom znanju u
drugom testiranju u odnosu na ono prvo. No isti učinak možemo očekivati zbog razlike u
sposobnostima koje učenicima eksperimentalne škole pomažu da bolje i brže usvajaju gradivo,
neovisno o korištenom programu. Slika 8.2 prikazuje ishod do kojeg može doći zbog interakcije
izbora i sazrijevanja ispitanika.
229
225
152
Ivo V.
Slika pokazuje nešto veću razinu znanja djece iz bogatije četvrti prilikom prvog opažanja, a nakon
uvođenja tretmanske varijable razlika u odnosu na netretiranu skupinu se još povećala. Često se
povećavanje razlike između tretmanske i netretmanske skupine u drugome testiranju pogrešno i
neopravdano pripisuje učinku tretmana. Prije no što to učini, istraživač bi morao isključiti
podjednako vjerojatnu hipotezu o interakciji početne neujednačenosti i sazrijevanja. U našem
primjeru djeca iz230 bogatijih četvrti možda su nešto sposobnija od one iz siromašnih, zbog čega
brže usvajaju novo gradivo. U takvoj bi situaciji brzina usvajanja novog gradiva, a ne nastavna
metoda, bila zaslužna za povećavanje razlike između djece iz različitih škola. No to, dakako, nije
jedina mogućnost tumačenja dobivenog ishoda, niti se interakcija izbora ispitanika i sazrijevanja
uvijek očituje u takvome obliku. Podjednako je, primjerice, vjerojatno da na dobiveni ishod utječe
interakcija povijesti i izbora ispitanika. Što to znači? Događaji između dva testiranja kojima je jedna
skupina bila izložena, a druga ne, mogli su dovesti do razlike u drugome mjerenju koja stvara
varljiv dojam o učinkovitosti tretmana. U našem primjeru događaji su mogli biti zbivanja u obitelji.
Poznato je da su imućnije obitelji obično intelektualno poticajnije u odnosu na siromašnije, te se
pomak u rezultatima prvih može pripisati intelektualnom rastu potaknutom stimulativnom
okolinom, a ne tretmanom.
Interakcija izbora ispitanika i povijesti vrlo se često susreće u praksi. Svaki događaj nevezan uz
intervenciju koji utječe na jednu, ali ne i drugu skupinu uključenu u istraživanje predstavlja, kako tu
pojavu nazivaju Cook i Campbell (1979), dio lokalne povijesti. Interakciju izbora ispitanika i
povijesti, kao prijetnju unutarnjoj valjanosti, treba, dakako, razlikovati od povijesti same, koja
uglavnom ugrožava pred-eksperimentalne nacrte. U tom slučaju također govorimo o događajima
između dva testiranja koji zbog odsutnosti kontrolne grupe mogu stvoriti pogrešan dojam učinka
nezavisne varijable. U iznimnom slučaju, prijetnja se može javiti i u istinskim eksperimentima u
kojima se zbog nedostatne kontrole (nedovoljne standardiziranosti uvjeta) odvijaju zbivanja koja
nisu zajednička eksperimentalnoj i kontrolnoj grupi. Kod kvazi-eksperimenata, međutim, različitost
u iskustvima između dva mjerenja često je odraz početne neujednačenosti ispitanika. Stanovanje u
bogatoj četvrti vjerojatno proizvodi različita iskustva od života u siromašnom dijelu grada,
neujednačenost u inreligenciji također može dovesti do posve različitih vanjskih utjecaja između
dva testiranja, kao što to mogu i rasna pripadnost, stupanj urbaniziranosti, spol, dob, naobrazba te
čitav niz drugih čimbenika prema kojime skupine nisu početno ujednačene. Sljedeća slika prikazuje
ishod do kojeg može doći zbog interakcije izbora ispitanika i povijesti. Recimo da smo nastojali
provjeriti učinkovitost programa odvikavanja od alkohola. Kako bismo program ispitali, primijenili
smo ga na skupini liječenih alkoholičara u jednoj regiji uspoređujući je pritom s drugom regijom u
230
226
153
Ivo V.
kojoj se program nije provodio. Kao mjeru uspješnosti mogli smo koristiti postotak apstinentskih
dana u nekom razdoblju. U konačnici rezultati bi mogli sličiti onima sa slike 8.3.
Slika pokazuje nešto veći postotak apstincntskih dana tretmanske grupe pri prvom opažanju. U
naknadnom mjerenju ta se razlika još produbljuje, jer tretmanska grupa napreduje, dok ona kojoj je
tretman uskraćen, stagnira na istoj razini. Čemu pripisati nastalu razliku? Osim samog programa, na
dobivene rezultate231 mogao je utjecati niz regionalnih događanja kojima je bila izložena tretmanska
grupa. Primjerice, s tretmanom se mogao vremenski podudariti feljton u lokalnim novinama o
štetnom utjecaju alkohola. Većoj apstinenciji mogli su pogodovati i brojni drugi faktori. Uzmimo da
se tretmanska grupa nalazi u regiji u kojoj zaposlenost sezonski varira, na primjer zbog
poljodjelskih radova, berbe ili turističke sezone. Povećavanje apstinencije može u tom slučaju biti
posljedica povećane zaposlenosti inače nezaposlenog pučanstva koje zbog toga, a ne zbog tretmana
kontrolira unos alkoholnih pića. U takvim slučajevima najbolje je vlastite zaključke pokušati
osnažiti dodatnim prikupljanjem podataka, nastojeći isključiti alternativne pretpostavke. Ako
smatramo da je do poboljšanja moglo doći zbog napisa u novinama, valja analizirati pisanje
lokalnih novina. Ako držimo da je na suzdržavanje od alkohola utjecalo smanjenje nezaposlenosti,
valja prikupiti podatke o kretanjima broja nezaposlenih u vremenu provođenja istraživanja. Premda
moguća, prijetnja vezana uz interakciju izbora ispitanika i sazrijevanja nije u prikazanom slučaju
vjerojatna. Moglo bi se, naime, očekivati da se broj apstineritskih dana poveća u obje skupine, a ne
samo u tretmanskoj. Ostajanje na istoj razini upućuje na to da u netretmanskoj skupini nije došlo do
sazrijevanja, te se takva prijetnja unutarnjoj valjanosti vjerojatno može odbaciti kao logički
neutemeljena.
Pogledajmo sljedeći primjer (slika 8.4) koji ilustrira mogući ishod u slučaju interakcije izbora
ispitanika i instrumentacije.Donekle slično kao u prethodnom slučaju, slika pokazuje da su skupine
početno neujednačene, te da se prvotno izmjerena razlika u drugom mjerenju dodatno232 povećava
zbog malog pomaka rezultata tretmanske grupe. To oskudno povećanje može se pokazati statistički
neznačajnim, odnosno posljedicom slučajnih varijacija. Takav zaključak, međutim, možda
zanemaruje utjecaj interakcije izbora ispitanika i instrumentacije. U pravilu, takva se prijetnja dade
svesti na različitost instrumenata što se koriste u tretmanskoj i netretmanskoj grupi (uključujući i
različitu stručnost ili uvježbanost procjenjivača). Međutim, ponekad takve prijetnje imaju suptilnu
narav i teško ih je zamijetiti. Primjerice, čest je slučaj da su uporabljeni mjerni instrumenti naoko
istovjetni, ali su metrijski posve različiti ako se koriste na različitim populacijama. Uzmimo primjer.
Nije dvojbeno da mjerne ljestvice što se rabe u psihologijskim istraživanjima gotovo nikada ne
231
227
232
228
154
Ivo V.
posjeduju jednake intervale (dakle ne radi se o intervalnim mjernim ljestvicarna, već obično o
ordinalnim) tako da pomaci na određenom dijelu skale ne znače isto što i pomaci na drugom dijelu.
Problem je posebno istaknut u situaciji poput one prikazane na slici, gdje su grupe početno dosta
različite. Zamislimo sljedeću situaciju. Dvije skupine učenika, uzmimo da se radi o dva razreda,
čine kontrolnu i eksperimentalnu grupu u kvazi-eksperimentu kojim se ispituje metoda usvajanja
novih riječi. Prvo mjerenje upućuje na inicijalno bogatstvo rječnika. Tretmanska grupa podvrgnuta
je potom intenzivnom učenju novih riječi, praćenom konverzacijom u kojoj se one mogu
upotrijebiti. U drugoj primjeni testa rječnika, učenici eksperimentalne grupe ne pokazuju bitno bolje
rezultate. Ono što možda utječe na podcjenjivanje učinkovitosti tretmana jest ranije spominjani (a)
"učinak stropa'', te (b) neintervalnost ljestvice na kojoj se procjenjuje zavisna varijabla. Učenici
već u početku barataju određenom, razmjerno velikom količinom riječi i 233 svaki daljnji napredak
iziskuje mnogo veći napor jer su preostale riječi odveć teške ili rijetke da bi se naučile. Riječ je,
zapravo, o problemu nedovoljne diskriminativnosti određenih dijelova skale. Ilustrirajmo to
primjerom. Među riječima sunce, stablo, pas, kakofonija, nepotizam i peristaltika, većina će
ispitanika prepoznati prve tri riječi, a neće preostale tri. Može se reći da je skala možda intervalna
na krajevima ali nikako ne u sredini. Razmak između poznavanja 3 i 4 riječi nikako, naime, nije
jednak onome između 1 i 2 ili pak 5 i 6. Slično se može dogoditi i u kvazi-eksperimentu. Obratimo
stoga pažnju na početnu razliku među grupama. Da je, kojim slučajem, prvo mjerenje pokazala
istovjetnost tretmanske i kontrolne grupe, problema različitog utjecaja instrumentacije ne bi bilo, a
upravo je on suština interakcije. Uzmimo da je početno mjerenje pokazalo da na početku obje grupe
poznaju pedesetak riječi, instrumentacija bi na obje grupe djelovala u jednakoj mjeri, jer se obje
središnje vrijednosti nalaze na istom dijelu skale. Dakako, gornji primjer govori samo o jednom od
mogućih ishoda do kojih može dovesti pojava različitog utjecaja instrumentacije na tretrnansku i
kontrolnu grupu. Kao što može prigušiti stvarnu učinkovitost tretmana, tako je instrumentacija
može prividno i prenaglasiti, recimo u slučaju da tretmanska grupa pokazuje inicijalno slabije
rezultate od kontrolne. Usto moramo napomenuti da gornji ishod nije tipičan samo za interakciju
izbora ispitanika i instrumentacije. On također može upućivati i na interakciju s poviješću. Preostalo
je još da razmotrimo situaciju u kojoj su skupine u različitoj mjeri podložne učincima statističke
regresije, koja maskira stvarnu djelotvornost primijenjenog tretmana.234
233
229
234
230
155
Ivo V.
Slika 8.5 pokazuje početno neujednačene skupine, koje se nakon primjene tretmana, prema
iskazanom rezultatu, približavaju jedna drugoj. Pritom se može činiti kako je do napretka došlo
zbog tretmana. Takvom se zaključku, međutim, kao i u prethodnim situacijama, mnogo štošta može
prigovoriti. Razlog za različit stupanj napretka u opažanom ponašanju mogu biti interakcija s
poviješću ili s instrumentacijom, ali ono što se u takvom ishodu ponajprije nameće kao vjerojatna
prijetnja unutarnjoj valjanosti jest interakcija sa statističkom regresijom. Pogledajmo na primjeru
kako do nje dolazi. U praksi smo često suočeni sa zadaćom pomaganja onim najviše ugroženima ili
depriviranima. To, primjerice, mogu biti učenici s najslabijim znanjem iz matematike. Početno
mjerenje obično se koristi kako bi se ustanovilo inicijalno znanje i utvrdilo koji su učenici najslabiji,
odnosno kojima od njih je tretman potreban. No ono što otprije znamo o statističkoj regresiji
upućuje na oprez. Ako na temelju neke nedovoljno pouzdane mjere (poput testa iz matematike)
izdvojimo iz šireg uzorka skupinu s krajnjim rezultatima (u ovom slučaju najslabijima, no isto se
dešava i s najboljima), ona će se u drugom mjerenju, prema središnjim vrijednostima, približiti
prosjeku bez obzira na primijenjeni tretman. Zbog toga ćemo se, zanemarimo li statističku regresiju,
naći u situaciji da tretman neopravdano proglasimo uspješnim (ako izaberemo one najslabije) ili
neuspješnim, čak kontraproduktivnim (ako izaberemo najbolje), bez obzira na njegovu stvarnu
vrijednost. U gornjem primjeru, najslabiji učenici, oni na kojima je pružena mogućnost dodatne
nastave, pokazuju najveći napredak u znanju matematike. No isto bi se pokazalo i bez ikakvog
tretmana! Zbog greške mjerenja kojom su u većoj mjeri opterećeni krajnji rezultati, njihova
aritmetička sredina, u drugom mjerenju se približava prosjeku. Ili još općenitije, do takve pojave,
prisjetimo se, dolazi uvijek u slučaju nesavršene povezanosti prvog i drugog mjerenja. Do
interakcije sa statističkom regresijom neće doći ako su ispitanici u sve skupine birani na isti način iz
iste populacije (bilo kao najslabiji ili kao najbolji), ali ako za jednu grupu, primjerice tretmansku,
odaberemo najslabije, a za drugu one tek nešto bolje, doći će do interakcije, kao i u slučaju kad
ispitanike biramo na isti način iz različitih populacija (primjerice, škola koje nisu posve
usporedive).
Sada kad smo upoznali osnovne tipove pogrešaka koje se javljaju prilikom primjene nacrta na
neujednačenim grupama, vratimo se na primjer istraživanja učinkovitosti prehrane obogaćenom
rižom na smanjenje učestalosti bolesti beri-beri. Je li na rezultate mogla utjecati pojava interakcije
izbora ispitanika i sazrijevanja. Zapravo je teško domisliti način na koji bi ona mogla proizvesti
artefakt i ugroziti zaključak o učinkovitosti tretmana. Jedna moguća hipoteza jest ona o stjecanju
boljeg imuniteta u dijelu poluotoka obuhvaćenog tretmanom. To znači da bi, iz nekog nepoznatog
razloga (u svakom slučaju nevezanog uz sam tretman), žitelji regije obuhvaćene programom ishrane
obogaćenom rižom, brže razvijali imunitet u odnosu na programom nezahvaćeni dio poluotoka.
Budući da takva hipoteza nije odveć uvjerljiva, možemo je, na temelju logičkih kriterija, odbaciti.
156
Ivo V.
Druga je mogućnost da se bolest počela 235 povlačiti sama od sebe, ali nešto brže u tretmanskoj
grupi, recimo zbog mlađe dobi ili boljih životnih uvjeta, što bi se, sukladno terminologiji Cooka i
Campbella (1979), također dalo podvesti pod interakciju izbora ispitanika i sazrijevanja. Takvo što
može se kao prijetnja uglavnom otkloniti jer se pokazalo da u netretiranoj grupi uopće nema
znakova smanjivanja čestine pojavljivanja oboljelih (sazrijevanja), što isključuje diferencijalno
sazrijevanje kao stvarnu mogućnost. Interakcija izbora s poviješću, naprotiv, mogla je utjecati na
rezultate. Na dijelu poluotoka koji je primao obogaćenu rižu moglo je istodobno doći do događaja
koji su, nevezano uz prehranu, utjecali na dobivene rezultate. Mogla se, recimo, pojaviti brošura
koja podučava o bolesti i načinima njene prevencije, ili pak neka druga vrsta hrane koja sadrži
potrebne vitamine. No kako su istraživači imali kontrolu nad tim potencijalnim prijetnjama, te takav
događaj ne bi protekao nezamijećen, i takva se mogućnost može logički odbaciti. Preostale dvije
prijetnje dadu se otkloniti samim ishodom kvazieksperimenta. Prijetnja vezana uz instrumentaciju
teško je zamisliva također i zbog prirode korištenih mjera, odnosno čestina pojavljivanja bolesti u
uzorku. Budući da se definicija bolesti nije mijenjala u tijeku istraživanja, moguće je, premda
iznimno malo vjerojatno, jedino pretpostaviti da su se liječnici na jednom dijelu poluotoka uvježbali
prepoznavati bolest koju su u početku pogrešno pripisivali i stanjima slične simptomatike, što je
umjetno smanjilo čestinu samo tretmanske grupe. Ovakva pretpostavka vrlo je nategnuta te je se s
visokim stupnjem sigurnosti može odbaciti. Posljednja alternativna hipoteza u odnosu na učinak
tretmana odnosi se na mogućnost da je do prividnog učinka tretmana došlo zbog pojave interakcije
ispitanika i statističke regresije.
Uistinu, moguće je pretpostaviti da je broj oboljelih osoba podložan nesustavnom kolebanju koje se
može podvesti pod kategoriju greške uzorkovanja ili mjerenja te se u određenom vremenskom
razdoblju može prividno "sama od sebe" smanjiti ili povećati. Ako je prvo mjerenje bilo provedeno
u trenutku kad je čestina pojavljivanja bila na najvišoj razini, može se očekivati da sljedeće
mjerenje pokaže smanjenje čak i u odsutnosti bilo kakve intervencije. Dakako, sve se to može
dogoditi pod pretpostavkom nesavršene korelacije (manje od 1) između dvaju mjerenja, što je posve
razumna pretpostavka zbog mnoštva ne sustavnih čimbenika. Primjerice, u nekom će se razdoblju
bolesnima proglasiti osobe koje su zapravo zdrave, dok će se u drugom bolesne osobe uzeti za
zdrave236. Ovisno o prevlasti jednog ili drugog tipa greške, procjena čestine pojavljivanja će
nesustavno varirati. U nekom će se razdoblju, valja i to predvidjeti, broj oboljelih povećati ili
smanjiti zbog mnoštva drugih nesustavno237 djelujućih čimbenika (primjerice selektivne migracije
zdravih, umiranja bolesnih, klimatskih prilika, ekonomskog rasta ili stagnacije koji utječe na
prehrambene navike itd.). No smanjenje čestine pojavljivanja u provedenom je istraživanju toliko
naglašeno da je razmjerno teško povjerovati u takvo tumačenje. Logički argumenti čine takvu
hipotezu neuvjerljivom te nas učvršćuju u stavu o uspješnosti provedenog tretmana.
Vidimo na pokazanom primjeru da kvazi-eksperimentalni nacrt, premda naoko slab, pruža velike
mogućnosti izvođenja uzročno-posljedičnih zaključaka, ako istraživač analizom i logičkim
argumentima otkloni prijetnje unutarnjoj valjanosti koje takav nacrt ne kontrolira. Pribrojimo li
tome i mogućnost primjene analize kovarijance koja dodatno kontrolira neke od prepoznatih
"vanjskih faktora", kvazieksperimenti mogu se, prema spoznajnim dosezima, posve približiti
istinskim eksperimentima, pred kojima imaju i jednu neupitnu prednost, nadmoćnu vanjsku
valjanost.
Nacrt s netretiranom kontrolnom skupinom i zamjenskom mjerom u predispitivanju
Jedna od brojnih varijacija dvokratnog nacrta s netretiranom grupom jest i nacrt u kojem se umjesto
dvokratnog korištenja istovjetnog instrumenta pribjegava primijeni paralelnih formi teesta ili čak
mjerama koje ne zahvaćaju identično obilježje, već neku s njime povezanu osobinu ili ponašanje.
Uzmimo za primjer istraživanje utjecaja predavanja vezanih uz ekološku problematiku na ponašanje
235
231
236
Premda se čini neuvjerljivim da do takvog tipa greške uopće može doći, valja imati na umu razmjerno fluidnu
granicu koju osoba prelazi prilikom izbijanja bolesti ili ozdravljenja: kada osobu u koje se bolest tek razvija valja
proglasili bolesnom, a kada se može govorili o ozdravljenju.
237
232
157
Ivo V.
srednjoškolaca, poput bacanja reciklažnog materijala u kontejnere. Najbolji način provjere
učinkovitosti predavanja jest da se srednjoškolci jedne škole, koji su čuli predavanja, usporede s
onima iz škole u kojima ona nisu održana, te da se na temelju pomaka u ekološkom ponašanju
izvede zaključak o djelotvornosti predavanja. No recimo da su predavavnja otpočela prije nego je
istraživanje naručeno. Jednom kad se to dogodilo, nismo više u mogućnosti izmjeriti inicijalno
stanje zavisne varijable. Uzmimo, međutim, da otprije posjedujemo podatke koji su bliski i
korelirani sa zavisnom varijablom. To, primjerice, mogu biti općeniti ekološki stavovi ili svijest o
ugroženosti okoliša. Oni su, premda nesavršena, ipak itekako korisna mjera koja nam u nacrtu
zamjenjuje početno mjerenje prave zavisne varijable.
Ili, drugi primjer. Povjerena nam je zadaća da ispitamo novi program učenja logike u gimnazijama.
Nažalost, na početku školske godme nema smisla primijeniti test znanja iz logike jer ju učenici nisu
do tad slušali. Ali je zato moguće umjesto predispitivanja iz logike koristiti ocjenu iz nekog drugog
predmeta, primjerice matematike ili filozofije kako bi se barem približno odredila polazišna točka
svake od skupina. Štoviše, kao zamjena za predispitivanje može poslužiti i naobrazba roditelja,
kvocijent inteligencije ili neko drugo obilježje za koje je poznata korelacija sa zavisnom varijablom.
Prisjetimo se, početno mjerenje u kvazi-eksperimentlntima je nužno, 238 jer ne možemo računati na
ujednačenost skupina koja se u istinskim eksperimentima ostvaruje raspodjelom po slučaju. Opća
shema nacrta je stoga:
Osnovna poteškoća sa zamjenskim mjerama jest to što se nalaze u nižim korelacijama s mjerama
drugog testiranja nego je to slučaj s istovjetnim testom (dakako, ovisno o pouzdanosti, i ta je
korelacija bitno manja od jedinice). Niža korelacija ujedno znači i veću varijancu greške kojom je
opterećen takav eksperiment te je za dokazivanje učinkovitosti tretmana potrebna mnogo veća
razlika među skupinama nego bi to bilo potrebno pri korištenju jedne mjere u dva testiranja.
Sukladno tomu, zamjenske mjere slabe snagu takvih nacrta, što znači da je njima teže otkriti utjecaj
nezavisne varijable ako on uistinu postoji. Takva pojava ne čudi uzme li se u obzir da analiza
kovarijance, koja se koristi kako bi se obradili rezultati takvog nacrta, odstranjuje varijancu
početnog mjerenja iz završnog mjerenja. Što su ta dva testiranja u većoj korelaciji, to je veća
količina odstranjene varijance, a preostatak je u većoj mjeri zasićen utjecajem nezavisne varijable.
Dvokratni nacrt s netretiranom skupinom na odvojenim uzorcima
Često nam praktične okolnosti ne dopuštaju dvokratno testiranje istih ispitanika. U tom slučaju
koristi se nacrt u kojem skupine ispitanika testirane prije i poslije provođenja tretmana nisu
istovjetne (dvokratno ispitane), ali su dio iste populacije. O čemu se zapravo radi prikazuje opća
shema u kojoj okomita crta upućuje na različitost uzoraka:
Nacrt se u pravilu koristi u dvjema situacijama, kad istraživač nije u mogućnosti dvokratno ispitati
iste ispitanike ili kad sumnja da će samo pred ispitivanje utjecati na rezultate naknadnog testiranja.
U odnosu na opći tip nacrta s neujednačenom skupinom, nacrt na odvojenim uzorcima podložan je
još i dodatnim slabostima. Ne samo da ne kontrolira prijetnje unutarnjoj valjanosti vezane uz
interakciju s izborom ispitanika, već se pojavljuju i ozbiljni problemi vezani uz usporedivost uzorka
prvog i drugog ispitivanja. Ono što potencira slabost takvog nacrta je stoga:
 pitanje uzorkovanja
 statističko kolebanje zbog greške uzorka239
238
233
239
234
158
Ivo V.
 moguća pristranost
 prijetnje unutarnjoj valjanosti vezane uz početnu neujednačenost kontrolne i
eksperimentalne skupine
Donekle pouzdane zaključke iz takvog nacrta možemo izvesti samo onda kada su uzorci u prvom i
drugom testiranju slučajno izabrani iz iste populacije. U tom slučaju, prvo je testiranje doista
usporedivo s drugim, ali, dakako, u granicama greške uzorka. To znači da se snaga nacrta bitno
smanjuje ako koristimo manje ili heterogene uzorke, a posve je mala ako uzorci nisu po slučaju
izabrani iz iste populacije. U ovom drugom slučaju nemamo nikakva jamstva o nepristranosti
jednog ili obaju uzoraka, što otklanja mogućnost jednoznačnog tumačenja zabilježene razlike među
njima. Uza sve dosad nabrojene slabosti, nacrt je podložan i svim prijetnjama zbog izbora
ispitanika, jer, čak i uz osiguranu usporedivost uzoraka prvog i naknadnog ispitivanja, nije
zajamčena usporedivost tretmanske i kontrolne grupe.
Uzmimo da nas zanima učinak promidžbenog skupa na preferenciju predsjedničkog kandidata u
nekom gradu. Poznato nam je, nadalje, da panel istraživanja prečesto pate od ozbiljne slabosti,
ispitanici, naime, pod svaku cijenu nastoje biti dosljedni prvotno iskazanom mišljenju. Stoga
odlučujemo ispitati učinke na nezavisnim uzorcima iste populacije. Pritom uspoređujemo uzorke iz
grada u kojem se treba održati predizborni skup s drugim, za koji vjerujemo da je sličan po
relevantnim obilježjima (veličini, regionalnim i demografskim osobitostima). Prije i poslije
održanog skupa u svakome od gradova ispitamo probabilistički uzorak građana i 240 provjerimo
njihove glasačke namjere. Uzmimo da smo dobili rezultate prikazane na slici 8.6.
Ono što prvo moramo provjeriti jest značajnost razlike u rezultatima uzorka tretmanskog u odnosu
na kontrolni grad. No za razliku od provjere na zavisnim uzorcima koja zbog smanjene greške
(varijance) posjeduje značajno veću statističku snagu, vjerojatnost dokazivanja učinka tretmana,
odnosno u konkretnom slučaju, predizbornog skupa, ako do njega uistinu dolazi, bitno je snižena.
Istraživač usto mora voditi posebnu brigu o usporedivosti skupina, kako tretmanskih u odnosu na
kontrolne, tako i uzoraka prvog u odnosu na drugo ispitivanje. Kako bi stekao uvid u izjednačenost
skupina koje su opažane prije, u odnosu na one promatrane poslije tretmana, istraživač ih
uspoređuje prema nekom relevantnom obilježju. U našem primjeru to mogu biti naobrazba, dob,
spol, nacionalnost, vjerska pripadnost, materijalni status i drugo. Prijetnje unutarnjoj valjanosti koje
ugrožavaju zaključke temeljene na kvazi-eksperimentalnim nacrtima, u ovome su slučaj još dodatno
pojačane. Gornja razlika može biti posljedica ne samo različitih interakcija izbora ispitanika sa
sazrijevanjem, poviješću, instrumentacijom, već također i neujednačenosti uzoraka prvog i drugog
testiranja. Naš nacrt, drugim riječima, ne isključuje pretpostavku o različitosti uzoraka dvaju
240
235
159
Ivo V.
testiranja (ne zbog greške uzorkovanja, jer se ona podrazumijeva, već zbog pristranosti), kao ni
pretpostavke o lokalnoj povijesti, ili diferencijalnom sazrijevanju.
Ilustrirajmo moguću pristranost u izboru uzoraka, koja prvo i drugo ispitivanje može učiniti
neusporedivima. Obavljamo li, primjerice, prvo testiranje prije podne, a drugo poslije podne, pri
čemu ne vodimo dovoljno brige o izboru ispitanika unutar kućanstava, može se dogoditi da u prvom
navratu obuhvatimo više starijih i nezaposlenih osoba, a u drugome više mlađih i zaposlenih. Ako
su dob i radni status bitne odrednice političke naklonosti (a redovito jesu), naši uzorci nisu
usporedivi niti nepristrani u odnosu na širu populaciju. Zbog pristranosti uzoraka, ne možemo
očekivati podudaranje prikupljenih statistika i populacijskih parametara, a time niti međusobnu
usporedivost statistika dobivenih na različitim uzorcima (izuzev u slučaju jednako pristrano
provedenog uzorkovanja). Razlike koje bismo pogrešno mogli pripisati učinku tretmana, u takvom
su primjeru samo posljedica pristrano izabranih uzoraka.
Pretpostavimo li da do pristranosti nije došlo, moramo isključiti podjednako važne prijetnje vezane
uz ranije spomenute interakcije s izborom ispitanika. Interakcija izbora ispitanika i povijesti u
prikazanom tipu nacrta svakako je vrlo izgledna. U razdoblju predizborne kampanje rijetko je
moguće izolirati jedan jedini događaj koji utječe na političke preferencije. Predizborni skup neke
stranke tek je jedan od mnogih utjecaja koji u tom vremenu djeluju na birače. U jednom od gradova
je istodobno mogao biti održan skup suparničke stranke, mogao je izaći povoljan ili nepovoljan241
napis u lokalnim novinama ili biti puštena politička emisija na lokalnom radiju. Sve od navedenog
upućuje na razložnost pretpostavke o lokalnoj povijesti kao potencijalno važnom utjecaju na
ponašanje. Isto je i sa sazrijevanjem. Pogledajmo još jednom razliku prije početka intervencije i
prisjetimo se da je konačan ishod tipičan za interakciju sa sazrijevanjem. Kasnije razlike u
političkom opredjeljenju ispitanika u tretmanskom gradu, mogući su odraz ranijih razlika i time
uvjetovanog bržeg priklanjanja predsjedničkom kandidatu. Recimo da znamo da se manje
izobražene osobe dadu, putem medija, lakše navesti da glasuju za određenog kandidata.
Pretpostavimo usto da su mediji većinom u rukama jedne stranke. To znaci da će grad koji okuplja
manje obrazovane žitelje pokazivati u vremenu sve veću tendenciju glasovanja za kandidata iz
stranke koja raspolaže većim medijskim prostorom.
8.4.1.2 NACRTI S USPOREOBOM RAZLIČITIH ZAVISNIH VARIJABLI
Ponekad smo prisiljeni neki program ispitati na samo jednoj grupi, bez izgleda da njezine rezultate
usporedimo s onima netretmanske grupe. Ni tu nismo posve bespomoćni jer nam preostaje
mogućnost da učinkovitost tretmana, provjerimo usporedbom mjera ponašanja za koje, sukladno
teoriji, očekujemo da će se promijeniti, s onima kod kojih se takve promjene ne očekuju. Primjerice,
ako nas zanima djelotvornost nekog programa za učenje matematike, mogli bismo rezonirati na
sljedeći način. Očekujemo promjenu u znanju matematike, ali istodobno nastojimo provjeriti je li
upravo tretman utjecao na promjenu ili je došlo do generalizirane promjene zbog povijesti,
sazrijevanja ili neke druge prijetnje unutarnjoj valjanosti. Ako je promjena specifična i ograničena
isključivo na znanje matematike, to u određenoj mjeri podržava zaključke o učinkovitosti programa.
Naprotiv, ako se istodobno popravlja i znanje iz književnosti, povijesti i zemljopisa, tada promjenu
možda možemo pripisati većoj pažnji (hothornski učinak), sazrijevanju, pononovljenom testiranju,
promjeni nastavnika, poboljšanju školske opreme ili nekom sličnom čimbeniku. U nacrtu stoga
uspoređujemo dvije različite zavisne varijable, očekujući diferencijalni učinak tretmana, promjenu u
jednoj i stabilno stanje u drugoj. Opća shema nacrta je:
pri čemu A i B označavaju različite mjere ponašanja unutar iste grupe. Kako smo rekli A može biti
test iz matematike, a B iz književnosti. Dakako, zavisne varijable moraju biti povezane u razumnoj
mjeri, jer jedino tako možemo kontrolirati prijetnje unutarnjoj valjanosti poput sazrijevanja,
241
236
160
Ivo V.
testiranja i povijesti. Izvjesno je,242 primjerice, da promjena nastavnika u osnovnoj školi neće
utjecati na količinu hrane koju dijete pojede, ali će svakako utjecati na njegovu motivaciju za
učenjem različitih predmeta. Stoga će usporedba rezultata u testovima iz matematike i književnosti
donekle kontrolirati prijetnje vezane uz povijest, dok usporedba testova iz matematike i količine
pojedene hrane to zasigurno neće. Ako se rezultati u testu iz matematike u drugom mjerenju
poprave, dok rezultati iz testa književnosti ostanu na istoj razini, možemo donekle isključiti
prijetnje vezane uz sazrijevanje, testiranje i povijest jer bi se, u protivnom, učinak u oba testa
vjerojatno poboljšao. Primjerice, ako se rezultati u testu iz matematike popravljaju samo zbog
ponovne uporabe istog instrumenta, takav učinak bit će zamjetljiv i u testu iz književnosti. Nažalost,
nacrti koji se temelje na usporedbi različitih zavisnih varijabli razmjerno su manjkavi i u pravilu
nisu primjeren okvir za izvodenje zaključaka o uzročno-posljedičnim vezama. U iznesenom
primjeru testiranje, instrumentacija, sazrijevanje ili povijest mogu u većoj mjeri utjecati na jednu
zavisnu varijablu negoli na drugu. Stoga je važno da zavisne varijable budu što je moguće sličnije
(primjerice, umjesto usporedbe matematike i književnosti, usporedba između rješavanja jednadžbi i
trigonometrije) i da testovi budu usporedivi (jednak broj pitanja, sukladan način odgovaranja i
primjerena težina). Zaključci su još sigurniji ako posjedujemo veći broj zavisnih varijabli i
očekivanja vezana uz svaku od njih (na primjer, učenje rješavanja jednadžbi najviše će popraviti
rezultate u matematici, nešto manje u fizici, a najmanje u povijesti).
8.4.1.3 NACRTI PONOVLJENIH TRETMANA
Drugi način da se učinkovitost tretmana provjeri na jednoj jedinoj grupi jest da se intervencija
višekratno (najmanje dva puta) ponavlja i uskraćuje. Opća shema pri tome je:
Dakako, nacrt je upotebljiv samo onda kada su učinci tretmana prolazni, jer u protivnom njegovo
kasnije uskraćivanje ne bi imalo smisla. Prikazanim nacrtom bismo primjerice mogli ispitati kako
buka utječe na pamćenje besmisienih slogova. Ispitali bismo inicijalnu sposobnost zapamćivanja,
potom izložili ispitanike buci i ispitali ih u takvim, otežanim uvjetima, potom ponovno u uvjetima
bez buke i naposljetku ponovno uz izlaganje zvučnim podražajima. Pri tome, sukladno teorijskim
pretpostavkama očekujemo ishod u kojem će unošenje buke smanjivati sposobnost zapamćivanja.
Takav je ishod prikazan na slici 8.7.
Premda se čini neupitnim da upravo buka utječe na smanjivanje sposobnosti zapamćivanja, nacrt
ponovljenih tretmana ne rješava sve prijetnje valjanosti. Za razliku od većine drugih tipova kvazi-
eksperimentalnih nacrta, pitanje unutarnje valjanosti 243 razmjerno je dobro riješeno, tako da postoji
malen broj alternativnih pretpostavki koje bi objasnile pomake u ponašanju, osobito ako postoji veći
242
237
243
238
161
Ivo V.
broj opažanja, ponavljanja i ukidanja tretmana. Ključni problem nacrta leži, međutim, u
konstruktnoj valjanosti i artefaktima vezanima uz interakciju ispitanika i eksperimentatora. Budući
da je unošenje i ukidanje tretmana najčešće uočljivo i neprikriveno, ispitanici mogu stvoriti jasne
hipoteze o tome što se ispituje i što se od njih očekuje, te se ponašati u skladu s time. Nije stoga do
kraja jasno je li upravo intervencija utjecala na promjenu ponašanja, prateća obazrivost i pažnja ili
pak želja da se udovolji eksperimentatoru. Prema osnovnoj logici nacrt koji se širi u vremenu i
uključuje višestruka ponavljanja tretmana blizak je nacrtu na pojedincu, o kojem će više riječi biti
poslije.
8.4.1.4 KOHORTNI NACRTI
Ponekad se umjesto neujednačenih skupina u kvazi-eksperimentima koriste kohorte, skupine ljudi
koje istodobno prolaze različite formalne (škola, sportski klubovi) ili neformalne institucije (obitelj,
vršnjačke grupe). Najčešće je ipak riječ o dobno sličnim kategorijama koje običavamo zvati
naraštajima ili generacijama. Pogodnost korištenja kohorti očituje se u tri glavne prednosti (Cook i
Campbell, 1979):
1. opažanje različitih kohorti omogućuje usporedbu onih izloženih tretmanu u odnosu na
prethodne ili sljedeće koje mu nisu izložene;244
2. kohorte se najčešće razlikuju tek u manjoj mjeri, što olakšava usporedbe;
3. usporedbu je često moguće napraviti pomoću dostupne arhivske građe prethodne ili sljedeće
kohorte;
Pogledajmo jednu od mogućih upotreba kohortnog nacrta. Želimo li ispitati učinkovitost novog
školskog programa obogaćenog samostalnim radom učenika na računalima, možemo to činiti
uspoređujući tretmanske i netretmanske razrede istodobno. Druga mogućnost jest da uspoređujemo
znanje učenika recimo četvrtih razreda, izmjereno prije i po završetku nastave s onim što su ga
unutar intervala iste duljine iskazali polaznici četvrtog razreda iste škole prethodne godine.
Shematski radi se o sljedećem tipu nacrta:
Valovita crta označava ograničen stupanj u kojem se usporedive kohorte međusobno razlikuju
(Cook i Campbell, 1979). Takva je pretpostavka razumna, jer se, primjerice četvrti razredi
prethodnog i sljedećeg naraštaja iste škole ne bi trebali međusobno značajnije razlikovati. U našem
primjeru O1 i O2 označavaju početno i završno testiranje četvrtih razreda godinu dana prije početka
programa. Njihov ukupni dobitak u znanju uspoređujerno s onim što ga ostvaruje sljedeći naraštaj
uz primjenu novog programa i računalne opreme. Ako se pokaže da je razlika između O 3 i O4 veća
od one između O1 i O2 tada se može govoriti o uspješnosti programa, ali tek pošto se isključe neke
od najvećih prijetnji unutarnjoj valjanosti. Među njima je bez dvojbe na prvome mjestu prijetnja
vezana uz izbor ispitanika i neujednačenost skupina. Jedan naraštaj učenika može biti atipično
dobar ili loš u odnosu na prosjek. Ova je prrjetnja dobrim dijelom kontrolirana jer posjedujemo
podatke o prvom mjerenju u obje kohorte, no ponekad se, zbog sigurnosti pribjegava i korištenju
dodatnih pokazatelja. Jedan od takvih, dodatnih načina da provjerimo njihovu izjednačenost jest
usporedba temeljena na njihovim socio-demografskim obilježjima i porijeklu. Može nas, primjerice,
zanimati naobrazba i društveni status njihovih roditelja, inteligencija ili opći uspjeh u ranijim
razredima. Ako se pokaže da se prema uzetim mjerama, koje moraju biti visoko korelirane sa
zavisnom varijablom, djeca značajno ne razlikuju, prijetnje vezane uz početnu neujednačenost
skupina možemo otkloniti kao neuvjerljive. Osim takvih prijetnji, važno je isključiti i onu vezanu uz
povijest, jer neki atipični događali mogu smanjiti uspješnost netretirane kohorte ili povećati
uspjesnost tretirane, navodeći na pogrešan zaključak o učinkovitosti programa. Kohortni nacrt se
može osnažiti uzimanjem većeg broja kontrolnih grupa, što bi nas u iznesenom primjeru, navelo da
244
239
162
Ivo V.
u arhivi potražimo podatke, ne samo prethodnog245 naraštaja četvrtih razreda, već i nekoliko
naraštaja unatrag. Time je, doduše, otklonjena prijetnja vezana uz atipičnost događanja tijekom
prethodne godine, ali ne i ona vezana uz neuobičajena događanja tijekom godine u kojoj je
proveden tretman. Najbolje rješenje u takvoj prilici jest kombiniranje kohortnog nacrta s nacrtom
netretirane skupine (usporedba s neujednačenorn skupinom u razdoblju kad se provodi tretman), jer
se na taj način nadilaze slabosti oba zasebna nacrta. Pogledajmo kako bi u praksi mogao izgledati
takav nacrt.
8.4.1.5 NACRT REGRESIJSKOG PREKIDA

Istraživač će se često puta naći u prilici ispitivati učinke specijalnih intervencija i programa
namijenjenih skupinama koje od drugih odskaču prema svojim obilježjima (naviše ili naniže). To
mogu biti najbolji studenti koje država za nagradu stipendira ili pak osobe intelektualno skromnih
potencijala kojima društvo pruža mogućnost kompenzatornog obrazovanja. Nije, kako ćemo ubrzo
vidjeti, jednostavno procijeniti je li neki takav program donio ploda, premda je osnovna logika
nacrta jednostavna. Pretpostavimo da studente nekog fakulteta razvrstamo prema prosječnoj ocjeni.
Uzrnimo također da oni s prosjekom većim od 4,8 dobivaju državne nagrade ili bivaju stipendirani
u nastavku studija. Kako provjeriti učinkovitost nagrade, kad su već i prije nje studenti probrani po
vrsnoći ionako najbolji? Naše očekivanje, u takvom slučaju ide i korak dalje 246. Ako je program
učinkovit, oni ne samo da će i nadalje biti najbolji, već će crta regresije između rezultata na prvom i
drugom testiranju neovisno izračunata na stipendistima i ne-stipendistima biti prekinuta, odnosno
pokazivati diskontinuitet. Pogledajmo sliku 8.8.
Uzmimo da su umjesto ocjena, kao kriterij stipendiranja korišteni bodovi na testovima i procjene
profesora. U protivnom, koristeći se ocjenama moglo bi nam se dogoditi da izazovemo učinak
stropa, jer bismo teško mogli očekivati pomak prosječne ocjene iznad 4,8. Na apscisi se nalaze
rezultati prvog, a na ordinati drugog testiranja. Kružići označavaju studente ispod razine potrebne
za stipendiju, a križiči one koji su je zavrijedili. Ako tretman (u našem slučaju stipendija) nema
245
240
246
Daljnja rasprava zahtijeva barem površno poznavanje regrcsijske analize i teško ju je učiniti jasnijom studentima
nevičnima statistici.
163
Ivo V.
učinka, regresijske crte247 će se kontinuirano nastavljati jedna na drugu bez prekida (iscrtana tanka
linija na desnoj strani slike). Uspješan tretman, naprotiv, dovest će do diskontinuiteta, odnosno
prekida u regresijskoj crti jer će nagrađeni studenti dodatno popraviti svoj prosječni rezultat, dok
ostatak studentske populacije to neće ostvariti. Za razliku od drugih dosad opisanih kvazi-
eksperimentalnih nacrta u kojima se o izjednačenosti grupa može samo nagađati, u nacrtu
regresijskog prekida nema takvih nejasnoća. Izbor ispitanika potpuno je određen njihovim početnim
rezultatima. Također za razliku od drugih kvazi- ili istinskih eksperimentalnih nacrta, u kojima
nastojimo u što većoj mjeri osigurati usporedivost skupina kako bismo pomake u rezultatima mogli
pripisati tretmanu, u nacrtu regresijskog prekida unaprijed smo suočeni sa skupinama koje su
namjerno učinjene maksimalno različitima s obzirom na predispitivanje. Usprkos tome, upravo
opisani nacrt posjeduje golem potencijal za vrednovanje različitih društvenih intervencija. Sa
stajališta metodologije, njime postignuta unutarnja valjanost usporediva je onoj istinskih
eksperimenata (Trochim, 1999). Ukratko ćemo objasniti zašto, premda je za dublje razumijevanje
logike nacrta potrebno konzultirati dodatnu literaturu (Cook i Campbell, 1979; Trochirn, 1999). Za
razliku od istinskih eksperimenata u kojima se usporedivost skupina postiže raspoređivanjem
ispitanika po slučaju, u nacrtu regresijskog prekida grupe su namjerno neujednačene, što nameće i
druge oblike kontrole unutarnje valjanosti. Čini se da je zbog prirode nacrta, prijetnja vezana uz
izbor ispitanika ozbiljan problem.248
Primjerice, interakcija izbora i sazrijevanja mogla bi u tretmanskoj i netretmanskoj grupi dovesti do

diferencijalnog pomaka u drugom testiranju. Uzmimo da se broj bodova na testu znanja što smo ga
primijenili u prvom mjerenju, u drugome povećava množenjem faktorom 1,5 (ili formulom O 2= 1,5
x O1), i da tretman nema nikakvog učinka. To znači da će osoba koja je na njemu postigla 10
bodova, na drugom testiranju postići 15 (dobitak od +5), ona s početnih 20 skočit će na 30 (+ 10),
dok će neka treća povećati vlastiti rezultat s 50 na 75 (+25). Radi se o interakciji sazrijevanja i
rezultata predispitivanja jer je očito da početno bolji studenti sazrijevaju brže od slabijih (njihov
bodovni porast je brži)249. Očekujemo stoga da će svi ispitanici postići bolji rezultat u drugom
mjerenju, ali će tretmanska grupa sazrijevati brže od netretmanske (jer je izabrana prema visini
247
241
248
242
249
Jednaka brzina sazrijevanja moglo bi biti opisana pribrajanjem svakom rezultatu jednakog broja bodova. Jednaka
stopa rasta mogla bi tako biti opisana kao O2 =O1 +2. U tom slučaju rezultati bi se linearno povćavali, tako da bi rezultat
10 u prvom testiranju odgovarao kasnijem rezultatu 12, 15 bi se povećao na 17, 20 na 22, a 50 na 52. U upravo
opisanom primjeru prisutno je jednakomjerno, a ne difercncijalno sazrijevanje (još nazvano interakcija sazrijevanja s
rezultatima predispitivanja) o kojem govorimo u glavnom dijelu teksta kao jednoj od prijetnji unutarnjoj valjanosti.
164
Ivo V.
bodova u predispitivanju). Međutim, učinak programa u nacrtu regresijskog prekida ne odražavaju
razlike završnog u odnosu na prvo testiranje, već promjena u povezanosti prvog i drugog testiranja
na mjestu odsijecanja250 uzorka koji prima tretman.
U konkretnom primjeru, usprkos različitoj apsolutnoj razini sazrijevanja, regresijska će crta biti
kontinuirana uvijek s istim množiteljem koji upućuje na nagib (u ovom slučaju 1,5). Isto bi se
dogodilo i da je množitelj kojim valja pomnožiti početni rezultat 1,2; 1,7; 2; 3 ili 5, sve dotle dok
sazrijevanje, u relativnom smislu, jednako utječe na sve rezultate. Slika 8.9 pokazuje neke od takvih
situacija.
Naprotiv, nacrt regresijskog prekida osjetljiv je na pojavu diskontinuiteta ili prekida u prirodi
povezanosti. To bi značilo da, primjerice netretirana skupina studenata napreduje u svojem znanju
prema jednadžbi O2= 1,5 x O1 dok se istodobno rezultati tretirane grupe mogu iskazati kao O 2=3 x
O1 (vidi sliku 8.10).
Ishod poput onog prikazanog na slici 8.10, malo je vjerojatan u slučaju izostanka tretmanskog
djelovanja. Zbog toga smo prilično sigurni da prijetnja vezana uz interakciju izbora ispitanika i
sazrijevanja ne ugrožava nacrte regresijskog prekida. Slično vrijedi i za drugu prijetnju koja se čini
logički uvjerljivim objašnjenjem prekida regresijske crte, onu vezanu uz statističku regresiju.
Prisjetimo se, naime, da će rezultati ponovnog mjerenja izračunati na ispitanicima ekstremiziranima
na temelju prvog mjerenja biti prosječno bliži prosjeku. To znači da će, u slučaju primjene nacrta
regresijskog prekida, rezultati skupine izdvojene prema većim vrijednostima težiti u retestiranju
nižem prosječnom rezultatu, dok će rezultati preostalih 251 naginjati nešto višim vrijednostima. No
ova diferencijalna kretanja prema prosjeku neće proizvesti prekid u regresijskoj crti. Naprotiv,
očekujemo da regresija prema prosječnoj vrijednosti bude kontinuirano zastupljena duž cijelog
raspona rezultata predispitivanja. Kako vidimo, suprotno prvome dojmu, nacrt regresijskog prekida
imun je na prijetnje vezane uz izbor ispitanika. Problem je, međutim, u njegovoj statističkoj snazi.
Goldberger (1972), primjerice, navodi procjenu kako je za ovaj tip nacrta potrebno osigurati 2,75
puta više ispitanika negoli u istinskorn eksperimentu da bi bio podjednako osjetljiv, odnosno da bi
se njime mogla odbaciti hipoteza o nepostojanju razlika u slučaju da one uistinu postoje. Usprkos
neekonomičnosti, primjenu takvog nacrta često nalažu praktične okolnosti.
8.4.1.6 STATISTIČKA ANALIZA NACRTA NEUJEDNAČENIH SKUPINA
Statistički postupci koji se koriste pri analizi rezultata kvazi-eksperimentalnih nacrta neujednačenih
skupina mogu se podijeliti u dvije široke kategorije koje će biti obrađene zasebno: analiza nacrta s
250
243
251
244
165
Ivo V.
nekontroliranim izborom ispitanika i analiza nacrta regresijskog prekida. Zbog ograničenosti
prostora, postupci i njihova logika bit će opisani na informativnoj razini, dok njihovo potpunije
upoznavanje i mogućnost korištenja zahtijevaju konzultiranje mnogo stručnije literature (poput
Reichardt, 1979).
Analiza nacrta s nekontroliranim izborom ispitanika
Najjednostavniji, ali ujedno i najmanje precizan način da se provjeri učinkovirost tretmana u nacrtu
s dvokratnim mjerenjem jest primjena t-testa ili analize varijance. Usmjerit ćemo se na analizu
varijance (ANOVA) kao općenitiji model, no ono što ćemo reći podjednako vrijedi i za t-testove. U
nastavku ćemo iznijeti osnovne podatke o drugim načinima statističke obrade koje se koriste pri
analizi takvih nacrta, analizi varijance na razlici drugog u odnosu na prvo mjerenje te
najprikladnijoj metodi, analizi kovarijance (ANCOVA).
Jednostavna analiza varijance
Podsjetimo se ukratko na logičke pretpostavke na kojima počiva ANOVA. 252 Ova metoda razlaže
rezultate na tri sastavnice, ukupnu aritmetičku sredinu izračunatu na svim ispitanicima, učinak
tretmana koji se ogleda u odstupanju prosječnih253 vrijednosti pojedinog eksperimentalnog uvjeta od
ukupne aritmetičke sredine i, naposljetku, grešku, odnosno varijancu koja preostaje nakon
izdvajanja varijance tretmana i predstavlja učinke svih drugih čimbenika koji pridonose
razlikovanju pojedinačnih rezultata. Pri izboru jednostavnog nacrta s dvokratnim mjerenjem i
početno neujednačenim skupinama, metodom ANOVA provjerava se uglavnom samo postojanje
statistički značajnih razlika između tretmana (ili tretmana i kontrolne grupe) u završnom mjerenju.
Osnovni nedostatak ANOVA-e je, prema tome, neuzimanje u obzir početnih razlika među grupanu.
U jednostavnoj ANOVA-i, tretman je, sukladno pretpostavci, jedini uzrok očekivane razlike u
opaženom ponašanju eksperimentalne i kontrolne grupe izmjerenom nakon intervencije. Takva se
pretpostavka može braniti samo u slučaju slučajne raspodjele ispitanika u grupe. Naprotiv u
kvazieksperimentima s neujednačenim grupama, mjere naknadnog testiranja mogu varirati (i
redovito variraju) zbog početne različitosti grupa. Zbog toga je jednostavna ANOVA neprikladna za
provjeru učinkovitosti tretmana u kvazi-eksperimentima. Neki istraživači upravo opisane
manjkavosti nastoje prevladati dvostupanjskim korištenjem ANOVA-e. Pri tome najprije provjere
istovjetnost tretmanske (tretmanskih) i kontrolne grupe u predispitivanju. Tek ako se razlike među
njima pokažu statistički neznačajnima, pristupaju analizi naknadnog testiranja. Ni taj postupak,
međutim, nije lišen ozbiljnih slabosti. Prvi je problem kako se ponašati u situaciji kad je već u
početnom mjerenju utvrđena statistički značajna razlika između usporedivih grupa. Na takvo pitanje
dvostupanjska ANOVA ne daje odgovora. Problem je tek nešto manje naglašen ako razlike u
početnom mjerenju nisu statistički značajne. Neujednačenost grupa, naime, ne može biti dobro
procijenjena samo na temelju predispitivanja. Uzmimo samo najjednostavniji primjer u kojem na
rezultate djeluje interakcija izbora i sazrijevanja. Početne manje razlike među grupama ne moraju
biti statistički značajne, što znači "zeleno svjetlo" za provedbu analize varijance na drugom
testiranju. Zbog nejednakog sazrijevanja, razlike u drugom testiranju nužno su veće i često
statistički značajne. Umjesto da rezultate opravdano pripišemo različitom sazrijevanju tretmanske i
kontrolne grupe, navedeni smo na pogrešno uvjerenje u učinkovitost tretmana. Vidimo stoga da je
ozbiljan nedostatak jednostavne ANOVA-e neuzimanje u obzir djelovanja interakcije, odnosno
potpuno zanemarivanje činjenice da isti tretman u različitih osoba može proizvesti različite učinke.
Drugi nedostatak, zbog kojeg je analiza kovarijance ponekad poželjnija od jednostavne analize
varijance u istinskim eksperimentima, jest slaba kontrola varijance vezane uz osobne razlike i s
njome povezan manjak statističke snage ANOVA-e. Naime, izdvajajući iz cjelokupne varijance
samo dio za koji je odgovoran tretman, ta metoda posjeduje značajno manju statističku snagu od
analize kovarijance koju ćemo opisati u nastavku izlaganja. Do toga dolazi zbog neuzimanja u obzir
drugih izvora varijauce, osobito individualnih razlika koje se odražavaju i na rezultatima
252
Nešto opsežnija rasprava pružena je u odjeljku o statističkoj analizi istinskih eksperimentalnih nacrta, no i ona se
zadržava tek na osnovnim informacijama. Čitatelja stoga i nadalje upućujemo na ozbiljnije i specijalizirane knjige
(poput klasičnih djela Fisher iz 1935., Cochrana i Coxa iz 1957 ili novijih "Viner 1971, Keppel 1982. Kirk. 1995).
253
245
166
Ivo V.
predispitivanja. Sve one, kako smo već pokazali, ulaze u varijancu greške i time 254 otežavaju
odbacivanje nul-hipoteze kad razlika na populacijskoj razini uistinu postoji.
Analiza varijance na razlikama prvog i drugog ispitivanja
Zbog prethodno opisanih nedostataka, ponekad se pristupa računanju ANOVA-e ne na temelju
rezultata naknadnog testiranja nego na temelju razlike između drugog i prvog ispitivanja (O 2-O1),
odnosno na tzv. rezultatima "dobitka". Osnovna je pretpostavka analize da će se učinak tretmana
očitovati kao veća ili manja promjena u rezultatima naknadnog testiranja u odnosu na početno
stanje. Analiza razlika ide stoga korak dalje od jednostavne ANOVA-e, uzimajući u obzir početno
izmjerene rezultate i mjereći učinak tretmana isključivo u odnosu na njih, a ne u razmjerima
apsolutne razlike tretmanske i netretrnanske grupe. Zbog toga se takvom vrstom analize pri obradi
rezultata kvazi-eksperimenata propituje različita nul-hipoteza u odnosu na jednostavnu analizu
variiance. Osnovna pristranost analize "dobitaka" sastoji se u korištenju prosječne razlike u prvom
testiranju kao standarda za procjenjivanje razlike u naknadnom testiranju. Kako smo ranije,
govoreći o sličnom postupku prilikom primjene t-testova ustvrdili, takav je postupak u većoj mjeri
opterećen greškom mjerenja. Zbog toga je i cijela analiza manje pouzdana te ju neki autori uopće ne
preporučuju (Cronbach, 1990). Usto što je neprecizan, takav postupak zanemaruje sve druge
činitelje koji usporedo s tretmanom mogu djelovati na zavisnu varijablu. Među njima istaknuto
mjesto zaslužuju interakcija izbora i sazrijevanja, ali i sve druge moguće interakcije, primjerice one
s instrumentacijom ili statističkom regresijom. Pored svega toga, analiza razlika pati od istih
slabosti kao i jednostavna ANOVA-a jer se ne obazire na moguću interakciju tretmana i
predispitivanja.
Analiza kovarijance255
Kako smo ranije rekli, cilj je eksperimenta stvoriti uvjete za dokazivanje učinka tretmana i to na
nedvosmislen način. U tome nas, međutim, ometa neizbježno prisutna greška koja zamagljuje
stvarne učinke. Grešku, već je mnogo puta rečeno, smanjujemo primjerenom kontrolom, uklanjajući
sve činitelje koji pridonose variranju rezultata neovisno o tretmanu. No dok je to donekle izvedivo u
istinskom eksperimentu, u kvazi-eksperimentima moramo računati barem s jednim, i to vrlo
važnim., izvorom varijabiliteta koji nismo u mogućnosti kontrolirati, a to je početna neujednačenost
skupina. Analizom kovarijance pokušavamo statistički razriješiti ono što ne uspijevamo
eksperimentalnom kontrolom. Njome provjeravamo razliku u256 naknadnom testiranju tretmanske i
kontrolne skupine uzimajući pritom u obzir rezultate na predispitivanju. Analiza kovarijance
(ANCOVA) ide stoga korak dalje od ANOVA-e se prilikom provjere razlikovanja u naknadnom
testiranju služi rezultatima predispitivanja koje putem linearne regresije odstranjuje iz analize.
Pojasnimo o čemu se zapravo radi. U svojoj biti i ANCOVA je metoda kojom se rezultati
eksperimenta prilagođavaju sukladno razlikama između ispitanika prije provođenja eksperimenta.
Zbog toga ova metoda zahtijeva posjedovanje podataka o nekom relevantnom obilježju prije
provođenja eksperimenta257. To obilježje naziva se kovarijatom, a često i kontrolnom ili popratnom
varijablom (Keppel, 1982). Podaci o kovarijati služe dvojakoj svrsi, da bi se
a) eksperimentalna greška svela samo na varijancu neovisnu o kovarijati i
b) učinci tretmana prilagodili u odnosu na razlike između tretmanske i kontrolne grupe
(ili više njih) prije njegova provođenja.
Premda podjednako važne za analizu kovarijance, na ovome ćemo mjestu raspravljati uglavnom o
ovoj drugoj svrsi jer je upravo ona srž logike statističkog zaključivanja u kvazi-eksperimentalnom
nacrtu.
Posvetimo ipak nekoliko riječi analizi kovarijance kao oruđu smanjivanja eksperimentalne greške.
Iako nema pravog lijeka za manjak kontrole u eksperimentu, ponekad se služimo metodama koje
254
246
255
U odjeljku što slijedi iznesena je logika primjene analize kovarijance u statističkoj obradi kvazieksperimentalnih
nacrta, dok je sam računski postupak opisan u poglavlju posvećenom statističkoj analizi eksperimenata.
256
247
257
U našem razmatranju kvazi-eksperimentalnog nacrta to je redovito rezultat u predispitivanju.
167
Ivo V.
postojeću i neizbježnu grešku smanjuju prepoznajući njezine izvore. Na tom načelu djeluje nacrt s
podjelom na blokove koji je opisan u poglavlju o statističkoj analizi eksperimenata, dok se u nacrt
unutar ispitanika uklanjaju svi izvori varijabiliteta vezani uz osobne razlike samim višekratnim
testiranjem. U analizi kovarijance, umjesto eksperimentalnom kontrolom ili uparivanjem (podjelom
na blokove) služimo se statističkom kontrolom. Jednako kao u nacrtu s blokovima, možemo vlastiti
nacrt poželjeti učiniti statistički snažnijim time što ćemo ukloniti razlike u varijabli za koju znamo
ili očekujemo da je snažno povezana s ishodom. Uočimo li, primjerice, da zbog velikih razlika
unutar grupa ne možemo odbaciti nul-hipotezu o učinkovitosti tretmana za razvijanje sposobnosti
čitanja i pisanja u prvoškolaca, možemo vlastiti nacrt učiniti osjetljivijim ako statistički isključimo
neku po ishod značajnu varijablu nevezanu uz tretman. To može biti inteligencija jer je prirodno
očekivati da sposobnost čitanja i pisanja uvelike ovise o darovitosti učenika. Uspijemo li isključiti
varijancu vezanu uz inteligenciju, preostat će samo manje unutargrupne razlike, zbog čega ćemo
biti kadri dokazati djelotvornost tretmana uz mnogo manju veličinu učinka. U nastavku ćemo
pokazati kako zapravo izgleda takav postupak.
Statistička kontrola kojoj je zadaća smanjenje varijance greške ili uklanjanje početne
neujednačenosti skupina postiže se metodom linearne regresije. Njome se uspostavlja pravocrtna
funkcija izmedu dviju varijabli, u ovom slučaju zavisne 258 varijable i kovarijate. Funkcija zapravo
predstavlja njihovu međusobnu povezanost (kovarijancu) odnosno varijabilitet zavisne varijable
koji se može pripisati kovarijati. Taj se varijabilitet statističkim putem odstranjuje iz zavisne
varijable, tako da preostaje samo onaj dio varijance nevezan uz kovarijatu. Prevedeno na jezik
kvazieksperimenta, rezultati drugog mjerenja oslobađaju se zamagljujućeg utjecaja početne
neujednačenosti, čime stvarni učinci tretmana bivaju bolje procijenjeni. U posve statističkom
smislu, od svakog se rezultata drugog testiranja odbija prognozirani rezultat temeljen na prvom
testiranju (odnosno na bilo kojoj drugoj varijabli izabranoj za kovarijatu). Formula poprima sljedeći
osnovni oblik:
pri čemu je Y rezultat u post-testu, ukupna aritmetička sredina, učinak tretmana, greška, a preostali
izraz predstavlja udio varijance koji se dade pripisati kovarijati. Ono što nas zapravo u
eksperimentu zanima jest učinak tretmana. Prema tome:
Iz formule je vidljivo da analiza kovarijance nije ništa drugo negoli jednostavna analiza varijance iz
koje je, zbog logike eksperimenta, prethodno izdvojen dio varijance koji se može pripisati kovarijati
(kovarijarica je upravo ime za zajedničku varijancu što je dijele dvije varijable). Valja napomenuti
da se analiza kovarijance u slučaju korelacije 0, pretvara u jednostavnu analizu varijance, dok u
slučaju korelacije približne veličine 1 postaje bliska jednostavnoj analizi varijance izračunate na
razlikama post-testa i predispitivanja. Pogledajmo slikovno u čemu se zapravo radi. Na slici 8.11 su
prikazani rezultati tretmanske i kontrolne grupe u pred ispitivanju i naknadnom testiranju. Umjesto
skupinom točaka, grupe su predstavljene oblakom. Aritmetičke sredine izvučene su kao okomice i
paralele. Vidimo da je aritmetička sredina tretmanske skupine u predispitivanju iznosila 8, a u
naknadnom testiranju 15, dok su prosječni rezultati kontrolne grupe bili 7 i 6. Razlika u
predispitivanju iznosila je stoga + 1, a naknadnom testiranju +9 u korist tretmanske grupe.
258
248
168
Ivo V.
Već intuitivno možemo zaključiti da tretman uistinu djeluje. Razlika između grupa prije tretmana
bitno je manja od one nakon tretmana. Tim prije što su mjere prvog i drugog testiranja umjereno
visoko korelirane (što je vidljivo iz izduženosti elipsa). Ako učinak tretmana doista postoji,
očekivane regresijske crte bit će pravocrtne i međusobno paralelne, kao na slici. Učinak tretmana
očituje se kao pomak regresijske crte naviše ili naniže ili, drugim riječima, kao razlika u sjecištima
regresijskih crta i ordinate. Uočavamo usto da analiza kovarijance uzima u obzir prethodne razlike
među grupama. Umjesto da učinkom tretmana proglasi sveukupnu razliku među aritimetičkim
sredinama u drugom testiranju (+9), ona u obzir uzima početne 259 razlike, pa je tako učinak tretmana
približno +8 (udaljenost regresijskih crta na slici).
Na slici 8.12 prikazana je situacija u kojoj učinak tretmana nije vidljiv. Tretmanska i kontrolna
grupa razlikuju se u prosječnim vrijednostima u oba mjerenja, ali elipse leže na zajedničkoj
regresijskoj crti. Osnovno pitanje na koje ANCOVA odgovara jest razlikuju li se tretmanska i
kontrolna grupa više nego što bi se dalo očekivati na temelju početne razlike očitovane u
predispitivanju. U prvom prikazanom slučaju, takva razlika postoji, u drugome ne. Krajnje
pojednostavljeno, u ANCOVA-i se za svaki rezultat predispitivanja računa vjerojatni rezultat u
naknadnom ispitivanju za obje grupe, tretmansku i kontroinu. Na temelju prosječne razlike rezultata
u drugom ispitivanju, izjednačenih s obzirom na prvo, sudi se o učinku tretmana. Pojasnimo.
Uzmimo rezultat u predispitivanju 10. Povucimo okomicu do regresijskih crta (masnije otisnutih)
koje opisuju vjerojatne rezultate kontrolne i tretmanske grupe. Vidimo da rezultat od 10 u
predispitivanju odgovara, u kontrolnim uvjetima post-testovnom rezultatu 8, odnosno u
tretmanskim uvjetima 16. Ili rezultat 5 postignut u početnom mjerenju. Ponovimo li isti postupak,
ustanovir ćemo da će, u prosjeku, osoba iz kontrolne skupine s tim rezultatom postići u post-testu 5,
dok će, za260 osobe u tretmanskoj grupi, prosječnu vrijednost predstavljati 13.Vidimo da je razlika
od +8 u korist tretmana konstantna za sve vrijednosti predispitivanja. To je upravo i udaljenost
dviju regresijskih crta jedne od druge.
259
249
260
250
169
Ivo V.
Učinak tretmana li ANCOVA-i je stoga jednak prosječnoj razlici između predviđenih rezultata na
post-testu tretmanske i kontrolne grupe prethodno izjednačenih prema rezultatu pred ispitivanja. Na
neki način, stoga, ANCOVA je metoda naknadnog, statističkog uparivanja rezultata tretmanske i
kontrolne grupe. Postavimo sebi još nekoliko pitanja. Što bi se dogodilo kad bi početna razlika
između grupa bila 0? U tome nam slučaju ANCOVA ne bi bila potrebna jer bi se svela na
jednostavnu ANOVA-u. Pritom bi se elipse međusobno preklopile (što bi uputilo na izostanak
učinka tretmana) ili bi bile paralelne jedna iznad druge (postoji učinak). Zašto se naša procjena
učinka tretmana popravlja (u slučaju pozitivne korelacije početnog s naknadnim ispitivanjem)
primjenom ANCOVA-e? Zato što smo u stanju bolje predvidjeti mogući rezultat jedne varijable na
temelju druge, što uklanja dio varijance greške koji bi inače primjenom ANOVA-e bio prisutan i
otežavao dokazivanje učinkovitosti tretmana. Ne ulazeći u podrobnu raspravu, kojoj ovdje nije
mjesto, napomenimo samo da se raspon vjerojatnih rezultata, primjerice u kontrolnoj grupi, 261
poznavanjem rezultata predispitivanja, značajno smanjuje. Za neki rezultat raspon moguićih
rezultata u naknadnom testiranju nije više 2-9 koliko bi bio bez poznavanja predispitivanja, vec je,
recimo za početni rezultat 4, 2-7 za rezultat 10, 4-9, a za 5 3-8. Sužavanje mogućeg raspona
rezultata zapravo je rezultat objašnjene varijance. Ukolonimo li tu varijancu iz jednadžbe, lakše
ćemo dokazati učinak tretmana i naš će eksperiment postati osjetljiviji.
No primjena ANCOVA- e krije u sebi moguću pristranost nastalu kao posljedicu greške mjerenja u
predispitivanju. Poznato je da su mjere kojima se koristi psihologija kako bi opisala ljudsko
ponašanje podložne pogrešci. U svakom testovnom rezultatu, opažanju ili procijenjivanju sadržana
je određena količina greške nastala zbog različitih nesustavno varirajućih čimbenika. I dok greška u
naknadnom testiranju samo smanjuje preciznost našeg statističkog oruđa i otežava utvrđivanie
učinaka ako oni postoje, opterećenost greškom mjera predispitivanja dovodi do pristranosti i do
artefakata pa se značajan učinak, zbog pojave koju ćemo ukratko opisati, može pretvoriti u
značajan. Što se zapravo dešava? Pogledajmo na slici 8.13, uz argumentaciju uvelike posuđenu od
Reichardta (1979).
Sad je već nešto jasnije o čemu se radi. Strelice na slici označavaju smjer u kojem djeluje greška
mjerenja. Budući da se radi o nesustavnom varijabilitetu, pojedinačni rezultati u podjednakoj se
mjeri pomiču naviše i naniže u odnosu na istinske262 vrijednosti. Prosječne vrijednosti se ne
mijenjaju, ali se elipsa širi prema krajevima. U prvom dijelu slike prikazan je utjecaj greške
261
251
262
252
170
Ivo V.
mjerenja u predispitivanju na ANCOVA-u. Elipsa je proširena u odnosu na vrijednosti apscise (pred
ispitivanja), što dovodi do toga da istinska crta regresije biva krivo procijenjena (puna crta). Valja
naime imati na umu da se ANCOVA-om regresijska crta prilagođava tako da se minimaliziraju
kvadratna odstupanja od drugog testiranja (ordinate). Ako su odstupanja u tom smjeru simeuična,
kao što je slučaj u odjeljku b), u kojem je prikazan utjecaj greške mjerenja u post-testiranju, tada se
istinska crta regresije i njena procjena podudaraju. Ako su odstupanja asimetrična (a), tada su
procjene zakrenute u odnosu na istinsku vrijednost, što vodi artefaktu i nalaženju tretmanskog
učinka tamo gdje on zapravo ne postoji. Na slici, nadalje, vidimo kako su pogrešne procjene
regresijske crte u odnosu na istinsku manjeg nagiba. Ovaj tip artefakta javlja se samo pri analizi
kvazi-eksperimenata, odnosno pri početno neujednačenim skupinama. Kada bi, kojim slučajem, one
bile početno izjednačene, promjena nagiba regresijske crte utjecala bi u jednakoj mjeri na obje
(odnosno elipse bi se, ili potpuno preklapale, ili bile paralelne jedna s drugom). Do artefakta također
ne bi došlo ni u slučaju da raspolažemo savršeno pouzdanim mjerama izučavanih konstrukata (što u
praksi nikada nije moguće), jer u tom bi slučaju sve točke, umjesto unutar elipse, ležale na pravcu.
Kako ukloniti pseudo-učinke prilikom primjena analize kovarijance? Najbolje rješenje je svakako
ono koje nudi Trochim (1999), zalažući se za ANCOVA-u koja je ispravljena u odnosu na vlastitu
pouzdanost (proporciju istinske varijance u cjelokupnoj varijanci). Ukratko ćemo izložiti logiku
postupka. Već smo rekli da greška mjerenja širi raspodjelu rezultata, odnosno povećava njihov
prirodni varijabilitet. Korekcijom dovodimo raspodjelu u "normalno" stanje, što istodobno utječe da
se izgubi artefakt uzrokovan njenim širenjem. Sužavanje varijabiliteta zapravo je vrlo jednostavan
postupak i obavlja se prema sljedećoj formuli:
pri čemu je Xpod prilagođeni rezultat. To je rezultat predispitivanja koji uzima u obzir nepouzdanost
mjerenja. Zbog toga je svaki rezultat nešto bliži aritmetičkoj sredini predispitivanja. Zgušnjavanje
rezultata prema aritmetičkoj sredini to je izrazitije što su mjere manje pouzdane. U krajnjem
(ujedno potpuno apsurdnom) slučaju izostanka korelacije između predispitivanja i post-testa (r=0),
svi bi rezultati bili svedeni na aritmetičku sredinu. Naprotiv, u slučaju jedinične korelacije između
prvog i drugog testiranja (što je podjednako rijedak slučaj kao i prethodno upotrijebljeni primjer),
stvarne vrijednosti rezultata ne bi se mijenjale. Pogledajmo što se dešava u realno mogućoj situaciji
u kojoj je korelacija prvog i drugog mjerenja razumno visoka, r=0,70. Recimo da aritmetička
sredina iznosi 100, a dva rezultata, A i B iznose 120 i 70, Nakon korekcije, rezultat A će iznositi
114, a B 79. Premda prvi ostaje natprosiječan, 263 a drugi ispodprosječan, oba su "bliže" aritmetičkoj
sredini nego što su početno bila.
Statističko analiza nacrta regresijskog prekida
Dva su matematički srodna načina ispitivanja učinka tretmana pri korištenju nacrta regresijskog
prekida. Oba smo već ranije upoznali govoreći o analizi nacrta s nekontroliranim izborom
ispitanika. Prvi je ANCOVA, a drugi regresijska analiza. Prisjetimo se da se o učinku tretmana sudi
na temelju postojanja ili nepostojanja prekida ili diskontinuiteta u regresijskim pravcima koji
opisuju povezanost pred ispitivanja i post-testiranja u kontrolnoj i tretmanskoj skupini. Problemu
možemo pristupiti računajući analizu kovarijance s predispitivanjern kao jedinom kovarijatom
(Reichardt, 1979). Pritom se ne suočavamo s problemima koji su nas pratili u obradi nacrta s
nekontroliranom selekcijom, jer greška mjerenja u predispitivanju, pri obradi nacrta regresijskog
prekida ne dovodi do pristranosti. Kako je to moguće? Valja imati na umu da se izbor ispitanika
odvija na temelju predispitivanja, a ne konstrukta koji on intencijski zahvaća, tako da naknadne
korekcije nisu potrebne. No utvrđeni diskontinuitet u regresijskim pravcima ipak ne mora nužno
značiti da je intervencija bila djelotvorna. Tomu mogu pridonijeti različite prijetnje unutarnjoj
valjanosti, ali i greška u specificiranju modela, poglavito ako se kontinuirana nelinearna povezanost
prikaže kao diskontinuirana linearna. Specifikaciji modela zbog toga svakako treba prethoditi
vizualna analiza povezanosti prvog i drugog testiranja (sagledavanjem oblika povezanosti).
263
253
171
Ivo V.
8.4.2 NACRTI PREKINUTIH VREMENSKIH NIZOVA
Dosad smo uglavnom govorili o nacrtima u kojima o uzročno-posljedičnoj povezanosti
zaključujemo usporedbom dviju istodobno testiranih skupina. Drugi način uspostavljanja uzročnosti
nudi obitelj kvazi-eksperimentalnih tehnika zajedničkog imena nacrti prekinutih vremenskih
nizova. Mogućnost takvog zaključivanja proizlazi iz većeg broja opažanja zavisne varijable prije i
poslije unošenja tretmanske varijable. To su samo osnovne odrednice nacrta prekinutih vremenskih
nizova koji se u praksi pojavljuju u mnoštvu različitih modaliteta. U nastavku ćemo se upoznati s
tipičnim nacrtima ove kategorije kako bi čitatelj stekao sliku o njihovim prednostima, nedostacima i
područjima primjene. Za podrobnije upoznavanje valja konzultirati izvrsnu i sveobuhvatnu knjigu
Cooka i Carnpbella (1979), na koju se naša rasprava u najvećoj mjeri naslanja.
8.4.2.1 JEDNOSTAVNI NACRT
U svom temeljnom obliku, nacrt prekinutih vremenskih nizova uključuje tek jednu opažanu skupinu
i niz mjerenja prije i poslije unošenja tretmanske varijable. Opća shema nacrta je (Cook i Campbell,
1979):264
Ranije smo rekli zašto jednostavna shema poput O1 E O2 ne nudi mogućnost uzročno-posljedičnog
zaključka (Campbell i Stanley, 1966). Takav nacrt ne otklanja gotovo ni jednu prijetnju unutarnjoj
valjanosti. Promjenu u drugom testiranju možemo pripisati, povijesti, sazrijevanju, prvom
testiranju, instrumentaciji i njihovim međusobnim interakcijama. No ako posjedujemo niz mjera
koje prethode i slijede nakon uvođenja tretmanske varijable, većinu takvih prijetnji možemo
ukloniti ili učiniti manje vjerojatnima. Uzmimo za primjer antologijski rad Campbella i Rossa
(1968) i pokušajmo kroz njega upoznati logiku takvih nacrta.
Tijekom 1955., više od 300 osoba poginulo je u prometnim nesrećama na autocestama

Connecticuta. Broj poginulih nadmašio je sve godine u kojima je vođena takva evidencija.
Guverner Connecticuta, Ribicoff, odlučio je tome stati na kraj i poduzeo oštre mjere kako bi suzbio
prebrzu vožnju, vjerujući da je upravo ona odgovorna za velik broj izgubljenih ljudskih života. U
prosincu 1955., guverner je uveo mjeru oduzimanja vozačke dozvole na mjesec dana osobama koje
po prvi put prekorače dopuštenu brzinu, dva mjeseca onima koje isti prekršaj ponove, te suspenziju
na neodređeno vrijeme onima koji to učine tri puta. Tijekom narednog razdoblja broj poginulih
značajno je opao, jednako kao i broj suspenzija uslijed prebrze vožnje. Ubrzo potom Ribicoff je,
uspoređujući broj fatalnih nesreća na cestama Connecticuta tijekom 1956. u odnosu na 1955. pred
264
254
172
Ivo V.
javnošću zaključio kako je program uspješan. Rezultati na temelju kojih je donesen ovakav
zaključak prikazani su na slici 8.14.265
Kako drže sami autori, vješto iznesen podatak poput ovog može izgledati uvjerljivo, ali istodobno
upućivati na posve pogrešne zaključke. Primijenimo li već usvojeno znanje o kvazi-eksperimentima
i prijetnjama unutarnjoj valjanosti, nije teško razabrati zbog čega podatak pred nama nema osobitu
težinu. Na smanjenje broja nesreća mogli su utjecati mnogi činitelji nevezani uz rigorozne sankcije
koje su u to vrijeme bile na snazi. Pobrojimo samo najvažnije. U odnosu na 1955., 1956. je mogla
biti godina u kojoj su vremenske prilike bile mnogo povoljnije za vožnju (manje kiše i lošeg
vremena), u međuvremenu su možda popravljene neke ceste, postavljeni dodatni prometni znakovi
ili je promet reguliran na bolji način. Sve to može se podvesti pod, sad već dobro poznatu, prijetnju
vezanu uz povijest. Također je moglo doći do sazrijevanja, u konkretnom slučaju to su svi događaji
koji pridonose postojanom trendu veće sigurnosti u vožnji. Ovamo se mogu ubrojiti bolja
izobraženost vozača, izrada sve boljih i sigurnijih automobila i sve boljih i sigurnijih cesta. No
faktor sazrijevanja također bi se mogao očitovati i kao postojan porast učestalosti nesreća zbog
narastanja broja vozila i gustoće prometa. Ta dva suprotna procesa vjerojatno se u konačnici
uravnoteže. Faktor testiranja, koji se ogleda u objavljivanju statistike o broju prometnih nesreća
prethodne godine, mogao je sam po sebi djelovati otrežnjavajuće i utjecati na smanjenje broja
nesreća u sljedećoj godini. Važno je također naglasiti da je do odluke o oštrijim kaznama došlo
nakon godine koju je obilježio dotad najveći broj prometnih nesreća sa smrtnim ishodom. Kako
znamo, kad na temelju jednog testiranja izdvojimo krajnje rezultate, oni zbog opterećenosti
greškom mjerenja (ili još preciznije korelacije niže od 1), u drugom testiranju imaju tendenciju
vraćanja prema prosjeku. Statistička regresija, također je, stoga, mogla biti uzrokom uočenog
pomaka. Ona u suštini i nije ništa drugo doli slučajno kolebanje rezultata. Zbog niza fakrora koji
nesustavno variraju, broj prometnih nesreća može jedne godine biti veći, a druge manji. Jedini način
da se utvrdi radi li se o istinskom pomaku ili tek slučajnoj varijaciji jesu testovi statističke
značajnosti. Pogledajmo sada kako nam podaci o zavisnoj varijabli izmjereni u različitim
vremenskim točkama prije i poslije tretmana pomažu pri tumačenju rezultata i osnažuju naše
zaključke.
Slika 8.15 baca posve novo svjetlo na prethodno iznesene podatke. Razdoblje prikazano u
prethodnoj slici označeno je svjetlijom bojom. Ono što se odmah dalo razabrati jest istaknutost
broja prometnih nesreća 1955. koje su inicirale uvođenje oštrijih kazni. Teško se zbog toga oteti
265
255
173
Ivo V.
dojmu kako je smanjenje broja prometnih nesreća sa smrtnim ishodima samo posljedica statističke
regresije. Može se činiti nejasnim kako egzakran pokazatelj poput broja nesreća sa smrtnim
ishodima može sadržavati grešku266. No uzmemo li kako se radi samo o pokazatelju opće sigurnosti
u267 prometu, prirodno je očekivati njegovu opterećenost nepreciznošću koju donose nesustavne
varijacije (često o pukom slučaju ovisi hoće li uopće doći do prometne nesreće i hoće li ona završiti
smrću ili samo povredama sudionika). K tome valja uzeti u obzir opću nestabilnost mjera smrtnih
slučajeva iz godine u godinu, tako da se ne može isključiti ni pretpostavka da se radi o uobičajenim
statističkim kolebanjima. Rad jasno pokazuje svu težinu provjere učinkovitosti tretmana u
praktičnim uvjetima, ali i neodoljivu privlačnost iznošenja zaključaka koji nisu opravdani nacrtom.
Što je najvažnije, treba uočiti prednosti što ih pruža nacrt vremenskih nizova u odnosu na posve
neeksperimentalni nacrt samo s mjerenjem prije i poslije tretmana.
Najvažniju prednost što je posjeduju nacrti vremenskih nizova pred ostalim kvazi-eksperimentalnim
nacrtima leži u mogućnosti prepoznavanja trenda sazrijevanja prije unošenja tretmanske varijable.
Uzmimo za primjer program psihološke pomoći koji bi za cilj imao smanjenje broja samoubojstava.
Recimo usto da su nam dostupni podaci o samoubojstvima ranijih godina i nakon početka
provođenja programa. To što se u nekom gradu broj samoubojstava smanjio sa 107 na 64 ne mora
mnogo značiti.
Slika 8.16 upućuje na postojanje jasnog silaznog trenda, odnosno smanjenja broja samoubojstava
prije početka tretmana. Zbog toga je na temelju takvog ishoda teško bilo što zaključiti o tretmanu.
Razlog kontinuiranom opadanju može biti268 popravljanje općih uvjeta života.
Istina je, doduše, da je opadanje broja samoubojstava u praćenom razdoblju najveće upravo u
vremenu provođenja programa, ali to se može shvatili kao nastavak prethodnog razdoblja. U
prikazanom primjeru, stoga, nije moguće isključiti prijetnje vezane za sazrijevanje.269
266
Prisjetimo se, statistička regresija posljedica je nejedinične korelacije dvaju mjerenja, odnosno mjerne nepouzdanosti
i do nje ne bi došlo da su konstrukti mjereni instrumentima koji ne sadrže grešku.
267
256
268
257
269
258
174
Ivo V.
Slika 8.17 upućuje na cikličke varijacije u broju samoubojstava. Razlog tomu mogu biti slučajna
kolebanja ovisna o meteorološkim prilikama (primjerice, broju kišnih dana, vrućinama, tlaku zraka
ili sličnom), ekonomskim činiteljima (primjerice, porastu ili opadanju broja nezaposlenih) ili nečem
trećem. Tretmanske se razdoblje ni po čemu ne izdvaja od ostalih faza u kojima broj samoubojstava
opada. Djelotvornost tretmana upitna je tim prije što se godinu potom broj samoubojstava nanovo
povećava.
Treći mogući ishod (slika 8.18) isključuje sazrijevanje kao prijetnju, a također i slučajno kolebanja
neovisna o tretmanu. Čini se da u ovom slučaju učinkovitost tretmana nije upitna. Doista, prikazani
ishod je najbliži tome da omogući zaključke o njegovoj djelotvornosti. No nacrtom nipošto nisu
otklonjene sve prijetnje unutarnjoj valjanosti. Uzmimo samo najvažniju od njih, onu vezanu uz
povijest. Tijekom 1995. u vremenu kad je implementiran program moglo se dogoditi nešto što je
utjecalo na smanjenje broja samoubojstava. Ne možemo, primjerice, isključiti pretpostavku da je
povrat okupiranih područja utjecao na smanjenje broja samoubojstava (dakako, primjer je posve
izmišljen i prikazane brojke nemaju nikakve veze sa stvarnom statistikom). Ne može se isključiti
niti prijetnja vezana uz instrumentaciju. Evidenciju broja sarnoubojstava, primjerice, mogla je
preuzeti neka druga ustanova koja je postrožila kriterije za proglašavanje nekog slučaja
samoubojstvom, što je samo prividno smanjilo njihov broj. Uvođenje novih kriterija pri mjerenju
iste pojave nije u stvarnosti rijetko, kako bi se moglo činiti na prvi pogled. Uzmimo samo primjer
175
Ivo V.
evidencije nezaposlenih. Tijekom 2002. usvojeni su stroži kriteriji prema kojima se osobe koje 270
odbijaju poslove u mjestima udaljenima 80 kilometara od mjesta stanovanja brišu iz evidencije,
jednako kao i one za koje se utvrdi da nisu raspoložive ili ne traže aktivno posao. Takve su mjere
ubrzo rezultirale "opadanjem" broja nezaposlenih, što svakako nije bila posljedica učinkovite
politike zapošljavanja.
Ponovimo da je jednostavni nacrt vremenskih nizova u prednosti zbog mogućnosti prepoznavanja
ranijih trendova, čime se otklanja prijetnja vezana uz sazrijevanje. Jednako tako vidjeli smo da ovaj
nacrt zadovoljavajuće rješava problem statističke regresije. Osnovne slabosti leže, međutim, u
nemogućnosti kontroliranja povijesti te, donekle, instrumentacije.
8.4.2.2 NACRT VREMENSKIH NIZOVA S NEUJEDNAČENOM KONTROLNOM SKUPINOM
Jedan od načina da učvrstimo naše zaključke o djelotvornosti tretmana do kojih smo došli
primjenom nacrta prekinutih vremenskih nizova jest da eksperimentalnoj skupini pridružimo i
kontrolnu koja se cijelo vrijeme prati, ali nije izložena tretmanu. Opća shema je pritom:
Prikazani nacrt vrlo uvjerljivo otklanja neke prijetnje unutarnjoj valjanosti koje nisu
zadovoljavajuće riješene jednostavnim nacrtom. Primjerice, na slici s prethodne strane nismo mogli
posve isključiti prijetnje vezane uz povijest i instrumentaciju. Smanjenje broja samoubojstava
moglo je biti posljedica nekog događaja na društvenoj razini ili pak promjene u bilježenju. Uzmimo,
međutim, da su nam na raspolaganju stajala dva grada u kojima smo iz godine u godinu pratili broj
samoubojstava. Osim opažanja u gradu u kojem je primijenjen program posjedujemo stoga i
kontrolna mjerenja u drugome gradu. Ishod koji prethodno nismo mogli dokraja rasvijetliti, postaje
primjenom šireg nacrta proturnačiv, s učincima koje je mnogo lakše pripisati djelovanju tretmana.
Pogledajmo sliku 8.19.
Ako je grad koji smo uzeli za kontrolu barem donekle usporediv s onim u kojem smo primijenili
program prevencije, što je osnovni preduvjet takvog nacrta, povijest i instrumentacija trebale bi
prestati biti ozbiljnije prijetnje unutarnjoj valjanosti. Vidimo da se u kontrolnome gradu broj
samoubojstava od početka do kraja zadržao na razmjerno stabilnoj razini i da se nije smanjio nakon
što je u tretmanskoj grupi primijenjen ispitivani program. To upućuje na to da nije bilo nekih širih
društvenih događanja kojima bi se mogao pripisati blagotvoran učinak smanjenog broja
270
259
176
Ivo V.
samoubojstava. Na isti način možemo isključiti instrumentaciju kao moguće objašnjenje uočenog
pomaka. Ako je način bilježenja podudaran u oba grada, ono ne 271 može biti odagovorno za pomake
u samo jednome od njih.
S druge strane, prikazani nacrt još je uvijek manjkav određenim aspektima unutarnje valjanosti. On
naime posjeduje slične slabosti kao i drugi nacrti s neujednačenom kontrolnom skupinom. Njime
smo, doduše, otklonili prijetnje vezane uz povijest, ali ne i uz interakciju izbora ispitanika i povijest,
ili, kako smo je nazivali, lokalnu povijest. Ne možemo, naime, kao moguće agense promjene
isključiti događaje koji su se dešavali u samo jednom od dva grada. To, primjerice, mogu biti veći
ekonomski prosperitet, bolja socijalna politika, uspjesi na sportskom polju ili nešto drugo. Budući
da ih ne možemo kontrolirati samim nacrtom, valja ih isključiti logičkom analizom.
8.4.2.3 NACRT PREKINUTIH VREMENSKIH NIZOVA S RAZLIČITIM ZAVISNIM VARIJABLAMA
Drugi način da se ukloni prijetnja unutarnjoj valjanosti vezana uz povijest jest nalaženje barem još
jedne zavisne varijable, koja će biti kontrola različitih događanja nevezanih uz tretman. Sličan
model spominjali smo kad smo se bavili nacrtima s neujednačenim kontrolnim skupinama. Logika
je u biti ista. Valja naći varijablu koja je bliska zavisnoj varijabli i na koju, sukladno teorijskoj
pretpostavci, ne djeluje tretman. Opća shema takvog nacrta (Cook i Campbell, 1979) je:272
Pokušajmo na primjeru vidjeti kako bi se takav nacrt mogao primijeniti. Uzmimo da pokušavamo
izmjeriti učinke neke propagandne kampanje za zubnu pastu X. Posjedujemo podatke o njenoj
prodaji prije i poslije kampanje. No ono što nas zanima jest može li se porast potrošnje pripisati
kampanji ili nekim drugim činiteljima, poput narastajuče zdravstvene svijesti. Možemo rezonirati
da, ako je upravo kampanja proizvela učinke povećane potrošnje, neka druga zubna pasta Y, koja u
tom razdoblju nije bila odveć reklamirana, neće bilježiti porast potrošnje. Ishod koji smo, na
temelju provedene analize očekivali, uglavnom se ostvario. Zubna pasta X uistinu se počela
pojačano kupovati nakon propagandne kampanje, za razliku od paste Y, čija potrošnja nije
zabilježila tako nagli porast. S obzirom na to da je skok nakon kampanje očigledan, a da nije
zamijećen u kontrolnoj zavisnoj varijabli, povijest se može isključiti kao moguća prijetnja valjanosti
zaključaka. Premda su trendovi potrošnje obje zubne paste uzlazni, prijetnja vezana uz sazrijevanje
271
260
272
261
177
Ivo V.
također se može odbaciti. Na temelju trenda uspostavljenog u mjerenjima prije kampanje, nije se
mogao očekivati takav skok u potrošnji.
8.4.2.4 MOGUĆI NEDOSTACI NACRTA PREKINUTIH VREMENSKIH NIZOVA
Nacrti prekinutih vremenskih nizova naširoko se koriste u primijenjenim istraživanjima, poglavito
zbog mogućnosti držanja pod kontrolom većeg broja prijetnji unutarnjoj valjanosti. Prethodno
spomenuti nacrti dobro ilustriraju logiku na kojoj273 počivaju i način uklanjanja alternativnih
pretpostavki. Istraživač koji ih koristi, međutim, mora biti svjestan i njihovih zajedničkih
ograničenja koja proistječu iz praktičnih okolnosti u kojima se takva istraživanja provode. Cook i
Campbell (1979) spomenuli su četiri osnovna:
1. Postupno umjesto naglog uvođenja tretmana
2. Odgođeno uzrokovanje
3. Premalen broj vremenskih nizova
4. Problemi vezani uz arhivske podatke
Društvene promjene najčešće se ne odvijaju naglo, već se uvode postupno. Zbog toga je razmjerno
teško točno odrediti točku u kojoj je neka skupina izložena intervenciji. Svi navedeni nacrti,
međutim, pretpostavljaju istodobnost uvođenja promjena u cijeloj skupini. Pokušamo li utvrditi
djelotvornost novog zakona o ograničenju brzine, obično polazimo od pogrešne pretpostavke da je
program u punom smislu implementiran od prvoga dana stupanja na snagu. Najčešće je, međutim,
potrebno stanovito vrijeme da bi se sa zakonom upoznali podjednako građani i prometna policija
kako bi se potom počeo provoditi. Zbog toga početni izostanak učinaka možda jednostavno treba
pripisati nepotpunom provođenju tretmana. Nadalje, tretmanske varijable ne moraju djelovati
promptno, već se često dešava da se njihov učinak javlja sa zadrškom. Istraživač stoga mora biti
pripravan pratiti promjene u duljem vremenu po uvođenju tretmana. Nažalost, praktične okolnosti
prečesto skraćuju period praćenja otežavajući izvođenje zaključaka. Stroga statistička pravila što ih
iziskuje analiza vremenskih nizova nalažu čak 50 mjernih točaka kako bi se valjano procijenio trend
podataka, što je u praksi tek rijetko moguće ispoštovati. Ohrabruje ipak da i svega nekoliko
dodatnih mjerenja prije i poslije tretmana značajno popravlja mogućnost izvođenja uzročno-
posljedičnih zaključaka. Naposljetku, istraživač je redovito suočen s ograničenjima vezanima uz
arhivske podatke kojima se koristi. Umjesto podataka koji mu trebaju, istraživač se mora zadovoljiti
onima koji su mu dostupni. Tu, međutim, tek počinju njegovi (njezini) problemi jer je do podataka
možda teško doći, ili su nepregledne posloženi, često bez kompjutorskog zapisa. Osim s takvim
tipom poteškoća, istraživač mora biti spreman improvizirati vlastiti nacrt ako arhivski podaci ne
odgovaraju vremenskim intervalima koje je imao u planu (primjerice, arhivski se podaci uzimaju
mjesečno, a za istraživanje bi bilo idealno činiti to tjedno).
8.4.2.5 STATISTIČKA ANALIZA PREKINUTIH VREMENSKIH NlZOVA
Budući da problemi vezani uz statističku analizu prekinutih vremenskih nizova daleko nadmašuju
razinu potrebnu za ovladavanje metodologijom, na ovome ćemo mjestu tek ukratko opisati logiku
postupaka. Za ozbiljno bavljenje problematikom 274 svakako valja pročitati specijalizirane tekstove
(Box i Jenkins, 1976; McCleary i Hay 1980; Gaynor i Kirkpatrick, 1994). Prije svega valja reći da
se pri analizi istraživači često zadovoljavaju vizualnim pregledom rezultata, koji upućuje na
osnovna kretanja naznačena podacima, ali ne pruža nikakve pokazatelje njihove statističke
značajnosti. S druge strane, statistički postupci, premda uistinu sofisticirani, ne nude nikakva
jamstva da utvrde ni učinak nije odraz nedovoljno kontroliranih faktora, a ne tretmana. Suština
analize vremenskih nizova sastoji se u pokušaju da se provjeri jesu li promjene do kojih je došlo
nakon uvođenja tretmana dovoljno velike da se isključi mogućnost kako su tek odraz statističke
greške. Riječ je zapravo o posebnoj vrsti regresijske analize koja na temelju mjerenja prije tretmana
izračunava i procjenjuje trend kojim se kreću podaci. Potom predviđeni trend uspoređuje s
opaženim nakon tretmana te, uzimajući u obzir statističku grešku, nudi zaključke o značajnosti
promjene. Specifičan problem na koji nailazimo pri analizi vremenskih nizova jest međusobna
273
262
274
263
178
Ivo V.
koreliranost grešaka što se vezuju uz svako opažanje. Uobičajena regresijska analiza polazi od
pretpostavke nezavisnosti greške vezane za rezultate. Takve pretpostavke pri analizi vremenskih
nizova nisu ispunjene, što se može jednostavno pokazati. Koreliranost pogrešaka znači da su podaci
dobiveni u bliskim nizovima međusobno bolje korelirani od onih međusobno udalienijih. Model
uobičajene regresijske analize podrazumijeva njihovu međusobnu nekoreliranost. Posljedice takve
krive pretpostavke očituju se u podcjenjivanju statističke greške i s time povezanom precjenjivanju
učinaka tretmana. Zbog toga je analiza koja se preporučuje u nacrtima prekinutih vremenskih
nizova ponešto složenija. Za tu svrhu koriste se tzv. autoregrcsijski modeli s integriranim pomičnim
srednjim vrijednostima ili skraćeno ARlMA (od Auto Regressive Integrated Moving Average), koje
su razvili Box i Jenkins (1976). Postupak se sastoji od nekoliko koraka:
1. Identifikacije
2. Procjene
3. Dijagnoze
4. Provjere hipoteze
Pri identifikaciji se iz nizova uklanja postojeći trend (obično oduzimanjem prve ili druge razlike) 275
i potom se nastoji odrediti model u koji bi sc podaci uklopili, autoregresivni, pomičnih srednjih
vrijednosti ili kombinirani. Procjena uključuje računanje početnih vrijednosti parametara
pretpostavljenog modela na temelju kojih se potom iterativno računaju konačne procjene.
Dijagnostička provjera je pokušaj da se podaci uklope u pretpostavljeni model. Ako su rezidualna
odstupanja opaženih276 vrijednosti od onih pretpostavljenih modelom prevelika, model se mora
iznova specificirati. U konačnom koraku provjerava se sratistička značajnost odstupanja mjerenja
nakon uvođenja tretmana od predviđanja prije usvojenog modela.
8.5 NAČINI UNAPREĐIVANJA ZAKLJUČIVANJA U KVAZI-EKSPERIMENTIMA

Osnovna slabost kvazi-eksperimenata leži u nemogućnosti da posve isključe druge faktore kao
uzroke promjena zavisne varijable. Budući da je temeljna zadaća nacrta upravo ta, da omogući
nedvosmislene zaključke o tome utječe li nezavisna varijabla ili ne na zavisnu, takva se slabost
može držati ozbiljnim nedostatkom. Kako je ublažiti? Odgovor leži u kombiniranju različitih
istraživačkih nacrta koji se međusobno nadopunjavaju isključujući različite prijetnje unutarnjoj
valjanosti. Prethodno smo upoznali dvije osnovne strategije kvazi-eksperimentalnih nacrta. Prva,
sadržana u nacrtima s neujednačenim skupinama, temelji se na proširenju osnovnog nacrta jednom
ili većim brojem kontrolnih skupina koje nisu izložene tretmanu. U drugoj strategiji, svojstvenoj
nacrtima prekinutih vremenskih nizova, kontrola se sastoji u većem broju mjerenja prije i poslije
tretmana. Obje strategije služe upravo isključivanju različitih prijetnji unutarnjoj valjanosti,
odnosno odbacivanju drugih mogućih objašnjenja pomaka u opažanom ponašanju. No istraživač
nipošto ne bi smio svaki od opisanih nacrta smatrati same sebi dostatnima. Naprotiv, osnovna snaga
kvazi-eksperimentalnih nacrta leži u njihovu kombiniranju, kako bi zajednički pružili temelj
čvršćim zaključcima o utjecaju tretmanske na zavisnu varijablu. Ideja kombiniranja prisutna je,
primjerice, u nacrtu prekinutih vremenskih nizova s neujednačenom kontrolnom skupinom.
Dodavanjem kontrolne skupine nacrtu prekinutih vremenskih nizova smanjuje se uvjerljivost
alternativnih objašnjenja vezanih uz povijest i instrumentaciju. Kombiniranje je, gdje je to moguće,
također preporučljivo s istinskim eksperimentalnim nacrtima (Trochim i Land, 1982).277
275
To se obavlja na sljedeći način. Primjerice, ako su podaci: 1,2,3,4... itd., trend se uklanja oduzimanjem prethodnog u
nizu od sljedcćeg: 2-1, 3-2, 4-3 ... itd., nakon čega se trend gubi jer su sada, transformirani podaci 1, 1, 1 itd.
276
264
277
265
179

METODE

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

METODE

Uploaded by

Copyright:

Available Formats

Goran Milas:

ISTRAŽIVAČKE METODE U PSIHOLOGIJI I

1.1 NAČINI SPOZNAVANJA SVIJETA

1.2 ZNANSTVENI I NEZNANSTVENI PRISTUPI SPOZNAJI

1.3 ULOGA ZNANSTVENE METODOLOGIJE

1.4 TEMELJNE PRETPOSTAVKE ZNANOSTI

6. Znanje se usvaja iskustvom

1.5 CILJEVI ZNANOSTI

Vrste konstrukata u psihologiji

Valja uočiti da je posredujuća varijabla posve određena prethodećim podražajem i kasnijim

2.2 NORMALNA ZNANOST I ZNANSTVENA REVOLUCIJA

2.3 ISTRAŽIVAČKI PRISTUPI

2.3.3 KVANTITATIVNA I KVALITATIVNA ISTRAŽiVANJA

3.3 OBMANA U PSIHOLOGIJSKOM ISTRAŽIVANJU

3.4 IZVJEŠTAVANJE O ISTRAŽIVANJU

U nastavku ćemo se uglavnom baviti istraživačkim metodama, njihovim prednostima i nedostacima

4.1 ISTRAŽiVAČKI PROBLEM

5.1 OSNOVNE SMJERNICE ZA PISANJE IZVJEŠTAJA74

5.2 STRUKTURA ZNANSTVENOG IZVJEŠTAJA

5.2.1 NASLOV I NASLOVNA STRANICA

5.3 OBILJEŽJA KVALITETNO NAPISANOG RADA

5.4 PROCES ZNANSTVENE RECENZJJE

6. TEMELJI EKSPERIMENTALNE METODE

6.2 LOGIKA EKSPERIMENTIRANJA

pritiskanje prekidača, lupkanje po svjetiljci, pritiskanje žarulje  paljenje svjetla

ne-pritiskanje prekidača, lupkanje po svjetiljci, pritiskanje žarulje  svijetlo se ne pali

sjena, zalijevanje, gnojenje  biljka napreduje

6.3 VARIJABLE U EKSPERIMENTU

6.4 KONTROLA U EKSPERIMENTU

6.5 EKSPERIMENTALNA VALJANOST

6.5.1.1 OSNOVNE ZNAČAJKE STATISTIČKOG TESTIRANJA

6.5.1.2 PRIJETNJE VALJANOSTI STATISTIČKOG ZAKLJUČKA

Podsjetimo se za početak načina izvođenja statističkih zaključaka ti eksperimentu. Uspoređujemo

Nepouzdanost zavisne varijable

7.1 EKSPERIMENTALNI NACRTI

Potom se na tako dobivenim razlikama računaju t-testovi između kontrolne i eksperimentalne

Za potpuno uravnoteženi nacrt svojstveno je da:

Uvjerimo se da zadovoljava navedene uvjete. Pogledajmo, primjerice, uvjet A. Na svakom mjestu u

Zaključke o glavnim učincima izvodimo na sljedeći način:

1. Budući da je (A1B1 + A1B2)/2 = (A2B1 + A2B2))/2=0,5, zaključujemo da ne postoje glavni

7.1.4 IZBOR EKSPERIMENTALNOG NACRTA

Nacrt unutar ispitanika temelji se na višekratnom izlaganju svakog ispitanika različitim

7.2 ARTEFAKT U EKSPERIMENTU I NAČINI NJEGOVE KONTROLE

8.1 RAZLIKE U ODNOSU NA ISTINSKI EKSPERIMENT

8.2 KVAZI-EKSPERIMENTI I NE-EKSPERIMENTALNA ISTRAŽIVANJA

8.3 NAČIN ZAKLJUČIVANJA U KVAZI-EKSPERIMENTU

8.4 OSNOVNI TIPOVI KVAZI-EKSPERIMENTALNIH NACRTA

dvokratno mjerenje zavisne varijable (ako grupe nisu raspodijeljene po slučaju)

ili oboje, u nacrtu poput:

Pred-eksperimentalni nacrti sami po sebi ne jamče ispravnost zaključaka i mogu pridonijeti

Rezultati, čini se, nedvosmisleno upućuju na zaključak o uspješnosti intervencije. Premda je u

8.4.1.5 NACRT REGRESIJSKOG PREKIDA

Primjerice, interakcija izbora i sazrijevanja mogla bi u tretmanskoj i netretmanskoj grupi dovesti do

Tijekom 1955., više od 300 osoba poginulo je u prometnim nesrećama na autocestama

8.5 NAČINI UNAPREĐIVANJA ZAKLJUČIVANJA U KVAZI-EKSPERIMENTIMA

You might also like