Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 12

Ključne riječi: statistička obrada podataka, deskriptivna statistika, inferencijalna statistika,

testiranje hipoteza, nul-hipoteza, alternativna hipoteza, distribucija, parametrijski testovi,


neparametrijski testovi
Ovaj rad daje kratak pregled glavnih ideja analize statističkih podataka u kvantitativnom
istraživanju. Kvantitativna analiza podataka može biti deskriptivna ili inferencijalna.
Deskriptivna analiza koja uključuje samo jednu varijablu naziva se univarijatna analiza.
Bivarijatna analiza opisuje odnose između dvije varijable, a multivarijantna analiza odnosi se na
ispitivanje međusobne povezanosti triju ili više varijabli. Rijetko se kvantitativna istraživanja
provode samo radi opisivanja uzoraka kao takvih. U većini slučajeva cilj je iznositi tvrdnje o
većoj populaciji iz kojeg je odabran uzorak ili o uzročnim procesima općenito koji bi mogli
objasniti određeni suodnos podacima. Deskriptivna analiza ne daje temelj za generaliziranje
izvan uzorka. Čak i kada se opisuju odnosi varijabli u istraživanju, to samo po sebi ne pruža
dovoljnu osnovu za zaključivanje da ti odnosi postoje općenito ili imaju bilo kakvo teorijsko
značenje. Danas se analiza podataka obično obavlja računalim programima poput SPSS-a
(Statistički paket za društvene znanosti) ili nešto rudimentarnijeg Excela. Da bi ti programi radili
, moraju moći čitati podatke prikupljene u istraživanju. Prvi korak u kvantitativnoj analizi
podataka je, dakle, kodiranje. Kodiranje uključuje dodjeljivanje diskretnih brojeva za svaku
kategoriju svake varijable. U anketi, na primjer, neki od podataka su nužno brojčani: dob ili
prihod, na primjer.Također, moguće je nominalne kategorije “muško” i “žensko” kodirati u “1” i
“2”. Analogno tomu, i varijablama kao što su "vjerska pripadnost" ili "etnička pripadnost"
moguće je dodijeliti brojčane vrijednosti. U anketama s otvorenim pitanjima odgovori se moraju
sažeti u kodirani popis kategorija, a dodjeljivanje istog koda provodi se na odgovorima za koje se
čini da pripadaju zajedno. Nakon što se podaci pretvore u kvantitativne kodove, potrebno je
unijeti podatke u računalo. Sljededi eliminacija pogrešaka u unosu podataka, odnosno, “čišćenje”
podataka. Tek tada je moguće započeti kvantitativnu analizu.

Deskriptivna univarijatna analiza jest ispitivanje distribucije slučajeva na samo jednoj varijabli.
Primjerice, kada bi se mjerio "spol", gledalo bi se koliko je muškaraca, a koliko žena. To je
osnovni oblik univarijatne analize- frekvencija distribucije. Nezgrapno bi bilo predstaviti
univarijantne podatake navođenjem svih atributa za svaku varijablu, poput dobi. Uz određeni
gubitak detalja podatke je moguće grupirati te tablično prikazati u ovom slučaju frekvenciju
distribucije jedinica uzorka prema dobnim kategorijama u apsolutnim brojkama ili postocima.
Također podatke je moguće prikazati i mjerama centralne tendencije: mod (najčešća vrijednost,
bilo grupiran ili negrupiran), aritmetička sredina (osjetljiva na ekstreme) i medijan (centralna
vrijednost u rangiranoj distribuciji promatranih atributa). Medijan predstavlja “srednju”
vrijednost: polovina podataka je iznad njega, polovina ispod. Još je jedan osnovni statistički
koncept, koncept disperzije. Prosječne vrijednosti kondenziraju neobrađene podatke na jedan
broj (ili atribut) koji predstavlja sve podatke prikupljene za tu varijablu, ali iz nje se ne može
rekonstruirati izvorne podatke. Najjednostavnija mjera disperzije je raspon: razlika najviše i
najniže vrijednosti. Najčešća mjera disperizije je standardna devijacija koja odražava disperziju
distribucije označavajući koliko su pojedinačni rezultati prosječno udaljeni od aritmetičke
sredine. Distribucije sa različitim stupnjevima disperzije mogu imati iste mjere centralne
tendencije. Oslanjanje isključivo na mjere centralne tendencije može dati nepotpunu i
obmanjujuću sliku stoga je važno u obzir uzeti i disperziju podataka.

Vrsta izračuna koja se može izvesti na varijabli ovisi o njezinoj ljestvici mjerenja. Varijable na
nominalnoj ljestvici imaju kvalitativne atribute koji su samo kategorički. Primjeri nominalnih
varijabli su spol, etnička pripadnost i mjesto rođenja. Nominalne se varijable može mjeriti samo
kao frekvencije, na primjer, koliki postotak klijenata čine žene. Varijable na ordinalnoj ljestvici
mogu biti rangirane tako da različiti atributi predstavljaju relativno više ili manje varijable. Ali
razlike između atributa nisu precizne. Na ordinalnoj je ljestvici poznato ima li nečega više ili
manje nego u drugom slučaju, ali ne i koliko više. U slučaju varijabli na intervalnoj ljestvici,
razlike između različitih razina svojstva su jednake. Dakle, razlika između IQ rezultata od 95 do
100 smatra se istom kao i razlika između 100 i 105. Sumarni rezultati na Likertovoj ljestvici
često se tretiraju kao intervalne varijable iako su formalno govoreći na ordinalnoj ljestvici. Uzme
li se anketa od 10 pitanja koja na Likertovoj ljestvici mjeri nečiji stupanj slaganja ili neslaganja,
ukupni rezultati mogu se kretati od 10 do 50. Ne može se sa sigurnošću reći da razlika između
rezultata 40 i 45 predstavljaju isti stupanj razlike u stavu kao i razlika između rezultata 20 i 25.
Omjerne varijable imaju isti atribut kao intervalne, ali dodatno imaju pravu nultu točku,
apsolutnu nulu koja predstavlja potpuno odsustvo svojstva. Strogo govoreći, medijan,
aritmetičku sredinu i standardnu devijaciju treba računati samo za podatke na intervalnoj i
omjernoj ljestvici. Postoje, međutim, brojne "sive zone" u izračunu prosjeka. Ako se neki
statistički izračuni pokažu korisnima u prakse, istraživači bi trebali biti donekle fleksibilni u
primjeni statističkih izračuna na podatke na kojima se oni formalno ne bi smjeli izvoditi.
Međutim, nedopušteno je razmišljanje da takvi rezultati predstavljaju nešto uistinu precizno.
Ponekad je moguće promatrati više od jedne varijable, ali ne gledajući njihov odnos. To bi i dalje
bila univarijatna analiza. Na primjer, moguće je kvantificirati dvije varijable koje mogu, ali i ne
moraju biti povezani. Kada se promatra odnos dviju varijabli, provodi se bivarijatna analiza.
Dok su univarijatne analize varijabli prvenstveno deskriptivne, cilj bivarijatne analize je
objašnjenja odnosa. Multivarijatne tablice konstruiraju se od nekoliko varijabli. Umjesto jedne
nezavisne varijable i jedne zavisne, ovdje postoji više od jedne nezavisne varijabla. Umjesto
objašnjavanja zavisne varijable na temelju jedne nezavisne, objašnjenje se nalazi u uporabi više
od jedne nezavisne varijable. Multivarijatna tablica nije ništa više od dvije bivarijatne tablice
jedna pored druge. Tumačenje multivarijatne tablice svodi se na dva koraka- interpretiranje dvije
bivarijatne tablice.

Do sada opisana deskriptivna statistika ne omogućuje isključivanje slučajnosti. Za isključivanje


slučajnosti koristi se inferencijalna statistika koja procjenjuje ima li odnos opažen u podacima
statističku važnost. Ako se vjerojatnost da se odnos može pripisati slučajnosti sasvim malen, tada
će taj odnos biti smatran statistički značajnim. Da bi se utvrdila vjerojatnost,provodi se test
statističke značajnosti. Postoje mnoge vrste testova statističke značajnosti. Razna razmatranja —
uključujući jesu li varijable nominalnog, ordinalnog ili omjernog tipa određuje koji statistički test
je najprikladniji za određenu vezu. Bez obzira koja se vrsta testa značajnosti koristi, test
pokazuje kolika je vjerojatnost da je odnos varijabli rezultat slučajnosti. Najčešće će se odnos
nazvati statistički značajnim kada je p-vrijednost jednaka ili niža od 0,05, što znači da postoji
samo 5 % šanse da se odnos može pripisati slučajnosti. Neka istraživanja s vrlo malim uzorcima
koristite 0,10 kao graničnu točku za određivanje statističke značajnosti odnosa jer je matematički
teže postići statističku značajnost na malim uzorcima. Inferencijalna statistika i njezini testovi
zaključuju o odnosima ili razlikama u populaciji na temelju statistike uzorka. Važno je
napomenuti da ona ne daje apsolutne odgovore već samo pokazuje koliko je vjerojatno da postoji
odnos ili razlika. Općenito, za provedbu inferencijalne statistike potrebni su prilično veliki uzorci
i nacrt istraživanja u kojem postoji temeljna hipoteza.

Statističke hipoteze su hipoteze koje se mogu provjeriti na temelju podataka promatranja


modeliranih kao ostvarene vrijednosti preuzete iz skupa slučajnih varijabli. Skup podataka je
modeliran kao skup ostvarenih vrijednosti slučajnih varijabli koje dijele zajedničku distribuciju
vjerojatnosti preko nekog skupa mogućih zajedničkih distribucija. Hipoteza koja se testira je
upravo ovaj skup mogućih distribucija vjerojatnosti. Testiranje statističkih hipoteza je metoda
statističkog zaključivanja. Postoji još jedna pretpostavka o mogućoj distribuciji podataka.
Usporedba dvaju modela smatra se statistički značajnom ako je, prema pragu vjerojatnosti (razini
značajnosti), malo vjerojatno da će se podaci pojaviti ako je nulta hipoteza istinita. Testiranje
hipoteze koristi prethodno odabranu mjeru pristranosti (statistički rezultati ispitivanja,
prikladnost modela) kako bi se odredilo koji ishod dovodi do odbacivanja nulte hipoteze na
temelju unaprijed određene razine značaja. Prethodno odabrana razina značajnosti je najveća
dopuštena "lažno pozitivna" stopa - nadamo se da se kontrolira rizik od lažnog odbacivanja
istinite nul-hipoteze. Razmatranje dvije vrste konceptualnih pogrešaka pomaže razlikovanju nul-
hipoteze i alternativnih hipoteza. Prva vrsta pogreške (alfa-lažna pogreška odbijanja ili pogreška
tipa I) javlja se kada se kao lažna odbaci istinita nulta hipoteza. Pogreške tipa II (beta-pogreške
ili pogreške tipa II) nastaju kada se ne odbacuje lažna nulta hipoteza. Statistički testovi temeljeni
na statističkoj značajnosti još su jedan način izražavanja intervala povjerenja. Drugim riječima,
bilo koje testiranje hipoteze temeljene na značajnosti može se provesti s intervalima povjerenja, a
svaki interval povjerenja može se dobiti testiranjem hipoteze utemeljene na značajnosti.

Analiza podataka u svrhu istraživanja često nastoji koristiti informacije dobivene od uzorka
ispitanika kako bi se izvukli zaključci o populaciji od interesa. Ispitivanje statističkih hipoteza je
široko korištena metoda statističkog zaključivanja. Računala i specijalizirani statistički postupci ,
te njihov opsežan opis i tumačenje, olakšavaju izvođenje statističkih testova. Statistički programi
izračunavaju točnu p-vrijednost, a urednici časopisa danas zahtijevaju od autora da navedu tu
vrijednost, dopuštajući čitateljima da je sami interpretiraju. S druge strane, kada je p-vrijednost
manja od 0,05 ili bilo koje druge proizvoljne granice, interpretacija rezultata testa nije samo
izjava "statističke važnosti". Stoga je podjednako važno da istraživači i čitatelji znanstvenih i
stručnih časopisa razumiju proces provjere statističkih hipoteza i kako ga koristiti kada želimo
prezentirati ili vrednovati rezultate istraživanja u objavljenim člancima. Postoji donekle
zanemaren problem u vezi sa statističkim testovima. Mnogi objavljeni radovi navode znatan broj
p-vrijednosti, što može otežati interpretaciju.

Ispitivanje statističke hipoteze je proces koji uključuje formuliranje statističke hipoteze i


korištenje podataka iz uzorka za određivanje valjanosti formulirane statističke hipoteze. Iako se
pojedinosti testa mogu razlikovati od testa do testa, možemo koristiti sljedeći postupak u četiri
koraka za svaki test statističke hipoteze: 1. Postavljanje nul i alternativne hipoteze. 2. Definiranje
postupka ispitivanja, uključujući odabir razine statističke značajnosti i intenziteta ispitivanja. 3.
Izračunavanje statističkog testa i odgovarajuće p-vrijednosti. 4. Određivanje jesu li podaci u
skladu s nul-hipotezom ili donošenje suda o nul-hipotezi. U određivanju nul-hipoteze mogu se
napraviti dvije ranije spomenute pogreške. Pogreška tipa I javlja se kada "vidimo" učinak koji
zapravo ne postoji. Vjerojatnost pogreške tipa I često se naziva alfa (α), a njezina se vrijednost
utvrđuje prije testiranja statističkih hipoteza. Alfa je ono što nazivamo "razinom značajnosti", a
njezina se vrijednost obično postavlja na 0,05 ili 0,01. Kada je p-vrijednost dobivena u trećem
koraku postupka testiranja statističke hipoteze niža od vrijednosti α, kaže se da je "statistički
značajna na razini α". Pogreške tipa II nastaju kada ne "vidimo" razliku, a ona zapravo postoji.
Vjerojatnost pogreške tipa II naziva se beta (β), a njezina vrijednost uvelike ovisi o veličini
učinka koji nas zanima, veličini uzorka i odabranoj razini statističke značajnosti. Beta je
povezana sa snagom testa za otkrivanje učinka određene količine. P-vrijednost nerijetko se
netočno navodi kao mogućnost da je nul-hipoteza vjerodostojna. Nul-hipoteza nije nasumce
odabrana i stoga nema vjerojatnosti. Ona ili je vjerodostojna ili nije. Istinito obilježje p-
vrijednosti jest, da je to mogućnost zapažanja informacija kakve su na analiziranom uzorku kada
je nul-hipoteza vjerodostojna. Jedno je od glavnih pitanja koju razinu statističke značajnosti
odabrati? Nivo statističke značajnosti je subjektivna vrijednost koju se bira kao graničnu
vrijednost u donošenju odluka o nul-hipotezi i treba ju odrediti prije analize. Statistička
značajnost nam govori o vjerojatnosti da bi veze koje promatramo mogle biti uzrokovane nečim
drugim, a ne slučajnošću. Dakle, kada se kaže da je neka razlika statistički značajna, onda
tvrdimo da pronađena razlika, bez obzira na njezinu veličinu, nije slučajna, već da vrlo
vjerojatno postoji i među populacijama. Suprotno, tvrdi li se da neka razlika nije statistički
značajna, to može značiti da je razlika dobivena mjerenjem slučajna posljedica variranja uzoraka,
a da među populacijama kojima ti uzorci pripadaju možda i nema nikakve razlike. Kada čitate
istraživačeve zaključke, svakako obratite pozornost na to koji su odnosi statistički značajni, a
koji nisu. Statistička hipoteza ne „potvrđuje“ ništa. U odnosu na nul-hipotezu moramo se
izražavati da je „nismo odbacili“ ili „nismo je uspjeli odbaciti“. Ispitivanje statističke hipoteze
učestali je način statističkog donošenja zaključaka.

U testiranju statističkih hipoteza koriste se testovi koji su specifično odabrani ili definirani na
način da unutar promatranih podataka kvantificiraju ponašanja koja razlikuju nultu od
alternativne hipoteze ili bi karakterizirala nultu hipotezu ako nema eksplicitno navedene
alternativne hipoteze. Važno svojstvo statističkog testa jest da se distribucija uzorka mora moći
izračunati ili aproksimirati, što omogućuje izračunavanje p-vrijednosti, a mogu se klasificirati su
kao parametrijski i neparametrijski. Većina testova zahtijeva normalnu distribuciju u populaciji,
iako je u praksi distribucija populacije često nepoznata ili sama populacija nije normalna. Za
odabir statističkog testa potrebno je,dakle, između ostalog, znati tip varijabli (nominalne,
ordinalne, intervalne,omjerne), kako su podaci organizirani, koliko je uzoraka, veličinu uzorka i
jesu li zavisni ili nezavisni, te konačno, slijede li normalnu (Gaussovu) distribuciju.

Testovi s jednim uzorkom prikladni su kada se uzorak uspoređuje s populacijom iz hipoteze.


Karakteristike populacije poznate su iz teorije ili se izračunavaju iz populacije. Testovi s dva
uzorka prikladni su za usporedbu dvaju uzoraka, obično eksperimentalnih i kontrolnih uzoraka iz
znanstveno kontroliranog eksperimenta. Upareni testovi prikladni su za usporedbu dvaju uzoraka
gdje je nemoguće kontrolirati važne varijable. Umjesto da se uspoređuju dva skupa, članovi se
uparuju između uzoraka tako da razlika između članova postaje uzorak. Obično se srednja
vrijednost razlika tada uspoređuje s nulom. Uobičajeni primjer scenarija kada je test uparenih
razlika prikladan je kada jedan skup ispitanika ima nešto primijenjeno na njih i test je namijenjen
provjeri učinka.

Distribucija u statistici označava frekvenciju kojom se u skupu po veličini poredanih rezultata


javljaju pojedini rezultati. Normalna distribucija je simetrična distribucija zvonkolikog oblika
koja se asimptotski približava apscisi, a gustoća vrijednosti je najviša oko neke mjere centralne
tendencije, a prema ekstremima opada. Kod simetrične normalne distribucije vrijednosti
aritmetičke sredine, medijana i moda jednake su, a 99,73 % rezultata nalazi se u rasponu od šest
standardnih devijacija (± 3 standardne devijacije). U intervalu od ± 1 standardne devijacije nalazi
se 68,27 % vrijednosti, a u intervalu od ± 2 standardne devijacije 95,45 %. U slučaju pozitivno
asimetrične distribucije prevladavaju manje vrijednosti, a srednje vrijednosti od najveće prema
najmanjoj slijede: aritmetička sredina, medijan i mod. Kada prevladavaju veće vrijednosti,
distribucija je negativno asimetrična, mod je najveća mjera centralne tendencije, a zatim slijede
medijan pa aritmetička sredina. Indikator zaobljenosti vrha krivulje naziva se kurtoza čija
vrijednost veća od nule upućuje na šiljastiju distribuciju, a manja od nule na plosnatiju.
Studentova t-distribucija nastaje procjenjivanjem srednje vrijednosti normalne distribucije
populacije u slučajevima male veličine uzorka i nepoznate standardne devijacije populacije.
Simetrična je i zvonolika poput normalne distribucije (t-distribucija jest normalna per se), ali s
debljim repovima, odnosno sklonija je stvarati vrijednosti koje padaju daleko od srednje
vrijednosti. Što je manji broj uzoraka Povećanjem broja stupnjeva slobode približava se
normalnoj distribuciji.

U društvenim se znanostima neke pojave često distribuiraju upravo suprotno


normalnojnajpoznatiji primjer takve distribucije jest Poissonova), kao u slučaju U-distribucije u
kojoj se najveće frekvencije nalaze na ekstremima apscise. Primjer takve distribucije javlja se
kada samo oni koji imaju čvrsto mišljenje o temi istraživanja (ekstremno pozitivni ili negativni
stavovi na Likertovoj ljestvici) ispune anketu. Niska stopa odgovora može unijeti pristranost
neodgovora ili odstupanje neodziva (non response bias)- osobe koje se ne odazovu imaju
sustavno drugačije karakteristike od onih koje su se odazvale ispitivanju. Isto tako, parametrijske
testove nije moguće primijeniti na varijable izražene kvalitetama (nominalne, ordinalne). Tada se
koriste neparametrijski testovi, testovi neovisni o distribuciji u populaciji.

Statistički test koji uključuje stvaranje određenih pretpostavki o parametru populacije naziva se
parametarski test. Statistički test koji se koristi na neovisnim varijablama bez skale naziva se
neparametarski test. U parametrijskom testu, testna statistika temelji se na distribuciji. S druge
strane, u slučaju neparametarskog testa, statistika testa je proizvoljna. U parametarskom
testiranju pretpostavlja se da je mjerenje varijable od interesa na intervalnoj ili omjernoj ljestvici
za razliku od neparametrijskog testa koji barata nominalnim I ordinalnim varijablama. Općenito,
mjera središnje tendencije u parametarskom testu je srednja vrijednost, dok je u slučaju
neparametarskog testa medijan. U parametarskom testu postoje potpune informacije o populaciji.
Suprotno tome, u neparametrijskom testu nema informacija o populaciji. Primjenjivost
parametarskog testa odnosi se samo na varijable, dok se neparametarski test primjenjuje i na
varijable i na atribute. Za mjerenje stupnja povezanosti između dviju kvantitativnih varijabli,
parametarski test koristi Pearsonov koeficijent korelacije, dok neparametarski test koristi
Spearmanovu rang korelaciju.

Korelacija i regresija odnose se na odnos između dviju intervalnih ili omjernih varijabli koje se
mogu prikazati ravnom linijom (linija najboljeg pristajanja ili linija trenda) na dijagramu
raspršenja. Broj koji se naziva 'koeficijent korelacije' (ponekad se naziva i 'r') pokazuje koliko su
usko povezane dvije varijable (u smislu linije najboljeg uklapanja) i ima vrijednosti od +1 do -1.
Ako je koeficijent korelacije +1, to znači da kako se vrijednost nezavisne varijable povećava,
zavisna varijabla raste proporcionalno, točno slijedeći liniju najboljeg uklapanja. Ali ako je
koeficijent korelacije -1, tada kako se vrijednost nezavisne varijable povećava, zavisna varijabla
se smanjuje (tako da linija najboljeg uklapanja ide prema dolje, a ne prema gore). Regresijska
analiza daje dodatne informacije o liniji najboljeg pristajanja, a također p-vrijednost pokazuje je
li odnos između varijabli značajan. Nikad nije dobro koristiti korelaciju za zaključak o 'uzroku i
posljedici'.

Z-test prikladan je za usporedbu srednjih vrijednosti pod strogim uvjetima normalnosti i poznate
standardne devijacije. Njime se provjerava postojanje statitistički značajne razlike aritmetičke
sredine uzorka i prethodno utvrđene aritmetičke sredine populacije. Ako je potrebno utvrditi
samo značajnost razlike, ali ne i smjer razlike (veći ili manji), koristi se dvostruki z-test. U
suprotnom, koristi se jednostruki. U praksi se češće koristi dvosmjerni test koji, uostalom, ima
veću “snagu testa”. Z-test zahtijeva normalnu distribuciju i uzorak veći od N=60 (ili 50).

Promatra li se značajnost razlike između aritmetičkih sredina dvaju uzoraka, pri čemu nije nužno
da oba uzorka imaju jednak broj podataka, koristi se t-test koji je vezan uz Studentovu t-
distribuciju. Postoje tri tipa t-testa ovisno o vrsti u uzoraka. Tip 1 koristi se na zavisnim uzorcima
za parove rezultata prije i poslije uvođenja neke nezavisne varijable. Razlika tipa 2 i tipa 3 t-testa
počiva na (približnoj) jednakosti odnosno različitosti varijance koja se, pak, utvrđuje F-testom.

F-testovi (analiza varijance, ANOVA) obično se koriste kada se odlučuje jesu li grupiranje
podataka po kategorijama smisleno.

Analiza varijance (ANOVA) utvrđuje je li varijabilnost između uzoraka statistički značajno veća
od varijabilnosti unutar uzorka. Pokaže li se da jest, zaključuje se da ta dva uzorka ne pripadaju
istoj populaciji. Prema broju promatranih nezavisnih varijabli razlikuju se jednofaktorska i
dvofaktorska analiza varijance. Jednofaktorska analiza varijance nije ništa drugo doli t-test na
više od dva uzorka. Dvofaktorska anliza varijance uzima u obzir statističku značajnost utjecaja
svake nezavisne varijable (faktora) posebno (pritom zanemarujući ovu drugu) i njihove
interakcije, tj. utječu li promjene oba faktora statistički značajno na zavisnu varijablu.
Hi-kvadrat test je najprimjenjivanija neparametrijska medoda analize kvantitativnih podataka.
Vrlo je koristan jer se može koristiti za kategoričke (nominalne) varijable,dihotomne varijable,
relativno male uzorke i podatke koji nisu normalno distribuirani. Ovaj test u osnovi traži veze i
razlike između promatranih i očekivanih vrijednosti. Sam hi-kvadrat test može poslužiti za
provjeru normalnosti distribucije.

Tablica kontingencije služi za prikaz frekvencije podataka raspoređenih prema dva kriterija od
kojih svaki može imati dvije ili više kategorija. Formiranjem tablice opaženih i tablice
očekivanih rezultata te provođenjem hi-kvadrat testa utvrđuje se postojanje statistički značajne
razlike frekvencija među uzorcima, odnosno, povezanost klasifikacijskih kriterija.

Česta je pojava donošenja dalekosežnih zaključaka po provedenoj statističkoj analizi. Treba


naglasiti kako sama statistička obrada podataka ne garantira znanstvenu vrijednosti istraživanja.
Statistički značajna razlika ne implicira čemu tu razliku treba pripisati stoga u interpretaciji
rezultata treba paziti na korištenje indikativnog I implicitnog jezika, a izbjegavati asertoričke i
apodiktičke izjave.

Popis literature:

Arnold, S., Ord, K., Stuart, A. (1999). Kendall’s Advanced Theory of Statistics, Volume 2 A:
Classical Inference & the Linear Model. London: Hodder Arnold.

Babbie, E. (1973). Survey Research Methods, Belmont: Cengage Learning.

Babbie E., Rubin, A. (2008). Essential Research Methods for Social Work, Belmont: Cengage
Learning.

Davies, C. (2020). A Quick Guide to Quantitative Research in the Social Sciences. University of
Wales Trinity Saint David.
Ilakovac, V. (2009). Testiranje statističkih hipoteza i neke zamke. Biochemia Medica, XIX (1),
10–16.

Marusteri, M. (2010). Kako odabrati pravi test za procjenu statističke značajnosti razlike između
skupina? Biochemia Medica, XX (1), 15-32.

Papić, M. (2014). Primijenjena statistika u MS Excelu za ekonomiste, znanstvenike i neznalice.


Zagreb: ZORO d.o.o.

Petz, B. (1997). Osnovne statističke metode za nematematičare. Zagreb: Naklada Slap.

Pološki Vokić, N., Sinčić Ćorić, D., Tkalac Verčič, A. (2010). Priručnik za metodologiju
istraživačkog rada - Kako osmisliti, provesti i opisati znanstveno i stručno istraživanje. Zagreb:
M.E.P. d.o.o.

Rice, J.A. (2007). Mathematical Statistics and Data Analysis, Boston: Cengage Learning.

Serdar V., Šošić, I. (1997). Uvod u statistiku. Zagreb: Školska knjiga.

Sheppard, V. (2020). Research Methods for the Social Sciences: An Introduction.


https://pressbooks.bccampus.ca/jibcresearchmethods/. Pristupljeno 04. svibnja 2022.

Sorić, B. (1987). Koliki postotak znanstvenih otkrića nisu otkrića? Arhiv za higijenu rada i
toksikologiju, XXXVIII (3), 251-260.

You might also like