Statistika U Psihologiji - Priručnik

Filozofski fakultet u Sarajevu
Statistika u psihologiji
Prirunik za studente
Nermin apo i Ratko oki
Sarajevo, 2012
Statistika u psihologiji, prirunik za studente
ii
Nermin apo
Ratko oki
STATISTIKA U PSIHOLOGIJI, PRIRUNIK ZA STUDENTE
Urednik:
Prof. dr. Ivo Komi
Recenzenti:
Prof. dr. Valentin Bucik
Doc. dr. Denana Husremovi
Izdanje:
Prvo
Izdava:
Filozofski fakultet u Sarajevu
Sarajevo, 2012
Elektronsko izdanje
------------------------------------------------CIP - Katalogizacija u publikaciji
Nacionalna i univerzitetska biblioteka
Bosne i Hercegovine, Sarajevo
159.9:519.2(075.8)(076)
APO, Nermin
Statistika u psihologiji : prirunik za
studente [Elektronski izvor] / Nermin apo, Ratko
oki. - Sarajevo : Filozofski fakultet, 2012. - 1
elektronski optiki disk (CD-ROM) : tekst, slike ;
12 cm
Nasl. s naslovnog ekrana.
ISBN 978-9958-625-22-0
1. oki, Ratko
COBISS.BH-ID 19349510
------------------------------------------------iii
iv
Statistika u psihologiji
Prirunik za studente
Sarajevo, 2012
ii
Predgovor
Statistika u psihologiji prirunik je namijenjen prvenstveno studentima koji zapoinju izuavati
metodologiju psiholokih istraivanja. Premda se Statistika u nastavnim programima psihologije
izuava kao zaseban predmet, statistike metode zapravo su sastavni dio istraivakog procesa, to
se u pisanju ovog prirunika nastojalo posebno naglasiti. Prirunik je pripremljen s osnovnim ciljem
da studentima prui saeta objanjenje osnovnih statistikih pojmova, ije poznavanje je preduslov
za naprednije nastavne programe iz Statistike, kao i nauno-istraivaku praksu. Pri tome, koristili
smo pristup uobiajen u edukaciji iz Statistike na studijama iz drutvenih i humanistikih nauka, a
kojim se definicije i objanjenja koncepata daju bez komplikovanih matematikih izraza i izvoda.
Prirunik se sastoji iz 11 poglavlja koja svojim sadrajem obuhvaaju desktiptivnu i osnove

inferencijalne statistike: Uvod, Grafiko i tabelarno predstavljanje podataka, Mjere centralne
tendencije, Mjere varijabiliteta, Osnovni koncepti vjerovatnoe, Normalna raspodjela, Standardna
pogreka aritmetike sredine, Testiranje hipoteza, Testiranje razlika izmeu dvije aritmetike
sredine, Analiza varijance, Korelacija i regresija. Svako poglavlje zapoinje uvodom u kojem su data
osnovna i kratka objanjenja, koja su kroz primjere u nastavku poglavlja dodatno interpretirana i u
kojima je ukazano na njihovu praktinu primjenu. Svako poglavlje zavrava zadacima koji slue za
vjebanje i ponavljanje gradiva odreene teme. Na kraju Prirunika data su rjeenja nekih zadataka.
Nadamo se da e ovaj prirunik posluiti ne samo studentima psihologije ve i drugima koji se iz

razliitih razloga interesuju za Statistiku u psihologiji. Vanim nam se ini naglasiti da ovaj
Prirunik ne moe zamijeniti udbenik iz Statistike. Njegovu svrhu treba prepoznati u samom
nazivu, dakle, da bude pri ruci studentu koji izuava odreene teme iz Statistike.
Na kraju, elimo se zahvaliti svima koji su na razliite naine doprinijeli nastanku ovog teksta. U
prvom redu, to su generacije studenata Odsjeka za psihologiju Filozofskog fakulteta u Sarajevu
kojima je Prirunik i namjenjen. Njih smo najvie oslukivali dok smo radili na ovom tekstu.
Statistikim rjenikom reeno, udio njihove varijance u objanjenju nastanka ovog Prirunika je
najvei. Nadalje, zahvaljujemo se i kolegama sa Odsjeka na podrci da posao zapoet prije nekoliko
godina dovedemo do kraja. Posebnu zahvalnost dugujemo Jadranki Kolenovi-apo koja je prva
proitala rukopis, dala vrijedne savjete i sugestije i nesebino pomogla u tehnikom dijelu posla
vanom za nastanak Prirunika. Zahvaljujemo se Marijani Gali, koja je s znatieljom i strpljenjem
proitala rukopis te iz pozicije strunjaka ekonomskih nauka dala korisne sugestije.
iii
Sadraj
1. Uvod ......................................................................................................................... 1
2. Grafiko i tabelarno predstavljanje podataka ........................................................... 8
3. Mjere centralne tendencije ..................................................................................... 29
4. Mjere varijabiliteta ................................................................................................. 49
5. Osnovni koncepti vjerovatnoe .............................................................................. 70
6. Normalna raspodjela ............................................................................................... 82
7. Standardna pogreka aritmetike sredine ............................................................... 99
8. Testiranje hipoteza................................................................................................ 117
9. Testiranje razlika izmeu dvije aritmetike sredine ............................................. 131
10. Analiza varijance ................................................................................................ 147
11. Korelacija i regresija........................................................................................... 179
12. Rjeenja .............................................................................................................. 220
iii
1. Uvod
Pojam statistika ima najmanje dva znaenja. Prema jednom znaenju, statistika oznaava
numerike vrijednosti kojima se opisuje skup podataka (npr. prosjeni kolski uspjeh uenika jedne
kole, ili raspon rezultata koje ispitanici postiu na testu znanja iz nastavnog predmeta Statistika u
psihologiji). Prema drugom znaenju, statistika je grana matematike i predstavlja skup postupaka
koje koristimo za prikupljanje, prezentaciju, analizu i interpretaciju podataka. Na studiju psihologije
izuava se primijenjena statistika, odnosno metode za deskripciju i analizu podataka izvedene iz
osnovnih matematikih principa. Naini kojim se do njih dolo predmetom su izuavanja teorijske
statistike.
Postupci koje koristimo u opisu podataka (npr. odreivanje broj kategorija, centralne
vrijednosti, aritmetike sredine, itd.) dio su deskriptivne statistike, dok je donoenje zakljuaka o
populaciji na osnovu podataka dobivenih na uzorku dio inferencijalne statistike. Deskriptivne
statistike postupke koristimo, npr., kada elimo opisati jednu ili vie grupa ispitanika, a
inferencijanu statistiku kako bi pokazali da li je razlika dobivena na ogranienom skupu podataka
vjerovatna i na populacijama.
Statistika je sastavni dio istraivakog procesa jer provedba istraivanja ukljuuje
prikupljanje, obradu i analizu podataka. Stoga predmet Statistika u psihologiji pripada metodolokoj
grupi predmeta, u koju ubrajamo i Metodologiju psiholokih istraivanja i Psihometriju.
Statistika je vana i u svakodnevnom ivotu. Poznavanje statistikih pojmova i koncepata,
vjetine i sposobnosti njihovog koritenja ine statistiku pismenost. Obzirom da smo svakodnevno
izloeni podacima na osnovu kojih donosimo odluke, statistika pismenost pomae nam da bolje
razumijemo svijet u kojem ivimo. Ponekad podaci ne odraavaju realnost i mogu nas navesti na
donoenje pogrene odluke. Statistika nam pomae da izmeu nekoliko odluka izaberemo najbolju.
Varijabla, mjerenje, populacija, uzorak, parametar i statistik dio su osnovnog vokabulara
statistike. Stoga emo u ovom poglavlju navest osnovne definicije ovih pojmova.
Varijabla (promjenljiva) je svojstvo pojave (osobe, objekta ili dogaaja) koje se mijenja.
Nekim varijablama jednostavno klasificiramo pojave u jednu od grupa ili kategorija (npr. spol
osoba je mukog spola; boja kose osoba ima kosu plave boje); ove varijable nazivamo
kategorijalnim varijablama. Drugim varijablama odreujemo koliinu neega, i nazivamo ih
kvantitativnim varijablama. Kvantitativne varijable mogu biti diskretne (vrijednosti varijable
mogu poprimiti samo neke vrijednosti iz odreenog intervala, pri emu su vrijednosti jasno
odijeljene) i kontinuirane (teorijski, ove varijable mogu poprimiti bilo koju vrijednost iz odreenog
intervala; izmeu pojedinih vrijednosti ne postoji skokovit prijelaz kao kod diskretnih varijabli).
Zavisne varijable se mijenjaju zbog promjene drugih varijabli. One nisu pod kontrolom istraivaa.
Njihovu promjenu objanjavamo, opisujemo ili klasificiramo pomou drugih varijabli. Obino se
oznaavaju slovom Y. Nezavisne varijable su pod kontrolom istraivaa. Njima se objaanjavaju,
opisuju ili klasificiraju promjene zavisne varijable. Obino se oznaavaju slovom X.
1
Prema Campbellu1 mjerenje je pridruivanje numerike vrijednosti pojavi koju posmatramo

prema jasno utvrenim pravilima. Mjerenje u psihologiji je indirektno jer ne postoji psiholoki
mjerni instrument ija je mjerna jedinica precizno definirana vrijednost mjerenog svojstva. Vrsta
skale mjerenja odreuje izbor numerikih i grafikih metoda za deskripciju i analizu podataka U
psihologiji koristimo razliite skale mjerenja: nominalna (kategorizacija), ordinalna (redoslijed +
kategorizacija), intervalna (interval + redoslijed + kategorizacija) i racio (apsolutna nula + interval +
redoslijed + kategorizacija).
Potpuni skup podataka (dogaaja) koji su predmet istraivanja naziva se populacija.
Deskriptivne vrijednosti dobivene na populaciji nazivamo parametrima. esto je nemogue
podatke prikupiti iz populacije. Zapravo, za tako neto esto nema niti potrebe. Dovoljno je na
pravilan nain podatke prikupiti iz dijela populacije. Dio populacije (podskup populacije) koji
koristimo za prikupljanje podataka koji e nam omoguiti zakljuivanje o populaciji nazivamo
uzorak. Deskriptivne vrijednosti dobivene na uzorku nazivamo statisticima.
Primjeri 1.1 i 1.2 ilustriraju neke od osnovnih statistikih koncepata koje smo naveli u ovom
dijelu.
Campbell, N. (1953). What is science. New York: Dover Publication.

2
PRIMJER 1.1
Pretpostavimo da je vrijeme izbora i da se ne moete odluiti izmeu dva predsjednika
kandidata. Kriteriji kojeg koristite za izbor je prethodni angaman svakog od kandidata u rjeavanju
razliitih problema zatite okoline. Kandidat A navodi da je 30 puta glasao za razliita zakonska
rjeenja koja se odnose na zatitu okoline, dok kandidat B istie da je glasao u 70% sluajeva za
takva zakonska rjeenja. Za koga biste glasali?
Za donoenje odluke potrebno je dodatno istraivanje koje ukljuuje prikupljanje vie
podataka nego to su ih ponudili kandidati. Kandidat A glasao je za 30 zakonskih rjeenja, ali je
preutio da je za 70 glasao protiv. Premda je kandidat B glasao u 70% sluajeva, nije naveo da se u
ostalih 30% sluajeva radilo o najvanijim zakonima.
Na kraju, moemo zakljuiti da niti jedan kandidat zapravo nije dobar izbor. Istraivanje i
pravilno zakljuivanje (drugim rijeima statistika) pomoi e nam u donoenju dobrih odluka.
PRIMJER 1.2
Rezultati nekih istraivanja ukazuju da uenici nieg socio-ekonomskog statusa postiu nii
kolski uspjeh. Uenici koji ive u ekonomski nepovoljnijim uslovima, imaju manje mogunosti za
kvalitetnije kolovanje. kolski psiholog odluio je istraiti povezanost izmeu odreenih socioekonomskih karakteristika i kolskog uspjeha uenika srednjih kola.
Umjesto na populaciji koju ine svi uenici srednjih kola, istraivanje je provedeno na
uzorku. Obzirom da istraiva namjerava zakljuivati o populaciji na osnovu podataka prikupljenih
na uzorku, nuno je na pravilan nain formirati uzorak. U protivnom, mogunost generalizacije
rezultata istraivanja bit e ograniena. Uzorak je mogao biti formiran tako da svaki uenik iz
populacije ima podjednake anse da bude ukljuen u istraivanje. Meutim, istraiva se odluio da
metodom sluajnog odabira izabere odreeni broj kola iz itave drave, i da u tako izabranim
kolama ispita sve uenike.
Istraiva je, izmeu ostalih podataka, prikupio podatke o stepenu strune spreme majke,
radnom statusu majke i broju lanova porodice, te o dobi i spolu uenika. U tabeli 1.2.1. prikazani su
podaci za pet uenika. Spol, kola, stepen strune spreme, radni status i broj lanova domainstva su
diskretne (diskontinuirane) varijable. Vrijednosti varijable radni status jasno su odijeljene u tri
kategorije: zaposlen, nezaposlen i penzioner. Dob i prosjeni kolski uspjeh su kontinuirane
varijable. Dob ispitanika moe biti 16,7 (to odgovara uzrastu od 16 godina i 8 mjeseci), ali se moe
jo preciznije izraziti vrijednou 16,69. Mjerni (kvantitativni) podaci su dob, prosjeni kolski
uspjeh, broj lanova domainstva, dok su spol, kola, struna sprema i radni status kategorijalni
podaci. Vrijednosti kategorijalnih podataka izraavamo frekvencijama ili procentima za svaku
kategoriju (npr. u istraivanju je uestovalo 52% djevojica i 48% djeaka). Nominalne varijable su
kola, spol i radni status. Dob je jedina varijabla mjerena racio skalom mjerenja. kolski uspjeh i
broj lanova domainstva predstavljaju varijable mjerene rang skalom mjerenja.
Tabela 1-1. Podaci za pet uenika
UENIK
KOLA
SPOL
PROSJENI
STEPEN
DOB
KOLSKI
STRUNE
SPREME
SSS
RADNI
BROJ LANOVA
STATUS
DOMAINSTVA
zaposlen
15,2
USPJEH
2,5
14,5
3,7
VSS
nezaposlena
50
15,0
4,0
OS
zaposlena
275
16,7
2,0
SSS
penzioner
350
17,1
4,7
SSS
nezaposlena
Zavisna varijabla u istraivanju je kolski uspjeh. Istraiva na osnovu rezultata dobivenih u

drugim istraivanjima, teorija i svakodnevnog iskustva smatra da se promjena varijable kolski
uspjeh moe objasniti pomou niza socio-ekonomskih varijabli, koje, stoga, predstavljaju nezavisne
varijable.
ZADACI
1. U tabeli ispod prikazan je dio podataka dobivenih u hipotetikom istraivanju. Koje varijable su
kategorijalne, a koje kvantitativne? Koje su vrijednosti svake od varijabli?
PACIJENT
SPOL
DOB
DIJAGNOZA
AB
Srednja dob
CR
NT
VRSTA
TRAJANJE
TERAPIJE
TERAPIJE
(U
MJESECIMA)
Anksiozni poremeaj
Kbt
10
Starija dob
Fobija
Kbt
Starija dob
Anksiozni poremeaj
Getalt
SQ
Mlaa dob
Depresivnost
Getalt
TW
Starija dob
Depresivnost
Taa
15
2. U medicinskim istraivanjima koriste se razliite varijable. Koje od dolje navedenih su

kategorijalne, a koje kvantitativne?
a. Spol (enski, muki).
b. Dob (godine i mjeseci).
c. Puenje (da ili ne).
d. Sistolni krvni pritisak (mm ivinog stuba).
e. Puls (broj otkucaja u minuti).
f. Koliina eera u krvi (mmol/l).
g. Dijagnoza.
h. Tjelesna temperatura (C).
i. Duina terapije (u danima).
j. Vrsta terapije.
3. U primjerima datim ispod: a) identificirajte varijable i b) za svaku varijablu odredite njen tip
(kategorijalna ili kvantitativna).
a. Za svako od 150 novoroenadi utvreni su: spol, poroajna teina, datum i vrijeme roenja.
b. Stomatolog je za potrebe istraivanja izmjerio duine (u mm) zadnjeg donjeg molara kod 10
pacijenata.
c. Tokom kontrole 250 vozila policija je utvrdila da u 50 sluajeva voza nije vezan sigurnosnim
pojasom, u 10 sluajeva vozilo je bilo u tehniki neispravnom stanju, dok u 30 vozila nije
naena prva pomo. Za sva vozila zabiljeene su registarske tablice, brizna kojom se vozilo
kretao prema kontrolnoj taki i spol vozaa.
d. Na sistematskom pregledu djeci je izmjerena visina i teina, uraen pregled plua, abdomena,
ekstremiteta, oftalmoloki pregled, te laboratorijski nalazi (sedimentacija, broj eritrocita i broj
leukocita). Djeca su na pregled dola u pratnji jednog ili oba roditelja.
e. Prije nego to je zapoeo sa rezanjem, Edvin je pet puta izmjerio dimenzije obrisa kocke
ucrtanih na kartonu.
f. Biolog je prebrojao listove na svakoj od 20 biljaka.
g. Emir je deset puta u toku dana mjerio krvni pritisak. Svaki put dobio je drugaije vrijednosti.
5
h. U Osnovnoj koli Wilhelm Wundt utvren je broj razreda, odjeljenja i uenika.

i. Psiholog je posmatrao desetero djece i mjerio vrijeme koje svako od njih provede igrajui se
sa plianim medvjediem.
j. Deset atletiara tralo je na 100 metara. Prvi na cilj doao je A.N, drugi N.Z, dok je zadnji na
cilj doao W.P.
4. U dolje navedenim primjerima odredite nivo (skalu) mjerenja.
a. Broj pogreaka koje pacov naini prilikom prolaska kroz labirint.
b. Spol.
c. Dob.
d. Udaljenost izmeu Sarajeva i Konjica (u km).
e. Vrijeme koje je potrebno motoru da postigne brzinu od 100 km/h.
f. Stepen zadovoljstva ivotom koji ispitanici procjenjuju na skali od 7 jedinica (1 uopte
nisam zadovoljan/a; 7 ekstremno sam zadovoljan/a).
g. Da li osoba koristi ili ne koristi zamjenice prvog lica (mene, meni, nas, nama) tokom 10minutne konverzacije?
h. Koliko puta u toku 30-minutne konverzacije osoba upotrijebi prvo lice jednine.
i. Nacionalna pripadnost.
j. Rezultati na testu depresije (maksimalni rezultat je 100).
k. Rangiranje 5 tema u skladu sa stepenom u kojem je osoba upoznata sa temama (teme se
rangiraju od najbolje upoznat do najslabije upoznat).
l. Djetetov izbor rune igrake ili lijepe igrake.
m. Broj tano rijeenih zadataka na testu znanja iz fizike.
n. Vrste psiholokih fobija.
o. Tjelesna temperatura (izraena u C).
p. Samopotovanje, izraeno na skali sa 5 stupnjeva.
q. Godinji prihod u KM.
r. Teoretska psihoterapijska orijentacija.
s. Osvojeno mjesto na takmienju u latinoamerikom plesu.
t. Srani ritam izraen kao broj otkucaja u minuti.
u. Broj eritrocita u krvi.
v. Kuni brojevi u ulici Wilhelma Wundta (npr. ulica Wilhelma Wundta br. 25).
w. Vrijeme reakcije (u sekundama).
x. Prosjena kolska ocjena iz fizike na kraju kolske godine.
y. Broj rijei zapamenih na testu pamenja.
z. Temperatura tijela izraena u Kelvinima.
aa. Vrsta kazne u kriminolokoj praksi (npr. uvjetna, mjera zatvora).
bb. Vrijeme koje dijete provede u igranju sa svojim vrnjakom (u minutama).
cc. Broj godina kolovanja.
dd. Brani status ispitanika.
5. Odredite skale mjerenja u zadacima 1, 2 i 3.
6. Provjerite tanost sljedeih tvrdnji:

a. Nominalna skala slui za klasificiranje pojava.
b. Intervalne skale imaju jednake intervale izmeu mjernih jedinica (taaka
na skali).
c. Na rang skali vrijednosti su poredane od najmanje do najvee.
DA
NE
DA
NE
DA
NE
d. Na omjernim skalama, vei broj uvijek znai vie pojave koja se mjeri.
DA
NE
e. Intervalne skale ne podrazumijevaju svojstvo redoslijeda.

f. Na intervalnim skalama, rezultat nula znai odsustvo fenomena koji se
mjeri.
g. Kada se koristi nominalna mjerna skala, najvie to se moe rei je da je
jedan rezultat vei od drugog.
h. Rang skalom ne moemo klasificirati pojave.
DA
NE
DA
NE
DA
NE
DA
NE
i. Na intervalnim skalama rezultat nula nije mogu.
DA
NE
7. Za sljedee rezultate mjerenja identificirajte originalno koritenu skalu, a potom transformirajte

rezultate sa skala viih nivoa mjerenja na rezultate skala niih nivoa mjerenja:
a. Ben je na ispitu iz Statistike dobio ocjenu 9,1; Den 7,5; Ken 9,9; Jen 8,7; Ren 5 (nije uspio
poloiti ispit); Wen 10.
a.1. Transformirajte ove rezultate na nominalnu skalu.
a.2. Transformirajte ove rezultate na rang skalu.
b. Carl Lewis istrao je dionicu od 100 m za 9,86 s; Tyson Gay za 9,69; Donovan Bailey za 9,84
s; Usain Bolt za 9,58; Leroy Burrell za 9,85 s; Maurice Green za 9,79 s; dok je Asaffa Powell
odustao prije dolaska na cilj.
b.1. Transformirajte ove rezultate na nominalnu skalu.
b.2. Transformirajte ove rezultate na rang skalu.
c. Zavod za socijalnu zatitu utvrdio je sljedee ekonomske razrede za rangiranje stanovnitva:
mjeseni prihodi od 0 do 370 KM spadaju u razred ispodprosjenih novanih primanja.
Primanja od 371 do 670 KM spadaju u prosjena primanja, dok se mjesena primanja via od
670 KM registruju kao nadprosjena. Domainstvo Jung ima mjesena primanja od 230 KM,
Wundt 567 KM, Skinner 1.045 KM; Adler 746 KM, Erickson 984 KM, Terman 350 KM i
Lindsay 650 KM.
c.1. Transformirajte ove rezultate na nominalnu skalu.
c.2. Transformirajte ove rezultate na rang skalu.
2. Grafiko i tabelarno predstavljanje podataka
Zamislite da ispred sebe imate podatke o kolskom uspjehu i pokazateljima socioekonomskog statusa za vie od 2000 uenika. ta bi mogli zakljuiti na osnovu podataka? Ko
postie bolji kolski uspjeh: djeaci ili djevojice? U kakvom je odnosu kolski uspjeh i stepen
obrazovanja roditelja? Od samih podataka prikupljenih tokom istraivanja zapravo nemamo mnogo
koristi. Podaci koji nisu sistematizirani i ureeni nazivaju se sirovi podaci.
Podatke je potrebno organizirati i prikazati tako da ih moemo opisati, analizirati,
interpretirati. U tu svrhu koristimo numerike i grafike postupke pomou kojih organiziramo i
reprezentiramo podatake na jasan, ekonomian i razumljiv nain. Numerikim postupcima
izraunavamo odreene vrijednosti kojima opisujemo uzorak; izraunate vrijednosti nazivamo
statisticima. Numeriki postupci pruaju precizne i objektivne informacije o podacima. Grafikim
postupcima vizuelno predstavljamo podatke. Za razliku od numerikih postupaka, oni ukljuuju
detaljnije informacije o nekim karakteristikama podataka, npr. obliku distribucije.
Izbor naina prikazivanja podataka zavisi od koritene skale mjerenja. Kategorijalne podatke
grafiki predstavljamo u stupastim i torta dijagramima. Numerike podatke moemo predstaviti
kroz tabelarni prikaz distribucije frekvencija, stablo i listovi (engl. steam and leaf) i box-plot prikaz. Numeriki podaci grafiki se prikazuju pomou histograma i procentualne kumulativne krive.
U primjerima koji slijede prikazani su najee koriteni grafiki i tabelarni postupci
organiziranja i prikazivanja podataka.
PRIMJER 2.1
Na grupi od 100 ispitanika primjenjen je Test ope informiranosti. Podaci (broj tanih
odgovora) prikazani su ispod.
24
27
32
20
20
15
20
20
19
22
18
22
27
28
15
20
14
24
24
19
24
30
25
19
21
13
20
22
20
19
20
25
24
26
21
19
16
22
22
14
12
25
25
12
17
19
21
18
14
15
17
18
18
17
15
20
19
22
16
19
12
24
17
10
21
21
14
19
22
16
21
20
22
15
21
22
16
18
22
30
27
21
17
25
19
20
19
19
15
27
20
24
21
16
18
16
19
16
Podatake emo poredati po veliini, a zatim za svaki odrediti koliko se puta pojavljuje.
Uvrtavanjem ovih vrijednosti u tabelu, podatke emo urediti u vidu tabele distribucije frekvencija
negrupiranih podataka (tabela 2.1.1).
Tabela 2.1.1: Distribucije frekvencija negrupiranih podataka

rezultat
10
12
13
14
15
16
17
18
19
13
20
12
21
22
10
24
25
26
27
28
30
32
Distribucije frekvencija negrupiranih podataka praktian je nain organiziranja i prikazivanja

manjeg skupa podataka. Za vei skup podataka, koristimo tabelarno prikazivanje pomou distribucije frekvencija grupiranih podataka. Podatke grupiramo na sljedei nain:
Odredimo totalni raspon rezultat.

Raspon rezultata podijelimo na odreeni broj razreda tako da razredi imaju istu veliinu.
Broj razreda je obino izmeu 5 i 20.
Odredimo veliinu intervala razreda prema izrazu: totalni raspon/ broj razreda. Sredina
razreda treba da koincidira sa stvarnim rezultatima. Granice razreda ne bi trebale koincidirati
sa stvarnim rezultatima.
Odredimo broj podataka za svaki razred.
Razrede i frekvencije uvrstitimo u tabelu.
U tabeli 2.1.2 prikazana je distribucije frekvencija grupiranih podataka.
10
Table 2.1.2: Distribucije frekvencija grupiranih podataka

razred
6-9
10-13
14-17
22
18-21
40
22-25
22
26-29
30-33
total
100
Grafiki prikaz ovako organiziranih podataka naziva se histogram. Histogram distribucije

frekvencija grupiranih podataka prikazan je na slici 2.1.1.
Slika 2.1.1. Distribucija frekvencija grupiranih

podataka
f 45
40
35
30
25
20
15
10
5
0
3,5
7,5
11,5
15,5
19,5
22,5
27,5
31,5
35,5
Ponekad se koristi tabelarni/grafiki prikaz distribucije relativnih i kumulativnih frekvencija.

Relativne frekvencije odreuju se djeljenjem frekvencije datog razreda sa ukupnim brojem podataka.
Izraava se kao proporcija ili postotak. Kumulativne frekvencije odreujemo sukcesivnim
dodavanjem frekvencija razreda ispod datog razreda. Izraava se kao frekvencija ili postotak. U
tabeli 2.1.3. prikazane su distribucije relativnih i kumulativnih frekvencija. Grafiki prikaz
distribucije relativnih kumulativnih frekvencija (u procentima) dat je na slici 2.1.2.
11
Tabela 2.1.3: Distribucije relativnih i kumulativnih frekvencija

razred
rf
rf(%)
cf
rcf
rcf(%)
6-9
0,02
2,0%
0,02
2,0%
10-13
0,05
5,0%
0,07
7,0%
14-17
22
0,22
22,0%
29
0,29
29,0%
18-21
40
0,40
40,0%
69
0,69
69,0%
22-25
22
0,22
22,0%
91
0,91
91,0%
26-29
0,06
6,0%
97
0,97
97,0%
30-33
0,03
3,0%
100
100,0%
total
100
100%
Distribuciju kumulativnih frekvencija koristimo kada trebamo odrediti poloaj podatka u

distribuciji svih podataka, odnosno poloaj ispitanika kojem podatak pripada u grupi svih ispitanika.
Za odreivanje poloaja nekog podatka koristimo centile i decile. Centili su vrijednosti koje skup
rezultata dijele na 100 jednakih dijelova (frakcije rezultata od 1%). Prvi centil obuhvaa 1% najniih
rezultata, drugi centil 1% sljedeih... dvadeseti centil obuhvaa onih 1% koji su na dvadesetom
mjestu od najnieg rezultata. Ako neki rezultat pada u 60. centil, to znai da je 60% rezultata
jednake ili nie vrijednost, a 40% vie vrijednosti. Decili su vrijednosti koje skup rezultata dijele na
10 jednakih dijelova (frakcije rezultata od 10%). Prvi decil obuhvaa 10% najniih (ili najviih)
rezultata, drugi decil sljedeih 10%, itd. Prvi centil je poetna vrijednost za prvi decil, 10. centil je
poetna vrijednost za drugi decil, dok je 90. centil poetna vrijednost za deseti decil.
Slika 2.1.2. Distribucija procentualnih kumulativnih

frekvencija
rfc% 100
90
80
70
60
50
40
30
20
10
0
29,5; 9733,5; 100

25,5; 91
21,5; 69
17,7; 29
5,5; 0 9,5; 2
0,0
5,0
10,0
13,5; 7
15,0
20,0
25,0
30,0
35,0
40,0
X
Tabelarnim i grafikim prikazom kumulativnih frekvencija moemo odrediti koliko se

podataka nalazi u odreenom intervalu (npr. u intervalu od 5,5 do 21,5 nalazi se 69% podataka, tj.
69 podataka). Nadalje, moemo odrediti granice intervala u kojem se nalazi odreeni procenat (ili
broj) podataka (npr. 9% najviih vrijednosti nalazi se u intervalu od 21,5 do kraja distribucije, tj. do
33,5).
12
PRIMJER 2.2
U tabeli ispod prikazani su podaci prikupljeni od 29 pacijenata koji se lijee na Pedijatrijskoj
klinici. Prikupljeni su podaci za dob pacijenta (izraena u godinama), spol (1-djeaci; 2-djevojice),
tjelesnu teinu TTEZ (u kg), puls i sistolni krvni pritisak SKP. U ovom primjeru, podatke emo
organizirati i predstaviti na razliite naine zavisno od tipa varijabli.
Tabela 2.2.4: Podaci za dob, spol, tjelesnu teinu TTEZ (u kg), puls i sistolni krvni pritisak SKP
r/br.
DOB
SPOL
TTEZ
PULS
SKP
r/br
DOB
SPOL
TTEZ
PULS
SKP
0,3
90
65
16
5,4
22
100
100
0,2
178
65
17
6,5
23
96
99
0,3
140
87
18
12,7
51
79
109
0,3
120
60
19
10,1
24
93
104
0,3
155
65
20
16,2
52
74
101
0,3
150
70
21
15,6
35
100
128
0,3
156
65
22
9,4
28
88
86
0,6
163
88
23
15,3
45
90
100
0,9
128
105
24
9,1
45
110
112
10
1,1
110
95
25
9,7
30
90
110
11
5,1
28
160
99
26
9,4
20
160
99
12
1,5
10
110
86
27
12,2
25
100
112
13
2,2
12
110
95
28
6,0
20
117
115
14
1,5
10
110
86
29
16,0
47
81
128
15
1,5
12
110
86
Varijabla SPOL je kategorijalna, i stoga su podaci prikazani u obliku torta dijagrama (slika
2.2.3). Kategorije varijable spol (djevojice i djeaci) oznaene su na razliit nain. Pored svake
kategorije naveden je broj podataka.
Slika 2.2.3. Spolna zastupljenost ispitanika
14
15
djevojice
13
djeaci
Varijabla DOB je kontinuirana, a vrijednosti su izraene kao decimalni brojevi. Za

predstavljanje podataka koristit emo stablo i listovi prikaz (tabela 2.2.5). Stablo sadrava
brojeve sa lijeve strane decimalnog zareza, a listovi brojeve sa desne strane decimalnog zareza.
Tabela 2.2.5. Stablo i listovi prikaz dobi ispitanika
0
(9)
(2)
(2)
10
12
(2)
15
(2)
16
(2)
znai 1,1 godina
(4)
(1)
(4)
(1)
U zagradama su prikazane frekvencije listova, tj. broj podataka za svaku vrijednost stabla.
Stablo i listovi prikaz omoguava vizuelnu impresiju o distribuciji podataka. Ako zamislimo da
prikaz rotiramo za 90 u smjeru obrnutom od smjera kazaljke na satu, dobit emo prikaz koji je
veoma slian ipkastom dijagramu. Iz prikaza moemo vidjeti da je najvei broj pacijenata mlaih
od godinu dana (ukupno devet), zatim onih sa devet godina (4 pacijenta) itd.
Varijabla TJELESNA TEINA je kontinuirana. Stoga distribuciju podataka ove varijable
moemo predstaviti pomou stablo i listovi prikaza. Vrijednosti varijable izraene su kao cijeli
brojevi sa jednom ili dvije cifre. Stoga u stablo i listovi prikazu 2|4 znai 24 kg, dok 0|6 znai 6
kg. U tabeli 2.2.6 dat je stablo i listovi prikaz vrijednosti tjelesne teine.
Tabela 2.2.6. Stablo i listovi prikaz tjelesne teine
0
znai 3 kg
znai 20 kg
(10)
(4)
(8)
(2)
(3)
(2)
14
Podaci dobiveni mjerenjem pulsa ispitanika najprije su grupirani u razrede. Formirano je est
razreda (prvi od 61 do 80, zadnji od 161 do 180), nakon ega su odreeni podaci koji pripadaju
svakom razredu. Tabelarni prikaz distribucije frekvencija rezultata grupiranih u razrede prikazan je u
tabeli 2.2.7). Na slian nain formirana je distribucija frekvencija rezultata grupiranih u razrede
varijable sistolni krvni pritisak (tabela 2.2.8).
Tabela 2.2.7: Distribucija frekvencija rezultata varijable PULS
Razred
61-80
81-100
10
101-120
121-140
141-160
161-180
Tabela 2.2.8: Distribucije frekvencija rezultata SKP

Razred
60-69
70-79
80-89
90-99
100-109
110-119
120-129
PRIMJER 2.3
Trei razred 1. Osnovne kole broji ukupno 25 uenika. Na pitanje Koji vam je omiljeni
kolski predmet?, troje uenika navelo je biologiju, petoro geografiju, estoro historiju, dvoje
matematiku, etvoro tjelesni odgoj, troje fiziku, jedno likovnu kulturu i jedno hemiju. Dobivene
podatke naprije emo tabelarno prikazati (tabela 2.3.9). U prvi stupac tabele unijeti su predmeti, a u
drugi broj uenika koji su navedene predmete naveli kao omiljene.
15
Tabela 2.3.9: Podjela uenika IIIc odjeljenja prema preferiranom kolskom predmetu
Preferirani kolski predmet
Biologija
Geografija
Historija
Matematika
Tjelesni odgoj
Fizika
Likovna kultura
Hemija
total
25
S obzirom da je varijabla PREFERIRANI PREDMET kategorijalna, za grafiki prikaz

koristit emo stupasti dijagram (slika 2.3.4).
S lika 2.3.4. P odjela u enika IIIc odjeljena prema

preferiranom kols kom predmetu
f 8
6
6
4
F iz ika
F iz i ko v.
Matematika
Is torija
B iologija
G eografija
H emija
L ikovno v.
P referirani predmet
Na kolskom sistematskom pregledu mjerena je visina svakog od ovih 25 uenika. Utvrene

su sljedee visine uenika, zaokruene na cijeli centimetar:
131
134
136
135
139
135
137
133
138
136
136
134
135
136
134
137
135
132
135
134
135
137
135
132
136
16
Podaci se mogu predstaviti tabelarno u obliku negrupirane distribucije frekvencija (tabela

2.3.10) ili pomou stablo i listovi prikaza (slika 2.3.11).
Tabela 2.3.10: Visina uenika IIIc odjeljenja
Visina uenika (cm)
131
132
133
134
135
136
137
138
139
total
25
Tabela 2.3.11. Stablo i listovi prikaz visina uenika IIIc odjeljenja

13
(1)
13
13
13
13
13
13
13
(1)
13
(1)
13
znai 131 cm
13
znai 138 cm
(2)
(1)
(4)
5
(7)
(5)
(3)
Iz Tabele 2.3.10 moemo vidjeti da je najnii uenik u razredu visok 131 cm, a najvii 139
cm. Dakle utvreni raspon rezultata je 8 (139 131). Obzirom da je utvreni raspon rezultata mali,
te da imamo relativno mali broj ispitanika (N=25), tj. da ve na temelju tabele 2.3.10 imamo dobar
pregled distribucije, rezultate nije potrebno grupirati u razrede. Tabeli 2.3.10 dodat emo vrijednosti
relativnih i kumulativnih frekvencija [rf, rf (%), cf, rcf i rcf (%)] koje e nam omoguiti dodatne
informacija o distribuciji visina uenika (tabela 2.3.12).
Iz tabele 2.3.12 mogli bismo izvui zakljuak da je 20% uenika visoko 136 cm procenat
rezultata u tom razredu [rf(%)] je upravo 20. Ipak, preciznije bi bilo rei da je 20% uenika visoko
17
izmeu 135,5 i 136,5 cm. Naime, zbog nepreciznosti naeg mjerenja (tj. zaokruivanja rezultata na
cijeli cm), visina uenika koji su visoki izmeu 135,5 i 136,5 cm bit e registrirana kao visina od
136 cm. Dakle, iako je prikazani rezultat 136 cm, stvarni rezultat kree se u intervalu omeenom
stvarnom donjom granicom 135,5 cm i stvarnom gornjom granicom 136,5 cm.
Tabela 2.3.12. Distribucija visina uenika IIIc odjeljenja

Visina uenika (cm)
131
132
133
134
135
136
137
138
139
total
f
1
2
1
4
7
5
3
1
1
25
rf
0,04
0,08
0,04
0,16
0,28
0,2
0,12
0,04
0,04
1
rf(%)
4
8
4
16
28
20
12
4
4
100
cf
1
3
4
8
15
20
23
24
25
rcf
0,04
0,12
0,16
0,32
0,6
0,8
0,92
0,96
1
rcf(%)
4
12
16
32
60
80
92
96
100
Nadalje, iz tabele 2.3.12 moemo zakljuiti da je 40% uenika visoko najmanje 136 cm
(preciznije 135,5 cm) ukoliko saberemo procenat uenika sa visinom jednakom ili veom od 136
cm dobit emo upravo 40 procenata distribucije.
Podatke moemo predstaviti i pomou ogive (slika 2.3.5)
S lika 2.3.5. D is tribuc ije relativ nih kumulativ nih frekv enc ija (u
proc entima)
rc f (% )
100
92 %
80
80 %
60
60 %
40
20
0
96 %100 %
32 %
12 %
16 %
4%
0%
130,5 131,5 132,5 133,5 134,5 135,5 136,5 137,5 138,5 139,5
Vis ina u enika IIIc odjeljenja (c m)
Koristei se ogivom, tj. spajajui preko ogive rezultat sa odgovarajuom kumulativnom

procentualnom vrijednou i obratno, moemo doi do zakljuaka kao to su: 40% uenika je nie
od oko 134,75 cm; neto manje od 20% uenika je visoko najmanje 137 cm; neto vie od 40%
uenika svojom visinom spada u interval izmeu dva spomenuta rezultata (134,75 i 137 cm).
18
PRIMJER 2.4
Odreivanje centila i decila ilustrirat emo na primjeru 2.1. Odredit emo: a) u koji centil
pada rezultat 22, b) rezultat koji pada na 25 centil, c) centil rezultata 19, d) rezultat koji odgovara 60
centilu i e) granice 7. decila. Za odreivanje zadatih vrijednosti koristit emo tabelu 2.1.3 i grafiki
prikaz distribucije relativnih kumulativnih frekvencija (slika 2.1.2).
a)
U koji centil pada rezultat 22

Centil moemo odrediti pomou formule:
Centil rezultata = (Rang rezultata / N) x 100.
Npr. ako je meu 90 rezultata neki rezultat 40 po redu, onda se taj rezultat nalazi u: (40/90) x
100 = 44. centilu.
Kod rezultata grupiranih u razrede centil se odreuje prema sljedeoj formuli:
centil RKFD (X D)
RFR
i
gdje je:
X rezultat za koji traimo centil,
RKFD relativna kumulativna frekvencija (%) rezultata ispod razreda u kojem je
rezultat X,
D prava donja granica razreda u kojem se nalazi rezultat X,
i interval,
RFR relativna frekvencija (%) rezultata u razredu u kojem se nalazi rezultat X.
Nakon to odredimo poznate vrijednosti: X=22; RKFD=69,0; D=21,5; i=4; RFR=22,0, i uvrstimo
ih u izraz, izraunat emo centil rezultata X=22:
centil RKFD (X D)
RFR
22,0
69,0 (22 21,5)
71,75
i
4
Moemo zakljuiti da se ispod rezultata X=22 (ukljuujui i rezultat 22) nalazi 71,75% rezultata
(tj. ispitanika), dok se iznad ovog rezultata nalazi 28,25% rezultata (tj. ispitanika).
19
b)
Koji rezultat pada na 25 centil

Za odreivanje rezultata koji pada na 25 centil primijenit emo sljedei izraz:
centil N
i
X D
fD
100
fR
gdje je:
Centil zadati centil
D prava donja granica razreda u kojem je rezultat X,
fD ukupan broj rezultata ispod razreda u kojem je rezultat X,
fR broj rezultata u razredu u kojem je rezultat X,
i interval.
Nakon to odredimo poznate vrijednosti: Centil=25; D=13,5; fD=7; fR=22; i=4, i uvrstimo ih u
izraz, izraunat emo rezultat koji pada na 25 centil:
centil N
i
25 100
4
X D
fD 13,5
7
16,77
100
fR
100
22
Rezultat 16,77 dijeli distribuciju na dva dijela, tako da je ispod ovog rezultata 25% rezultata (tj.
ispitanika), a iznad 75%.
c)
Odrediti centil rezultata 25
Za odreivanje centila rezultata X=25 koristi emo grafiki prikaz distribucije relativnih
kumulativnih frekvencija (slika 2.4.7) Sa apscise emo povui okomitu liniju od take koja pada na
X=25, do mjesta presjeka za procentualnom ogivom. Zatim emo od ove take povui liniju
paralelnu sa apscisom, do ordinate. Taka u kojoj ova linija sjee ordinatu odgovara traenom
centilu. Tako je Centil 90%
d)
Odrediti rezultat koji odgovara 60 centilu
Za odreivanje rezultata koji odgovara 60. centilu koristi emo procentualnu ogivu (slika 2.4.7).
Sa ordinate emo povui okomitu liniju od take koja pada na rcf%=60, do mjesta presjeka sa
procentualnom ogivom. Zatim emo od ove take povui liniju paralelnu sa ordinatom, do apscise.
Taka u kojoj ova linija sjee apscisu odgovara traenom rezultatu. Tako je X 20.
20
Slika 2.4.7. Distribucija procentualnih kumulativnih

frekvencija
rfc% 100
90
80
70
60
50
40
30
20
10
0
29,5; 9733,5; 100

25,5; 91
21,5; 69
17,7; 29
5,5; 0 9,5; 2
0,0
5,0
10,0
13,5; 7
15,0
20,0
25,0
30,0
35,0
40,0
X
e)
Koje su granice 7. decila?
Sedmi decil poinje sa 60-im a zavrava sa 69,99-im centilom. Stoga je potrebno odrediti
rezultate koji padaju u 60 i 69,99 centil.
centil N
i
60 100
4
X 60 centil D
fD 17,5
29
20,6
100
f
100
40
centil N
i
69,99 100
4
X 69,99 centil D
fD 17,5
29
21,6
100
100
fR
40
Granice 7. decila su: 20,6 21,6.
PRIMJER 2.5
Kantonalni Zdravstveni zavod Sarajevo proveo je istraivanje sa ciljem utvrivanja
karakteristika populacije pacijenata sa dijagnosticiranom hipertenzijom te utvrivanja naina na koji
lijenici ope prakse tretiraju ove pacijente. Anketiranje je provedeno na reprezentativnom uzorku
od 300 pacijenata iz Kantona.
Na priloenim graficima prezentirani su dobiveni rezultati istraivanja prema pojedinim
varijablama.
21
Prva varijabla je spol kategorijalna varijabla utvrena na nominalnoj skali. Obzirom na

prirodu mjerenja u ovoj varijabli, prikladan nain grafikog prikazivanja podataka je torta dijagram:
S lika 2.5.7. Zas tupljenos t pac ijenata prema

s polu
46%
54%
ene
Mu karc i
Naredni skup podataka odnosi se na starosnu strukturu pacijenata. Starosna strukura ispitanika
je kvantitativna varijabla iako ispitanike razvrstavamo u jednu od kategorija prema njihovoj
starosnoj dobi, na temelju pripadnosti odreenoj kategoriji, ispitanici mogu dobiti i odgovarajui
rang. Tako, npr., svi ispitanici mlai od 30 godina e dobiti rang 1, ispitanici starosti od 31 do 40
godina rang 2, ispitanici u narednoj starosnoj skupini rang 3...
S lika 2.5.8. S taros na s truktura pac ijenata

%
35
30
25
20
15
10
5
0
Is pod 30 od 31 do O d 41 do O d 51 do O d 61 do O d 71 do P reko 81
god.
40 god. 50 god. 60 god. 70 god. 80 god.
god.
D obna kategorija
Prilikom utvrivanja procenata pacijenata pojedinih starosnih uzrasta koji su upueni lijeniku
specijalisti (slika 2.5.9) ponovo smo se koristili mjerenjem na nominalnoj skali ispitanici su
svrstani u jednu od dvije kategorije: Upuen specijalisti/ Nije upuen specijalisti, a potom je u
svakoj od kategorija utvren broj ispitanika.
22
S lika 2.5.9. P roc enat pac ijenata u pojedinim dobnim

kateg orijama upud enih s pec ijalis ti od s trane lije nika
opd e praks e
%
100
80
60
40
20
0
Is pod 30 od 31 do O d 41 do O d 51 do O d 61 do O d 71 do P reko 81
god.
40 god.
50 god.
60 god. 70 god.
80 god.
god.
D obna kategorija
Slika 2.5.10 predstavlja kombinaciju kategorijalne i kontinuirane varijable. Varijabla Upuen

specijalisti je, kako smo ve naveli, kategorijalna, dok je varijabla Krvni (sistoliki/ dijastoliki)
pritisak kontinuirana.
S lika 2.5.10. P reg led pros je nih v rijednos ti

s is toli kog i dijas toli kog pritis ka pac ijenata prema
tome da li s u upud eni s pec ijalis ti ili ne
158.69 m m /H g
P ac ijent je
upud en
s pec ijalis ti
94,31 m m /H g
143.21 m m /H g
P ac ijent nije
upud en
s pec ijalis ti
0,00
89,43 m m /H g
50,00
100,00
mm/Hg
23
150,00
200,00
P ros je na
vrijednos t
s is toli kog
pritis ka
P ros je na
vrijednos t
dijas toli kog
pritis ka
ZADACI
1. Na grupi od 30 uenika primjenjen je test inteligencije. Dobiveni su sljedei rezultati:

70
85
100
114
93
89
126
76
142
104
68
73
109
82
97
79
116
121
84
100
93
74
95
113
96
83
70
110
69
91
a. Prikaite tabelarno distribuciju frekvencija rezultata grupiranih u 8 razreda. Neka donja

granica prvog razreda bude 67.
b. Koje su prave granice zadnjeg razreda?
c. Konstruirajte stablo i listovidijagram.
d. Nacrtajte histogram.
e. Grafiki prikaite distribuciju relativnih kumulativnih frekvencija.
2. U tabeli ispod prikazana je dobna distribucija 230 lanova planinarskog drutva.
Dob
Broj lanova (f)
<15
16
16-19
25
20-29
40
30-39
47
40-49
50
50-59
45
> 60
a. Koliko je lanova starijih od 60 godina? Izraunatu vrijednost unesite u tabelu.

b. Podatke prikaite u tabeli sa pravim donjim i gornjim granicama razreda.
c. Nacrtajte histogram podataka.
3. Nivo hemoglobina izmjeren je na grupi od 40 pacijenata. Dobivene su sljedee vrijednosti
mjerenja, zaokruene na prvu decimalu:
9,2
11,9
14
15,6
9,7
12,1
14,1
15,9
9,7
12,4
14,5
16
10,3
12,6
14,6
16,4
10,9
12,8
14,6
16,5
10,9
13
14,8
16,6
11,4
13,1
14,9
16,7
11,4
13,2
15,1
16,8
11,4
13,7
15,1
16,8
11,7
13,8
15,3
16,9
a. Formirajte tabelu rezultata grupiranih u razrede.

b. Nacrtajte histogram rezultata.
4. U tabeli ispod prikazana je distribucija kolskih ocjena 520 uenika petih razreda.
kolski uspjeh
Broj uenika (f)
1
2
2
35
24
3
240
4
150
5
93
Formirajte nove distribucije (u odnosu na distribuciju prikazanu u tabeli) tako da:

a. se u svakom razredu nalazi podjednak broj uenika,
b. je vie uenika koji su postigli nie ocjene,
c. je vie uenika koji su postigli vie ocjene.
5. U dva kruga grupnog nadmetanja Lige ampiona postignuta su 72 gola. U tabeli ispod prikazan je
broj pogodaka tokom razliitih perioda utakmice. Grafiki prikaite podatke iz tabele.
minuta
broj golova
1-15
16-30
31-45
Dodatno vrijeme (1)
46-60
61-75
15
76-90
20
Dodatno vrijeme (2)
6. Na osnovu stem-and-leaf prikaza odredite sirove podatke.

ene
332111
64332211111
9331
5532
mukarci
48
2559
11113455666899
22368
stem
6
7
8
9
7. VIa razred Osnovne kole Sigmund Freud broji ukupno 25 uenika. Na pitanje Koji vam je
omiljeni kolski predmet?, uenici su dali sljedee odgovore: njih troje navelo je maternji jezik,
etvoro hemiju, petoro tjelesni odgoj, dvoje matematiku, estoro historiju, dvoje fiziku, jedno
tehniki odgoj i dvoje geografiju.
a. Predstavite ove podatke tabelarno. Navedite procenat sluajeva za svaku kategoriju.
b. Podatke predstavite grafiki pomou stupastog dijagrama.
25
8. Na kolskom sistematskom pregledu izmjerena je visina 25 uenika iz prethodnog zadatka.

Utvrene su sljedee visine uenika, zaokruene na cijeli centimetar:
148
158
158
153
141
134
152
148
134
145
158
142
137
152
148
134
140
153
155
146
152
138
137
141
152
a.
b.
c.
d.
e.
Ove rezultate predstavite u obliku jednostavne distribucije frekvencija.

Rezultate predstavite pomou stablo i listovi prikaza. Opiite distribuciju.
Rezultate prezentirajte u vidu grupirane distribucije frekvencija.
Rezultate predstavite grafiki, pomou histograma.
U tabeli sa grupiranom distribucijom frekvencija dodajte kolone sa relativnim frekvencijama
[rf], relativnim frekvencijama u procentima [rf(%)], kumulativnim frekvencijama [cf],
relativnim kumulativnim frekvencijama [rcf] i relativnim kumulativnim frekvencijama u
postocima [rcf(%)].
f. Relativne kumulativne frekvencije izraene u procentima [rcf(%)] prikaite grafiki, pomou
OGIVE.
g. Nastavnik tjelesnog odgoja eli za svoj kolski koarkaki tim testirati 20% najviih uenika
iz razreda. Koliko e uenika pozvati na testiranje? Koja e biti visina najnieg uenika kojeg
e pozvati na testiranje?
h. kolski ljekar sumnja da kod djece koja su u VI razredu nia od 137 cm moe postojati
odreena hormonalna neravnotea u organizmu koja usporava rast. Kako se ovaj poremeaj
tretira vitaminskom terapijom, ljekar eli znati za koji broj uenika iz razreda treba naruiti
vitamine?
9. Kompanija eli zaposliti 10 novih radnika na poziciji istraivaa trita te je u novinama objavila
oglas na koji se javilo ukupno 46 kanditata. Svi kandidati su pozvani na test namjenjen
utvrivanju nivoa njihovog znanja iz statistike (maksimalni rezultat na testu iznosio je 40).
Dobiveni su sljedei rezultati:
19
25
26
27
28
29
30
31
32
20
25
26
27
28
29
30
31
32
23
25
26
27
28
29
30
32
35
24
25
27
27
29
29
30
32
35
25
26
27
27
29
29
31
32
35
39
Napravite tabelarni prikaz distribucije frekvencija rezultata grupiranih u razrede. Utvrdite

relativne frekvencije [rf], relativne frekvencije u procentima [rf(%)], kumulativne frekvencije
[cf], relativne kumulativne frekvencije [rcf] i relativne kumulativne frekvencije u postocima
[rcf(%)].
26
a. Grupirane frekvencije predstavite grafiki, pomou histograma.

b. Relativne kumulativne frekvencije izraene u procentima [rcf(%)] prikaite grafiki, pomou
ogive.
Koristei tabelu grupiranih frekvencija ili ogivu, odgovorite na naredna pitanja:
a. Koji rezultat (otprilike) dijeli distribuciju na 50% gornjih i donjih rezultata (50% slabijih i
50% boljih kandidata).
b. Kompanija e zaposliti one kandidate koji su na testu iz statistike skupili najmanje 34 boda.
Koliko kandidata e odmah dobiti ponudu za posao? Koliko je to procenata ukupno
prijavljenih kandidata?
c. Kako kompaniji treba ukupno 10 novih uposlenika, odlueno je se na dodatni trening iz
statistike pozove duplo vie kandidata nego to ima preostalih upranjenih radnih mjesta.
Kandidat koji e biti pozvani na trening su oni koji imaju najbolje rezultate na testu kada se
iskljue oni kandidati koji su ve dobili ponudu za posao. Koliko kandidata e biti pozvano na
dodatni trening? Koji su granini rezultati (donji i gornji) koji odreuju ovu skupinu? Koji je
to procenat ukupnog broja prijavljenih kandidata?
10. Kliniki centar registovao je uestalost prijema pacijenata koji su se alili na probleme sa
respiratornim sistemom tokom godine dana. Tokom te godine zabiljeeno je 1500 prijema.
Ukoliko se eli saznati u kojem godinjem dobu je vei broj prijema, na koji nain e se podaci
prikazati? Koji e se grafiki prikaz koristiti?
11. U prodavnici tehnikih ureaja kupci su u knjigu utisaka mogli upisivati primjedbe koje imaju na
pruene usluge. Primjedbe su razvrstane u pet grupa. Tokom godinu dana registrovano je 500
albi. Na koji nain se grafiki mogu prikazati registrirane primjedbe? Ukoliko nas zanima u
kojem mjesecu je zabiljeen najvei broj primjedbi (bez obzira na vrstu primjedbe), koji emo
grafiki prikaz izabrati?
12. Telefonska kompanija prikupila je podatke o dobi i spolu svojih korisnika. Najmlai ima 14
godina, a najstariji 75. Na koji nain se prikupljeni podaci mogu prikazati?
13. U istraivanju su prikupljeni podaci o spolu, tjelesnoj teini i dnevnoj koliini unesenih kalorija.
Na koji nain se podaci mogu prikazati?
14. Ukoliko elimo uporediti procenat podataka koji pripadaju jednoj kategoriji, u odnosu na
procenat podataka koji pripadaju drugoj kategoriji, koji prikaz emo koristiti?
15. Psiholog je prikupio podatke o verbalnim sposobnostima mukaraca i ena. Koji naini
prikazivanja podataka e koristiti ukoliko eli uporediti distribucije rezultata ove dvije grupe?
16. Nastavnici osnovnih kola predlagali su uenike za program za poticanje nadarenosti. Za svakog
uenika predloili su oblast za koju smatraju da je uenik nadaren. Na slici ispod prikazani su
dobiveni rezultati.
27
32
30
28
26
24
broj uenika
22
20
18
djeaci
16
djevojice
14
12
10
8
6
4
2
0
Prirodne
nauke
Matematika Drutvene
nauke
Jezik i
Umjetnost
Sport
Ostalo
knjievnost
oblasti
Koliko je djeaka, a koliko djevojica predloeno za pojedine oblasti? Za koju oblast je bilo
najvie prijedloga, a za koju najmanje?
17. Studenti su tokom mjesec dana vodili dnevnik spavanja. Izmeu ostalih vrijednosti, u dnevnik su
unosili podatke o vremenu kada idu na spavanje, vremenu kada se bude, duini spavanja, broju
snova i vrsti snova (radi jednostavnosti, pretpostavimo da su trebali odrediti da li je san bio
prijatan ili neprijatan). Na koji nain se prikupljeni podaci mogu prikazati?
28
3. Mjere centralne tendencije
Utvrivanje mjera centalne tendencije numeriki je postupak deskripcije podataka. Mjere

centralne tendencije predstavljaju vrijednosti koje odraavaju centralno mjesto distribucije podataka;
to je vrijednost koja je tipina, tj. reprezentira skup podataka. U svakodnevnom jeziku za mjere
centralne tendencije koristimo izraz prosjek, ali je ovaj termin neprecizan jer ukljuuje vie mjera.
Tri najvanije mjere centralne tendencije su: mod, medijana i aritmetika sredina.
Mod (dominantna vrijednost) je najuestalija vrijednost u distribuciji. Ako je u distribuciji
podataka jedna dominantna vrijednost, takvu distibuciju nazivamo unimodalnom. Ako su dvije
dominantne vrijednosti, distribucija je bimodalna i tako redom.
U skupu podataka: x=(2,4,5,4,6,3), vrijednost koja se najee pojavljuje je 4; stoga je: Mod=4.
Medijana (centralna vrijednost) je vrijednost koja distribuciju dijeli na dva jednaka dijela, tj.
vrijednost koja se u nizu podataka poredanih po veliini nalazi tano u sredini. Poloaj medijane
odreujemo preko izraza:
Poloaj medijane = (N+1)/2
U skupu podataka: x=(2,7,4,5,6,7,2), poloaj medijane je (7 + 1)/2 = 4, to znai da se centralna vrijednost
nalazi na etvrtom mjestu niza rezultata poredanih po veliini:
x=(2,2,4,5,6,7,7)
Centralna vrijednost iznosi: C = 5
Aritmetika sredina je suma svih rezultata podijeljena brojem rezultata. Aritmetika sredina
predstavlja teite rezultata i stoga je osjetljiva na ekstremne vrijednosti rezultata. Aritmetika
sredina odreuje se prema izrazu:
M= X/N
Za skup podataka: x=(2,7,4,5,6,7,2), aritmetika sredina iznosi: M=(2+7+4+5+6+7+2)/7=4,71
29
Kod simetrine, unimodalne distribucije mod, medijana i aritmetika sredina bit e priblino
jednake vrijednosti.
Izbor mjera centralne tendencije zavisi od skale mjerenja i oblika distribucije. Ako je
koritena nominalna skala mjerenja kao mjeru centralne tendencije koristimo mod, dok kod
ordinalnih skala mjerenja koristimo medijanu. Kada su podaci dobiveni na intervalnoj ili racio skali
mjerenja, kao mjeru centralne tendencije koristimo aritmetiku sredinu, ali samo ukoliko je
distribucija simetrina; u protivnom koristimo medijanu. Ispod je dat shematski prikaz izbor mjera
centralne tendencije.
Mjera centralne tendencije
Koja skala
mjerenja je
koritena?
Nominalna
Ordinalna
Mod
Medija
na
Intervalna
ili racio
ne
Da li je
distribucija
simetrina?
da
Aritmetika sredina
Distribucija je asimetrina ako je vei broj podataka koncentriran na jednoj strani skale, a
manji broj na drugoj strani. Kod pozitivno asimetrine distribucije relativno je vei broj niih
vrijednosti, a kod negativno asimetrine distribucije relativno je vei broj viih vrijednosti.
30
Slika 3.3.1: Primjeri negativno i pozitivno asimetrinih distribucija

8
1
0
0
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13
9 10 11 12 13
Skjunis (eng. skewness) koristimo kao mjeru (a)simetrinosti distribucije. Izraunava se

prema izrazu:
N
(Xi M)
skjunis
N - 2 (N 1) s 3
Ako je vrijednost skjunisa pozitivna, distribucija je pozitivno asimetrina. Ako je vrijednost

skjunisa negativna, distribucija je negativno asimetrina. Ako je vrijednost skjunisa 0, distribucija je
simetrina. Uz vrijednost skjunisa potrebno je odrediti i standardnu pogreku skjunisa!
Kod asimetrinih distribucija aritmetika sredina je pomjerena od medijane u smjeru dueg
kraka distribucije.
31
PRIMJER 3.1
Na grupi od 20 ispitanika primjenjen je Test znanja iz statistike. Rezultati (broj tanih
odgovora) prikazani su ispod.
24
27
32
20
20
15
20
20
19
22
18
22
27
28
15
20
14
24
24
19
Koliko iznosi mod, medijana i aritmetika sredina?

Podatke treba najprije urediti. Koristit emo distribuciju negrupiranih rezultata, prikazanu u
tabeli 3.1.1.
Tabela 3.1.1. Distribucija negrupiranih rezultata
rezultat
14
15
18
19
20
22
24
27
28
32
total
20
1. Mod
Rezultat koji se najuestalije pojavljuje je 20 (pet puta). Prema tome:
Mod = 20
32
2. Medijana
U tabeli distribucije negrupiranih rezultata, rezultati su ve poredani po veliini. Poziciju
medijane odredit emo preko izraza: (N+1)/2.
Poloaj medijane = (20+1)/2 = 10,5
Medijana se nalazi na 10,5 mjestu, tj. na polovini rastojanja izmeu 10 i 11 mjesta. Rezultat
19 nalazi se na estom mjestu, a rezultat 20 od sedmog do jedanaestog mjesta (ukupno je pet
rezultata 20). Na dvanaestom i trinaestom mjestu je rezultat 22, itd. Budui da 10. i 11. mjesto
zauzima jedan te isti rezultat, X=20, medijana iznosi upravo toliko, tj.
C = 20
3. Aritmetika sredina
Aritmetiku sredinu odredit emo preko izraza:
M
X
N
S obzirom da se pojedini rezultati pojavljuju vie puta, gornjem izrazu dodat emo vrijednosti
frekvencija i dobiti sljedeu formulu:
fX
i
14 1 15 2 18 1 19 2 20 5 22 2 24 3 27 2 28 1 32 1
20
Aritmetika sredina iznosi:

M = 21,5
Poreenjem izraunatih mjera centralne tendencije uoavamo da je: M>C=D, to ukazuje da
je distribucija rezultata asimetrina.
33
PRIMJER 3.2
Za podatke iz primjera 2.1 odredite aritmetiku sredinu i medijanu. Tabeli distribucije
grupiranih rezultata dodat emo vrijednosti sredine razreda (X'), a zatim pomnoiti svaku sredinu
razreda sa frekvencijom pripadajueg razreda (tabela 3.2.1).
Tabela 3.2.1. Distribucije frekvencija grupiranih podataka
razred
fX
6-9
7,5
15
10-13
11,5
57,5
14-17
22
15,5
341
18-21
40
19,5
780
22-25
22
23,5
517
26-29
27,5
165
30-33
31,5
94,5
fi= 100
f iXi=1970
Vrijednosti fi Xi i fi uvrstit emo u formulu i izraunati aritmetiku sredinu.

M
fX
i
1970
19,7
100
(napomena: fi = N)
Medijanu moemo odrediti na dva naina: raunskim postupkom ili oitavanjem iz grafikog
prikaza.
Za izraunavanje medijane potrebno je formirati distribucije kumulativne i procentualne
relativne kumulativne frekvencije (tabela 3.2.2).
34
Tabela 3.2.2. Distribucije frekvencija grupiranih podataka

razred
cf
rcf(%)
6-9
2%
10-13
7%
14-17
22
29
29%
18-21
40
69
69%
22-25
22
91
91%
26-29
97
97%
30-33
100
100%
total
100
Primijenit emo sljedeu formulu:

centil N
i
X D
fD
100
fR
Medijana se nalazi u razredu 18-21 jer se do prave gornje granice ovog razreda nalazi 69%
rezultata. Prava donja granica ovog razreda je D=17,5; u ovom razredu nalazi se fR=40 rezultata; do
razreda 18-21 ukupno je fD=29 rezultata; interval razreda iznosi i=4. Centil centralne vrijednosti je
50-i.
Nakon to uvrstimo vrijednosti u formulu:
50 100
4
C 17,5
29
100
40
izraunat emo vrijednost medijane: C = 19,6.

Grafiko odreivanje medijane radimo pomou procentualne ogive (slika 3.2.1). Obzirom da
medijana dijeli distibuciju na dva jednaka dijela, potrebno je na apscisi (x) oitati rezultat koji
odgovara 50-om procentu na ordinati (rcf %).
35
Slika 3.2.1. Grafiko odreivanje centralne

vrijednosti iz distribucija procentualnih
kumulativnih frekvencija
rfc% 100
90
80
70
60
50
40
30
20
10
0
29,5; 9733,5; 100

25,5; 91
21,5; 69
17,7; 29
5,5; 0 9,5; 2
0,0
5,0
10,0
13,5; 7
15,0
20,0
25,0
30,0
35,0
40,0
X
Rezultat koji odgovara 50-om centilu iznosi neto malo vie od 19,5. itav postupak radi se na
milimetarskom papiru na kojem moemo oitati tanu vrijednost. Kada bi tako uradili, uvjerili
bismo se da se radi o rezultatu C=19,6, kojeg smo dobili i raunskim putem.
Obzirom da su vrijednosti aritmetike sredine i medijane podjednake (MC), moemo
zakljuiti da je distribucija rezultata simetrina. Zaista, uvidom u oblik histograma primjeujemo da
je oblik distribucije simetrian (slika 2.1.1).
PRIMJER 3.3
Za varijablu DOB iz primjera 2.2 odredit emo mod, medijanu i aritmetiku sredinu. Za
odreivanje mjera centralne tendencije koristit emo stablo i listovi prikaz (tabela 3.3.1).
Tabela 3.3.1 Stem and leaf prikaz dobi pacijenata
(9)
(2)
(2)
10
12
(2)
15
(2)
16
(2)
(4)
(1)
(4)
(1)
= 29
36
1.
Mod
Iz stablo i listovi prikaza odredit emo rezultat koji se javlja najvei broj puta. Za vrijednost
stabla 0, frekvencija je 9. Vrijednost lista 3 javlja se est puta. Moemo zakljuiti da je:
Mod = 0,3
2.
Medijana
U prikazu rezultati su poredani po veliini (od 0,2 do 16,2). Poloaj medijane odreujemo
preko izraza (N+1)/2. Medijana se nalazi na 15 mjestu. Petnaesto mjesto odredit emo
sabiranjem broja listova za pojedine vrijednosti stabla, sve dok zbir ne bude 15 ili dok ne
preemo vrijednost 15. Dakle, 9 (za 0) + 4 (za 1) + 1 (za 2) + 2 (za 5), to iznosi 16. Na 16.
mjestu nalazi se vrijednost 5,4. Jedno mjesto ispod, tj. na 15. mjestu, nalazi se vrijednost 5,1.
Dakle:
C = 5,1
3.
Aritmetika sredina
Aritmetiku sredinu izraunat emo koristei formulu: M=X/N. Uvrtavanjem vrijednosti u
formulu, dobit emo da aritmetika sredina iznosi:
M = 5,9
Izraunate vrijednosti mjera centralne tendencije se razlikuju. Najvea razlika je izmeu moda
i ostale dvije mjere. Koju emo mjeru centralne tendencije izabrati ako skup podataka elimo
numeriki opisati? Iz stem and leaf prikaza moemo vidjeti da je oblik distribucije asimetrian.
Dakle, aritmetika sredina nije najbolji izbor. Mod takoer ne bi adekvatno reprezentirao skup
podataka jer se vrijednost 0,3 javlja samo est puta, to je malo u odnosu na ukupan broj podataka.
Najbolji reprezentant podataka je medijana.
PRIMJER 3.4
Za visine uenika IIIc odjeljenja, potrebno je utvrditi deskripitive vrijednosti mod, medijanu i
aritmetiku sredinu. U tu svrhu koristit emo tabelu 3.4.1.
37
Tabela 3.4.1: Distribucija visina uenika IIIc odjeljenja
1.
Visina uenika
(cm)
rf
rf(%)
cf
rcf
rcf(%)
131
0,04
0,04
132
0,08
0,12
12
133
0,04
0,16
16
134
0,16
16
0,32
32
135
0,28
28
15
0,6
60
136
0,2
20
20
0,8
80
137
0,12
12
23
0,92
92
138
0,04
24
0,96
96
139
0,04
25
100
25
100
Mod
Rezultat sa najveom frekvencijom je X=135. Prema tome:
Mod = 135
2.
Medijana
Obzirom da su u Tabeli 3.4.1 rezultati poredani prema veliini (od 131 cm do 139 cm),
vrijednost medijane moemo utvrditi prema formuli za utvrivanje njenog poloaja u skupu
podataka (N+1)/2. Medijana se nalazi na 13. mjestu u nizu podataka poredanih prema veliini.
Uvidom u distribuciju kumulativnih frekvencija (cf) vidimo da rezultat 135 zauzima pozicije
od 9. do 15. mjesta. Prema tome, rezultat koji se nalazi na 13. mjestu i koji predstavlja
medijanu distribucije takoer iznosi 135 cm.
Do istog zakljuka smo mogli doi i uvidom u distribuciju kumulativnih relativnih frekvencija
u procentima [crf (%)]. Vidimo da je zakljuno sa rezultatom 134 u distribuciji akumulirano
32% rezultata. Ukljuenjem rezultata 135 akumulira se dodatnih 28%, tj. ukupno 60%
rezultata. Dakle, rezultat koji dijeli distribuciju na pola (50% donjih i 50% gornjih rezultata) je
upravo rezultat 135.
38
3.
Aritmetika sredina
Aritmetika sredina iznosi:
M
fX
i
3377
135,08
25
Vidimo da su tri izraunate deskriptive vrijednosti praktino jednake na temelju ega

zakljuujemo da je rije o distribuciji koju moemo opisati kao simetrinu.
39
PRIMJER 3.5
Nastavnik matematike u koli Grbavica II dao je uenicima treih razreda test iz
matematike, na kojem su uenici ostvarili rezultate (izraene kao broj skupljenih bodova, pri emu je
maksimalana broj bodova na testu iznosio 50) prikazane u tabeli grupiranih rezultata (tabela 3.5.1).
Tabela 3.5.1: Distribucija grupiranih rezultata

rezultat
rf
rf (%)
cf
crf
crf (%)
0-4
0,07
7,14
0,07
7,14
5-9
0,00
0,00
0,07
7,14
10-14
0,00
0,00
0,07
7,14
15-19
0,00
0,00
0,07
7,14
20-24
0,00
0,00
0,07
7,14
25-29
0,00
0,00
0,07
7,14
30-34
0,00
0,00
0,07
7,14
35-39
0,00
0,00
0,07
7,14
40-44
0,00
0,00
0,07
7,14
45-49
0,00
0,00
0,07
7,14
50-54
0,00
0,00
0,07
7,14
55-59
0,00
0,00
0,07
7,14
60-64
0,00
0,00
0,07
7,14
65-69
0,09
9,18
16
0,16
16,33
70-74
13
0,13
13,27
29
0,30
29,59
75-79
61
0,62
62,24
90
0,92
91,84
80-84
0,07
7,14
97
0,99
98,98
85-89
0,01
1,02
98
1,00
100,00
98
100
Nastavnik je odluio izraunati mjeru centralne tendencije koja najbolje reprezentira prosjenu
vrijednost. Izraunao je medijanu i aritmetiku sredinu.
1.
Medijana
Iz gornje tabele moe se zakljuiti da je 50% distribucije akumulirano u razredu sa graninim
vrijednostima 75 i 79 (do donje stvarne granice ovog razreda nalazi se 29,59% rezultata u
distribuciji, a do njegove gornje stvarne granice 91,84%; dakle, taka u kojoj se distribucija
40
dijeli na pola je negdje u intervalu izmeu rezultata 75 i 79). Na taj nain dobijamo vrijednosti
potrebne za formulu za odreivanje centralne vrijednosti (tj. 50. centila).
5
50 98
C 74,5
29
76,14
100
61
2.
Aritmetika sredina
Kako bi izraunao aritmetiku sredinu rezultata, nastavnik je svaki pojedini razred u grupiranoj
distribuciji predstavio njegovom srednjom vrijednou, koju je potom pomnoio sa
frekvencijom razreda, konano sumirajui dobivene vrijednosti.
Tabela 3.5.2. Srednje vrijednosti i frekvencije razreda

razred
Xf
0-4
14
5-9
10-14
12
15-19
17
20-24
22
25-29
27
30-34
32
35-39
37
40-44
42
45-49
47
50-54
52
55-59
57
60-64
62
65-69
67
603
70-74
72
13
936
75-79
77
61
4697
80-84
82
574
85-89
87
87
98
6911
total
41
Koristei formulu:
M
fX
i
Nastavnik je utvrdio konanu vrijednost aritmetike sredine: M = 70,52.

Obzirom da je medijana distribucije vea od aritmetike sredine (76,14 u odnosu na 70,52
razlika od skoro 6 bodova), nastavnik je zakljuio da je distribucija rezultata negativno asimetrina
(rezultati se u veoj mjeri grupiraju na desnoj strani distribucije; ekstremne vrijednosti se javljaju na
lijevoj strani distribucije, tj. idu prema negativnom kraju x ose, odakle i odrednica negativna
asimetrija). Iz tabele grupiranih rezultata, jasno je da 93% uenika ostvaruje rezultate izmeu 65 i 89
bodova, dok samo njih 7% ima rezultate nie od 4 boda te su oni i razlog nie aritmetike sredine
(uzrokuju da se ukupni uinak grupe ini slabijim nego to stvarno jeste). Iz tabele je takoer jasno
da je najvei broj uenika (njih ak 62,24%) postigao rezultat izmeu 75 i 79 bodova to je i
interval iz kojeg dolazi medijana. Dakle, zbog asimetrinosti distribucije, bolji pokazatelj postignua
uenika imaemo ako se oslonimo na medijanu, a ne na aritmetiku sredinu.
42
ZADACI
1. Ispod su prikazane vrijednosti ekstraverzije za 30 uenika.
20
10
14
20
15
15
15
15
15
23
16
16
17
17
18
21
18
19
19
20
20
20
14
21
18
21
23
23
16
Izraunajte mod, medijanu i aritmetiku sredinu.

2. Na istoj grupi uenika utvrene su i vrijednosti psihoticizma. Podaci su prikazani ispod.
4
13
Izraunajte mod, medijanu i aritmetiku sredinu.

3. U tabeli ispod prikazana je distribucija grupiranih rezultata.
Razred
0-4
5-9
14
10-14
12
15-19
20-24
Izraunajte medijanu i aritmetiku sredinu.

4. Na slici je prikazan histogram rezultata koje je grupa uenika postigla na testu znanja iz
matematike. Na osnovu histograma formirajte distibuciju grupiranih rezultata (veliina intervala
i=5), a zatim, iz grupiranih podataka, odredite medijanu i aritmetiku sredinu.
43
f 16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
0
12
17
22
27
32
37
x
5. Na osnovu distibucije grupiranih rezultata iz zadatka 3.4 grafikim putem odredite medijanu.
6. U tabeli ispod navedene su bosanskohercegovake rijeke i duine njihovih tokova (u km).
Rijeka
Duina toka (u km)
Sava
331
Una
212
Unac
58
Sana
140,4
Vrbas
192
Vrbanjka
70,5
Ukrina
53,3
Bosna
271
Krivaja
65,5
Sprea
112,3
Usora
77
Tolisa
56,2
Tinja
69
Drina
346
ehotina
33
Lim
40
Praa
57
Drinjaa
78,5
Janja
53,3
Neretva
218
Trebinjica
96,5
44
Koliko iznosi prosjena duina toka gore navedenih rijeka? Izraunajte aritmetiku sredinu i
medijanu. Koju mjeru centralne tendencije biste izabrali za odgovor na pitanje o prosjenoj
duini toka gore navedenih rijeka?
7. U tabeli ispod navedena su povrine bosanskohercegovakih jezera (u km2).
Jezero
Povrina (u km2)
Buko
55,8
Blidnje
3,2
Borako
0,26
Jablaniko
13,3
Modrac
17,1
Plivsko
1,15
Peruako
12,4
Ramsko
15,3
Zvorniko
8,1
Koliko iznosi prosjena povrina gore navedenih jezera?

8. Izraunajte mod, medijanu i aritmetiku sredinu za podatke iz zadatka 2.1. ta na osnovu
izraunatih vrijednosti mjera centralne tendencije moete zakljuiti o distribuciji rezultata? Koja
mjera centralne tendencije najbolje reprezentira skup podataka?
9. Izraunajte mjere centralne tendencije za podatke iz zadatka 2.2.
10. Izraunajte medijanu i aritmetiku sredinu za podatke iz zadatka 2.3.
11. Koristei stablo i listovi prikaz iz zadatka 2.6 odredite mod i medijanu za ene i mukarce.
12. Nastavnik fizike u O Sigmund Freud je uenicima estih razreda (ukljuujui i VIa razred)
zadao test. Uenici su ostvarili sljedee rezultate (izraene kao broj skupljenih bodova;
maksimalan broj bodova iznosio je 50):
45
Broj bodova na
testu iz fizike
25
26
27
28
29
30
33
34
35
36
10
37
19
38
19
39
40
41
45
total
98
a. Utvrdite vrijednost moda za gornju distribuciju.

b. Grupirajte distribuciju frekvencija gornijih rezultata te izraunajte vrijednost medijane i
aritmetike sredine.
c. Nainite grafiki prikaz distribucije.
d. Opiite distribuciju (posebno obratite panju na izbor mjere centralne tendencije koja
najpreciznije reprezentira distribuciju).
13. Nastavno vijee O Sigmund Freud je roditeljima uenika estih razreda potom poslalo
anketni upitnik sa ciljem da prikupi preciznije informacije o socijalno-ekonomskom statusu
porodica iz kojih dolaze njihovi uenici. Upitnik je sadravao i pitanja o mjesenim primanjima
svakog od roditelja uenika (pri tome je roditeljima garantirana stroga diskrecija datih odgovora).
Ispod su prikazani prikupljeni odgovori o mjesenim primanjima majki uenika, zaokrueni na
jedinice od 50 KM (N=98).
46
Mjesena primanja
Mjesena primanja
majki uenika (KM)
majki uenika (KM)
350
950
400
1.000
450
1.050
500
1.100
550
1.150
600
1.200
650
1.250
700
1.350
750
1.400
800
7.550
850
8.000
900
13
10.600
a. Utvrdite vrijednost moda, medijane i aritmetike sredine za gornju distribuciju.

b. Nainite grafiki prikaz distribucije.
c. Opiite distribuciju (posebno obratite panju na izbor mjere centralne tendencije koja
najpreciznije reprezentira distribuciju; obrazloite svoj izbor).
19. Ispitivanjem znanja iz Statistike u psihologiji na grupi od 30 studenata dobiveni su sljedei
rezultati:
121
132
119
126
110
122
121
130
113
123
114
123
117
124
120
129
114
123
117
124
119
125
124
118
125
120
128
119
127
116
Izraunajte mjere centralne tendencije.
47
20. Kako bi se ispitao efekat supstance QWR11 na psihomotorne sposobnosti, ispitanicima su

najprije utvrene psihomotorne sposobnosti, zatim su primili odgovarajuu dozu QWR11, te su
ponovo izmjerene psihomotorne sposobnosti. Rezultati dva mjerenja prikazani su ispod.
Ispitanik
10
11
12
13
14
15
Prije
43
20
17
30
25
19
34
28
23
41
26
40
16
23
34
poslije
45
16
20
33
30
19
33
25
26
40
28
36
15
26
32
Grafiki prikaite distribucije rezultata. Izraunajte mjere prosjeka.
48
4. Mjere varijabiliteta
Pored tendencije grupiranja podataka oko neke srednje vrijednosti, postoji i tendencija
variranja tj. rasprenja podataka oko srednje vrijednosti. Stoga u numerikoj deskripciji skupa
podataka, pored mjere centralne tendencije koristimo i mjere varijabiliteta. Sljedei primjer ilustrira
nunost da pored mjere centralne tendencije treba odrediti i mjeru varijabiliteta.
U skupovima podataka A i B Mod = C = M = 70.
A:
53 62
70 70
75 78
82
B:
10 20
50 70
70 120
150
Numerika deskripcija na temelju mjere centralne tendencije moe nas navesti na pogrean zakljuak da se
radi o slinim skupovima. Zapravo, podaci se prilino razlikuju. Raspon rezultata skupa B znatno je vei od
raspona rezultata skupa A.
Koristimo razliite mjere varijabiliteta: broj kategorija, raspon rezultata, inerkvartilni

raspon, varijancu i standardnu devijaciju.
Raspon rezultata je razlika izmeu najvee i najmanje vrijednosti u skupu podataka.
Raspon = Xmax - Xmin
Za skup podataka: x=(53,62,70,70,75,78,82), razlika izmeu najvieg i najnieg rezultata je: 82 53 = 29.
Dakle, raspon rezultata iznosi 29.
Na osnovu raspona rezultata ne moemo saznati nita o raspodjeli podataka unutar raspona
jer se raspon rauna samo preko ekstremnih vrijednosti.
U skupovima podataka A i B raspon je jednak i iznosi 70. U skupu B vei broj rezultata grupiran je oko
centralne vrijednosti.
A:
10 20
50 60
70 80
B:
10 50
50 50
50 80
Interkvartilni raspon (ili rasprenje) je raspon u kojem se nalazi 50% sredinjih rezultata.
Za razliku od raspona rezultata interkvartilni raspon nije osjetljiv na ekstremne rezultate. Za
49
odreivanje kvartilnog rasprenja, podatke treba poredati po veliini, od najmanjeg do najveeg.

Zatim se odrede rezultati koji distribuciju dijele na etiri jednaka dijela. Prvi takav rezultat naziva se
prvi kvartil (oznaava se sa Q1) i distribuciju dijeli tako da je ispod (tj. 25%) najniih rezultata, a
iznad (75%) viih rezultata. Drugi utvreni rezultat distribuciju dijeli na dva jednaka dijela
(centralna vrijednost). Trei rezultat naziva se trei kvartil (oznaava sa Q3), i distibuciju dijeli
tako da je ispod ovog rezultata , tj 75% niih rezultata, a iznad , tj. 25% najviih rezultata.
Interkvartilini raspon izraunava se preko razlike Q3 i Q1, tj:
IQR= Q3 - Q1
Poluinterkvartilni raspon izraunava se kada kvartilni raspon podijelimo sa dva:
SQR=( Q3 - Q1)/2,
i predstavlja grubu procjenu prosjene udaljenosti izmeu medijane i prvog kvartila i izmeu
medijane i treeg kvartila.
Dati su skupovi podataka A i B.
A:
B:
A) Skup emo podijeliti na dva jednaka dijela.

Prva polovina: 1, 2, 5; druga polovina: 6, 7, 8.
Prvi kvartil je medijana prve polovine, Q1=2; trei kvartil je medijana druge polovine, Q3=7. Interkvartilni
raspon jednak je: QR=7-2=5; SQR=2,5
B) Skup emo podijeliti na dva dijela (medijana skupa je iskljuena):
Prva polovina: 1, 3, 4; druga polovina: 5, 7, 8.
Q1=3; Q3=7. Interkvartilni raspon jednak je: QR=7-3=4; SQR=2
Standardna devijacija i varijanca su mjere varijabiliteta koje se temelje na udaljenostima

svakog rezultata od aritmetike sredine. Varijanca skupa podataka je prosjek kvadriranih
odstupanja rezultata od aritmetike sredine:
v
(X
- M)2
N-1
50
Standardna devijacija jednaka je drugom korijenu iz varijance:
(X
M)2
N1
Za skup podataka: x=(1,2,3,5,6,7), varijanca i standardna devijacija iznose:

v
(X
- M) 2
N-1
(1 4) 2 (2 4) 2 (3 4) 2 (5 4) 2 (6 4) 2 (7 4) 2
5,6
6 1
v=5,6; s=2,37
Standardnu devijaciju statistiki je opravdano raunati kada je: distribucija rezultata normalna
ili barem simetrina i kada je koritena intervalna ili racio skala mjerenja.
Varijabilnost podataka utie na spljotenost distribucije. to je rasprenje vee, spljotenost je
vea i obratno - to je rasprenje manje, spljotenost je manja. S obziron na rasprenost, distribucije
mogu biti platokurtine (spljotene) i leptokurtine (izduene).
Platokurtina
leptokurtina
Kao mjeru spljotenosti (ili izduenosti) distribucije koristimo kurtozis (eng. kurtosis):
kurtozis
N(N - 1)
(Xi M)4 3(N 1)2
(N - 2)(N - 3) (N 1) s 4
(N 2)(N 3)
Ako je vrijednost kurtozisa pozitivna, distribucija je leptokurtina. Ako je vrijednost kurtozisa

negativna, distribucija je platokurtina. Ako je vrijednost kurtozisa 0, distribucija je simetrina.
Kako je to sluaj i kod skjunisa, sama vrijednost kurtozisa ne ukazuje na odstupanja oblika
distribucije. Naime, potrebno je odrediti standardnu pogreku kurtozisa!
Koristan nain numerikog sumiranja podataka je navoenje pet vrijednosti koje pruaju
vane informacije o distribuciji. Te vrijednosti su: medijana, prvi kvartil, trei kvartili, minimalna i
maksimalna vrijednost. Ovaj nain numerike deskripcije podakata naziva se sumiranje sa pet
brojeva. Sumiranje skupa podataka sa pet brojeva moe se transformisati u grafiki prikaz kojeg
nazivamo box-plot prikaz.
51
Maksimalna vrijednost
7
6
Trei kvartil, Q3
Medijana, C
4
3
Prvi kvartil, Q1
2
1
Minimalna vrijednost
Krajevi pravougaonika predstavljaju kvartile, a linija koja dijeli pravougaonik medijanu. U

sluaju kada je distribucija rezultata simetrina (kao to je ovdje sluaj) linija koja predstavlja
medijanu dijeli pravougaonik na dva jednaka dijela. Minimalni i maksimalni rezultat oznaeni su
krajevima linija okomitih na pravougaonik.
S obzirom da box-plot prikaz na jednostavan i ekonomian nain prua uvid u oblik
distribucije (simetrinost i spljotenost), predstavlja popularan nain sumiranja rezultata dobivenih u
istraivanju.
Kao i kod mjera centralne tendencije, izbor mjera varijabiliteta zavisi od skale mjerenja i
oblika distribucije. Ako je koritena nominalna skala mjerenja kao mjeru varijabiliteta koristimo broj
kategorija. Kod podataka dobivenih ordinalnom skalom mjerenja koristimo poluinterkvartilni raspon
(SQI). Kada su podaci dobiveni na intervalnoj ili racio skali mjerenja, kao mjeru varijabiliteta
koristimo varijancu, tj. standardnu devijaciju (ali samo ukoliko je distribucija simetrina); u
protivnom koristimo poluinterkvartilni raspon. Ispod je dat shematski prikaz izbora mjera
varijabiliteta.
52
Mjera varijabiliteta
Koja skala
mjerenja je
koritena?
Nominalna
Broj
Intervalna
ili racio
Ordinalna
ne
SQR
kategorija
Da li je
distribucija
simetrina?
da
Varijanca,
standardna devijacija
53
PRIMJER 4.1
Za podatke iz primjera 1.3 izraunat emo interkvartilni raspon i standardnu devijaciju, a skup
podataka opisat emo sa pet brojeva. Rezultati (broj tanih odgovora na Testu znanja iz statistike)
prikazani su ispod.
24
27
32
20
20
15
20
20
19
22
18
22
27
28
15
20
14
24
24
19
Kao i kod izraunavanja mjera centralne tendencije, podatke emo najprije urediti koristei
distribuciju negrupiranih rezultata (prikazanu u tabeli ispod).
a.
rezultat
14
15
18
19
20
22
24
27
28
32
total
20
Interkvartilni raspon
Skup podataka sastoji se od 20 rezultata. Ovaj skup podijelit emo na dva jednaka dijela:
I dio: 14, 15,15,18,19,19, 20, 20, 20, 20;
II dio: 20, 22, 22, 24, 24, 24, 27, 27, 28, 32
Rezultat koji distribuciju prvog dijela skupa dijeli na dva jednaka dijela iznosi 19 to je prvi
kvartil; rezultat koji drugi dio skupa dijeli na dva jednaka dijela iznosi 24 to je trei kvartil.
Odnosno, Q1=19; Q3=24. Interkvartilni raspon iznosi:
54
QR= Q3 - Q1=24-19=5
IQR=5
b.
Standardna devijacija
Standardnu devijaciju odredit emo preko izraza:

s
(X
M)2
N1
S obzirom da se pojedini rezultati pojavljuju vie puta, gornjem izrazu dodat emo vrijednosti
frekvencija i dobiti sljedeu formulu:
s
fX
f
i
M2
Odredit emo vrijednosti koje treba uvrstiti u gornji izraz.

rezultat
fX
f X2
14
14
196
15
30
450
18
18
324
19
38
722
20
100
2000
22
44
968
24
72
1728
27
54
1458
28
28
784
32
32
1024
fi=20
fiX=430
fi X2=9654
Standardna devijacija iznosi:

s=4,43
55
c.
Pet brojeva
Pet brojeva: Xmin=14; Xmax=32; C=20; Q1=19; Q3=24
Ispod je dat box-plot prikaz. Iz grafikog prikaza moemo proitati gore navedene vrijednosti,
ali i neke informacije o distribuciji rezultata. Najprije, uoit emo krui, kojim se oznaava
ekstremna vrijednost. Ekstremne vrijednosti potrebno je posebno tretirati, te je njihova
detekcija u deskripciji rezultata izuzetno vana. Linija koja oznaava medijanu smjetena je
znatno blie prvom kvartilu i oigledno je da distribucija nije simetrina. Od prvog kvartila do
medijane udaljenost je: C-Q1=20-19=1. Udaljenost od medijane do treeg kvartila iznosi: Q3C=24-20=4. U rasponu od 19 do 20 nalazi se 25% rezultata (ispod medijane), a isti broj
rezultata nalazi se u rasponu od 20 do 24 (iznad medijane). Dakle, raspon od 4 obuhvata
jednak broj rezultata kao i raspon od 1.
33
32
31
30
29
28
27
26
25
24
23
22
21
20
19
18
17
16
15
14
13
56
PRIMJER 4.2
Za podatke iz primjera 3.1 odredite standardnu devijaciju i interkvartilni raspon.
razred
fX
f X2
6-9
7,5
15
112,5
10-13
11,5
57,5
661,3
14-17
22
15,5
341
5286
18-21
40
19,5
780
15210
22-25
22
23,5
517
12150
26-29
27,5
165
4538
30-33
31,5
94,5
2977
fi X2 =40933
fi =100
Vrijednosti fi X2 i fi uvrstit emo u formulu i izraunati standardnu devijaciju.
fX
f
M2
s= 4,61
Interkvartilni raspon iz grupiranih podataka moemo odrediti na dva naina: raunskim
postupkom ili oitavanjem iz grafikog prikaza.
Za izraunavanje prvog i treeg kvartila potrebno je formirati distribucije kumulativne i
procentualne relativne kumulativne frekvencije, to je i uraeno u tabeli ispod.
razred
cf
rcf(%)
6-9
2%
10-13
7%
14-17
22
29
29%
18-21
40
69
69%
22-25
22
91
91%
26-29
97
97%
30-33
100
100%
total
100
57
Prvi i trei kvartil izraunat emo primjenom sljedee formule:

centil N
i
X D
fD
100
fR
odnosno,
25 N
i
Q1 D
fD
100
fR
75 N
i
Q3 D
fD
100
fR
gdje je:
Q1, Q3 traeni rezultati (prvi i trei kvartil)
D prava donja granica razreda u kojem je prvi i trei kvartil,
fD ukupan broj rezultata ispod razreda u kojem je prvi i trei kvartil,
fR broj rezultata u razredu u kojem je prvi i trei kvartil,
i interval.
Prvi kvartil nalazi se u razredu 14-17. Prava donja granica ovog razreda je D=13,5; u razredu
se nalazi fR=22 rezultata; do razreda 14-17 ukupno je fD =7 rezultata; interval razreda iznosi i=4.
25 100
4
Q 1 13,5
7
16,77
100
22
Trei kvartil nalazi se u razredu 22-25. Prava donja granica ovog razreda je D=21,5; u razredu
se nalazi fR=22 rezultata; do razreda 14-17 ukupno je fD =69 rezultata; interval razreda iznosi i=4.
75 100
4
Q 3 21,5
69
22,23
100
22
Interkvartilni raspon iznosi:

IQR=22,23-16,77; IQR=5,45
Udaljenost od medijane do prvog kvartila iznosi: 19,6 16,77 = 2,83, slino kao i udaljenost
od medijane do treeg kvartila: 22,23 19,6 = 2,63. Ovakve vrijednosti mogli smo i oekivati
obzirom na simetrinost distribucije. U sluaju idealno simetrine distribucije, ove dvije udaljenosti
bile bi identine.
Grafiko odreivanje kvartila radimo pomou procentualne ogive (slika ispod). Obzirom da
prvi kvartil dijeli distibuciju na dva dijela, tako da je ispod 25%, a iznad 75% rezultata, potrebno je
na apscisi (x) oitati rezultat koji odgovara 25-om procentu na ordinati (rcf %). Slino tome, kako
58
trei kvartil dijeli distibuciju na dva dijela, tako da je ispod 75%, a iznad 25% rezultata, potrebno je
na apscisi (x) oitati rezultat koji odgovara 75 procentu na ordinati (rcf %). Na apscisi oitavamo da
je Q1=16,7 i Q3=22,2. Kao i kod odreivanja medijane, itav postupak radi se na milimetarskom
papiru na kojem moemo oitati tanu vrijednost.
rfc%
100
29,5; 97
90
33,5; 100
25,5; 91
80
70
21,5; 69
60
50
40
30
17,7; 29
20
10
13,5; 7
5,5; 0
0,0
5,0
9,5; 2
10,0
15,0
20,0
25,0
30,0
35,0
40,0
X
PRIMJER 4.3
Na dvije lokacije ireg gradskog podruja biljeene su brzine 70 automobila (mjerenja su
uraena u istom periodu dana). U tabeli ispod prikazani su dobiveni podaci.
Brzina (km/h)
fA
fB
0 - 20
14
21 - 40
18
41 - 60
20
61 - 80
13
30
81 - 100
20
101 - 120
totali
70
70
U ovom primjeru elimo numeriki opisati podatke. Stoga se nuno nameu dva pitanja, a to
su: (1) Koje mjere centralne tendencije i varijabiliteta je potrebno odrediti? i (2) ta moemo
zakljuiti na osnovu dobivenih rezultata?
Prvo to uoavamo iz tabelarnog prikaza jeste da su distribucije frekvencija asimetrine, pa je
u ovom sluaju opravdano izraunati medijanu, uz koju se kao mjera varijabiliteta izraunava
interkvartilni raspon.
59
Iz grafikog prikaza procentualnih ogiva odredit emo medijanu, prvi i trei kvartil za dvije
lokacije.
100%
rcf% 90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
0
20,5
40,5
60,5
80,5
100,5
120,5
X
Lokacija A
Lokacija B
Vrijednosti medijane, prvog i treeg kvartila koje smo oitali iz grafika navedene su u tabeli
ispod.
A
Q1
25,1
62,9
46,0
75,2
Q3
65,8
89,4
Prosjena brzina automobila na lokaciji B (C=75,2 km/h) vea je od prosjene brzine na

lokaciji A (C=46,0 km/h). Meutim, interkvartilni raspon znatno je vei na lokaciji A (25,1 km/h
65,8 km/h) u odnosu na lokaciju B (62,9 km/h 89,4 km/h). Dakle, automobili na lokaciji A se u
prosjeku kreu sporije, ali uz veu varijaciju brzina, za razliku od lokacije B, gdje se automobili
kreu bre, ali uz manju varijaciju brzina.
PRIMJER 4.4
Na slici ispod dati su box-plot prikazi rezultata koje je jedna grupa ispitanika postigla na tri
testa (T1, T2 i T3). Svaki test sadri 20 zadataka, tako da je ispitanik mogao osvojiti maksimalno 20
bodova. Na osnovu grafikog prikaza odredit emo teine testova.
60
20
18
16
14
12
10
8
6
4
2
0
T1
T2
T3
T1
T2
T3
Teinu testa moemo odrediti prema broju ispitanika koji tano rjeavaju zadatke. to je vei
broj ispitanika koji tano rjeavaju zadatke, to je test laki, i obratno, to je manji broj ispitanika koji
tano rjeavaju zadatke, to je test tei. Kod testa prosjene teine, podjednak je broj ispitanika ispod
i iznad prosjene vrijednosti.
Kako bi odredili teine testova, posmatrat emo razlike u distribuciji rezultata na tri testa, te
utvrditi vrijednosti medijane, prvog i treeg kvartila. Iz box-plot prikaza oitat emo vrijednosti
medijane te prvog i treeg kvartila.
T1
T2
T3
Q1
5,25
2,0
5,25
10,5
6,5
14,0
Q3
15,75
14,75
19,0
Primjeujemo da su udaljenosti izmeu medijane i prvog, odnosno treeg kvartila razliite za

T1, T2, T3.
Ukoliko je Q3CCQ1, tada je distribucija simetrina (ili gotovo pa simetrina) i box-plot
podataka izgleda kao to je prikazano na slici pod T1. Linija koja oznaava medijanu nalazi se
tano na sredini pravougaonika. Izaunavanjem udaljenosti izmeu medijane i prvog te drugog
kvartila uvjerit emo se da su jednake (5,25). Ispod i iznad medijane jednak je broj rezultata.
Ukoliko je Q3C>CQ1, distribucija podataka je pozitivno asimetrina. Udaljenost od
medijane do treeg kvartila (8,25) vea je u odnosu na udaljenost izmeu medijane i prvog kvartila
(4,25). Izgleda kao da je gornji dio distribucije (uslovno reeno, pozitivan kraj) razvuen.
Ukoliko je Q3C<CQ1, za distribuciju kaemo da je negativno asimetrina. Distribucija
rezultata na testu 3 je negativno asimetrina. Udaljenost od medijane do prvog kvartila (8,75) vea
je u odnosu na udaljenost izmeu medijane i treeg kvartila (5). Izgleda kao da je donji dio
distribucije (uvjetno reeno, negativan kraj) razvuen.
61
I duine linija koje spajaju pravougaonik sa graninikom koji predstavlja najvii, odnosno
najnii rezultat, ukazuju na simetrinost tj. asimetrinost rezultata. Ako je gornja linija dua od
donje, vjerovatno se radi o pozitivno asimetrinoj distribuciji. Ukoliko je donja linija dua od
gornje, onda je distribucija rezultata vjerovatno negativno asimetrina. Upravo takve odnose
uviamo i u naem primjeru.
Na osnovu distribucije rezultata moemo zakljuiti da je test 2 tei u odnosu na test 3, dok za
test 1 moemo tvrditi da je prosjene teine. Na testu 2 postignut je vei broj niih rezultata, dok je
na testu 3 postignut vei broj viih rezultata.
PRIMJER 4.5
Za utvrene visine uenika naeg IIIc odjeljenja, nakon to su utvrene mjere centralne
tendencije, potrebno je utvrditi i pokazatelje varijabiliteta. Obzirom da je rije o distribuciji koja se
svojim oblikom pribliava simetrinoj, u ovom sluaju mogu se izraunati sve mjere varijabiliteta.
Mi smo se odluili za utvrivanje interkvartilnog i poluinterkvartilnog raspona, standardne
devijacije te varijance. U tu svrhu ponovo e nam posluiti tabelarni prikaz distribucije visina
uenika:
Visina uenika
(cm)
rf(%)
cf
rcf(%)
131
132
12
133
16
134
16
32
135
28
15
60
136
20
20
80
137
12
23
92
138
24
96
139
25
100
25
100
Iako se radio o negrupiranoj distribuciji rezultata, postupak raunanja kvartila praktino je isti
kao i kod grupiranih frekvencija rezultata.
62
Za odreivanje poluinterkvartilnog rasprenja najprije emo odrediti Q1 i Q3, koristei

sljedee izraze:
25 N
i
Q1 D
fD
100
fR
75 N
i
Q3 D
fD
100
fR
25 25
1
Q 1 133,5
4
100
4
75 25
1
Q 3 135,5
15
100
5
Q1 = 134,06; Q3 = 136,25.
Interkvartilni raspon iznosi:
IQR = Q3 Q1
IQR = 136,25 - 134,06 = 2,19
Poluinterkvartilni raspon iznosi: SIQR= IQR/2=2,19/2=1,09.
Interkvartilni raspon obuhvata 50% sredinjih rezultata. U naem primjeru, 50% uenika
visoki su izmeu 134,06 i 136,25.
Standardnu devijaciju distribucije visina uenika emo izraunati prema izrazu:
fX
f
i
M2
Od ranije nam je poznato da aritmetika sredina distribucije iznosi 135,08 cm. Tabelarnom
prikazu distribucije podataka dodat emo stupce koji e nam posluiti za odreivanje standardne
devijacije:
63
Visina uenika
(cm)
X-M
(X-M)2
(X-M)2xf
131
-4,08
16,65
16,65
132
-3,08
9,49
18,97
133
-2,08
4,33
4,33
134
-1,08
1,17
4,67
135
-0,08
0,01
0,04
136
0,92
0,85
4,23
137
1,92
3,69
11,06
138
2,92
8,53
8,53
139
3,92
15,37
15,37
25
83,84
Standardna devijacija iznosi:

s = 1,83 cm.
Varijanca visina uenika IIIc oko njihove aritmetike sredine iznosi:
v = s2 = 1,832 = 3,35 cm
Jasniju predstavu o varijanci rezultata oko njihove aritmetike sredine, tj. o izraenosti
variranja vrijednosti u distribuciji moe nam pruiti i grafiki prikaz. Na slici ispod svaki od uenika
IIIc odjeljenja predstavljen je kruiem.
64
Na slici jo jednom vidimo da se distribucija moe smatrati simetrinom te da je variranje

rezultata relativno malo vidimo da je u distribuciji zastupljeno malo razliitih rezultata (samo 9
moguih vrijednosti) koji se kreu u razmjerno malom rasponu.
PRIMJER 4.6
Uitelj u O Grbavica II eli utvrditi varijabilitet (preciznije, interkvartilni i
poluinterkvartilni raspon, standardnu devijaciju i varijancu) distribucije rezultata koje su uenici
treih razreda postigli na testu znanja iz matematike (vidi primjer 3.5). U tu svrhu nastavnik je
nainio sljedei tabelarni prikaz distribucije:
razred
cf
crf (%)
Sr. vr. razreda (X)
X2
f * X2
0-4
28
5-9
49
10-14
12
144
15-19
17
289
20-24
22
484
25-29
27
729
30-34
32
1024
35-39
37
1369
40-44
42
1764
45-49
47
2209
50-54
52
2704
55-59
57
3249
60-64
62
3844
65-69
16
16
67
4489
40401
70-74
13
29
30
72
5184
67392
75-79
61
90
92
77
5929
361669
80-84
97
99
82
6724
47068
85-89
98
100
87
7569
7569
98
524127
65
Za izraunavanje interkvartilnog i poluinterkvartilnog rasprenja koristit emo sljedee izraze:
25 N
i
Q1 D
fD
100
fR
75 N
i
Q3 D
fD
100
fR
Iz kolone rcf (%) oitavamo da se 25% distribucije formiralo u razredu 70 74, a 75%
distribucije odmah u narednom razredu 75 79 (iz ega je odmah jasno da nije rije o simetrinoj
distribuciji). Prema tome:
25 98
5
Q 1 69,5
16
72,77
100
13
75 98
5
Q 3 74,5
29
78,15
100
61
Interkvartilno rasprenje iznosi:

IQR = Q3 Q1 = 78,15 72,77 = 5,38
Poluniterkvartilno rasprenje iznosi:
SQR=IQR/2=2,69
Za izraunavanje standardne devijacije moe se upotrijebiti formula:
fX
f
i
M2
524127
70,522 19,37 (bodova)
98
Aritmetika sredina poznata je od ranije (vidi poglavlje 3) i iznosi 70,52 bodova.

Varijanca je jednaka kvadratu vrijednosti standardne devijacije, tj:
v = 19,372 = 375,16 (bodova)
66
ZADACI
1. Izraunajte interkvartilni raspon i standardnu devijaciju za podatke iz zadatka 3.1.
5. Na osnovu distribucije grupiranih rezultata iz zadatka 4. grafikim putem odredite interkvartilni
raspon.
9. Ispod su dati rezultati testiranja znanja iz matematike grupe od 20 uenika.
A
14
36
16
10
12
13
15
17
19
13
12
12
14
25
15
19
16
19
17
20
18
15
16
19
17
25
14
25
Najprije odredite koju mjeru varijabiliteta treba izraunati (s obzirom na distribucije rezultata), a
zatim ih izraunajte.
10. Na grupi od 20 studenata primjenjen je upitnik kojim se mjeri srameljivost. Dobiveni rezultati
prikazani su ispod.
1
10
10
13
13
15
16
16
17
40
Izraunajte aritmetiku sredinu i standardnu devijaciju.

U skupu podataka rezultat 40 je ekstremna vrijednost. Izraunajte aritmetiku sredinu i
standardnu devijaciju, ali nakon to ste iz skupa podataka iskljuili rezultat 40. ta primjeujete?
Na koji nain ekstremne vrijednosti utjeu na aritmetiku sredinu i standardnu devijaciju?
67
11. Za pet grupa podataka izraunate su vrijednosti prvog kvartila, centralne vrijednosti i treeg
kvartila. Na osnovu prikazanih vrijednosti, ta moete zakljuiti o obliku distribucije? Da li su
distribucije simetrine, ako nisu o kojoj se simetriji radi? U kojoj grupi podataka je najvea
varijabilnost rezultata?
I
II
III
IV
Q1
10
10
Q3
13
15
20
Pretpostavimo da se prva grupa podataka sastoji od deset rezultata. Jedan, maksimalni, je

izgubljen, tako da znamo da se radi o sljedeih devet: 1, 2, 3, 3, 10, 10, 13, 13, 15. Da li na
osnovu izraunatih vrijednosti (prvi, trei kvartili i C) moemo odrediti o kojem se rezultatu
radi? Ako znamo da je za ovu grupu podataka aritmetika sredina M=8,6 te standardna devijacija
s=5,8, da li moemo odrediti o kojem rezultatu se radi? Obrazloite odgovor i, ukoliko je
mogue, odredite rezultat koji nedostaje.
12. Ispod su prikazani histogrami distribucije rezultata ispitanika na etiri testa (A, B, C, D).
20
18
16
14
12
f 10
8
6
4
2
0
20
16
14
12
f 10
8
6
4
2
0
18
12 16 20 24 28 32 36 40
12 16 20 24 28 32 36 40
20
20
18
16
14
12
10
8
6
4
2
0
18
16
14
12
f 10
8
6
4
2
0
0
0
12 16 20 24 28 32 36 40
12 16 20 24 28 32 36 40
Odredite kojem box-plot prikazu pripadaju gore prikazani histogrami.
68
42
40
38
36
34
32
30
28
26
24
22
20
18
16
14
12
10
8
6
4
2
0
T1
T1
T2
T3
T3
T2
T4
T4
13. Izraunajte interkvartilni raspon, varijancu i standardnu devijaciju za podatke iz zadatka 3.10 i
3.11.
14. Izraunajte interkvartilni raspon, standardnu devijaciju i varijancu za podatke iz zadatka 3.12.
Imajui u vidu dobivene vrijednosti varijance i standardne devijacije, jo jednom razmislite o
najpogodnijoj mjeri centralne tendencije distribucije.
15. Izraunajte interkvartilni raspon, varijancu i standardnu devijaciju za podatke iz zadatka 3.13.
16. Izraunajte mjere varijabiliteta za podatke iz primjera 2.2 i 2.9. Koju mjeru varijabiliteta trebamo
koristiti za adekvatnu deskripciju podataka svake od varijabli.
69
5. Osnovni koncepti vjerovatnoe
Teorija vjerovatnoe je grana matematike iz koje je nastala matematika statistika.

Zakljuivanje u statistici temelji se na vjerovatnoi. Zakljuak kojim se prihvata ili odbacuje
hipoteza donosi se uz vjerovatnou da moda nismo u pravu. U tekstu ispod navest emo osnovne
koncepte vjerovatnoe.
Postoje klasina, geometrijska, statistika (aksiomatska) i subjektivna definicija vjerovatnoe.
Subjektivna vjerovatnoa je vjerovanje osobe u mogunost (izvjesnost) pojave nekog dogaaja
(npr. Mislim da e sutra padati kia). Ova vjerovatnoa se ne temelji na matematikim modelima
ili definiciji ve na osobnom iskustvu.
Klasina (Laplaceova) definicija vjerovatnoe
Sluajni eksperiment ima konaan broj (n) svih moguih ishoda, pri emu svaki od moguih
ishoda ima jednaku mogunost pojavljivanja (tj. svi ishodi su jednako vjerovatni). Svi mogui ishodi
sluajnog eksperimenta tvore potpuni skup . Svaki dogaaj u sluajnom eksperimentu je podskup
A skupa svih moguih ishoda (A). Ako je skup svih moguih ishoda n-lani skup, a sluajni
dogaaj m-lani podskup A, onda se openito vjerovatnoa dogaaja A definira kao omjer broja
sluajnih dogaaja (m) i broja svih moguih ishoda (n).
Vjerovatnoa se definira kao omjer broja povoljnih i broja svih moguih ishoda eksperimenta.
Vjerovatnoa sluajnog dogaaja izraava se realnim brojem izmeu 0 i 1, ukljuujui 0 i 1, tj
0P(A)1.
Vjerovatnoa se definira izrazom:
m
P(A)=
n
Ako je sluajni eksperiment bacanje igrae kocke, skup svih moguih ishoda bit e = {1,2,3,4,5,6}. Dogaaj
za kojeg elimo utvrditi vjerovatnou je pojava parnog broja. Stoga je podskupa A={2,4,6}. Postoji n=6 svih
moguih ishoda, od kojih je m=3 povoljnih za dogaaj A. Tada je P(A) =3/6
P(A)=0,5
Vjerovatnoa dogaaja A iznosi 0,5
Kada je skup svih moguih ishoda beskonaan skup, klasina definicija vjerovatnoe nije
primjenljiva.
70
Klasini (kao i geometrijski) model vjerovatnoe temelje se na pretpostavci da su svi ishodi

jednako mogui. U mnogim sluajnim pojavama u prirodi i drutvu ova pretpostavka nije realna.
Statistika definicija vjerovatnoe
Statistika definicija vjerovatnoe temelji se na empirijskoj spoznaji o stabilnosti relativnih
frekvencija sluajnih dogaaja kod ponavljanja eksperimenata. Frekvencija dogaaja A pri n
ponavljanja sluajnog eksperimenta je broj m pojavljivanja dogaaja A. Omjer frekvencije (m)
dogaaja A i broj (n) ponavljanja sluajnog eksperimenta zove se relativna frekvencija dogaaja A:
m
fA=
Ako se sluajni eksperiment sastoji od bacanja igrae kocke, onda se uzastopno bacanje smatra ponavljanjem
sluajnog eksperimenta (u istim uvjetima). Neka je pojava parnog broja dogaaj A. Ako se nakon 100 uzastopnih bacanja kocke dogaaj A ostvari 45 puta, kaemo da je frekvencija m=45. Tada je fA=45/100.
fA=0,45
Relativna frekvencija zavisi, osim o dogaaju A, i o broju ponavljanja sluajnog

eksperimenta. Za velike n, tj. pri velikom broju ponavljanja eksperimenta (ili opaanja), relativna
frekvencija prestaje zavisiti od n i stabilizira se na odreenu fiksnu vrijednost koja se interpretira kao
statistika vjerovatnoa dogaaja A.
Praktino, relativna frekvencija se koristi kao vjerovatnoa dogaaja A, pri emu se nastoji
postii to je mogue vei broj (n) opaanja sluajne pojave.
Osnovne teoreme vjerovatnoe

Dvije osnovne teoreme vjerovatnoe, relevantne za uvod u statistiku su aditivna i
multiplikaciona teorema.
1. Aditivna teorema
Za meusobno iskljuive dogaaje A1 i A2 vjerovatnoa da e se dogoditi ili A1 ili A2, jednaka
je sumi vjerovatnoa za svaki dogaaj posebno:
P(A1 A2) = P(A1) + P (A2)
U kutiji se nalaze tri bijele, sedam crvenih i jedna crna kuglica. Kolika je vjerovatnoa da emo iz kutije
izvaditi bijelu/ crvenu/ crnu kuglicu?Kolika je vjerovatnoa da emo iz kutije izvaditi ili bijelu ili crvenu
kuglicu?
71
P (A1) = 3/11
P (A2) = 7/11
P (A3) = 1/11
P(A1 A2) = P(A1) + P (A2) = 3/11 + 7/11 = 10/11
2. Multiplikaciona teorema
Vjerovatnoa istovremenog dogaanja dva ili vie nezavisnih dogaaja jednaka je produktu
pojedinanih vjerovatnoa tih dogaaja:
P(A1 A2) = P(A1) x P(A2)
Ako bacamo dvije kocke, kolika je vjerovatnoa da e i na jednoj i na drugoj kocki pasti broj 6?
P(A1 A2) = P(A1) x P(A2) = 1/6 x 1/6 = 1/36
Sluajne varijable i distribucije vjerovatnoa

Sluajni dogaaj je dogaaj koji se pod odreenim uvjetima moe, ali i ne mora dogoditi
(npr. pojava pisma kod bacanja novia, ili pojava rezultata veih od aritmetike sredine na testu
znanja iz Statistike). Za dva dogaaja kaemo da su nezavisna kada pojavljivanje ili nepojavljivanje
jednog nema nikakvog efekta na pojavljivanje ili nepojavljivanje drugog. Za dva dogaaja kaemo
da se meusobno iskljuuju ako istovremeno ne mogu nastupiti oba.
Sluajna varijabla je promjenljiva veliina koja poprima vrijednosti iz zadatog skupa S svih
moguih ishoda, tj. sluajnih dogaaja nekog sluajnog eksperimenta. Uz svaki element skupa S
vee se odreena vjerovatnoa njegovog ishoda. Sluajnoj varijabli X pripada odreena distribucija
vjerovatnoa.
Distribucije diskretnih i kontinuiranih varijabli tretiraju se na razliit nain u teoriji
vjerovatnoe.
Diskretnoj sluajnoj varijabli pripada diskretna distribucija vjerovatnoa. Svaka vrijednost
i (mogui ishod) optereena je odreenom vjerovatnoom pi.
Elementi skupa S={1,2,3,4,5,6} su ishodi sluajnog eksperimenta bacanja igrae kocke. Sa X oznaavamo
sluajnu varijablu za koju je S skup moguih vrijednosti. U sluaju idealne kocke, svakom ishodu sluajnog
eksperimenta pripada vjerovatnoa 1/6, tj. P(X=1)=1/6. Takoer vrijedi P(X=2)=1/6, itd., P(X=6)=1/6.
Vjerovatnoe svakog ishoda moemo prikazati na sljedei nain:
Vrijednosti
Vjerovatnoe
1/6
1/6
1/6
1/6
1/6
1/6
72
Ako eksperiment radimo sa kockom koja nije idealna (jer je npr. pomaknuto teite), tada ishodi ne bi bili
jednako vjerovatni, ve bi im pripadale razliite vjerovatnosti (pi0, pi=1).
Binomna distribucija (situacije u kojima svaki broj nezavisnih pokuaja rezultira jednim od
dva mogua ishoda, pri emu pojavljivanje jednog ishoda iskljuuje mogunost pojavljivanja drugog
ishoda primjer bacanja novia) i Poissonova distribucija (raspodjela rijetkih dogaaja)
predstavljaju diskretne distribucije vjerovatnoa.
Kontinuiranoj sluajnoj varijabli pripada distribucija vjerovatnoa vrijednosti (ishoda)
unutar odreenog intervala. Distribucija vjerovatnoa kontinuirane sluajne varijable razlikuje se
od distribucije vjerovatnoa diskretnih varijabli jer:
ishod (dogaaj, rezultat) moe biti bilo koja vrijednost unutar odreenog opsega, s tim da ta
vrijednost nije nuno cijeli broj,
vjerovatnoa jedne specifine vrijednosti je nula, i
vjerovatnoa se izraava u terminima povrine pod krivom koja predstavlja kontinuiranu
distribuciju.
Distribucija vjerovatnoa kontinuirane sluajne varijable moe se prikazivati pomou relativnih

frekvencija (jer distribucija relativnih frekvencija ima slina svojstva kao i distribucija
vjerovatnoa).
Statistikom dominira jedna kontinuirana distribucija nazvana normalna distribucija jer
predstavlja model mnogih kontinuiranih sluajnih varijabli, kao to su fizike karakteristike
(tjelesna teina, visina), rezultati na testovima linosti, inteligencije, itd. Pod odreenim uvjetima,
normalna distribucija predstavlja i aproksimaciju razliitih diskretnih distiribucija (binomne i
Poissonove).
73
PRIMJER 5.1
Neka su baene dvije kocke. Kolika je vjerovatnoa da je zbir brojeva koji se pojave na
kockama 7?
Svi mogui ishodi eksperimenta, tj. potpuni skup sastoji se od svih ureenih parova (i, j). U
svakom ureenom paru prvi element predstavlja broj koji se pojavljuje na gornjoj strani prve kocke,
a drugi element u paru predstavlja broj koji se pojavljuje na gornjoj strani druge kocke. Skup u
ovom primjeru ima 36 elemenata.
Dogaaj A, da je zbir brojeva koji se pojave na kockama 7, jeste sljedei podskup od :
= {(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)}
Vjerovatnoa dogaaja A, jednaka je:
P(A) = 7 / 36=0,194
PRIMJER 5.2
U kutiji se nalaze pet bijelih, etiri ute i dvije crne kuglice. Kolika je vjerovatnoa da emo iz
kutije izvaditi svijetlu (bijelu ili utu) kuglicu?
Primjenit emo aditivnu teoremu, prema kojoj za meusobno iskljuive dogaaje A1 i A2
vjerovatnoa da e se dogoditi ili A1 ili A2 jednaka je sumi vjerovatnoa svakog pojedinanog
dogaaja. Dogaaj A1 je izvlaenje bijele, a dogaaj A2 je izvlaenje ute kuglice. Vjerovatnoe
dogaaja A1, A2 i A3 iznose:
P (A1) = 5/11
P (A2) = 4/11
P (A3) = 2/11.
Vjerovatnoa izvlaenja svijetle kuglice (ili bijele ili ute) iznosi:
P(A1 A2) = P(A1) + P (A2) = 5/11 + 4/11 = 9/11=0,818
PRIMJER 5.3
Ako bacamo dvije kocke, kolika je vjerovatnoa da e i na jednoj i na drugoj kocki pasti broj
1?
Prema multiplikacionoj teoremi, vjerovatnoa istovremenog dogaanja dva ili vie nezavisnih
dogaaja jednaka je produktu pojedinanih vjerovatnoa tih dogaaja. Vjerovatnoa dogaaja A 1
74
jednaka je vjerovatnoi dogaaja A2 i iznosi 1/6. Prema tome, vjerovatnoa da e i na jednoj i na

drugoj kocki pasti broj 1 iznosi:
P(A1A2) = P(A1) x P(A2) = 1/6 x 1/6 = 1/36=0,028
PRIMJER 5.4
Pretpostavimo da veliku grupu srednjokolaca (N=3000) pitamo da na skali od 1 (ekstremno
vano) do 5 (uope nije vano) procjene vanost razliitih aspekata njihovog ivota: zdravlje, kola,
prijatelji, politika stabilnost. Na slici 5.4.1 dat je grafiki prikaz distribucije relativnih frekvencija
odgovora ovog hipotetikog primjera.
Na apscisi su nanesene procjene (od 1 do 5), a na ordinati relativne frekvencije odgovora

svakog od procjenjivanog aspekta. Relativne frekvencije se praktino koriste kao vjerovatnoe
dogaaja, u ovom sluaju procjene vanosti razliitih aspekata ivota.
Iz grafikog prikaza vidljive su razliite distribucije odgovora za razliite aspekte ivota.
Neto vie od polovine ispitanika (rf=0,517) prijateljstvo procjenjuje kao ekstremno vaan aspekt
njihovog ivota, dok politiku stabilnost na isti nain procjenjuje jako mali broj ispitanika
(rf=0,066). Drugim rijeima, vjerovatnoa da e sluajno izabrana osoba prijateljstvo procjeniti kao
ekstremno vano iznosi 0,517, dok je vjerovatnoa da e neka osoba (takoer odabrana po sluaju)
politiku stabilnost procjeniti kao ekstremno vanu samo 0,066.
75
PRIMJER 5.5
Studenti prve godine Odsjeka za psihologiju u Sarajevu su na vjebama iz predmeta Statistika
u psihologiji I napravili mali eksperiment: eljeli su empirijski provjeriti kako izgleda distribucija
diskretne sluajne varijable u sluaju velikog broja rezultata. Da bi to postigli studenti su bacali
parove igraih kocki i biljeili dobivene rezultate. Dakle, rezultat je operacionaliziran kao zbir
brojeva koji se dobije bacanjem dvije igrae kocke.
Mogue kombinacije brojeva i odgovarajui rezultati koji se mogu dobiti bacanjem dvije
kocke (kocke I i II) prikazani su u tabeli 5.5.1
Kocka I
Kocka II
Rezultat
Kocka I
Kocka II
Rezultat
Kocka I
Kocka II
Rezultat
Kocka I
Kocka II
Rezultat
Kocka I
Kocka II
Rezultat
Kocka I
Kocka II
Rezultat
Tabela 5.5.1. Kombinacije brojeva i odgovarajui rezultati koji se mogu dobiti bacanjem dvije kocke
10
10
11
10
11
12
Iz tabele se vidi da se mogui rezultati kreu u rasponu od 2 do 12. Moguih kombinacija

brojeva na dvije kocke imamo 36, dok se kombinacije koje daju pojedini rezultat pojavljuju razliit
broj puta (tako, npr., imamo samo jednu kombinaciju koja daje rezultat 2: 1+1=2, dok kombinacija
koje daju rezultat 7 ima najvie: 1+6, 2+5, 3+4, 4+3, 5+2, 6+1). Na temelju ukupnog broja
kombinacija (n=36) i broja kombinacija koje daju pojedini rezultat (m) mogue je izraunati
vjerovatnou javljanja svakog pojedinog rezultata (tabela 5.5.2.).
76
Tabela 5.5.2: Vjerovatnoa javljanja svakog pojedinog rezultata

Rezultat
p=m/n
36
0,0278
2,7778
36
0,0556
5,5556
36
0,0833
8,3333
36
0,1111
11,1111
36
0,1389
13,8889
36
0,1667
16,6667
36
0,1389
13,8889
36
0,1111
11,1111
10
36
0,0833
8,3333
11
36
0,0556
5,5556
12
36
0,0278
2,7778
1,0000
100
total
Studenti psihologije su na vjebama iz psihologije utvrdili ukupno N=900 rezultata bacanja

dvije kocke (studenti su vjebe iz predmeta Statistika u psihologiji I pohaali u 3 grupe; u svakoj
grupi, studenti su bacali 15 parova kocki po 20 puta; tako smo dobili skup od ukupno 900 rezultata:
3 grupe x 15 parova kocki x 20 bacanja = 900 rezultata). Na temelju gornje tabele sa teorijskim
vjerovatnoama pojedinih rezultata mogue je nainiti tabelu sa teorijskim (oekivanim)
frekvencijama svakog pojedinog rezultata u skupu rezultata veliine N=900. Naime, vjerovatnoe
pojedinih rezultata izraene kao proporcije i procenti u gornjoj tabeli nisu nita drugo nego relativne
frekvencije i relativne frekvencije u procentima pojedinih rezultata (tabela 5.5.3).
Table 5.5.3: Relativne frekvencije i relativne frekvencije u procentima pojedinih rezultata

Rezultat
p (rf)
% (rf%)
0,02778
2,778
25
0,05556
5,556
50
0,08333
8,333
75
0,11111
11,111
100
0,13889
13,889
125
0,16667
16,667
150
0,13889
13,889
125
0,11111
11,111
100
10
0,08333
8,333
75
11
0,05556
5,556
50
12
0,02778
2,778
25
total
1,00000
100,000
900
77
Gornja distribucija ima M=7 i s=2,42, te ima oblik normalne distribucije, to se moe vidjeti i
na slici 5.2.2.
S lika 5.2.2. T eorijs ka (o ekiv ana) dis tribuc ija rez ultata bac anja
dv ije koc ke 900 puta
160
0,18
140
0,16
0,14
120
0,12
100
0,1
f 80
0,08
60
0,06
40
0,04
20
0,02
0
1
10
11
12
13
R ez ultat
Sada moemo prei na empirijski dio eksperimenta. Studenti su prilikom 900 stvarnih bacanja
kocki dobili frekvencije prikazane u tabeli 5.5.4.
Table 5.5.4: Empirijska distribucija rezultata
Rezultat
Opaena
frekvencija
21
57
66
83
126
147
139
97
10
81
11
54
12
29
900
78
Vidimo da se opaene frekvencije relativno dobro podudaraju sa teorijski oekivanim.

Empirijska distribucija prikazana je na slici 5.2.3.
S lika 5.2.3. E mpirijs ka (opa ena) dis tribuc ija rez ultata bac anja
dv ije koc ke 900 puta
160
0,18
140
0,16
0,14
120
0,12
100
0,1
f 80
0,08
60
0,06
40
0,04
20
0,02
0
1
10
11
12
13
R ez ultat
Kao to se vidi, empirijska distribucija vjerno prati krivu normalne raspodjele.

Dobivena distribucija ima M=7,13 i s=2,43. Ove su vrijednosti vrlo bliske (praktino
identine) teorijski oekivanim vrijednostima.
Prema tome, na eksperiment je uspio: empirijski smo pokazali da se ishodi unutar sluajnih
varijabli (uz uvjet da imamo dovoljan broj ishoda) distribuiraju u obliku normalne distribucije. Ovo
je vrlo vana statistika injenica jer u empirijskim istraivanjima vrlo esto poredimo empirijski
utvrenu distribuciju rezultata sa normalnom distribucijom koju teorijski oekujemo kada imamo
sluajnu varijablu. Ukoliko izmeu empirijske i teorijske distribucije postoje znaajna odstupanja
zakljuujemo da empirijska distribucija nije distribucija sluajne varijable. U tom sluaju smatramo
da je na empirijsku distribuciju djelovao neki sistematski faktor koji je doveo do njenog odstupanja
u jednom ili drugom smjeru. Taj sistematski faktor vrlo esto nazivamo nezavisnom varijablom.
PRIMJER 5.6
Posmatrajmo eksperiment bacanja dvije kocke. Kolika je vjerovatnoa da je zbir brojeva koji
se pojavljuju na kockama 6, uz uvjet da je drugi broj paran?
Neka je E dogaaj takav da je zbir brojeva koji se pojavljuju na kockama 6, tj. E = {(1,5),
(2,4), (3,3), (4,2), (1,5)}. Neka je F dogaaj da je broj koji se pojavljuje na drugoj kocki paran, tj.
F={(1,2), (2,2), (3,2), (4,2), (5,2), (6,2),(1,4), (2,4), (3,4), (4,4), (5,4), (6,4), (1,6), (2,6), (3,6), (4,6),
(5,6), (6,6)}.
79
Kolika je vjerovatnoa dogaaja E uz uvjet da je zadovoljen dogaaj F? Ako je zadovoljen F,

tj. na drugoj kocki se pojavljuje paran broj, onda je zbir brojeva na obje kocke 6, samo ako su ishodi
sljedei: (2,4), (4,2). Dogaaj F ima 18 elemenata. Stoga je vjerovatnoa dogaaja E uz uvjet da je
dat F: 2 /18, tj.
P(E F) = 2 /18 (itamo: vjerovatnoa od E dat F).
PRIMJER 5.7
Provedena su tri eksperimenta sa tri igrae kocke. U svakom eksperimentu igrau kocku bacali
smo 600 puta. Ispod su prikazane uestalosti pojavljivanja brojeva 1, 2, 3, 4, 5, 6.
Strana
kocke
Eksperiment
1
Eksperiment
2
Eksperiment
3
100
50
101
98
70
99
102
130
102
93
80
101
110
150
98
97
120
99
total
600
600
600
ta moete sve zakljuiti na osnovu dobivenih distribucija?

Vjerovatnoa pojavljivanja svakog od brojeva kocke iznosi p=1/6=0,167. Najprije, izraunat
emo relativne frekvencije i uporediti ih sa teorijskim vjerovatnoama (p=0,167 za svaki broj).
Ukoliko je kocka ispravna ili je eksperiment proveden na pravilan nain, relativne frekvencije
trebale bi biti priblino jednake teorijskim.
Strana
kocke
Eksperiment 1
Eksperiment 2
Eksperiment 3
pe
pt
pe
pt
pe
pt
0,167
0,167
0,083
0,167
0,168
0,167
0,163
0,167
0,117
0,167
0,165
0,167
0,170
0,167
0,217
0,167
0,170
0,167
0,155
0,167
0,133
0,167
0,168
0,167
0,183
0,167
0,250
0,167
0,163
0,167
0,162
0,167
0,200
0,167
0,165
0,167
total
80
Oigledno je da su razlike izmeu teorijskih vjerovatnoa i relativnih frekvencija najvee u

eksperimentu 2. Npr., za broj pet, relativna frekvencija iznosi 0,250, dok je teorijska vjerovatnoa
p=0,167. Izvjesne razlike utvrene su u prvom eksperimentu, a najmanje su u treem eksperimentu.
Na osnovu dobivenih rezultata moemo opravdano pretpostaviti da drugi eksperiment nije
pravilno proveden ili da kocka nije bila ispravna.
81
6. Normalna raspodjela
Na slici 6.1 prikazan je histogram rezultata 100 ispitanika na testu X. Mnogi podaci, prikupljeni
od relativno velikog broja ispitanika, rasporeuju se slino kao to je prikazano na slici. Moemo
primjetiti da su krajevi histograma jednako udaljeni od jednog vrha pozicioniranog tano u sredini.
Slika 6.1: Histogram rezultata testa X
30
20
10
0
25,0
35,0
30,0
45,0
40,0
55,0
50,0
65,0
60,0
75,0
70,0
Krivulja nacrtana kroz histogram predstavlja matematiki model raspodjele rezultata i prua
kompaktnu sliku cjelokupne raspodjele rezultata (obzirom da je matematiki model idealizirana slika
raspodjele rezultata, zanemaruju se eventualna mala odstupanja).
Krivulja prikazana na slici je normalna krivulja i grafiki opisuje kontinuiranu raspodjelu
koju zovemo normalna raspodjela. Normalna raspodjela je zvonolikog oblika, simetrina i
unimodalna.
Matematiki je definirana izrazom:
u kojem X oznaava rezultat, aritemetiku sredinu, a standardnu devijaciju ( i e su konstante).

Prema tome, normalna raspodjela je u potpunosti determinirana vrijednostima aritmetike sredine i
82
standardne devijacije. Aritmetika sredina nalazi se u centru raspodjele, tj. tjemenu krive, i iste je
vrijednosti kao i medijana.
Normalna raspodjela je vana u statistici jer:
vrijednosti mnogih psiholokih varijabli u populaciji se rasporeuju normalno,
osnova je za mnoge statistike testove, i
pod odreenim uvjetima, predstavlja aproksimaciju razliitih diskretnih raspodjela (binomne
i Poissonove).
Ukoliko znamo vrijednosti aritmetike sredine i standardne devijacije, tada moemo odrediti
broj rezultata unutar nekog opsega2. Odnosno vrijedi da se u...
intervalu nalazi se 68,26% svih rezultata
intervalu 2 nalazi se 95,44% svih rezultata
intervalu 3 nalazi se 99,73% svih rezultata
Na slici ispod prikazana je normalna raspodjela sa navedenim intervalima i postocima rezultata
koji se nalaze u datom intervalu.
Slika 6.2: Normalna raspodjela
Standardna normalna raspodjela

Empirijski dobivene normalne raspodjele moemo aproksimirati na jednu normalnu raspodjelu
ako podatke izrazimo u jedinicama standardne devijacije, tj. transformiramo u z-vrijednosti.
Odreivanje broja podataka unutar zadatog intervala provodi se integriranjem funkcije:

, u intervalu od X1 do X2. U
statistikim tablicama koje se nalaze na kraju svakog udbenika iz statistike, unijete su vrijednosti na osnovu kojih moemo odrediti broj
podataka unutar nekog intervala.
2
83
Transformacija rezultata u z-vrijednosti naziva se standardizacija rezultata. Pomou zvrijednosti izraavamo koliko je neki rezultat udaljen od aritmetike sredine i u kojem smjeru (desno
ili lijevo od aritmetike sredine), pri emu se udaljenost izraava u jedinicama standardne devijacije.
Z-vrijednost odreujemo koristei izraz:
Neka je M = 52, s = 12. Odredite z-vrijednost rezultata X1 = 70

z1 = (70 56)/12 =2
Rezultat 70 udaljen je od M za 2 standardne devijacije, u desnu stranu.
Raspodjela rezultata izraenih u z-vrijednostima naziva se standardna normalna raspodjela.

Standardizacijom rezultata bilo koju normalnu raspodjelu svodimo na jednu, standardnu raspodjelu.
Aritmetika sredina ove raspodjele iznosi =0 a standardna devijacija =1. Povrina pod
standardnom normalnom raspodjelom iznosi p=1.
Povrina pod krivom proporcionalna je broju podataka u raspodjeli, pa se odreivanje broja
podataka u odreenom intervalu svodi na odreivanje povrine pod normalnom krivuljom. Za
standardnu normalnu raspodjelu vrijednosti povrina za pojedine opsege rezultata ispod normalne
krivulje oitavamo iz tablice standardne normalne raspodjele, koje se nalaze u svakom udbeniku
statistike.
Postupak odreivanja broja podataka u odreenom intervalu sastoji se u tome da, najprije,
granine vrijednosti intervala pretvorimo u z-vrijednosti, a zatim, koristei se odgovarajuom
tablicom, utvrdimo proporciju rezultata unutar datog intervala (tj. odredimo povrinu krivulje koja
odgovara datom intervalu).
84
U primjeru desno, oznaena je jedna

strana pod krivuljom, ija povrina
iznosi P=0,5. U opsegu od -3 standardne
deviacije do aritmetike sredine
(tj. 0 standardne devijacije) nalazi se
50 posto rezultata.
U primjeru desno, oznaena je povrina pod
normalnom raspodjelom izmeu z1=-1 i z2=1.
z1 = -1 p1 = 0.1587
z2 = 1 p2 = 0.1587
p = 1 (p1 + p2) = 1 - 0,3174
p = 0,6826
p1
p2
Povrina pod normalnom krivuljom (u datom intervalu) predstavlja vjerovatnou

pojavljivanja rezultata datog intervala. Vjerovatnoa da emo metodom sluajnog odabira izvui
rezultat koji se nalazi u rasponu od -3 do 3 standardne devijacije iznosi 99,73%. Vjerovatnoa da
emo izvui rezultat koji se nalazi u rasponu od -1 do 1 standardne devijacije iznosi 68,26%.
Iz grafikog prikaza normalne krivulje oigledno je da rasponi iste veliine nemaju istu
vjerovatnou pojavljivanja.
85
PRIMJER 6.1
Raspodjela vrijednosti holesterola u krvi u populaciji osoba iste dobne grupe i spola priblino
je normalna. Za 14-godinje djeake prosjena vrijednost u populaciji iznosi = 170 mg/dl, a
standardna devijacija = 30 mg/dl. Vrijednosti iznad 240 mg/dl zahtijevaju medicinski tretman.
Zanima nas postotak 14-godinjih djeaka koji imaju vrijednost holesterola veu od 240 mg/dl?
Potrebno je odrediti postotak djeaka sa X>240 mg/dl. U raspodjeli rezultata odreivanje
postotka djeaka sa X>240 mg/dl podrazumijevalo bi odreivanje proporcije, tj. povrine pod
normalnom krivuljom pomou formule koja matematiki definira normalnu krivulju. Umjesto toga,
koristit emo standardnu normalnu raspodjelu za koju su vrijednosti povrina pod krivuljom
izraunate i sistematizirane u tablici. Stoga emo najprije izraunati z-vrijednost za X=240, a zatim
iz tabele A oitati povrinu koja korespondira izraunatoj z-vrijednosti.
= 170 mg/dl
= 30 mg/dl
X = 240 mg/dl
z=
XM
s
z=
240 170
30
z = 2,33
Potrebno je odrediti povrinu pod normalnom krivuljom za z > 2,33.
p=0,0099
z=2,33
Iz tablice emo oitati da povrina od z=2,33 do kraja krivulje iznosi p=0.0099, tj p0,01.
Pretvoreno u procente, povrina iznosi 1%.
Na kraju zakljuujemo da u populaciji moemo oekivati 1% djeaka dobi od 14 godina koji
imaju vrijednost holesterola u krvi veu od 240 mg/dl.
86
PRIMJER 6.2
Prosjeno vrijeme trajanja trudnoe (od zaea do poroda) u populaciji iznosi =266 dana uz
varijabilnost od =16 dana. Raspodjela je priblino normalna.
a. Osoba A.B porodila se 282. dan. Koji postotak ena ima vrijeme trajanja trudnoe vee od osobe
A.B.?
= 266 dana
= 16 dana
X=282 dana
z=?
z=
XM
z=
282 266
16
z=1
Potrebno je odrediti povrinu pod normalnom krivuljom za z > 1.
p=0,1587
z=1
Iz tablice emo oitati da povrina od z=1 do kraja krivulje iznosi p=0,1587. Pretvoreno u
procente, povrina iznosi 15,87%. Na kraju, zakljuujemo da u populaciji moemo oekivati 15,87%
ena kod kojih trudnoa traje vie od 282 dana.
b. Osoba C.D. porodila se 250-ti dan trudnoe. Koji postotak ena ima vrijeme trudnoe vee od
osobe C.D.?
= 266 dana
= 16 dana
X = 250 dana
z=?
z = -1
z=
XM
s
z=
87
250 266
16
Potrebno je odrediti povrinu pod normalnog krivuljom za z > -1.
p=0,1587
z=-1
Iz tablice emo oitati da povrina od z=-1 do blieg kraja krivulje iznosi p=0,1587.
Pretvoreno u procente povrina iznosi 15,68%. Meutim, povrina koja nas interesira nalazi se od z
do desnog kraja krivulje. Stoga emo zakljuiti da u populaciji moemo oekivati 100% - 15,87 % =
84,17 % ena kod kojih trudnoa traje vie od 250 dana.
c. Koliko je ena kojima je vrijeme trudnoe izmeu 250 i 282 dana.
= 266 dana
= 16 dana
X1 = 250 dana
X2 = 282 dana
z1 = ?
z2 = ?
z1 = -1;
z2 = 1
Potrebno je odrediti povrinu pod normalnom krivuljom izmeu z=-1 i z=1.

p=1 (0,1587 + 0,1587)
p=0,1587
p=0,1587
p = 1 (0,1587 + 0,1587), p = 0,6826

P = 68,26 %
88
d. U kojem intervalu se nalazi 99,73% sredinjih vrijednosti trajanja trudnoe?

U intervalu od -3z do 3z nalazi se 99,73% sredinjih rezultata. Prema tome, potrebno je
odrediti rezultate koji odgovaraju -3z i 3z.
Iz izraza:
z=
XM
s
slijedi da je: X = M + zs,
X1 = 266 + 3x16 = 314,

X2 = 266 + (-3)x16 = 218.
Dakle, u intervalu od 218 314 dana nalazi se 99,73% vrijednosti trajanja trudnoe.
e. U kojem intervalu se nalazi 95,44% sredinjih vrijednosti trajanja trudnoe?
U intervalu od -2z do 2z nalazi se 95,44% rezultata. Prema tome, potrebno je odrediti rezultate
koji odgovaraju -2z i 2z.
X1 = 266 + 2x16 = 298
X2 = 266 + (-2)x16 = 234
Dakle, u intervalu od 298 234 dana nalazi se 95,44% sredinjih vrijednosti trajanja trudnoe.
f. Koliko traje trudnoa za ene koje se nalaze u prvom kvartilu distribucije?
Prvi kvartil sadrava prvih 25% vrijednosti. Znai da je gornja granica prvog kvartila 25.
centil. Pod normalnom krivuljom prvih 25% rezultata odgovara povrini p=0,25. Ako znamo p, iz
tablice moemo oitati i njoj odgovarajuu z-vrijednost.
Za p = 0,25, z = 0,68
X = M + zs
X = 266 + (-0,68)x16 = 255,12
Zakljuujemo da za ene koje se nalaze u prvom kvartilu vrijeme trajanja trudnoe iznosi
maksimalno 255 dana.
89
PRIMJER 6.3
Primjenjujui test matematikih kompetencija na velikom broju uenika prvog razreda
srednjih kola dobivena je normalna raspodjela rezultata sa sljedeim vrijednostima M=500 i s=100.
a. Koji postotak uenika postie rezultate vee od 600? Drugim rijeima, koliko iznosi centilni rang
rezultata 600?
z=
XM
s
z = (600 500)/100 = 1
p = 0,1587 P = 15,87%.
15,87% uenika postie rezultat vei od 600. Dakle, rezultat 600 lei na 84-om centilu (10015,87=84,1384).
b. Koji postotak uenika postie rezultate manje ili jednake 400? Drugim rijeima, koliko iznosi
centilni rang rezultata 400?
z=
XM
s
z = (400 500)/100 = -1
p = 0,1587
P = 15,87%,
Dakle, 15,87% uenika postie rezultat manji ili jednak 400. Rezultat 400 lei na 16-om
centilu (ispod ovog rezultata nalazi se oko 16% rezultata).
c. Koji rezultat je jednak manji od 75% rezultata postignutih na testu? Drugim rijeima, koliko
iznosi 25 centil?
p = 0,25
z = - 0,67
X = M + zs = 500 - 0,67x100 = 433
Rezultat 433 nalazi se na 25 centilu (ovaj rezultat je jednak ili manji od 75% postignutih
rezultata).
U istom istraivanju primijenjen je test jezikih kompetencija. Dobivene su sljedee
deskriptivne vrijednosti raspodjele: M = 550, s = 90.
90
Ispitanik A je na testu matematikih kompetencija postigao rezultat 500, a na testu jezikih

kompetencija takoer rezultat 500. Na kojem testu je bio bolji?
z1 =
z2 =
500 500
100
500 550
90
=0
= -0,55
Rezultat ispitanika A na testu matematikih kompetencija jednak je vrijednosti aritmetike

sredine (z=0). Na testu jezikih kompetencija nalazi se za neto vie od pola standardne devijacije
ispod aritmetike sredine (z=-0,55). Ispitanik A je postigao bolji rezultat na testu matematiih
kompetencija.
PRIMJER 6.4
Kvocijent inteligencije (IQ) je standardizirani rezultat, a raspodjela vrijednosti IQ-a u
populaciji priblino je normalna, sa deskriptivnim populacijskim vrijednostima = 100 i = 16.
a. Koliko iznosi vjerovatnoa sluajnog odabira rezultata vrijednosti 120 i vie?
z = (120-100)/16 =1,25
p = 0,1056
Dakle, vjerovatnoa sluajnog odabira rezultata vrijednosti 120 i vie iznosi 10,56%.
b. Koliko iznosi vjerovatnoa sluajnog odabira rezultata vrijednosti 90 i manje?
z = (90-100)/16 = -0,625
p = 0,2643
Dakle, vjerovatnoa sluajnog odabira rezultata vrijednosti 90 i manje iznosi 26,43%.
c. Koliko iznosi vjerovatnoa sluajnog odabira rezultata vrijednosti od 90 do 120?
z1 = -0,625; z2 = 1,25
p = 1-(p1+p2) = 1- (0,2643 + 0,1056) = 0,6301
Dakle, vjerovatnoa sluajnog odabira rezultata izmeu 90 i 120 iznosi 63,01%.
91
d. MENSA je organizacija koja okuplja ljude sa visokim IQ. lanovima ove organizacije moe
postati samo 2% osoba sa najviim IQ rezultatima. Koliko iznosi najmanji rezultat koji prua
mogunost ulanjenja u MENSA-u? Zapravo, interesira nas koja z vrijednost odgovara postotku od
2% najviih rezultata ispod standardne normalne krive. Iz tabele oitavamo da je to z=2,05.
X = M + zs
X = 100 + 2,05x16
X = 132,8
Dakle, najmanji IQ rezultat koji prua mogunost ulanjenja u MENSA-u iznosi 132,8.
PRIMJER 6.5
U primjeru 2.3 raspodjele visina uenika IIIc odjeljenja smo prikazivali tabelarno i grafiki te
smo ilustrovali vrste informacija koje moemo ekstrahirati iz ovih prikaza. Na ovom mjestu emo
pokazati da do istih informacija moemo doi sluei se standardnom normalnom raspodjelom
(obzirom da je i originalna raspodjela visina uenika takoer normalna) te pripadajuom tablicom p
vrijednosti pod krivom standardne normalne raspodjele. U primjerima 3.4 i 4.5 utvrdili smo
prosjenu vrijednost i pripadajuu standardnu devijaciju za raspodjelu visina 25 uenika IIIc
odjeljenja: M = 135,08 cm i s = 1,83 cm.
a. Koliko uenika IIIc odjeljenja je visoko izmeu 135,5 i 136,5 cm?
Da bismo utvrdili broj rezultata koji spadaju u odreeni interval raspodjele moramo se
koristiti tablicama p vrijednosti pod krivom standardne normalne raspodjele. Ove vrijednosti se iz
tablica oitavaju samo u odnosu na standardne, z-vrijednosti. To znai da je neophodno utvrditi
odgovarajue z-vrijednosti za originalne rezultate (rezultate izraene na originalnoj skali mjerenja, tj.
rezultate iz originalne raspodjele).
Pripadajue z vrijednosti za originalne rezultate 135,5 i 136,5 cm su:
z=
z=
XM
s
XM
s
135,5 135,08
1,83
136,5 135,08
1,83
= 0,23
= 0,78
Na slici ispod prikazane su izraunate z-vrijednosti i korespondirajue povrine.
92
0,25
Iz tablic e o itavamo da s e od z = 0.23 do kra ja
distribuc ije nalaz i 40,90% povr ine dis tribuc ije (tj.
40,90% rez ultata u dis tribuc iji). O vaj dio dis tribuc ije z vat
d emo povr inom 1 (P 1).
0,2
O d z = 0.78 do kraja dis tribuc ije nalaz i s e 21,77%
povr ine dis tribuc ije (tj. 21,77% rez ultata u
dis tribuc iji).O vaj dio dis
tribuc ije z vat d emo
0,15
povr inom 2 (P 2).
O ve dvije povr ine preklapaju s e u dijelu dis tribuc ije
koji je na grafiku oz na en "kariranim" trihiranjem.
0,1 do P 2 (dakle, dio dis tribuc ije
To nije ni ta drugo
iz nad z = 0,78).
-4
-3
-2
-1
z = 0,23
Meutim, mi elimo z nati proc enat dis tribuc ije iz meu ove
0,05
dvije vrijednos ti (taj dio dis tribuc ije oz na en je kos im linijama).
Taj dio dis tribuc ije odgovara upravo ra z lic i iz meu P 1 i P 2 pa
d emo ga tako i utvrditi:
P 1 - P 2 = 40,90 - 21,77 = 19,13.
0 u enika IIIc odjeljenja vis oko je iz meu 135,5 i
Dakle, 19,13%
136,5 c m. 4
z = 0,78
Dakle, koristei se z-vrijednostima i odgovarajuim povrinama distribucije doli smo do

rezultata da je 19,13% uenika visoko izmeu 135,5 i 136,5 cm.
Ukoliko se vratimo na primjer 2.3 iz tabele grupiranih rezultata moemo oitati da je 20%
uenika visoko 136 cm (preciznije, izmeu 135,5 i 136,5 cm), to je rezultat vrlo blizak ovom koji
smo dobili pomou z-vrijednosti.
20% od ukupno 25 uenika IIIc odjeljenja iznosi 5 uenika to je upravo podatak koji
moete utvrditi u tablici grupiranih rezultata u primjeru 2.3.
b. Koliko uenika je visoko najmanje 135,5 cm?
Podatak koliko uenika je visoko najmanje 135,5 cm ve imamo utvren na grafikonu: njih
40,9 % (tj. od z=0,23 do blieg kraja distribucije imamo 40,9% povrine ispod krive). 40,9% od
ukupno 25 uenika iznosi 10 uenika.
c. Koja je granina vrijednost koja odvaja 40% najniih uenika od ostalih?
Granini z rezultat koji odvaja 40% najniih uenika takoer moemo dobiti vrlo jednostavno
samo emo tablicu p vrijednosti ispod standardne normalne krive korsititi u obratnom smjeru:
proporciji od 0,4000 povrine ispod krive odgovara priblina z-vrijednost od - 0,25 (z vrijednost je
negativna obzirom da se nalazi ispod aritmetike sredine).
Jo jednom, izraavajui formulu za z rezultate preko X dolazimo do jednaine:
X = M + zs = 135,08 + (-0,25)x1,83 = 134,62
40% uenika IIIc odjeljenja nie je od 134,62 cm (na osnovu ogive u primjeru 2.3 mi smo
ovu granicu postavili na visinu od oko 134,75 cm).
93
d. Koji procenat uenika je visok najmanje 137 cm?

U konkretnoj raspodjeli visina uenika IIIc odjeljenja, visini od 137 cm odgovara z rezultat
od:
z=
XM
137 135,08
1,83
= 1,05
0,25
0,2
0,15
O d z = 1,05 do bli eg kraja
dis tribuc ije nalaz i s e 14,69%
dis tribuc ije.
0,1
0,05
0
-4
-3
-2
-1
z = 1,05
Dakle, 14,69% uenika IIIc je vie od 137 cm.

0,25
dis tribuc ije (P 1).
e. Koliko uenika je visoko izmeu 135,5 i 136,5 cm?
0,2
0,15

dis tribuc ije (P 2).
Sa prethodnog grafika vidimo da je 14,69% uenika vie

od 137 cm. Ukoliko izraunamo odgovarajui z rezultat za
visinu od 134,75 cm (a on iznosi -0,18) i pozicioniramo ga
na grafu, dobit emo prikaz desno.
0,1
0,05
0
-4
42,45% uenika IIIc odjeljenja (ili njih 11) visoko je

izmeu 134,75 cm i 137 cm.
94
-3
-2
-1
z = 0,18
z = 1,05
P roc enat dis tribuc ije iz meu z = 0,18 i

z = 1,05 dobid emo tako to d emo od ukupne
povr ine (tj. 100% ) dis tribuc ije oduz eti one
dijelove koji nam "ne trebaju", tj. P 1 i P 2:
100% - 42,86% - 14,69% = 42,45% .
ZADACI
1. U primjerima 2.3, 3.4 i 4.5 utvrdili smo karakteristike distribucije visina uenika IIIc odjeljenja
(izmeu ostalog i to da distribucija ima M = 135,08 cm i s = 1,83 cm). Utvrdite u kojem rasponu
rezultata se u ovoj raspodjeli nalazi:
a. 68,26% sredinjih vrijednosti.
b. 95,44% sredinjih vrijednosti.
c. 99,73% sredinjih vrijednosti.
2. Iste raspone utvrdite i za distribucije iz zadataka: 2.1, 2.3, 3.1, 3.2, 3.3 i 3.4.
3. Distribucija rezultata ima M = 28 i s = 4. Utvrdite z-vrijednosti za sljedee rezultate koji su
izvueni iz ove distribucije:
a.
b.
c.
d.
e.
X = 28.
X = 32.
X = 36.
X = 24.
X = 16.
Objasnite zato ste dobili upravo te z-vrijednosti.

4. Distribucija rezultata ima M = 95 i s = 12. Utvrdite vrijednosti sirovih rezultata kojima u ovoj
distribuciji odgovaraju sljedee z-vrijednosti:
a.
b.
c.
d.
e.
f.
z = 2,5.
z = -1,8.
z = 0.
z = 1.
z = 2.
z = -3.
Obratite panju na rezultate koje ste dobili u zadacima c., d., e. i f. Objasnite zato ste dobili
upravo te sirove vrijednosti.
5. Distribucija rezultata ima s = 9. Ako rezultatu X = 36 u ovoj distribuciji odgovara z = -2,2, koliko
iznosi aritmetika sredina distribucije?
6. Distribucija ima M = 41. Ako rezultatu X = 28 u ovoj distribuciji odgovara z = - 3,2, koliko
iznosi standardna devijacija distribucije?
95
7. Normalna distribucija rezultata ima M = 49 i s = 7. Utvrdite z-vrijednosti za sljedee rezultate

koji su izvueni iz ove distribucije:
a.
b.
c.
d.
e.
f.
X = 26.
X = 21.
X = 40.
X = 55.
X = 63.
X = 30.
Za svaki od navedenih rezultata utvrdite procenat niih i viih rezultata u distribuciji.

8. Normalna distribucija rezultata ima M = 55 i s = 6. Utvrdite z-vrijednosti za sljedee rezultate
koji su izvueni iz ove distribucije:
a.
b.
c.
d.
e.
f.
X = 48
X = 41
X = 54
X = 57
X = 62
X = 65
Za svaki od navedenih rezultata utvrdite procenat rezultata izmeu datog rezultata i aritmetike
sredine distribucije.
9. Distribuciju visina uenika IIIc odjeljenja (iz primjera 2.3, 3.4 i 4.5) predstavite pomou
histograma. Zatim sve rezultate iz distribucije pretvorite u z-rezultate te dobivenu z-distribuciju
prikaite na histogramu. Da li se oblik distribucije promijenio? Objasnite.
10. Obratite panju na predznak odgovarajuih z-rezultata za visine dva najnia i dva najvia uenika
u IIIc odjeljenju. ta vam govori predznak utvrenih z-rezultata?
11. Za potrebe regrutiranja novih vojnika, Ministarstvo odbrane je testom inteligencije testiralo
ukupno 1350 ispitanika. Dobivena je normalna distribucija rezultata sa sljedeim deskriptivnim
vrijednostima: M = 202 i s = 38. Utvrdite z-vrijednosti za ispitanike sa sljedeim rezultatima:
a.
b.
c.
d.
e.
f.
g.
h.
X1 = 115
X2 = 236
X3 = 302
X4 = 345
X5 = 98
X6 = 152
Za svakog od navedenih ispitanika utvrdite broj ispitanika koji su ostvarili bolji rezultat.
Utvrdite broj ispitanika koji se po rezultatu na testu inteligencije nalaze izmeu ispitanika 1 i
4; 2 i 5; 2 i 4; 1 i 6.
i. Utvrdite koji (sirovi) rezultat dijeli distribuciju na 50% slabijih i 50% boljih ispitanika.
96
j. Ukoliko Ministarstvo odbrane eli regrutovati samo 250 najboljih ispitanika, koji (sirovi)
granini rezultat e koristiti prilikom selekcije kandidata?
k. Ukoliko Ministarstvo odbrane eli regrutovati 35% najboljih kandidata, koji (sirovi) granini
rezultat e koristiti prilikom selekcije kandidata?
12. Velika programerska kompanija eli zaposliti 25 novih radnika. Na konkurs se prijavilo ukupno
89 kandidata. Svi kandidati su testirani na Testu matematike i Testu informatike. Distribucije
utvrenih rezultata na ova dva testa imaju sljedee deskriptivne pokazatelje:
Test matematike: M = 125 i s = 17;
Test informatike: M = 42 i s = 8.
a. Na intervju za posao bie pozvani svi kadidati koji su na Testu matematike ostvarili najmanje
145 bodova. Koliko kandidata e biti pozvano na intervju?
b. Kompanija je zaposlila sve intervjuirane kandidate. Obzirom da je ostao odreeni broj
nepopunjenih radnih mjesta, rukovodioci sektora za ljudske resurse odluili su organizirati
informatiku obuku za najbolje meu preostalim (nezaposlenim) kandidatima. Na trening su
odluili pozvati 20% kandidata koji su na Testu matematike ostvarili najbolje rezultate kada
se iz poetne skupine iskljue kandidati koji su ve dobili posao. Koji rezultat na Testu
matematike e biti koriten kao granini prilikom odluivanja koga pozvati na trening?
c. Kandidat A je na Testu matematike ostvario rezultat 120, a na Testu informatike 48. Kandidat
B je na Testu matematike ostvario 131 bodova, a na Testu informatike 42 boda. Ako
kompanija oba testa smatra jednako vanim, koji od ova dva kandidata bi trebao imati
prednost pri zapoljavanju?
13. U medicini se smatra da je normalna vrijednost sistolikog krvnog pritiska kod odraslih
mukaraca 120 mm/Hg. U velikom epidemiolokom istraivanju (provedenom na podruju cijele
drave) na reprezentativnom uzorku od N = 3.500 odraslih mukaraca utvreno je da se
vrijednosti sistolikog krvnog pritiska normalno distribuiraju sa M = 126 mm/Hg i s = 11
mm/Hg.
a. Koji procenat odraslog mukog stanovnitva ima sistoliki krvni pritisak vei od normalnog?
Ako u datoj dravi ivi ukupno 4.250.827 odraslih mukih stanovnika, koliko njih ima
sistoliki krvni pritisak vei od normalnog?
b. Ako je drava u lijeenju pacijenata sa sistolikim krvnim pritiskom veim od 160 mm/Hg
duna uestvovati sa 3.80 Eur mjeseno po pacijentu, kolike mjesene trokove lijeenja ove
bolesti moe oekivati ministar zdravstva date drave?
14. Prema novom zakonu o socijalnoj pomoi, domainstva u dravi podijeljenja su u 6 kategorija
prema visini mjesenih primanja:
Kategorija I: do 120 KM (mjeseno u domainstvu);
Kategorija II: od 121 do 200 KM;
Kategorija III: od 201 KM do 350 KM;
Kategorija IV: od 351 KM do 600 KM;
97
Kategorija V: od 601 KM do 900 KM;

Kategorija VI: iznad 901 KM.
Prema istom zakonu, domainstva Kategorije I mjeseno e dobivati socijalnu pomo u iznosu od
150 KM; domainstva Kategorije II mjeseno e dobivati 95 KM; domainstva kategorije III
mjeseno e dobivati 50 KM socijalne pomoi.
Ako u dravi ima ukupno 2.256.897 registriranih domainstava te ako se njihova mjesena
primanja rasporeuju u obliku normalne raspodjele sa M = 1.486 KM i s = 365 KM, koliko novca
e drava mjeseno plaati socijalno ugroenim domainstvima?
15. Utvrdite vrijednosti skjunisa i kurtozisa za distribuciju visina uenika IIIc odjeljenja (primjeri
2.3, 3.4 i 4.5)? ta moete zakljuiti o obliku ove distribucije na temelju dobivenih vrijednosti?
16. Za sljedee podatke odredite vrijednosti skjunisa i kurtozisa:
11
12
11
ta na osnovu dobivenih vrijednosti moete zakljuiti o obliku raspodjele? Svaki rezultat iz

prethodne distribucije uveajte za 2 te ponovo izraunajte skjunis i kurtozis. ta se dogodilo s
oblikom distribucije? Objasnite.
98
7. Standardna pogreka aritmetike sredine
Istraivanja u psihologiji u pravilu provodimo na uzorcima odreenih populacija. Razlozi za

to su ekonominost (uteda novca i vremena) i praktinost (npr. mjerenjem se ponekad unitava
proizvod kao u sluaju kontrole kvalitete razliitih industrijskih proizvoda). Meutim, iako
istraivanja ne obuhvataju sve lanove odreene populacije koja je predmet naeg interesiranja (npr.
svu djecu sa tekoama u uenju, sve osobe sa depresivnim poremeajima, svu talentiranu djecu, sve
graane sa pravom glasa itd.), moemo donositi sasvim valjane zakljuke i na temelju vrijednosti
koje smo dobili na uzorcima. Naime, na osnovu rezultata dobivenih na uzorcima izvode se zakljuci
o vrijednostima populacije.
Postupak donoenja zakljuaka o populaciji na osnovu rezultata dobivenih na uzorku naziva
se statistiko zakljuivanje. Dijagram ispod ilustrira proces statistikog zakljuivanja. Iz populacije
formiramo uzorak kojeg numerikim i grafikim metodama opisujemo. Odreenim postupcima, o
kojima e biti govora u nastavku Prirunika, donosimo zakljuak o populaciji. U ovom poglavlju
bavit emo se procjenom aritmetike sredine populacije na osnovu vrijednosti koju smo dobili na
uzorku.
1. Populacija
2. Uzorak
3. Deskripcija i
analiza
podataka iz
uzorka
4. Statistiko
zakljuivanje
Populaciju ine svi lanovi neke grupe s odreenom karakteristikom koju mjerimo.
Deskriptivne vrijednosti populacije nazivamo parametrima: aritmetika sredina populacije i
standardna devijacija populacije.
Uzorak je podskup populacije na kojem se vri istraivanje. Da bi se rezultati dobiveni
istraivanjem na uzorku mogli generalizirati na populaciju iz koje je uzorak izvuen, uzorak mora
biti reprezentativan. Deskriptivne statistike vrijednosti (M i s) koje smo dobili na uzorku
99
nazivamo procjenama parametara (procjene prave aritmetike sredine i prave standardne

devijacije) ili statisticima.
Obzirom da su statistici procjene parametara, prilikom statistikog zakljuivanja izlaemo se
pogreci; u primjeru aritmetike sredine ova pogreka naziva se standardna pogreka aritmetike
sredine.
Postupak donoenja zakljuka o aritmetikoj sredini populaciji na osnovu aritmetike sredine
uzorka, tj. statistika uzorka, kao i logika standardne pogreke aritmetike sredine temelji se na
nekoliko principa raspodjele aritmetikih sredina velikog broja uzoraka (dakle, velikog broja
statistika) oko jedne zajednike (centralne) vrijednosti. U primjeru ispod demonstriran je postupak
donoenja zakljuka o aritmetikoj sredini populacije i smisao standardne pogreke aritmetike
sredine.
Iz populacije veliine N=10000 sa deskriptivnim vrijednostim =49,84 i =9,88, metodom
sluajnog odabira formirali smo odreeni broj uzoraka veliine N=5, N=100 i N=5000. Svaki put
kada bi formirali uzorak izraunali bi i njegovu aritmetiku sredinu. Teoretski, za svaku veliinu
uzorka mogli smo formirati beskonano mnogo uzoraka, odnosno aritmetikih sredina. Za potrebe
demonstracije dovoljno je da broj uzoraka, tj. aritmetikih sredina bude 20. U tabeli ispod navedene
su aritmetike sredine uzoraka razliitih veliina dobivenih u eksperimentu kao i aritmetike sredine
i standardne devijacije aritmetikih sredina uzoraka (M i s).
Tabela 7.1: Aritmetike sredine uzoraka veliina N=5, N=100 i N=5000
Redni broj
uzorka
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
M
s
N=5
48,8
49,4
42,8
47,4
43,2
50,0
48,8
56,6
53,2
44,8
54,8
47,2
51,0
53,4
54,4
50,2
50,6
49,2
48,6
48,2
49,6
3,7
Veliina uzorka
N=100 N=5000
50,5
49,8
50,9
50,0
50,9
49,9
51,4
49,8
50,9
49,7
50,2
49,9
51,3
49,8
52,8
49,7
50,1
49,8
49,3
49,7
52,4
49,8
49,1
49,8
50,1
49,9
50,2
49,8
48,7
49,9
48,9
49,8
49,8
49,7
51,1
49,7
50,3
49,9
51,4
50,1
50,5
49,8
1,1
0,1
100
Na osnovu aritmetikih sredina prikazanih u tabeli 7.1 moemo primjetiti da se u sluaju

uzoraka veliine N=5 dobivaju aritmetike sredine u najveem rasponu (od 42,8 do 56,6), dok je u
sluaju uzoraka veliine N=5000 raspon znatno manji (od 49,1 do 50,1). Uostalom, standardne
devijacije aritmetikih sredina potvruju ono to moemo primjetiti pregledom vrijednosti
aritmetikih sredina uzoraka. Najnia standardna devijacija dobivena je za uzorke veliine N=5000,
a najvea za uzorke veliine N=5. Nadalje, ako uporedimo aritmetike sredine uzoraka razliitih
veliina, moemo primjetiti da su aritmetike sredine uzoraka veliine N=5000 u pravilu blizu
pravoj aritmetikoj sredini, dok se tek poneka aritmetika sredina za uzorke veliine N=5 pribliava
pravoj aritmetikoj sredini (npr. 50,0).
Ako bi nastavili eksperiment i formirali znatno vei broj aritmetikih sredina uzoraka, mogli bi
vidjeti da se one distribuiraju prema normalnoj raspodjeli. Aritmetika sredina aritmetikih sredina
bila bi jednaka pravoj aritmetikoj sredini. Mogli bi se uvjeriti da vrijede sljedea pravila:
1. Aritmetika sredina aritmetikih sredina uzoraka (populacija aritmetikih sredina uzoraka)
iste veliine jednaka je pravoj aritmetikoj sredini, tj. aritmetikoj sredini populacije.
M =
2. Varijanca populacije aritmetikih sredina uzoraka jednaka je varijanci originalne populacije,
podjeljenoj s veliinom uzorka.
2M =2 / N
3. Varijance uzoraka ine takvu raspodjelu oko prave varijance da im aritmetika sredina
odgovara pravoj varijanci:
s2 = 2
4. Standardna devijacija aritmetikih sredina uzoraka oko prave aritmetike sredine populacije
je standardna pogreka aritmetike sredine.
sM = M
Dakle, standardna pogreka aritmetike sredine uzorka zapravo je standardna devijacija
aritmetikih sredina uzoraka oko prave aritmetike sredine populacije.
101
PRIMJER 7.1
Istraiva je u jednom manjem mjestu zaposlene graane pitao o visini njihove mjesene
zarade. Na taj nain dobio je bazu podataka sa iznosima mjesenih plata za N=10000 ispitanika
[obzirom da se u ovom skupu nalaze sve zaposlene osobe koje ive u tom mjestu, ovaj skup
nazivamo populacijom (zaposlenih osoba tog mjesta), a vrijednosti koje utvrdimo na ovim podacima
parametrima]. U tabeli 7.1.1 prezentirane su vrijednosti parametara ove populacije.
Tabela 7.1.1: Populacijske deskriptivne vrijednosti varijable Mjesena primanja (N=10000)
Medijan
Skjunis
Kurtozis
Raspon
Minimum
Maximum
1200,47
1201,00
259,63
0,02
-0,08
1979,94
204,90
2184,84
Prema ovim pokazateljima moemo zakljuiti da je rije o normalno distribuiranoj varijabli,

to nam potvruje i donja slika:
Slika 7.1.1.: Distribucija mjesenih primanja u populaciji (N=10000)

1600
1400
1200
1000
f 800
600
400
200
2101 - 2200,5
2001 - 2100,5
1901 - 2000,5
1801 - 1900,5
1701 - 1800,5
1601 - 1700,5
1501 - 1600,5
1401 - 1500,5
1301 - 1400,5
1201 - 1300,5
1101 - 1200,5
1001 - 1100,5
901 - 1000,5
801 - 900,5
701 - 800,5
601 - 700,5
501 - 600,5
401 - 500,5
301 - 400,5
201 - 300,5
Kategorija mjesenih primanja (KM)
Ovim primjerom elimo demonstrirati da do zadovoljavajue procjene populacijske

aritmetike sredine (=1200,47) moemo doi i preko uzorka. Prednost rada sa uzorcima umjesto
sa populacijama jasna je ako razmislimo o utedama (u vremenu i novcu) koje moemo ostvariti ako
anketiramo uzorak od npr. 300 zaposlenih graana, umjesto njih svih 10000.
Teoretski, iz nae populacije moemo po sluaju izvui jako veliki broj razliitih uzoraka
iste veliine, npr. veliine n=30 (ili npr. n=300 ili npr. n=800); kada kaemo razliiti uzorci iste
veliine mislimo na uzorke koji sadre jednak broj ispitanika, ali koji se razlikuju u bar jednom od
tih ispitanika. Kako bismo detaljnije demonstrirali principe izloene u uvodnom dijelu ovog
poglavlja za poetak emo iz ove populacije izvui 50 uzoraka veliine n=30. Za svaki od
formiranih uzoraka izraunat emo aritmetiku sredinu ime emo dobiti distribuciju od ukupno 50
102
aritmetikih sredina. Dobivene aritmetike sredine i standardne devijacije za svaki formirani uzorak
prezentirane su u tabeli 7.1.2.
Tabela 7.1. 2: Aritmetike sredine i standardne devijacije uzoraka

Redni broj
uzorka
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
1159,21
1214,20
1195,01
1278,40
1161,32
1240,94
1215,48
1176,50
1221,17
1200,65
1216,56
1217,22
1278,56
1199,91
1155,46
1206,81
1183,36
1149,56
1193,08
1252,95
1228,54
1232,06
1164,10
1227,48
1193,44
1255,06
1171,73
1221,07
1296,07
1280,11
1191,20
1237,17
1281,10
1207,93
1174,78
1185,07
1187,82
1174,19
1264,19
1239,55
1126,24
1265,88
1201,25
1245,73
1202,71
1140,33
1093,32
1213,18
1149,27
1255,80
237,79
239,18
268,70
238,58
217,88
212,18
247,92
211,59
214,70
253,94
262,68
235,36
273,00
273,00
300,92
257,02
269,74
262,79
216,72
251,02
246,04
268,92
269,81
252,53
237,11
215,68
211,25
252,71
240,02
301,00
228,79
282,83
165,10
225,83
252,89
265,55
285,36
274,89
234,01
257,59
288,01
291,30
324,63
287,20
284,12
194,30
223,49
238,48
266,60
279,99
M
s
1208,45
44,10
251,81
Prije svega, primjeujemo da niti jedna od utvrenih aritmetikih sredina formiranih uzoraka
ne odgovara (u potpunosti) aritmetikoj sredini populacije. Sve aritmetike sredine uzoraka vie ili
manje variraju oko prave populacijske aritmetike sredine. Ova pojava je sasvim oekivana
aritmetiku sredinu uzorka koja u potpunosti odgovara aritmetikoj sredini populacije po sluaju
moemo oekivati iznimno rijetko.
Ipak, ukoliko populacijska distribucija ima oblik normalne raspodjele te ukoliko iz te
populacije po sluaju formiramo dovoljan broj uzoraka iste veliine i izraunamo njihove
103
aritmetike sredine, primjetiemo da se te aritmetike sredine uzoraka grupiraju oko jedne centralne
vrijednosti u obliku normalne raspodjele. Centralna vrijednost oko koje se te aritmetike sredine
grupiraju odgovara pravoj populacijskoj aritmetikoj sredini (vidi pravilo 1 u uvodnom dijelu).
Kako smo mi iz nae poetne, normalne populacije od 10000 lanova formirali relativno
veliki broj uzoraka (50) iste veliine (n=30), moemo empirijski provjeriti gornju tvrdnju. Dakle, iz
tabele 7.1.2 vidimo da zajednika aritmetika sredina aritmetikih sredina svih uzoraka, tj.
aritmetika sredina distribucije aritmetikih sredina uzoraka iznosi M=1208,453. Ova
vrijednost bliska je populacijskoj aritmetikoj sredini od =1200,47. Slika 7.1.2 ilustrira kako se
aritmetike sredine uzoraka distribuiraju oko svoje zajednike aritmetike sredine.
Slika 7.1.2: Distribucija aritmetikih sredina 50 uzoraka veliine n=30

12
10
f 6
1291 - 1310,5
1271 - 1290,5
1251 - 1270,5
1231 - 1250,5
1211 - 1230,5
1191 - 1210,5
1171 - 1190,5
1151 - 1170,5
1131 - 1150,5
1111 - 1130,5
1091 - 1110,5
Aritmetike sredine uzoraka (mjesena primanja u KM)
Kao to se vidi, gornja distribucija priblino odgovara teoretskoj normalnoj distribuciji.

Prema pravilu 2, varijanca distribucije aritmetikih sredina uzoraka jednaka je varijanci originalne
populacije, podjeljenoj s veliinom uzorka, tj:
s2M = 2 / N
U uvodnom dijelu, za oznaavanje deskriptivnih vrijednosti distribucije aritmetikih sredina uzoraka koriteni su simboli za oznaavanje
populacijskih vrijednosti ( i ) obzirom da se misli na teoretsku, beskonano veliku populaciju aritmetikih sredina beskonano velikog
broja uzoraka iste veliine koji se mogu izvui iz beskonano velike poetne populacije. Obzirom da u ovom primjeru radimo sa
konkretnom distribucijom aritmetikih sredina 50 uzoraka (to je, u sutini, samo uzorak svih moguih aritmetikih sredina uzoraka koji
se mogu izvui iz poetne populacije), za oznaavanje deskriptivnih vrijednosti ove distribucije koristiemo se oznakama koje se i inae
koriste za uzorke M i s.
104
Obzirom da se standardna devijacija dobiva jednostavnim korjenovanjem vrijednosti varijance,

gornja formula se moe izraziti i za standardnu devijaciju:
s2M = 2 / N
tj.
sM = / N
Dakle, ukoliko standardnu devijaciju populacije podijelimo korjenom broja ispitanika u
uzorku dobit emo vrijednost standardne devijacije distribucije aritmetikih sredina uzoraka. Ovu
tvrdnju provjerit emo na naem primjeru.
Standardna devijacija populacije iznosi =259,63 (vidi tabelu 7.1.1). Ako ovu vrijednost
podjelimo korjenom broja ispitanika u uzorku (n=30) dobit emo:
sM = 259,63/ 30 = 47,40
Ova vrijednost je slina (mada ne identina) standardnoj devijaciji aritmetikih sredina
uzoraka oko njihove zajednike standardne devijacije koja iznosi 44,10 (vidi tabelu 7.1.2).
Prema pravilu 3 varijance uzoraka ine takvu raspodjelu oko prave varijance da im
aritmetika sredina odgovara pravoj varijanci, odnosno:
Ms2 = 2
Ako i ovu formulu prevedemo u termine standardne devijacije dobit emo:
Ms = ,
tj. prosjek standardnih devijacija uzoraka jednak je standardnoj devijaciji populacije. Provjerimo to
na naem primjeru u tabeli 7.1.2 moemo vidjeti da je prosjena standardna devijacija 50 uzoraka
Ms=251,81 to je vrijednost slina populacijskoj standardnoj devijaciji = 259,63.
Primjetili ste da u dosadanjem dijelu ovog Proglavlja kada govorimo o odnosu populacijskih
vrijednosti i vrijednosti koje izraunavamo za distribuciju aritmetikih sredina uzoraka esto
koristimo odrednice priblino, blisko, slino, tj. da nije demonstrirana apsolutna tanost tri
razmatrana pravila. Razlog za to je to ova pravila vrijede za teoretske, beskonano velike populacije
iz kojih po sluaju izvlaimo beskonano veliki broj uzoraka iste veliine. Ipak, i kada radimo sa
realnim populacijama i brojem uzoraka koji je relativno mali (u naem primjeru samo 50) vidimo da
navedena pravila prilino dobro funkcioniraju.
Jedan od naina da se jo vie pribliimo populacijskim vrijednostima (pored izvlaenja veeg
broja uzoraka iz populacije) jeste da iz populacije izvlaimo vee uzorke. Slino kao i u uvodnom
dijelu, to emo demonstrirati tako to emo iz nae populacije izvui po 50 sluajnih uzoraka
veliine n=300, odnosno n=800.
105
U tabeli 7.1.3 nainjena je komparacija triju formiranih distribucija od po 50 uzoraka (veliine

n=30, n=300 i n=800); s ciljem usporedbe, prezentirani su i populacijski parametri.
Tabela 7.1.3.
Redni broj
uzorka
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
M
1159,21
1214,20
1195,01
1278,40
1161,32
1240,94
1215,48
1176,50
1221,17
1200,65
1216,56
1217,22
1278,56
1199,91
1155,46
1206,81
1183,36
1149,56
1193,08
1252,95
1228,54
1232,06
1164,10
1227,48
1193,44
1255,06
1171,73
1221,07
1296,07
1280,11
1191,20
1237,17
1281,10
1207,93
1174,78
1185,07
1187,82
1174,19
1264,19
1239,55
1126,24
1265,88
1201,25
1245,73
1202,71
1140,33
1093,32
1213,18
1149,27
1255,80
s
237,79
239,18
268,70
238,58
217,88
212,18
247,92
211,59
214,70
253,94
262,68
235,36
273,00
273,00
300,92
257,02
269,74
262,79
216,72
251,02
246,04
268,92
269,81
252,53
237,11
215,68
211,25
252,71
240,02
301,00
228,79
282,83
165,10
225,83
252,89
265,55
285,36
274,89
234,01
257,59
288,01
291,30
324,63
287,20
284,12
194,30
223,49
238,48
266,60
279,99
M
s
1208,45
44,10
n = 30
n = 300
n = 800
1212,80
252,24
1205,77
258,32
1171,57
246,16
1187,69
268,43
1198,13
246,79
1209,88
248,12
1213,14
259,72
1193,99
258,77
1235,48
266,99
1197,00
253,27
1214,32
270,36
1190,70
244,02
1187,89
249,13
1201,27
252,40
1186,08
263,07
1207,79
259,31
1185,73
262,41
1190,56
264,03
1183,70
256,35
1213,49
248,96
1193,68
248,90
1216,45
248,39
1216,49
254,39
1194,98
254,73
1201,29
254,61
1208,70
256,15
1191,34
260,68
1193,45
257,56
1182,94
265,45
1201,16
256,61
1182,29
275,51
1202,33
265,18
1185,35
277,03
1209,66
264,35
1187,75
277,65
1184,40
258,92
1203,41
252,27
1212,43
252,60
1192,18
269,66
1194,32
261,26
1215,83
258,51
1191,88
262,74
1200,76
241,56
1194,11
258,97
1190,14
279,29
1206,70
256,39
1228,05
251,95
1202,84
256,85
1204,94
262,48
1191,34
253,98
1190,77
254,68
1200,20
268,44
1188,23
251,53
1195,80
245,25
1205,05
264,23
1204,73
258,14
1199,41
256,49
1194,88
266,50
1223,49
265,27
1214,20
252,56
1220,95
286,11
1211,56
261,39
1192,60
283,42
1193,05
259,50
1189,22
256,46
1202,08
263,06
1206,08
255,90
1208,79
250,54
1202,25
262,98
1212,08
257,34
1190,49
264,05
1209,52
257,42
1197,87
268,06
1202,61
266,85
1214,96
243,33
1205,10
261,60
1189,62
270,30
1209,66
257,23
1221,46
250,39
1205,57
268,07
1163,68
250,56
1192,17
253,91
1202,90
255,26
1203,01
256,18
1185,99
260,71
1198,76
261,86
1209,04
253,01
1189,05
275,81
1210,58
268,66
1204,23
260,74
1207,22
256,21
1194,54
269,08
1192,34
260,13
1189,54
253,00
1226,84
270,23
1196,20
259,48
1186,71
264,93
1210,77
258,50
1200,06
260,13
1185,91
267,40
251,81
1199,66
15,03
260,72
1200,74
8,45
258,60
1200,47
259,63
Populacijske vrijednosti:
Kao i u primjeru u uvodnom dijelu, primjetno je da distribucija sa najveim uzorcima

(n=800) ima aritmetiku sredinu koja je najblia pravoj aritmetikoj sredini populacije. Takoer, ova
distribucija pokazuje najmanje rasprenje (s=8,45), odnosno aritmetike sredine ovih uzoraka se
106
najue grupiraju oko svoje zajednike aritmetike sredine (koja je, jo jednom, vrlo bliska
populacijskoj aritmetikoj sredini razlika je samo 0,27 KM).
Razlike izmeu distribucija aritmetikih sredina uzoraka razliite veliine jo su uoljivije
na slici 7.1.3.
Slika 7.1.3.: Usporedba distribucija 50 aritmetikih sredina uzoraka veliina n=30, n=300 i n=800
n = 30
n = 300
25
12
10
20
8
15
f 6
f
10
4
2
1291 - 1310,5
1271 - 1290,5
1251 - 1270,5
1231 - 1250,5
1211 - 1230,5
1191 - 1210,5
1171 - 1190,5
1151 - 1170,5
1131 - 1150,5
1091 - 1110,5
1111 - 1130,5
1291 - 1310,5
1271 - 1290,5
1251 - 1270,5
1231 - 1250,5
1211 - 1230,5
1191 - 1210,5
1171 - 1190,5
1151 - 1170,5
1131 - 1150,5
1111 - 1130,5
1091 - 1110,5
n = 800
40
35
30
25
f 20
15
10
5
1291 - 1310,5
1271 - 1290,5
1251 - 1270,5
1231 - 1250,5
1211 - 1230,5
1191 - 1210,5
1171 - 1190,5
1151 - 1170,5
1131 - 1150,5
1111 - 1130,5
1091 - 1110,5
Za vjebu, provjerite koja od tri predstavljene distribucije najtanije ilustriraju pravila 2 i 3

iz uvodnog dijela poglavlja.
Sada emo se koncentrirati na pravilo 4 koji je u osnovi postupka statistikog zakljuivanja
i koji glasi: Standardna devijacija aritmetikih sredina uzoraka oko prave aritmetike sredine
populacije je standardna pogreka aritmetike sredine:
sM = M.
Podsjetimo se jo jednom da je statistiko zakljuivanje postupak zakljuivanja o populaciji
na temelju vrijednosti utvrenih na uzorku. Osnovu za ovakvo zakljuivanje prua nam upravo
standardna pogreka aritmetike sredine.
107
Standardna pogreka se rauna prema izrazu:

sM =s / N
pri emu je:
s standardna devijacija uzorka,
N veliina uzorka.
Primjeujete da se ova formula temelji na vrijednostima koje dobijamo na uzorku. To je
sasvim razumljivo: iz gore navedenih razloga, istraivanja vrlo rijetko provodimo na cijelim
populacijama. Ono to radimo mnogo ee jeste da iz populacije po sluaju izvuemo jedan uzorak
i preko njegovih deskriptivnih vrijednosti pokuavamo zakljuiti o pravim populacijskim
vrijednostima.
U praksi bi to izgledalo ovako: iz nae poetne populacije od 10000 zaposlenih graana (o
ijim mjesenim primanjima ne znamo nita to je i razlog provoenja istraivanja) bismo po
sluaju izvukli samo jedan uzorak veliine, npr., n=800 ispitanika. Nakon to smo statistiki obradili
odgovore ovih 800 ispitanika na pitanje koliko mjeseno zarauju, dobili smo aritmetiku sredinu
mjesenih primanja od M=1202,54 KM i standardnu devijaciju s=259,76 KM. Na temelju ovih
vrijednosti elimo procijeniti prosjenu mjesenu platu naih 10000 graana.
Ono to teoretski znamo jeste sljedee:
1. na uzorak samo je jedan od svih moguih uzoraka veliine n=800 koji se mogu izvui iz
nae populacije;
2. dakle, aritmetika sredina naeg uzorka je samo jedna od svih moguih aritmetikih
sredina svih moguih uzoraka veliine n=800 koji se mogu izvui iz nae populacije, a
koje ine teoretsku distribuciju aritmetikih sredina uzoraka;
3. obzirom da (pretpostavljamo) da se mjesena primanja naih 10000 graana distribuiraju u
obliku normalne distribucije, i teoretska distribucija aritmetikih sredina uzoraka ima oblik
normalne distribucije;
4. aritmetika sredina ove teoretske distribucije aritmetikih sredina uzoraka jednaka je
pravoj populacijskoj aritmetikoj sredini (vidi pravilo 1 i gornju diskusiju)
5. standardna devijacija ove distribucije aritmetikih sredina uzoraka jednaka je standardnoj
devijaciji originalne populacije i rauna se prema formuli:
M = / N
(vidi pravilo 2 i gornju diskusiju);
6. obzirom da ne znamo koliko iznosi populacijska standardna devijacija, najbolja
aproksimacija standardne devijacije distribucije aritmetikih sredina uzoraka do koje
108
moemo doi jeste ona preko standardne devijacije uzorka, a koja se naziva standardna
pogreka aritmetike sredine i koja se rauna prema formuli:
sM = s / N
7. obzirom da je rije o normalnoj distribuciji, i za distribuciju aritmetikih sredina uzoraka
vrijede principi po kojima kada aritmetikoj sredini te distribucije dodamo jednu, dvije,
odnosno tri standardne devijacije te distribucije, obuhvatamo raspon od 68,26, 95,44,
odnosno 99,73% rezultata te distribucije. Jo jednom, (a) rezultati koji ine distribuciju
aritmetikih sredina uzoraka nisu nita drugo do aritmetike sredine svih sluajnih uzoraka
iste veliine koji se mogu izvui iz poetne populacije; (b) aritmetika sredina te
distribucije nije nita drugo do prava aritmetika sredina populacije; (c) standardna
devijacija te distribucije nije nita drugo do standardna pogreka aritmetike sredine.
Grafiki, distribucija aritmetikih sredina uzoraka izgledala bi kao to je prikazano na slici
7.2.
Slika 7-1. Distribucija aritmetikih sredina uzoraka
Slika 7.1.4.: Distribucija aritmetikih sredina uzoraka
1 sM: 68,26 % rezultata

Postotak rezultata koji se nalaze u naznaenim intervalima oko aritmetike sredine raspodjele
(a to je populacijska aritmetika sredina) nije nita drugo do vjerovatnoama da emo kada po
sluaju izvlaimo jedan rezultat iz ove raspodjele dobiti rezultat ba iz tog intervala.
Prilikom izvlaenja sluajnog uzorka iz populacije i raunanja njegove aritmetike sredine mi
radimo upravo to iz distribucije aritmetikih sredina uzoraka po sluaju izvlaimo jednu
aritmetiku sredinu. Pri tome imamo vjerovatnou od 68,26, 95,44, odnosno 99,73% da emo
izvui aritmetiku sredinu koja je od populacijske aritmetike sredine () udaljena manje od jedne,
dvije, odnosno tri standardne pogreke aritmetike sredine (sM).
Koristei se obratnom logikom ako naoj aritmetikoj sredini uzorka (M) dodamo i
oduzmemo jednu, dvije, odnosno tri standardne pogreke aritmetike sredine (sM) imaemo ansu od
68,26, 95,44, odnosno 99,73% da emo u istom tom intervalu obuhvatiti i pravu populacijsku
aritmetiku sredinu. U svrhu ilustracije ta je situacija prikazana na slici 7.3.
109
Slika 7.3: Distribucija aritmetikih sredina uzoraka-razliiti intervali u kojima

oekujemo pravu aritmetiku sredinu
Slika 7.1.4.a.
M 1 sM: 68,26 % rezultata

Provjerimo da li ovaj princip vrijedi i za na uzorak od n=800 i sa M=1202,54 KM i

s=259,76 KM.
Standardna pogreka iznosi:
sM =
s
N
259,76
800
= 9,18
Ako ovu vrijednost jednom, dva, odnosno tri puta dodamo i oduzmemo vrijednosti M dobit emo
sljedee intervale:
Interval I: 1193,36 - 1211,72
Interval II: 1184,17 - 1220,91
Interval III: 1174,99 - 1230,09
Kao to vidite, svi ovi intervali sadre vrijednost populacijske aritmetike sredine,
=1200,47 KM. Dakle, u stvarnim istraivanjima provedenim na uzorcima mi nikada neemo znati
tanu vrijednost populacijske aritmetike sredine; najvie to emo moi uiniti jeste odrediti
interval u kojem se sa odreenim stepenom sigurnosti ta aritmetika sredina nalazi. Ti intervali
nazivaju se intervalima pouzdanosti i vezuju se uz odreeni stupanj sigurnosti da se u njima
nalazi traena vrijednost populacijske aritmetike sredine. Tako, za interval I sa 68,26% sigurnosti
tvrdimo da se u njemu nalazi populacijska aritmetika sredina; za interval II to tvrdimo sa 95,44%
sigurnosti; za interval III sa 99,73% sigurnosti.
110
PRIMJER 7.3
U primjeru 5.6 opisali smo eksperiment studenata psihologije sa bacenjem para igraih
kockica 900 puta. Sada emo iste dobivene rezultate iskoristiti za ilustraciju principa uzorkovanja i
distribuiranja aritmetikih sredina uzoraka oko prave (populacijske) aritmetike sredine .
Pri tome emo, naravno, krenuti od populacije. Nau populaciju u ovom sluaju ini 900
rezultata dobivenih bacanjem para kocaka (mogui rezultati kreu se u rasponu od 2 do 12).
Prisjetimo se i izgleda raspodjele rezultata koje dobijemo bacajui par kocaka 900 puta (vidi sliku
5.2.3). Ta je raspodjela ponovo prikazana na slici 7.1.1 i ovaj put je nazvana populacijskom
raspodjelom (obzirom da predstavlja nau populaciju od N=900 rezultata). Ve znamo da ova
distribucija ima =7,13 i =2,43.
Slika 7.1.1. Populacijska distribucija rezultata bacanja dvije kockice (N=900; =

7,127; =2,431)
160
0,18
140
0,16
120
0,14
0,12
100
0,1
f 80
0,08
60
0,06
40
0,04
20
0,02
0
1
10
11
12
13
Rezultat
Svaki par studenata dvije kockice je bacao po 20 puta. Ukupno je bilo 45 parova studenata,
ime dobivamo nau populaciju od ukupno 900 rezultata. Obzirom da rezultati svakog pojedinog
para studenata mogu predstavljati jedan od moguih uzoraka koji se moe izvui iz nae populacije,
ove skupove od po 20 rezultata koje su dobili pojedinani parovi studenata od sada emo nazivati
uzorcima. Vano je napomenuti da su svi uzorci iste veliine, n=20. U tabeli 7.1.1 prikazane su
aritmetike sredine za 45 uzoraka.
Na osnovu aritmetikih sredina pojedinanih uzoraka moemo izraunati zajedniku
aritmetiku sredinu, odnosno aritmetiku sredinu aritmetikih sredina uzoraka te standardnu
devijaciju ove distribucije aritmetikih sredina uzoraka. Kako bismo ovu zajedniku aritmetiku
sredinu razlikovali od aritmetike sredine populacije () i aritmetikih sredina pojedinanih uzoraka
(M), oznait emo je sa X. Standardnu devijaciju aritmetikih sredina uzoraka oko njihove
zajednike aritmetike sredine oznait emo sa s.
111
Tabela 7.1.1: Aritmetike sredine 45 uzoraka

R. br.
uzorka
R. br.
uzorka
R. br.
uzorka
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
7,40
6,25
6,55
7,45
8,35
7,80
7,60
6,60
6,20
7,15
6,70
7,80
7,60
7,55
7,60
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
7,45
6,25
8,05
7,05
7,05
7,15
7,15
7,05
7,50
6,55
7,05
7,80
6,70
7,05
6,25
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
7,60
8,00
7,45
7,50
6,80
6,05
6,30
7,15
8,45
7,00
6,90
6,75
6,45
6,35
7,25
N
X'
s'
45
7,127
0,597
Dakle, aritmetika sredina pojedinanih uzoraka iznosi X=7,13. Kao to vidite, aritmetika
sredina distribucije aritmetikih sredina uzoraka iste veliine koji su po sluaju izvueni iz
populacije istovjetna je populacijskoj (pravoj) aritmetikoj sredini.
Aritmetike sredine pojedinih uzoraka distribuiraju se oko ove zajednike (tj. populacijske)
aritmetike sredine u obliku normalne distribucije.
Iako gornja tvrdnja vrijedi za veliki broj uzoraka (teoretski, za beskonano veliki broj uzoraka
iste veliine koji se izvlae iz beskonano velike populacije), tendencija normalnog distribuiranja
aritmetikih sredina uzoraka oko populacijske aritmetike sredine primjetna je i na grafikom
prikazu distribucije naih 45 aritmetikih sredina (slika 7.1.2). [Ukoliko bismo iz nae populacije od
N=900 nastavili izvlaiti nove i nove uzorke veliine n=20, donja distribucija bi sve vie nalikovala
normalnoj distribuciji].
Slika 7.1.2 Distribucija aritmetikih sredina uzoraka (broj

uzoraka 45; veliina uzorka n=20; veliina populacije
N=900); X'=7,127; s'=0,597
14
12
10
f
8
6
4
2
0
6
6,5
7,5
8,5
Vrijednost aritmetikih sredina
Iako je aritmetika sredina populacije istovjetna aritmetikoj sredini aritmetikih sredina

uzoraka (7,13), obratite panju da se standardne devijacije distribucije rezultata u populaciji i
distribucije aritmetikih sredina znaajno razlikuju (=2,43 naspram s=0,60).
112
Standardna devijacija koju smo izraunali za distribuciju aritmetikih sredina uzoraka

(s=0,60) priblino odgovara vrijednosti standardne pogreke aritmetike sredine koja se oznaava
simbolom sM. Standardna pogreka aritmetike sredine rauna se na temelju standardne devijacije
uzorka i veliine uzorka, prema izrazu:
s
sM =
Ova vrijednost je uvijek manja od standardne devijacije populacije. Razlog tome je to

aritmetike sredine uzoraka koje izvlaimo iz date populacije manje variraju oko svoje zajednike
aritmetike sredine nego to originalni rezultati u toj populaciji variraju oko aritmetike sredine
populacije. Jo jednom napominjemo da je aritmetika sredina distribucije aritmetikih sredina
uzoraka istovjetna populacijskoj aritmetikoj sredini).
U istraivanjima rijetko unaprijed znamo vrijednost populacijske aritmetike sredine (zapravo,
za to i nema potrebe), ali ovu vrijednost ipak moemo procijeniti na temelju aritmetike sredine
jednog uzorka. Na koji nain? Vratimo se na na primjer. Zamislite da nismo znali koja je to
aritmetika sredina nae populacije od 900 rezultata. Nadalje, zamislite da smo umjesto 45 razliitih
uzoraka iz ove populacije izvukli samo jedan sluajni uzorak veliine n=20. Pretpostavimo da smo
na tako dobijenom uzorku utvrdili M=7,70 i s=2,28. Na zadatak je da na temelju ovih vrijednosti
procjenimo vrijednost aritmetike sredine populacije!
Ono to prvo moemo primjetiti jeste da niti aritmetika sredina uzorka niti njegova
standradna devijacija ne odgovaraju vrijednostima parametara.
No, ono to teoretski znamo jeste da u sluaju normalne distribucije (kakva je naa
populacijska distribucija) interval vrijednosti definiran kao:
obuhvata 68,26% svih rezultata, da interval
2 obuhvata 95,44% svih rezultata, a da interval
3 obuhvata 99,73% svih rezultata u populacijskoj distribuciji.
Ako ovu logiku primjenimo na distribuciju aritmetikih sredina uzoraka, znaemo da kada
aritmetikoj sredini te distribucije (koja nije nita drugo do populacijska aritmetika sredina)
dodamo i oduzmemu jednu, dvije, odnosno tri standardne devijacije te distribucije (a to je
standardna pogreka aritmetike sredine) imamo intervale koji obuhvataju 68,26%, 95,44%,
odnosno 99,73% rezultata u distribuciji (a ti rezultati nisu nita drugo do sve aritmetike sredine
uzoraka koje je mogue izvui iz populacije).
Jedna od tih aritmetikih sredina koje ine distribuciju svih moguih aritmetikih sredina je i
vrijednost koju smo izraunali na naem uzorku.
113
Slika 7.2: Distribucija aritmetikih sredina uzoraka veliine n=20

1
1
1
0
0
0
M= 7,73
X' = =7,13
X's M
9,50
9,25
9,00
8,75
8,50
8,25
8,00
7,75
7,50
7,25
7,00
6,75
6,50
6,25
6,00
5,75
5,50
5,25
5,00
4,75
4,50
68,26%
95,44%
X'1,96s M
99,73%
X'2,58s M
Ako sada jo jednom primjenimo istu logiku samo u obratnom smjeru moemo zakljuiti
sljedee: ako aritmetikoj sredini jednog uzorka dodamo i oduzmemo jednu, dvije, odnosno tri
standardne pogreke aritmetike sredine, imat emo 68,26%, 95,44%, odnosno 99,73% anse da u
dobivenim intervalima obuhvatimo i vrijednost prave aritmetike sredine (vidi gornju sliku).
Razlog zato aritmetikoj sredini uzorka dodajemo i oduzimamo standardnu pogreku
aritmetike sredine jeste taj to mi ne znamo koja je vrijednost standardne devijacije u distribuciji
aritmetikih sredina uzoraka (podsjeamo, iz populacije izvlaimo samo jedan uzorak). Standardna
pogreka aritmetike sredine slui nam kao procijena vrijednosti standardne devijacije
distribucije aritmetikih sredina uzoraka!
Prema tome, koristei formulu za standardnu pogreku aritmetike sredine:
s
sM =
na naem uzorku dobivamo da je standardna pogreka aritmetike sredine:
sM =
2,28
20
= 0,51
Kao to se moe vidjeti, rije je o vrlo bliskoj vrijednosti standardne pogreke koju smo
izraunali kao standardnu devijaciju distribucije aritmetikih sredina 45 uzoraka (sM = 0,60).
Da zakljuimo: na temelju vrijednosti M i s uzorka te njegove veliine, moemo (raunajui
standardnu pogreku aritmetike sredine uzorka) doi do procjene o vrijednosti aritmetike sredine
populacije!
114
PRIMJER 7.3
Ljekar ope prakse eli doi do informacije o prosjenoj visini populacije djeaka izmeu 10 i
12 godina Kantona Sarajevo. Meutim zbog praktine neizvodljivosti, ljekar niti ne razmilja o
provoenju istraivanja na cjelokupnoj populaciji. Umjesto toga, svoje e istraivanje provesti na
reprezentativnom (sluajnom) uzorku uenika sarajevskih osnovnih kola koji imaju izmeu 8 i 10
godina. Uzorak broji 350 uenika. Vrijednosti utvrene na uzorku su:
M = 139,36 cm
s = 26,22 cm
Na temelju ovih vrijednosti mogue je procijeniti prosjenu visinu muke djece ovog uzrasta u
pripadajuoj populaciji (i uz svaku procjenu mogue je navesti i stupanj sigurnosti da je tana).
Prvo to je ljekar uradio sa dobivenim statisticima jeste da je izraunao standardnu pogreku
aritmetike sredine:
sM =
s
N
26,22
350
= 1,40
U narednom koraku ljekar je izraunao 68, 95 i 99-postotne intervale pouzdanosti aritmetike

sredine:
139,36 1,40:
137,96 140,76
68 %-tni interval pouzdanosti
139,36 2 x 1,40:
136,56 142,16
95%-tni interval pouzdanosti
139,36 3 x 1,40:
135,16 143,56
99%-tni interval pouzdanosti
U svom zavrnom izvjetaju ljekar je naveo da sa 95% sigurnosti tvrdi da se prava prosjena
visina (svih) djeaka izmeu 10 i 12 godina u Kantonu Sarajevo nalazi u intervalu od 136,56 do
142,16 cm.
Dakle, intervale koje dobijemo kada aritmetikoj sredini uzorka na jednoj strani oduzmemo i na
drugoj strani dodamo jednu, dvije, odnosno tri standardne pogreke aritmetike sredine nazivamo
intervalima pouzdanosti aritmetike sredine. Uz svaki interval pouzdanosti vezuje se odreeni
stepen sigurnosti da se u njemu nalazi prava (populacijska) aritmetika sredina (ti odgovarajui
stupanj sigurnosti su 68%, 95%, odnosno 99%).
115
ZADACI
1.
Ukoliko je populacijska standardna devijacija () za neku varijablu 22,5, koja je vrijednost

standardne pogreke aritmetike sredina kada je a) N = 2; b) N = 5; c) N = 25; d) N = 125; e)
N = 545.
2.
Za koliko bismo trebali promijeniti veliinu uzorka da bismo standardnu pogreku aritmetike
sredine smanjili za pola; da bismo standardnu pogreku aritmetike sredine smanjili za 4 puta?
3.
Istraiva je na uzorku N=1.350 utvrdio da je prosjena mjesena zarada u Bosni i

Hercegovini 987 KM, uz standardnu devijaciju 236 KM. Koliko iznosu prava prosjena
mjesena zarada stanovnika Bosne i Hercegovine? Sa kojim stepenom sigurnosti to tvrdite?
4.
Izraunajte standardnu pogreku aritmetike sredine za zadatak 3.1.
5.
6.
7.
8.
Iz tabele 7.1.3 po sluaju odaberite jedan uzorak veliine n=30. Na temelju tog uzorka
procijenite populacijsku aritmetiku sredinu mjesenih primanja u populaciji. Da li vrijede
pravila navedena u uvodnom dijelu?
Ponovite isti postupak kao u prethodnom zadatku, sa jednim uzorkom veliine n=300 koji ste
ponovo po sluaju izvukli iz tabele 7.1.3 Objasnite kako veliina uzorka utie na tanost
procjene populacijske aritmetike sredine.
116
8. Testiranje hipoteza
Istraivanja u psihologiji provode se na uzorcima ispitanika. Meutim, cilj istraivanja je

donoenje zakljuka o populaciji. Na osnovu rezultata koje smo dobili na uzorku ispitanika,
donosimo zakljuke o stanju stvari u populaciji. U prethodnom poglavlju vidjeli smo kako nam
standardna pogreka aritmetike sredine omoguava utvrivanje intervala u kojem se uz odreenu
pouzdanost (p) nalazi aritmetika sredina populacije. Na osnovu statistika uzorka (npr. M)
zakljuujemo o parametru populacije (). Dio statistike koja se bavi procjenama parametara
populacije i testiranjem hipoteza naziva se inferencijalna statistika.
U svom opem znaenju, hipoteze su misaone pretpostavke o nekoj pojavi, odnosima meu
pojavama ili meu iniocima jedne pojave koja je predmet istraivanja. Hipoteza je sinonim za
pretpostavku, odnosno tvrdnju o stanju stvari. U statistici, testiranje hipoteza je postupak kojim se
donosi odluka o stanju stvari u populaciji na osnovu podataka prikupljenih na uzorku (npr. Da li se
aritmetika sredina uzorka statistiki znaajno razlikuje od aritmetike sredine populacije? Da li se
aritmetike sredine dva ili vie uzoraka statistiki znaajno razlikuju?) Hipoteze se formiraju na
osnovi prethodnih teorijskih saznanja, novootkrivenih empirijskih injenica, svakodnevnog iskustva
ili opih vjerovanja.
Statistika hipoteza ukljuuje tvrdnju ili pretpostavku o parametru ili parametrima
populacije (npr. aritmetikoj sredini ili varijanci populacije). Tvrdnja prema kojoj je populacijski
parametar jednak odreenoj vrijednosti ili da su populacijski parametri dvije ili vie grupa jednaki
(npr. Prosjena visina mukaraca ista je kao i prosjena visina ena) naziva se nul-hipoteza (H0).
Openito, prema ovoj hipotezi ne postoji efekat, razlika. Tvrdnja prema kojoj populacijski parametar
nije jednak odreenoj vrijednosti ili da su populacijski parametri dvije ili vie grupa razliiti (npr.
Prosjena visina mukaraca nije ista kao i prosjena visina ena) naziva se alternativna hipoteza
(H1). Openito, prema ovoj hipotezi se oekuje neki efekat, npr. postojanje razlika.
Statistiko testiranje hipoteza zasniva se na metodi dokazivanja poznatoj kao deductio ad absurdum, odnosno, dovoenje do protivrijenosti ako se pretpostavi suprotna tvrdnja. Ako elimo
dokazati neku tvrdnju, onda polazimo od suprotne tvrdnje. Stoga uvijek polazimo od nulte hipoteze.
Postupak testiranja hipoteza slian je sudskoj praksi u kojoj osoba koja je osumnjiena nije kriva
dok se ne dokae suprotno.
Npr., elimo dokazati da je novi lijek efikasan u tretiranju neke bolesti. Tvrdnja prema kojoj lijek ima efekta je
alternativna hipoteza. Da bi dokazali ovu hipotezu, polazimo od suprotne, prema kojoj lijek nema efekta.
Tvrdnja prema kojoj lijek nema efekta je nulta hipoteza. Da bi se dokazala poetna tvrdnja, mora se oboriti
suprotna (provjeravamo ima li dokaza protiv H0, a u korist H1).
117
Statistiki test je postupak pomou kojeg se dolazi do odluke o prihvatanju ili odbacivanje
nulte hipoteze. Zasniva se na sluajnoj varijabli X kojom se matematiki definira distribucija
statistika uzoraka (npr. aritmetikih sredina, razlika izmeu dvije aritmetike sredine, varijanci,
medijana). Statistik uzorka (aritmetika sredina, razlika izmeu aritmetikih sredina, varijanca) je
vrijednost koja se nalazi u odreenom rasponu. Skup vrijednosti statistika za koje odbacujemo
hipotezu H0 nazivamo oblast odbacivanja ili kritina oblast. Veliina oblasti odbacivanja H0
odreena je vjerovatnoom () pojavljivanja statistika uzorka u kritinoj oblasti. Ova vjerovatnoa
naziva se nivo znaajnosti testa i odreuje se kao vjerovatnoa da e vrijednost sluajne varijable X
pasti u kritinu oblast. Nivo znaajnosti moe biti odreen arbitrarno, npr. 0,05 ili 0,01. Na osnovu
unaprijed odreenog nivoa znaajnosti (tj. kritine oblasti) odreujemo i kritine vrijednosti
statistika, tj. granine vrijednosti kritine oblasti.
Na osnovu vrijednosti statistika i kritine oblasti, donosimo zakljuak. Ako statistik testa
pada u oblast odbacivanja, odbacujemo H0. Ako statistik testa nije u oblasti odbacivanja, prihvatamo
H0 (drugim rijeima, ako pada u oblast prihvatanja H0). Praktino, kada je p<, test sugerira
odbacivanje H0 (statistiki znaajno).
Neka je nulta hipoteza da izmeu aritmetike sredine uzorka podataka i aritmetike sredine populacije nema
razlike. Zamislimo da provodimo sljedei eksperiment: iz ciljne populacije metodom sluajnog odabira
formiramo uzorak iste veliine kao i uzorak za iju aritmetiku sredinu testiramo nultu hipotezu. Za ovaj
uzorak izraunamo aritmetiku sredinu. Zatim podatke uzorka vratimo u populaciju i ponovimo isti
postupak: formiramo novi uzorak, izraunamo njegovu aritmetiku sredinu i podatke vratimo u populaciju.
Opisani postupak ponovimo veliki broj puta. Na ovaj nain dobit emo veliki broj aritmetikih sredina
uzoraka. Distribucija aritmetikih sredina uzoraka opisana je sluajnom varijablom X ije se vrijednosti
normalno distribuiraju. Ova distribucija zapravo je distribucija statistika uzoraka. Aritmetika sredina
statistika uzoraka jednaka je aritmetikoj sredini populacije. Standardna devijacija statistika uzoraka zapravo
je standardna pogreka aritmetikih sredina uzoraka. Region odbacivanja H0, granine vrijednosti i region
prihvatanja H0 odreujemo arbitrarno. Distribucija statistika uzoraka, granine vrijednosti i regioni
prihvatanja i odbacivanja H0 prikazani su ispod.
granina
vrijednost
region prihvatanja
region odbacivanja
Izbor statistikog testa prvenstveno zavisi od problema istraivanja, odnosno istraivake

hipoteze. Ako, npr. elimo ispitati hipotezu prema kojoj se mukarci i ene ne razlikuju u verbalnim
sposobnostima, to znai da emo imati dva nezavisna uzorka (mukarci i ene) ije deskriptivne
vrijednosti treba uporediti i, pomou odgovarajueg statistikog testa, donijeti statistiki zakljuak.
118
Izbor statistikog testa zavisi i od skale mjerenja i oblika raspodjele podataka. Zapravo,
statistike testove dijelimo na parametrijske i neparametrijske. Parametrijski testovi koriste se za
provjeru hipoteza o nepoznatoj vrijednosti parametara populacije; preduvjet za njihovo koritenje je
intervalni/ racio nivo mjerenja. Parametrijski testovi se vre na osnovu nekih od teorijskih
raspodjela: normalne, Studentove t-raspodjele, F-raspodjele, binomne raspodjele, itd. Kada su
podaci prikupljeni koritenjem nominalne ili rang skale mjerenja i kada podaci prikupljeni
intervalnom ili racio skalom mjerenja ne zadovoljavaju odreene karakteristike distribucije,
koristimo neparametrijske testove.
Ispod je dat shematski prikaz izbora statistikog testa zavisno od istraivakog problema,
skale mjerenja i odreenih preduvjeta potrebnih za pojedine testove, prema Barry Cohenu4.
Cohen, B. (2011). Explaining Psychological Statistics (1 edition). Wiley, New York

119
120
Ukoliko nam istraivaki nacrt nalae da ispitamo razlike u verbalnim sposobnostima izmeu
mukaraca i ena (tj. izmeu dva nezavisna uzorka), a da smo pri tom podatke prikupili koristei
intervalni nivo mjerenja, i da su podaci normalno rasporeeni, onda emo koristiti t-test. Meutim,
ukoliko su podaci izrazito asimetrine raspodjele, onda e odgovarajui statistiki test biti MannWhitneyev test, a ne t-test.
Kada testiramo hipotezu prolazimo odreene korake. Zavisno od problema istraivanja
postavljamo statistiku nultu hipotezu, te biramo odgovarajui test. Nadalje, na osnovu prihvaenog
nivoa znaajnosti odreujemo granine vrijednost (definiramo oblast prihvatanja H0), odreujemo
statistik testa i poredimo izraunati statsitik s graninom vrijednosu. Na kraju donosimo odluku.
121
Ako se statistik testa nalazi u kritinoj oblasti odbacujemo H0, ako ne, prihvatamo H0. Shematski
prikaz koraka u testiranju hipoteza dat je ispod.
Problem istraivanja
Postavljanje nulte hipoteze H0
Odabir uzorka
Deskriptivne vrijednosti
Izbor statistikog testa
Nivo znaajnosti
Odreivanje (granine) vrijednosti
Izraunavanje statistika testa
Poreenje statistika testa i granine

vrijednosti
Statistik testa u
kritinoj
oblasti?
NE
Prihvata se H0
DA
Odbacuje se H0
Testiranje hipoteze s jednim uzorkom

U nastavku poglavlja prikazat emo postupak testiranje hipoteze s jednim uzorkom.
Istraivaki nacrt kojim u kojem testiramo hipotezu s jednim uzorkom podrazumijeva da poredimo
aritmetiku sredinu uzorka s aritmetikom sredinom populacije. Kada provjeravamo hipotezu o
razlici izmeu poznate populacijske vrijednosti aritmetike sredine i aritmetike sredine uzorka
122
koristimo z-test ili t-test za jedan uzorak. Prvi test koristimo kada je poznata populacijska vrijednost
varijance, a t-test kada nam ova vrijednost nije poznata, pa o njoj zakljuujemo na osnovu varijance
uzorka.
Postupak testiranja hipoteze s jednim uzorkom temelji se na central-limit teoremi (eng.
central limit theorem), jednoj od najpoznatijih teorema u statistici. Prema ovoj teoremi, raspodjela
aritmetikih sredina uzoraka pribliava se normalnoj distribuciji s poveanjem veliine uzorka.
Nadalje, u populaciji sa aritmetikom sredinom i varijancom 2, distribucija aritmetikih sredina
uzoraka imat e aritmetiku sredinu M= i varijancu jednaku 2M= 2/N. Na osnovu central-limit
teoreme, poznate su nam sve vane karakteristike raspodjele (oblik, aritmetika sredina i varijanca),
to nam omoguava testiranje hipoteza o aritmetikim sredinama.
z-test za jedan uzorak

Kao smo ve naveli, z-test koristimo kada nam je poznata populacijska vrijednost varijance.
Na primjeru navedenom ispod objasnit emo logiku z-testa i postupak testiranja hipoteze s jednim
uzokom kada znamo varijancu populacije.
Na grupi uenika (N=100) primjenjen je test inteligencije. Dobivena je aritmetika sredina M=105. Da li se
ova grupa uenika prema mjerenom svojstvnu razlikuje od populacije? Pretpostavimo da nam je poznata
aritmetika sredina populacije, =100.
- Nulta hipoteza: Grupa uenika ne razlikuje se statistiki znaajno od populacije u intelektualnim
sposobnostima.
- Alternativna hipoteza: Grupa uenika razlikuje se statistiki znaajno od populacije u intelektualnim
sposobnostima.
Kako bi utvrdili lokaciju na koju pada statistik uzorka (aritmetika sredina grupe) dobiveni rezultat, tj.
aritmetiku sredinu treba pretvoriti u z-vrijednost. Kada smo odredili z-vrijednost, koristei tabelu za
standardnu normalnu distribuciju, moemo jednostavno odrediti oblast ispod ili iznad z-vrijednosti.
Dakle, koristit emo izraz:
gdje je M aritmetika sredina uzorka, aritmetika sredina populacije, M standardna devijacija distribucije
uzoraka.
Kako bi odredili standardnu devijaciju distribucije uzoraka trebamo poznavati standardnu devijaciju
populacije. Ovaj parametar obino ne poznajemo, ali za neke varijable (kao to je IQ) standardna devijacija
je poznata (jer se rezultati standardiziraju na velikim uzorcima). Pretpostavimo da je =20. Odredit emo zvrijednost:
M
105 100
2,5
20
sM
100
z-vrijednost iznosi 2,5. Sada moemo odrediti oblasti ispod i iznad izraunate z-vrijednosti. Iz tablice moemo
odrediti da je povrina od z=2,5 do kraja krivulje p=0,0062. Prema tome, vjerovatnoa da emo dobiti
vrijednost veu od M=105 (uz uvjet da je uzorak veliine N=100) je veoma mala. Ako bi zamiljeni
eksperiment formiranja velikog broja uzoraka i odreivanja distribucije statistika uzoraka ponovili 1000 puta,
123
tek bi u est sluajeva dobili aritmetiku sredinu uzorka veu od 105. Da li nam je ovo dovoljno za tvrdnju da
je razlika statistiki znaajna? Odgovor na ovo pitanje zavisi od unaprijed definirane kritine oblasti. Uz uvjet
da je nivo znaajnosti =0,05 statistik pada u oblast odbacivanja nulte hipoteze. Odnosno, trebamo uporediti
p-vrijednost i nivo znaajnosti =0,05. Obzirom da je p<,, test sugerira odbacivanje H0.
Statistiki zakljuak mogli smo izvui i na osnovu uporeivanja dobivenog statistika sa kritinom vrijednosti.
Uz nivo znaajnosti od =0,05, granina vrijednost iznosi zgr=1,66. Graninu vrijednost oitavamo iz tablice
za standardnu normalnu distribuciju.
Obzirom da je:
z > zgr,
zakljuujemo da statistik pada u oblast odbacivanja nulte hipoteze. Ispod je ilustrirana distribucija statistika i
poloaj statistika grupe uenika.
region prihvatanja
zgr=1,66
z=2,5
region odbacivanja
Na kraju, rezultat testiranja hipoteza formuliramo na sljedei nain:

z (100)=2,5; p=0,006 ili z (100)=2,5; p<0,001,
Vrijednost u zagradi predstavlja korigirani broj rezultata ili stepene slobode (SS).
t-test za jedan uzorak

U praksi, varijanca populacije (2) najee nije poznata, nego je procjenjujemo na osnovu
varijance uzorka (s2). Stoga se i postupak testiranja hipoteze mijenja: ne koristimo z-vrijednost niti
tablice sa z-vrijednostima. Za testiranje hipoteza s jednim uzorkom, u sluaju kada nam varijanca
populacije nije poznata te je procjenjujemo na osnovu varijance uzorka, koristimo t-test i tablice tvrijednosti. Statistici uzoraka rasporeuju se po Studentovoj t-distribuciji.
t-vrijednost (statistik) izraunava se prema izrazu:
M
sM
Distribucija t-vrijednosti je zvonolika, unimodalna, simetrina, dok je aritmetika sredina

jednaka nuli. Definirana je korigiranim brojem podataka vrijednou koju nazivamo stupnjevi
slobode (SS); jedna t-distribucija ne korespondira svim moguim veliinama uzoraka. Stoga postoji
porodica t-distribucija. Stupnjevi slobode za t-test za jedan uzorak odreuju se prema izrazu: SS=N124
1. to je veliina uzorka vea, to je t-raspodjela slinija normalnoj. Kaemo da kada N, tdistribucija postaje ekvivalentna z-distribuciji.
Na grupi uenika (N=25) primjenjen je test inteligencije. Dobivena je aritmetika sredina M=105. Da li se
ova grupa uenika prema mjerenom svojstvu razlikuje od populacije? Pretpostavimo da nam je poznata
aritmetika sredina populacije, =100.
Nulta hipoteza: Grupa uenika ne razlikuje se od populacije u intelektualnim sposobnostima.
Alternativna hipoteza: Grupa uenika razlikuje se od populacije u intelektualnim sposobnostima.
Izraunat emo t-vrijednost:
M
105 100
5
1,66
15
sM
3
25
Iz tabele t-vrijednosti oitat emo graninu t-vrijednost za SS=24 uz nivo rizika od =0,05:
tgr=1,711.Obzirom da je:
t<tgr,
zakljuujemo da na statistik pada u oblast prihvatanja H0.
Pogreke u statistikom zakljuivanju

Niti jedan statistiki zakljuak o populaciji nije stopostotno siguran (jer se temelji na uzorku);
stoga i prihvaanje neke hipoteze ne znai da je ta hipoteza apsolutno tana. Umjesto "hipotezu
prihvaamo" ispravnije je rei "na osnovi uzorka ne postoji razlog za odbacivanje hipoteze".
Prilikom statistikog zakljuivanja mogue je napraviti dvije vrste pogreaka (tabela 10.1):
pogreka tipa I odbacivanje nulte hipoteze ako je ona istinita (vjerojatnost njenog
pojavljivanja je nivo znaajnosti );
pogreka tipa II prihvaanje nulte hipoteze ako je ona lana.
125
Tabela 8.1: Pogreke u statistikom zakljuivanju

STANJE U POPULACIJI
STATISTIKA ODLUKA
Nema razlike izmeu dvije

aritmetike sredine
Postoji razlika izmeu dvije

aritmetike sredine
Pogreka tipa 1(p=)
Ispravna odluka
lano pozitivan
(p=1-)
Ispravna odluka
Pogreka tipa 2 (p=)
(p=1-)
lano negativan
Odbacujemo nul-hipotezu
Prihvaamo nul-hipotezu
Uz blai kriterij (nii nivo znaajnosti) izlaemo se riziku da proglasimo da se dvije

aritmetike sredine razlikuju, a zapravo meu AS populacije nema razlike. Najee vrijednosti su
0,10; 0,05; 0,01. Rizik od pogreke tipa 1 je pod naom kontrolom jer postavljamo nivo znaajnosti
prije testiranja hipoteze. Obino je to 0,05 ili manje.
Uz stroiji kriterij (vii nivo znaajnosti) izlaemo se riziku da ne proglasimo da se dvije
aritmetike sredine razlikuju, a zapravo meu AS populacije postoji razlika. to je uzorak manji
vea je mogunost pogreke tipa II. Vrijednost 1- predstavlja snagu statistikog testa.
Vjerovatnoe pogreaka tipa I i tipa II su u inverznom odnosu: sa smanjenjem poveava se
, a smanjenjem poveava se .
Jednosmjerno i dvosmjerno testiranja

Ako unaprijed pretpostavimo smjer razlike (npr. M>, ili obratno, M<) region odbacivanja
lociran je na jednom kraju distribucije statistika uzoraka; stoga ovakav test nazivamo jednosmjerni
(direktni) test. Ukoliko pretpostavimo oba smjera razlike (M>, i obratno, M<), region
odbacivanja lociran je na oba kraja distribucije; ovakav test nazivamo dvosmjerni (nedirektni) test.
Razlika izmeu jednosmjernog i dvosmjernog testa je u graninim vrijednostima regiona
odbacivanja H0. S obzirom da se nivo znaajnosti kod dvosmjernog testa dijeli na dva dijela (jedna
polovina s jedne strane, druga s druge strane raspodjele) bit e i razliite granine vrijednosti.
Meutim, ako posmatramo samo jednu stranu raspodjele, tada je vjerovatnoa da e vrijednost
sluajne varijable X pasti u kritinoj oblasti dva puta vea kod jednosmjernog u odnosu na
dvosmjerni test. Razlike izmeu jednosmjernog i dvosmjernog testa ilustrirane su ispod.
126
PRIMJER 8.1
Poimo od hipoteze da je kod bacanja ispravnog novia vjerovatnoa pojavljivanja pisma
p=0,5. Pretpostavimo da smo kod 20 bacanja novia u 17 sluajeva dobili pismo. Rezultat ovog
eksperimenta nije apsolutni dokaz da je novi neispravan (ili da je eksperiment proveden na
neispravan nain) jer nije nemogue da se ovakav rezultat dobije (ak i kod ispravnog novia).
Meutim, iz iskustva znamo da se ovo rijetko moe desiti sa ispravnim noviem. Dobivanje 10 ili
11 pisama ne bi izazvalo sumnju uz hipotezu da je p=0,5, dok 18 ili 19 sluajeva pisma prua
osnovu za odbacivanje ove hipoteze kao malo vjerovatne. Drugim rijeima, rezultat naeg
eksperimenta dovoljan je dokaz protiv hipoteze p=0,5, a u korist hipoteze p>0,5. Gdje je granica
izmeu prihvatanja i odbacivanja hipoteze? Da li je to pojavljivanje pisma 13, 14 ili 15 puta?
Statistika teorija testiranja hipoteza omoguava kvantifikaciju stupnja sumnje u neku hipotezu.
PRIMJER 8.2
Pretpostavimo da smo proveli istraivanje u kojem smo pitali studente koliko sati spavaju.
Obzirom na obaveze prema studiju, te njihov stil ivota, oekujemo da u prosjeku studenti spavaju
manje od prosjeka populacije. Kako bi ispitali ovu tvrdnju provedeno je istraivanje, prikupljeni su
podaci i testirana je hipoteza.
Nulta hipoteza: Studenti spavaju isto kao i prosjek populacije:
Mgrupe=populacije
Alternativna hipoteza: Studenti spavaju manje od prosjeka populacije:
Mgrupe>populacije
Istraivanje je provedeno na uzorku od 100 studenata. Nakon prikupljanja podataka, utvreno
je da studenti u prosjeku spavaju M=6,5 sati. Aritmetika sredina populacije iznosi =8 (znamo da u
prosjeku ovjek tokom 24 sata provede 8 sati spavajui), dok standardna devijacija iznosi =2,5.
Provjeravamo razliku izmeu aritmetike sredine jedne grupe i aritmetike sredine populacije.
Obzirom da nam je poznata standardna devijacija populacije, hipotezu emo testirati z-testom za
jedan uzorak.
M 6,5 8 1,5
6
2,5
sM
0,25
100
Uz nivo znaajnosti od p=0,05 i dvosmjerno testiranje razlike, granina z-vrijednost iznosi

zgr=1,96. Poreenjem izraunate z-vrijednosti i granine z-vrijednosti moemo zakljuiti da je z>zgr,
odnosno da z-vrijednost pada u oblast odbacivanja H0. Prema tome, grupa studentata koja je
127
uestvovala u istraivanju u prosjeku spava manje od prosjeka populacije, to izraavamo i na

sljedei nain:
z (100)=-6; p<0,05
PRIMJER 8.3
Da li djeca koja su bila izloena traumatskim dogaajima ispoljavaju statistiki znaajno vie
problema u ponaanju u odnosu na djecu koja nisu bila izloena traumatskim dogaajima? Na grupi
od 120 djece koja su bila izloena traumatskim dogaajima primjenjen je upitnik pomou kojeg se
ispituju problemi u ponaanju djece i mladih. Aritmetika sredina ove grupe djece na ovom upitniku
iznosi M = 55,0 uz s=10. Da li je aritmetika sredina grupe djece koja su bila izloena velikom broju
traumatskih iskustava statistiki znaajno vea od aritmetike sredine populacije? Poznat nam je
parametar populacije: = 50.
Nulta hipoteza: Broj problema u ponaanju djece koja su bila izloena traumatskim iskustvima
ne razlikuje se statistiki znaajno od broja problema u populaciji njihovih vrnjaka:
Mgrupe=populacije.
Nultu hipotezu mogli smo formulirati i kao: Grupa djece koja su uestvovala u istraivanju
pripada populaciji ija je aritmetika sredina =50.
Alternativna hipoteza: Djeca koja su doivjela traumatska iskustva iskazuju statistiki
znaajno vei broj problema u ponaanju od djece iz populacije njihovih vrnjaka bez traumatskih
iskustava:
Mgrupe>populacije.
Obzirom da nam nije poznata standardna devijacija populacije, hipotezu emo testirati ttestom za jedan uzorak. Neka je nivo znaajnosti p=0,05, a testiranje dvosmjerno.
55 50
5
5,49
10
s
0,91
120
Granina t-vrijednost za SS=119 iznosi zgr=1,96. Poreenjem izraunate t-vrijednosti i

granine t-vrijednosti moemo zakljuiti da je z>zgr, odnosno da t-vrijednost pada u oblast
odbacivanja H0. Prema tome, grupa djece koja je uestvovala u istraivanju u prosjeku postie
statistiki znaajno vie vrijednosti od prosjeka populacije.
Hipotezu moemo testirati i na nivou znaajnosti od p=0,01. Granina vrijednost iznosi
tgr=2,576. Prema tome, H0 se odbacuje i na nivou od p=0,01. Nadalje, hipotezu testiramo i na nivou
p=0,001. Granina vrijednost iznosi tgr=3,291. Zakljuujemo da se H0 odbacuje i na nivou
znaajnosti od p=0,001. Dakle, tvrdnju statistiki izraavamo na sljedei nain:
t(100)=5,49; p<0,001.
128
ZADACI
1.
Pretpostavimo da direktor jedne osnovne kole tvrdi da uenici te kole u prosjeku dnevno ue
6 sati. Opiite postupak kojim bi smo provjerili tvrdnju direktora.
2.
U hipotetikom istraivanju na grupi od 20 studenata izmjeren je krvni pritisak i dobivena

prosjena vrijednost M=124 mm Hg. Prosjeni krvni pritisak u populaciji je =120, a
standardna devijacija =10. Da li se aritmetika sredina krvnog pritiska grupe studenata
znaajno razlikuje od aritmetike sredine krvnog pritiska populacije?
3.
Na grupi od 25 uenika IV razreda utvrena je prosjena vrijednost inteligencije M=106.

a. Testirajte hipotezu da se ova grupa djece statistiki znaajno ne razlikuje od ope
populacije uenika IV razreda (=100, =15) uz nivo znaajnosti p=0,05, uz dvosmjerno
testiranje.
b. Testirajte hipotezu da se ova grupa djece statistiki znaajno ne razlikuje od ope
populacije uenika IV razreda (=100, =15) uz nivo znaajnosti p=0,01, uz dvosmjerno
testiranje.
4.
Pretpostavimo da je uzorak iz zadatka 1 povean za pet puta, a da je aritmetika sredina

uzorka ostala ista.
a. Testirajte hipotezu uz nivo znaajnosti od p=0,01.
b. Uporedite vrijednosti izraunate u zadatku 8.1 i 8.3.a. ta moete zakljuiti?
5.
Pretpostavimo da je grupa studenata rjeavala zadatke matematikog rezoniranja iz

standardiziranog testa za koji vrijedi da je =50 i =10. Studenti su postigli sljedee rezultate:
70, 45, 56, 59, 63, 50, 54, 67, 51, 48.
a. Testirajte nultu hipotezu prema kojoj se ova grupa studenata statistiki znaajno ne
razlikuje od populacije (nivo znaajnosti p=0,05).
b. U ovom sluaju, kojem tipu pogreke se izlaete kod zakljuivanja?
6.
Pretpostavimo da poveanje supstance TRY u krvi dovodi do ozbiljnih zdravstvenih

problema. U hipotetikom istraivanju testiran je novi lijek koji dovodi do smanjenja TRY-a u
krvi. Na 100 pacijenata izmjerena je koliina TRY supstance nakon konzumiranja lijeka te je
utvrena prosjena vrijednost M=58,02. Pretpostavimo da za populaciju vrijedi da je
prosjena koliina TRY supstance u krvi =60, a standardna devijacija =10.
a.
b.
c.
d.
Testirajte nultu hipotezu na nivou znaajnosti p=0,05, dvosmjerno.

Testirajte nultu hipotezu na nivou znaajnosti p=0,01, dvosmjerno.
U ovom sluaju, kojem tipu pogreke se izlaete kod zakljuivanja?
Kakva je praktina posljedica pogreaka tipa I i II?
129
7.
Jednu osnovnu kolu pohaa 500 uenika. Direktor te kole smatra da su uenici te kole
iznadprosjenih intelektualnih sposobnosti. Prema njegovom miljenju, prosjeni kvocijent
inteligencije (IQ ) iznosi najmanje 110. U cilju provjere ove tvrdnje, provedeno je ispitivanje
inteligencije na sluajno odabranom uzorku od 40 uenika. Prosjena vrijednost na testu
inteligencije iznosila je M=107, a standardna devijacija 10. Na osnovu dobivenih rezultata
izvedite zakljuak o prihvatanju ili odbacivanju tvrdnje direktora. Hipotezu testirajte uz nivo
znaajnosti od 0,01.
8.
Grupa od 25 uenika rjeavala je zadatke matematikog rezoniranja iz standardiziranog testa

za koji vrijedi da je =100. Standardna devijacija za populaciju nam nije poznata. Prosjena
vrijednost grupe uenika iznosi M=95, a standardna devijacija s=10.
a. Testirajte nultu hipotezu prema kojoj se ova grupa studenata ne razlikuje od populacije
(p=0,05).
b. Testirajte nultu hipotezu prema kojoj se ova grupa studenata ne razlikuje od populacije
(p=0,01).
9.
Nastavnik statistike provjeravao je znanje studenata iz matematike. Prethodne generacije

studenata na istom testu tano su rjeavale u prosjeku 50 zadataka. Deset studenata, odabranih
metodom sluajnog odabira, rjeavali su test znanja iz matematike i postigli sljedee rezultate:
64, 54, 48, 39, 62, 58, 46, 45, 50, 51. Moe li nastavnik biti barem 90% siguran da e
prosjean broj tanih rijeena biti najmanje 50?
10.
Trener lokalnog koarkakog kluba eli znati da li se prosjean broj koeva koje igrai
njegovog kluba postignu tokom sezone takmienja znaajno razlikuje od dravnog prosjeka.
Pretpostavimo da na nivou drave prosjean broj ubaenih koeva iznosi =65, a standardna
devijacija =8. Prosjean broj koeva njegovog tima je M=68. Da li ovaj tim postie vie
koeva od dravnog prosjeka? Testirajte hipotezu uz nivo znaajnosti od 0,05.
130
9. Testiranje razlika izmeu dvije aritmetike sredine
U znanstvenim istraivanjima vrlo esto postavljamo pitanje Da li se aritmetike sredine dva

uzorka statistiki znaajno razlikuju?. Da bismo odgovorili na ovo pitanje, prije svega moramo
razumjeti izraz statistiki znaajna razlika. Statistiki reeno, razlika izmeu dvije aritmetike
sredine je statistiki znaajna ako je po sluaju oekujemo u manje od 5% sluajeva distribucije
svih moguih razlika (naravno, ako prihvatimo stupanj rizika od 5%; ako govorimo o stupnju rizika
od 1%, onda tu razliku po sluaju oekujemo u manje od 1% sluajeva; drugim rijeima, razliku
koju proglaavamo statistiki znaajnom po sluaju oekujemo u proporciji manjoj od
postavljenog nivoa).
Pored statistikog odreenja statistike znaajnosti razlike izmeu dvije aritmetike sredine,
moemo govoriti i o znanstveno istraivakom odreenju: ako statistiki znaajnu razliku po
sluaju oekujemo u veoma malom procentu sluajeva (dakle, manjem od ), a u naem istraivanju
dobijemo upravo tu razliku, onda moemo zakljuiti da ona najvjerovatnije nije rezultat sluaja, ve
je rezultat djelovanja nekog sistematskog faktora. Naime, u znanstvenim istraivanjima mi se
sistematski trudimo da razliku izmeu dvije aritmetike sredine uinimo to veom, tj.
znaajnijom, ili provjeravamo razlike izmeu dvije grupe u sluajevima kada pretpostavljamo
postojanje nekog sistematskog faktora koji dovodi do tih razlika. Npr., time to u okviru klinike
studije jednoj grupi depresivnih pacijenata dajemo novi (i, nadamo se, efikasniji) lijek protiv
depresije, mi sistematskim naporom (davanjem novog lijeka) nastojimo ovu grupu, po prosjenom
broju njihovih depresivnih simptoma, uiniti to je mogue vie razliitom (tj. manje depresivnom)
u odnosu na drugu skupinu depresivnih pacijenata koji koriste klasini lijek protiv depresije. Ili, time
to jednu grupu uenika poduavamo fiziku po novoj (i, nadamo, se boljoj) metodi, mi sistematski
nastojimo dovesti do toga da prosjeni uspjeh ovih uenika iz fizike bude statistiki znaajno vei
od prosjenog uspjeha druge skupine uenika koja je gradivo iz fizike savladavala po klasinoj
metodi poduavanja. Ili, pak, provjeravamo hipotezu o statistikoj znaajnosti razlike izmeu
djeaka i djevojica u agresivnom ponaanju, koju oekujemo obzirom na sistematsko djelovanje
razliitih faktora u procesu socijalizacije.
Koliko velika razlika izmeu dvije aritmetike sredine treba biti da bismo je proglasili
statistiki znaajnom? Distribucija aritmetikih sredina uzoraka o kojoj smo govorili u prethodna
dva poglavlja nam je demonstrirala da prilikom izvlaenja sluajnih uzoraka iz populacije,
aritmetike sredine tih uzoraka obavezno variraju. Dakle, mi uvijek unaprijed oekujemo da emo
prilikom formiranja dva razliita sluajna uzorka iz iste populacije dobiti manje ili vie razliite
vrijednosti njihovih aritmetikih sredina. Jo jednom da li je ta razlika rezultat sluajnih variranja
uzoraka ili je, pak, rezultat djelovanja nekog sistematskog faktora?
Kako je objanjeno u prethodnom poglavlju, donijeti odluku o statistikoj znaajnosti razlike
izmeu dvije aritmetike sredine zapravo znai testirati tu razliku (stoga ovo poglavlje nosi naslov
Testiranje razlika izmeu dvije aritmetike sredine), odnosno, provjeriti da li statistik testa pada u
kritinu oblast. Logika testiranja razlika izmeu dvije aritmetike sredine ista je kao i kod testiranje
hipoteze s jednim uzorkom.
131
Obzirom da se kriterij za proglaavanje statistike (ne)znaajnosti temelji na vjerovatnoi, tj.

vrijednosti, ovu razliku moramo pozicionirati u neku distribuciju koja bi nam omoguila oitanje
vjerovatnoe njenog javljanja po sluaju (dakle, uz vaenje H0). Ta teorijska distribucija, u
situacijama kada testiramo znaajnost razlika izmeu dvije aritmetike sredine, se naziva traspodjela. Zapravo, govorimo o porodici t-raspodjela jer je oblik ove raspodjele matematiki
odreen veliinom uzorka; t-raspodjela, kao i normalna raspodjela, je unimodalna, zvonolikog
oblika i simetrina. to je uzorak vei, t-raspodjela slinija je normalnoj.
Logiku t-testa kojeg koristimo kod testiranja razlike izmeu dvije aritmetike sredine moemo
objasniti pomou misaonog eksperimenta kojeg smo koristili u prethodnom poglavlju.
Zamislimo da imamo dvije identine populacije sa identinim parametrima (ili da smo jednu populaciju
klonirali pa njen klon posmatrali kao drugu populaciju). Iz prve populacije metodom sluajnog odabira
formiramo uzorak i izraunamo aritmetiku sredinu. Zatim iz druge populacije metodom sluajnog odabira
formiramo uzorak, iste veliine kao i prvi uzorak, i izraunamo aritmetiku sredinu. Zatim podatke uzoraka
vratimo u populacije. Opisani postupak ponovimo veliki broj puta, i svaki put izraunamo i razliku izmeu
dvije aritmetike sredine. Na ovaj nain dobit emo veliki broj razlika izmeu aritmetikih sredina uzoraka.
Distribucija razlika aritmetikih sredina uzoraka opisana je sluajnom varijablom X ije se vrijednosti
rasporeuju prema t-raspodjeli. Aritmetika sredina razlika izmeu aritmetikih sredina parova uzoraka
jednaka je razlici izmeu aritmetikih sredina populacija, odnosno jednaka je 0. Standardna devijacija razlika
aritmetikih sredina zapravo je standardna pogreka razlike aritmetikih sredina uzoraka.
Praktino, razlikujemo testiranje razlika izmeu aritmetikih sredina za velike nezavisne i

zavisne, te za male nezavisne i zavisne uzorke.
t-test za velike nezavisne uzorke

Kod velikih uzoraka, t-raspodjela je normalna raspodjela razlika izmeu svih moguih parova
aritmetikih sredina svih moguih uzoraka iste veliine koji se mogu izvui iz poetne (teorijski
beskonano velike) populacije. Teorijski, aritmetika sredina t-raspodjele iznosi:
M1-M2=0,
a njena standardna devijacija, koja se naziva standardna pogreka razlike izmeu
aritmetikih sredina, se rauna prema formuli:
sM1-M2
s1
s
2
N1
N2
Prema H0 razlika izmeu dvije aritmetike sredine nee biti statistiki znaajna, tj. u
raspodjeli e se pozicionirati oko aritmetike sredine (preciznije, oko vrijednosti M1-M2=0) (u tom
sluaju zakljuujemo, npr., da novi antidepresiv nije znaajno efikasniji od klasinog; nova metoda
poduavanja iz fizike nije bolja od stare).
132
Nasuprot tome, prema alternativnoj hipotezi, razlika izmeu dvije aritmetike sredine e biti
dovoljno velika (u apsolutnim vrijednostima) da e u t-distribuciji izlaziti izvan intervala M1-M2
1,96sM1-M2 , uz nivo znaajnosti od 5% ili intervala M1-M2 2,58sM1-M2 , uz nivo znaajnosti od 1%
(ovo vrijedi za velike uzorke, tj. n>40). Dakle, da bismo je proglasili statistiki znaajnom na nivou
znaajnosti od 5%, odnosno od 1%, razlika izmeu dvije aritmetike sredine mora biti 1,96, odnosno
2,58 puta vea od svoje pogreke. U tom sluaju iz naih primjera zakljuujemo: da je novi
antidepresiv u suzbijanju simptoma depresije efikasniji od klasinog; uenici koji su uili fiziku po
novoj metodi postiu bolje rezultate od uenika koji su uili po staroj metodi itd.
Statistiki postupak koji nam omoguava da utvrdimo odnos razlike izmeu dvije aritmetike
sredine i standardne pogreke te razlike se naziva t-test i rauna se prema formuli:
razlika izmeu aritmetikih sredina
t=
pogreka razlike
tj.:
M1 M2
sM1-M2
Formiranje t-distribucije i logiku testiranja statistike znaajnosti razlika izmeu aritmetikih

sredina dva velika uzorka demonstrirat emo u primjeru 9.1.
t-test za velike zavisne uzorke

U odnosu na situaciju sa nezavisnim uzorcima, kada radimo sa zavisnim uzorcima, tj. kada se
mjerenja u obje situacije koje elimo porediti vre na isti ispitanicima, standardna pogreka razlike
izmeu aritmetikih sredina se smanjuje (tj. smanjuje se greka mjerenja). To se dogaa zbog toga
to se ovakvim istraivakim nacrtima iz greke mjerenja iskljuuje varijabilitet izmeu ispitanika.
Obzirom na to, t-test za velike zavisne uzorke se rauna prema sljedeoj formuli (pri tome, logika
testiranja znaajnosti razlike izmeu dvije aritmetike sredine ostaje ista kao i u sluaju velikih
nezavisnih uzoraka):
M1 M2
sM1 sM2 2r1,2sM1sM2
2
gdje je r1.2 korelacija izmeu dvije varijable.
133
t-test za male nezavisne uzorke

Naveli smo da za velike uzorke t-distribucija ima oblik normalne distribucije (preciznije
reeno, kako veliina uzorka tei beskonanosti t-raspodjela sve vie poprima oblik normalne
raspodjele). S druge strane, to je uzorak manji t-raspodjela postaje ira na krajevima, a tjeme nie.
Stoga je prilikom razmatranja da li je razlika izmeu aritmetikih sredina koje su dobivene na malim
uzorcima znaajna, obavezno konzultiranje tablica sa graninim t-vrijednostima.
t-test za male nezavisne uzorke temelji se na zajednikoj standardnoj devijaciji za oba uzorka.
Ovu vrijednost smijemo koristiti samo ako smo sigurni da se standardne devijacije uzoraka znaajno
ne razlikuju. Kako bismo to provjerili moramo izraunati F-test prema sljedeoj formuli:
F=
vea s2
manja s2
Ako je gornji F-omjer statistiki neznaajan (to opet utvrujemo pomou tablice graninih F
vrijednosti za testiranje razlika meu varijancama) izraunavanje t-testa emo nastaviti prema
sljedeoj proceduri:
Zajednika s =
sM1-M2 =
(X - M1)2 + (X - M2)2
(N1 - 1) + (N2 - 1)
Zajednika s
t=
N1 + N2
N1N2
M1 - M2
sM1-M2
SS = (N1 1) + (N2 1)
t-test za male zavisne uzorke

Kada radimo sa malim zavisnim uzorcima t-test raunamo prema metodi diferencijacije koja
ukljuuje i korelaciju izmeu rezultata dva mjerenja. U ovom sluaju t-test se temelji na raunanju
aritmetike sredine, standardne devijacije i standardne pogreke razlika parova rezultata. Testiranja
statistike znaajnosti razlika izmeu aritmetikih sredina dva mala zavisna uzorka demonstrirat
emo u primjeru 9.4.
134
PRIMJER 9.1
U primjeru 7.1 smo iz poetne populacije od 10000 zaposlenih graana zamiljenog malog
mjesta formirali distribuciju aritmetikih sredina 50 uzoraka veliine n=800. Na osnovu ovih
aritmetikih sredina moemo vrlo jednostavno formirati distribuciju razlika aritmetikih sredina ovih
uzoraka: izraunat emo razlike za sve mogue parove ovih aritmetikih sredina (M1-M2, M1-M3,
M1-M4,... M2-M3, M2-M4, M2-M5... M49-M50). Kako se ukupno moe nainiti 12255 ovakvih parova,
tako emo dobiti i distribuciju od ukupno 1225 razlika izmeu aritmetikih sredina.
U tabeli 9.1.1 i na slici 9.1.1 predstavljene su deskriptivne vrijednosti i izgled distribucije
aritmetikih sredina 50 uzoraka:
Tabela 9.1.1: Deskriptivne vrijednosti distribucije razlika aritmetikih sredina 50 uzoraka
veliine n=800 (ukupno 1225 razlika)
M
Medijan
Skjunis
Kurtozis
Raspon
Minimum
Maximum
-0,29
-0,22
11,95
-0,02
-0,61
61,84
-32,05
29,79
Slika 9.1.1.: Distribucija razlika izmeu aritmetikoh sredina 50 uzoraka veliine

n=800 (ukupno 1225 razlika)
50
45
40
35
30
f 25
20
15
10
5
29,71
26,71
23,71
20,71
17,71
14,71
11,71
8,71
5,71
2,71
-0,29
-3,29
-6,29
-9,29
-12,29
-15,29
-18,29
-21,29
-24,29
-27,29
-30,29
Razlika izmeu dvije aritmetike sredine
Zakljuujemo da dobivena raspodjela odgovara normalnoj raspodjeli. Mala odstupanja od

oekivanih vrijednosti koja smo dobili (npr. aritmetika sredina distribucije iznosi M=-0,29 umjesto
oekivanih 0 objanjavamo odstupanjem ovog primjera od poetnih teorijskih pretpostavki). Da
bismo dobili savreno normalnu distribuciju koja ima aritmetiku sredinu tano u taki 0 potrebna
Broj moguih parova rauna se prema formuli k(k-1)/2, pri emu je k broj aritmetikih sredina.
135
nam je beskonano velika poetna distribucija iz koje formiramo beskonano veliki broj razliitih
uzoraka iste veliine; za potrebe nae demonstracije i ovaj primjer e biti sasvim zadovoljavajui.
Ono to u sutini radimo kada testiramo znaajnost razlike izmeu aritmetikih sredina dva
uzorka jeste da iz teorijske distribucije razlika izmeu aritmetikih sredina (koja ima M1-M2=0 i
ija je standardna devijacija standardna pogreka razlike izmeu aritmetikih sredina) izvlaimo
jednu razliku izmeu dvije aritmetike sredine (naih konkretnih uzorka) i procjenjujemo
vjerovatnou javljanja te razlike po sluaju. Ako je ta vjerovatnoa vea od 5%, odnosno od 1% razliku neemo proglasiti statistiki znaajnom na nivou znaajnosti od 5%, odnosno 1%. Ako je,
pak, ta vjerovatnoa mala, tj. manja od 5%, odnosno 1%, onda tu razliku proglaavamo statistiki
znaajnom na nivou od 5%, odnosno od 1%.
Zamislimo da smo iz nae poetne populacije izvukli dva sluajna uzorka, npr. uzorke pod
rednim brojem 7 i 12 sa sljedeim deskriptivnim vrijednostima:
Tabela 9.1.2: M i s prosjenih mjesenih primanja (u KM) u dva sluajna uzorka
Redni broj
uzorka
800
1201,27
252,40
17
800
1209,66
264,35
Prema H0 smatramo da je razlika izmeu ova dva uzorka rezultat sluajnih varijacija, tj. da
ona nije statistiki znaajna; drugim rijeima, prema H0 smatramo da ova dva uzorka pripradaju
istoj populaciji.
Prema alternativnoj hipotezi (H1), razlika izmeu ova dva uzorka je statistiki znaajna, tj.
posljedica je djelovanja nekog sistematskog (sistematskih) faktora. Drugim rijeima, ova dva uzorka
reprezentiraju dvije razliite populacije.
Obzirom da znamo da su oba uzorka izvuena iz iste populacije (zaposlenih osoba koje ive
u istom mjestu) pretpostavljamo da razlika nee biti statistiki znaajna. Ipak, da bismo bili sigurni
da uoena razlika izmeu aritmetikih sredina nije statistiki znaajna nuno je provesti t-test:
t=
M1 M2
sM1-M2
t=
M1 M2
-8,39
12,92
136
s12
N1
-0,65
s22
N2
Dakle, i statistiki smo potvrdili da naa dva uzorka dolaze iz iste poetne populacije: t-test
(t-omjer) nam pokazuje da razlika izmeu dvije aritmetike sredine nije dva puta vea od svoje
pogreke, tako da je neemo proglasiti statistiki znaajnom na nivou od 5% znaajnosti.
Obzirom da su oba uzorka relativno velika i iste veliine, u ovom primjeru ne moramo
konsultirati tablice za oitanje znaajnosti rezultata t-testova. Ipak, standardna procedura za
zakljuivanje o statistikoj znaajnosti nekog t-testa podrazumijeva konsultiranje graninih
vrijednosti t uz zadani broj stupnjeva slobode. Stupnjevi slobode u sluaju velikih nezavnisnih
uzoraka raunaju se prema formuli:
SS = (n1 1) + (n2 1)
SS = 799 + 799 = 1598
Granina vrijednost za utvreni SS na nivou znaajnosti od 5% iznosi tgr = 1,96.
Obzirom da je t<tgr, prihvatamo H0 i to statistiki izraavamo kao:
t(1598) = -0,65; p>0,05.
Zamislimo sada malo realniju situaciju. Istraivaa interesira da li postoji statistiki znaajna
razlika u prosjenim mjesenim primanjima mukaraca i ena. Kako bi to utvrdio, istraiva je u
istoj anketi u kojoj je ispitanike pitao o njihovim primanjima zabiljeio i spol ispitanika. Anketirano
je ukupno 436 ena i 312 mukaraca iz poetne populacije od 10000 zaposlenih graana.
Deskriptivne vrijednosti prikazane su u tabeli 9.1.3.
Tabela 9.1.3: M i s prosjenih mjesenih primanja (u KM) u skupini ena i mukaraca
Spol
436
1367,68
232,40
312
1051,89
198,73
total
1235,96
Na osnovu ovih vrijednosti dobivamo sljedei t-omjer:
t=
315,79
15,83
19,95
SS = 746
Obzirom da je granina t-vrijednost za zadate stupnjeve slobode na nivou rizika od 5%
tgr=1,96, odnosno za 1% rizika tgr=2,58, zakljuujemo da je utvrena razlika izmeu prosjenih
primanja mukaraca i ena statistiki znaajna (tj. ene u prosjeku mjeseno zarauju statistiki
137
znaajno vie novca). Drugim rijeima, po svojim mjesenim primanjima ene i mukarci ine dvije
razliite populacije, to izraavamo na sljedei nain:
t(746) = 19,95; p<0,01
PRIMJER 9.2
Istraivaa interesira da li program strunog usavravanja ima utjecaja na visinu mjesenih
primanja uposlenika. U tu svrhu je utvrdio prosjena mjesena primanja 260 uposlenika nekoliko
firmi prije i nakon pohaanja 6-mjesenog kursa menadmenta. Deskriptivne vrijednosti prikazane
su u tabeli 9.2.1.
Tabela 9.2.1: M i s mjesenih primanja (u KM) prije i nakon treninga menadmenta
Mjerenje
Prije treninga
1150,00
181,21
Nakon treninga
1320,00
236,43
Korelacija mjesenih primanja u dvije mjerne take iznosila je r=0,53.

Prema formuli, t-test iznosi:
t=
1150 1320
11,24 + 14,662 2*0,53*11,24*14,66
2
t=
-170,00
12,91
-13,17
SS = n 1 = 259
Odgovarajua granina vrijednost za nivo znaajnosti od 5%, odnosno za 1% koju
oitavamo iz tablice iznosi tgr=1,97, odnosno tgr=2,58. U skladu s tim zakljuujemo da obuka
uposlenika iz oblasti menadmenta statistiki znaajno poveava iznos njihovih primanja te
navodimo:
t(259) = -13,17; p<0,01
138
PRIMJER 9.3
Prema jednoj od teorija koje objanjavaju poremeaj deficita panje (PDP) kod djece, djeca
sa ovim poremeajem imaju ouvanu sposobnost selektivne panje sposobna su usmjeravati
panju na ciljne podraaje uz istovremeno zanemarivanje drugih, irelevantnih podraaja, ali imaju
potekoa u odravanju panje na ciljnom podraaju dui vremenski period koji je potreban za
uspjeno rjeavanje odreenog zadatka (dakle, oslabljena im je sposobnost tzv. odravane panje).
Kako bi testirao ovu hipotezu, psiholog je testirao grupu od 6 djece sa PDP i 9 djece bez ove
dijagnoze na testu odravane panje. [Ispitanici na testu odravane panje imaju zadatak da reagiraju
na svaku promjenu prezentiranog stimulusa na ekranu; mjeri se broj pogreaka, tj. broj proputenih
reakcija]. Rezultati za ove dvije skupine djece predstavljeni su u tabeli ispod:
Tabela 9.3.1: Broj pogreaka i deskriptivne vrijednosti djece sa i bez PDP na testu odravane panje
Djeca bez PDP
Djeca sa PDP
R.br.
Broj greaka
R.br.
Broj greaka
18
12
13
11
17
10
15
21
7,89
16,00
2,03
3,35
Da bismo provjerili moemo li u ovom sluaju raunati nekorigirani t-test, u prvom koraku
moramo utvrditi da li su varijance ova dva uzorka homogene:
F=
3,352
2,032
= 0,37
Kako je granina F-vrijednost koju oitavamo iz tablice Fgr=4,82, zakljuujemo da meu

varijancama nema statistiki znaajne razlike tako da moemo nastaviti sa raunanjem t-testa:
139
Zajednika s =
32,89 + 56
8+5
Zajednika s =
sM1-M2 = 0,73
0,73
9+6
9x6
sM1-M2 = 0,38
t=
7,89 - 16,00
0,38
t = -21,08
SS = 8 + 5 = 13
Granine vrijednosti koje oitavamo iz tablice t-vrijednosti za zadate stupnjeve slobode i
nivo rizika od 5%, odnosno 1% iznose: 2,16, odnosno 3,01. Dakle, navodimo;
t(13) = -21,08; p<0,01
Na osnovu dobivenog t-omjera moemo zakljuiti da djeca sa PDP, u odnosu na djecu bez ovog
poremeaja, imaju statistiki znaajno slabiju sposobnost odravanja panje kroz due vremenske
intervale.
PRIMJER 9.4
Grupa ispitanika uila je seriju besmislenih slogova. Poslije dva ponavljanja serije, broj
slogova koji su lanovi grupe tano reproducirali naveden je u koloni Prije u tabeli ispod. Nakon
toga, ispitanici su, tri dana po jedan sat, uili serije besmislenih slogova iste duine kao i u prvoj
seriji, ali su dobili nove instrukcije o metodama uspjenog pamenja. Poslije tri dana zadata je nova
serija besmislenih slogova iste duine i teine kao i prva serija i ponovljena je dva puta. Ispitanicu su
tada postigli rezultate predstavljene u koloni Poslije .
140
ISP.
Prije
Poslije
Potrebno je ustanoviti da li je trodnevno vjebanje u uenju besmislenih slogova i koritenje

mnemotehnike dovelo do statistiki znaajnog poveanja broja tano reproduciranih slogova
posljednjeg dana.
Najprije emo izraunati razlike izmeu prvog i drugog rezultata za svakog ispitanika te aritmetiku sredinu i standardnu devijaciju utvrenih razlika:
ISP.
Prije
Poslije
Diferencijacija
(D)
d (D-MD)
d2
-2
-0,44
0,20
-1
0,56
0,31
-2
-0,44
0,20
-2
-0,44
0,20
-1
0,56
0,31
2,56
6,53
-3
-1,44
2,09
-3
-1,44
2,09
-1
0,56
0,31
D = -14
d2 = 12,22
MD = -1,56
sD = 1,24
Na osnovu sD izraunat emo standardnu pogreku aritmetike sredine razlika:
141
sD
sMD =
N
1,24
sMD =
sMD = 0,41
Konano, t-test raunamo prema formuli:
MD
t=
t=
sMD
-1,56
0,41
t = -3,78
Stupnjeve slobode raunamo prema formuli: SS=N-1, to u naem primjeru iznosi 8. Kako
je tgr=2,36 (za nivo od 5% rizika), odnosno tgr=3,36 (za nivo od 1% rizika), izraunati t-test proglaavamo statistiki znaajnim:
t(8) = -3,78; p<0,01,
i zakljuujemo da trodnevna vjeba i koritenje mnemotehnika znaajno unapreuje pamenje (besmislenih slogova).
142
ZADACI
1.
Pacijenti koji se lijee od depresije podijeljeni su u dvije skupine. Prvu skupinu ini 50
pacijenata koji su tokom dvije sedmice uzimali novi lijek za koji se smatra da umanjuje broj
simptoma. Druga skupina od 43 pacijenta za to vrijeme je bila bez medikamentoznog tretmana.
Nakon dvije sedmice ponovo je izmjeren broj simptoma kod obje skupine pri emu su
dobiveni sljedei rezultati:
1. skupina (podvrgnuta
tretmanu)
2. skupina (bez tretmana)
M = 14
M = 18
s = 3,2
s = 4,4
Da li je utvrena razlika izmeu aritmetikih sredina statistiki znaajna?

2. Istraivaa je interesiralo da li djeca koja ive u gradu itaju bre od djece koja ive na selu. U
tu svrhu po sluaju je formirao dvije skupine djece. Prvu skupinu od 150 djece inila su djeca
iz grada. Drugu skupinu od 139 djece inila su djeca sa sela. Na temelju zadatka brzog itanja,
istraiva je dobio sljedee rezultate: djeca iz grada zadati tekst su u prosjeku itala za 93 sek.,
uz standardnu devijaciju od 6,5 sek.; djeci iz sela za itanje istog odlomka teksta u prosjeku je
trebala 91 sek., uz standardnu devijaciju od 7,1 sek. Da li je utvrena razlika u brzini itanja
izmeu dvije navedene grupe statistiki znaajna?
3. Psiholog je elio testirati uinkovitost novog programa edukacije vozaa koji prave veliki broj
prekraja u saobraaju. Da bi to uinio, iz generalne populacije vozaa selektirao je (na temelju
podataka u MUP-u) 120 vozaa koji su u periodu od proteklih 12 mjeseci napravili vie od 20
prekraja. Statistiki pokazatelji za ovu grupu vozaa su sljedei:
M1 = 49 (prosjean broj prekraja u poroteklih 12 mjeseci)
s1 = 10
(standardna devijacija broja prekraja u uzorku)
Ovi vozai su upueni na novi program edukacije. Nakon zavrene edukacije, psiholog je u
periodu od 12 mjeseci pratio navedenu grupu vozaa i registrirao broj prekraja koji je svaki
od njih nainio. Utvrdio je sljedee statistike pokazatelje:
M2 = 35 (prosjean broj prekraja u 12 mjeseci nakon edukacije)
s2 = 7
(standardna devijacija broja prekraja u uzorku)
Korelacija izmeu broja prekraja nainjenih u dva perioda (prije i poslije edukacije) je r=0,69.
Da li je novi program edukacije uinkovit u smanjenju broja saobraajnih prekraja?
143
4. Test linosti ABC primjenjen je na dvije grupe uenika: prvoj grupi uenika koji se u koli
ponaaju neupadljivo, i drugoj grupi uenika sa odreenim problemima u ponaanju. Dobivene
su sljedee deskriptivne vrijednosti:
I grupa
II grupa
105,5
113
6,87
3,08
Da li se ove dvije grupe uenika znaajno razlikuju po prosjenim rezultatima na testu linosti?
5. Na testu verbalnih sposobnosti, grupa ispitanika iji roditelji imaju visoko ili vie obrazovanje
i grupa ispitanika iji roditelji imaju osnovno ili srednje obrazovanje postigle su sljedee
rezultate:
OBRAZOVANJE RODITELJA
Osnovno i
Visoko i vie
srednje
N
28
24
16,92
17,90
4,94
4,21
Utvrdite da li ove dvije grupe ispitanika imaju statistiki znaajno razliit prosjean uspjeh na
testu verbalnih sposobnosti.
6. Psihologa interesuje kako alkohol utie na tanost prepoznavanja saobraajnih znakova. Da bi
odgovorio na to pitanje selektirao je dvanaest ispitanika. Na poetku eksperimenta svaki
ispitanik imao je zadatak da prepozna (tj. da imenuje) 46 saobraajnih znakova. Nakon toga,
poto su u periodu od 45 minuta ispitanicu popili po 1,5 dl crvenog vina, psiholog im je
ponovo dao zadatak prepoznavanja 46 znakova. I u jednom i u drugom mjerenju registriran je
broj pogrenih odgovora ispitanika:
144
BROJ POGRENIH
PREPOZNAVANJA
SAOBRAAJNIH ZNAKOVA
ISP.
I mjerenje
II mjerenje
15
12
15
10
13
14
10
15
11
10
11
12
Da li alkohol smanjuje sposobnost prepoznavanja saobraajnih znakova?

7. U jednom eksperimentu ispitivalo se da li novi lijek dovodi do smanjenja koncentracije
tiroksina u krvi kod bolesnika koji boluju od Bazadovljeve bolesti. 134 pacijenata koji boluju
od navedene bolesti po sluaju su podijeljene u dvije grupe eksperimentalnu i kontrolnu.
Pacijenti iz eksperimentalne grupe dobivali su tokom deset dana novi lijek, kod su pacijenti iz
kontrolne dobivali inaktivnu fizioloku tvar (placebo). Jedanaesti dan izmjerena je
koncentracija hormona kod svakog pacijenta eksperimentalne i kontrolne grupe. Dobivene su
sljedee prosjene vrijednosti i rasprenja:
GRUPA
kontrolna
eksperimentalna
77
57
17,4
24
3,7
4,5
Da li je novi lijek bio efikasan u smanjenju koncentracije tiroksina? Obrazloite odgovor.

8. U jednom istraivanju testirana je hipoteza prema kojoj stariji ispitanici, s obzirom da slabije
procesiraju verbalne informacije, imaju slabije pamenje za rijei od mlaih ispitanika.
Zadatak ispitanka bio je da zapamte to vie rijei. Nakon neutralnog zadatka utvren je broj
145
rijei kojih su se ispitanici mlae i starije dobi mogli dosjetiti. Dobivene su sljedee prosjene
vrijednosti i rasprenja:
GRUPA
mlai
stariji
10
10
19,3
12
7,1
14
Da li je hipoteza potvrena?
9. Dvije grupe uenika rjeavale su test znanja iz matematike. Dobivene su sljedee deskriptivne
statistike vrijednosti:
GRUPA
I
II
100
100
100
110
20
40
a. Koja grupa je bolje rjeavala test znanja iz matematike? Obrazloite odgovor!

b. Kakav e biti odgovor na pitanje pod 4.a (Koja grupa je bolje rjeavala test znanja iz
matematike?) ako se standardna pogreka aritmetike sredine prve grupe povea dva puta?
(aritmetike sredine i broj ispitanika ostaju isti!)
10. Pretpostavimo da e denjaci znaajno bre prepoznati predmete koji se nalaze u njihovoj
desnoj ruci, od predmeta koji se nalaze u njihovoj lijevoj ruci (ispitivanje se izvodi s povezom
preko oiju ili s nepropusnim naoalima). U sljedeoj tabeli prikazan je broj predmeta koje
ispitanici prepoznaju za lijevu i desnu ruku u vremenu od 2 minute.
ISP.
1
2
3
4
5
6
7
8
9
10
11
12
lijeva ruka
8
5
11
9
7
8
10
7
12
6
11
9
Testirajte nul-hipotezu!
146
desna ruka
10
9
14
7
10
5
15
7
11
12
11
10
10. Analiza varijance
Analiza varijance (eng. analysis of variance) ili skraeno ANOVA, je postupak koji se koristi
za ispitivanje statistike znaajnosti razlika izmeu aritmetikih sredina vie grupa. Za razliku od ttesta, kojeg koristimo kada testiramo statistiku znaajnost razlike izmeu dvije aritmetike sredine,
ANOVA-om moemo testirati razlike izmeu bilo kojeg broja aritmetikih sredina.
Naziv postupka ne ukazuje da se ispituju razlike izmeu aritmetikih sredina. Meutim, neka
vas naziv postupka ne navodi na pogrean zakljuak.Zaista, analizom varijance varijabilitet rezultata
se razlae na odreene dijelove jer se totalni varijabilitet zavisne varijable razlae na manje dijelove,
i to na dio varijance koji se pripisuje nezavisnoj varijabli i dio koji predstavlja ostatak, tj. rezidual, ili
varijancu pogreke. No, premda se analizira varijabilitet, ipak nas procedura vodi ka zakljuku o
razlikama izmeu aritmetikih sredina. Razlog zbog kojeg se koristi naziv analiza varijance, a ne
multigrupna analiza aritmetikih sredina, je taj da se ovim postupkom zaista uporeuju aritmetike
sredine, ali analiziranjem i uporeivanjem varijabiliteta, tj. varijanci.
Razumno pitanje je zato ne koristiti t-test za svaki par AS? Nekoliko je razloga zbog kojih se
ne koriste t-testovi. Najprije, koritenje veeg broja t-testova nije ekonomino. Sa poveanjem broja
grupa znaajno se poveava posao! Ukoliko imamo tri aritmetike sredine broj parova za koje treba
primjeniti t-test je 3, za etiri aritmetike sredine 6, a za npr. est potrebno je primjeniti 15 t-testova.
Nadalje, pitamo se da li su razlike izmeu vie AS statistiki znaajne, a ne da li je razlika izmeu
dvije AS statistiki znaajna. Najvaniji razlog je da se s poveanjem broja t-testova, poveava i
vjerovarnoa javljanja pogreke tipa I. Na kraju, u sluajevima kada imamo dvije ili vie nezavisnih
varijabli istovremeno, elimo znati ne samo o efektima pojedine varijable ve i o efektu interakcije
dvije ili vie varijabli.
Najjednostavniji primjer analize varijance je jednostavna ili jednosmjerna (one-way) analiza
varijance, kod koje imamo jednu nezavisnu varijablu, tj. faktor i jednu zavisnu varijablu. Faktor je
kategorijalna varijabla, a vrijednosti varijable nazivaju se nivoi. Ukoliko imamo dva ili tri faktora,
govorimo o dvo- ili tro-smjernoj analizi varijance. Ako su isti ispitanici ukljueni u sve nivoe
nezavisne varijable, koristimo analizu varijance za zavisne uzorke (RM ANOVA, od engl.
repeated measures ANOVA). Analiza varijance sa jednom zavisnom varijablom naziva se
univarijatna, a s dvije ili vie zavisnih varijabli, multivarijatna tj. MANOVA-a.
147
Jednostavna (jednosmjerna) analiza varijanca - ANOVA

Logiku jednostavne analize varijance objasnit emo na jednom primjeru. Pretpostavimo da
eksperimentalnom metodom elimo ispitati efekat distraktora na sposobnost rjeavanja
matematikih zadataka. Nezavisna varijabla je nivo distraktora (nizak, srednji i visoki), a zavisna je
broj tano rjeenih zadataka u odreenom vremenskom periodu. Formirane su tri grupe ispitanika.
Tokom rjeavanja matematikih zadataka ispitanici su bili izloeni distraktoru razliitog intenziteta.
Ispitanici prve grupe bili su izloeni distraktoru niskog intenziteta, druge srednjeg, a ispitanici tree
grupe distraktoru visokog intenziteta. U svakoj grupi bilo je pet ispitanika. Broj tano rijeenih
zadataka ispitanika grupa A, B i C prikazan je u tabeli ispod.
10
17
20
14
19
19
12
18
23
13
20
26
11
16
22
Da li je razlika izmeu tri aritmetike sredine statistiki znaajna?

Polazimo od pretpostavke da izmeu aritmetikih sredina populacija ne postoji razlika, tj.
pretpostavljamo da se radi o identinim populacijama. Prema tome, postavit emo nultu hipotezu,
prema kojoj vrijedi:
H 0 : 1 = 2 = 3 = n
Pokuajmo o podacima razmiljati na neto drugaiji nain. Neka X i,j oznaava rezultat
ispitanika i u grupi j (npr. X1C se odnosi na rezultat prvog ispitanika u grupi C). Rezultat bilo kojeg
ispitanika u testu matematikih zadataka u funkciji je tri komponente: prosjene vrijednosti svih
ispitanika koji bi teoretski mogli uestvovati u eksperimentu bez obzira na grupnu pripadnost (),
odstupanja prosjene vrijednosti rezultata grupe (j) od ( = j ), i odstupanja rezultata
ispitanika i u grupi j od prosjene vrijednosti svoje grupe (eij = Xij j). Odnosno:
Xij = + (j - ) + eij = + j + eij.
Svaki rezultat odstupa od aritmetike sredine svih podataka (bez obzira na grupu), aritmetike
sredine podataka grupe kojoj pripada i odstupanja aritmetike sredine grupe kojoj podatak pripada
od sredine svih podataka (bez obzira na grupu). Na slici 2 prikazana su odstupanja rezultata prvog
ispitanika grupe C (X1C) od aritmetike sredine svih podataka (X-Mtot), zatim od aritmetike sredine
podataka grupe kojoj pripada (X-Mj) i odstupanje aritmetike sredine grupe kojoj ispitanik pripada
od aritmetike sredine svih podataka (Mj-Mtot).
148
Tabela 10.1: Grafiki prikaz odstupanja rezultata u funkciji tri komponente
Grupa C
MC=22
1
X=20
2
1
Grupa B
Mtot=17,3
3
3
1
Grupa A
Odstupanja moemo prikazati na sljedei nain:

Total
Unutar grupe
Izmeu grupa
X Mtot
X Mj
Mj Mtot
Za svaki rezultat mogu se izraunati navedena odstupanja. Kada kvadriramo ova odstupanja
dobit emo sume kvadrata. Tako imamo:
1. Sumu kvadrata totala (SStot)
2. Sumu kvadrata unutar grupa (SSwg), i
3. Sumu kvadrata izmeu grupa (SSbg).
Na osnovu sume kvadrata izraunat emo varijance:
2
SS ( x M )
s v MS
df
N 1
2
149
S obzirom da se varijanca zasniva na prosjenoj sumi kvadrata, u analizi varijance koristi se

termin prosjeni kvadrat i oznaava se sa MS (engl. mean-square).
Varijabilitet svih dobivenih rezultata rastavlja se na dijelove od kojih je sastavljen, tj. na
interni varijabilitet unutar svake pojedine grupe rezultata i na varijabilitet izmeu pojedinih grupa. Iz
odnosa tih dvaju varijabiliteta moe se zakljuiti radi li se o grupama koje ne pripadaju istoj
populaciji ili su njihove razlike samo sluajne pa sve grupe potjeu iz iste populacije.
Varijanca unutar svake pojedine grupe zasniva se na varijabilitetima unutar grupe i oznaava
sa MSwg (mean-square whitin groups). Kada su veliine grupa jednake, varijanca unutar grupa
jednaka je:
MSwg = s2j / k,
s2j varijance rezultata pojedinih grupa
k broj grupa
Varijanca izmeu pojedinih grupa zasniva se na varijabilitetu izmeu aritmetikih sredina
pojedinih grupa i oznaava se sa MSbg (mean-square between groups):
MSbg = n x s2M,
s2M varijanca aritmetikih sredina grupa
n broj ispitanika u jednoj grupi (n1 = n2 =....= nn)
Odnos izmeu varijabiliteta izmeu grupa i varijabiliteta unutar grupa je F-omjer:
MS bg
MS wg
Kao to smo koristili t-test u cilju donoenja odluke o prihvatanju ili odbacivanju nulte
hipoteze, kod ANOVA-e koristimo F-test. Postoji porodica F-distribucija, zavisno od vrijednosti
stupnjeva slobode brojnika i nazivnika. Obzirom da je F-omjer omjer varijanci, njegova vrijednost
ne moe biti manja od nula. F-distribucija je pozitivno asimetrina; samo u sluaju ekstremno
velikih uzoraka, oblik F-distribucije pribliava se normalnoj (tanije kada dfbg i dfwg tee ka
beskonanoj vrijednosti).
Kritinu vrijednost F-omjera oitavamo iz tablica na osnovu stupnjeva slobode brojnika i
nazivnika. Ako je izraunati F vei od kritine vrijednosti F (uz odreene stupnjeva slobode), onda
je varijabilitet izmeu grupa statistiki znaajno vei od varijabiliteta unutar grupa, tj. utvrena je
statistiki znaajna razlika izmeu aritmetikih sredina.
150
Preduvjeti za koritenje ANOVA-e

Homogenost varijanci, normalnost distribucije i nezavisni uzorci osnovni su preduvijeti za
koritenje analize varijance.
1. Homogenost varijanci
Populacije svake grupe imaju jednake varijance:
21 = 22 = 23 = 24 = 25
Za testiranje statistike znaajnosti razlika izmeu varijanci koristi se npr. Levenov F-test
homogenosti varijanci. U praksi se esto koristi princip prema kojem najvea standardna devijacija
ne smije biti dva puta vea od najmanje standardne devijacije, te smatramo da su varijance
najvjerovatnije homogene. Osim toga, kada su grupe jednake ili podjednake veliine, najvjerovatnije
su varijance homogene.
2. Normalna distribucija
Distribucije rezultata zavisne varijable u svakoj grupi trebaju biti priblino normalne.
3. Nezavisni uzorci
Uzorci (grupe) trebaju biti formirani metodom sluajnog odabira, tj. rezultati jednog uzorka su
nezavisni od rezultata drugog uzorka.
S ciljem provjere preduvjeta za ANOVA-u, provode se deskriptivni statistiki postupci
(distribucije frekvencija, aritmetika sredina i standardna devijacija, koeficijenti simetrinosti i
spljotenosti, testiranje normalnosti distribucija). U sluajevima kada se pokae da distribucije
rezultata nisu normalno distribuirane ili da su varijance heterogene, provode se razliiti postupci
kako bi se zadovoljili preduvjeti. Npr. ukoliko u distribuciji postoje ekstremne vrijednosti, a postoji
logika opravdanosti, takve podatke treba iskljuiti. Ponekad je potrebno provesti nelinearnu
transformaciju podataka kako bi se postigla normalnost distribucije. Ukoliko niti jedan postupak ne
da oekivani ishod, treba koristiti alternativne, neparametrijske postupke (Kruskall-Wallisov test).
Openito vrijedi da ukoliko su grupe podjednake veliine i varijance podjednake vrijednosti,
onda moemo koristiti ANOVA-u.
Analiza varijance za zavisne uzorke

Kod analize varijance za zavisne uzorke totalni varijabilitet dijeli se na varijabilitet izmeu
ispitanika i varijabilitet unutar ispitanika. Varijabilitet unutar ispitanika ine dvije komponente:
varijabilitet izmeu tretmana (ili taaka mjerenja) i rezidual, tj. ostatak kojeg ne moemo objasniti
efektom tretmana (tj. taaka mjerenja). Vrijedi:
SStot = SSbs + (SStr + SSrez)
151
Struktura varijabiliteta moe se prikazati na sljedei nain:
Totalni varijabilitet
SStot
Izmeu ispitanika
Unutar ispitanika
SSbs
SSws
Izmeu tretmana
Rezidual
SStr
SSrez
Pri emu je:

SStot Totalna suma kvadrata
SSbs Suma kvardata izmeu ispitanika
SSws Suma kvadrata unutar ispitanika
SStr Suma kvadrata izmeu tretmana
SSrez Suma kvadrata reziduala.
Faktorijalna analiza varijance
U terminima faktorijalne analize varijance nezavisne varijable nazivaju se jo i faktorima.
Stoga ovaj tip analize varijance nazivamo faktorijalna analiza varijance. Faktorijalna analiza
varijance sa dvije nezavisne varijable zove se dvosmjerna analiza varijance, sa tri trosmjerna, itd.
Uz naziv faktorijalna analiza varijance, navode se informacije o broju grupa, tj. nivoa
nezavisnih varijabli. Tako, faktorijalna analiza varijance 2 x 3 znai da prvi faktor ima dva, a trei tri
nivoa. Faktorijalna analiza 3 x 2 x 4 znai da imamo tri nezavisne varijable, od kojih prva ima tri,
druga dva, a trea etiri nivoa.
Kao i kod jednosmjerne analize varijance, kod faktorijalne analize varijace totalni varijabilitet
dijeli se na varijabilitet izmeu grupa i varijabilitet untar grupa. Varijabilitet izmeu grupa dijeli se
na varijabilitet grupe A, varijabilitet grupe B i varijabilitet interakcije grupe A i grupe B.
152
Totalni varijabilitet
SStot
Izmeu grupa
Unutar grupa
SSbg
SSwg
Grupa A
Grupa B
Interakcija A x B
SSA
SSB
SSAxB
Pri emu je:

SStot Totalna suma kvadrata
SSbg Suma kvardata izmeu grupa
SSwg Suma kvadrata unutar grupa
SSA Suma kvadrata grupe A
SSB Suma kvadrata grupe B
SSAxB Suma kvadrata interkacije AxB
153
PRIMJER 10.1
Pretpostavimo da elimo istraiti efekte razliitih naina procesiranja rijei na njihovo

pamenje. U zamiljenom eksperimentu formirano je pet grupa ispitanika. U svakoj grupi bilo je
deset ispitanika. Ispitanici prve grupe prebrojavali su slova zadate rijei, druge odreivali rije koja
se rimuje sa zadatom rijei, ispitanici trea grupe su odreivali pojam koji opisuje zadatu rije,
etvrte zamiljali predmet koji imenuje zadata rije, dok su ispitanici pete grupe dobili eksplicitan
zadatak da to bolje upamte zadatu rije. Nakon neutralnog zadatka ispitanici su pitani da se dosjete
rijei. U tabeli ispod navedeni su rezultati dobiveni u istraivanju. Broj oznaava koliinu
zapamenih rijei.
Odreivanje
Rimovanje
11
12
10
13
11
19
16
14
11
10
14
10
11
11
23
11
13
12
14
13
10
15
10
19
11
11
11
11
70
69
110
134
120
503
7,00
6,90
11,00
13,40
12,00
10,06
1,83
2,13
2,49
4,50
3,74
4,01
Varijanca
3,33
4,54
6,22
20,27
14,00
16,06
Total (Tj)
pridjeva
Imaginacija
Namjerno
Prebrojavanje
uenje
Total
Da li postoji statistiki znaajna razlika izmeu aritmetikih sredina pet grupa? Ako postoji,
koja grupa je najbolje rjeavala zadatak upamivanja? Koji nain procesiranja je najefikasniji?
Najprije emo grafiki prikazati aritmetike sredine. Najviu vrijednost AS postigli su ispitanici koji
su tokom nenamjernog uenja koristili imaginaciju (M=13,5), zatim ispitanici koji su dobili
eksplicitnu instrukciju da ue material (M=12) i ispitanici koji su odreivali pridjeve (M=11).
154
16
13,4
14
12
12
11
10
8
6,9
prebrojavanje
rimovanje
6
4
2
0
pridjevi
imaginacija
namjerno
ucenje
Da li su razlike statistiki znaajne?

Raunski postupak provodi se u nekoliko koraka i logiki odgovara smislu analize varijance.
Najprije izraunamo pomone vrijednosti veliki total (GT) i sumu kvadriranih vrijednosti svih
rezultata (X2), a zatim sume kvadrata totala, izmeu grupa i unutar grupa. U sljedeim koracima
potrebno je odrediti stupnjeve slobode, a zatim izraunati prosjene kvadrate (MSbg i MSwg). Na
kraju, izaunat emo F-omjer i uporediti izraunatu vrijednost s kritinom, koju smo oitali iz
tablice.
Izraunati GRAND TOTAL (GT): GT = (X) / N

X : suma svih rezultata u svim grupama
GT = (9 + 8 + 6 + + 7 + 9 + 15 + 11 + 11)2 / 50 = 5060,18
GT = 5060,18
Izraunati TOTALNU SUMU KVADRATA (SStot): SStot = X - GT

X2: totalna suma kvadriranih rezultata u svim grupama
GT: grand total
SStot = (92 + 82 + 62 + + 72 + 92 + + 152 + 112 + 112) 5060,18
SStot = 5847 5060,18 = 786,82
SStot = 786,82
Izraunati sumu kvadrata IZMEU GRUPA ( SSbg): SSbg = T2j / n GT

T2j:
kvadrirana suma rezultata u pojedinim grupama (j)
n:
broj rezultata u pojedinim grupama
GT:
grand total
155
SSbg = (702 + 692 + 1102 + 1342 + 1202) / 10 5060,18

SSbg = 5411,7 5060,18 = 351,52
SSbg = 351,52
Izraunati sumu kvadrata UNUTAR GRUPA (SSwg): SSwg = X-(T2j / nj)

X: totalna suma kvadriranih rezultata u svim grupama
T2j:
kvadrirana suma rezultata u pojedinim grupama (j)
nj:
broj rezultata u pojedinim grupama
SSwg = (92 + 82 + 62 + + 72 + 92 + + 152 + 112 + 112) (702 / 10 + 692 / 10 +1102 / 10 +

1342 / 10 + 1202 / 10)
SSwg = 5847 5411,7 = 435,3
SSwg = 435,3
PROVJERA:
Ako su tano izraunate vrijednosti SStot, SSbg i SSwg, tada mora biti zadovoljena jednakost:
SStot = SSbg + SSwg
786,82 = 351,52 + 435,3
Odrediti STUPNJEVE SLOBODE za svaku sumu kvadrata:

dfbg = (k-1) k: broj grupa
dfbg = 5 1 = 4
dfbg = 4
dfwg = (N-k)
dfwg = 50 5 = 45
dfwg = 45
dftot = dfbg + dfwg
dftot = 4 + 45 = 49
dftot = 49
Odrediti VARIJANCE (prosjene kvadrate):

MS = suma kvadrata/df
MSbg = SSbg / dfbg MSbg = 351,52 / 4 = 87,88
MSwg = SSwg / dfwg MSwg = 435,3 / 45 = 9,67
Izraunati F:
F = MSbg / MSwg
F = 87,88 / 9,67 = 9,08
Iz tablice L oitati graninu F vrijednost za odreene stupnjeve slobode. Ftablica se ita
tako da se stupnjevi slobode brojnika itaju na gornjem rubu tablice, a stupnjevi slobode
nazivnika na njenom lijevom rubu.
F0,05 (4,45) = 2,58; F0,01 (4,45) = 3,78
156
Unijeti rezultate u TABLICU ANALIZE VARIJANCE
Izvor varijabiliteta
Suma kvadrata
Stupnjevi
Varijanca
(SS)
slobode (df)
(MS)
izmeu grupa
351,52
87,88
unutar grupa
435,30
45
9,67
Total
786,82
49
9,08
Odbacujemo H0 i zakljuujemo da postoji znaajna razlika izmeu aritmetikih sredina

grupa!
Moemo zakljuiti da postoji statistiki znaajna razlika izmeu ispitanika pet grupa.
Meutim, jo uvijek ne znamo izmeu kojih grupa postoji statistiki znaajna razlika. Kako bi
odgovorili na ovo pitanje, provodimo tzv. post-hock postupak. Prilikom izraunavanja razlika
izmeu aritmetikih sredina nakon zavrenog F-testa (a posteriori) moe se koristiti neki od testova:
Scheffeov test, LSD, Bonferroni. U nastavku prikazat emo postupak u kojem se koristi Scheffeov
test.
Scheffeov test
Nakon izraunatog F-omjera u analizi varijance, za svaki par aritmetikih sredina koje elimo
usporediti primjeniti sljedeu formulu:
F = (Ma Mb)2 / [MSwg (na + nb) / nanb]
Iz F-tablice oitamo granini F uz eljeni nivo znaajnosti, za (k 1) i (N k) stupnjeve

slobode.
Oitana granina vrijednost F pomnoi se sa (k 1) i tako dobijemo novu graninu
vrijednost F.
Izraunati F uporedimo sa F. Ako je F>F razliku moemo smatrati znaajnom.
Postupak od 1 do 4 ponovit emo za svaki par aritmetikih sredina.
Za utvrivanje parova AS za koje postoji statistiki znaajna razlika upotrijebit emo Scheffeov
test.
F = (M1 M2)2 / [MSwg (n1 + n2) / n1n2]
157
F = (7 6,90)2 / [9,67 x (10 + 10) / 10 x 10]

F = 0,012 / 9,67 x 0,2
F = 0,005
F0,05 (4,45) = 2,58; F0,01 (4,45) = 3,78
Fgr x (k 1) = 2,58 x 4 = 10,32
0,005 < 10,32
Zakljuujemo da izmeu aritmetikih sredina prve i druge grupe ne postoji znaajna razlika!
Postupak emo ponoviti za svaki par AS. U tabeli ispod prikazane su izraunate Fvrijednosti i nivo znaajnosti.
Razlike izmeu AS
M1 - M2
0,005
> 0,05
M1 - M3
8,27
> 0,05
M1 - M4
21,18
< 0,01
M1 - M5
12,93
< 0,05
M2 - M3
8,69
>0,05
M2 - M4
21,85
<0,01
M2 - M5
13,45
>0,05
M3 - M4
2,98
>0,05
M3 - M5
0,52
>0,05
M4 - M5
1,01
>0,05
Najefikasiji naini procesiranja su etvrti i peti, tj. imaginacija i namjerno uenje.
158
PRIMJER 10.2
Pretpostavimo da je edukacijski psiholog elio ispitati koja je metoda poduavanja fizike
najefikasnija, metoda A, B ili C. Formirane su tri grupe ispitanika koje su poduavane trima
metodama, nakon ega je utvren nivo znanja primjenom Testa znanja iz fizike. Rezultati su
prikazani u tabeli ispod:
12
17
20
14
24
19
12
18
23
13
20
26
11
24
22
17
18
17
19
23
19
18
20
18
20
20
20
16
16
16
Da li se aritmetike sredine ispitanika grupa A, B i C statistiki znaajno razlikuju? Koja

metoda je najefikasnija?
Najprije emo provjeriti da li distribucije rezultata tri grupe znaajno odstupaju od normalne i
da li su varijance homogene. Box-plot prikaz distribucije rezultata moe nam posluiti za brzu
provjeru normalnosti distribucija rezultata (bez zakljuka), ali i ukazati na mogue razlike u
varijancama. Na osnovu box-plot prikaza moemo zakljuiti da su distribucije priblino simetrine, i
da se varijance znaajno ne razliku. Uporeujui standardne devijacije takoer moemo zakljuiti da
je zadovoljen preduvjet homogenosti varijanci.
A
Ti
152
200
200
15,2
20
20
3,2
2,9
3,0
159
1.
GT = (X)/ N
GT = 10156,80
2.
SumX = 10558
3.
SStot = X - GT
SStot = 401,20
4.
SSbg = T2j / n GT
SSbg = 153,60
5.
SSwg = X-(T2j / nj)
SSwg = 247,6
SStot = 401,20
provjera SStot = SSbg + SSwg

6.
7.
8.
dfbg = 2
df bg = (k-1)
df wg = (N-k)
dfwg = 27
df tot = dfbg + dfwg
dftot = 29
MSbg = SSbg / dfbg
MSbg = 76,80
MSwg = SSwg / dfwg
MSwg = 9,17
F = MSbg / MSwg
F = 8,375
p = 0,001
F0,05 (2,27)
9.
Tabela ANOVA
Suma kvadrata
(SS)
Stepeni slobode
(df)
Varijanca
(MS)
izmeu grupa
153,60
76,80
8,375
0,001
unutar grupa
247,60
27
9,17
Total
401,20
29
Razlike izmeu aritmetikih sredina su statistiki znaajne!

S obzirom da su aritmetike sredine grupa B i C jednake (i da su standardne devijacije
podjednake), zakljuujemo da su ove dvije metode podjednako efikasne, i da su efikasnije od
metode A.
160
PRIMJER 10.3
U zadatku 12 iz Poglavlja 3 (Mjere centralne tendencije) bilo je rijei o anketi koju je
nastavno vijee O Sigmund Freud uputilo roditeljima uenika estih razreda. Jedno od anketnih
pitanja odnosilo se i na novana primanja majki uenika (anketirano je ukupno 98 porodica). Na
temelju ovih podataka nastavno vijee eli dobiti informaciju da li se visina novanih primanja
majki statistiki znaajno razlikuje obzirom na njihovu strunu spremu. U tu svrhu, na temelju
podataka o strunoj spremi prikupljenih anketnim upitnikom, majke uenika podijeljenje su u etiri
kategorije: 1 nia struna sprema (NSS), 2 srednja struna sprema (SSS), 3 via struna sprema
(VS) i 4 visoka struna sprema (VSS). Obzirom da u dva anketna upitnika nije bila navedena
struna sprema ispitanica, podaci za ove dvije majke su iskljueni iz daljnje analize, ime je broj
ispitanika u konanom uzorku iznosio 96. Podaci organizirani na ovaj nain prezentirani su u tabeli
ispod.
161
Struna sprema majke

SSS
VS
VSS
450
750
900
1.150
450
750
900
1.150
450
750
900
1.150
500
800
950
1.200
500
800
950
1.200
500
850
950
1.200
500
850
950
1.200
550
850
950
1.200
600
850
950
1.250
600
850
950
1.250
600
850
1.000
1.250
650
850
1.000
1.250
650
850
1.000
1.250
650
850
1.000
1.250
650
900
1.050
1.250
700
900
1.050
1.350
700
900
1.050
1.350
700
900
1.050
1.350
700
900
1.050
1.400
700
900
1.100
1.400
700
900
1.100
1.400
750
900
1.100
7.750
750
900
1.150
8.000
750
900
1.150
10.600
24
24
24
24
614,58
854,17
1.008,33
2.200,00
102,66
50,90
76,14
2.585,20
14.750,00
20.500,00
24.200,00
52.800,00
217.562.500,00
420.250.000,00
585.640.000,00
2.787.840.000,00
9.307.500,00
17.570.000,00
24.535.000,00
269.875.000,00
Mjeseni novani prihodi majke (KM)
NSS
X
(X)
X2
U okviru raunskog postupka za jednosmjernu analizu varijance dobivene su sljedee

vrijednosti:
162
1.
GT = (SX)/ N
2.
SumX
3.
SStot = SX - GT
4.
SSbg = ST2j / n GT
5.
SSwg = SX - S(T2j / nj)
GT = 131.250.651,04
SumX = 321.287.500,00
SStot = 190.036.848,96
SSbg = 35.886.536,46
SSwg = 154.150.312,50
SStot = 190.036.848,96

6.
7.
8.
dfbg = 3
dfbg = (k - 1)
dfwg = (N - k)
dfwg = 92
dftot = dfbg + dfwg
dftot = 95
MSbg = SSbg / dfbg
MSbg =11.962.178,82
MSwg = SSwg / dfwg
MSwg = 1.675.546,88
F = MSbg / MSwg
F = 7,14
p = 0,00
2,72
F0,05 (3,92)
9.
Tabela ANOVA
Suma kvadrata (SS)
Stepeni
slobode
(df)
Varijanca
(MS)
izmeu grupa
35.886.536,46
11.962.178,82
7,14
0,00
unutar grupa
154.150.312,50
92
1.675.546,88
Total
190.036.848,96
95
Analiza varijance pokazuje da meu grupama (definiranim na temelju strune spreme) postoji
statistiki znaajna razlika u visini mjesenih primanja (to znai da nul-hipotezu treba odbaciti).
Meutim, naknadnom provjerom poetne distribucije rezultata, nastavnik matematike (koji je
provodio analizu) uvidio je da postoji osnova za sumnju da etiri grupne distribucije nisu normalno
distribuirane (ime ne bi bio ispunjen jedan od osnovnih uvjeta za provoenje analize varijance
163
normalnost distribucija). Osim toga, varijabilitet rezultata grupa znaajno se razlikuje (najnia
s=50,9, najvia s=2.585,20). Kako bi provjerio svoju pretpostavku, nastavnik je za svaku grupu
izraunao veliinu odstupanja distribucije mjesenih primanja od normalne distribucije (drugim
rijeima, izraunao je skjunis za svaku grupu). Dobio je sljedee rezultate:
Struna sprema
NSS
SSS
VS
VSS
Skjunis
-,364
-,988
,339
2,600
Std. greka skjunisa
,472
,472
,472
,472
Kako se iz tabele vidi, sve distribucije vie ili manje odstupaju od normalne (distribucije za
NSS i SSS su negativno asimetrine, a distribucije za VS i VSS pozitivno asimetrine). Meutim,
samo za VSS distribucija mjesenih primanja znaajno odstupa od normalne distribucije. To je
mogue zakljuiti na osnovu toga to je skjunis za ovu distribuciju vei od svoje standardne
pogreke za vie od tri puta.
Razlog asimetrinosti distribucije za grupu VSS jesu tri ekstremna rezultata, kako je to
ilustrirano u dolje priloenom box-plotu. Ovi rezultati (kako se vidi na grafikonu) pripadaju
ispitanicama pod rednim brojem 75, 76 i 77 u bazi podataka, odnosno to su rezultati od 7.750, 8.000
i 10.600 KM i svojom veliinom distribuciju pomjeraju u desnu stranu.
Nastavnik matematike imao je nekoliko opcija na raspolaganju kako bi rijeio problem

esktremnih rezultata. Prva opcija bila je da pronae anketne upitnike za ove tri osobe i da provjeri da
li je navedena vrijednost mjesenih primanja tano unesena u bazu podataka. Ispostavilo se da jeste.
Druga opcija koju je nastavnik imao na raspolaganju jeste da telefonski kontaktira navedene
ispitanice kako bi provjerio da li je do eventualne greke dolo prilikom ispunjavanja ankete. Nakon
to je ispitanicama detaljno objasnio zato ih ponovo kontaktira vezano za njihova (visoka) primanja
(a na njihovo insistiranje, kako su sve tri bile vrlo sumnjiave) te nakon to se jo jednom obavezao
164
da se ovi podaci nigdje nee povezati sa njihovim linim informacijama, sve su ispitanice potvrdile
da su to zaista njihova tana primanja. Meutim, kako su ovakvi sluajevi zaista ekstremni u
populaciji, nastavnik je jo uvijek elio biti siguran da su utvrene razlike meu grupama znaajne i
bez ovako rijetkih vrijednosti. Kako bi to uinio, nastavnik je odluio iskljuiti ova tri ekstremna
rezultata iz analize varijance. Na taj nain grupa VSS bi imala 21 ispitanicu, ime veliina grupa
ukljuenih u analizu ne bi bila jednaka (to moe naruiti pretpostavku o homogenosti varijanci u
grupama). Zbog toga je nastavnik odluio iz svake od tri preostale grupe po sluaju iskljuiti po tri
ispitanice. Konano, dobio je sljedee distribucije rezultata:
Struna sprema majke
SSS
VS
VSS
450
750
900
1150
450
750
900
1150
500
750
900
1150
500
800
950
1200
500
800
950
1200
500
850
950
1200
550
850
950
1200
600
850
950
1200
600
850
1000
1250
600
850
1000
1250
650
850
1000
1250
650
850
1000
1250
650
850
1050
1250
650
900
1050
1250
700
900
1050
1250
700
900
1050
1350
700
900
1050
1350
700
900
1100
1350
750
900
1100
1400
750
900
1150
1400
750
900
1150
1400
21
21
21
21
614,29
850,00
1.009,52
1.259,52
100,18
52,44
76,84
83,09
12.900,00
17.850,00
21.200,00
26.450,00
166.410.000,00
318.622.500,00
449.440.000,00
699.602.500,00
8.125.000,00
15.227.500,00
21.520.000,00
33.452.500,00
Mjeseni novani prihodi majke (KM)
NSS
X
(X)2
X2
165
Ponovnim uvidom u mjere (a)simetrinosti pojedinanih distribucija, nastavnik je zakljuio da

se sve etiri distribucije sada mogu smatrati normalnim (niti u jednoj distribuciji vrijednost skjunisa
nije tri puta vea od pripadajue standardne pogreke skjunisa):
Struna sprema majke
NSS
SSS
VS
VSS
Skjunis
-,270
-,862
,287
,533
Std. greka skjunis
,501
,501
,501
,501
U okviru raunskog postupka analize varijance, nastavnik je dobio sljedee vrijednosti:

1.
GT = (SX)/ N
GT = 73173333,33
2.
SumX
SumX = 78325000
3.
SStot = SX - GT
SStot = 5151666,667
4.
SSbg = S T2j / n GT
SSbg = 4639761,905
5.
SSwg = SX-S(T2j / nj)
SSwg = 511904,7619
SStot = 5151666,667

6.
7.
8.
dfbg = (k 1)
dfbg = 3
dfwg = (N k)
dfwg = 80
dftot = dfbg + dfwg
dftot = 83
MSbg = SSbg / dfbg
MSbg = 1546587,302
MSwg = SSwg / dfwg
MSwg = 6398,809524
F = MSbg / MSwg
F = 241,70
p = 0,0000
2,72
F0,05 (3, 80)
166
9.
Tabela ANOVA
Suma kvadrata (SS)
Stupnjevi
Varijanca
(MS)
izmeu grupa
4.639.761,90
1.546.587,30
241,70
0,00
unutar grupa
511.904,76
80
6.398,81
Total
5.151.666,67
slobode
(df)
Kao to vidimo, dobiveni F omjer je ponovo statistiki znaajan; meutim u ovoj analizi je
mnogo vei od onog dobivenog u prvom postupku (7,14 prema 241,70).
Nakon zakljuka da se grupe razliitih nivoa obrazovanja statistiki znaajno razlikuju prema
visini mjesenih primanja, nastavniku matematike ostalo je da utvrdi koje tano grupe se meusobno
razlikuju (odnosno u kojim parovima aritmetikih sredina se pojavljuje statistiki znaajna razlika).
Da bi to utvrdio, nastavnik je proveo post-hoc analizu razlika meu aritmetikim sredinama, sluei
se Scheffe-ovim postupkom:
F0,05 (3,80) 2,72
Fgr (k 1) = 2,72 x 3 = 8,16
Dobiveni su sljedei rezultati:
Razlike izmeu AS
M1 - M2
91,17
<0,05
M1 - M3
256,33
<0,05
M1 - M4
683,17
<0,05
M2 - M3
41,76
<0,05
M2 - M4
275,20
<0,05
M3 - M4
102,56
<0,05
Kako se sve aritmetike sredine statistiki znaajno razlikuju jedna od druge, moemo
zakljuiti da struna sprema (na svim nivoima) utie na mjesena primanja ispitanica.
167
PRIMJER 10.4
Jedna grupa ispitanika (N=6) uestvovala je u istraivanju zapamivanja rijei razliitog
emocionalnog znaenja (neutralne, pozitivne i negativne rijei). U tabeli ispod prikazan je broj
zapamenih rijei s obzirom na njihov emocionalni ton.
Ispitanik
Neutralne rijei
Pozitivne rijei
Negativne rijei
Ts
12
16
15
43
10
11
13
34
14
14
18
46
11
28
12
13
15
40
16
15
18
49
Tt
72
78
90
Izraunavanje pomonih vrijednosti (X2 i (X)2 / N )

X2 = 122 + 102 + 142 + .... + 112 + 152 + 182 = 3340
(X)2 / N = (12 + 10 + 14 + .... + 11 + 15 + 18)2 / 18 = 3200
Totalna suma kvadrata
SStot = X2 (X)2 / N
SStot = 3340 3200 = 140
Suma kvadrata izmeu ispitanika
SSbs = Ts / t (X)2 / N
SSbs = (432 + 342 + 462 + ... + 492) / 3 3200 = 3302 3200 = 102
Suma kvadrata izmeu tretmana
SSt = Tt / n (X)2 / N
SStr = (722 + 782 + 902) / 6 3200 = 3228 3200 = 28
Suma kvadrata reziduala
SSrez = SStot SSbs SStr
SSrez = 140 102 28 = 10
168
Odreivanje stupnjeva slobode

dfbs = n 1 = 6 1 = 5
dftr = t 1 = 3 1 = 2
dfrez = (n 1)(t 1) = 5 x 2 = 10
Odreivanje prosjenog kvadrata
MStr = SStr / dftr = 28 / 2 = 14
MSrez = SSrez / dfrez = 10 / 10 = 1
Odreivanje F-vrijednosti
F = MStr / MSrez = 14 / 1 = 14
Granina F-vrijednosti: F0,05 (2 / 10) = 4,10
Tabela analize varijance
Izmeu ispitanika
Suma kvadrata
(SS)
Stupnjevi
Varijanca
slobode (df)
(MS)
102
Izmeu tretmana
28
14
Rezidual
10
10
Total
140
17
14
<0,05
Unutar ispitanika
169
PRIMJER 10.5
Tri grupe ispitanika mukog i enskog spola uestvovali su u eksperimentalnom ispitivanju
efekata razliitih doza lijeka na simptome depresivnosti. U tabeli ispod prikazani su rezultati koje su
ispitanici postigli na skali depresivnosti nakon tretmana odgovarajuom dozom lijeka (vei rezultat
znai izraenije simptome depresivnosti).
ene
mukarci
TBj
Placebo
Srednja doza lijeka
Velika doza lijeka
38
33
23
35
32
26
33
26
21
T11 = 106
T12 = 91
T13 = 70
33
34
34
31
36
31
28
34
32
T21 = 92
T22 = 104
T23 = 97
293
198
195
167
560
TAi
267
Faktorijalnom analizom varijance provjeriti emo glavne efekte i efekat interakcije Spol x
Doza.
Izraunavanje pomonih vrijednosti (X2 i GT )
X2 = 382 + 352 + 332 + 332 +....+ 332 + ... + 322 = 17776
(X)2 / N = (38 + 35 + 33 + 33 + ....+ 32)2 / 18 = 5602 / 18 = 17422,22
Totalna suma kvadrata

SStot = X2 (X)2/N = 17776 17422,22 = 353,78
Suma kvadrata izmeu grupa
SSbg = Tij / n (X)2/N = (1062 + 912 + 702 + 922 + 1042 + 972) / 3 17422,22
= 53106 / 3 17422,22 = 17702 17422 = 279,78
Suma kvadrata za prvi faktor

SSA = TA2 / nb (X)2/N = (2672 + 2932) / 3 x 3 17422,22
= 17459,78 17422,22 = 37,56
170
Suma kvadrata za drugi faktor

SSB = TB2 / na ( X)2/N = (1982 + 1952 + 1672) / 3 x 2 17422,22
= 17519,67 17422,22 = 97,45
Suma kvadrata za interakciju

SSAB = SSbg SSA SSB = 279,78 37,56 97,45 = 144,77
Suma kvadrata unutar grupa
SSwg = X2 - Tij / n = 17776 17702 = 74
Provjera: SStot = SSbg + SSwg
353,78 = 279,78 + 74
Odreivanje stupnjeva slobode
dftot = N 1 = 18 1 = 17
dfA = a 1 = 2 1 = 1
dfB = b 1 = 3 1 = 2
dfAB = (a 1)(b 1) = 1 x 2 = 2
dfwg = N a x b = 18 2 x 3 = 18 6 = 12
dftot = dfwg + dfA + dfB + dfAB
Odreivanje prosjenog kvadrata
MSwg = SSwg / dfwg = 74 / 12 = 6,17
MSA = SSA / dfA = 37,56 / 1 = 37,56
MSB = SSB / dfB = 97,45 / 2 = 48,72
MSAB = SSAB / dfAB = 144,77 / 2 = 72,38
Odreivanje F-vrijednosti
FA = MSA / MSwg = 37,56 / 6,17 = 6,09
FB = MSB / MSwg = 48,72 / 6,17 = 7,90
FAB = MSAB / MSwg = 72,38 / 6,17 = 11,73
171
Granine F-vrijednosti:
A: F0,05 (1/12) =4,75
B: F0,05 (2/12) = 3,89
A x B: F0,05 (2/12) = 3,89
Tabela analize varijance
Suma kvadrata
Stepeni
Varijanca
(SS)
slobode (df)
(MS)
Izmeu grupa
279,78
A (spol)
37,56
B (tretman)
97,45
AxB
Unutar grupa
Total
37,56
6,09
p<0,05
48,72
7,90
p<0,05
144,77
72,38
11,73
p<0,05
74
12
6,17
353,78
17
Glavni efekti
Ako posmatramo razliku izmeu mukaraca i ena, bez obzira na tretman, govorimo o
glavnom efektu varijable Spol.
Mm = 32,56, M = 29,67
F = 6,09; p < 0,05
Takoer, ako posmatramo razliku izmeu tretmana, bez obzira na spol, govorimo o glavnom
efektu varijable Tretman.
Mp = 33, Msd = 32,5, Mvd = 27,83
F = 7,90; p < 0,05
172
Interakcija
Kako bi se razumjela interakcija, korisno je odrediti aritmetike sredine za svaku eliju.
Placebo
Srednja doza
lijeka
Velika doza lijeka
MA
ene
35,33
30,33
23,33
29,67
mukarci
30,67
34,67
32,33
32,56
33
32,5
27,83
MG = 31,11
MB
Nakon odreivanja AS, potrebno je napraviti grafiki prikaz i interpretirati interakciju. Zavisnu
varijablu (Depresija) nanosimo na Y osu, jednu od nezavisnih varijabli na X osu (Tretman), a
posebnim linijama oznaavamo dva nivoa druge nezavisne varijable (Spol).
Iz grafikog prikaza oigledno je da se nivo depresivnosti na razliite naine mijenja kod

mukaraca i ena s obzirom na dozu lijeka. Kod ena velika doza lijeka dovodi do znatnog
smanjenja simptoma, dok dok mukaraca to nije sluaj ak je nivo depresivnosti podjednak kao i
kod placeba!
173
ZADACI
Testirajte znaajnost razlika izmeu aritmetikih sredina.
1.
90
100
86
92
79
91
87
114
120
110
89
115
115
93
79
Testirajte znaajnost razlika izmeu aritmetikih sredina.
2.
3.
10
14
10
10
13
12
11
17
13
17
22
11
18
17
17
17
19
11
19
14
19
15
20
18
20
16
17
24
Bez raunanja odredite F i p.

A
10
12
10
14
13
14
14
10
12
10
12
12
14
13
11
13
11
11
13
11
174
4.
U jednom istraivanju ispitivano je da li postoje razlike u uspjenosti poduavanja biologije s

obzirom na koritene metode. Eksperimentalni dizajn podrazumijeva formiranje tri grupe (A, B
i C metoda) i razvrstavanje uenika u jednu od tri grupe metodom sluajnog odabira. Na kraju
kolske godine svi uenici su rjeavali standardizirani test znanja iz biologije (raspon rezultata
od 0 do 100 bodova). Rezultati ANOVA-e su prikazani u tabeli ispod.
SS
Izmeu grupa (bg)
df
MS
20
20
300
Unutar grupa (wg)

Total
700
22
a. Na osnovu rezultata prikazanih u tabeli, odredite vrijednosti koje nedostaju (SSwg, dfbg i
MSbg) i upiite ih u tabelu u odgovarajua polja.
b. Koliko je ispitanika uestvovalo u istraivanju?
c. ta moemo zakljuiti na osnovu dobivene F-vrijednosti?
d. Da li se aritmetike sredine statistiki znaajno razlikuju?
DA
NE
e. ta biste uradili nakon to odgovorite na pitanje da li se aritmetike sredine statistiki
znaajno razlikuju?
5.
Dopunite tabelu i odgovorite na pitanja ispod.

Suma
kvadrata
(SS)
izmeu grupa
Stepeni
slobode (df)
Varijanca
(MS)
unutar grupa
180,80
Total
276,95
19
Koliko je ukupno ispitanika uestvovalo u istraivanju? Da li su razlike izmeu AS statistiki

znaajne?
175
6.
Tri grupe ispitanika mukog i enskog spola uestvovale su u tri razliita eksperimentalna
uvjeta zapamivanja besmislenih rijei. Rezultati za svaku situaciju prikazani su u donjoj tabeli
kao i broj upamenih rijei za svakog ispitanika.
SPOL
II
III
10
11
19
11
13
17
14
15
18
13
10
15
18
14
14
11
10
20
11
14
16
14
15
18
14
10
15
17
15
14
Ispitati statistiku znaajnost efekata faktora SPOL, GRUPA te interakcije SPOL X GRUPA.
7.
U tabeli ispod navedite vrijednosti koje nedostaju te grafiki prikaite glavne efekte i efekat
interakcije varijabli A i B (nije potrebno raunski provoditi analizu varijance) (na graficima na
odgovarajui nain oznaite X ose te, ukoliko je potrebno formirajte legendu).
B1
B2
B3
A1
14
A2
A3
12
MB
176
MA
8.
Tri grupe od po 9 ispitanika su uili gradivo razliitim metodama (metode A, B i C). Uspjenost
uenja izmjerena je testom znanja. Vrijednosti u bodovima navedene su za svakog ispitanika u
svakoj grupi u tabeli ispod.
GRUPA A
GRUPA B
GRUPA C
49
47
32
31
25
20
28
32
30
35
35
18
38
33
22
50
41
37
55
44
34
30
34
32
42
40
35
a. Provjerite znaajnost razlika u uspjenosti uenja izmeu tri grupe ispitanika.

b. Koja metoda je najmanje efikasna u uenju (A, B ili C)?
9.
Dopunite tabelu sa podacima za grupe B i C, tako da vrijede rezultati prikazani u tabeli

ANOVA-e.
A
Suma
kvadrata
(SS)
Stepeni
slobode
(df)
Varijanca
(MS)
0,000
1,000
10
11
izmeu grupa
0,00
0,00
12
unutar grupa
8,40
12
0,70
8,4
14
11
Total
10
177
10. U sljedeoj tabeli prikazani su rezultati analize varijance nekog hipotetikog eksperimenta u
kojem su ispitanici rjeavali matematike zadatke na etiri nivoa teine i bili kanjeni za
pogrena rjeenja sa pet razliitih tipova kazne. Neke vrijednosti u tabeli su izbrisane, ali sve to
je izbrisano moe se izraunati na osnovu datih rezultata. Kompletirajte tabelu tako to ete
upisati odgovarajue vrijednosti!
Izvor variranja
SS
df
MS
Izmeu grupa
Teina zadatka (A)
100
Tip kazne (B)
150
AXB
Unutar grupa
Total
90
1190
178
11. Korelacija i regresija
Korelacija je statistika mjera povezanosti izmeu dvije ili vie varijabli. Korelacijom
opisujemo odnos izmeu dvije ili vie varijable: kakvog je oblika (npr.: linearan, kvadratian,
logaritamski, obrnuto U) i koliko iznosi. Npr., konzumiranje cigareta povezano je sa razliitim
oboljenjima; sa poveanjem konzumiranja cigareta poveava se uestalost razliitih oboljenja.
Sposobnost odgaanja zadovoljenja odreenih potreba u ranom djetinjstvu povezano je sa
socijalnom kompetencijom u odrasloj dobi ili s poveanjem sposobnosti odgaanja zadovoljenja
potreba u ranoj dobi, poveava se socijalna kompetencija u odrasloj dobi. U medicinskim
istraivanjima utvrena je povezanost izmeu tjelesne visine i uestalosti sranog udara kod ena:
to je visina vea, uestalost sranog udara je manja. U svakodnevnom ivotu esto koristimo
koncept povezanosti. Npr., ako na parkingu ispred trnog centra vidite veliki broj parkiranih
automobila, oekujete da e u centru biti guva; ako je na parkingu mali broj automobila, ne
oekujete guvu. Na osnovu ovih oekivanja (predvianja) donosite odgovarajuu odluku.
Korelacija moe biti pozitivna (porastu jedne odgovara porast druge varijable), negativna
(porastu jedne odgovara opadanje druge varijable), maksimalna, perfektna (vee slaganje ne moe
postojati) i nulta (izmeu dvije varijable ne postoji povezanost).
Ako su dvije varijable u korelaciji, to znai da na osnovu jedne varijable moemo, manje ili
vie precizno, predvidjeti rezultate druge varijable. Konceptu korelacije, blizak je koncept regresije
(tanije, regresijske analize). Regresijskom analizom predviamo vrijednosti jedne varijable, koju
nazivamo kriterijska, na osnovu informacija koje imamo o drugoj varijabli, koju nazivamo
prediktorska varijabla.
U tekstu koji slijedi najprije emo opisati koncept korelacije, a zatim koncept regresije.
Korelacija
U opisivanju povezanosti koristimo grafike i numerike metode.
Grafika metoda podrazumijeva grafiki prikaz povezanosti izmedu dvije varijable preko
skater dijagrama (eng. scatter diagram). Vrijednosti jedne varijable nanose se na X osu, a
druge na Y osu. Svaki ispitanik se prikazuje kao taka u koordinatnom sistemu [ureeni par, (x, y)].
Prediktorska varijabla nanosi se na apscisu, a kriterijska na ordinatu. Skater dijagram omoguava da:
odredimo smjer povezanosti; procjenimo da li je povezanost visoka, umjerena ili niska; utvrdimo
kakvog je oblika povezanost (linearna, inverzna U, ili neka druga); detektiramo ekstremne rezultate.
U skater dijagram unosi se pravac kojeg nazivamo pravac regresija Y na X. Predstavlja
najbolju predikciju Yi za datu vrijednost Xi. Stupanj u kojem se take okupljaju oko pravca
odraava veliinu povezanosti tj. korelacije izmeu X i Y. Ukoliko se sve take nalaze na pravcu
regresije, radi se o perfektnoj povezanosti, tj. maksimalno moguoj povezanosti.
179
Pretpostavimo da se u istraivanju ispitivala povezanost izmeu inteligencije (X) i kolskog

uspjeha (Y) i da smo prikupili podatke (kolski uspjeh i rezultat na testu inteligencije) za pet
ispitanika. Moemo pretpostaviti sljedea etiri opisa povezanosti izmeu ove dvije varijable: 1)
uenici koji su inteligentniji, postiu vii kolski uspjeh, 2) uenici koji su inteligentniji, postizat e
nii kolski uspjeh, 3) uenici koji su visoko inteligentni ili manje inteligentni, postizat e nii
kolski uspjeh u poreenju sa prosjeno inteligentnim uenicima, koji e postizati visok kolski
uspjeh, i 4) ne postoji povezanost izmeu inteligencije i kolskog uspjeha Za svaki opis navedeni su
podaci, a skater-dijagramom grafiki je prikazana povezanost.
1. Uenici koji su inteligentniji, postiu vii kolski uspjeh. Povezanost je pozitivna. Ispitanici koji
na jednoj varijabli postiu vie rezultate, takoer postiu vie rezultate i na drugoj varijabli, i
obratno, oni koji postiu nie rezultate na jednoj varijabli, postiu nie rezultate i na drugoj
varijabli.
ispitanik
y
Y
10
11
12
12
15
13
11
9
7
5
3
1
1
11
13
15
Skater dijagram u ovom sluaju opisuje pozitivnu povezanost izmeu dvije varijable.
Povezanost nije perfektna (take ne lee tano na pravcu regresije). S obzirom da su take blizu
pravca, povezanost je visoka.
U skater-dijagramu ispod, opisani su sluajevi kada take nisu toliko blizu pravca regresije.
Povezanost nije toliko visoka.
15
15
13
13
11
11
1
1
11
13
15
180
11
13
15
2. Uenici koji su inteligentniji, postizat e nii kolski uspjeh (nee se dovoljno truditi jer gradivo
smatraju jednostavnim, moda i dosadnim). Povezanost je negativna. Ispitanici koji na jednoj
varijabli postiu vie rezultate, na drugoj varijabli postiu nie rezultate, i obratno, oni koji
postiu nie rezultate na jednoj varijabli, postiu vie rezultate na drugoj varijabli.
ispitanik
12
11
11
10
12
15
13
3
1
1
11
13
15
Skater dijagram opisuje negativnu povezanost izmeu dvije varijable. Kao i u prethodnom
sluaju, povezanost nije perfektna (take ne lee tano na pravcu regresije), ali je visoka.
3. Uenici koji su visoko inteligentni ili manje inteligentni, postizat e nii kolski uspjeh u
poreenju sa prosjeno inteligentnim uenicima, koji e postizati visok kolski uspjeh.
Povezanost izmeu dvije varijable je nelinearna (zakrivljena). Ispitanici koji na jednoj varijabli
postiu vie i nie rezultate, postiu nie rezultate na drugoj varijabli, za razliku od ispitanika
koji na prvoj varijabli postiu prosjene vrijednosti, a na drugoj visoke.
ispitanik
10
12
15
13
11
5
3
1
1
11
13
15
Povezanost izmeu dvije varijable je nelinearna (zakrivljena). Pravac ne opisuje najbolje odnos
izmeu ove dvije varijable!
181
4. Ne postoji povezanost izmeu inteligencije i kolskog uspjeha. Povezanost izmeu dvije

varijable ne postoji (nulta povezanost). Bez obzira koji rezulat ostvarili na jednoj varijabli, na
drugoj varijabli ispitanici mogu postii bilo koji rezultat.
ispitanik
12
11
10
12
10
15
13
3
1
1
11
13
15
Povezanost izmeu dvije varijable ne postoji (nulta povezanost). Bilo gdje da ucrtamo pravac,
neemo adekvatno opisati nultu povezanost. Zapravo, ne postoji pravac koji najbolje opisuje ovakvu
povezanost.
Pearsonov koeficijent korelacije
Stupanj povezanosti izraava se koeficijentom korelacije, r. Vrijednost koeficijenta
korelacije kree se u granicama od -1 (potpuno negativna povezanost) do 1 (potpuno pozitivna
povezanost). Karl Pearson razradio je raunski postupak za izraunavanje stupnja povezanosti
(Pearsonov produkt-moment koeficijent korelacije).
Izraunavanje Pearsonovog koeficijenta korelacije preko kovarijanci
Kovarijanca je stepen u kojem dvije varijable zajedno variraju (ko-variraju). Kovarijanca
ukazuje na dijeljenu varijancu varijabli. Kovarijanca se izraunava preko izraza:
cov xy
(X Mx)(Y My)
N1
Pearsonov koeficijent korelacije izraunava se preko izraza:
rxy
cov xy
sx sy
Na grupi od deset ispitanika prikupljeni su podaci za varijable X i Y. Ispod je prikazan

postupak izraunavanja Pearsonovog koeficijenta korelacije.
182
ISPITANICI
1
2
3
4
5
6
7
8
9
10
M=
s=
X
3
4
5
5
6
7
8
9
9
10
Y
10
11
12
12
13
14
15
16
16
17
6,6
2,4
13,6
2,4
X - Mx
-3,60
-2,60
-1,60
-1,60
-0,60
0,40
1,40
2,40
2,40
3,40
Y - My
-3,60
-2,60
-1,60
-1,60
-0,60
0,40
1,40
2,40
2,40
3,40
(X - Mx)(Y - My)
12,96
6,76
2,56
2,56
0,36
0,16
1,96
5,76
5,76
11,56
=50,4
covxy =5,6
sx x sy =5,6
Koeficijent korelacija iznosi:
rxy
cov xy
sx sy
5,6
1
5,6
Izraunavanje Pearsonovog koeficijenta korelacije preko z-vrijednosti

Pearsonov koeficijent korelacije izraunava se preko izraza:
rxy
zy
N1
183
Postupak izraunavanja Pearsonovog koeficijenta korelacije prikazan je ispod.
ISPITANICI
1
2
3
4
5
6
7
8
9
10
M=
S=
X
3
4
5
5
6
7
8
9
9
10
Y
10
11
12
12
13
14
15
16
16
17
6,6
2,4
13,6
2,4
zx
-1,52
-1,10
-0,68
-0,68
-0,25
0,17
0,59
1,01
1,01
1,44
zy
-1,52
-1,10
-0,68
-0,68
-0,25
0,17
0,59
1,01
1,01
1,44
zx x z y
2,31
1,21
0,46
0,46
0,06
0,03
0,35
1,03
1,03
2,06
=9
Koeficijent korelacija iznosi:
rxy
zy
N1
9
1
9
Vano je primjetiti da su z-vrijednosti varijabli X i Y za svakog ispitanika identine (npr. za

prvog ispitanika, zx=-1,52; zy=-1,52), to je sluaj samo kada je povezanost izmeu dvije varijable
maksimalna.
Izraunavanje Pearsonovog koeficijenta korelacije iz sirovih rezultata
Za izraunavanje Pearsonovog koeficijenta korelacije iz sirovih rezultata koristimo sljedei
izraz:
rxy
N XY ( X)( Y)
X
2
184
Postupak izraunavanja Pearsonovog koeficijenta korelacije prikazan je ispod.
ISPITANICI
1
2
3
4
5
6
7
8
9
10
=
X
3
4
5
5
6
7
8
9
9
10
Y
10
11
12
12
13
14
15
16
16
17
X
9
16
25
25
36
49
64
81
81
100
Y
100
121
144
144
169
196
225
256
256
289
XY
30
44
60
60
78
98
120
144
144
170
66
136
486
1900
948
( X)= 4356
( Y)= 18496
Koeficijent korelacije iznosi:
rxy
N XY ( X)( Y)
N X X N Y Y
2
10 948 66 136
1
(10 486 4356) (10 1900 18496)
Testiranje znaajnosti r
Vrijednost dobivenog koeficijenta korelacije mogla je biti rezultat sluaja. Stoga je potrebno
testirati statistiku znaajnost dobivenog koeficijenta korelacije. Matematiki model (uz nultu
hipotezu, tj. da ne postoji povezanost izmeu dvije varijable) ukljuuje distribuciju svih
koeficijenata korelacije od -1 do +1, sa aritmetikom sredinom M=0 (r=0).
Statistiku znaajnost koeficijenta korelacije moemo provesti na dva naina: preko tvrijednosti i uporeivanjem dobivenog r sa graninom vrijednou r oitanom iz tablice. t-vrijednost
se izraunava koritenjem izraza:
r N2
1 r2
185
Preduvjeti za koritenje Pearsonovog koeficijenta korelacije

Pearsonov koeficijent korelacije rauna se ako su ispunjeni sljedei preduvjeti:
Intervalna ili omjerna skala mjerenja
Normalna, ili barem simetrina distribucija
Linearan odnos izmeu varijabli
Korelacija i uzrona veza
Sama injenica da izmeu dvije pojave postoji povezanost ne daje nam za pravo da te pojave
poveemo uzronom vezom.
Mogua objanjenja odnosa izmeu varijabli X i Y:
a.
b.
c.
d.
varijabla X utjee na varijablu Y (XY)

varijabla Y utjee na varijablu X (YX)
varijabla X utjee na varijablu Y i varijabla Y utjee na varijablu X (XY)
varijabla Z utjee na varijable X i Y (XZY)
Korelacijskim istraivakim nacrtom ne moemo odrediti prirodu odnosa izmeu X i Y (a,b,c

ili d). Uzrono-posljedina veza izmeu dvije pojave moe se dokazati samo eksperimentom.
Pravac regresije
Pravac ucrtan u skater-dijagram je pravac koji najbolje odgovara podacima i predstavlja
najbolju moguu predikciju vrijednosti Yi za datu vrijednost Xi. Uz pomo pravca regresije moemo
za bilo koju vrijednost X najtanije prognozirati vrijednost varijable Y.
Prognoziranu vrijednost Y oznaavamo sa Y. Pravac regresije definiran je nagibom i
odsjekom na osi Y (kada je X=0), tj. izrazom:
Y = a + bX
gdje je:
Y prognozirani rezultat
a odsjeak na osi Y kada je X=0
b nagib pravca
X vrijednost prediktora
Nagib pravca govori nam koliko se mijenja vrijednost Y varijable uz jedininu promjenu
vrijednosti X varijable. Odsjeak na Y osi je prognozirani rezultata kada je X=0.
Vrijednosti a i b odreuju se izrazima:
a = My bMx
cov xy
sx
ili
186
b rxy
sy
sx
Pretpostavimo da smo za grupu od pet ispitanika dobili sljedee vrijednosti varijabli X i Y:
ispitanik
10
11
12
12
Za odreivanje jednaine pravca regresije potrebno je izraunati vrijednosti a i b. Najprije

emo izraunati nagib pravca, b. Za odreivanje b, potrebno je izraunati kovarijancu (uz pomo
vrijednosti izraunatih ispod).
(x-Mx)
(y-My)
(x-Mx)(y-My)
-4
-4
16
-1
-2
-2
-4
12
(x-Mx)(y-My) = 22
cov xy
(X Mx)(Y My) 22
5,5
N1
4
s x 10
2
cov xy
sx
5,5
0,55
10
Odsjeak na Y osi, kada je X=0, odredit emo preko izraza:

a = My bMx
a = 9 0,55 x 8 = 4,6
Uvrtavanjem izraunatih vrijednosti dolazimo do definiranog pravca regresije:

Y = 4,6 + 0,55X
Kada znamo jednainu pravca regresije, koristei samo dvije vrijednosti X, u skater dijagramu
moemo nacrtati pravac regresije. Odredimo Y za, npr., X1=5 i X2=11.
187
Y1 = 4,6 + 0,55 x 5; Y1 = 7,35; Prva taka A (X1=5 ; Y1=7,35)

Y2 = 4,6 + 0,55 x 11; Y1 = 10,65; Druga taka B (X2=11; Y2=10,65)
Ako kroz dvije take, A i B, povuemo liniju, dobit emo pravac regresije (slika ispod).
Slika 11.1: Pravac regresije
Y
15
13
11
1
1
11
13
15
Pored pravca regresije Y na X, moemo odrediti i regresijski pravac X na Y. Ova dva pravca
sjeku se u taki Mx, My. Pravci su identini samo u sluaju perfektne korelacije (r=1).
Na istom primjeru pokazat emo i logiku odreivanja pravca regresije. U koordinatnom sistemu
moemo ucrtati beskonano mnogo pravaca, ali samo jedan pravac je optimalan, i to onaj koji je
tako definiran vrijednostima a i b da minimizira sumu kvadriranih YY odstupanja. Ova metoda
odreivanja pravca naziva se metoda najmanje sume kvadrata odstupanja. U skater-dijagramu
(slika 11.2) oznaena su YY odstupanja za svaku Y vrijednost.
188
Slika 11.2: Odstupanja Y od prognozironog rezultata Y

Y
15
13
11
11
9
YC- YC= 9 9
YD- YD= 11 7,9
12 YE- YE= 12 11,2
YB- YB=
YA- YA=
8 10,1
5 - 6,8
5
3
1
1
11
13
15
Vrijednosti a i b su takve da definiraju najpoteniju linearnu fukciju, tj. takve da pravac

regresije prolazi to blie vrijednostima Y varijable. Drugim rijeima, potrebno je nai
najoptimalnije vrijednosti a i b. Stoga se a i b odreuje u terminima pogreke predikcije, tj. preko
odstupanja rezultata Y od prognoziranog rezultata (koji se nalazi na pravcu regresije). Obzirom da je
Y rezultat kojeg smo dobili, a Y rezultat kojeg oekujemo jednainom pravca regresije, odstupanja
YY nazivamo rezidualom. Pravac koji prolazi skater-dijagramom treba da minimizira sumu
kvadriranih odstupanja, tj. minimizira (YY)2. Na taj nain dobiju se optimalne vrijednosti a i b.
Koristei jednainu pravca regresije moemo prognozirati rezultat Y na osnovu bilo kojeg
rezultata X. Prognoza rezultata moe se provesti grafikom (koristei skater-dijagram i pravac
regresije) ili numerikom metodom (koristei jednainu pravca regresije).
Koji je najvjerovatniji rezultat na varijabli Y ispitanika koji je na varijabli X postigao rezultat
x=15?
Y = 4,6 + 0,55X,
Y = 4,6 + 0,55 x 15
Dakle, najvjerovatniji rezultat, tj. prognozirani rezultat je:
Y = 12,85.
Drugi izraz (praktiniji) za odreivanje prognoziranog rezultata je:
s
Y' r y X Mx My
sx
189
Iako bi se na osnovu pojma prognoza moglo zakljuiti da varijabla X ima efekat na varijablu
Y, to je pogreno. Prognoza rezultata Y ne znai da smo utvrdili efekat jedne varijable na drugu!
Povezanost izmeu dvije varijable ne znai da jedna varijabla objanjava drugu!
Pogreka prognoze
U samo jednom sluaju, prognoza rezultata Y je maksimalno precizna: kada je povezanost
izmeu dvije varijable maksimalna mogua. Kada je r=1, sve take u skater-dijagramu nalaze se na
pravcu regresije, to znai da su odstupanja YY jednaka nuli, tj. rezidual je 0. U svim drugim
sluajevima postoji odreena odstupanja izmeu utvrenog i prognoziranog rezultata.
Izraz (YY)2 nazivamo suma kvadrata reziduala i oznaavamo sa SSrez. Pogreka
prognoze je to vea to je suma kvadrata reziduala vea. SSrez predstavlja varijabilitet koji ostaje
kada na osnovu X prognoziramo Y (kaemo da se radi o varijabilitetu koji se ne moe objasniti
prognoziranjem Y na osnovu X).
U naem primjeru, odredit emo (YY)2.
ispitanik
y- y
(yy)2
6,8
-2
10
10,1
-2
11
7,9
12
12
11,2
1
2
(YY) =
18
Suma kvadrata reziduala iznosi 18.

Suma kvadrata reziduala samo po sebi ne govori o pogreci koja postoji prilikom
prognoziranja rezultata. Za utvrivanje pogreke prognoze koristimo tzv. standardnu pogreku
prognoze.
Standardna pogreka prognoze definirana je izrazom:
sy, x
ssrez
ili
N2
sy, x
Y Y
N2
Kvadrirana vrijednost sy,x naziva se rezidualna varijanca ili varijanca pogreke. U naem
primjeru, standardna pogreka prognoze iznosi:
y, x
Y Y
N2
18
3
2,45
190
Za odreivanje standardne pogreke prognoze koristimo i sljedei izraz:
sy, x sy (1 r 2 )
N1
N2
Za velike uzorke (N-1)/(N-2) praktino je 1, pa se koristi i izraz:
sy, x sy (1 r 2 )
Standardna pogreka prognoze interpretira se kao standardna devijacija! Na osnovu standardne
pogreke prognoze odreujemo interval pouzdanosti prognoziranog rezultata:
Interval pouzdanosti = Y sy,x x t/2
Izraunat emo interval pouzdanosti prognoziranog rezultata na varijabli Y, ispitanika koji je na
varijabli X postigao rezultat x=15. Interval pouzdanosti iznosi (ve smo odredili da je prognozirani
rezultat Y=12,85):
IP=Y sy,x t/2 = 12,85 2,45 x 3,182 = 12,85 7,80
5,05 Y 20,65
(t/2 oitavamo iz tablice graninih vrijednosti t, za npr. 95% pouzdanost)
Dakle, 95% granice pouzdanosti su od 5,05 do 20,65.
Meutim, kada pravac regresije odreujemo na osnovu relativno malog broja podataka,
koristimo sljedei izraz:
Y s y,x t /2
1 (X Mx )2
1
N (N1)s x 2
Veliina intervala pouzdanosti prognoziranog rezultata odreena je veliinom koeficijenta

korelacije i, donekle, veliinom uzorka. to je koeficijent korelacije vei, pogreka prognoze se
smanjuje (ako je r=1, tada je sy,x=0, dok kod r=0, sy,x=sy). Veliina uzorka ne utjee u znaajnoj mjeri
na veliinu intervala pouzdanosti.
191
Preduvjeti za koritenje regresije

Preduvjeti za pravac regresije isti su kao i za Pearsonov koeficijent korelacije. Osim toga,
varijance Y za svaki X trebaju biti podjednake du pravca regresije homogenost varijanci, a
vrijednosti Y za svaki X trebaju se normalno distribuirati oko prognozirane vrijednosti Y(du
pravca regresije).
Koeficijent determinacije
Iz dva izraza za odreivanje standardne pogreke prognoze slijedi:
sy, x sy 1 r 2 , s y,x
SSrez
SSrez SS y (1 r 2 )
N2
odnosno:
SSrez = SSY SSY r2,
to nas dovodi do izraza:
r2
pri emu je:
SS y SSrez
SS y
SSy = (Y My)2
U gornjem izrazu SSy je totalna suma kvadrata rezultata Y (totalno variranje rezultata Y) i
sadrava totale:
1. sume kvadrata Y objanjen sa X - SSy(r2), i
2. sume kvadrata Y koji je nezavisan od X - SSrez.
U naem primjeru, totalna suma kvadrata rezultata kolskog uspjeha dijeli se na dio koji se
moe objasniti inteligencijom i dio (ostatak) koji objanjavaju druge varijable (ne znamo koje). SS rez
je suma kvadrata Y koja je nezavisna od X i predstavlja mjeru pogreke nakon to preko X
prognoziramo Y.
Nekoliko izvora varijabiliteta mogu se sumirati na sljedei nain:
1.
2.
3.
4.
SSX = (X MX)2; varijabilitet inteligencije;

SSY = (Y MY)2; varijabilitet kolskog uspjeha;
SSY = (Y My)2; varijabilitet kolskog uspjeha objanjen varijabilitetom inteligencije i
SSrez = (Y Y)2 = SSY SSY`; varijabilitet kolskog uspjeha koji se ne moe objasniti
varijabilitetom inteligencije.
192
Kako je ve reeno, jedan dio varijabiliteta kolskog uspjeha objanjen je inteligencijom (SS Y),
a jedan nije (SSrez). Bilo bi korisno da odredimo procenat ukupnog varijabiliteta kolskog uspjeha
koji se moe objasniti varijabilitetom inteligencije, tj. potrebna nam je mjera koja predstavlja odnos:
SS y
SS y
SS y SSrez
SS y
Ta mjera je koeficijent determinacije, r2:
r2
SS y
SS y
Koeficijent determinacije koristimo kako bi odredili postotak prognoziranog varijabiliteta.

Koeficijent determinacije govori o proporciji varijance jedne varijable koja se moe objasniti
varijancom druge varijable.
Na primjeru prognoze kolskog usjeha na osnovu inteligencije, koeficijent determinacije iznosi:
D = r2 = 0,493.
Moemo zakljuiti da je 49,3% varijabiliteta kolskog uspjeha objanjeno varijabilitetom
inteligencije. Ostalo je 50,7% varijabiliteta kolskog uspjeha koji se ne moe objasniti
varijabilitetom inteligencije.
193
PRIMJER 11.1
Na koji nain se mjenja potronja goriva s poveanjem brzine automobila? Ispod su prikazani
fiktivni podaci (koji oslikavaju realnu situaciju) koliine potroenog goriva na rastojanju od 100 km,
pri razliitim brzinama za automobil marke ASD.
Brzina (km/h)
10
20
30
40
50
60
70
80
Potronja (l)
20,0
15,7
10,0
8,6
7,3
6,0
7,5
7,9
Brzina (km/h)
90
100
110
120
130
140
150
160
Potronja (l)
8,2
9,1
9,8
10,0
11,0
12,5
12,9
13,3
Prikazat emo grafiki povezanost izmeu brzine automobile i koliine potroenog goriva, a
zatim opisati oblik povezanosti.
Slika 7
Potronja (l)
18
Skater dijagram prikazan je na slici 3.
16
Jasno se vidi da povezanost nije linearna.
14
Do vrijednosti brzine x=60 km/h potronja
12
goriva opada, ali pri brzinama veim od
10
ove, potronja goriva raste. Pri tome je
8
tempo opadanja potronje goriva vei od
tempa porasta potronje goriva. Obzirom da
6
povezanost nije linearna, nema smisla
4
govoriti o pozitivnoj ili negativnoj
2
povezanosti. Snagu povezanosti ne
0
0
20
40
60
80
100
120
140
160
180
moemo izraunati preko Pearsonovog
Brzina (km/h)
koeficijenta korelacije jer nije zadovoljen
uvjet linearne povezanosti izmeu varijabli.
Meutim, na osnovu oblika krivulje, mogli bi opravdano pretpostaviti da je povezanost snana
(postupci izraunavanja koeficijenata povezanosti u sluajevima kada nije zadovoljen uvjet
linearnosti, bit e objanjeni u sljedeem poglavlju).
PRIMJER 11. 2
Da li su verbalne sposobnosti povezane sa opom informiranou? U cilju ispitivanja ove
povezanosti grupa od 30 studenata psihologije rjeavala je test verbalnih sposobnosti (X) i test ope
informiranosti (Y). Rezultati su prikazani u tabeli ispod.
194
1. Koristei kovarijancu odrediti povezanost izmeu inteligencije i ope informiranosti.

ISPITANIK
XMX
YMY
(XMX)( YMY)
38,5
18
-0,13
2,13
-0,284
39,5
13
0,87
-2,87
-2,4969
47,5
15
8,87
-0,87
-7,7169
50,5
17
11,87
1,13
13,4131
38
14
-0,63
-1,87
1,1781
48
22
9,37
6,13
57,4381
43
16
4,37
0,13
0,5681
37
19
-1,63
3,13
-5,1019
45,5
24
6,87
8,13
55,8531
10
35
15
-3,63
-0,87
3,1581
11
25
11
-13,63
-4,87
66,3781
12
41
12
2,37
-3,87
-9,1719
13
28,5
-10,13
-7,87
79,7231
14
41,5
13
2,87
-2,87
-8,2369
15
39,5
18
0,87
2,13
1,8531
16
40,5
19
1,87
3,13
5,8531
17
34
19
-4,63
3,13
-14,4919
18
43,5
13
4,87
-2,87
-13,9769
19
29
14
-9,63
-1,87
18,0081
20
27
-11,63
-10,87
126,4181
21
35,5
20
-3,13
4,13
-12,9269
22
40
16
1,37
0,13
0,1781
23
29
20
-9,63
4,13
-39,7719
24
39
19
0,37
3,13
1,1581
25
40
21
1,37
5,13
7,0281
26
40
14
1,37
-1,87
-2,5619
27
39,5
12
0,87
-3,87
-3,3669
28
31
-7,63
-7,87
60,0481
29
49
25
10,37
9,13
94,6781
30
44
16
5,37
0,13
0,6981
(XMX)( YMY)=
195
473,5259
Deskriptivne vrijednosti iznose:

MX = 38,63; sX = 6,63
MY = 15,87; sY = 4,66
cov xy
rxy
sx s y
16,33
16,33
0,528
6,63 4,66 30,90
Pearsonov koeficijent korelacije iznosi:

r = 0,528.
U narednom koraku trebamo odrediti da li je utvreni koeficijent korelacije statistiki
znaajan.
t
r N2
1r
0,528
30 2
1 0,528
0,528
5,29
3,29
0,849
Granina vrijednost t za df=28 iznosi tgr= 2,048. Dakle, moemo zakljuiti da je izraunati
koeficijent korelacije statistiki znaajan na nivou p=0,05. tj:
r = 0,528, p < 0,05
2. Odrediti pravac regresije
Pravac regresije definiran je jednainom:
Y = a + bX
Za izraunavanje b i a koristit emo sljedee izraze:
a = My b Mx i b
cov xy
sx
16,33 16,33
0,37
6,632 43,96
a = My bMx = 15,87 0,37 x 38,63 = 1,58
196
cov xy
sx
Pravac regresije odreen je sljedeom jednainom:

Y = 1,58 + 0,37X
Za crtanje pravca potrebne su dvije take. Odredit emo ih preko jednaine pravca regresije.
Za X = 35, Y = 1,58 + 0,37 x 35 = 14,53
Za X = 45, Y = 1,58 + 0,37 x 45 = 18,23
Koristei jednainu pravca regresije odredili smo dvije take, A i B:
A(35;14,53), i B (45;18,23)
Skater-dijagran i pravac regresije prikazani su ispod.
Y 30
25
20
15
10
5
0
10
20
30
40
50
60
X
3. Odrediti koeficijent determinacije

Za odreivanje koeficijenta determinacije potrebno je kvadrirati koeficijent korelacije:
r2 = 0,5282 = 0,2789
Zakljuit emo da se 27,89% proporcije varijance ope informiranosti moe objasniti verbalnom
inteligencijom.
4. Odredit emo najvjerovatniji rezultat na testu ope informiranosti ispitanika koji na testu
verbalne inteligencije postie rezultat X=42. Odredit emo i 95% interval pouzdanosti
prognoziranog rezultata.
197
sy
Y ' r
sx
4,66
X Mx My 0,528
42 38,63 15,87 17,12
6
,
63
Za odreivanje intervala pouzdanosti, potrebno je izraunati standardnu pogreku prognoze:
sy , x sy (1 r 2 ) 4,66 1 0,528 2 4,66 0,85 3,96

Interval pouzdanosti iznosi:
IP=Y sy,x t/2 = 17,12 3,96 x 2,048= 17,12 8,11
9,00 25,23
Uz 95% sigurnost moemo tvrditi da se prognozirani rezultat nalazi u intervalu od 9 do 25,23.
PRIMJER 11.3
Psihologa je interesovalo da li uenici sa viim spacijalnim sposobnostima (npr. sposobnost
mentalne rotacije objekata) prave manje pogreaka na testu matematikih sposobnosti? Grupa od 30
uenika rjeavala je test spacijalnih sposobnosti (X) i utvren je broj pogreaka na test matematikih
sposobnosti (Y). Rezultati su prikazani ispod.
ISPITANIK
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
X
29
34,5
30
35
30,5
37
31
37
37,5
39
19
27
40
22
22
Y
15
15
19
20
20
20,5
21
21
22
22
23
23
25
27
28
ISPITANIK
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
198
X
26
23
24,5
25,5
20
28
25
28
28,5
32,5
24,5
18
27
21
28
Y
29
29
29
30
30
31
32
33
33,5
37,5
39
40
40,5
41
41
1. Ispitati preduvjet za koritenje Perasonovog koeficijenta korelacije

Za mjerenje spacijalnih i matematikih sposobnosti koritene su intervalne skale mjerenja.
Oblik distribucije rezultata obje varijble ispitat emo grafikom i numerikom metodom,
preko box-plot prikaza i skjunisa.
matematike sposobnosti
spacijalne sposobnosti
45.0
40.0
40.0
35.0
35.0
30.0
30.0
25.0
25.0
20.0
20.0
15.0
15.0
Box-plot prikaz ukazuje da se rezultati varijable spacijalne sposobnosti vjerovatno simetrino

distribuiraju, a da je distribucija rezultata varijable matematike sposobnosti negativno
asimetrina. Kako bi bili sigurni da li distribucije rezultata odstupaju statistiki znaajno od
simetrinosti, izraunat emo skjunis i odrediti standardnu pogrku skjunisa. Ispod su navedene
izraunate vrijednosti.
Varijabla
Spacijalne sposobnosti
Matematike
sposobnosti
skjunis
,287
,250
st.pog. skjunisa
,427
,427
Moemo zakljuiti da distribucija rezultata ne odstupa statistiki znaajno od simetrinosti.

Normalnost distribucije moemo ispitati koristei Kolmogorov-Smirnov Z test. Izraunate
vrijednosti KS-Z i p prikazani su ispod.
Varijabla
Spacijalne sposobnosti
Matematike
sposobnosti
KS-Z
,492
,737
p
,969
,649
Na osnovu dobivenih vrijednosti moemo tvrditi da distribucije rezultata na varijablama ne

odstupaju statistiki znaajno od normalne distribucije.
Linearnost odnosa izmeu varijabli utvrdit emo grafikim putem, preko skater-dijagrama i
pravca regresije.
199
matematike sposobnosti (Y)
50
40
30
20
10
0
0
10
20
30
40
50
spacijalne sposobnosti (X)
Na osnovu skater dijagrama i pravca regresije moemo tvrditi da su varijable u linearnom

odnosu.
2. Izraunati Pearsonov koeficijent korelacije i testirati statistiku znaajnost
Pearsonov koeficijent korelacije izraunat emo preko izraza za sirove podatke:
rxy
N XY ( X)( Y)
2
X
2
200
ISPITANIK
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
X
29
34,5
30
35
30,5
37
31
37
37,5
39
19
27
40
22
22
26
23
24,5
25,5
20
28
25
28
28,5
32,5
24,5
18
27
21
28
Y
15
15
19
20
20
20,5
21
21
22
22
23
23
25
27
28
29
29
29
30
30
31
32
33
33,5
37,5
39
40
40,5
41
41
X
841
1190,25
900
1225
930,25
1369
961
1369
1406,25
1521
361
729
1600
484
484
676
529
600,25
650,25
400
784
625
784
812,25
1056,25
600,25
324
729
441
784
Y
225
225
361
400
400
420,25
441
441
484
484
529
529
625
729
784
841
841
841
900
900
961
1024
1089
1122,25
1406,25
1521
1600
1640,25
1681
1681
XY
435
517,5
570
700
610
758,5
651
777
825
858
437
621
1000
594
616
754
667
710,5
765
600
868
800
924
954,75
1218,75
955,5
720
1093,5
861
1148
850
837
25166
25126
23010
( X)= 722500
( Y)= 700569
rxy
N XY ( X)( Y)
2
X Y Y
2
30 23010 850 837
25166 722500 25126 700569
rxy=-0,509
201
Statistiku znaajnost dobivenog Pearsonovog koeficijenta korelacije ispitat emo preko ttesta:
Uz df=28, za p=0,01 tgr=2,763. Prema tome utvreni koeficijent korelacije statistiki je
znaajan na nivou od 0,01.
3. Odrediti koeficijent determinacije

r2 = -0,5092 = 0,259
Moemo zakljuiti da je 25,9% varijabiliteta matematikih sposobnosti objanjeno
varijabilitetom spacijalnih sposobnosti.
4. Odrediti pravac regresije za predikciju rezultata na testu matematikih sposobnosti na osnovu
rezultata na testu spacijalnih sposobnosti
Pravac regresije definiran je jednainom:
Y = a + bX
Za izraunavanje b i a koristit emo sljedee izraze:
a = My bMx
cov xy
Najprije emo izraunati covxy i sx2.

covxy = -24,31; sx2 = 37,33
cov xy
sx
- 24,31
0,651
37,33
(Mx = 28,33; My = 27,9; sx = 6,11; sy = 7,82)

a = My bMx = 27,9 (-0,651) x 28,33 = 46,35
Pravac regresije odreen je sljedeom jednainom:
Y = 46,35 0,651X
202
sx
5. Koji je najvjerovatniji rezultat na testu matematikih sposobnosti ispitanika koji na testu

spacijalnih sposobnosti postie rezultat 20? Odrediti 95% interval pouzdanosti.
Za prognozu rezultata koristit emo jednainu pravca regresije.
Y = 46,35 0,651X = 46,35 0,651 x 20 = 33,33
Najvjerovatniji rezultat na testu matematikih sposobnosti ispitanika koji na testu spacijalnih
sposobnosti postie rezultat 20 iznosi Y = 33,33.
Za odreivanje intervala pouzdanosti, potrebno je izraunati standardnu pogreku prognoze:
sy, x sy (1 r 2 ) 7,82 1 0,5092 7,82 0,86 6,73
Interval pouzdanosti iznosi:

IP = Y sy,x t/2 = 33,33 6,73 x 2,048 = 33,33 13,78, tj.
19,55 47,11
Uz 95% sigurnost moemo tvrditi da se prognozirani rezultata nalazi u intervalu od 19,55 do
47,11. Interval je irok, ali ne koliko i 95% interval pouzdanosti od 11,88 do 43,91, kojeg bismo
imali na osnovu dobivenih rezultata Y (tj. My 2,048 x sy,), odnosno kada prognozu ne bi temeljili
na X.
6. Odrediti pravac regresije za predikciju rezultata na testu spacijalnih sposobnosti na osnovu
rezultata na testu matematikih sposobnosti
U sluaju da prognoziramo rezultat na testu spacijalnih sposobnosti na osnovu rezultata na testu
matematikih sposobnosti, ponovit emo postupak opisan u 10.3.4 s tim da e nam X varijabla biti
matematike sposobnosti, a Y varijabla spacijalne sposobnosti. Na kraju, dobili bi da je pravac
regresije definiran sljedeim izrazom:
Y = 39,42 - 0,3975X
7. Koji je najvjerovatniji rezultat na testu spacijalnih sposobnosti ispitanika koji na testu
matematikih sposobnosti postie rezultat 20? Odrediti pogreku prognoze.
Za prognozu rezultata koristit emo jednainu pravca regresije.
203
Y = 39,423 - 0,397X = 39,42 0,397 x 20 = 31,48

Najvjerovatniji rezultat na testu spacijalnih sposobnosti ispitanika koji na testu matematikih
sposobnosti postie rezultat 20 iznosi Y = 31,48.
Pogreku prognoze izraunat emo preko izraza:
sy, x sy (1 r 2 ) 6,11 1 0,5092 6,11 0,86 5,25

Obzirom da prognoziramo rezultat u varijabli spacijalne sposobnosti, u gornji izraz uvrtena je
vrijednost standardne devijacije rezultata varijable matematike sposobnosti.
8. Koliki bi bio najvjerovatniji prognozirani rezultat u testu matematikih sposobnosti ispitanika

koji u testu spacijalnih sposobnosti postie rezultat 35 u sluajevima:
a. Kada bi pogreka prognoze bila nula.
b. Kada bi pogreka prognoze bila maksimalna.
a. U sluaju kada je pogreka prognoze jednaka nuli, korelacija bi bila maksimalno mogua, tj.
r=1. Tada vrijedi:
s
7,82
Y' r y X Mx My 1
35 28,33 27,9 27,9 8,54
s
6,11
Y = 19,36 i Y = 36,44
b. Kod maksimalno mogue pogreke prognoze korelacija je jednaka nuli, tj. r=0. Tada vrijedi:
s
s
Y' r y X Mx My 0 y X Mx My My
sx
sx
Y = My = 27,9
204
PRIMJER 11.4
Pretpostavimo da je u prethodnom primjeru (10.3) ispitanik pod rednim brojem 27. na testu iz
matematike napravio samo jednu pogreku (y=1). Izraunajte koeficijent korelacije.
Koeficijent korelacije iznosi r=-0,191, to je znatno manje u odnosu na vrijednost izraunatu u
prethodnom primjeru (r=-0,509). Vidimo kako jedan podatak, koji znaajno odstupa od prosjeka,
znaajno mijenja vrijednost koeficijenta korelacije. Ekstremna vrijednost je podatak koji u
znaajnoj mjeri odstupa od drugih. Koeficijent korelacije osjetljiv je na ekstremne vrijednosti i stoga
njihova pojava moe znaajno izmjeniti realnu sliku povezanosti izmeu varijabli.
Na skater dijagramu (slika ispod) moemo uoiti u kojoj mjeri ovaj podatak odstupa od ostalih.
Za y=1 kaemo da predstavlja ekstremnu vrijednost. Prisjetimo se deskriptivnih vrijednosti iz

primjera 10.3:
MY = 15,87; sY = 4,66,
na osnovu kojih moemo izraunati standardnu vrijednost za y=1, tj:
z = -3,19,
to nam pokazuje da ova vrijednost znaajno odstupa od aritmetike sredine (za 3,19 SD).
U praksi se koristi nekoliko postupaka za eliminaciju efekata ekstremnih vrijednosti (npr.
ekstremna vrijednost se iskljui ili zamijeni aritmetikom sredinom).
205
PRIMJER 11.5
Pretpostavimo da su na grupi uenika prvog razreda nekoliko srednjih kola prikupljeni podaci
o kolskom uspjehu na kraju polugodita i da je primjenjen test matematikih sposobnosti. Stupanj
povezanost izmeu matematikih sposobnosti i kolskog uspjeha utvren je preko Pearsonovog
koeficijenta korelacije koji je iznosio r=0,659.
Nadalje, pretpostavimo da su iz grupe podataka izdvojeni oni koji pripadaju uenicima
matematike gimnazije. Ponovo je izraunat Pearsonov koeficijent korelacije. Ovaj put iznosio je
r=0,388. Kako moemo objasniti razliku u dobivenim koeficijentima korelacije? Zato je u drugom
sluaju dobiven gotovo dva puta manji koeficijent korelacije?
Za odgovor na postavljena pitanja trebamo znati da su uenici matematike gimnazije
selekcionirana grupa. Naime, jedan od kriterija za pohaanje matematike gimnazije su razvijene
matematike sposobnosti. Tako je kriterij za upis u ovu kolu bio rezultat jednak ili vei medijani na
testu matematikih sposobnosti (pretpostavimo da u ovom hipotetskom primjeru iznosi C=28). Stoga
u grupi uenika iz matematike gimnazije uope nema uenika ispodprosjenih matematikih
sposobnosti. Prema tome, opseg rezultata na testu matematikih sposobnosti uenika matematike
gimnazije manji je od opsega rezultata svih uenika koji su uestvovali u istraivanju. Kao
posljedica restrikcije opsega rezultata dobivena je nia vrijednost koeficjenta korealcije na grupi
uenika iz matematike gimnazije.
Na slici 10.5 vidimo kako je povezanost izmeu dvije varijable vea za cjelokupnu grupu
podataka u odnosu na podatke uenika matematike gimnazije. Isprekidanom linijom oznaena je
donja granica rezultata na testu matematikih sposobnosti uenika matematike gimnazije (X=28).
Ako prekrijemo take koje se nalaze ispod X=28, vidjet emo da je grupiranje oko zamiljenog
pravca manje u odnosu na grupiranje takaka svih uenika.
Najee, restrikcija opsega uzrokuje smanjenje koeficijenta korelacije, ali je mogue i da
dovede do njegovog poveanja.
r=0,659
r=0,388
206
PRIMJER 11.6
Jedna od mjera za poveanje profita koju kompanija M planira poduzeti je poveati ulaganja u
reklamiranje svojih proizvoda. Kako bi ispitala isplativost ovog poslovnog poteza, prikupljeni su
podaci o ulaganju u reklame i ostvarenoj dobiti 20 kompanija koje se bave prodajom razliitih
proizvoda. Odreene su regresijske jednaine za proizvode A, B i C. Podaci su prikazani u tabeli
ispod.
Proizvod
Regresijska jednaina
Y = 56,9 + 2X
B
C
Y = 26,3 + 0,03X
Y = 154,8 + 10,7X
ta moemo zakljuiti na osnovu regresijskih jednaina? Da li reklamiranje proizvoda

doprinosi veoj prodaji, a time i veoj dobiti? Za koji proizvod se najvie isplati ulagati u njegovo
reklamiranje?
Ve na osnovu nagiba pravaca (b vrijednosti) moemo zakljuiti da je dobit najvea od
reklamiranja proizvoda C. Najmanji nagib pravca (b) je za proizvod B (b=0,03), a najvei za
prozivod C (b=10,7). Stopa rasta dobiti u zavisnosti od ulaganja u reklame vea je za proizvod A
(b=2) nego za prozvod B, ali znatno manja nego za proizvod C. Ako kompanija ne ulae niti jednu
KM u reklame (tj. ako je X=0), najvea dobit je za proizvod C (Y=154,8), a najmanja za proizvod B
(Y=26,3).
Pravci regresije prikazani na slici 10.6 ilustriraju povezanost ostvarene dobiti i ulaganja u
reklamiranje tri proizvoda.
Na osnovu navedenog, moemo zakljuiti da se najveu dobit moe oekivati ako se ulae u
reklamiranje proizvoda C.
207
ZADACI
1. Ispod su data etiri skupa podataka (A, B, C i D).
A
x
2
5
3
7
6
B
y
3
6
4
7
8
x
9
5
3
7
6
C
y
3
2
4
7
9
x
4
5
3
7
2
D
y
3
5
4
3
7
x
1
3
5
7
9
y
2
4
6
4
2
a. Na osnovu podataka odredite, bez raunanja i crtanja skater dijagrama, smjer povezanosti
izmeu varijabli x i y.
b. Nacrtajte skater-dijagram i odredite kakvog smjera su povezanosti izmeu varijabli.
c. Izraunajte Pearsonov koeficijent korelacije za svaki skup podataka.
2. Ispod su prikazani skater-dijagrami za etiri skupa podataka (A, B, C i D).
10
10
0
0
10
10
10
10
0
0
10
10
a. Na osnovu skater-dijagrama odredite smjer i procjenite stupanj povezanosti.

b. Za svaki skater-dijagram procijenite poloaj pravca regresije.
c. Na osnovu skater dijagrama odredite vrijednosti varijabli x i y i izraunajte Pearsonov
koeficijent korelacije.
3. Bez raunanja odredite vrijednost Pearsonovog koeficijenta korelacije.
A
x
2
5
3
7
6
B
y
3
6
4
8
7
x
15
5
8
10
6
C
y
10
0
3
5
1
208
x
2
3
4
5
6
y
6
5
4
3
2
4. Ispod su navedene z vrijednosti. Koliko iznosi r?

A
x
1,55
-0,95
-0,2
0,3
-0,7
B
y
1,55
-0,95
-0,2
0,3
-0,7
x
-1,25
-0,625
0
0,625
1,25
y
1,25
0,625
0
-0,625
-1,25
5. Za podatke ispod izraunajte Pearsonov koeficijent korelacije

A
209
6. Na grupi od 29 uenika primjenjena je skala samopotovanja. Za svakog uenika izraunat je

prosjek ocjena iz svih predmeta na kraju polugodita. Ispod su dati rezultati mjerenja
samopotovanja (X) i prosjeni kolski uspjeh (Y) uenika.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
X
31
25
20
21
22
29
24
32
25
30
26
26
24
27
28
Y
4
2,8
2,3
2,6
2,6
4,1
2
4,1
2,6
3
2,1
2,3
2,7
3
3,8
16
17
18
19
20
21
22
23
24
25
26
27
28
29
X
33
28
29
23
29
30
18
30
31
17
32
27
32
33
Y
4
3,6
3,8
1,6
2,6
2,8
2
4,6
3,2
2,8
4
2,9
4
1,8
a. Povezanost grafiki predstavite u skater-dijagramu.

b. Odredite jednainu pravca regresije i ucrtajte pravac.
c. Izraunajte Pearsonov koeficijent korelacije izmeu samopotovanja i kolskog uspjeha.
7. Ako je korelacija izmeu tjelesne teine (mjerene u kilogramima) i visine (mjerene u metrima)
r=0,60, koliko e iznositi korelacija izmeu teine (mjerene u kN) i visine (mjerene u inima)?
210
8. Na grupi od 20 uenika prikupljeni su podaci o broju sati provedenih u pripremi za test znanja iz
fizike (X) i rezultatu kojeg su postigli na testu (Y).
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
a.
b.
c.
d.
e.
f.
g.
X
5
14
10
9
4
7
12
15
4
9
8
11
5
6
10
11
16
13
15
12
Y
35
58
60
65
41
53
60
79
35
50
59
64
45
52
65
69
69
72
73
50
U skater-dijagramu prikaite povezanost izmeu varijabli x i y.

Na osnovu skater-dijagrama odredite smjer povezanosti. Procijenite stupanj povezanosti.
Izraunajte Pearsonov koeficijent korelacije. Odredite statistiku znaajnost.
Odredite jednainu pravca regresije. Kakav je smisao a i b u jednaini pravca regresije?
Ako uenik provede 15 sati u uenju, koji je najvjerovatniji rezultat na testu iz fizike?
Ako uenik provede 10 sati u uenju, koji je najvjerovatniji rezultat na testu iz fizike?
Koliko sati provede u uenju uenik koji na testu iz fizike postie 25 bodova?
211
9. Nastavnik je ispitivao povezanost izmeu vremena rjeavanja testa (X) i broja tanih odgovora
koje uenik postigne na testu (Y). Dobiveni podaci prikazani su ispod.
1
2
3
4
5
6
7
8
9
10
11
12
X
30
45
60
36
39
54
56
46
37
51
62
47
Y
75
100
54
81
94
65
79
79
95
82
54
82
a. U skater-dijagramu prikaite povezanost izmeu varijabli x i y.

b. Odredite jednainu pravca regresije.
c. Izraunajte Pearsonov koeficijent korelacije. Odredite statistiku znaajnost dobivenog
koeficijenta korelacije.
10. Da li je depresivnost povezana sa boljim pamenjem uznemirujuih dogaaja, slika, scena? U
istraivanju je na grupi od 20 ispitanika izmjerena depresivnost (X) i broj zapamenih
uznemirujuih sadraja iz filma (Y). Podaci su prikazani ispod.
212
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
X
11
4
19
8
9
9
10
2
13
15
7
15
16
4
17
18
14
20
15
18
Y
8
4
9
10
6
11
7
4
9
6
7
9
5
6
8
11
12
12
9
7

11. U istraivanju djetetove percepcije roditeljskog ponaanja primjenjen je instrument koji izmeu
ostalog mjeri psiholoku kontrolu. Ispod su prikazane procjene koje su djeca dala o ponaanju
svojih oeva (X) i majki (Y) na subskali psiholoke kontrole.
1
2
3
4
5
6
7
8
9
10
11
12
x
1,3
2,4
0,8
2,1
1,8
0,9
1,8
2,8
1,1
1,3
0,7
1,7
213
y
0,7
2,1
1,5
2
1
0,9
1,5
2,1
1,8
0,9
1
1,8

12. Da li je dob pacijenta povezana sa vremenom oporavka nakon operacije? U istraivanju su
prikupljeni podaci o dobi pacijenta (X) i vremena provedenog u bolnici tokom postoperativnog
perioda (Y).
x
27
13
36
13
30
27
15
24
22
10
20
27
29
11
10
32
14
11
25
12
37

13. Provedeno je istraivanje s ciljem ispitivanja povezanosti izmeu koliine uzimanja vitamina B12 (X) i kognitivnih funkcija kod starijih osoba (Y). Ispitanici su vitamin B-12 konzumirali u
razliitim dozama (1-preporuena dnevna doza; 1,5-jedna i pol preporuena dnevna doza; 2- dva
puta vea; 2,5- dva i pol puta vea; 3- tri puta vea; 3,5- tri i pol puta vea; 4- etiri puta vea
doza od preporuene dnevne). Dobiveni podaci prikazani su ispod.
214
79
2,5
81
82
89
92
3,5
94
95
95
95
10
1,5
110
11
110
12
2,5
115

b. Izraunajte Pearsonov koeficijent korelacije.
14. Na grupi uenika izmjerena je visina i teina.
x
160
75
175
65
176
67
177
75
180
72
182
74
183
79
186
85
189
80
10
193
86
a. Izraunajte Pearsonov koeficijent korelacije.

b. U skater-dijagramu prikaite povezanost izmeu varijabli x i y. ta moete zakljuiti na
osnovu skater dijagrama?
c. Izraunajte Pearsonov koeficijent korelacije nakon to ste analizirali skater dijagram i
proveli odgovarajui postupak.
215
15. Na poetku nastave iz statistike studenti su rjeavali test matematikih sposobnosti (X). Na kraju
nastave utvren je uspjeh iz statistike (Y).
x
50
90
23
85
52
95
40
90
33
87
21
77
18
74
31
79
38
80
10
45
92

Koji je najvjerovatniji uspjeh iz statistike studenta koji na testu iz matematikih sposobnosti
postie rezultat 20?
e. Koji je najvjerovatniji uspjeh iz statistike studenta koji je na testu iz matematikih
sposobnosti bolji od 50% ostalih studenata?
a.
b.
c.
d.
16. Ispravne konice na automobilu vane su za sigurnu vonju. S vremenom snaga konica slabi.
Kako bi ispitali povezanost izmeu starosti automobila i snage konice provedeno je istraivanje
u kojem je automobilima razliite starosti (X) mjerena distanca zaustavljanja (y) pri brzini od
120 km/h. Starost automobila izraena je u mjesecima a distanca zaustavljanja u metrima.
Podaci su prikazani u tabeli ispod.
x
12
25,40
17
30,30
25
39,60
31
37,20
38
36,50
45
35,30
56
36,20
61
45,10
65
44,80
10
74
50,20
216
a.
b.
c.
d.
e.

Koja je najvjerovatnija distanca zaustavljanja novog automobila?
Kolika je najvjerovatnija distanca zaustavljanja automobila starog 10 godina?
17. Pretpostavimo da elimo ispitati povezanost izmeu tjelesne teine (X) i tjelesnog selfa (Y). U
istraivanju je uestvovalo deset mlaih adolescenata i deset starijih osoba. Tjelesna teina
izraena je u kilogramima. Tjelesni self izmeren je skalom tjelesnog selfa. Prikupljeni su podaci
od ispitanika mukog spola. Podaci su prikazani ispod.
Mlai adolescenti
Starije osobe
75
61
2,6
65
2,3
70
67
2,6
67
3,2
75
2,6
72
3,4
72
2,6
72
3,6
74
2,8
70
3,8
79
3,1
79
3,9
85
3,1
63
4,5
80
71
a. Izraunajte Pearsonov koeficijent korelacije za sve podatke (bez obzira na dob ispitanika)
b. Izraunajte Pearsonove koeficijente korelacije za mlae adolescente i starije osobe.
c. Uporedite izraunate koeficijente korelacije. ta moete zakljuiti?
217
18. Grupa od 14 ispitanika rjeavala je dva testa, iz geografije (X) i matematike (Y). U tabeli ispod
navedeni su rezultati (bodovi na testu) za svakog uenika u oba testa.
X
30
15
35
12
37
28
33
12
37
14
39
40
15
42
16
10
44
13
11
50
17
12
31
13
18
10
14
15
a. Izraunajte Pearsonov koeficijent korelacije.

b. Odredite pravac regresije.
c. Kolika je pogreka prognoze ako na osnovu rezultata u testu geografije prognoziramo neki
rezultat u testu matematike?
d. Koji je najvjerovatniji rezultat uenika u testu matematike koji u testu geografije postie
rezultat 50?
e. Koliki bi bio najvjerovatniji prognozirani rezultat u testu znanja iz matematike ispitanika
koji u testu znanja iz geografije postie rezultata 40 u sluajevima:
- Kada je pogreka prognoze nula?
- Kada je pogreka prognoze maksimalna za ovu situaciju?
19. Grupa od 100 ispitanika rjeavala je dva testa, iz hemije i biologije. Povezanost izmeu ova dva
testa iznosi r=0,70. Dobivene su sljedee deskriptivne statistike vrijednosti:
Mh = 50
Mb =60
Sh = 10
sb =10
a. Kolika je pogreka prognoze ako na osnovu rezultata u testu hemije prognoziramo neki
rezultat u testu biologije?
b. Koliko treba iznositi koeficijent korelacije da se standardna pogreka prognoze smanji za
50%?
c. Koji je najvjerovatniji rezultat uenika u testu biologije koji u testu hemije postie rezultat
50?
218
20. Grupa od 15 stonotenisaa pripremala se za dravno takmienje. Tokom priprema biljeeno je

vrijeme koje su igrai proveli trenirajui (x) (u satima) sedam dana prije takmienja. Takoer, za
svakog takmiara registrirana je broj pobjeda (y) na takmienju. Rezultati (vrijeme provedeno u
treningu i broj pobjeda na takmienju) za svakog takmiara prikazani su u donjoj tabeli.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
x
40
20
10
15
18
35
27
16
4
33
35
15
5
10
13
y
10
3
1
2
4
6
9
8
5
7
8
4
2
5
6
a. Da li moemo zakljuiti da je broj pobjeda povezan sa vremenom provedenim u treningu?

Obrazloite odgovor.
b. Kolika je pogreka prognoze broja pobjeda na takmienju?
c. Koliki je najvjerovatniji broj pobjeda takmiara koji prije takmienja uopte nije trenirao?
d. Koliki je najvjerovatniji broj pobjeda takmiara koji je prije takmienja trenirao 11 sati?
e. Koliko bi iznosila standardna pogreka prognoze u sluaju kada je r=0 i r=1?
219
12. Rjeenja
1. OSNOVNI STATISTIKI KONCEPTI

1.
Varijabla
Tip varijable
Vrijednosti
Pacijent
KATEGORIJALNA/ NOMINALNA
AB, CR, NT, SQ, TW
Spol
M,
Dob
MLAA, SREDNJA, STARIJA
Dijagnoza
ANKSIOZNI POREMEAJ, FOBIJA,

DEPRESIVNOST
Vrsta terapije
KBT, GETALT, TAA
Trajanje terapije
KVANTITATIVNA/ RACIO-OMJERNA
3, 4, 9, 10, 15
2.
a.
b.
c.
d.
e.
f.
g.
h.
i.
j.
KONTINUIRANA/ RACIO-OMJERNA
KONTINUIRANA/ RACIO
KONTINUIRANA/ RACIO
KONTINUIRANA/ RACIO
KATEGORIJALNA / NOMINALNA
KONTINUIRANA/ INTERVALNA
KONTINUIRANA/ RACIO
a.
b.
c.
Broj novoroenadi - RACIO; spol NOM.; poroajna teina RAC.; datum i vrijeme roenja RAC.
Duine (u mm) zadnjeg donjeg molara RACIO; broj pacijenata - RACIO.
Brok kontrolisanih vozila RACIO; vrsta prekraja NOM.; registarske tablice NOM.; brizna kretanja vozla RACIO; spol
vozaa NOM.
Visina djece racio; teina djece RACIO; stanje plua NOM.; stanje abdomena NOM.; stanje ekstremiteta NOM.;
stanje oiju NOM.; visina sedimentacije RACIO; broj eritrocita RACIO; broj leukocita RACIO; broj roditelja u pratnji
djeteta - RACIO.
Broj mjerenja RACIO; dimenzije obrisa kocke ucrtanih na kartonu - RACIO.
Broj listova na biljci RACIO; broj biljaka - RACIO.
Broj mjerenja krvnog pritiska RACIO; Visina krvnog pritiska RACIO.
Broj razreda; broj odjeljenja; broj uenika - RACIO.
Broj opaane djece RACIO; vremensko trajanje igre - RACIO.
Broj atletiara RACIO; Poredak atletiara na cilju RANG.
3.
d.
e.
f.
g.
h.
i.
j.
220
7.
a. INTERVALNA SKALA
a.1.
1 - NIJE POLOIO IPIT: Ren
2 POLOIO ISPIT: Ben, Den, Ken, Jen, Wen.
Rezultati izraeni na nominalnoj skali: 1, 2, 2, 2, 2, 2
a.2. Rezultati izraeni na rang skali:
1. Wen, 2. Ken, 3. Ben, 4. Jen, 5. Den, 6. Ren
b. RACIO SKALA
b.1.
1 NIJE ZAVRIO TRKU: Asaffa Powell
2 ZAVRIO TRKU: Carl Lewis, Tyson Gay, Donovan Bailey, Usain Bolt, Leroy Burrell, Maurice Green
Rezultati izraeni na nominalnoj skali: 1, 2, 2, 2, 2, 2, 2
b.2. Rezultati izraeni na rang skali:

1. Usain Bolt, 2. Tyson Gay, 3. Maurice Green, 4. Donovan Bailey, 5. Leroy Burrell, 6. Carl Lewis, 7. Asaffa Powell
2. GRAFIKO I TABELARNO PREDSTAVLJANJE PODATAKA
2.
a. Distribucija frekvencija rezultata grupiranih u 8 razreda.
Razredi
67-76
77-86
87-96
97-106
107-116
117-126
127-136
137-146
total
f
7
5
6
4
5
2
0
1
30
b. 136,5 146,5
221
c. Stem-and-leaf prikaz
(2)
10
(4)
11
(4)
12
14
(6)
(5)
(6)
(2)
(1)
znai 8,2
e.
100,0%
100,0%
96,7%
96,7%
90,0%
90,0%
80,0%
73,3%
70,0%
60,0%
60,0%
50,0%
40,0%
40,0%
30,0%
23,3%
20,0%
10,0%
76-90
d.v. (2)
136,5
61-75
126,5
106,5
46-60
116,5
96,5
86,5
76,5
56,5
66,5
0,0%
0,0%
5.
25
broj golova
20
15
10
0
1-15
16-30
31-45
d.v. (1)
minuta susreta
6.
ene
mukarci
61
61
61
62
63
63
72
72
81
83
83
89
92
93
95
95
73
73
74
76
64
68
72
75
75
79
81
81
81
81
83
84
85
86
86
86
88
89
89
92
92
93
96
98
222
85
10.Histogram
11. Torta ili stupasti dijagram. Histogram.
12. Histogram ili stablo i list prikaz.
14.Stupasti dijagram.
15.Histogram ili stablo i list prikaz.
3. MJERE CENTRALNE TENDENCIJE

1. Mod= 15, 20; C=18; M=17,57
2. Mod=2; C=2; M=3
3. C=10; M=10,03
4. Tabela grupiranih rezultata:
Razredi
fx
cf
rcf%
0-4
2,2%
5-9
28
11,1%
10-14
12
10
120
15
33,3%
15-19
17
15
255
30
66,7%
20-24
22
10
220
40
88,9%
25-29
27
108
44
97,8%
30-34
32
32
45
100,0%
45
765
C=17
M=17
3.5.
100,0%
90,0%
80,0%
70,0%
60,0%
50,0%
40,0%
30,0%
20,0%
10,0%
0,0%
0
4,5
9,5
14,5
19,5
24,5
29,5
34,5
6. Mod=70; C=93; M=94,07 (vrijednosti C i M utvrene iz negrupiranih rezultata).

Distribucija podataka nije simetrina. Kao mjeru centralne tendencije moemo uzeti medijanu.
7. C=13,9; M=13,7 (vrijednosti C i M utvrene iz negrupiranih rezultata).
8. Mod=61; C=73,5
Modm=81 Cm=85
223
9. C=77; M=125,26
Distribucija rezultata je izrazito asimetrina. Stoga je medijana reprezentativnija mjera centralne tendencije.
10. C=12,4; M=14,07
U nizu podataka jedna vrijednost je ekstremna (55,8). Stoga je medijana reprezentativnija mjera centralne tendencije.
4. MJERE VARIJABILITETA
1. Q1=15; C=18; Q3=20; IQR=5; s=3,59
2. Q1=1; C=2; Q3=4; IQR=3; s=2,64
4. Q1=12,63; Q3=21,38; IQR=8,75; s=6,24
7. Q1=11,75; Q3=15,525; IQR=3,775; s=2,25
10. M1=8,95; s1= 9,41
M2= 7,32; s2=6,09
Vrijednost aritemtike sredine i standardne devijacije manja je nakon to je iskljuena ekstremna vrijednost.
11. Na osnovu kvartila i centralne vrijednosti ne moemo odrediti o kojem rezultatu se radi.
Koristei M i s, odredit emo da je u pitanju rezultat 16.
12. A-T1; B-T4;C-T2; D-T3.
13. Interkvarilni raspon:
Q1 = 32,33
Q3 = 39,34
IQR = 7,01
v = 89,68
s = 9,47
4.14.
Q1 = 749,75
Q3 = 1.149,80
IQR = 400,05
s = 1.387,535
v = 1.925.254
6. NORMALNA RASPODJELA
1.
68,26% sredinjih vrijednosti: M s = 135,08 1,83: 133,25 - 136,91
95,44% sredinjih vrijednosti: M 2s = 135,08 2*1,83: 131,42 - 138,74
99,73% sredinjih vrijednosti: M 3*s =135,08 3*1,83:129,59 - 140,57
224
3.
a.
b.
c.
d.
e.
z=0
z=1
z=2
z = -1
z = -3
a.
b.
c.
d.
e.
f.
X = 125
X = 73,4
X = 95
X = 107
X = 119
X = 59
4.
5.
M = 55,8
7.
a.
z = -3,29
% niih rez.: 0,06
% viih rez.: 99,94
b.
z = -4,00
% niih rez.: 0
% viih rez.: 100
z = -1,29
% niih rez.: 9,85
% viih rez.: 90,15
z = 0,86
% niih rez.: 80,51
% viih rez.: 19,49
z = 2,00
% niih rez.: 97,72
% viih rez.: 2,28
z = -2,71
% niih rez.: 0,34
% viih rez.: 99,66
c.
d.
e.
f.
11.
a.
b.
c.
d.
e.
f.
g.
h.
i.
j.
k.
z1 = -2,29
z2 = 0,89
z3 = 2,63
z4 = 3,76
z5 = -2,74
z6 = -1,32
1335; 252; 6; 0; 1346; 1224
1334; 1094; 252; 111
X = 202
X 236,20
X 216,82
a.
b.
c.
11 kandidata.
X 133
Kandidat A.
12.
14. Oko 179.423,3 KM.

15. Skjunis: 0,22
Kurtozis: 13,56
225
8. TESTIRANJE HIPOTEZA
2. z(19)=1,79; p>0,05 (tgr=1,96)
3 z(24)=2; a) p<0,05; b) p>0,01
4. z(124)=6,74; p<0,01
7. t(39)=-1,90 t0,05=1,684; t0,01=2,423 p<0,05; p>0,01 (jednosmjerno testiranje)
10. ANOVA
1
Suma kvadrata (SS)
Stepeni slobode (df)
Varijanca (MS)
izmeu grupa
41,73
20,87
0,911
unutar grupa
2659,60
12
221,63
Total
2701,33
14
Suma kvadrata (SS)
Varijanca (MS)
izmeu grupa
101,60
50,80
0,041
unutar grupa
380,70
27
14,10
Total
482,30
29
0,094
3,603
F=0; p=1 Grupe su identine, stoga je variranje izmeu grupa nula!
3
4
Suma kvadrata (SS)
Varijanca (MS)
izmeu grupa
96,15
32,05
0,071
unutar grupa
180,80
16
11,30
Total
276,95
19
F=2,87, p>0,05. Razlike izmeu aritmetikih sredina nisu statistiki znaajne!
226
2,836
11. KORELACIJA I REGRESIJA

1.
d. r= 0,942; r= 0,077; r= -0,652; r=0
2.
10
10
0
0
10
10
10
10
0
0
10
10
c.
x
r=0,867; r=-0,680; r=0,005; povezanost nije linearna

3. r=1; r=1; r=-1
4. r=1; r=-1
5. r=-0,020; r=-0,020; r=-0,389;r=-0,132
6.
b. y = 0,1087x + 0,093
c. r=0,585
7. Korelacija e biti identina jer su mjere koritene u drugom primjeru linearne transformacije mjera koitenih u prvom primjeru
8.a.b.
c. r=0,835
d. y = 2,7445x + 30,804
227
e. y=72 sata
f. y=58 sata
g. y = 0,2542x - 4,8646; y=1,5 sati
9.
a.
b. y = -0,9497x + 122,89
c. r=-0,64838
10.
a.
b. y = 0,241x + 5,0444
c. r= 0,528271
11.
a.
b. y = 0,5223x + 0,6278
c. r=0,661921
12.
a.
b. y = 0,4116x - 1,6071
c. r=0,670059
228
13.
a.
b. r=0,085
14.
a.
b.
r=0,598; koeficijent korelacije trebao bi biti vei

Na skater dijagramu jasno je uoljiv ekstremni rezultata.
c.
Nakon eliminacije ekstremnog rezultata r=0,895824
15.
a.
b. r=0,844
c. y = 0,4966x + 67,468
d. y=77,4
e. z=0, X=M+zs=35,1; y=84,9
16.
b. r=0,864
c. y = 0,2965x + 25,489
d. x=0; y=25,489 m
e. x=120; y=61,1 m
229
a. r=0,136
b. za mlae adolescente r=0,526; za starije ispitanike r=0,251
c. U istraivanju su sudjelovali ispitanici razliite dobi (heterogene grupe ispitanika)
17.
a.r=0,500
b. y = 0,1931x + 4,8944
c. sy=3,67; sy,x=3,18
d. y=14,55
e.i. Ako je sy=0, onda je r=+/- 1. y=+/-1 x (3,67/9,52) x (40-34,21) + 11,5 = +/-2,23 + 11,5= 9,27 i 13,73
e.ii. Ako je sy=max, onda je r=0; y=My=11,5
18.
a. sy,x=7
b. sy,x=3,5; sy,x2=sy2(1-r2) r2=(sy2-sy,x2)/sy2=0,8775: r=0,937
230
ii
iii
Recenzija rukopisa dr. ape Nermina Statistika u psihologiji: Prirunik za studente

Recenziju napisala: dr. Denana Husremovi
Statistika u drutvenim znanostima, pa i u psihologiji, predstavlja jedno od najizazovnijih podruja

za poduavanje. Nastavnici na drutvenim znanostima koji poduavaju predmet Statistika esto se
susreu sa studentima koji nisu oekivali da e na odabranom studiju provesti znaajan dio vremena
izuavajui metode istraivanja i obrada podataka koje drutvene znanosti i ine znanostima.
Studenti drutvenih znanosti uglavnom dolaze sa oekivanjima da na studiju vie nee morati
baratati brojevima i matematikim konceptima. Njihovo odbijanje da se uhvate u kotac sa
metodolokom grupom predmeta nastavnike dovodi u poziciju da osim poduavanja, moraju puno
raditi na motiviranju studenata i objanjavanju vanosti Statistike za samu drutvenu znanost. Stoga
uspjean nastavnik statistike u drutvenim naukama nije onaj koji dobro poznaje primijenjenu
statistiku, nego je to onaj koji statistike koncepte zna pribliiti studentima i motivirati ih da
znanstveno razmiljaju, zakljuuju i predviaju. U poduavanju studenata, nastavnici imaju veliki
broj knjiga i udbenika na raspolaganju. Meutim, studentima su ti udbenici preesto napredna
literatura s obzirom na nivo znanja i vjetina matematike pismenosti sa kojim dou iz srednje kole.
I tako je dugo postojao prazan prostor u kojem je nedostajao prirunik koji bi na jednostavan nain
objanjavao najvanije koncepte iz statistike i omoguio studentima da napreduju prema
udbenicima koji jesu preporuena literatura. Nermin apo i Ratko oki su sa rukopisom
Statistika u psihologiji: Prirunik za studente vrlo uspjeno popunio ovaj prostor.
Prirunik se sastoji od dvanaest cjelina. Prvih jedanaest cjelina daju pregled najvanijih koncepata u
deskriptivnoj i inferencijalnoj statistici, dok su u dvanaestoj cjelini ponuena rjeenja za sve zadatke.
Svaka cjelina organizirana je na slian nain: prvo je detaljno objanjen koncept, a zatim se na
praktinim primjerima studentima metodom korak-po-korak demonstrira provoenje odreenog
postupka. Potom su studentima dati tipski zadaci za vjebanje i utvrivanje gradiva.
U prvoj cjelini date su definicije kljunih termina u statistici, te objanjenje varijabli to studentima
znaajno olakava savladavanje ostalih elemenata statistike. U drugoj cjelini prikazani su grafiki i
tabelarni postupci organiziranja i prikazivanja podataka na tako jednostavan nain da svaki
prosjean student moe, nakon itanja ovog poglavlja, nauiti oitavati i prirpemati grafikone i
tabele. Trea i etvrta cjelina se bave objanjavanjem dva glavna deskriptivna parametra mjerama
centralne tendencije i mjerama varijabiliteta, dok je u petoj cjelini dat pregled glavnih pojmova
teorije vjerovatnoe. Upravo itanje ovog petog poglavlja omoguava studentima da razumiju
izazovnost zakljuivanja i predvianja u drutvenim znanostima koje su bazirane na teoriji
vjerovatnoe. U ovom logikom slijedu, esto poglavlje objaanjava studentima to je normalna
raspodjela i kako se ova distribucija povezuje za teorijom vjerovatnoe. Sa sedmim poglavljem autor
uvodi studente u podruje inferencijalne statistike, odnosno u podruje statistikog zakljuivanja.
Kroz praktine primjere studenti jednosatvno uoavaju razlike u rezultatima dobivenim na uzorcima
i populaciji, te uviaju vanost pravilnog uzorkovanja u svrhu generalizacije rezultata na populacije.
Osmo poglavlje otvara podruje testiranja hipoteza. Termin hipoteze nije jako poznat studentima na
poetku njihovog studija jer se u srednjoj koli ne susreu esto sa testiranjima odreenih
iv
pretpostavki. Autor na poetku poglavlja vrlo struno i za studente prihvatljivo objanjava zato su
hipoteze vane i kako se one definiraju, te u poglavljima devet i deset daje prikaz osnovnih testova
za ispitivanje znaajnosti razlika artimetikih sredina (t-testova i analizi varijanci). U posljednjem
jedanaestom poglavlju studenti imaju priliku proitati i nauiti to je to povezanost izmeu dvije
varijable, te nauiti kako se testira znaajnost korelacije.
Ovaj prirunik predstavlja jedinstveno djelo po pristupu u objanjavanju statistikih koncepata. Na
prvo itanje je jasno da je napisan od strane autora koja ima viegodinje iskustvo u poduavanju
studenata statistici. Autor pie tako da prati misaoni tok studenta i daje mu upravo onoliko
informacija koliko je potrebno da se shvati sutina. Autor potuje sve principe logikog izlaganja i
ide od jednostavnijih ka teim stvarima, a apstraktne koncepte objanjava kroz razumljive praktine
primjere i slikovne prikaze koji omoguavaju studentima da u potpunosti razumiju to se, u stvari
krije iza formula. Na kraju svakog poglavlja autor daje zadatke za vjebanje kako bi studenti
izgradili znanje i vjetinu obrade podataka, te tako postali samostalni i kompetentni za budui rad.
Ovaj prirunik je usmjeren prema studentu i napisan je za studenta i moe sluiti kao primjer
metodiki adekvatnog i psiholoki motivirajueg materijala. Autor je uspio pokazati da je kao
strunjak i naunik vrsni poznavalac statistike, a da je kao nastavnik okrenut prema studentu i
sposoban vrlo sloene stvari objasniti tako da ga razumiju i oni koji ne vole matematiku.
Koritenje ovog prirunika kod studenata e zasigurno umanjiti anksioznost od pripreme ispita, te
razbiti predrasude o statistici kao matematici rezerviranoj samo za odabrane. Ovaj prirunik e
omoguiti svim zainteresiranim studentima da doive statistiku kao temelj istraivanja, zakljuivanja
i predvianja u psihologiji.
Dr. Denana Husremovi
Biografija
Nermin apo roen je 14. 1. 1970. godine u Mrkonji Gradu. Diplomirao je na Filozofskom
fakultetu u Sarajevu, Odsjek za psihologiju. Od 1997. godine zaposlen je na Odsjeku za psihologiju,
naprije kao asistenta na predmetima Statistika u psihologiji i Metodologija istraivanja u psihologiji,
zatim kao vii asistenta na predmetima Statistika u psihologiji i Opa psihologija II, a od 2007.
godine kao docenta na predmetima Statistika u psihologiji i Kognitivna psihologija. Na Filozofskom
fakultetu u Zagrebu 2001. godine odbranio je magistarsku radnju pod naslovom Kompozitno
pamenje i kohezija memorijskih tragova. Doktorsku disertaciju Interna i eksterna validacija
dinamikog testiranja inteligencije odbranio je 2006. na Odsjeku za psihologiju Filozofskog
fakulteta u Sarajevu. U okviru strunog i naunog usavravanja boravio je na LMU u Minhenu,
Njemaka i Institutu za psihologiju u Geteborgu, vedska. Podruje strunog i naunog rad su
primijenjena statistika, inteligencija i nadarenost. Objavio je vie naunih i strunih lanaka, u
autorstvu i koautorstvu, u domaim i internacionalnim asopisima (Naa kola, Didaktiki putokazi,
Psihologijske teme, Group Dynamics: Theory, Research and Practice, Journal of the American
Academy of Child and Adolescent Psychiatry, Mankind Quarterly, Personality and Individual
Differences, Temas em Psicologia). Sudjelovao je kao voditelj ili konsultant na vie istraivakih i
aplikativnih projekata. Uestvovao je na domaim i meunarodnim naunim i strunim skupovima i
seminarima.
Ratko oki roen je 3. 1. 1979. godine u Sarajevu. 2002. godine diplomirao je na Odsjeku za
psihologiju Filozofskog fakulteta u Sarajevu. Od 2001. do danas uestvovao u ili vodio niz projekata
socijalnih, trinih i medijskih istraivanja te istraivanja javnih politika (za klijente kao to su
UNICEF, BBC World Service Trust, Intermedia Washington, Unilever, UNDP, Save the Children
UK, Vijee za tampu BiH...). Od 2007. godine radi na Odsjeku za psihologiju Filozofskog fakulteta
u Sarajevu gdje je kao asistent angaovan na predmetima Statistika u psihologiji I i II, Metodologija
eksperimentalne psihologije i Metodologija neeksperimentalne psihologije. Trenutno pohaa
Doktorski studij psihologije u Zagrebu.
vi

Statistika U Psihologiji - Priručnik

Uploaded by

Copyright:

Available Formats

You might also like

Statistika U Psihologiji - Priručnik

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Statistika U Psihologiji - Priručnik

Uploaded by

Copyright:

Available Formats

Filozofski fakultet u Sarajevu

Nermin apo i Ratko oki

Statistika u psihologiji, prirunik za studente

Statistika u psihologiji, prirunik za studente

Statistika u psihologiji, prirunik za studente

Statistika u psihologiji, prirunik za studente

Nermin apo i Ratko oki

Statistika u psihologiji, prirunik za studente

Prirunik se sastoji iz 11 poglavlja koja svojim sadrajem obuhvaaju desktiptivnu i osnove

Nadamo se da e ovaj prirunik posluiti ne samo studentima psihologije ve i drugima koji se iz

Nermin apo i Ratko oki

Statistika u psihologiji, prirunik za studente

Statistika u psihologiji, prirunik za studente

Statistika u psihologiji, prirunik za studente

Prema Campbellu1 mjerenje je pridruivanje numerike vrijednosti pojavi koju posmatramo

Campbell, N. (1953). What is science. New York: Dover Publication.

Statistika u psihologiji, prirunik za studente

Statistika u psihologiji, prirunik za studente

Tabela 1-1. Podaci za pet uenika

Zavisna varijabla u istraivanju je kolski uspjeh. Istraiva na osnovu rezultata dobivenih u

Statistika u psihologiji, prirunik za studente

2. U medicinskim istraivanjima koriste se razliite varijable. Koje od dolje navedenih su

Statistika u psihologiji, prirunik za studente

h. U Osnovnoj koli Wilhelm Wundt utvren je broj razreda, odjeljenja i uenika.

Statistika u psihologiji, prirunik za studente

6. Provjerite tanost sljedeih tvrdnji:

e. Intervalne skale ne podrazumijevaju svojstvo redoslijeda.

i. Na intervalnim skalama rezultat nula nije mogu.

7. Za sljedee rezultate mjerenja identificirajte originalno koritenu skalu, a potom transformirajte

Statistika u psihologiji, prirunik za studente

2. Grafiko i tabelarno predstavljanje podataka

Statistika u psihologiji, prirunik za studente

Statistika u psihologiji, prirunik za studente

Tabela 2.1.1: Distribucije frekvencija negrupiranih podataka

Distribucije frekvencija negrupiranih podataka praktian je nain organiziranja i prikazivanja

Odredimo totalni raspon rezultat.

Statistika u psihologiji, prirunik za studente

Table 2.1.2: Distribucije frekvencija grupiranih podataka

Grafiki prikaz ovako organiziranih podataka naziva se histogram. Histogram distribucije

Slika 2.1.1. Distribucija frekvencija grupiranih

Ponekad se koristi tabelarni/grafiki prikaz distribucije relativnih i kumulativnih frekvencija.

Statistika u psihologiji, prirunik za studente

Tabela 2.1.3: Distribucije relativnih i kumulativnih frekvencija

Distribuciju kumulativnih frekvencija koristimo kada trebamo odrediti poloaj podatka u

Slika 2.1.2. Distribucija procentualnih kumulativnih

29,5; 9733,5; 100

Tabelarnim i grafikim prikazom kumulativnih frekvencija moemo odrediti koliko se

Statistika u psihologiji, prirunik za studente

Statistika u psihologiji, prirunik za studente

Varijabla DOB je kontinuirana, a vrijednosti su izraene kao decimalni brojevi. Za

znai 1,1 godina

Statistika u psihologiji, prirunik za studente

Tabela 2.2.8: Distribucije frekvencija rezultata SKP

Statistika u psihologiji, prirunik za studente

S obzirom da je varijabla PREFERIRANI PREDMET kategorijalna, za grafiki prikaz

S lika 2.3.4. P odjela u enika IIIc odjeljena prema

Na kolskom sistematskom pregledu mjerena je visina svakog od ovih 25 uenika. Utvrene

Statistika u psihologiji, prirunik za studente