Download as pdf or txt
Download as pdf or txt
You are on page 1of 264

Nakladnik:

Sveuilite u Splitu
Filozofski fakultet
Za nakladnika:
prof. dr. Josip Milat, dekan
Biblioteka:
Suvremena nastava
Knjiga br. 1
Recenzentice:
prof. dr. Elza Jurun
prof. dr. Ani Leburi
doc. dr. Mirjana imeija
Lektorica:
Sonja Krvavica, prof.
Dizajn naslovnice:
Baldo Leburi
Grafika obrada:
doc. dr. Snjeana Pivac

CIP - Katalogizacija u publikaciji


SVEUILINA KNJINICA U SPLITU
UDK 311.1(075.8)
PIVAC, Snjeana
Statistika za socioloka istraivanja / Snjeana Pivac, Ante
Rozga. - Split : Filozofski fakultet Sveuilita, 2006. - (Biblioteka
Suvremena nastava ; knj. 1)
Bibliografija.
ISBN 953-7395-01-4
1. Rozga, Ante
120625059
ISBN 953-7395-01-4

SNJEANA PIVAC
ANTE ROZGA

STATISTIKA

za socioloka istraivanja

Split, 2006.

SADRAJ
Predgovor ...............................................................................

1. Uvod ....................................................................................
1.1. Pojam i zadaa statistike ...................................................
1.2. Predmet prouavanja statistike .........................................
1.3. Vrste varijabli - statistika obiljeja .................................
1.4. Izvori podataka i metode njihova pribavljanja .................
1.5. Sekundarni podaci ............................................................
1.6. Primarni podaci ................................................................
1.7. Naini prikupljanja podataka ...........................................
1.8. Priprema podataka za statistiku analizu .........................
1.9. Uzorak ..............................................................................

9
9
10
11
12
13
14
23
24
25

2. Ureivanje i prikazivanje podataka .................................


2.1. Grupiranje podataka ..........................................................
2.1.1. Nizovi kvalitativnih podataka ............................
2.1.2. Numeriki niz .....................................................
2.2. Tabeliranje ........................................................................
2.3. Relativni brojevi strukture ................................................
2.4. Grafiko prikazivanje statistikih nizova .........................
2.5. Relativni brojevi koordinacije i indeksi ...........................

35
35
36
37
40
43
46
71

3. Srednje vrijednosti ..............................................................


3.1. Srednje vrijednosti .............................................................
3.2. Aritmetika sredina ...........................................................
3.3. Mod ...................................................................................
3.4. Harmonijska sredina .........................................................
3.5. Medijan .............................................................................
3.5.1.Kvantili ................................................................

103
103
104
107
118
121
124

4. Mjere disperzije, asimetrija i zaobljenost .........................


4.1. Mjere disperzije ..................................................................
4.1.1. Apsolutne mjere disperzije ..................................
4.1.2. Relativne mjere disperzije ...................................

133
133
133
139

4.1.3. Momenti numerikih nizova ................................ 151


4.2. Mjere asimetrije .................................................................. 152
4.3. Mjera zaobljenosti .............................................................. 156
5. Vjerojatnost ..........................................................................
5.1. Klasina definicija vjerojatnosti ..........................................
5.2. Teorem o zbrajanju vjerojatnosti .........................................
5.3. Teorem o mnoenju vjerojatnosti ........................................
5.4. Uvjetna vjerojatnost ............................................................
5.5. Diskontinuirana sluajna varijabla ......................................
5.6. Teorijske distribucije diskontinuirane sluajne varijable ....
5.6.1. Binomna distribucija .............................................
5.6.2. Poissonova distribucija .........................................
5.6.3. Dvodimenzionalna diskontinuirana distribucija ...
5.6.4. Marginalne distribucije diskontinuirane sluajne
varijable .........................................................................
5.6.5. Uvjetne distribucije diskontinuirane sluajne
varijable .........................................................................
5.7. Kontinuirana sluajna varijabla ..........................................
5.8. Teorijske distribucije kontinuirane sluajne varijable ........
5.8.1. Normalna distribucija ...........................................
5.8.2. Studentova distribucija .........................................

167
167
168
169
170
176
177
177
183
189

6. Ocjene parametara osnovnog skupa na osnovi uzorka ...


6.1. Uzorak .................................................................................
6.2. Procjena aritmetike sredine osnovnog skupa ....................
6.3. Procjena proporcije osnovnog skupa ..................................

201
201
202
209

190
191
195
196
196
198

7. Analitiki primjeri za vjebu .............................................. 217


8. Tablice odabranih statistikih distribucija ........................ 257
A. Povrine ispod normalne krivulje .......................................... 257
B. Kritine vrijednosti t, Studentove distribucije ....................... 258
9. Literatura .............................................................................. 259
Biljeka o autorici i autoru ...................................................... 264

PREDGOVOR
Ovaj udbenik namijenjen je prvenstveno studentima Odsjeka za
sociologiju Filozofskog fakulteta u Splitu, ali i svim drugim
zainteresiranim korisnicima koji u svom strunom i znanstvenom radu,
bavei se drutvenim istraivanjima, primjenjuju statistike metode i
tehnike.
Rad obuhvaa teorijske osnove i objanjenja za svako u ovaj rad
ukljueno podruje statistike. Kroz rjeavanje velikog broja konkretnih
analitikih primjera daju se objanjenja dobivenih rezultata i njihovo
kritiko vrednovanje. Na kraju udbenika u sklopu posljednjeg poglavlja
nalazi se odreeni broj analitikih primjera koji su ostavljeni korisniku za
samostalno rjeavanje. Svaki primjer sadri i rjeenja u svrhu kontrole
valjanosti usvojenoga gradiva. Na taj nain se studentima ne ostavlja
dvojbenim ni nain pismene provjere znanja te ih se osposobljava da
samostalno statistiki analiziraju odreene pojave na struno
zadovoljavajui nain.
Primjeri u udbeniku obraeni su u SPSS - Statistical Package for
the Social Sciences, koji je upravo prilagoen sociolokim istraivanjima.
Ovaj program prua puno mogunosti za provoenje statikih metoda i
tehnika na konkretnim analizama. Naime, upotrebom statistikih paketa,
poevi ve od pripremne faze statistikog istraivanja, znatno se
skrauje i pojednostavljuje vrijeme potrebno za primjenu statistikih
metoda i tehnika. Na taj se nain statistiki postupci pribliavaju mnogim
korisnicima. Svaki analitiki primjer rijeen u SPSS-u u tekstu udbenika
ima oznaku u obliku slike CD-a. Takovi primjeri su priloeni u
elektronikom obliku u dokumentu SPSS i svaki od njih ima i konkretno
rjeenje u dokumentu Output programa SPSS.
Potrebno je napomenuti da e studenti koji nastave obrazovanje na
poslijediplomskim studijima biti pripremljen za struni i znanstveni rad u
svojim istraivanjima, gdje se redovito koristi SPSS. Dio studenata koji
e se nakon diplomiranja neposredno ukljuiti u poslovnu praksu, takoer
e imati koristi, jer je danas SPSS redovito najzastupljenija programska
potpora u drutvenim analizama.

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOGIJU

Potrebno je napomenuti da je SPSS kompatibilan s Microsoft


Excelom, pa se ve postojei podaci iz jednog programa mogu
jednostavno kopirati u drugi. Microsoft Excel je jedan od najrairenijih i
programa za tabline izraune te je lako dostupan veini korisnika.
U radu su koritene oznake i simboli, koji su preuzeti iz
standardne statistike literature. Ako se, pak, u literaturi koriste razliite
oznake, upotrijebljena je ee spominjana verzija.
Na kraju istaknimo, ovaj udbenik je nastao kao rezultat
viegodinjeg iskustva autora kod primjene statistikih metoda u izradi
brojnih znanstvenih i strunih radova, studija i analiza te kao rezultat
predavakog iskustva pri prenoenju znanja iz podruja statistike na
mnoge generacije studenata splitskoga Ekonomskog fakulteta i drugih
drutvenih znanosti.
Za suradnju i niz korisnih sugestija zahvaljujemo recenzenticama
prof. dr. Elzi Jurun, prof. dr. Ani Leburi i doc. dr. Mirjani imeija.
Split, rujan 2006.
Autori

Uvod

1. UVOD
1.1. Pojam i zadaa statistike
Statistika je posebna znanstvena disciplina koja u svrhu
realizacije postavljenih ciljeva istraivanja na organiziran nain prikuplja,
odabire, grupira, prezentira i vri analizu informacija ili podataka te
interpretira rezultate provedene analize.
Statistika se kao znanstvena disciplina moe podijeliti na:
1. deskriptivnu statistiku i
2. inferencijalnu statistiku.
1. Deskriptivna ili opisna statistika temelji se na potpunom
obuhvatu statistikog skupa iju masu podataka
organizirano prikuplja, odabire, grupira, prezentira i
interpretira dobivene rezultate analize. Na taj nain se,
izraunavanjem razliitih karakteristika statistikog skupa,
sirova statistika graa svodi na lake razumljivu i
jednostavniju formu. Ako se statistike metode i tehnike
primjenjuju na itav statistiki skup, dakle ako su
istraivanjem obuhvaeni svi elementi skupa, oni tvore
statistiku populaciju.
2. Inferencijalna statistika temelji se na dijelu (uzorku)
jedinica izabranih iz cjelovitoga statistikog skupa pomou
kojeg se uz primjenu odgovarajuih statistikih metoda i
tehnika donose zakljuci o itavom statistikom skupu.

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Uvijek je prisutan odgovarajui stupanj rizika kada se koriste


rezultati iz uzorka, za koji je poeljno da bude izabran na
sluajan nain i da bude reprezentativan. Inferencijalna
statistika pripada skupini induktivnih metoda, kojima se
izvode zakljuci polazei od opega prema posebnome.
1.2. Predmet prouavanja statistike
Statistike metode i tehnike temelj su za provoenje statistike
analize drutvenih (i prirodnih) pojava.

Predmet prouavanja statistike su odreene zakonitosti koje se


javljaju u masovnim pojavama. Zadaa statistike je da uoi
zakonitosti u masovnim i sluajnim pojavama te da ih iskae
brojano.

Masovne pojave su skupine istovrsnih elemenata koji imaju jedno


ili vie zajednikih svojstava. Takvu skupinu nazivamo
statistikom masom ili statistikim skupom.

Statistiki skup potrebno je definirati pojmovno, prostorno i


vremenski.
Pojmovno odrediti statistiki skup podrazumijeva odrediti pojam
ili svojstvo svakog elementa promatranog skupa.
Prostorno odrediti statistiki skup znai odrediti prostor na koji
se odnosi ili kojemu pripadaju elementi statistikog skupa.
Vremenski odrediti statistiki skup znai odrediti vremenski
trenutak ili razdoblje kojim e se obuhvatiti svi elementi koji ulaze u
statistiki skup.
Analitiki primjer 1.1:
Statistiki skup, "studenti 1. godine Filozofskoga fakulteta Odsjeka za sociologiju u Splitu u Republici Hrvatskoj u akademskoj
godini 2006./07., na dan 10. 10. 2006. godine", vrlo je precizno odreen i
iz takve njegove definicije mogu se odrediti svi njegovi elementi.

10

Uvod

Svojstvo svakog elementa odnosno studenta definirano je najprije


pojmovno, tj. jasno je da se radi o studentima 1. godine Filozofskoga
fakulteta - Odsjeka za sociologiju.
Elementi ovog skupa odreeni su i prostorno, tj. nalaze se u
Splitu na podruju Republike Hrvatske.
Vremenska definicija toga statistikog skupa upuuje na
vremenski interval s kojim su elementi skupa obuhvaeni, tj. akademsku
godinu 2006./07. i trenutak u kojem su studenti selektirani, tj. 10. 10.
2006. godine.
1.3. Vrste varijabli - statistika obiljeja
Statistika obiljeja su ope karakteristike elemenata
statistikog skupa po kojima su ti elementi meusobno slini i po
kojima se meusobno razlikuju.
Analitiki primjer 1.2:
Statistiki skup, "studenti 1. godine Filozofskoga fakulteta Odsjeka za sociologiju u Splitu u Republici Hrvatskoj u akademskoj
godini 2006./07., na dan 10. 10. 2006. godine", promatran je prema
obiljeju "spol".
Sasvim je jasno da je spol jedna od karakteristika svakog studenta.
Postoji muki i enski spol. Neki studenti su jednakog spola, a neki se
razlikuju po spolu.
Potrebno je napomenuti da je u programskom paketu SPSS
oznaka za statistika obiljeja: Variable Type. Openito se statistika
obiljeja mogu podijeliti: na
1. kvalitativna statistika obiljeja, koja mogu poprimiti razliite
oblike, ali se izraavaju opisno. Ako se modalitetima ovog
obiljeja sluajno pridrue brojevi, s njima nisu doputene nikakve
raunske operacije (u SPSS-u: Variable Type: String).

11

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

2. kvantitativna statistika obiljeja koja se izraavaju brojano.


(u SPSS-u: Variable Type: Numeric).
Kvalitativna statistika obiljeja mogu se podijeliti: na a)
nominalna statistika obiljeja i na b) redoslijedna statistika
obiljeja.
a) Nominalna statistika obiljeja izraavaju se opisno.
b) Redoslijedna statistika obiljeja mijenjajuse prema intenzitetu
ili rangu. Na primjer: uspjeh na ispitu iz predmeta Statistika u
sociologiji I (ovdje se javljaju modaliteti obiljeja od 1 do 5, ali se
njima ne vre nikakve raunske operacije, ve se pomou njih
elementi skupa, odnosno studenti, mogu rangirati).
Kvantitativna statistika obiljeja jo se nazivaju i numerika
statistika obiljeja, a mogu se podijeliti: na a) neprekidna ili
kontinuirana statistika obiljeja i na b) prekidna ili diskontinuirana
statistika obiljeja.
a) Neprekidna ili kontinuirana statistika obiljeja takva su
numerika obiljeja koja mogu poprimiti neprebrojivo
beskonano mnogo vrijednosti. Primjeri takvog obiljeja su:
visina, teina, duljina, dob itd.
b) Prekidna ili diskontinuirana statistika obiljeja takva su
numerika obiljeja koja mogu poprimiti prebrojivo beskonano
mnogo vrijednosti. Primjeri takvog obiljeja su: broj djece, broj
uenika u razredu, starost u godinama, visina plae u kunama itd.
1.4. Izvori podataka i metode njihova pribavljanja
Osnovne faze statistikog istraivanja su:
a) statistiko promatranje
b) grupiranje (tabelarno i grafiko prikazivanje statistikih podataka)
12

Uvod

c) statistika analiza i interpretacija rezultata provedene analize.


Statistiko promatranje
statistikih podataka.

je

organizirano

prikupljanje

Nakon precizne definicije zadatka, cilja i predmeta istraivanja, tj.


statistikog skupa, pristupa se organiziranom prikupljanju statistikih
podataka. Uspjenost i objektivnost ovog prvog koraka uvjetuje kvalitetu
rezultata ostalih faza statistikog istraivanja. Nepotpune i neistinite
prikupljene informacije do kojih bi se dolo u ovoj fazi znaile bi da
konaan rezultat statistikog istraivanja sadri greku. Pri tom greka
moe biti sistematska i sluajna. Sistematsku greku je lake uoiti jer
se ona ponavlja (npr. neispravnost odreenoga mjernog instrumenta,
neistinito izjanjavanje ispitanika). Sluajnu greku je teko precizno
identificirati, jer se ona ne javlja kod svakog mjerenja i ne javlja se istim
intenzitetom. Stoga se kod sluajne greke esto vee pretpostavka o
ponitavanju njezin utjecaja na globalnoj razini promatranja.
U ovisnosti o karakteru izvora podataka, statistiki podaci se dijele: na
a) sekundarne podatke i na
b) primarne podatke.
1.5. Sekundarni podaci
Sekundarni podaci su oni koji se pribavljaju iz ve postojeih
baza podataka razliitih dravnih ustanova. Takvi se podaci
prikupljaju sustavno na odgovarajui nain, a njihov opseg ne ovisi o
donoenju neke poslovne odluke ili zadanom cilju nekakvog istraivanja.
Takve podatke u Hrvatskoj prikupljaju: Dravni zavod za
statistiku, Hrvatska narodna banka, Hrvatska gospodarska komora, te
neke druge specijalizirane agencije. Jedan od najee koritenih
sekundarnih izvora podataka u Hrvatskoj je Statistiki ljetopis Hrvatske u
izdanju Hrvatskog zavoda za statistiku. U svjetskim okvirima poznat je
World Statistical Yearbook, a internetom su danas dostupne mnoge baze
sekundarnih podataka (na primjer: Eurostat, U.S. Census Bureau i

13

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

slino). Na razini poduzea raznovrsna specifina izvjea o poslovanju i


zaposlenicima imaju sekundarni karakter.
Sekundarni podaci su uglavnom brojani. Predoeni su tablicama,
a vrlo esto i grafikim prikazima.
1.6. Primarni podaci
Primarni podaci prikupljaju se neposrednim promatranjem
svojstava elemenata statistikog skupa u skladu s unaprijed
definiranim ciljevima statistikog istraivanja. Prikupljanje tih
podataka zahtijeva definiranje statistikog skupa, izbor obiljeja koja se
ele istraiti, odreivanje modaliteta promatranog obiljeja, pripremanje
anketnih upitnika i/ili prateih formulara te organiziranje i provoenje
samog prikupljanja podataka.
Ako se podaci prikupljaju za sve lanove nekog skupa, takvo
promatranje naziva se census. Primjer takvog prikupljanja je popis
stanovnitva. Vrlo esto su takva istraivanja skupa, pa se podaci
prikupljaju za podskup osnovnog skupa, odnosno za uzorak. Takvo
promatranje se naziva reprezentativno promatranje.
Prema vremenu promatranje moe se podijeliti na jednokratno,
periodino i tekue. Jednokratno promatranje provodi se jedanput i
nema ponavljanja. Periodino promatranje se ponavlja nakon jednakih
perioda (npr. bilanca uspjeha u poduzeu). Za tekue promatranje
mjerenje je kontinuirano (npr. proizvodnja mlijeka).
Prikupljanje primarnih podataka moe se vriti i pomou
statistikih pokusa. Statistikim pokusom se vri mjerenje vrijednosti
obiljeja nastalih u kontroliranim uvjetima. Vrlo estu primjenu statistiki
pokus ima u marketinkom istraivanju trita. Na primjer, eli se istraiti
kako boja pakiranja deterdenta za rublje utjee na kupnju. U takvom
sluaju istraiva e u pokusu odrediti razliite boje pakiranja (vrijednosti
kontroliranog obiljeja) i u njima e izloiti proizvod. U odreenom
vremenu vriti e se mjerenje opsega prodaje. Na taj nain dobiveni
statistiki podaci su primarni.

14

Uvod

Statistiki podaci prikupljeni nekom od navedenih metoda


predstavljaju "sirovu" statistiku grau koju je potrebno na
odgovarajui nain urediti i pripremiti za analizu. Danas se statistiki
podaci uglavnom obrauju prikladnim programima za raunalo. Postoje
suvremeni statistiki programski paketi koji omoguavaju, uz vrlo
jednostavno rukovanje, unos, pripremu i obradu prikupljenih statistikih
podataka. Primjeri suvremenih statistikih paketa su: STATISTICA,
SAS, SPSS. Kratica SPSS odgovara engleskom nazivu programa
Statistical Package for the Social Sciences, koji je upravo prilagoen
sociolokim istraivanjima. Spomenuti statistiki paketi se koriste za
sloenije statistike analize.
Potrebno je napomenuti da je jedan od najpopularnijih softwarea
(programskih jezika) za tabline proraune u provoenju razliitih
aspekata statistike analize i Microsoft Excel. U podruju programa koji
su namijenjeni prvenstveno tablinim proraunima su Lotus 1-2-3 i
QuatroPro, ali upotreba MS Excela je najrairenija.
MS Excel je u funkciji svih bitnih faza procesa statistike analize
od formiranja baze podataka, sreivanja i grupiranja podataka, grafikog
prikazivanja statistikih nizova, izrauna temeljnih karakteristika
statistikog niza pa sve do sloenijih statistikih analiza i procedura i
analize vremenskih nizova. Ovaj program je kompatibilan sa SPSS-om,
pa se ve postojei podaci iz jednog programa mogu jednostavno kopirati
u drugi.
Upotrebom statistikih paketa, poevi ve od pripremne faze
statistikog istraivanja, znatno se skrauje i pojednostavljuje vrijeme
potrebno za primjenu statistikih metoda i tehnika. Na taj se nain
statistiki postupci pribliavaju mnogim korisnicima.
Prikupljene statistike podatke potrebno je unijeti i pohraniti u
odgovarajuu datoteku odabranog statistikog paketa. Kada se unose
podaci kvalitativnog ili opisnog karaktera, potrebno je izvriti ifriranje
ili kodiranje vrijednosti takvih obiljeja.
U bilo kojem statistikom programskom paketu, pa tako i u SPSSu, potrebno je za svaku varijablu odabrati odgovarajuu skalu mjerenja. U
SPSS-u oznaka za skalu mjerenja je Measure i postoje 3 vrste skale
mjerenja:
15

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Nominal: nominalne skale, za koje se umjesto imena predmeta


navodi njegov broj. Brojevi slue samo za identifikaciju.

Ordinal: ordinalne skale koje slue za oznaavanje redoslijeda


(odreuju je li neto vee ili manje od drugoga).

Scale: numerika statistika obiljeja su vezana za intervalnu i


omjernu skalu.

Intervalna skala nema apsolutnu nulu (nula u ovom sluaju ne


znai nepostojanje promatrane pojave). Na primjer: obiljeje
"temperatura zraka" 00C ne upuuje na nepostojanje temperature.
Vrijednosti ove skale ne mogu se dijeliti, (50C na nekom podruju u
odnosu na 150C na nekom drugom podruju ne znai da je na jednom
mjestu bilo tri puta hladnije u odnosu na to drugo).
Omjerna skala ima apsolutnu nulu (nula podrazumijeva
nepostojanje svojstva). Omjeri znae i jednake odnose u mjerenom
svojstvu. Na primjer: duina, teina, visina uteevine na raunu u banci.
Analitiki primjer 1.3:
Zaposleni u poduzeu "P" u mjestu "M" na dan 30. 09. 2006.
godine statistiki su skup. Promatrani su prema sljedeim obiljejima:
- dob, godine staa, spol, struna sprema, plaa u kunama, visina,
teina, brano stanje, stambena situacija, broj lanova u obitelji, mjesto
roenja.
a)
Zadatak je utvrditi kojim vrstama statistikih obiljeja pripadaju
navedena obiljeja?
Rjeenje 1.3:
Navedena obiljeja pripadaju sljedeim vrstama:
- dob: numeriko (kontinuirano) obiljeje
- godine staa: numeriko (diskontinuirano) obiljeje
- spol: nominalno obiljeje
- struna sprema: redoslijedno obiljeje
- plaa: numeriko (diskontinuirano) obiljeje

16

Uvod

- visina: numeriko (kontinuirano) obiljeje


- teina: numeriko (kontinuirano) obiljeje
- brano stanje: nominalno obiljeje
- stambena situacija: nominalno obiljeje
- broj lanova u obitelji: numeriko (diskontinuirano) obiljeje
- mjesto roenja: nominalno (zemljopisno) obiljeje.
Analitiki primjer 1.4:
Na odabranom podruju izvrena je analiza zainteresiranosti
uenika i studenata za poduke iz razliitih predmeta upitnikom u kojem
su izmeu ostalih bila sljedea pitanja:
1. Iz kojih predmeta ste pohaali
poduke?
a) Matematika
b) Fizika
c) Engleski jezik
d) Hrvatski jezik
e) Ostalo

a)

2. eljeli biste pohaati:


a) Individualne poduke
b) Grupne poduke
c) Svejedno mi je
3. Spol
a) ensko
b) muko

Zadatak je izvriti kodiranje odabranih pitanja?

Rjeenje 1.4:
Tablica 1.1.
Kodna lista
OBILJEJE
poduke iz eljenog predmeta(V1)

eljena vrsta poduka (V2)


spol (V3)

OBLICI OBILJEJA
Matematika
Fizika
Engleski jezik
Hrvatski jezik
Ostalo
Individualne poduke
Grupne poduke
Nije bitno
enski
muki

KOD
A
B
C
D
E
A
B
C
1
2

Izvor: Simulirani podaci.


17

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

U tablici 1.1. vidi se da obiljeje "poduka iz eljenog predmeta"


moe poprimiti 5 oblika: Matematika, Fizika, Engleski jezik, Hrvatski
jezik i ostalo. Svakom obliku obiljeja dodijeljena je ifra ili kod: A, B,
C, D i E. Na taj nain pri unosu podataka umjesto da se piu itave rijei
upisuje se ifra, ime se postie velika uteda vremena.
Kodovi ne moraju biti slova, pa se kod obiljeja spol za "enski"
unosi 1, a za "muki" 2.
Moderni statistiki paketi imaju mogunosti kreiranja i grupiranja
unesenih podataka u razliitim eljenim varijantama u tablice, to opet
ovisi o vrsti istraivanja i postavljenim ciljevima statistikog istraivanja.
Analitiki primjer 1.5:
Kodirana pitanja iz 1.4 potrebno je za 10 ispitanika unijeti u
tablicu!
Rjeenje 1.5:
U tablici 1.2. prikazana su kodirana pitanja za 10 ispitanika:
Tablica 1.2.
Tablica s kodiranim podacima (ili matrica podataka)
Ispitanici
1
2
3
4
5
6
7
8
9
10

V1
A
C
A
B
A
A
D
E
B
A

V2
A
A
B
C
A
B
A
C
A
A

V3
1
2
1
1
2
1
2
1
2
2

Izvor: Simulirani podaci.

U tablici 1.2 vrste statistikih obiljeja smjetene su u stupce. U


drugom stupcu tablice obiljeje V1, prema kodnoj listi u tablici 1.1.,
znai "poduke iz eljenog predmeta". Stupac V2 podrazumijeva "eljenu
vrstu poduke", a V3 znai "spol".

18

Uvod

Ako se pogledaju podaci za 3. ispitanika u tablici 2, A u stupcu


obiljeja V1 (poduke iz eljenog predmeta) znai da taj ispitanik eli
poduku iz Matematike. Oznaka B u stupcu V2 (eljena vrsta poduka)
istog ispitanika podrazumijeva da on preferira grupnu poduku, a njegova
oznaka 1 u stupcu V3 (spol) kae nam da je taj ispitanik enskog spola.

Analitiki primjer 1.6:


Na odabranom podruju izvrena je analiza stanovnitva
upitnikom u kojem su izmeu ostalih bila sljedea pitanja:
1. Spol:
a) Muki
b) enski
2. Visina:
...............................
Tablica 1.3:
Kodna lista
OBILJEJE
spol (V1)
visina u cm (V2)

OBLICI OBILJEJA
Muki
enski
..........

KOD
1
2
........

Izvor: Simulirani podaci.

a)
Kodirana pitanja iz tablice 1.3. potrebno je unijeti u dokument
programa SPSS!
b)
Za 20 ispitanika potrebno je u SPSS unijeti konkretne podatke o
spolu i visini u cm!
Rjeenje 1.6:
a) U programu SPSS pitanja, odnosno varijable se definiraju u
dijelu Variable view koji se bira u donjem lijevom kutu ekrana (slika
1.1.)

19

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slika 1.1.
Variable view za definiranje varijabli u programu SPSS

Izvor: Iz programa SPSS.

Slika 1.2.
Prikaz definiranih varijabli u programu SPSS

Izvor: Simulirani podaci.

Prema slici 1.2 vidi se da su varijable nazvane (Name) V1 i V2.


Radi lakeg rada s podacima naznaena je vrsta podataka (Type)
Numeric. U stupcu Label oznaeno je da je varijabla V1: Spol, a
varijabla V2: Visina u cm. Zadnji stupac definira skalu mjerenja
(Measure), gdje je za V1-Spol oznaena opisna, tj. Nominal skala, a za
V2-Visinu u cm numerika, tj. Scale skala.
U stupcu Values za varijablu V1-Spol uneseni su kodovi prema
tablici 1.3. Klikom mia u prvo polje stupca Values otvara se prozor
Value Labels, u kojem se definira konkretno kodiranje. To je za ovaj
primjer prikazano na slici 1.3.
Na slici 1.3 vidi se da muki spol ima kod 1, a enski spol kod 2.
Potrebno je napomenuti da pri unosu objanjenja i vrijednosti treba
izbjegavati slova koja ne pripadaju engleskoj abecedi jer ih SPSS nee
prepoznati.

20

Uvod

Slika 1.3.
Prikaz definiranih varijabli u programu SPSS

Izvor: Prema podacima autora.

b)
U programu SPSS podaci se prema definiranim varijablama
unose u dijelu Data view koji se bira u donjem lijevom kutu ekrana (slika
1.4).
Slika 1.4.
Data view za unoenje podataka u programu SPSS

Izvor: Iz programa SPSS.

Na slici 1.5 prikazani su podaci o spolu i visini u cm za 20


ispitanika (podaci su simulirani).
Naravno, nakon to su se podaci unijeli u program SPSS,
potrebno ih je snimiti na standardan nain kako se to radi kod veine
klasinih programa za raunalo. Na glavnom izborniku odabire se File, a
u njegovu padajuem izborniku Save As te se uneseni podaci snimaju pod
eljenim imenom.

21

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slika 1.5.
Prikaz podataka o varijablama V1 i V2 za 20 ispitanika u programu
SPSS

Izvor: Simulirani podaci.

Moderni statistiki paketi imaju mogunosti kreiranja i grupiranja


unesenih podataka u razliitim eljenim varijantama u tablice, to opet
ovisi o vrsti istraivanja i postavljenim ciljevima statistikog istraivanja.
Takav nain obrade podataka olakava rad s masom statistikih
podataka i omoguava veliku utedu vremena.

22

Uvod

1.7. Naini prikupljanja podataka


Pojedinane metode statistikog promatranja su:
a)
b)
c)
d)
e)

mjerenje
brojenje
ocjenjivanje
evidentiranje i
anketiranje.

Jedan od naina statistikog promatranja i prikupljanja podataka


je mjerenje. Mjeri se na primjer urod penice po jedinici poljoprivredne
povrine. Moe se mjeriti teina proizvoda, kao i visina stanovnitva
nekog podruja.
Brojenjem se moe doi do podataka o broju zaposlenih u
pojedinim organizacijskim jedinicama poduzea, o broju upisanih
uenika u srednje kole. Broje se i noenja turista u turistikoj sezoni pa
se na taj nain dobivaju podaci relevantni za analizu uspjenosti sezone.
Ocjenjivanjem kao metodom prikupljanja statistikih podataka
odreuje se kvaliteta provoenja odreenih radnji, stoga se taj postupak
obino vee za redoslijedna obiljeja statistikog skupa. Ocjenjuju se i
rangiraju studenti na testu iz statistike, ocjenjuje se usluga nekog
hotelskog poduzea i slino.
Evidentiranje podataka podrazumijeva kontinuirano praenje
kretanja neke pojave u duljem ili kraem razdoblju. Za potrebe evidencije
esto se ureuju odgovarajui obrasci. Na primjer, za promatranje
izostanaka i broja ostvarenih radnih sati djelatnika u nekom poduzeu
postoji obrazac za evidenciju gdje zaposlenici upisuju: ime i prezime,
vrijeme dolaska i odlaska s radnog mjesta, vrijeme izostanka, razlog
izostanka. Evidentiranje se moe vriti i tehnikim ureajima. To su
umreena raunala, optiki itai, ureaji za brojenje npr. putnika i
slino.
Anketa i/ili intervju je metoda kojom se prikupljaju podaci uz
pomo unaprijed pripremljenih upitnika na kojima ispitanici svojim
23

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

odgovorima daju informacije o promatranim obiljejima statistikog


skupa. Da bi anketa uspjela, potrebno je veliku pozornost obratiti
sastavljanju upitnika. Anketu sastavlja statistiar, koji se esto konzultira
i sa psihologom. Upiti moraju biti kratki, precizni i jasni. Moraju biti
postavljeni tako da ne sugeriraju odgovor. Broj pitanja ne smije biti velik
da ne zamara one koji odgovaraju. Pri provoenju ankete pristup
ispitaniku, odnosno jedinici statistikog skupa moe biti izravan i
neizravan.
Izravan pristup ostvaruje se kada osoba ili tim koji anketiraju
izlaze na teren i u direktnom kontaktu s ispitanicima prikupljaju odgovore
na pitanja iz upitnika. Neizravan pristup ostvaruje se potom,
telefonom, elektronikom potom i web-om. Na taj nain smanjuju se
trokovi prikupljanja podataka (npr. putni trokovi osoba koje provode
anketu, tj. anketara). Iako se i neizravnim nainom ispitanicima
prezentira tko istrauje i koja mu je svrha, praksa je pokazala da je tim
pristupom anketiranja prisutan velik postotak neodaziva, kao i esto velik
postotak nevaljano i nepotpuno popunjenih upitnika. Naravno, razloge
treba traiti u injenici da ispitaniku nije na raspolaganju osoba koja e
mu pojasniti nejasna pitanja.
Ovisno o obimu istraivanja organizaciju prikupljanja
podataka moe provoditi jedna osoba, skupina istraivaa ili osoblje
specijalizirane ustanove kojoj je to osnovna djelatnost. Ako se radi o
manjem istraivanju, u prikupljanju podataka e sudjelovati manji broj
istraivaa, dok e vee istraivanje zahtijevati rad veeg broja
istraivaa.
1.8. Priprema podataka za statistiku analizu
Prije poetka obrade prikupljenih podataka potrebno je izvriti
kontrolu sirove statistike grae. Kontrola se moe vriti u tijeku ili na
kraju postupka prikupljanja podataka, to ovisi i o razliitim metodama
prikupljanja.
Preventivna kontrola obavlja se ve u tijeku samog postupka
prikupljanja statistikih podataka. Kod provoenja ankete to
24

Uvod

podrazumijeva kontrolu upitnika pri njegovu preuzimanju od ispitanika.


Kontrolira se jesu li dani odgovori na sva pitanja i jesu li pravilno
popunjena predviena mjesta za traene odgovore.
Naknadna kontrola prikupljenih podataka obavlja se nakon
postupka prikupljanja. Formalnom kontrolom se usporeuje realizirani
broj prikupljenih podataka s onim planiranim obuhvatom statistikog
skupa. Ako je anketa vrena neizravnim putem, na primjer potom,
usporeuje se broj odaslanih upitnika s brojem vraenih upitnika.
Materijalnom kontrolom ispituje se potpunost i tonost sadraja
prikupljenih podataka. Na primjeru ankete to podrazumijeva kontrolu
potpunosti i loginosti danih odgovora.
1.9. Uzorak
Uzorak je podskup osnovnoga statistikog skupa, a uzima se u
svrhu ispitivanja obiljeja elemenata osnovnog skupa (ili populacije).
Poeljno je da uzorak bude to vei, ali u konkretnim
istraivanjima moe se dogoditi da:

poveavanjem uzorka istraivanje postaje sve skuplje

katkada se uzorci unitavaju (npr. kemijska analiza nekih


prehrambenih artikala).

Kad god je mogue, poeljno je izabrati sluajni uzorak. U


takvom uzorku svaka jedinica populacije (osnovnog skupa) ima jednaku
vjerojatnost da bude izabrana. Uzorak treba biti reprezentativan, a ne
selekcioniran (npr. potrebno je obuhvatiti istraivanjem i gradsko i
seosko stanovnitvo, zatim u nekom medicinskom istraivanju nije cilj
samo analizirati i donositi zakljuke za "dobrovoljce").
Ako neki lanovi populacije imaju veu ansu od drugih da budu
izabrani, takav uzorak se naziva pristrani uzorak (biased sample).
Sluajni uzorak sastavlja se prema odreenim principima, koji
odgovaraju zakonu sluaja. Najbolji nain je upotreba "tablice sluajnih

25

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

brojeva" ili koritenje raunalnog sustava sluajnog izbora (generator


sluajnih brojeva).
Pri izradi tablice sluajnih brojeva koristi se deseterostrana
prizma s brojevima od 0 do 9.
Analitiki primjer 1.7:
Nakon 40 bacanja deseterostrane prizme dobije se na sluajan
nain 40 brojeva; skupljeni u skupine od po 4:
7766 7520 1607 6048 2771 4733 8558 8681 5204 3806
a)
Zadatak je izabrati uzorak veliine 350 iz osnovnog skupa veliine
790. (Prije poetka odabira svakoj osobi iz osnovnog skupa dodjeljuje se
broj od 1 do 790!).
Rjeenje 1.7:
a)
Najprije je potrebno otvoriti tablicu sluajnih brojeva sluajno!
Pretpostavka je da se tablica otvorila na stranicu na kojoj je u prvom
retku prikazan niz od 40 brojeva.
Kako je u osnovnom skupu ukupno 790 osoba, potrebno je itati
troznamenkaste brojeve iz tablice (u redovima, u stupcima ili
dijagonalno).
Ako se brojevi itaju po redovima, prvi troznamenkasti broj iz
prezentiranog retka, tj. prva odabrana osoba je ona oznaena brojem 776,
zatim 675, pa 201 itd.
Ako se naie na broj vei od 790, on se odbacuje, jer u osnovnom
skupu nema vie od 790 osoba. Ako se dogodi da se neki broj ponavlja,
on se opet odbacuje, jer se jedna osoba u uzorak ne moe odabrati dva
puta.
Uzorak moe biti i sistematski ako se jedinice iz osnovnog skupa
biraju sistematski. Na primjer, ako se po redu u uzorak bira svaki 10.
element iz osnovnog skupa.
Stratificirani ili slojeviti uzorak je takav uzorak koji se dobije na
nain da se populacija podijeli u slojeve ili stratume prema nekim

26

Uvod

karakteristikama, te da se iz svake od grupa uzme sluajni uzorak. Na


primjer, u sociolokim istraivanjima stratumi se mogu birati prema
dobnim skupinama.
Klaster uzorci su loija varijanta sluajnog uzorka i koriste se u
velikim trinim, ekonomskim ili politikim istraivanjima. Na primjer,
pri ispitivanju miljenja stanovnika nekog grada o nekoj problematici,
grad se moe prema planu podijeli na 50-ak blokova, odnosno kvartova.
Tada se na sluaj biraju neki blokovi u kojima anketari detaljno
intervjuiraju sve stanovnike. ak se vraaju na adrese dok ne dobiju
intervju od svakog stanovnika u odabranim blokovima.
Kvotni uzorci su jo loiji jer predstavljaju nesluajni
stratificirani uzorak. Koriste se kod ad hoc organiziranih istraivanja za
potrebe trita, za prikupljanje miljenja graana o nekom pitanju i
slino. Istraiva unaprijed izabere broj ljudi (kvotu) svakog pojedinog
stratuma koje mora intervjuirati, stoga se ti uzorci nazivaju kvotni.
Prigodni uzorak je onaj koji se "nae pri ruci" jer je drugi
nedostupan. Na primjer, dostupni bolesnici na odjelu u bolnici, prisutni
studenti neke godine studija i slino.
Pri istraivanju se mogu dogoditi pogreke koje mogu biti:
a) pogreke izvan uzorka (zbog pogreno odabrane metode
istraivanja, zbog pogrene obrade rezultata i slino)
b) pogreke uzorka.
Veliinu uzorka nije mogue openito definirati, jer to ovisi o
varijabilnosti pojave koja se mjeri i o preciznosti kojom se pojava eli
izmjeriti. Za uzorak je najvanije da bude reprezentativan, tj. kad god je
to mogue sluajno sakupljen.
Frakcija odabiranja (f) omjer je jedinica u uzorku i broja
jedinica u osnovnom skupu:
f =

n
N

(1.1)

gdje je :
n - broj jedinica u uzorku

27

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

N - broj jedinica u osnovnom skupu.

Korak izbora je reciprona vrijednost frakcije odabiranja ( 1 f ) i


upotrebljava se kod sistematskog izbora jedinica u uzorak. To znai da
ako je korak izbora jednak 20, da se u uzorak iz osnovnog skupa odabire
svaki 20. element.
Broj svih moguih uzoraka (bez ponavljanja) veliine n iz
osnovnog skupa veliine N jednak je broju kombinacija bez ponavljanja
n -tog razreda:
N
K = .
n

(1.2)

Pomou uzorka vri se procjena odreenih parametara osnovnog


skupa i testiraju se hipoteze o nepoznatim parametrima osnovnog skupa.
Analitiki primjer 1.8:
Na odabranom podruju izvrena je analiza studentske populacije
upitnikom u kojem su izmeu ostalih bila sljedea pitanja:
Anketni upitnik:
1. Spol:

1. Muki
2. enski

2. Visina u cm:
3. Teina u kg:
4. Prosjena ocjena u srednjoj koli:
5. Koliki deparac dobivate na mjesec u kunama?
6. Financijske prilike u obitelji:

1. Nedovoljno novca za normalni standard


2. Zadovoljavamo osnovne potrebe
3. Nema materijalnih problema
4. ivimo odlino.

a) Kodirana pitanja iz anketnog upitnika potrebno je unijeti u dokument


programa SPSS!
b) Za svakog ispitanika potrebno je u SPSS unijeti konkretne podatke o
postavljenim pitanjima iz ankete!
28

Uvod

Rjeenje 1.8:
a) U programu SPSS pitanja, odnosno varijable se definiraju u
dijelu Variable view koji se bira u donjem lijevom kutu ekrana (slika
1.1.).
Slika 1.6.
Prikaz definiranih varijabli u programu SPSS

Izvor: Simulirani podaci.

Prema slici 1.6. vidi se da su varijable nazvane (Name) od v1 do


v2. Radi lakeg rada s podacima, naznaena je vrsta podataka za sve
varijable (Type) Numeric. U stupcu Label oznaeno je da je varijabla V1:
Spol, a varijabla V2: Visina u cm, itd. Zadnji stupac definira skalu
mjerenja (Measure).
Slika 1.7.
Prikaz definirane varijable v6-Financijske prilike u obitelji u programu
SPSS

Izvor: Simulirani podaci.

29

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

U stupcu Values za varijable v1-Spol i v6-Financijske prilike u


obitelji uneseni su odgovarajui kodovi prema odgovarajuim pitanjima
iz ankete. Na slici 1.7 prikazani su kodovi za varijablu v6-Financijske
prilike u obitelji.
Na slici 1.7 vidi se da odgovor "Nema novca za normalan
standard" kod 1, odgovor "Zadovoljavamo osnovne potrebe" kod 2 itd..
b) U programu SPSS podaci prema definiranim varijablama
unose se u dijelu Data view koji se bira u donjem lijevom kutu ekrana
(slika 1.4).
Slika 1.8.
Prikaz dijela podataka o varijablama v1 - v6 za odabrane ispitanike u
programu SPSS

Izvor: Simulirani podaci.

Na slici 1.8 prikazan je dio podataka o ispitanicima za varijable


v1 - v6 (podaci su simulirani).
Naravno, nakon to su se podaci unijeli u program SPSS,
potrebno ih je snimiti na standardan nain kako se to radi kod veine
klasinih programa za raunalo. Na glavnom izborniku odabire se File, a
u njegovom padajuem izborniku Save As te se uneseni podaci snimaju
pod eljenim imenom.

30

Uvod

Analitiki primjer 1.9:


Prema podacima iz analitikog primjera 1.8:
a)
Za sve ispitanike potrebno je izraunati indeks kojim se odreuje
idealna tjelesna teina u skladu s visinom ispitanika. To je Body Mass
Index (BMI) - (v7) koji se rauna prema sljedeem izrazu:
BMI =

tezina u kg
vi sin a u m 2

b)
Zadatak je za sve ispitanike od numerike varijable deparac (v6)
formirati novu varijablu grupirani deparac (v8) po principu koji je
prikazan u tablici 1.4.
Tablica 1.4.
Princip formiranja nove varijable grupirani deparac (v8)
Grupe

1
2
3
4
5
6

Visina
deparca
0 - 200
201 - 400
401 - 600
601 - 800
800 - 1000
1001 - 3500

Nova
vrijednost
200
400
600
800
1000
3500

Izvor: Simulirani podaci.

Rjeenje 1.9:
a)
Da bi se pomou postojeih numerikih varijabli izraunala nova
numerika varijabla, potrebno je na glavnom izborniku odabrati
Transform, a u njegovu padajuem izborniku Compute. Na ekranu se
pojavi prozor Compute Variable koji je prikazan na slici 1.9.

31

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slika 1.9.
Prozor Compute Variable u kojem se kreira nova numerika varijabla v7

Izvor: Simulirani podaci.

Prema slici 1.9 vidi se da je u polje Target Variable potrebno


unijeti ime nove varijable BMI -v7, dok se u Numeric Expression unosi
izraz po kojem se iz postojeih varijabli kreira nova varijabla. Pritom
treba voditi rauna o tome da su postojei podaci o visini ispitanika
izraeni u cm te da bi se dobila visina izraena u metrima, potrebno je
centimetre podijeliti sa 100. To se moe vidjeti na slici 1.9 pod Numeric
Expression. Nakon to se klikne ikona OK, nova varijabla v7 automatski
se formira u dodatnom stupcu u Data View programa SPSS. Nova
varijabla se moe vidjeti na slici 1.10.
U Variable View potrebno je na odgovarajui nain definirati tu
novu varijablu te u stupcu Label naznaiti da se radi o Body Mass Index.
Ta nova varijabla je numerika i ima skalu mjerenja Scale.

32

Uvod

Slika 1.10.
Data view s novom varijablom v7

Izvor: Simulirani podaci.

b)
Da bi se pomou varijable v6 - deparac formirala nova varijabla
grupirani deparac po principu koji je prikazan u tablici 1.4, potrebno je
na glavnom izborniku odabrati Transform, a u njegovu padajuem
izborniku odabrati Recode. U njegovom izborniku bira se Into Different
Variables (jer bi se odabirom Into Same Variables izgubila postojea
varijabla). U polje Numeric Variable bira se v6 - "Koliki deparac
dobivate", a u Outut Variable, Name je v8, a Label Grupirani deparac.
Odabirom ikone Old and New Values otvara se novi prozor
Recode into Different Variables. Aktiviranjem opcije Range upisuju se
odgovarajue grupe visine deparca, kako je zadano u tablici 1.4. Nakon
upisivanja svakog pojedinog Range, upisuje se odgovarajua New Value,
koja se svaki put kao nova grupa dodaje klikom na ikonu Add. Nakon to
su unesene sve grupe ikonom Continue, zatim Change i OK, u novom
stupcu Data View kreirat e se nova varijabla Grupirani deparac,
odnosno v8.
Na slici 1.11. prikazani su prozori Recode into Different
Variables i Old and New Values.

33

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slika 1.11.
Prozori Recode into Different Variables pomou kojih se kreira nova
varijabla v8 - Grupirani deparac

Izvor: Simulirani podaci.

34

Ureivanje i prikazivanje podataka

2. UREIVANJE I PRIKAZIVANJE PODATAKA


2.1. Grupiranje podataka
Ako se urede prikupljeni statistiki podaci prema nekom
obiljeju ili karakteristici, dobiva se statistiki niz.
Grupiranje statistikih podataka je postupak diobe
statistikog skupa na odreeni broj podskupova prema prethodno
utvrenim modalitetima promatranog obiljeja i uz potivanje
principa iskljuivosti i iscrpnosti.
Princip iskljuivosti podrazumijeva da svaki element osnovnog
skupa istovremeno moe pripadati samo jednoj grupi, tj. podskupu.
Princip iscrpnosti podrazumijeva da postupkom grupiranja trebaju biti
obuhvaeni svi elementi osnovnog skupa.
Statistika obiljeja, odnosno ope karakteristike elemenata
statistikog skupa openito se oznaavaju: sa
Xi, i = 1, 2, , N.

(2.1)

Prema tome postoji N modaliteta, tj. pojavnih oblika promatranih


obiljeja.
Broj elemenata statistikog skupa koji pripadaju odreenoj
grupi, tj. jednom modalitetu ili pojavnom obliku promatranog
obiljeja, naziva se apsolutna frekvencija.
Oznaka za apsolutnu frekvenciju je
fi, i = 1, 2, ,N.

(2.2)

Zbroj svih elemenata statistikog skupa naziva se opseg


statistikog skupa. Zbog principa iskljuivosti i iscrpnosti taj broj

35

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

odgovara i zbroju svih apsolutnih frekvencija kako je prikazano


izrazom (2.3).1
N

(2.3)

f1 + f 2 + f 3 + . .. + f N = f i
i =1

Moe se definirati da je skup ureenih parova modaliteta


promatranog obiljeja i njima pripadajuih apsolutnih frekvencija
statistiki niz.
2.1.1. Nizovi kvalitativnih podataka
Kvalitativni statistiki nizovi su nominalni (atributivni i
zemljopisni) i redoslijedni.

U izrazu (2.3) dan je znak zbrajanja f i koji se ita: zbroj apsolutnih frekvencija f i ,
i =1

gdje i ide od 1 do N. Neke od karakteristika znaka zbrajanja su sljedee:


1.
2.
3.

X i = X 1 + X 2 + . . . + X N , gdje je i = indeks zbrajanja;

i =1
N

i =1

i =1

i =1
N

( X i Yi Z i . . .) = X i Yi Z i . . . ;

i =1
N

X i Yi = X 1Y1 + X 2 Y2 + . . . + X N Y N X i Yi (ovdje se za desni dio

i =1

i =1

i =1

nejednakosti, primjenom izraza 1., moe zakljuiti da suma produkta nije


jednaka produktu suma);
N

4.

Xi
X
X
X
= 1 + 2 + ... + N

Y1
Y2
YN
i =1 Yi
N

Xi

i =1
N

(ovdje se moe zakljuiti da je suma

Yi

i =1

kvocijenta razliita od kvocijenta suma);


5.

i =1

i =1

aX i = aX 1 + aX 2 + . . . + aX N = a( X 1 + X 2 + . . . + X N ) = a X i , gdje je "a"

konstanta, jer ne ovisi o indeksu zbrajanja i;


6.

i =1

i =1

i =1

i =1

(aX i bYi cZ i . . . ) = a X i b Yi c Z i . . . , gdje su a, b, c,

konstante.
36

Ureivanje i prikazivanje podataka

Nominalni statistiki nizovi formiraju se grupiranjem


elemenata osnovnog skupa prema modalitetima odgovarajueg
nominalnog obiljeja.
Modaliteti nominalnog obiljeja izraavaju se pomou atributa,
kategorija i slovnih oznaka, a mogu se navoditi abecednim redom, prema
veliini apsolutnih frekvencija, te dogovorno ili zakonski utvrenim
popisima. Na primjer, slubena statistika koristi: SMTK ili Standardnu
meunarodnu trgovinsku klasifikaciju i NKD ili Nacionalnu klasifikaciju
djelatnosti.
Zemljopisni statistiki nizovi formiraju se grupiranjem
elemenata osnovnog skupa prema modalitetima odgovarajuega
zemljopisnog ili prostornog obiljeja.
Modaliteti prostornog obiljeja najee odgovaraju teritorijalnoadministrativnoj podjeli odreenog geografskog prostora, kao na primjer:
gradovi, upanije, regije, drave, kontinenti. Grupe toga obiljeja mogu
biti poredane po abecednom redu, po veliinama apsolutnih frekvencija
ili po geografskom poloaju. Ako se zbog vee preglednosti nekoliko
modaliteta stavi zajedno u grupu "ostalo", ona obino dolazi na kraju
statistikog niza.
Redoslijedni statistiki nizovi formiraju se grupiranjem
elemenata osnovnog skupa prema modalitetima odgovarajueg
redoslijednog obiljeja.
Grupiranje podataka statistikog skupa prema redoslijednom
obiljeju vri se slino kao kod nominalnih obiljeja, ali je redoslijed
grupa ovdje odreen rangom koji pojedina grupa obiljeja predstavlja.
Rangiranje se moe vriti polazei od najnieg ranga prema najviem ili
obrnuto.
2.1.2. Numeriki niz
Grupiranjem
elemenata
statistikog
skupa
prema
numerikom ili kvantitativnom obiljeju nastaje numeriki statistiki
niz.
37

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Grupiranje i ureivanje elemenata numerikog statistikog skupa


ovisi o broju podataka i o njihovoj vrsti, odnosno o tome radi li se o
neprekidnim (kontinuiranim) ili prekidnim (diskontinuiranim)
numerikim statistikim obiljejima.
Ako numeriko obiljeje moe poprimiti samo mali broj
numerikih vrijednosti, tada ta svaka vrijednost moe biti posebna grupa
u nizu. To je najee sluaj kod prekidnog ili diskontinuiranog
numerikog obiljeja.
Ureen negrupiran prekidni numeriki statistiki niz ima
karakteristiku da su njegove vrijednosti sloene po veliini poevi,
najee, od najmanje:
X 1 , X 2 , ..., X N ; X i 1 < X i , i = 2,3, ..., N .

(2.4)

Openito je pojedini oblik (modalitet) obiljeja: X i , i = 1,2, ..., k , a


pripadajua apsolutna frekvencija: f i , i = 1,2, ..., k .
Skup ureenih parova:
( X i , f i ), i = 1,2,3, ..., k

(2.5)

je distribucija frekvencija promatranog prekidnog numerikog


obiljeja.
Takoer vrijedi da je suma svih apsolutnih frekvencija jednaka
opsegu statistikog odnosno osnovnog skupa:
k

fi = N .

i =1

(2.6)

Za vrijednosti koje se pojavljuju manje puta formiraju se


zajednike grupe ili "razredi". U razredima se nalaze elementi skupa s
vrijednostima obiljeja koje se nalaze izmeu donje i gornje granice
razreda.
Na taj se nain formiranjem razreda postie vea preglednost, ali
se gubi na preciznosti i potpunosti informacija. U sluaju
diskontinuiranog numerikog obiljeja donja granica sljedeeg (i+1)
razreda razlikuje se od gornje granice prethodnog (i) razreda za
jedinicu mjere promatranog obiljeja.

38

Ureivanje i prikazivanje podataka

Te originalne granice razreda nazivaju se jo i nominalne


granice. Prije provoenja statistike analize potrebno je nominalne
granice zamijeniti preciznim ili pravim granicama, to ovisi o nainu
mjerenja promatranog svojstva. To se najee radi na nain da se donja
granica sljedeeg (i+1) nominalnog razreda umanji, a gornja granica
prethodnog (i) nominalnog razreda uvea za polovicu razlike izmeu tih
granica. Ponekad se precizne granice formiraju jednostavno na nain da
se sve gornje granice uveaju za 1 jedinicu obiljeja i tako izjednae sa
svojom sljedeom donjom granicom ili da se sve donje granice umanje za
1 jedinicu obiljeja i tako izjednae sa svojom prethodnom gornjom
granicom.
Kontinuirano ili neprekidno statistiko obiljeje moe
poprimiti vrijednosti iz nekog intervala, pa se njegovi modaliteti
formiraju kao razredi. Skup ureenih parova razreda obiljeja i
njima pripadajuih frekvencija2
( DGi X i < GGi , f i ), i = 1,2,3, ..., k

(2.7)

je distribucija frekvencija promatranog neprekidnog numerikog


obiljeja. U sluaju kontinuiranog numerikog obiljeja donja
granica sljedeeg (i+1) razreda jednaka je gornjoj granici
prethodnog (i) razreda, pa ovdje nije potrebno raunati precizne ili
prave granice.
Ako nije definirana najmanja vrijednost obiljeja za neki skup,
donja granica poetnog razreda pri grupiranju se moe ostaviti
otvorena. Isto tako ako nije definirana najvea vrijednost obiljeja za
neki skup, gornja granica posljednjeg razreda moe se ostaviti
otvorena. Meutim prije poetka same statistike analize, te je otvorene
granice potrebno zatvoriti takozvanim procijenjenim granicama, koje se
stavljaju u zagrade, jer njima istraiva procjenjuje da nijedan element
skupa nema vrijednost manju od prve donje ili veu od zadnje gornje
procijenjene granice.
Veliina razreda (i) razlika je izmeu gornje i donje granice
razreda (kada je rije o diskontinuiranom numerikom obiljeju radi se s
preciznim ili pravim granicama).
2

gdje je DGi donja granica i-tog razreda, a GGi gornja granica i-tog razreda.
39

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

i = GGi DGi , i = 1,2, ..., k .

(2.8.)

Sredina razreda (sredXi) je prosjek (odnosno jednostavna


aritmetika sredina) izmeu donje i gornje (prave ili precizne) granice
razreda:
DGi + GGi
, i = 1,2, ..., k .
2

sredX i =

(2.9)

Ako vrijednosti promatranog numerikog niza nisu ravnomjerno


rasporeene, veliine koje se izraunavaju pomou sredine razreda sadre
tzv. greku grupiranja.
2.2. Tabeliranje
Tabeliranje je postupak svrstavanja grupiranih prikupljenih
statistikih podataka u tablice.
Statistike tablice kao jedan od oblika prikazivanja statistikih
podataka prisutne su u literaturi svuda oko nas.
Tablica nastaje crtanjem okomitih i vodoravnih linija prema
odreenim pravilima. Svaka statistika tablica mora imati: naslov,
broj tablice (ako ih ima vie), tekstualni dio, numeriki ili brojani
dio i izvor podataka te po potrebi napomenu.
Tablica 2.1.
Naslov tablice
Zaglavlje

Zbirni

Oznake
stupca
0
Pred- Oznake
sturetka
pac

1
stupac

stupac:

j =1

2
redak

polje
polje

Zbirni redak:
m

i =1

Izvor podataka:
40

Ureivanje i prikazivanje podataka

Tablica 2.1. prikazuje opi oblik statistike tablice.


Naslov tablice mora biti jasan i kratak, a istovremeno u sebi mora
sadravati pojmovnu, prostornu i vremensku definiciju statistikog skupa
da bi onaj tko je ita mogao precizno odrediti njezine elemente.
Tekstualni dio statistike tablice sastoji se od dva dijela:
zaglavlja i predstupca. U zaglavlju ili tumau stupaca opisuje se i
objanjava sadraj stupaca. U predstupcu ili tumau redaka opisuje se i
objanjava sadraj redaka. To su najee oblici statistikog obiljeja po
kojemu je promatran statistiki niz. Uz tekstualni dio svaki stupac moe
biti oznaen i odgovarajuim brojem. Kako se vidi u tablici 2.1,
predstupac se esto oznaava nulom, a numeriranje dalje ide po redu: 1,
2, , n.
Brojani ili numeriki dio tablice sastoji se od polja u koja se
unose frekvencije, odnosno rezultati grupiranja statistikih podataka.
Zbirni ili marginalni stupac sadri zbrojeve pojedinih redaka. Njegova
n

suma zbraja elemente svakog retka po j - stupcima. Zbirni ili


j =1

marginalni redak sadri zbrojeve pojedinih stupaca. Njegova suma


m

zbraja elemente svakog stupca po i- redcima.

i =1

Izvor podataka se navodi ispod tablice. On omoguuje provjeru


ispravnosti prikupljenih podataka u tablici, kao i eventualnu dopunu
podataka, ako to zahtijeva statistiko istraivanje (posebno ako su podaci
u tablici preuzeti iz sekundarnih izvora).
Zbog vee preglednosti tablice, esto se zaglavlje, predstupac,
zbirni redak i zbirni stupac odvajaju debljim crtama od brojanog dijela
kao to se moe vidjeti u tablici 2.1.
Dakle, statistika tablica mora potivati 3 naela: preglednost,
potpunost i jasnou.
Statistike tablice mogu se podijeliti: na
1) ope ili izvjetajne statistike tablice i na
2) analitike ili sumarne statistike tablice.

41

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Ope statistike tablice prikazuju jako velik broj statistikih


podataka o nekome promatranom statistikom skupu.
Analitike statistike tablice se konstruiraju za neku posebnu
analizu i one su u pravilu preglednije.
U ovisnosti o tome prikazuju li se prikupljeni statistiki podaci u
tablici prema jednom ili vie statistikih obiljeja i prikazuje li se jedan ili
vie statistikih nizova razlikuju se:
1) jednostavne statistike tablice i
2) sloene statistike tablice, koje se mogu podijeliti: na

skupne statistike tablice i na

kombinirane statistike tablice.

Jednostavne statistike tablice prikazuju jedan statistiki skup


grupiran u jedan statistiki niz, tj. grupiran prema jednom obiljeju.
Skupne statistike tablice prikazuju dva ili vie statistika skupa
grupirana u dva ili vie statistika niza prema jednom obiljeju.
Tablica 2.2.
Naslov tablice: Dvostruka (sloena) statistika tablica
Zaglavlje

Zbirni

Oznake
stupca
Predstupac

0
Oznake

1
x11

stupac:

j =1

2
x12

n
x1n

x1 j

j =1

retka

x21

x22

x2n

x2 j

j =1

xm1

xm2

xmn

xmj

j =1

Zbirni redak:
m

i =1
Izvor podataka:

42

xi1

i =1

xi 2

i =1

xin

i =1

m m

xij

i =1 j =1

Ureivanje i prikazivanje podataka

Kombinirane statistike tablice (tablice kontigence) prikazuju


jedan statistiki skup grupiran u dva ili vie statistikih nizova prema dva
ili vie obiljeja. Ako kod kombinirane tablice s dva obiljeja jedno
obiljeje ulazi u tablicu iz predstupca, a drugo iz zaglavlja, kae se da je
to tablica s dva ulaza. U skladu s tim postoje kombinirane tablice s vie
ulaza, ali pri njihovu kreiranju gubi se jasnoa i preglednost.
Tablica 2.2 prikazuje jednu opu dvostruku statistiku tablicu s
odgovarajuim sumama u zbirnom retku i zbirnom stupcu. Jednadba
(2.10) pokazuje da je zbroj zbirnog retka jednak zbroju zbirnog stupca,
odnosno ako kod dvostruke sume one zamijene svoja mjesta, nita se
nee promijeniti:
m n

n m

i =1 j =1

j =1i =1

x ij = x ij .

(2.10)

2.3. Relativni brojevi strukture


Relativni brojevi su "neimenovani", stoga se pomou njih mogu
usporeivati i analizirati pojave koje imaju razliitu jedinicu mjere ili
razliit broj elemenata. Na taj nain dobije se relativna vanost dijela ili
cjeline statistikog niza.
Relativni brojevi nastaju dijeljenjem dviju veliina. Veliina s
kojom se dijeli zove se osnova relativnog broja i po njoj se relativni
brojevi meusobno razlikuju.
Relativni brojevi strukture pokazuju odnos dijela prema
cjelini, i njima se olakava analiza rasporeda podataka prema
modalitetima obiljeja u jednom statistikom nizu, odnosno njihova
struktura. Najee se izraavaju u postocima, a mogu i u promilima.
Ako relativni brojevi strukture (Pi) pokazuju odnos apsolutnih
frekvencija prema opsegu statistikog skupa (tj. ukupnom broju
elemenata statistikog skupa), zovu se relativne frekvencije (fri).

43

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Pi =

f
dio
; fri = n i
cjelina
fi

(2.11)

f
dio
100 (u %); fri = n i 100 (u %)
cjelina
fi

(2.12)

f
dio
1000 (u ); fri = n i 1000 (u )
cjelina
fi

(2.13)

i =1

Pi =

i =1

Pi =

i =1

Zbroj svih relativnih brojeva u jednom statistikom nizu je 1 ili


100, ili 1000, u ovisnosti o tome kako je relativni broj izraen.
Relativni brojevi strukture se grafiki mogu prikazivati pomou
strukturnih stupaca, strukturnih krugova, polukrugova ili nekim drugim
geometrijskim likom. Pri tom se za usporedbu dvaju ili vie statistikih
nizova konstruiraju geometrijski likovi jednakih povrina, jer je zbroj
relativnih frekvencija uvijek isti.
Analitiki primjer 2.1.
Statistiki nizovi "prosjean broj nezaposlenih osoba u RH, 1995.
i 2002. godine" prema redoslijednom obiljeju "struna sprema",
prikazani su u tablici 2.2.
a)
Zadatak je izraunati strukturu nezaposlenih osoba prema strunoj
spremi za 1995. i 2003. godinu.
b)
Zadatak je strukturu nezaposlenih osoba prema strunoj spremi za
1995. i 2003. godinu prikazati na grafikonu pomou strukturnih stupaca
uz sve potrebne oznake.
Rjeenje 2.1.
a)
U tablici 2.3. u posljednja 2 stupca prikazana je struktura
nezaposlenih osoba prema strunoj spremi za 1995. i 2003. godinu.
Na primjer: fr11 =

f 11
6

f 1i

i =1

44

100 =

51367
100 = 20,62% ,
249070

Ureivanje i prikazivanje podataka

to znai da je 1995. godine udio niskokvalificiranih radnika (NKV) u


ukupnom broju nezaposlenih bio 20,62%.
Tablica 2.3.
Prosjean broj nezaposlenih osoba u RH prema strunoj spremi, 1995. i
2003. godine
Prosjean broj
Struktura u %
nezaposlenih osoba
Struna sprema 1995. god. 2003. god. 1995. god. 2002. god.
f1i
f2i
fr1i
fr2i
NKV
51367
58939 20,62352
18,4945
PKV;NSS
36453
56957 14,63564 17,87256
KV,VKV
87172
105728
34,999 33,17644
SSS
57276
76087 22,99594 23,87537
VS
7346
9891 2,949372 3,103701
VSS
9456
11082 3,796523 3,477426
Ukupno:
249070
318684
100
100
Izvor: Statistiki ljetopis Republike Hrvatske, 2005. godina, str. 177.

b)
Na slici 2.1. prikazana je struktura nezaposlenih osoba prema
strunoj spremi za 1995. i 2003. godinu.
Slika 2.1.
Prosjean broj nezaposlenih u RH prema strunoj spremi
100%

80%
struktura u %

V SS
V S

60%

SSS
KV ,V KV

40%

PKV ;NSS
NKV

20%

0%
1995. god.

2002. god.

Izvor: Statistiki ljetopis Republike Hrvatske, 2005. godina, str. 177.

45

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

2.4. Grafiko prikazivanje statistikih nizova


Uz statistike tablice pomono sredstvo u analizi statistikih
nizova su grafiki prikazi.
Grafikonima se na jednostavan i pregledan nain uz pomo
razliitih geometrijskih likova prezentiraju osnovne karakteristike
statistikih nizova.
Grafiki prikazi statistikih podataka su pregledniji i razumljiviji
u odnosu na njihovo prikazivanje statistikom tablicom. Grafikoni
omoguuju jednostavnije uoavanje glavnih karakteristika promatranih
pojava, ali vrlo esto ta preglednost ide na tetu preciznosti statistikih
informacija. Stoga je poeljno uz grafiki prikaz prezentirati i tablicu s
originalnim vrijednostima statistikog niza. Suvremeni statistiki
programski paketi, a izmeu njih i SPSS, naravno u skladu sa
statistikom teorijom, imaju mnotvo mogunosti kreiranja grafikih
prikaza. Pomou njih se mogu odabrati razliite boje, oblici i linije na
grafikonu, to omoguuje jo zorniji prikaz promatrane pojave.
Oznake na grafikonu moraju biti takve da onaj tko ita grafikon
moe jasno raspoznati koji su elementi i koja je pojava prikazana. Stoga i
grafikon mora imati naslov, jedinice mjere promatranog obiljeja,
oznake modaliteta obiljeja, izvor podataka i po potrebi kazalo ili
tuma oznaka.
Postoje tri skupine grafikih prikaza:
1) povrinski grafikoni
2) linijski grafikoni i
3) kartogrami.
Analitiki primjer 2.2.
Statistiki skup "Zaposleni u pravnim osobama u RH, stanje 31.
oujka 2004. god.", prema redoslijednom obiljeju "stupanj strunog
obrazovanja" prikazan je u tablici 2.3.
a)
Zadatak je zaposlene u pravnim osobama u RH prema stupnju
strunog obrazovanja za 2004. godinu prikazati na grafikonu pomou
jednostavnih stupaca uz sve potrebne oznake.
46

Ureivanje i prikazivanje podataka

Tablica 2.4.
Zaposleni u pravnim osobama u RH prema stupnju strunog
obrazovanja, stanje 31. oujka 2004. god.
Stupanj strunog
Broj
obrazovanja
zaposlenih
NKV
97516
PKV
35948
KV
146161
VKV
30626
nie
36510
srednje
453710
vie
82283
visoko
163417
Ukupno:
1046171
Izvor: Statistiki ljetopis Republike Hrvatske,2005. godina, str. 136.-137.

Rjeenje 2.2.
a)
Na slici 2.2 prikazani su zaposleni u pravnim osobama u RH
prema stupnju strunog obrazovanja za 2004. godinu.
Slika 2.2.
Zaposleni u pravnim osobama u RH pre ma stupnju
strunog obra zovanja, stanje 31.03.2004.

Broj zaposlenih

500000
400000
300000
200000
100000
0
NKV

PKV

KV

V KV

nie

srednje

vie

visoko

Stupanj s trunog obrazovanja

Izvor: Statistiki ljetopis Republike Hrvatske,2005. godina, str. 136.-137.

Na slici 2.2 jasno se vidi da je u Republici Hrvatskoj u pravnim


osobama, na dan 31. 03. 2004., najvie bilo zaposlenih sa srednjim

47

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

stupnjem obrazovanja, dok je onih u kategoriji VKV, odnosno


visokokvalificiranih radnika bilo najmanje.
Analitiki primjer 2.3.
Statistiki skup, "Stanovnitvo Republike Hrvatske, popis 2001.
godine" prema obiljejima "spol i aktivnost" podijeljen je na grupe i
zadan je u tablici 2.5.
a)
Zadatak je napraviti strukturne krugove za stanovnitvo mukog
i enskog spola prema obiljeju "aktivnost".
Tablica 2.5.
Mukarci i ene u RH prema aktivnosti, popis 2001. godine
Stanovnitvo (u 000)
Mukarci
ene
f2i
f1i

Stupnjevi struktur. kruga


Mukarci
ene
0
S 1i
S02i

Aktivnost
Aktivno
stanovnitvo
1005,4
819,8
178,3854
132,9885
Osobe ss osobnim
prihodima
490,6
639
87,04584
103,659
Uzdravano
stanovnitvo
533
760,4
94,56875
123,3526
Ukupno
2029
2219,2
360
360
Izvor: Statistiki ljetopis Republike Hrvatske,2005. godina, str. 100.

Rjeenje 2.3.
a)
U tablici 2.5 uz originalne apsolutne frekvencije dani su i
stupnjevi strukturnoga kruga. Stupnjevi strukturnoga kruga raunaju se na
sljedei nain:
S 0i =

fi
N

360 0 .

(2.14)

fi

i =1

Na slici 2.3 pomou strukturnih krugova prikazani su mukarci i


ene u Republici Hrvatskoj prema aktivnosti (popis 2001.).
U stupcu tablice 2.5. za muki spol:

48

Ureivanje i prikazivanje podataka

f 11

S 0 11 =

360 0 =

f 1i

1005,4
360 0 = 178,385 0 ,
2029

i =1

to odgovara odreenom dijelu 1. strukturnoga kruga na lici 2.3.


U stupcu tablice 2.5. za enski spol:
S 0 22 =

f 22
3

f 2i

360 0 =

639
360 0 = 103,659 0 ,
2219,2

i =1

to odgovara odreenom dijelu 2. strukturnoga kruga na slici 2.3.


Slika 2.3.
Mukarci i ene u Republici Hrvatskoj prema aktivnosti (popis 2001.)

Izvor: Statistiki ljetopis Republike Hrvatske,2005. godina, str. 100.

Iz slike 2.3. jasno se vidi da je kod mukaraca bilo najvie


aktivnog stanovnitva, dok je kod ena aktivno stanovnitvo samo malo
vee od uzdravanog stanovnitva.
Analitiki primjer 2.4.
Zadan je statistiki skup, "Zasijane povrine u oranicama" prema
prostornom obiljeju "upanije u RH".
a)

Zadatak je zadani skup prikazati pomou statistike karte.

49

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Rjeenje 2.4.
a)
Statistiki skup, "Zasijane povrine u oranicama" prema
prostornom obiljeju "upanije u RH" prikazan je na slici 2.4.
Slika 2.4.
Udio zasijanih povrina u oranicama po upanijama u RH, 2002. god.

Izvor: Statistiki ljetopis Republike Hrvatske, 2003. godina, str. 673.

Na slici 2.4 vidi se udio zasijanih povrina u oranicama u


Republici Hrvatskoj prikazan po upanijama. Na zemljovidu su
sjenanjem prikazani intenziteti vrijednosti pojave po modalitetima
obiljeja, tj. po upanijama. Tako su one upanije s manjim udjelom
zasijane povrine u oranicama slabije osjenane, dok su one s veim
udjelom zasijane povrine jae osjenane.

50

Ureivanje i prikazivanje podataka

Analitiki primjer 2.5.


Zadani su podaci o spolu i deparcu uzorka studentske populacije
na jednom sveuilitu.
a)

Zadatak je formirati i komentirati apsolutne frekvencije varijabli:


- spol,
- "grupirani" deparac.
Rjeenje 2.5.

a)
U programskom paketu SPSS apsolutne frekvencije se mogu
formirati na 2 naina.
I. nain:
Potrebno je na glavnom izborniku odabrati Analyze, a na njegovu
padajuem izborniku odabrati Tables. Dalje se bira Tables of
Frequencies. Najprije se varijabla v1 - Spol prebaci u polje Frequencies
for:. Klikom na OK u Outputu programa SPSS dobije se tablica
frekvencija uzorka prema obiljeju, odnosno varijabli spol. Rezultat je
prikazan u tablici 2.6.
Tablica 2.6.
Ispitanici prema spolu
Spol
Count
Musko

94

Zensko

144

Izvor: Simulirani podaci.

Prva frekvencija u tablici 2.6. znai da je meu ispitanicima bilo


94 studenta. Druga frekvencija u tablici 2.6. znai da je meu
ispitanicima bilo 144 studentice.
II. nain:
Potrebno je na glavnom izborniku odabrati Analyze, a na njegovu
padajuem izborniku odabrati Descriptive Statistics. Dalje se bira
Frequencies. U ovom sluaju se mogu obje varijable v1 - Spol i v2 -

51

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Grupirani deparac prebaciti u polje Variable(s). Konani izgled prozora


Frequencies s odabranim varijablama prikazan je na slici 2.5.
Slika 2.5.
Prozor "Frequencies" iz izbornika "Descriptive Statistics" s odabranim
varijablama v1 i v2

Izvor: Simulirani podaci.

Klikom na OK u Outputu programa SPSS dobije se tablica


frekvencija uzorka prema odabranim obiljejima, odnosno varijablama.
Rezultat je prikazan u tablicama 2.7 i 2.8.
Tablica 2.7.
Ispitanici prema obiljeju: Spol
Valid

Missing

Valid Percent
39,5

Cumulative
Percent
39,5

60,3

60,5

100,0

99,6

100,0

Frequency
94

Percent
39,3

Zensko

144

Total

238

Musko

System

Total

,4

239

100,0

Izvor: Simulirani podaci.

Prva frekvencija u stupcu Frequency u tablici 2.7. znai da je


meu ispitanicima bilo 94 studenta. Druga frekvencija istog stupca znai
da je meu ispitanicima bilo 144 studentice. Na postavljeno pitanje je
52

Ureivanje i prikazivanje podataka

odgovorilo 238 ispitanika, dok frekvencija 1 iz retka Missing System


znai da 1 ispitanik nije dao odgovor na pitanje o njegovom spolu. Stupac
Percent prikazuje relativne frekvencije u postotcima za valjane podatke
ukljuujui i one koji nedostaju. Stupac Valid Percent prikazuje
originalne valjane frekvencije u postotcima. Prvi podatak iz tog stupca
pokazuje da je meu onima koji su odgovorili na pitanje o spolu bilo
39,5% mukog spola, a 60,5 enskog spola.
Tablica 2.8.
Ispitanici prema obiljeju: Grupirani dzeparac

Valid

200,00

Frequency
73

Percent
30,5

Valid Percent
42,2

Cumulative
Percent
42,2

400,00

52

21,8

30,1

72,3

600,00

30

12,6

17,3

89,6

800,00

2,5

3,5

93,1

1000,00

2,9

4,0

97,1

3500,00

2,1

2,9

100,0

173

72,4

100,0

66

27,6

239

100,0

Total
Missing

System

Total

Izvor: Simulirani podaci.

Prva frekvencija u stupcu Frequency u tablici 2.8 znai da je


meu ispitanicima bilo 73 studenta s deparcem od 200 kn ili manje.
Druga frekvencija istog stupca znai da je meu ispitanicima bilo 52
studenta s deparcem izmeu 201 kn i 400 kn itd. Na postavljeno pitanje
je odgovorilo 173 ispitanika, dok frekvencija 66 iz retka Missing System
znai da 66 ispitanika nije dalo odgovor na pitanje o njihovu deparcu.
Stupac Percent prikazuje relativne frekvencije u postotcima za valjane
podatke ukljuujui i one koji nedostaju. Stupac Valid Percent prikazuje
originalne valjane frekvencije u postocima. Prvi podatak iz tog stupca
pokazuje da je meu onima koji su odgovorili na pitanje o deparcu bilo
42,2% studenata s deparcem od 200 kn ili manje itd.
Ovaj II nain prikaza frekvencija u programu SPSS je detaljniji,
jer osim apsolutnih prikazuje i relativne frekvencije.

53

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Analitiki primjer 2.6.


Zadatak je za sve ispitanike od varijable "Prosjena ocjena u
srednjoj koli" (v1) formirati novu varijablu "Grupirana ocjena u srednjoj
koli" (v2) po principu koji je prikazan u tablici 2.9.
Tablica 2.9.
Princip formiranja nove varijable grupirana ocjena u srednjoj koli (v2)
Grupe

1
2
3
4

Prosj. ocjena
u sred. koli
2,00-2,49
2,50-3,49
3,50-4,49
4,50-5,00

Nova
vrijednost
2
3
4
5

Izvor: Simulirani podaci.

Rjeenje 2.6:
Da bi se pomou varijable v1 - "Prosjena ocjena u srednjoj koli"
formirala nova varijabla v2 - "Grupirana ocjena u srednjoj koli" po
principu koji je prikazan u tablici 2.8, potrebno je na glavnom izborniku
odabrati Transform, a u njegovu padajuem izborniku odabrati Recode.
U njegovu izborniku bira se Into Different Variables (jer bi se odabirom
Into Same Variables izgubila postojea varijabla). U polje Numeric
Variable bira se v1 - "Prosjena ocjena u srednjoj koli", a u Outut
Variable, Name je v2, a Label "Grupirana ocjena u srednjoj koli".
Odabirom ikone Old and New Values otvara se novi prozor
Recode into Different Variables. Aktiviranjem opcije Range upisuju se
odgovarajue grupe ocjena, kako je zadano u tablici 2.8. Nakon
upisivanja svakog pojedinog Range, upisuje se odgovarajua New Value,
koja se svaki put kao nova grupa dodaje klikom na ikonu Add. Nakon to
su unesene sve grupe ikonom Continue, zatim Change i OK, u novom
stupcu Data View, kreirat e se nova varijabla "Grupirana ocjena u
srednjoj koli", odnosno v2. (Princip je slian kao u analitikom primjeru
1.9.)

54

Ureivanje i prikazivanje podataka

Na slici 2.6 prikazan je prozor Recode into Different Variables:


Old and New Values.
Slika 2.6.
Prozor "Recode into Different Variables: Old and New Values", pomou
kojih se kreira nova varijabla v2 - Grupirana ocjena u srednjoj koli

Izvor: Simulirani podaci.

Analitiki primjer 2.7.


Zadatak je komentirati apsolutne i relativne frekvencije varijable:
Grupirana ocjena u srednjoj koli (v2).
Rjeenje 2.7:
Potrebno je na glavnom izborniku odabrati Analyze, a na njegovu
padajuem izborniku odabrati Descriptive Statistics. Dalje se bira
Frequencies, gdje se u dio prozora Variable(s) klikom na strelicu prebaci
varijabla v2 - Grupirana ocjena u srednjoj koli. Konani izgled prozora
Frequencies s odabranom varijablom prikazan je na slici 2.7.

55

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slika 2.7.
Prozor "Frequencies" iz izbornika "Descriptive Statistics" s odabranom
varijablom v2

Izvor: Simulirani podaci.

Klikom na OK u Outputu programa SPSS dobije se tablica


frekvencija uzorka prema odabranom obiljeju, odnosno varijabli.
Rezultat je prikazan u tablici 2.10.
Tablica 2.10.
Ispitanici prema: Grupirana ocjena u srednjoj skoli
Valid

Missing

Frequency
1

Percent
,4

Valid Percent
,4

Cumulative
Percent
,4

3,00

34

14,2

14,3

14,7

4,00

113

47,3

47,5

62,2

5,00

90

37,7

37,8

100,0

Total

238

99,6

100,0

,4

239

100,0

2,00

System

Total

Izvor: Simulirani podaci.

Prva frekvencija u stupcu Frequency u tablici 2.10 znai da je


meu ispitanicima bio 1 student s ocjenom 2 u srednjoj koli. Druga
frekvencija istog stupca znai da je meu ispitanicima bilo 34 studenta s

56

Ureivanje i prikazivanje podataka

ocjenom 3, ... itd. Na postavljeno pitanje je odgovorilo 238 ispitanika,


dok frekvencija 1 iz retka Missing System znai da 1 ispitanik nije dao
odgovor na pitanje o ocjeni u srednjoj koli. Stupac Percent prikazuje
relativne frekvencije u postotcima za valjane podatke ukljuujui i one
koji nedostaju. Stupac Valid Percent prikazuje originalne valjane
frekvencije u postotcima. Trei podatak iz tog stupca pokazuje da je
47,5% studenata imalo prosjenu ocjenu u srednjoj koli 4.

Analitiki primjer 2.8.


Zadatak je izmeu svih ispitanika odabrati samo one koji su
enskog spola.
Rjeenje 2.8:
U glavnom izborniku bira se Data, a na njegovu padajuem
izborniku Select Cases, gdje je potrebno aktivirati opciju If condition is
satisfied kako je prikazano na slici 2.8.
Slika 2.8.
Prozor "Select Cases" s aktiviranom opcijom "If condition is satisfied"

Izvor: Simulirani podaci.


57

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Klikom na ikonu If... otvara se novi prozor Select cases: If, kako
je prikazano na slici 2.9.
Slika 2.9.
Prozor "Select Cases: If" s naznaenim uvjetom v1=2

Izvor: Simulirani podaci.

Strelicom se varijabla v1 prebaci u odgovarajue polje i izjednai


s 2, jer je uvjet da se biraju samo oni ispitanici enskog spola, a enski
spol je pri kodiranju oznaen s 2. Klikom na Continue i OK, u dodatnom
stupcu Data View javlja se nova varijabla filter_$, gdje su s 1 oznaena
polja ispitanika enskog spola, a s 0 polja ispitanika mukog spola.
Naravno, dok je filter aktivan program SPSS u svim svojim
analizama uvaava samo polja oznaena u filteru s 1, odnosno
ispitanike enskog spola. Stupac filter_$ moe se vidjeti na slici 2.10.
Slika 2.10.
"Data View" sa stupcem "filter_$"

Izvor: Simulirani podaci.


58

Ureivanje i prikazivanje podataka

Analitiki primjer 2.9.


Zadatak je komentirati apsolutne i relativne frekvencije varijable:
Grupirana ocjena u srednjoj koli (v2) samo za enski spol.
Rjeenje 2.9:
Nakon to je izvrena selekcija ispitanika enskog spola (kako je
objanjeno u 2.8), potrebno je na glavnom izborniku odabrati Analyze, a
na njegovu padajuem izborniku Descriptive Statistics. Dalje se bira
Frequencies, gdje se u dio prozora Variable(s) klikom na strelicu prebaci
varijabla v2 - Grupirana ocjena u srednjoj koli. Klikom na OK u
Outputu programa SPSS dobije se tablica frekvencija uzorka prema
odabranom obiljeju, odnosno varijabli. Rezultat je prikazan u tablici
2.11 gdje su dani rezultati samo za enski spol.
Tablica 2.11.
Ispitanici prema: Grupirana ocjena u srednjoj skoli (enski spol)
Valid

Cumulative
Percent
13,9

3,00

Frequency
20

Percent
13,9

Valid Percent
13,9

4,00

59

41,0

41,0

54,9

5,00

65

45,1

45,1

100,0

Total

144

100,0

100,0

Izvor: Simulirani podaci.

Prva frekvencija u stupcu Frequency u tablici 2.11 znai da je


meu ispitanicima enskog spola bilo 20 njih s ocjenom 3 u srednjoj
koli. Druga frekvencija istog stupca znai da je meu ispitanicima bilo
59 studentica s ocjenom 4, a njih 65 s ocjenom 5. U analizi je ukupno bilo
144 ispitanika enskog spola. Stupac Percent prikazuje relativne
frekvencije u postotcima za valjane podatke. Kako se vidi iz tablice,
njegove vrijednosti odgovaraju onima iz stupca Valid Percent. Trea
proporcija ili relativna frekvencija pokazuje da su 45,1% studentica u
odnosu na sve 144 studentice imala prosjenu ocjenu u srednjoj koli 5.

59

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Analitiki primjer 2.10.


Zadatak je iz postojee baze podataka svih ispitanika odabrati
sluajni uzorak od 60% ispitanika.
Rjeenje 2.10:
U glavnom izborniku bira se Data, a na njegovu padajuem
izborniku Select Cases, gdje je potrebno aktivirati opciju Random
sample of cases kako je prikazano na slici 2.11.
Slika 2.11.
Prozor "Select Cases" s aktiviranom opcijom "Random sample of cases"

Izvor: Simulirani podaci.

Klikom na ikonu Sample... otvara se novi prozor Select Cases:


Random Sample, kako je prikazano na slici 2.12. U tom prozoru
potrebno je aktivirati Approximately i naznaiti 60% of all cases. Klikom
na Continue i OK, u dodatnom stupcu Data View javlja se nova varijabla
filter_$, gdje su s 1 oznaena polja sluajno odabranih 60% ispitanika, a
sa 0 polja 40% ispitanika koji nee biti ukljueni u daljnju analizu.
Naravno, dok je filter aktivan program SPSS u svim svojim
analizama uvaava samo polja oznaena u filteru s 1.

60

Ureivanje i prikazivanje podataka

Slika 2.12.
Prozor "Select Cases: If" s naznaenim uvjetom v1=2

Izvor: Simulirani podaci.

Analitiki primjer 2.11.


Zadatak je komentirati apsolutne i relativne frekvencije varijable :
Grupirana ocjena u srednjoj koli (v2) za 60% sluajno odabranih
ispitanika.
Rjeenje 2.11:
Nakon to je izvrena sluajna selekcija 60% ispitanika (kako je
objanjeno u 2.10), potrebno je na glavnom izborniku odabrati Analyze, a
na njegovu padajuem izborniku Descriptive Statistics. Dalje se bira
Frequencies, gdje se u dio prozora Variable(s) klikom na strelicu prebaci
varijabla v2 - Grupirana ocjena u srednjoj koli. Klikom na OK u
Outputu programa SPSS dobije se tablica frekvencija uzorka prema
odabranom obiljeju, odnosno varijabli. Rezultat je prikazan u tablici
2.10, gdje su dani rezultati samo za 60% sluajno odabranih ispitanika.
Prva frekvencija u stupcu Frequency u tablici 2.12 znai da je
izmeu 60% sluajno odabranih ispitanika bio 1 s ocjenom 2 u srednjoj
koli. Druga frekvencija istog stupca znai da je meu tim ispitanicima
bilo 17 s ocjenom 3, njih 75 s ocjenom 4, a 49 s ocjenom 5. Sluajno
odabranih 60% ispitanika ima 143, a od toga 1 nije odgovorio na
postavljeno pitanje.

61

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Tablica 2.12.
Ispitanici prema: Grupirana ocjena u srednjoj skoli
Valid

Missing

2,00

Frequency
1

Percent
,7

Valid Percent
,7

Cumulative
Percent
,7

3,00

17

11,9

12,0

12,7

4,00

75

52,4

52,8

65,5

5,00

49

34,3

34,5

100,0

Total

142

99,3

100,0

,7

143

100,0

System

Total

Izvor: Simulirani podaci.

Stupac Percent prikazuje relativne frekvencije u postotcima za


valjane podatke. Druga proporcija ili relativna frekvencija pokazuje da je
od 60% ispitanika njih 12% imalo prosjenu ocjenu u srednjoj koli 3.

Analitiki primjer 2.12.


Zadatak je formirati grafikon jednostavnih stupaca za varijablu:
Spol (v1).
Rjeenje 2.12:
Grafikon jednostavnih stupaca za odabranu varijablu u programu
SPSS moe se nacrtati na dva naina:
I. nain:
Potrebno je na glavnom izborniku odabrati Analyze, a na njegovu
padajuem izborniku Descriptive Statistics. Dalje se bira Frequencies,
gdje se u dio prozora Variable(s) klikom na strelicu prebaci varijabla v1 Spol. Odabirom ikone Charts otvara se novi prozor Frequencies: Charts,
gdje je potrebno aktivirati Bar charts. Klikom na Continue i OK u
Outputu programa SPSS uz sve frekvencije dobije se i traeni grafikon.

62

Ureivanje i prikazivanje podataka

Slika 2.13.
Prozori "Frequencies" i "Frequencies: Charts" s odabranim "Bar Charts" i
varijablom Spol (v1)

Izvor: Simulirani podaci.

Slika 2.14.
Ispitanici prema spolu (v1)

150

Frequency

120

90

60

30

0
Musko

Zensko

Spol

Izvor: Simulirani podaci.

63

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Prema slici 2.14 vidi se da je meu ispitanicima vie onih enskog


spola, preciznije njih 144, a onih mukog spola ima 94.
II. nain:
Potrebno je na glavnom izborniku odabrati Graphs, a na njegovu
padajuem izborniku Bar chart, na kojem se aktivira ikona Simple. To je
prikazano na slici 2.15.
Slika 2.15.
Prozori "Bar Charts" s aktiviranim "Simple" grafikonima

Izvor: Simulirani podaci.

Odabirom ikone Define otvara se prozor Define Simple Bar:


Summaries for Groups of Cases, gdje se u prostor Category Axis prebaci
eljena varijabla, to je u ovom sluaju Spol (v1). Grafikonu se moe
definirati i naslov na nain da se klikne na ikonu Titles... Klikom na OK u
Outputu programa SPSS dobije se traeni grafikon koji je identian
onome prikazanom na slici 2.14.

Analitiki primjer 2.13.


Zadatak je formirati grafikon strukturni krug za varijablu: Spol
(v1).

64

Ureivanje i prikazivanje podataka

Rjeenje 2.13:
Grafikon strukturnoga kruga za odabranu varijablu u programu
SPSS moe se nacrtati na dva naina:
I. nain:
Potrebno je na glavnom izborniku odabrati Analyze, a na njegovu
padajuem izborniku Descriptive Statistics. Dalje se bira Frequencies,
gdje se u dio prozora Variable(s) klikom na strelicu prebaci varijabla v1 Spol. Odabirom ikone Charts otvara se novi prozor Frequencies: Charts,
gdje je potrebno aktivirati Pie charts. Klikom na Continue i OK u
Outputu programa SPSS uz sve frekvencije dobije se i traeni grafikon.
Slika 2.16.
Ispitanici prema spolu (v1)
Spol

Musko
Zensko
Missing

Izvor: Simulirani podaci.

Prema slici 2.16 vidi se da je meu ispitanicima vie onih enskog


spola. Moe se vidjeti da su na ovom grafikom prikazu ukljueni svi
ispitanici, pa i oni koji nisu dali odgovor na pitanje o spolu.

65

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

II. nain:
Potrebno je na glavnom izborniku odabrati Graphs, a na njegovu
padajuem izborniku Pie chart, na kojem se aktivira Summaries of
groups of case. To je prikazano na slici 2.17.
Slika 2.17.
Prozor "Pie Charts" s aktiviranim "Summaries of groups of case"

Izvor: Simulirani podaci.

Odabirom ikone Define otvara se prozor Define Pie: Summaries


for Groups of Cases, gdje se u prostor Define Slices by prebaci eljena
varijabla, to je u ovom sluaju Spol (v1). Grafikonu se moe definirati i
naslov, na nain da se klikne na ikonu Titles... Klikom na OK u Outputu
programa SPSS dobije se traeni grafikon koji je slian onome
prikazanom na slici 2.16, samo to ne sadri ispitanike koji nisu
odgovorili na pitanje o spolu (Missing).

Analitiki primjer 2.14.


Za sve ispitanike zadatak je:
a)
Izraunati ukupan deparac po obitelji (v4) ako sva djeca u jednoj
obitelji dobivaju jednak iznos novca.
b)
Prikazati varijablu grupiranog deparca (v2) grafiki pomou
jednostavnih stupaca.
c)

66

Objasniti grafikon pod (b)!

Ureivanje i prikazivanje podataka

Rjeenje 2.14:
a)
Za sve ispitanike potrebno je izraunati ukupan deparac po
obitelji uz pretpostavku da sva djeca u jednoj obitelji imaju jednak
deparac. Dakle, da bi se dobio ukupan deparac po obitelji za svakog
ispitanika, potrebno je deparac ispitanika (v1) pomnoiti s brojem djece
u svakoj obitelji (v3).
Da bi se pomou postojeih numerikih varijabli izraunala nova
numerika varijabla, potrebno je na glavnom izborniku odabrati
Transform, a u njegovu padajuem izborniku Compute. Na ekranu se
pojavi prozor Compute Variable.
U polje Target Variable potrebno je unijeti ime nove varijable v4,
dok se u Numeric Expression unosi izraz po kojem se iz postojeih
varijabli kreira nova varijabla na sljedei nain:
v 4 = v1 v3 .

(2.15)

Nakon to se klikne ikona OK, nova varijabla v4 automatski se


formira u dodatnom stupcu u Data View programa SPSS. Nova varijabla
se moe vidjeti na slici 2.18.
Slika 2.18.
"Data view" s novom varijablom v4

Izvor: Simulirani podaci.


67

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

U Variable View potrebno je na odgovarajui nain definirati tu


novu varijablu te u stupcu Label naznaiti da je to "Ukupan deparac po
obitelji". Ta nova varijabla je numerika i ima skalu mjerenja Scale.
b)
Potrebno je na glavnom izborniku odabrati Graphs, a na njegovu
padajuem izborniku Bar char, na kojem se aktivira ikona Simple.
Odabirom ikone Define otvara se prozor Define Simple Bar:
Summaries for Groups of Cases, gdje se u prostor Category Axis prebaci
eljena varijabla, to je u ovom sluaju Grupirani deparac (v2).
Grafikonu se moe definirati i naslov na nain da se klikne na ikonu
Titles... Klikom na OK u Outputu programa SPSS dobije se traeni
grafikon koji je prikazan na slici 2.19.
Slika 2.19.
Ispitanici prema grupiranom dzeparcu

80

Count

60

40

20

0
200,00

400,00

600,00

800,00

Grupirani dzeparac

Izvor: Simulirani podaci.

68

1000,00

3500,00

Ureivanje i prikazivanje podataka

c)
Na grafikonu se moe vidjeti da najvei broj ispitanika ima
deparac do 200 kn. Kako raste visina deparca, smanjuje se broj
ispitanika koji ima toliki deparac.

Analitiki primjer 2.15.


Za sve ispitanike potrebno je:
a)
Grupirati varijablu Visina u cm (v2) u Grupiranu visinu (v3) po
principu:
- 160
160
- 170
- 180
- 190
- 200
- 210

170
180
190
200
210.

b)
Prikazati varijablu grupirane visine (v3) grafiki pomou linijskog
grafikona.
c)

Objasniti grafikon pod (b)!


Rjeenje 2.15:

a)
Da bi se pomou varijable v2 - "Visina u cm" formirala nova
varijabla v3 - "Grupirana visina " po principu koji je prikazan u zadatku
pd (a), potrebno je na glavnom izborniku odabrati Transform, a u
njegovu padajuem izborniku odabrati Recode. U njegovu izborniku bira
se Into Different Variables (jer bi se odabirom Into Same Variables
izgubila postojea varijabla). U polje Numeric Variable bira se v2 "Visina u cm", a u Output Variable, Name je v3, a Label "Grupirana
visina".
Odabirom ikone Old and New Values otvara se novi prozor
Recode into Different Variables. Aktiviranjem opcije Range: Lowest
through upisuju se odgovarajue grupe ocjena kako je prikazano na slici
2.20.

69

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slika 2.20.
Prozor "Recode into Different Variables: Old and New Values", pomou
kojih se kreira nova varijabla v3 - Grupirana visina

Izvor: Simulirani podaci.

Nakon upisivanja svakog pojedinog Range: Lowest through, upisuje se i


odgovarajua New Value, koja se svaki put kao nova grupa dodaje
klikom na ikonu Add. Nakon to su unesene sve grupe ikonom Continue,
zatim Change i OK, u novom stupcu Data View, kreirat e se nova
varijabla "Grupirana visina", odnosno v3.
b)
Potrebno je na glavnom izborniku odabrati Graphs, a na njegovu
padajuem izborniku Line chart na kojem se aktivira ikona Simple.
Odabirom ikone Define otvara se prozor Define Simple Bar:
Summaries for Groups of Cases, gdje se u prostor Category Axis prebaci
eljena varijabla, to je u ovom sluaju Grupirana visina (v3). Grafikonu
se moe definirati i naslov na nain da se klikne na ikonu Titles... Klikom
na OK u Outputu programa SPSS dobije se traeni grafikon koji je
prikazan na slici 2.21.

70

Ureivanje i prikazivanje podataka

Slika 2.21.
Ispitanici prema "grupiranoj visini"

120

100

Count

80

60

40

20

0
160,00

170,00

180,00

190,00

200,00

210,00

Grupirana visina

Izvor: Simulirani podaci.

c)
Na grafikonu se moe vidjeti da najvei broj ispitanika ima visinu
180 cm. Kako se visina smanjuje ili poveava, smanjuje se broj ispitanika
koji ima toliku visinu.
2.5. Relativni brojevi koordinacije i indeksi
Relativni brojevi koordinacije pokazuju odnos dviju pojava ili
frekvencija u razliitim statistikim nizovima, koje mogu imati
razliitu jedinicu mjere, a koje ima smisla usporeivati.
Raunaju se:
Ri =

Ai
, i = 1,2,..., k
Bi

(2.16)

gdje je:
71

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Ai - veliina koja se usporeuje


Bi - veliina s kojom se Ai usporeuje.
Grafiki prikaz relativnih brojeva koordinacije je tzv. Varzarov
znak. To su stupci, odnosno pravokutnici, ija baza na apscisi odgovara
nazivniku (Bi), a visina relativnom broju koordinacije (Ri). Ako se zna da
je povrina stupca (pravokutnika) baza visina, moe se zakljuiti da
povrina odgovara brojniku (Ai), tj. veliini koja se usporeuje.
Analitiki primjer 2.16.
Statistiki nizovi "povrine i stanovnitvo u odabranim zemljama
2001. godine" prema nominalnom prostornom obiljeju "zemlje",
prikazani su u tablici 2.13. Zadatak je izraunati broj stanovnika po km2.
Tablica 2.13.
Povrine i stanovnitvo u odabranim zemljama 2001. godine
Stanovnitvo Povrina
u 000
u km2 Br.stan./km2
Ai
Bi
Ri
Hrvatska
4437
56594
78,40054
Slovenija
1930
20273
95,20051
Austrija
8151
83871
97,18496
Maarska
10106
93032
108,6293
Bosna i Hercegovina
3922
51197
76,60605
Izvor: Statistiki ljetopis Republike Hrvatske, 2003. godina, str. 743.
Zemlje

Rjeenje 2.16.
U posljednjem stupcu tablice 2.13 izraunat je broj stanovnika po
km za svaku zemlju, odnosno izraunati su relativni brojevi
koordinacije.
2

Na primjer, za Republiku Hrvatsku:


R1 =

A1 4437000
2
=
= 78,40 stan/km .
56594
B1

Rezultat se moe komentirati: u Republici Hrvatskoj je po km2 bilo


prosjeno 78,40 stanovnika u 2001. godini. Najveu gustou naseljenosti
72

Ureivanje i prikazivanje podataka

od promatranih zemalja imala je Maarska (108,63 stan/km2), a najniu


Bosna i Hercegovina (76,61 stan/km2).
Potrebno je napomenuti da je stanovnitvo u tablici dano u
tisuama, pa su kod raunanja za vrijednosti Ai dodane tisue.
Indeksima niza kvalitativnih podataka usporeuje se smjer i
intenzitet varijacija frekvencija nekog statistikog niza s takvim
varijacijama drugoga statistikog niza.
Raunaju se tako da se svaki lan promatranog niza stavi u odnos
prema odabranoj bazi, koja moe biti jedan od lanova niza ili neka druga
zadana veliina.
Ii =

fi
100, i = 1,2,..., k .
B

(2.17)

Dakle, prema izrazu (2.17) indeksi se raunaju kao omjer


frekvencije promatranog niza i odabrane baze (B).
Grafiki prikaz indeksa kvalitativnih nizova su jednostavni stupci
koji imaju jednake baze, jer se ovdje lanovi niza usporeuju uvijek s
istom veliinom. Specifinost ovog grafikona jest da se stupci naslanjaju
na bazu koja je jednaka 100.
Analitiki primjer 2.17.
Statistiki niz "prosjena godinja osobna potronja po kuanstvu
u kunama, RH, 2002. godine" prema nominalnom obiljeju "vrsta
potronje" prikazani su u tablici 2.14.
Zadatak je izraunati indekse potronje s bazom "potronja na
rekreaciju i kulturu".
Rjeenje 2.17.
U tablici 2.14. izraunati su indeksi za svaki pojedini modalitet
vrste potronje, a baza tih indeksa je potronja na rekreaciju i kulturu.
Indeksi su izraunati tako da je svaka apsolutna frekvencija niza stavljena
u odnos prema zadanoj bazi. Indeks uz bazu je uvijek = 100. Na
primjer, indeks za potronju na hranu i bezalkoholna pia je:

73

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

I1 =

f1
20816
100 =
100 = 500,99 .
B
4155

Tablica 2.14.
Prosjena godinja osobna potronja po kuanstvu u kunama, RH, 2002.
god.
Potronja
Indeksi
Vrsta potronje
fi
(Rekr. i kult.=100)
Hrana i bezalk. pia
20816
500,9868
Alkohol i duhan
2575
61,97353
Odjea i obua
5736
138,0505
Stanovanje
8875
213,5981
Pokustvo i odravanje
3573
85,99278
Zdravstvo
1442
34,70517
Rekreacija i kultura
4155
100
Hoteli i restorani
2049
49,31408
Izvor: Statistiki ljetopis Republike Hrvatske, 2003. godina, str. 185. i 186.

Indeksi se tumae u %, tako da se od njih oduzme 100. Moe


se zakljuiti da je potronja na hranu i bezalkoholna pia bila
( I 1 100 = 500,99 100 = 400,99% ) za 400,99% vea u odnosu na bazu,
odnosno na potronju za rekreaciju i kulturu.
Isto tako indeks za potronju na odjeu i obuu je:
I3 =

f3
5736
100 =
100 = 138,05 .
4155
B

Moe se zakljuiti da je potronja na odjeu i obuu bila


( I 3 100 = 138,05 100 = 38,05% ) za 38,05% vea u odnosu na bazu,
odnosno na potronju za rekreaciju i kulturu.
Na isti nain indeks za potronju na zdravstvo je:
I6 =

f6
1442
100 =
100 = 34,71 .
4155
B

Moe se zakljuiti da je potronja na zdravstvo bila


( I 6 100 = 34,71 100 = 65,29% ) za 65,29% manja u odnosu na potronju
za rekreaciju i kulturu.

74

Ureivanje i prikazivanje podataka

Slika 2.21.
Indeksi prosjene godinje osobne
potronje(Rekr. i kult.=100)
600
500

Indeksi

400
300
200

Hoteli i

restorani

kultura

Rekreacija i

odravanje

Pokustvo i

Stanovanje

obua

Odjea i

duhan

Alkohol i

pia

Hrana i bezalk.

Zdravstvo

100

Izvor: Statistiki ljetopis Republike Hrvatske, 2003. godina, str. 185. i 186.

Na slici 2.21 prikazani su izraunati indeksi. Na slici se vidi da su


to stupci naslonjeni na bazu 100. Ako je indeks vei od 100, stupac se
nalazi iznad baze, a ako je manji od 100, stupac je ispod baze. Tako se iz
grafikona jasno vidi za koliki postotak su pojedine kategorije prosjene
godinje osobne potronje vee ili manje od baze 100, tj. potronje na
rekreaciju i kulturu.

Analitiki primjer 2.18.


Ako je prosjeni deparac 372 kn, potrebno je za sve ispitanike:
a)
Izraunati indekse varijable deparac (v3) uzimajui za bazu
indeksa prosjeni deparac po ispitaniku.
Rjeenje 2.18:
Za sve ispitanike potrebno je izraunati indekse varijable deparac
(v3) uzimajui za bazu indeksa prosjeni deparac po ispitaniku koji
75

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

iznosi 372. Dakle, da bi se dobili ovi indeksi, potrebno je deparac


ispitanika (v2) podijeliti s bazom koja iznosi 372 i sve to prema jednadbi
(2.17) pomnoiti sa 100.
Da bi se pomou postojeih numerikih varijabli izraunala nova
numerika varijabla, potrebno je na glavnom izborniku odabrati
Transform, a u njegovu padajuem izborniku Compute. Na ekranu se
pojavi prozor Compute Variable.
U polje Target Variable potrebno unijeti ime nove varijable v3,
dok se u Numeric Expression unosi izraz po kojem se iz postojeih
varijabli kreira nova varijabla na sljedei nain:
v3 = (v 2 / 372) 100 .

Nakon to se klikne ikona OK, nova varijabla v3 automatski se


formira u dodatnom stupcu u Data View programa SPSS.
U Variable View potrebno je na odgovarajui nain definirati tu
novu varijablu te u stupcu Label naznaiti da su to "Indeksi deparca po
ispitaniku". Ta nova varijabla je numerika i ima skalu mjerenja Scale.

Analitiki primjer 2.19.


Zadatak je formirati dvostruku statistiku tablicu, gdje se varijabla
(obiljeje) spol (v1) mijenja po redcima (row), a varijabla (obiljeje)
grupirani deparac (v2) po stupcima (column):
a)
Formirati dvostruku statistiku tablicu bez zbirnih redaka i
stupaca.
b)
Formirati dvostruku statistiku tablicu sa zbirnim redcima i
stupcima.
c)
Nacrtati grafikon viestrukih
varijablama i komentirati sliku!

76

stupaca

prema

odabranim

Ureivanje i prikazivanje podataka

Rjeenje 2.19:
a)
Da bi se formirala dvostruka statistika tablica bez zbirnih redaka
i stupaca, potrebno je na glavnom izborniku izabrati ikonu Analyze, a na
njezinu padajuem izborniku Tables, i General Tables. Prema zahtjevu
zadatka pomou odgovarajuih strelica varijabla v1 - Spol se prebacuje u
polje Rows, a druga varijabla v2 - Grupirani deparac u polje Columns.
To je prikazano na slici 2.23.
Slika 2.23.
"General Tables" s varijablama v1 u redcima i v2 u stupcima

Izvor: Simulirani podaci.

Klikom na OK, u Outputu se za rezultat dobije traena tablica


koja je prikazana u sljedeoj tablici 2.15.
Tablica 2.15.
Ispitanici prema spolu i grupiranom deparcu
Grupirani deparac
200,00
Spol

400,00

600,00

800,00

1000,00

3500,00

Muko

28

18

10

ensko

45

34

20

Izvor: Simulirani podaci.


77

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

U tablici 2.15. vidi se da najvie ispitanika ima deparac do 200


kn. Iako je u analizi vie ispitanika enskog spola, pokazalo se da vei
deparac imaju oni mukog spola.
b)
Da bi se formirala dvostruka statistika tablica sa zbirnim redcima
i stupcima, potrebno je na glavnom izborniku izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Crosstabs. Prema
zahtjevu zadatka pomou odgovarajuih strelica varijabla v1 - Spol se
prebacuje u polje Row(s), a druga varijabla v2 - Grupirani deparac u
polje Column(s). To je prikazano na slici 2.24.
Slika 2.24.
"Crosstabs" s varijablama v1 u redcima i v2 u stupcima

Izvor: Simulirani podaci.

Klikom na OK u Outputu se za rezultat dobije traena tablica sa


zbirnim stupcima i redcima koja je prikazana u sljedeoj tablici 2.16.

78

Ureivanje i prikazivanje podataka

Tablica 2.16.
Ispitanici prema spolu i grupiranom deparcu
Spol * Grupirani dzeparac Crosstabulation
Count
Grupirani dzeparac
Spol

200,00
28
45
73

Musko
Zensko

Total

400,00
18
34
52

600,00
10
20
30

800,00
4
2
6

1000,00
4
3
7

3500,00
4
1
5

Total
68
105
173

Izvor: Simulirani podaci.

Za razliku od tablice 2.15 u tablici 2.16 postoje zbirni stupci i


zbirni redci. U njima se nalaze marginalne frekvencije koje kau koliko
ispitanika ima po jednoj grupi obiljeja bez obzira na drugo obiljeje. Na
primjer, prvi podatak u zbirnom stupcu kae da je 68 ispitanika mukog
spola bez obzira na deparac. Trei podatak u zbirnom retku kae da je
30 ispitanika imalo deparac izmeu 400 i 600 kn bez obzira na spol.
c)
Da bi se u Outputu dobio i grafikon viestrukih stupaca pri
kreiranju dvostruke statistike tablice u prozoru Crosstabs (slika 2.24),
potrebno je aktivirati Display clustered bar charts.
Slika 2.25.
Viestruki stupci visine deparca prema spolu
Bar Chart

Grupirani dzeparac

50

200,00
400,00
600,00
40

800,00
1000,00

Count

3500,00
30

20

10

0
Musko

Zensko

Spol

Izvor: Simulirani podaci.


79

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Traeni grafikon prikazan je na slici 2.25. Moe se vidjeti da se


prvi viestruki stupac odnosi na ispitanike mukog spola, a drugi na
ispitanike enskog spola. I u jednom i u drugom dijelu grafikona najvei
stupci su oni koji prikazuju nii deparac, dok oni manji stupci pokazuju
vii iznos deparca.

Analitiki primjer 2.20.


Zadatak je formirati dvostruku statistiku tablicu gdje se varijabla
(obiljeje) spol (v1) mijenja po stupcima (column), a varijabla (obiljeje)
grupirani deparac (v2) po redcima (row):
a)
Formirati dvostruku statistiku tablicu bez zbirnih redaka i
stupaca.
b)
Formirati dvostruku statistiku tablicu sa zbirnim redcima i
stupcima.
c)
Nacrtati grafikon dvostrukih
varijablama i komentirati sliku!

stupaca

prema

odabranim

Rjeenje 2.20:
a)
Da bi se formirala dvostruka statistika tablica bez zbirnih redaka
i stupaca, potrebno je na glavnom izborniku izabrati ikonu Analyze, a na
njezinu padajuem izborniku Tables i General Tables. Prema zahtjevu
zadatka pomou odgovarajuih strelica varijabla v1 - Spol se prebacuje u
polje Columns, a druga varijabla v2 - Grupirani deparac u polje Rows.
Princip je kao to je prikazano na slici 2.20, samo to odabrane varijable
po stupcima i po redcima mijenjaju svoje mjesto.
Klikom na OK, u Outputu se za rezultat dobije traena tablica
koja je prikazana u sljedeoj tablici 2.17.

80

Ureivanje i prikazivanje podataka

Tablica 2.17.
Ispitanici prema spolu i grupiranom deparcu
Spol
Grupirani
dzeparac

200,00

Musko
28

Zensko
45

400,00

18

34

600,00

10

20

800,00

1000,00

3500,00

Izvor: Simulirani podaci.

Ako se napravi usporedba tablice 2.17 s tablicom 2.15, moe se


vidjeti da se sada varijabla spol mijenja po stupcima, a varijabla grupirani
deparac po redcima. I iz ove tablice jasno je da najvei broj ispitanika i
jednog i drugog spola imaju najmanju kategoriju deparca, tj. do 200 kn
na mjesec.
b)
Da bi se formirala dvostruka statistika tablica s zbirnim redcima i
stupcima, potrebno je na glavnom izborniku izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Crosstabs. Prema
zahtjevu zadatka pomou odgovarajuih strelica varijabla v1 - Spol se
prebacuje u polje Column(s), a druga varijabla v2 - Grupirani deparac u
polje Row(s).
Tablica 2.18.
Ispitanici prema spolu i grupiranom deparcu
Grupirani dzeparac * Spol Crosstabulation
Count
Spol
Grupirani
dzeparac

Total

200,00

Musko
28

Zensko
45

400,00

18

34

52

600,00

10

20

30

800,00

1000,00

3500,00

68

105

173

Total

73

Izvor: Simulirani podaci.


81

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slian je princip kao to je prikazano na slici 2.24, samo to


odabrane varijable po stupcima i po redcima mijenjaju svoje mjesto.
Klikom na OK u Outputu se za rezultat dobije traena tablica sa zbirnim
stupcima i redcima koja je prikazana u tablici 2.18.
Za razliku od tablice 2.17 u tablici 2.18 postoje zbirni stupci i
zbirni redci. U njima se nalaze marginalne frekvencije koje kau koliko
ispitanika ima po jednoj grupi obiljeja bez obzira na drugo obiljeje. Na
primjer, prvi podatak u zbirnom retku kae da je 68 ispitanika mukog
spola bez obzira na deparac. Trei podatak u zbirnom stupcu kae da je
30 ispitanika imalo deparac izmeu 400 i 600 kn bez obzira na spol.
c)
Da bi se u Outputu dobio i grafikon viestrukih stupaca pri
kreiranju dvostruke statistike tablice u prozoru Crosstabs (slika 2.24),
potrebno je aktivirati Display clustered bar charts.
Slika 2.26.
Dvostruki stupci spola ispitanika prema visini deparca
Bar Chart

Spol

50

Musko
Zensko

Count

40

30

20

10

0
200,00

400,00

600,00

800,00

1000,00

3500,00

Grupirani dzeparac

Izvor: Simulirani podaci.

Traeni grafikon prikazan je na slici 2.26. Moe se vidjeti da se


svaki dvostruki stupac odnosi na razliitu kategoriju visine deparca. U
prva tri dvostruka stupca veu zastupljenost imaju ispitanici enskog
82

Ureivanje i prikazivanje podataka

spola, a prema posljednja tri stupca moe se zakljuiti da je muki spol u


veini. Dakle, openito ispitanici enskog spola imaju nii iznos
deparca, dok ispitanici mukog spola imaju vei iznos deparca.

Analitiki primjer 2.21.


Zadatak je formirati dvostruku statistiku tablicu gdje se varijabla
(obiljeje) kolska sprema oca (v1) mijenja po redcima (row), a varijabla
(obiljeje) prikljuenje EU (v2) po stupcima (column):
a)
Tablica sa zbirnim redcima i stupcima te nacrtati grafikon
viestrukih stupaca!
b)

Komentirati sliku i izraunate frekvencije!


Rjeenje 2.21:

a)
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Crosstabs.
Tablica 2.19.
Ispitanici prema kolskoj spremi oca i miljenju o prikljuenju EU
Skolska sprema oca * Jeste li za prikljucenje RH u EU Crosstabulation
Count
Jeste li za prikljucenje
RH EU
Da
Skolska
sprema
oca

Total

Ne

Osnovna skola

22

22

Srednja cetverogodisnja

67

73

Srednja trogodisnja

27

29

Visa

39

44

Visoka

53

57

Magisterij
Doktorat
Total

214

19

233

Izvor: Simulirani podaci.

83

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Pomou odgovarajuih strelica varijabla v1 - kolska sprema oca


se prebacuje u polje Row(s), a druga varijabla v2 - Prikljuenje EU u
polje Column(s). Da bi se u Outputu dobio i grafikon viestrukih stupaca
pri kreiranju dvostruke statistike tablice u prozoru Crosstabs, potrebno
je aktivirati Display clustered bar charts.
Klikom na OK u Outputu se za rezultat dobije traena dvostruka
tablica, koja je prikazana tablicom 2.19 i grafikon, prikazan na slici 2.27.
Slika 2.27.
Ispitanici prema kolskoj spremi oca i miljenju o prikljuenju EU
Bar Chart

Jeste li za prikljucenje
RH EU

70

Da
60

Ne

Count

50

40

30

20

10

0
Osnovna
skola

Srednja
Srednja
cetverogodis... trogodisnja

Visa

Visoka

Magisterij

Doktorat

Skolska sprema oca

Izvor: Simulirani podaci.

b)
Prema podacima u tablici 2.19 i slici 2.27 moe se zakljuiti da je
veina ispitanika iz odabranog uzorka za prikljuenje Republike Hrvatske
Europskoj uniji, bez obzira na kolsku spremu njihova oca. Isto tako
moe se primijetiti da je u uzorku najvei broj ispitanika kojima otac ima
srednju strunu spremu (to je zaista i openita situacija u Republici
Hrvatskoj - prema podacima u SLJH, razne godine - pa bi se u tom smislu
moglo komentirati o sluajnosti izabranog uzorka).
84

Ureivanje i prikazivanje podataka

Analitiki primjer 2.22.


Zadatak je formirati dvostruku statistiku tablicu gdje se varijabla
(obiljeje) prikljuenje EU (v1) mijenja po redcima (row), a varijabla
(obiljeje) vjenanje sa osobom druge vjere (v2) po stupcima (column):
a)
Formirati tablicu sa zbirnim redcima i stupcima te nacrtati
grafikon viestrukih stupaca!
b)

Komentirati sliku i izraunate frekvencije!


Rjeenje 2.22:

a)
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Crosstabs.
Pomou odgovarajuih strelica varijabla v1 - Prikljuenje EU u
polje Row(s), a druga varijabla v2 - Vjenanje sa osobom druge vjere u
polje Column(s). Da bi se u Outputu dobio i grafikon viestrukih stupaca
pri kreiranju dvostruke statistike tablice u prozoru Crosstabs, potrebno
je aktivirati Display clustered bar charts.
Klikom na OK u Outputu se za rezultat dobije traena dvostruka
tablica koja je prikazana tablicom 2.20 i grafikon prikazan na slici 2.28.
Tablica 2.20.
Ispitanici prema miljenju o prikljuenju EU i o vjenanju sa osobom
druge vjere
Jeste li za prikljucenje RH EU * Biste li se vjencali sa osobom druge vjere
Crosstabulation
Count
Biste li se vjencali sa
osobom druge vjere
Da
Jeste li za prikljucenje
RH EU
Total

Total

Ne

Da

105

95

Ne

10

19

115

104

219

200

Izvor: Simulirani podaci.

85

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slika 2.28
Ispitanici prema miljenju o prikljuenju EU i o vjenanju sa osobom
druge vjere
Bar Chart

Biste li se vjencali sa
osobom druge vjere

120

Da
Ne

100

Count

80

60

40

20

0
Da

Ne

Jeste li za prikljucenje RH EU

Izvor: Simulirani podaci.

b)
Prema podacima u tablici 2.20 i slici 2.28 moe se zakljuiti da je
veina ispitanika iz odabranog uzorka za prikljuenje Republike Hrvatske
Europskoj uniji, to se vidi prema marginalnim frekvencijama u zbirnom
stupcu tablice i prema prvom dvostrukom stupcu grafikona. Isto tako
moe se primijetiti da je u uzorku broj ispitanika koji bi se vjenao sa
osobom druge vjere malo vei od onih koji to ne bi napravili, te da su
otprilike ravnomjerno rasporeeni bez obzira na miljenje o tome jesu li
za prikljuenje Republike Hrvatske Europskoj uniji.

Analitiki primjer 2.23.


Zadatak je formirati dvostruku statistiku tablicu, gdje se varijabla
(obiljeje) odnosi u obitelji (v1) mijenja po redcima (row), a varijabla
(obiljeje) uivate li drogu (v2) po stupcima (column). Potrebno je:

86

Ureivanje i prikazivanje podataka

a)
Formirati tablicu sa zbirnim redcima i stupcima te nacrtati
grafikon viestrukih stupaca!
b)

Komentirati sliku i izraunate frekvencije!


Rjeenje 2.23:

a)
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Crosstabs.
Pomou odgovarajuih strelica varijabla v2 - Odnosi u obitelji
prebacuje se u polje Row(s), a druga varijabla v1 - Uivate li drogu u
polje Column(s). Da bi se u Outputu dobio i grafikon viestrukih stupaca
pri kreiranju dvostruke statistike tablice u prozoru Crosstabs, potrebno
je aktivirati Display clustered bar charts.
Klikom na OK u Outputu se za rezultat dobije traena dvostruka
tablica, koja je prikazana tablicom 2.21 i grafikon prikazan na slici 2.29.
Tablica 2.21.
Ispitanici prema odnosima u njihovoj obitelji i konzumiranju droge
Odnosi u obitelji * Uzivate li drogu Crosstabulation
Count
Uzivate li drogu
Da
Odnosi u
obitelji

Total

Ne

Vlada sklad i
razumijevanje

147

153

Povremene svadje i
sukobi

70

76

Ucestale svadje i sukobi


Total

13

217

230

Izvor: Simulirani podaci.

b) Prema podacima u tablici 2.21 i slici 2.29 moe se zakljuiti da


veina ispitanika iz odabranog uzorka ne konzumira drogu. Prema prvoj
marginalnoj frekvenciji u zbirnom stupcu, te prvom dvostrukom stupcu
grafikona, moe se vidjeti da u obiteljima kod veine ispitanika vlada
sklad i razumijevanje. Samo 1 ispitanik izjasnio se da u obitelji ima
uestale svae i sukobe i on konzumira drogu (trei dvostruki stupac
grafikona).

87

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slika 2.29.
Ispitanici prema odnosima u njihovoj obitelji i konzumiranju droge
Bar Chart

Uzivate li drogu

150

Da
Ne

Count

120

90

60

30

0
Vlada sklad i
razumijevanje

Povremene svadje i
sukobi

Ucestale svadje i sukobi

Odnosi u obitelji

Izvor: Simulirani podaci.

Analitiki primjer 2.24.


Zadatak je formirati dvostruku statistiku tablicu gdje se varijabla
(obiljeje) kolska sprema oca (v1) mijenja po redcima (row), a varijabla
(obiljeje) Uivate li drogu (v2) po stupcima (column). Potrebno je:
a)
Formirati tablicu sa zbirnim redcima i stupcima te nacrtati
grafikon viestrukih stupaca!
b)

Komentirati sliku i izraunate frekvencije!


Rjeenje 2.24:

a)
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Crosstabs.
88

Ureivanje i prikazivanje podataka

Pomou odgovarajuih strelica varijabla v1 - kolska sprema oca


Row(s), a druga varijabla v2 - Uivate li drogu u polje Column(s). Da bi
se u Outputu dobio i grafikon viestrukih stupaca pri kreiranju dvostruke
statistike tablice u prozoru Crosstabs, potrebno je aktivirati Display
clustered bar charts.
Klikom na OK u Outputu se za rezultat dobije traena dvostruka
tablica, koja je prikazana tablicom 2.22 i grafikon prikazan na slici 2.30.
Tablica 2.22.
Ispitanici prema kolskoj spremi oca i konzumiranju droge
Skolska sprema oca * Uzivate li drogu Crosstabulation
Count
Uzivate li drogu
Da
Skolska
sprema
oca

Total

Ne

Osnovna skola

20

21

Srednja cetverogodisnja

69

71

Srednja trogodisnja

28

30

Visa

41

44

Visoka

53

58

Magisterij

Doktorat
Total

13

218

231

Izvor: Simulirani podaci.

b) Prema podacima u tablici 2.22 i slici 2.30 moe se zakljuiti da


veina ispitanika iz odabranog uzorka ne konzumira drogu. Prema zadnje
dvije marginalne frekvencije u zbirnom stupcu, te zadnja dva dvostruka
stupca grafikona, moe se vidjeti da samo 5 ispitanika ima oca s titulom
magistra, a 2 ispitanika imaju oca s doktoratom. Meu njima nitko ne
konzumira drogu.

89

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slika 2.30.
Ispitanici prema kolskoj spremi oca i konzumiranju droge
Bar Chart

Uzivate li drogu

70

Da
Ne
60

Count

50

40

30

20

10

0
Osnovna
skola

Srednja
Srednja
cetverogodis... trogodisnja

Visa

Visoka

Magisterij

Doktorat

Skolska sprema oca

Izvor: Simulirani podaci.

Analitiki primjer 2.25.


Zadatak je formirati dvostruku statistiku tablicu, gdje se varijabla
(obiljeje) Broj djece u obitelji (v1) mijenja po redcima (row), a varijabla
(obiljeje) Uivate li drogu (v2) po stupcima (column). Potrebno je:
a)
Formirati tablicu sa zbirnim redcima i stupcima te nacrtati
grafikon viestrukih stupaca!
b)

Komentirati sliku i izraunate frekvencije!


Rjeenje 2.25:

a)
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Crosstabs.
90

Ureivanje i prikazivanje podataka

Pomou odgovarajuih strelica varijabla v1 - Broj djece u obitelji


prebacuje se u polje Row(s), a druga varijabla v2 - Uivate li drogu u
polje Column(s). Da bi se u Outputu dobio i grafikon viestrukih stupaca
pri kreiranju dvostruke statistike tablice u prozoru Crosstabs, potrebno
je aktivirati Display clustered bar charts.
Klikom na OK u Outputu se za rezultat dobije traena dvostruka
tablica koja je prikazana tablicom 2.23 i grafikon prikazan na slici 2.31.
Tablica 2.23.
Ispitanici prema broju djece u obitelji i konzumiranju droge
Broj djece u obitelji * Uzivate li drogu Crosstabulation
Count
Uzivate li drogu
Da
Broj
djece u
obitelji

Total

Ne

20

21

130

138

51

55

11

11

7
Total

13

219

232

Izvor: Simulirani podaci.

b)
Prema podacima u tablici 2.23 i slici 2.31 moe se zakljuiti da
veina ispitanika iz odabranog uzorka ne konzumira drogu. Prema zadnje
dvije marginalne frekvencije u zbirnom stupcu, te zadnja dva dvostruka
stupca grafikona, moe se vidjeti da samo po 1 ispitanik u obitelji ima 6ero i 7-ero djece. Meu njima nitko ne konzumira drogu.

91

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slika 2.31.
Ispitanici prema broju djece u obitelji i konzumiranju droge
Bar Chart

Uzivate li drogu

140

Da
Ne
120

Count

100

80

60

40

20

0
1

Broj djece u obitelji

Izvor: Simulirani podaci.

Analitiki primjer 2.26.


Zadatak je formirati dvostruku statistiku tablicu gdje se varijabla
(obiljeje) Financijske prilike u obitelji (v1) mijenja po redcima (row), a
varijabla (obiljeje) Broj djece u obitelji (v2) po stupcima (column).
Potrebno je:
a)
Formirati tablicu sa zbirnim redcima i stupcima te nacrtati
grafikon viestrukih stupaca!
b)

Komentirati sliku i izraunate frekvencije!


Rjeenje 2.26:

a)
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Crosstabs.
Pomou odgovarajuih strelica varijabla v1 - Financijske prilike u
obitelji prebacuje se u polje Row(s), a druga varijabla v2 - Broj djece u
92

Ureivanje i prikazivanje podataka

obitelji u polje Column(s). Da bi se u Outputu dobio i grafikon


viestrukih stupaca pri kreiranju dvostruke statistike tablice u prozoru
Crosstabs, potrebno je aktivirati Display clustered bar charts.
Klikom na OK u Outputu se za rezultat dobije traena dvostruka
tablica koja je prikazana tablicom 2.24 i grafikon prikazan na slici 2.32.
Tablica 2.24.
Ispitanici prema financijskim prilikama i broju djece u obitelji
Financijske prilike u obitelji * Broj djece u obitelji Crosstabulation
Count
Broj djece u obitelji
1
Financijske
prilike u
obitelji

Nema
novca za
normalan
standard
Zadovoljavamo
osnovne
potrebe
Nema
materijalnih
problema
Zivimo
odlicno

Total

Total
6

12

56

29

104

78

25

121

21

142

55

11

236

Izvor: Simulirani podaci.

b)
Prema podacima u tablici 2.24 i slici 2.32 moe se zakljuiti da
kod veine ispitanika iz odabranog uzorka ima 2 djece u obitelji.
Ispitanika koji su se izjasnili da nemaju novca za normalan standard te
onih koji ive odlino ima znatno manje u odnosu na ostale kategorije
(prvi i zadnji viestruki stupac grafikona na slici 2.32).

93

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slika 2.32.
Ispitanici prema financijskim prilikama i broju djece u obitelji
Bar Chart

Broj djece u obitelji

80

1
2
3
4

60

5
6

Count

7
40

20

0
Nema novca za
normalan standard

Zadovoljavamo
osnovne potrebe

Nema materijalnih
problema

Zivimo odlicno

Financijske prilike u obitelji

Izvor: Simulirani podaci.

Analitiki primjer 2.27.


Zadatak je formirati dvostruku statistiku tablicu gdje se varijabla
(obiljeje) Financijske prilike u obitelji (v1) mijenja po redcima (row), a
varijabla (obiljeje) Uivate li drogu (v2) po stupcima (column).
Potrebno je:
a)
Formirati tablicu sa zbirnim redcima i stupcima te nacrtati
grafikon viestrukih stupaca!
b)
94

Komentirati sliku i izraunate frekvencije!

Ureivanje i prikazivanje podataka

Rjeenje 2.27:
a)
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Crosstabs.
Pomou odgovarajuih strelica varijabla v1 - Financijske prilike u
obitelji prebacuje se u polje Row(s), a druga varijabla v2 - Uivate li
drogu u polje Column(s). Da bi se u Outputu dobio i grafikon viestrukih
stupaca pri kreiranju dvostruke statistike tablice u prozoru Crosstabs,
potrebno je aktivirati Display clustered bar charts.
Klikom na OK u Outputu se za rezultat dobije traena dvostruka
tablica koja je prikazana tablicom 2.25 i grafikon prikazan na slici 2.33.
Tablica 2.25.
Ispitanici prema financijskim prilikama u obitelji i konzumiranju droge
Financijske prilike u obitelji * Uzivate li drogu Crosstabulation
Count
Uzivate li drogu
Da
Financijske
prilike u
obitelji

Total

Ne

Nema novca za
normalan standard

Zadovoljavamo
osnovne potrebe

96

103

Nema materijalnih
problema

114

118

Zivimo odlicno
Total

13

218

231

Izvor: Simulirani podaci.

b)
Prema podacima u tablici 2.25 i slici 2.33 moe se zakljuiti da
veina ispitanika iz odabranog uzorka ipak ne konzumira drogu.
Ispitanika koji su se izjasnili da nemaju novca za normalan standard te
onih koji ive odlino ima znatno manje u odnosu na ostale kategorije
(prvi i zadnji viestruki stupac grafikona na slici 2.33).

95

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slika 2.33.
Ispitanici prema financijskim prilikama u obitelji i konzumiranju droge
Bar Chart

Uzivate li drogu

120

Da
Ne
100

Count

80

60

40

20

0
Nema novca za
Zadovoljavamo
normalan standard osnovne potrebe

Nema materijalnih
problema

Zivimo odlicno

Financijske prilike u obitelji

Izvor: Simulirani podaci.

Analitiki primjer 2.28.


Zadatak je formirati dvostruku statistiku tablicu gdje se varijabla
(obiljeje) Grupirana ocjena u srednjoj koli (v1) mijenja po redcima
(row), a varijabla (obiljeje) Uivate li drogu (v2) po stupcima (column).
Potrebno je:
a)
Formirati tablicu sa zbirnim redcima i stupcima te nacrtati
grafikon viestrukih stupaca!
b)

Komentirati sliku i izraunate frekvencije!


Rjeenje 2.28:

a)
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Crosstabs.

96

Ureivanje i prikazivanje podataka

Tablica 2.26.
Ispitanici prema ocjeni iz srednje kole i konzumiranju droge
Grupirana ocjena u srednjoj skoli * Uzivate li drogu Crosstabulation
Count
Uzivate li drogu
Da
Grupirana
ocjena u
srednjoj
skoli

Total

Ne

2,00

3,00

30

34

4,00

104

109

5,00

Total

84

88

13

219

232

Izvor: Simulirani podaci.

Slika 2.34.
Ispitanici prema ocjeni iz srednje kole i konzumiranju droge
Bar Chart

Uzivate li drogu

120

Da
Ne
100

Count

80

60

40

20

0
2,00

3,00

4,00

5,00

Grupirana ocjena u srednjoj skoli

Izvor: Simulirani podaci.

Pomou odgovarajuih strelica varijabla v1 - Grupirana ocjena u


srednjoj koli prebacuje se u polje Row(s), a druga varijabla v2 - Uivate
li drogu u polje Column(s). Da bi se u Outputu dobio i grafikon
viestrukih stupaca pri kreiranju dvostruke statistike tablice u prozoru
Crosstabs, potrebno je aktivirati Display clustered bar charts.
Klikom na OK u Outputu se za rezultat dobije traena dvostruka
tablica koja je prikazana tablicom 2.26. i grafikon prikazan na slici 2.34.
97

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

b) Prema podacima u tablici 2.26 i slici 2.34 moe se zakljuiti da


veina ispitanika u srednjoj koli ima prosjenu ocjenu 4. S obzirom na
ukupan broj ispitanika koji su u srednjoj koli imali prosjenu ocjenu 3,
broj onih koji izmeu njih konzumiraju drogu je 4, a to je relativno
najvei udio (drugi dvostruki stupac grafikona na slici 2.34).

Analitiki primjer 2.29.


Zadatak je formirati dvostruku statistiku tablicu gdje se varijabla
(obiljeje) Uivate li drogu (v2) mijenja po redcima (row), a varijabla
(obiljeje) Spol (v1) po stupcima (column). Potrebno je:
a)
Formirati tablicu sa zbirnim redcima i stupcima te nacrtati
grafikon viestrukih stupaca!
b)

Komentirati sliku i izraunate frekvencije!


Rjeenje 2.29:

a)
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Crosstabs.
Pomou odgovarajuih strelica varijabla v2 - Uivate li drogu
premjestiti u polje Row(s), a drugu varijablu v1 - Spol u polje Column(s).
Da bi se u Outputu dobio i grafikon viestrukih stupaca pri kreiranju
dvostruke statistike tablice u prozoru Crosstabs, potrebno je aktivirati
Display clustered bar charts.
Tablica 2.27.
Ispitanici prema konzumiranju droge i spolu
Uzivate li drogu * Spol Crosstabulation
Count
Spol
Musko
Uzivate
li drogu

13

NE

84

136

220

91

142

233

Total

Izvor: Simulirani podaci.


98

Total

Zensko

Da

Ureivanje i prikazivanje podataka

Klikom na OK u Outputu se za rezultat dobije traena dvostruka


tablica koja je prikazana tablicom 2.27 i grafikon prikazan na slici 2.35.
Slika 2.35.
Ispitanici prema konzumiranju droge i spolu
Bar Chart

Spol

140

Musko
Zensko
120

Count

100

80

60

40

20

0
Da

NE

Uzivate li drogu

Izvor: Simulirani podaci.

b)
Prema podacima u tablici 2.27 i slici 2.35 moe se zakljuiti da je
veina ispitanika u odabranom uzorku enskog spola. Prvi dvostruki
stupac grafikona odnosi se na one ispitanike koji konzumiraju drogu.
Moe se vidjeti da meu njima prevladavaju oni mukog spola (i prema
prvom retku tablice 2.27).

Analitiki primjer 2.30.


Zadatak je formirati dvostruku statistiku tablicu, gdje se varijabla
(obiljeje) Puite li cigarete (v1) mijenja po redcima (row), a varijabla
(obiljeje) Grupirana ocjena u srednjoj koli (v2) po stupcima (column).
Potrebno je:

99

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

a)
Formirati tablicu sa zbirnim redcima i stupcima te nacrtati
grafikon viestrukih stupaca!
b)

Komentirati sliku i izraunate frekvencije!


Rjeenje 2.30:

a)
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Crosstabs.
Pomou odgovarajuih strelica varijabla v1 - Puite li cigarete
prebacuje se u polje Row(s), a druga varijabla v2 - Grupirana ocjena u
srednjoj koli u polje Column(s). Da bi se u Outputu dobio i grafikon
viestrukih stupaca pri kreiranju dvostruke statistike tablice u prozoru
Crosstabs, potrebno je aktivirati Display clustered bar charts.
Tablica 2.28.
Ispitanici prema puenju cigareta i ocjeni iz srednje kole
Pusite li cigarete * Grupirana ocjena u srednjoj skoli Crosstabulation
Count
Grupirana ocjena u srednjoj skoli
2,00
Pusite li
cigarete

Ne
Do 10 cigareta na
dan
Do 1 kutije na dan
Vise od 1 kutije na
dan

Total

Total

3,00
18

4,00
83

5,00
72

14

25

11

29

10

34

112

90

237

173

Izvor: Simulirani podaci.

Klikom na OK u Outputu se za rezultat dobije traena dvostruka


tablica koja je prikazana tablicom 2.28 i grafikon prikazan na slici 2.36.
b)
Prema podacima u tablici 2.28 i slici 2.36 moe se zakljuiti da
veina ispitanika ne pui cigarete. U svim kategorijama puaa cigareta
najvei je broj onih s prosjenom ocjenom iz srednje kole vrlo dobar, tj.
4, osim kod onih koji pue do 1 kutije na dan, gdje prevladavaju ispitanici
s prosjenom ocjenom iz srednje kole dobar, tj. 3 (trei viestruki stupac
grafikona na slici 2.36).

100

Ureivanje i prikazivanje podataka

Slika 2.36.
Ispitanici prema puenju cigareta i ocjeni iz srednje kole
Bar Chart

Grupirana ocjena u
srednjoj skoli

100

2,00
3,00
80

4,00

Count

5,00

60

40

20

0
Ne

Do 10 cigareta na Do 1 kutije na dan Vise od 1 kutije na


dan
dan

Pusite li cigarete

Izvor: Simulirani podaci.

101

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

102

Srednje vrijednosti

3. SREDNJE VRIJEDNOSTI
3.1. Srednje vrijednosti
Prikupljeni statistiki podaci u svom izvornom obliku esto zbog
svog obujma nemaju razumljivu formu. Zbog toga se i vri njihovo
grupiranje, odnosno formiranje statistikih nizova. Na taj se nain dobiva
detaljniji uvid u svojstva promatranoga statistikog niza.
Raunanjem srednjih vrijednosti dolazi se do informacija o
vrijednostima statistikog obiljeja oko kojih se rasporeuju elementi
statistikog niza.
Srednja vrijednost je vrijednost statistikog obiljeja oko koje
se grupiraju podaci statistikog niza. Jo se zove i "mjera centralne
tendencije".
Srednje vrijednosti mogu se podijeliti: na
1. Poloajne srednje vrijednosti odreuju se poloajem podataka u
nizu. Najvanije poloajne srednje vrijednosti su :
a) mod
b) medijan.
2. Potpune srednje vrijednosti raunaju se upotrebom svih
podataka u statistikom nizu. Potpune srednje vrijednost su:
a) aritmetika sredina
b) harmonijska sredina
c) geometrijska sredina (koja nema svoju primjenu u
sociolokim istraivanjima).

103

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

3.2. Aritmetika sredina


Aritmetika sredina spada u potpune srednje vrijednosti i
rauna se upotrebom svih podataka u statistikom nizu. To je najvanija i
najee koritena srednja vrijednost (ali ne i uvijek najbolja srednja
vrijednost).
Aritmetika sredina je omjer zbroja svih vrijednosti
numerikog obiljeja jednog niza i broja elemenata tog niza.
Ako se radi o negrupiranom statistikom numerikom nizu,
rauna se jednostavna aritmetika sredina:
N

X =

Xi

i =1

X 1 + X 2 + ... + X N
N

(3.1)

Ako se radi o grupiranom statistikom numerikom nizu,


rauna se sloena, vagana ili ponderirana aritmetika sredina.
Poznato je da apsolutne frekvencije oznaavaju broj elemenata
skupa koji pripadaju odreenom modalitetu promatranoga statistikog
obiljeja. Iz toga se moe zakljuiti da je vanost svake vrijednosti
obiljeja ovisna o frekvenciji jer vea frekvencija znai vei udio tog
oblika obiljeja u promatranom skupu. Zato se frekvencija jo naziva
teinski faktor ili ponder kod grupiranih nizova.
Vagana ili ponderirana aritmetika sredina rauna se prema
izrazu:
k

X=

f i xi

i =1
k

fi

f 1 x1 + f 2 x 2 + ... + f k x k
f 1 + f 2 + ... + f k

(3.2)

i =1

U jednadbi (3.2) k predstavlja broj grupa, odnosno modaliteta


promatranog numerikog obiljeja. Nazivnik ovog izraza, kao suma svih
apsolutnih frekvencija, odgovara opsegu statistikog skupa.
Ako su veliine razreda grupiranog numerikog niza razliite
od 1, za raunanje vagane ili ponderirane aritmetike sredine

104

Srednje vrijednosti

potrebno je izvriti aproksimaciju pomou sredine razreda. Sredina


razreda, kako je ve reeno, dobije se kao jednostavan prosjek donje i
gornje granice razreda. Na taj nain ona predstavlja sve vrijednosti
obiljeja koje se javljaju u jednoj grupi. Stoga je, u ovom sluaju,
aritmetika sredina procjena stvarne aritmetike sredine numerikog niza.
Analitiki primjer 3.1.
Statistiki skup "Zaposlene ene u graevinarstvu u RH, 31. 03.
2002. godine" promatran prema neprekidnom numerikom obiljeju
"dob" dan je u tablici 3.1..
Zadatak je izraunati aritmetiku sredinu.
Tablica 3.1.
Zaposlene ene u graevinarstvu u RH, 31. 03. 2004. godine
Dob
xi

Broj ena
fi

(18)-25
25-30
30-35
35-40
40-45
45-50
50-65
Ukupno:

712
1367
1277
1417
1580
1557
1322
9232

Sredina
razreda
xi
21,5
27,5
32,5
37,5
42,5
47,5
57,5
-

fixi
15308
37592,5
41502,5
53137,5
67150
73957,5
76015
364663

Izvor: Statistiki ljetopis Republike Hrvatske, 2005. godine, str. 145.

Rjeenje 3.1:
Zadani niz je grupiran prema modalitetima obiljeja. Razredi nisu
jednake veliine, a ima ih 7.
Kod grupiranih nizova s veliinom razreda razliitom od 1, u
izrazu za aritmetiku sredinu, xi predstavlja sredinu i-tog razreda. Stoga
je aproksimacija aritmetike sredine sljedea:
7

f i xi

=
X = i =17
fi

f 1 x1 + f 2 x 2 + ... + f 7 x 7 364663
=
= 39,5 godina
9232
f 1 + f 2 + ... + f 7

i =1

105

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Dakle priblino, prosjena je dob ena zaposlenih


graevinarstvu RH (stanje 31. 03. 2004. god.) 39,5 godina.

Aritmetika sredina izraava se u originalnim jedinicama mjere


promatranoga numerikog obiljeja, obuhvaa sve elemente nekog skupa,
te se pomou nje mogu usporeivati nizovi koji su grupirani po jednakom
obiljeju. Uz ove, aritmetika sredina zadovoljava i sljedee kriterije:
a) Aritmetika sredina nalazi su izmeu najvee i najmanje
vrijednosti promatranoga numerikog obiljeja:
xmin X xmax

(3.3)

b) Zbroj odstupanja vrijednosti numerikog obiljeja od aritmetike


sredine u jednoj distribuciji je uvijek nula.
N

( xi X ) = 0 , za negrupirani niz,

i =1
k

f i ( xi X ) = 0 , za grupirani niz.

i =1

(3.4)
(3.5)

c) Zbroj kvadrata odstupanja vrijednosti numerikog obiljeja od


aritmetike sredine u jednoj distribuciji je manji ili jednak zbroju
kvadrata odstupanja vrijednosti numerikog obiljeja u istoj
distribuciji od bilo koje druge vrijednosti (a).
N

i =1

i =1

2
2
( xi X ) ( xi a) , za negrupirani niz,

i =1

i =1

2
2
f i ( xi X ) f i ( xi a) , za grupirani niz.

(3.6)
(3.7)

Ako neki numeriki niz sadri ekstremno male ili velike


vrijednosti obiljeja, aritmetika sredina kao prosjena vrijednost gubi na
svojoj reprezentativnosti. Taj problem je dodatno izraen kada u
distribuciji postoje razredi s otvorenom donjom, odnosno gornjom
granicom razreda, i kada nije mogue te granice objektivno procijeniti.

106

Srednje vrijednosti

3.3. Mod
Mod je vrijednost statistikog obiljeja koja se najee javlja
u nekom nizu, tj. vrijednost obiljeja kojoj pripada najvea
frekvencija.
Mod se moe primijeniti na kvalitativne i kvantitativne statistike
nizove, a spada u poloajne srednje vrijednosti.
Kod nominalnih obiljeja mod se odreuje brojenjem na nain
da se trai koja se vrijednost obiljeja u nizu najee javlja. Ako je niz
grupiran, trai se najvea apsolutna frekvencija. Vrijednost obiljeja kojoj
pripada ta najvea apsolutna frekvencija je mod.
Analitiki primjer 3.2.
Statistiki skup "prodane cipele u prodavaonici "K" na dan 05. 05.
2005. god." grupiran je prema nominalnom obiljeju "boja". Modaliteti
toga obiljeja su: crna (C), bijela (B), ruiasta (R), smea (S).
Ureeni podaci dobiveni evidencijom na odreeni dan su:
CCCCCBRRRS
Zadatak je odrediti mod.
Rjeenje 3.2:
Dakle, na dan 05. 05. 2005. god. u prodavaonici "K" je prodano
10 cipela. Od toga 5 crnih, 1 bijele, 3 ruiaste i 1 smee. Vrijednost
obiljeja "boja" koja se u ovom nizu najee javlja je crna, pa se moe
zakljuiti da je mod, Mo = crna boja .
Statistiki niz grupiran u razrede prikazan je u tablici 3.2.
Kod grupiranih nizova mod se odreuje prema najveoj
apsolutnoj frekvenciji: f max = 5 . Modalitet obiljeja koji odgovara toj
frekvenciji je crno, to znai da je: Mo = crna boja .

107

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Tablica 3.2.
Prodane cipele u prodavaonici "K" na dan 05. 05. 2005. god. prema boji
Boja cipela
Xi
crna
bijela
ruiasta
smea
Ukupno:

Broj prodanih
cipela
fi
5
1
3
1
10

Izvor: Evidencija prodavaonice "K", svibanj 2005. godine

Ovo je primjer tzv. unimodalnih nizova koji imaju samo jedan


mod. Postoje statistiki nizovi u kojima se dvije ili vie vrijednosti
obiljeja mogu pojavljivati ee u odnosu na ostale modalitete obiljeja.
U tom sluaju kae se su to bimodalni ili multimodalni nizovi. Kod
bimodalne distribucije, koja ima dva vrha, postoji glavni mod i lokalni
mod. Kada je u nizu prisutno vie od jednog moda, potrebno je statistiki
skup podijeliti na vie podskupova, od kojih e svaki imati svoja
karakteristina svojstva, te izvriti analizu svakoga podskupa posebno.

Analitiki primjer 3.3.


Za varijablu (obiljeje) visina u cm (v2) potrebno je odrediti:
a)

Najmanju i najveu vrijednost obiljeja;

b)

Aritmetiku sredinu;

c)

Mod;

d)

Komentirati rezultate!
Rjeenje 3.3:

Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na


njezinu padajuem izborniku Descriptive Statistics i Frequencies.

108

Srednje vrijednosti

U prozoru Frequencies pomou odgovarajue strelice varijabla v2


- visina u cm se prebacuje u polje Variable(s, kako je prikazano na slici
3.1.
Slika 3.1.
Prozor "Frequencies" sa izabranom varijablom (obiljejem) visina u cm
(v2)

Izvor: Simulirani podaci.

Klikom na ikonu Statistics otvara se novi prozor Frequencies


Statistics, gdje je potrebno aktivirati odreene statistike veliine prema
zahtjevu zadatka, a koje se odnose na odabranu varijablu visina u cm
(v2).
Da bi se u izlaznim rezultatima dobila najmanja i najvea
vrijednost niza, u spomenutom prozoru se aktivira Minimum i
Maximum. Aritmetika sredina dobit e se aktiviranjem veliine Mean, a
za mod potrebno je oznaiti Mode. Prozor Frequencies Statistics s
potrebnim aktiviranim veliinama prikazan je na slici 3.2.

109

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slika 3.2.
Prozor "Frequencies Statistics" sa izabranim odgovarajuim statistikim
veliinama

Izvor: Simulirani podaci.

Da bi se u Outputu programa SPSS dobili eljeni podaci o visini


ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je
prikazan u tablici 3.3.
Tablica 3.3.
Statistiki podaci o visini ispitanika
Statistics
Visina u cm
N

Valid
Missing

235
4

Mean

175,77

Mode

172

Minimum

154

Maximum

206

Izvor: Simulirani podaci.

Prema podacima iz tablice 3.3. moe se vidjeti da je 325 ispitanika


dalo odgovor o svojoj visini, dok ih 4 nije odgovorilo na to pitanje.

110

Srednje vrijednosti

Prosjena visina ispitanika u odabranom uzorku (od onih koji su dali


odgovor), odnosno aritmetika sredina je 175,77 cm.
Mod, odnosno najea visina ispitanika je 172 cm.
Najmanja visina ispitanika u uzorku je 154 cm.
Najvea visina ispitanika u uzorku je 206 cm.

Analitiki primjer 3.4.


Za varijablu (obiljeje) prosjena ocjena u srednjoj koli (v3)3
potrebno je odrediti:
a)

Najmanju i najveu vrijednost obiljeja;

b)

Aritmetiku sredinu;

c)

Mod;

d)

Komentirati rezultate!
Rjeenje 3.4:

Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na


njezinu padajuem izborniku Descriptive Statistics i Frequencies.
U prozoru Frequencies pomou odgovarajue strelice varijabla v3
- Prosjena ocjena u srednjoj koli se prebacuje u polje Variable(s).
Klikom na ikonu Statistics otvara se novi prozor Frequencies
Statistics, gdje je potrebno aktivirati odreene statistike veliine prema
zahtjevu zadatka, a koje se odnose na odabranu varijablu prosjena
ocjena u srednjoj koli (v3).
Da bi se u izlaznim rezultatima dobila najmanja i najvea
vrijednost niza, u spomenutom prozoru se aktivira Minimum i
3

Aritmetika sredina se po definiciji izraunava samo za numerika obiljeja, ali se za


cjelovitu analizu esto primjenjuje i za redoslijedno obiljeje.

111

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Maximum. Aritmetika sredina dobit e se aktiviranjem veliine Mean, a


za mod potrebno je oznaiti Mode.
Da bi se u Outputu programa SPSS dobili eljeni podaci o
prosjenoj ocjeni u srednjoj koli ispitanika, potrebno je kliknuti na
Continue, zatim na OK. Rezultat je prikazan u tablici 3.4.
Tablica 3.4.
Statistiki podaci o prosjenoj ocjeni ispitanika u srednjoj koli
Statistics
Prosjecna ocjena u srednjoj skoli
N
Valid

238

Missing

Mean

4,1773

Mode

4,00

Minimum

2,00

Maximum

5,00

Izvor: Simulirani podaci.

Prema podacima iz tablice 3.4. moe se vidjeti da je 238 ispitanika


dalo odgovor o svojoj prosjenoj ocjeni u srednjoj koli, dok 1 ispitanik
nije odgovorio na to pitanje. Prosjena ocjena u srednjoj koli za sve
ispitanike u odabranom uzorku (od onih koji su dali odgovor), odnosno
aritmetika sredina je 4,177.
Mod, odnosno najea prosjena ocjena ispitanika u srednjoj
koli je 4.
Najmanja prosjena ocjena ispitanika u srednjoj koli u uzorku je
2.
Najvea prosjena ocjena ispitanika u srednjoj koli u uzorku je 5.

Analitiki primjer 3.5.


Za varijablu (obiljeje) grupirana ocjena u srednjoj koli (v4)
potrebno je odrediti:
a)

Tablicu frekvencija;

b)

Najmanju i najveu vrijednost obiljeja;

112

Srednje vrijednosti

c)

Aritmetiku sredinu;

d)

Mod;

e)

Komentirati rezultate!
Rjeenje 3.5:

Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na


njezinu padajuem izborniku Descriptive Statistics i Frequencies.
U prozoru Frequencies pomou odgovarajue strelice varijabla v4
- Grupirana ocjena u srednjoj koli se prebacuje u polje Variable(s).
Klikom na ikonu Statistics otvara se novi prozor Frequencies
Statistics, gdje je potrebno aktivirati odreene statistike veliine prema
zahtjevu zadatka, a koje se odnose na odabranu varijablu grupirana
ocjena u srednjoj koli (v4). S obzirom na to da se u ovom primjeru trai i
tablica frekvencija, potrebno je aktivirati Display Frequency Tables.
Da bi se u izlaznim rezultatima dobila najmanja i najvea
vrijednost niza u spomenutom prozoru se aktivira Minimum i Maximum.
Aritmetika sredina dobit e se aktiviranjem veliine Mean, a za mod
potrebno je oznaiti Mode.
Da bi se u Outputu programa SPSS dobili eljeni podaci o
grupiranoj ocjeni ispitanika u srednjoj koli, potrebno je kliknuti na
Continue, zatim na OK. Rezultat je prikazan u tablici 3.5.
Tablica 3.5.
Statistiki podaci o grupiranoj ocjeni ispitanika u srednjoj koli
N

Statistics
Grupirana ocjena u srednjoj skoli
Valid
238
Missing

Mean

4,2269

Mode

4,00

Minimum

2,00

Maximum

5,00

Izvor: Simulirani podaci.

113

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Prema podacima iz tablice 3.5. moe se vidjeti da je 238 ispitanika


dalo odgovor o svojoj prosjenoj ocjeni u srednjoj koli, dok 1 ispitanik
nije odgovorio na to pitanje. Prosjena ocjena u srednjoj koli za sve
ispitanike u odabranom uzorku (od onih koji su dali odgovor), odnosno
aritmetika sredina je 4,23.
Mod, odnosno najea prosjena ocjena u srednjoj koli
ispitanika je 4.
Najmanja prosjena ocjena ispitanika u srednjoj koli u uzorku je
2.
Najvea prosjena ocjena ispitanika u srednjoj koli u uzorku je 5.
U Outputu je dana i tablica frekvencija prema grupiranoj ocjeni u
srednjoj koli. Prikazana je u tablici 3.6.
Tablica 3.6.
Grupirana ocjena u srednjoj skoli

Valid

Frequency
1

Percent
,4

Valid Percent
,4

Cumulative
Percent
,4

3,00

34

14,2

14,3

14,7

4,00

113

47,3

47,5

62,2

5,00

90

37,7

37,8

100,0

Total

238

99,6

100,0

2,00

Missing

System

Total

,4

239

100,0

Izvor: Simulirani podaci.

U stupcu Frequency moe se vidjeti da je od 238 ispitanika koji su


dali odgovor na postavljeno pitanje ocjenu 2 imao samo 1, ocjenu 3 njih
34, ocjenu 4 njih 113, dok je ocjenu 5 imalo 90 ispitanika.

Analitiki primjer 3.6.


Potrebno je dokazati 3 svojstva aritmetike sredine za anketirane
ispitanike prema varijabli (obiljeju) prosjena ocjena u srednjoj koli
(v2) .
114

Srednje vrijednosti

a)

Provjeriti 1. svojstvo da je: x min X x max .

b)

Provjeriti 2. svojstvo da je: ( x i X ) = 0 , (za negrupirani niz).

c)

Provjeriti 3. svojstvo da je:

i =1

i =1

i =1

2
2
( xi X ) ( xi a) ,

(za

negrupirani niz) ako je npr. a = 3 .


Rjeenje 3.6:
a)
Da bi se dokazalo 1. svojstvo da se aritmetika sredina nalazi
izmeu najvee i najmanje vrijednosti obiljeja, treba izraunati
X , x min i x max .
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Frequencies.
U prozoru Frequencies pomou odgovarajue strelice varijabla v2
- Prosjena ocjena u srednjoj koli se prebacuje u polje Variable(s).
Klikom na ikonu Statistics otvara se novi prozor Frequencies
Statistics, gdje je potrebno aktivirati Minimum, Maximum i Mean.
Dalje je potrebno kliknuti na Continue, zatim na OK. Rezultat je
prikazan u tablici 3.7.
Tablica 3.7.
Statistics
Prosjecna ocjena u srednjoj skoli
N
Valid
238
Missing
Mean

1
4,1773

Minimum

2,00

Maximum

5,00

Izvor: Simulirani podaci.

Iz podataka u tablici 3.7. vidi se da je aritmetika sredina 4,1773 i


vrijedi da je izmeu najmanje (2) i najvee (5) vrijednosti obiljeja:
2 4,1773 5 .

115

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

b)
Da bi se dokazalo 2. svojstvo aritmetike sredine da je zbroj
odstupanja vrijednosti obiljeja od prosjeka jednak 0, potrebno je
formirati novi stupac (varijablu) gdje e se izraunati ta odstupanja. Zbroj
svih podataka iz tog novog stupca mora biti 0. Na glavnom izborniku
potrebno je odabrati Transform, a na njegovu padajuem izborniku se
bira Compute. Na taj nain se otvori prozor Compute Variable koji je
prikazan na slici 3.3.
Slika 3.3.
Prozor "Compute Variable" gdje se raunaju odstupanja od prosjeka kao
nova varijabla v3

Izvor: Simulirani podaci.

Pod Target Variable upisuje se novo ime v3, a u Numeric


Expression se upisuje: v 2 4,773 , odnosno da se od svih vrijednosti
varijable v2 oduzme njihov prosjek 4,773. Potrebno je napomenuti da se
decimalni zarez u programu SPSS oznaava tokom. Klikom na OK u
prostoru Data View formira se nova varijabla v3.
116

Srednje vrijednosti

Da bi se vidio zbroj podataka u stupcu na glavnom izborniku


potrebno je izabrati ikonu Analyze, a na njenzinu padajuem izborniku
Descriptive Statistics i Descriptives. Varijabla v3 prebacuje se u
Variable(s). U Options potrebno je aktivirati Sum (dok se druge veliine
mogu deaktivirati jer u ovom sluaju nisu potrebne).
Tablica 3.8.
Zbroj odstupanja vrijednosti obiljeja od prosjeka
Descriptive Statistics
N

Sum

v3

238

Valid N (listwise)

238

,00

Izvor: Simulirani podaci.

Suma vrijednosti novoformirane varijable v3 u zadnjem stupcu


tablice 3.8 je 0, ime je dokazano 2. svojstvo aritmetike sredine.
Da bi se dokazalo 3. svojstvo aritmetike sredine da je zbroj
kvadrata odstupanja vrijednosti obiljeja od prosjeka manje ili jednako
zbroju kvadrata odstupanja vrijednosti obiljeja od bilo kojeg drugog
broja, npr. 3, potrebno je formirati nove stupce gdje e se izraunati ti
kvadrati odstupanja. Usporedbom zbroja tih stupaca dokazat e se
svojstvo 3. Na glavnom izborniku potrebno je odabrati Transform, a na
njegovu padajuem izborniku bira se Compute. Na taj nain se otvori
prozor Compute Variable.
c)

Pod Target Variable upisuje se novo ime v4, a u Numeric


Expression se upisuje: (v 2 4,773) * *2 , odnosno da se od svih vrijednosti
varijable v2 oduzme njihov prosjek 4,773 i sve se kvadrira. Potrebno je
napomenuti da se potencija u programu SPSS oznaava dvjema
zvjezdicama. Klikom na OK u prostoru Data View formira se nova
varijabla v4.
Zatim se ponovo u Target Variable upisuje novo ime v5, a u
Numeric Expression se upisuje: (v 2 3) * *2 , odnosno od svih se
vrijednosti varijable v2 oduzme 3 i sve se kvadrira. Klikom na OK u
prostoru Data View formira se nova varijabla v5.
Da bi se vidio zbroj podataka u ova dva nova stupca v4 i v5 na
glavnom izborniku, potrebno je izabrati ikonu Analyze, a na njezinu

117

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

padajuem izborniku Descriptive Statistics i Descriptives. Varijable v4 i


v5 prebacuju se u Variable(s). U Options potrebno je aktivirati Sum (dok
se druge veliine mogu deaktivirati jer u ovom sluaju nisu potrebne).
Tablica 3.9.
Zbroj kvadrata odstupanja vrijednosti obiljeja od prosjeka i od
vrijednosti 3
Descriptive Statistics
v4

N
238

Sum
103,84

v5

238

433,72

Valid N (listwise)

238

Izvor: Simulirani podaci.

Sume vrijednosti novoformiranih varijabli v4 i v5 prikazane su u


zadnjem stupcu tablice 3.9, ime je dokazano 3. svojstvo aritmetike
N

i =1

i =1

sredine, tj. da je: ( x i X ) 2 ( x i a ) 2 , odnosno da je: 103,84 433,72 .

3.6. Harmonijska sredina


Harmonijska sredina spada u potpune srednje vrijednosti i
rauna se upotrebom svih podataka u statistikom nizu.
Harmonijska sredina je reciprona vrijednost aritmetike
sredine recipronih vrijednosti numerikog obiljeja u jednom nizu.
Ako se radi o negrupiranom statistikom numerikom nizu,
rauna se jednostavna harmonijska sredina:
H =

N
1

i =1 xi
N

(3.7)

Ako se radi o grupiranom statistikom numerikom nizu,


rauna se sloena ili vagana harmonijska sredina:

118

Srednje vrijednosti
k

fi

i =1
k

H =

f
i
i =1 xi

(3.8)

Ponderi su i ovdje apsolutne frekvencije. Ako su veliine razreda


razliite od 1, i za harmonijsku sredinu se radi aproksimacija na nain da
se raunaju sredine razreda xi.
Harmonijska sredina rijetko se primjenjuje u praksi.
Specifino podruje njezine primjene je izraunavanje srednjih
vrijednosti relativnih brojeva koordinacije.
Relativni brojevi koordinacije (Ri), kako je ve reeno,
pokazuju odnos dviju pojava koje ima smisla usporeivati (Ai i Bi).
Ai

Ri =

Bi

(3.9)

Openito srednja vrijednost relativnih brojeva koordinacije je


k

omjer zbroja svih vrijednosti veliine koja se usporeuje ( Ai ) i


i =1

zbroja svih vrijednosti veliine s kojom se usporeuje veliina iz


k

brojnika ( Bi ):
i =1

R=

Ai

i =1
k

(3.10)

Bi

i =1

Katkada u konkretnom statistikom istraivanju nisu dostupni


podaci o veliinama sadranim u relativnom broju koordinacije, pa
su pri izraunavanju njegove srednje vrijednosti mogue 3 situacije:
a) Ako su dostupni podaci o relativnom broju koordinacije (Ri) i o
veliini s kojom se usporeuje veliina iz brojnika (Bi), srednja e
se vrijednost ( R ) izraunati pomou izraza za sloenu ili vaganu
aritmetiku sredinu:

119

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA


k

R=

Ri Bi

i =1
k

(3.11)

Bi

i =1

Na temelju osnovne relacije (3.10) jasno je da vrijedi da je


k

i =1

i =1

veliina iz brojnika: Ai = Ri Bi . Ponderi su ovdje vrijednosti


veliine s kojom se usporeuje veliina iz brojnika: Bi.
b) Ako su dostupni podaci o relativnom broju koordinacije (Ri), bez
informacija o veliinama u brojniku (Ai) i nazivniku (Bi), srednju
vrijednost R nije mogue izraunati. Pokuaj aproksimacije ove
srednje vrijednosti ne daje vjerodostojan rezultat.
c) Ako su dostupni podaci o relativnom broju koordinacije (Ri) i o
veliini koja se usporeuje (Ai), srednja e se vrijednost ( R )
izraunati pomou izraza za sloenu ili vaganu harmonijsku
sredinu:
k

R=

Ai

i =1
k A
i

(3.12)

i =1 Ri

Na temelju osnovne relacije (3.10) jasno je da vrijedi da je


k

i =1

i =1

veliina iz nazivnika: Bi = Ai Ri . Ponderi su ovdje vrijednosti


veliine koja se usporeuje iz brojnika: Ai.
Analitiki primjer 3.7.
Za nekoliko odabranih fakulteta u RH dani su podaci o broju
studenata i broju studenata po 1 nastavniku u akademskoj godini 2004/05.
Zadatak je izraunati prosjean broj studenata po 1 nastavniku za
sve promatrane fakultete zajedno, odnosno prosjek relativnih brojeva
koordinacije ( R ).

120

Srednje vrijednosti

Tablica 3.10.
Broj studenata i broj studenata po 1 nastavniku u nekim odabranim
fakultetima u RH u akademskoj godini 2004/05.
Broj studenata
(Ai)

Fakulteti

Broj studenata po 1
nastavniku (Ri)

Broj nastavnika
(Ai/Ri)=Bi

PMF
3562
8,62469734
413
Graevinski fakulteti
2761
9,17275748
301
Fakult. el. stroj. i brod.
7704
10,1102362
762
Medicinski fakulteti
3315
3,64285714
910
Ekonomski fakulteti
14247
33,0556845
431
31589
64,6062326
2817
Ukupno:
Izvor: Statistiki ljetopis Republike Hrvatske, 2005. godina, str. 492, 495, 496, 497.

Rjeenje 3.7:
S obzirom na to da je u navedenom primjeru poznata (Ai) veliina
koja se usporeuje i relativni brojevi koordinacije (Ri), njihov se prosjek
rauna pomou izraza za sloenu ili vaganu harmonijsku sredinu gdje su
ponderi (Ai):
k

H=

fi

i =1

fi
i =1 x i
k

R=

Ai

i =1

Ai
i =1 Ri
k

31589
= 11,214 .
2817

Prosjean broj studenata po jednom nastavniku za sve promatrane


fakultete u akademskoj godini 2004/05. zajedno iznosi 11,214 studenata
po nastavniku.
3.5. Medijan
Medijan je vrijednost statistikog obiljeja koja ureeni
statistiki niz dijeli na dva jednakobrojna dijela.
Medijan se moe primijeniti na redoslijedne i kvantitativne
statistike nizove, a spada u poloajne srednje vrijednosti. Medijan se ne
primjenjuje kod nominalnih nizova jer poredak oblika ovog obiljeja
moe biti proizvoljan.

121

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Kod negrupiranog, a ureenog niza (po veliini vrijednosti


obiljeja), medijan je vrijednost obiljeja koja pripada elementu
statistikog niza koji se nalazi u sredini niza. Ako je broj elemenata
statistikog niza paran, onda se za medijan uzima jednostavan prosjek
vrijednosti obiljeja dvaju lanova koji se nalaze na sredini statistikog
niza.
Ako je statistiki niz grupiran u razrede, prije raunanja
medijana potrebno je izraunati frekvencije kumulativnog niza "manje
od" ili "vie od", te se u takvom nizu trai sredinji lan. Ako se
raunaju frekvencije kumulativnog niza "manje od", trai se prva
frekvencija niza koja sadri N 2 . Razred koji odgovara ovoj
frekvenciji kumulativnog niza "manje od" je medijalni razred.
Ako su veliine razreda obiljeja jednake 1, vrijednost
obiljeja koja odgovara odabranoj frekvenciji kumulativnog niza je
medijan.
Ako su veliine razreda obiljeja razliite od 1, medijan se
rauna po izrazu:
N m
fi
2
i =1
Me = L1 +
i ,
f med

(3.13)

gdje je:
L1 - donja prava ili precizna granica medijalnog razreda
N 2 - polovica elemenata statistikog niza
m

f i - zbroj svih apsolutnih frekvencija do medijalnog razreda, ne

i =1

ukljuujui medijalni razred (tj. kumulativna frekvencija ispred


kumulativne frekvencije medijalnog razreda)
f med - apsolutna frekvencija medijalnog razreda
i - veliina medijalnog razreda.

122

Srednje vrijednosti

Analitiki primjer 3.8.


Statistiki skup "Sklopljeni brakovi u RH u 2002. godini" prema
kontinuiranom numerikom obiljeju "dob nevjeste", prikazan je u
tablici 3.3.
Zadatak je izraunati medijan, odnosno dob nevjeste koja
promatrani statistiki niz dijeli na dva jednaka dijela.
Tablica 3.11.
Sklopljeni brakovi u RH u 2004. godini prema nevjestinoj dobi
Nevjestina
dob

Sklopljeni
brakovi

Kumulativni
niz
"manje od"

Veliine
razreda

Xi
fi
i
15-20
1903
1903
5
20-25
8104
10007
5
25-30
7335
17342
5
30-35
2820
20162
5
35-45
1516
21678
10
45-(80)
894
22572
35
Ukupno:
22572
Izvor: Statistiki ljetopis Republike Hrvatske, 2005. godina, str. 124.

Rjeenje 3.8.
U tablici 3.11 vidi se da grupirani niz ima veliine razreda
razliite od 1. Stoga je za izraunavanje medijana potrebno odrediti
frekvencije kumulativnog niza "manje od" tako da se postupno zbrajaju
apsolutne frekvencije odozgo prema dolje. Trai se prva frekvencija
kumulativnog niza koja u sebi sadri: N 2 = 22572 2 = 11286 jedinicu. To
je frekvencija 17342, a razred koji odgovara toj frekvenciji je medijalni
razred. Njegova donja granica je L1 = 25 .
N m
fi
11286 10007
2
i =1
Me = L1 +
i = 25 +
5 = 25,87 godina
f med
7335

Dakle, kod polovice sklopljenih brakova u Republici Hrvatskoj u


2002. godini nevjesta je bila mlaa od 25,87 godina, dok je kod preostale
polovice brakova nevjesta bila starija od 25,87 godina.
123

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

U statistikim distribucijama postoji samo jedan medijan i on se


nalazi izmeu najvee i najmanje vrijednosti obiljeja. Prednost medijana
je da na njega ne utjeu ekstremno male ili velike vrijednosti obiljeja, pa
je primjerena srednja vrijednost i kod izrazito asimetrinih distribucija.
3.5.1. Kvantili
Kvantili su vrijednosti statistikog obiljeja koje ureeni
statistiki niz dijele na q jednakobrojnih dijelova.
Kod analize statistikih nizova vrlo su esto u upotrebi kvartili.
Kvartili su vrijednosti statistikog obiljeja koje statistiki niz
dijele na 4 jednakobrojna dijela. Kvartili se mogu podijeliti: na
a) donji kvartil (Q1) i na
b) gornji kvartil (Q3)4 .
Donji kvartil dijeli ureeni statistiki niz na etiri jednaka dijela
u omjeru 1:3, odnosno 25% elemenata statistikog skupa ima vrijednost
obiljeja manju ili jednaku donjem kvartilu, a 75% elemenata statistikog
skupa ima vrijednost obiljeja veu od donjeg kvartila.
Gornji kvartil dijeli ureeni statistiki niz na etiri jednaka dijela
u omjeru 3:1, odnosno 75% elemenata statistikog skupa ima vrijednost
obiljeja manju ili jednaku donjem kvartilu, a 25% elemenata statistikog
skupa ima vrijednost obiljeja veu od gornjeg kvartila.
Kvartili se, slino kao i medijan, mogu primijeniti na redoslijedne
i kvantitativne statistike nizove, a odreuju se poloajem u nizu. Ni oni
se ne primjenjuju kod nominalnih nizova jer, kako je ve naglaeno,
poredak oblika ovog obiljeja moe biti proizvoljan.

Vrijedi da je medijan: Me = Q2 .

124

Srednje vrijednosti

Kod negrupiranog, a ureenog niza (po veliini vrijednosti


obiljeja), donji kvartil je vrijednost obiljeja koja pripada elementu
statistikog niza iji rang (r), tj. mjesto u nizu odgovara:
5

Q1 = xr , gdje je r = INT ( N 4) + 1 , ako N nije djeljiv s 4;


Q1 =

xr + xr +1
, gdje je r = N 4 , (r + 1) = N 4 + 1 , ako je N djeljivo
2

s 4, rauna se prosjek obiljeja koji se nalaze na mjestu u nizu:


r i (r + 1) .
Kod negrupiranog, a ureenog niza (po veliini vrijednosti
obiljeja), gornji kvartil je vrijednost obiljeja koja pripada elementu
statistikog niza iji rang, tj. mjesto u nizu odgovara:
Q3 = xr , gdje je r = INT (3 N 4) + 1 , ako N nije djeljiv s 4;
Q3 =

xr + xr +1
, gdje je r = 3N 4 , (r + 1) = 3 N 4 + 1 , ako je N
2

djeljivo s 4, rauna se prosjek obiljeja koji se nalaze na mjestu u nizu:


r i (r + 1) .
Ako je statistiki niz grupiran u razrede, prije raunanja
kvartila potrebno je izraunati frekvencije kumulativnog niza "manje od"
ili "vie od", te se u takvom nizu trai odgovarajui lan. Ako se raunaju
frekvencije kumulativnog niza "manje od", za donji kvartil se trai prva
frekvencija niza koja sadri N 4 . Za gornji kvartil se trai prva
frekvencija niza koja sadri 3 N 4 . Razred koji odgovara odabranoj
frekvenciji kumulativnog niza "manje od" je razred donjeg, odnosno
gornjeg kvartila.
Ako su veliine razreda obiljeja jednake 1, vrijednost
obiljeja koja odgovara odabranoj frekvenciji kumulativnog niza je
donji, odnosno gornji kvartil.
Ako su veliine razreda obiljeja razliite od 1, donji kvartil se
rauna po izrazu:
5

INT predstavlja cijeli dio decimalnog broja dobivenog dijeljenjem (eng. integer). npr.
INT (6,3) = 6,
INT (6,7) = 6.

125

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

N q
fi
Q1 = L1 + 4 i =1 i ,
f k var t

(3.14)

gdje je:
L1 - donja prava ili precizna granica donje kvatilnog razreda
N 4 - etvrtina elemenata statistikog niza
q

f i - zbroj svih apsolutnih frekvencija do donje kvartilnog razreda, ne

i =1

ukljuujui taj razred (tj. kumulativna frekvencija ispred kumulativne


frekvencije donje kvartilnog razreda)
f k var t - apsolutna frekvencija donje kvartilnog razreda
i - veliina kvartilnog razreda.

Ako su veliine razreda obiljeja razliite od 1, gornji kvartil


se rauna po izrazu:
3N q
fi
Q3 = L1 + 4 i =1 i ,
f k var t

(3.15)

gdje je:
L1 - donja prava ili precizna granica gornje kvatilnog razreda
3N 4 - tri etvrtine elemenata statistikog niza
q

f i - zbroj svih apsolutnih frekvencija do gornje kvartilnog razreda, ne

i =1

ukljuujui taj razred (tj. kumulativna frekvencija ispred kumulativne


frekvencije gornje kvartilnog razreda)
f k var t - apsolutna frekvencija gornje kvartilnog razreda
i - veliina kvartilnog razreda.

Sve srednje vrijednosti se, uz prikazane izraune pomou


apsolutnih frekvencija, na isti nain mogu raunati koritenjem relativnih
frekvencija (proporcija i postotaka).
126

Srednje vrijednosti

Analitiki primjer 3.9.


Statistiki skup "sklopljeni brakovi u RH u 2002. godini" prema
kontinuiranom numerikom obiljeju "nevjestina dob", prikazan je u
tablici 3.12 (ve je prezentiran u analitikom primjeru 3.8).
Zadatak je izraunati donji i gornji kvartil.
Tablica 3.12.
Sklopljeni brakovi u RH u 2004. godini prema nevjestinoj dobi
Nevjestina
dob

Sklopljeni
brakovi

Kumulativni
niz
"manje od"

Veliine
razreda

Xi
fi
i
15-20
1903
1903
5
20-25
8104
10007
5
25-30
7335
17342
5
30-35
2820
20162
5
35-45
1516
21678
10
45-(80)
894
22572
35
Ukupno:
22572
Izvor: Statistiki ljetopis Republike Hrvatske, 2005. godina, str. 124.

Rjeenje 3.9.
U tablici 3.12 vidi se da grupirani niz ima veliine razreda
razliite od 1. Stoga je za izraunavanje kvartila potrebno odrediti
frekvencije kumulativnog niza "manje od" tako da se postupno zbrajaju
apsolutne frekvencije odozgo prema dolje.
Za donji kvartil se trai prva frekvencija kumulativnog niza koja
u sebi sadri:

N 22572
=
= 5643 jedinice.
4
4

To je frekvencija 10007, a

razred koji odgovara toj frekvenciji je donje kvarilni razred. Njegova


donja granica je L1 = 20 .
N q
fi
5643 1903
4
i =1
i = 20 +
5 = 22,31 godina
Q1 = L1 +
f k var t
8104

Dakle, kod jedne etvrtine (tj. 25%) sklopljenih brakova u R.


Hrvatskoj u 2002. godini nevjesta je bila mlaa od 22,31 godine, dok je

127

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

kod preostale tri etvrtine (tj. 75%) brakova nevjesta bila starija od 22,31
godine.
Za gornji kvartil se trai prva frekvencija kumulativnog niza koja
u sebi sadri:

3N 3 22572
=
= 16929 jedinica. To je frekvencija 17342, a
4
4

razred koji odgovara toj frekvenciji je gornje kvarilni razred. Njegova


donja granica je L1 = 25 .
3N q
fi
16929 10007
4
i =1
=
+
i = 25 +
5 = 27,72 godina
Q3 L1
f k var t
7335

Dakle, kod tri etvrtine (tj. 75%) sklopljenih brakova u R.


Hrvatskoj u 2002. godini nevjesta je bila mlaa od 29,48 godina, dok je
kod preostale etvrtine (tj. 25%) brakova nevjesta bila starija od 29,48
godina.

Analitiki primjer 3.10.


Za varijablu (obiljeje) teina u kg (v2) potrebno je odrediti:
a)

Najmanju i najveu vrijednost obiljeja;

b)

Aritmetiku sredinu;

c)

Mod;

d)

Medijan;

e)

Donji i gornji kvartil;

f)

Komentirati rezultate!
Rjeenje 3.10:

Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na


njezinu padajuem izborniku Descriptive Statistics i Frequencies.
U prozoru Frequencies pomou odgovarajue strelice varijabla v2
- teina u kg se prebacuje u polje Variable(s).
128

Srednje vrijednosti

Klikom na ikonu Statistics otvara se novi prozor Frequencies


Statistics, gdje je potrebno aktivirati odreene statistike veliine prema
zahtjevu zadatka, a koje se odnose na odabranu varijablu teina u kg (v2).
Da bi se u izlaznim rezultatima dobile najmanja i najvea
vrijednost niza, u spomenutom se prozoru aktivira Minimum i
Maximum. Aritmetika sredina dobit e se aktiviranjem veliine Mean, a
za mod potrebno je oznaiti Mode. Medijan se dobije aktiviranjem
Median, a donji i gornji kvartil oznaavanjem Quartiles. Prozor
Frequencies Statistics s potrebnim aktiviranim veliinama prikazan je na
slici 3.4.
Slika 3.4.
Prozor "Frequencies Statistics" sa izabranim odgovarajuim statistikim
veliinama

Izvor: Simulirani podaci.

Da bi se u Outputu programa SPSS dobili eljeni podaci o teini


ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je
prikazan u tablici 3.13. Prema tim podacima moe se vidjeti da je 324
ispitanika dalo odgovor o svojoj teini, dok ih 5 nije odgovorilo na to
pitanje. Prosjena teina ispitanika u odabranom uzorku (od onih koji su
dali odgovor), odnosno aritmetika sredina je 67,18 kg.

129

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Tablica 3.13.
Statistiki podaci o teini ispitanika
Statistics
Tezina u kg
N

Valid

234

Missing

Mean

67,1795

Median

64,0000

Mode

52,00

Minimum

46,00

Maximum

110,00

Percentiles

25

56,0000

50

64,0000

75

75,0000

Izvor: Simulirani podaci.

Medijan, odnosno teina koja odabrani uzorak dijeli na 2


jednakobrojna dijela je Me = 64 kg , to znai da je polovica ispitanika
imala teinu manju ili jednaku 64 kg, dok je preostala polovica ispitanika
imala teinu veu od 64 kg.
Mod, odnosno najea teina ispitanika je 52 kg.
Najmanja teina ispitanika u uzorku je 46 kg.
Najvea teina ispitanika u uzorku je 110 kg.
Donji i gornji kvartil dani su meu Percentiles. Donji kvaril
Q1 = 56 kg , to znai da je etvrtina ispitanika imala teinu manju ili
jednaku 56 kg, dok je preostalih tri etvrtine ispitanika imalo teinu veu
od 56 kg. Gornji kvaril Q3 = 75 kg , to znai da je tri etvrtine ispitanika
imalo teinu manju ili jednaku od 75 kg, dok je preostala etvrtina
ispitanika imala teinu veu od 75 kg.

Analitiki primjer 3.11.


Za varijablu (obiljeje) dobiveni deparac (v3) potrebno je
odrediti:

130

Srednje vrijednosti

a)

Najmanju i najveu vrijednost obiljeja;

b)

Aritmetiku sredinu;

c)

Mod;

d)

Medijan;

e)

Donji i gornji kvartil;

f)

Komentirati rezultate!
Rjeenje 3.11:

Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na


njezinu padajuem izborniku Descriptive Statistics i Frequencies.
U prozoru Frequencies pomou odgovarajue strelice varijabla v3
- Koliki deparac dobivate prebacuje se u polje Variable(s). Klikom na
ikonu Statistics otvara se novi prozor Frequencies Statistics, gdje je
potrebno aktivirati odreene statistike veliine prema zahtjevu zadatka, a
koje se odnose na odabranu varijablu deparca (v3).
Da bi se u izlaznim rezultatima dobile najmanja i najvea
vrijednost niza, u spomenutom prozoru aktivira se Minimum i
Maximum. Aritmetika sredina dobit e se aktiviranjem veliine Mean, a
za mod potrebno je oznaiti Mode. Medijan se dobije aktiviranjem
Median, a donji i gornji kvartil oznaavanjem Quartiles. Da bi se u
Outputu programa SPSS dobili eljeni podaci o deparcu ispitanika
potrebno je kliknuti na Continue, zatim na OK. Rezultat je prikazan u
tablici 3.14.
Prema podacima iz tablice 3.14 moe se vidjeti da je 173 ispitanika dalo
odgovor o svom deparcu, dok ih 66 nije odgovorilo na to pitanje.
Prosjeni deparac ispitanika u odabranom uzorku (od onih koji su dali
odgovor), odnosno aritmetika sredina je 371,55 kn.
Medijan, odnosno deparac koji odabrani uzorak dijeli na 2
jednakobrojna dijela je Me = 300 kn , to znai da je polovica ispitanika
imala deparac manji ili jednak 300 kn, dok je preostala polovica
ispitanika imala deparac vei od 300 kn.

131

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Tablica 3.14.
Statistiki podaci o deparcu ispitanika
Statistics
Koliki dzeparac dobivate
N
Valid
Missing

173
66

Mean

371,5491

Median

300,0000

Mode

200,00(a)

Minimum

,00

Maximum
Percentiles

3500,00
25

150,0000

50

300,0000

75

500,0000

a Multiple modes exist. The smallest value is shown

Izvor: Simulirani podaci.

Mod, odnosno najei deparac ispitanika je 200 kn. Moe se


vidjeti napomena ispod tablice koja se odnosi na mod. Zadana distribucija
uzorka ima vie od 1 moda, a u tablici Outputa dana je najmanja
vrijednost. Ako se u Outputu jo zatrai i prikaz tablice frekvencija
(aktivira se Display frequency tables), moe se vidjeti da je 26 ispitanika
imalo deparac od 200 kn i a da ih je isto toliko imalo deparac od 300
kn. Dakle ovo je jedna bimodalna distribucija. Jedan mod je 200 kn, a
drugi mod je 300 kn.
Najmanji deparac ispitanika u uzorku je 0,00 kn.
Najvei deparac ispitanika u uzorku je 3500,00 kn.
Donji i gornji kvartil dani su meu Percentiles. Donji kvaril
Q1 = 150 kn , to znai da je etvrtina ispitanika imala deparac manji od

500 kn ili jednak tom iznosu, dok je preostalih tri etvrtine ispitanika
imalo deparac vei od 150 kn. Gornji kvaril Q3 = 500 kn , to znai da je
tri etvrtine ispitanika imalo deparac manji od 500 kn ili jednak tom
iznosu, dok je preostala etvrtina ispitanika imala deparac vei od 500
kn.

132

Mjere disperzije, asimetrija i zaobljenost

4. MJERE DISPERZIJE, ASIMETRIJA I


ZAOBLJENOST
4.1. Mjere disperzije
Moe se dogoditi da neki statistiki skupovi imaju jednake npr.
aritmetike sredine, a da su njihovi elementi potpuno razliiti. To znai
da je raspored elemenata u tim skupovima razliit. Informaciju o
rasporedu elemenata daju mjere rasprenosti ili disperzije elemenata
numerikog statistikog niza.
Postoje apsolutne i relativne mjere rasprenosti. Apsolutni
pokazatelji izraeni su u originalnim jedinicama mjere i omoguavaju
usporedbu nizova prema istom obiljeju. Apsolutni pokazatelji
rasprenosti su: raspon varijacije, interkvartil, varijanca i
standardna devijacija.
Usporedbu rasprenosti elemenata nizova s razliitom mjernom
jedinicom omoguuju relativni pokazatelji, koji su najee izraeni u
postotcima. Relativni pokazatelji rasprenost su: koeficijent kvartilne
devijacije i koeficijent varijacije.
4.1.1. Apsolutne mjere disperzije
Raspon varijacije je najjednostavnija mjera disperzije, a
predstavlja razliku izmeu najvee i najmanje vrijednosti
numerikog obiljeja promatranog niza.
R = xmax xmin

(4.1)

Ovaj apsolutni pokazatelj rasprenosti izraen je u originalnim


jedinicama mjere numerikog obiljeja. Moe poprimiti vrijednost 0. To
se dogaa kada svi elementi niza imaju jednaku vrijednost obiljeja.

133

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Najvea vrijednost toga pokazatelja nije ograniena jer ona ovisi o


konkretnoj rasprenosti promatranih vrijednosti obiljeja.
Raspon varijacije je nepotpuna mjera disperzije jer se rauna samo
na temelju dvije vrijednosti obiljeja, odnosno na temelju najvee i
najmanje vrijednosti. Moe se rei da to nije precizna mjera rasprenosti
elemenata niza, pogotovo u sluaju postojanja ekstremno malih i/ili
ekstremno velikih vrijednosti obiljeja. Tada se dobije veliki raspon
varijacije, a moda je veina elemenata skupa rasprena usko oko
srednjih vrijednosti.
Taj problem
interkvartil.

preciznosti

rjeava

interkvartilni

raspon

ili

Interkvartil je apsolutna, nepotpuna mjera rasprenosti koja


pokazuje disperziju srednjih 50% elemenata ureenoga numerikog
niza.
I q = Q3 Q1

(4.2)

Interkvartil predstavlja razliku gornjeg i donjeg kvartila. Na


taj nain se eliminira 25% ekstremno malih i 25% ekstremno velikih
vrijednosti obiljeja u nizu.
Slika 4.1.
Simetrina distribucija s oznaenim gornjim i donjim kvartilom
fi

50%
25%

Q1

25%

Q3

xi

Izvor: Konstrukcija autora.

Slika 4.1. prikazuje jednu simetrinu distribuciju gdje su elementi


skupa ravnomjerno rasporeeni oko srednjih vrijednosti. Poznato je da
134

Mjere disperzije, asimetrija i zaobljenost

donji kvartil (Q1) dijeli distribuciju u omjeru 1:3, tj. da 25% elemenata
skupa ima vrijednost obiljeja manju od donjeg kvartila, a 75% elemenata
skupa ima vrijednost obiljeja veu od donjeg kvartila. Isto tako gornji
kvartil (Q3) dijeli distribuciju u omjeru 3:1, tj. da 75% elemenata skupa
ima vrijednost obiljeja manju od gornjeg kvartila, a 25% elemenata
skupa ima vrijednost obiljeja veu od gornjeg kvartila. Na taj nain
interkvartil pokazuje disperziju srednjih 50% elemenata skupa.
Varijanca spada u potpune mjere rasprenosti jer obuhvaa
sve elemente odabranoga numerikog statistikog niza. Ovaj pokazatelj
mjeri odstupanja, tj. rasprenost elemenata skupa od aritmetike sredine.
S obzirom na poznato svojstvo aritmetike sredine da je zbroj
odstupanja vrijednosti obiljeja od aritmetike sredine u jednoj
N

distribuciji uvijek nula, tj. da je: ( xi X ) = 0 (za negrupirani niz) i


i =1

f i ( xi X ) = 0 (za grupirani niz), varijanca se izraava preko kvadrata

i =1

ovih odstupanja.
Varijanca je prosjeno kvadratno odstupanje vrijednosti
numerikog obiljeja od aritmetike sredine.
N

2 =

xi X

i =1

xi

i =1

X2,

(4.3)

za negrupirani niz i
k

2 =

f i xi X

i =1

fi

i =1

2
f i xi

i =1
k

X2,

(4.4)

fi

i =1

za grupirani niz.
Varijanca je mjera rasprenosti izraena u drugom stupnju, pa kao
rezultat daje jedinice mjere numerikog obiljeja na kvadrat. Stoga je
oteana njezina interpretacija.
Standardna devijacija je pozitivan korijen iz varijance i
izraena je u originalnim jedinicama mjere. Stoga je kao potpuna i

135

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

apsolutna mjera disperzije vrlo esto u upotrebi. Moe se definirati kao


prosjeno odstupanje vrijednosti numerikog obiljeja od
aritmetike sredine.
(xi X )
N

=+ 2 =+

i =1

=+

xi

i =1

X2 ,

(4.5)

za negrupirani niz.
f i (x i X )
k

=+ =+
2

i =1

=+

fi

f i xi

i =1
k

X2 ,

(4.6)

fi

i =1

i =1

za grupirani niz. Pomou standardne devijacije u originalnim mjernim


jedinicama obiljeja moe se usporeivati rasprenost oko aritmetike
sredine nizova koji su grupirani po jednakom obiljeju.
Analitiki primjer 4.1.
Zadan je statistiki numeriki niz "Zaposleni u sektoru
Obrazovanje u RH prema dobi, stanje 31. oujka 2004. god.". Zadatak je
izraunati raspon varijacije obiljeja, interkvartil, varijancu i standardnu
devijaciju vrijednosti ovog obiljeja.
Tablica 4.1.
Zaposleni u sektoru Obrazovanje u RH, stanje 31. oujka 2004. god.
Dob
xi

(18)-30
30-35
35-40
40-45
45-50
50-55
55-60
60-(70)
Ukupno:

Br.
zaposlenih fi

10172
11082
12430
14130
12830
12040
10039
5990
88713

Kum.niz "<"

9779
20861
33291
47421
60251
72291
82330
88320
-

Veli.
razreda i

12
5
5
5
5
5
5
10
-

Izvor: Statistiki ljetopis Republike Hrvatske, 2005. godina, str. 144.

136

Mjere disperzije, asimetrija i zaobljenost

Rjeenje 4.1:
Raspon varijacije obiljeja:
R = x max x min = 70 18 = 52 godine

Raspon varijacije ovog numerikog obiljeja dobije se kao razlika


najvee i najmanje vrijednosti obiljeja, a iznosi 52 godine.
Interkvartil:
U tablici 4.1. prikazan je grupirani niz koji ima veliine razreda
razliite od 1. Stoga je za izraunavanje kvartila potrebno odrediti
frekvencije kumulativnog niza "manje od" tako da se postupno zbrajaju
apsolutne frekvencije odozgo prema dolje.
Za donji kvartil se trai prva frekvencija kumulativnog niza koja u sebi
sadri:

N 88713
=
= 22178,25 jedinica. To je frekvencija 33291, a razred
4
4

koji odgovara toj frekvenciji je donje kvarilni razred. Njegova donja


granica je L1 = 35 .
N q
fi
22178,25 20861
5 = 35,53
Q1 = L1 + 4 i =1 i = 35 +
12430
f k var t

Dakle, jedna etvrtina (tj. 25%) zaposlenih u Obrazovanju u


Republici Hrvatskoj u 2004. godini je bilo mlae od 35,53 godina, dok je
preostalih tri etvrtine zaposlenih (tj. 75%) bilo starije od 35,53 godina.
Za gornji kvartil se trai prva frekvencija kumulativnog niza koja
u sebi sadri:

3 N 3 88713
=
= 66534,75 jedinica. To je frekvencija 72291,
4
4

a razred koji odgovara toj frekvenciji je gornje kvarilni razred. Njegova


donja granica je L1 = 50 .
3N q
fi
66534,75 60251
4
i =1
i = 50 +
5 = 52,61
Q3 = L1 +
12040
f k var t

137

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Dakle, tri etvrtine (tj. 75%) zaposlenih u Obrazovanju u R


Hrvatskoj u 2002. godini je bilo mlae od 52,61 godina, dok je preostala
etvrtina zaposlenih (tj. 25%) bilo starije od 52,61 godina.
Interkvartil je razlika kvartila:
I q = Q3 Q1 = 52,61 35,53 = 17,08 godina

Dakle, dob srednjih 50% zaposlenih u Obrazovanju u ovoj


distribuciji varira u rasponu od 17,08 godina.
Da bi se izraunala varijanca i standardna devijacija vrijednosti
ovog obiljeja, prikazani su podaci u tablici 4.2.
Tablica 4.2.
Zaposleni u sektoru Obrazovanje u RH, stanje 31. oujka 2004. god.
Dob
xi

Broj
zaposlenih
fi

(18)-30
30-35
35-40
40-45
45-50
50-55
55-60
60-(70)
Ukupno:

10172
11082
12430
14130
12830
12040
10039
5990
88713

Sredina
razreda
xi

f i xi

24
32,5
37,5
42,5
47,5
52,5
57,5
65
-

244128
360165
466125
600525
609425
632100
577242,5
389350
3879061

f i ( xi X ) 2

f i xi 2

3958060
5859072
1396576 11705363
481817,8 17479688
21236,85 25522313
182743,2 28947688
926886,1 33185250
1904643 33191444
2710985 25307750
11582947 181198566

Izvor: Statistiki ljetopis Republike Hrvatske, 2005. godina, str. 144.

Zadatak je izraunati varijancu i standardnu devijaciju


vrijednosti zadanog obiljeja.
Ovo je grupirani niz. Varijanca i standardna devijacija raunaju se
po izrazima od (4.3) do (4.6). Najprije je potrebno izraunati sloenu
aritmetiku sredinu za negrupirane nizove.
k

X=

f i xi

i =1
k

fi

i =1

138

3879061
= 43,726 godina
88713

Mjere disperzije, asimetrija i zaobljenost

Dakle, prosjena dob zaposlenih u sektoru Obrazovanje u RH,


stanje 31. oujka 2004. god., 43,726 je godina. Varijanca je:
f i (xi X )
k

2 = i =1

fi

11582947
2
= 130,57 godina .
88713

i =1

Vrijednosti iz brojnika, f i (xi X ) , u izrazu za varijancu su


k

i =1

izraunate u 5. stupcu tablice, a njihova suma je dana u zbirnom retku.


Isti rezultat se moe dobiti i preko izvedene formule za varijancu
grupiranih nizova (4.6):
k

=
2

f i xi

i =1
k

fi

X2 =

181198566
2
43,726 2 = 130,57 godina .
88713

i =1

Zbroj fi xi 2 dan je u tablici 4.2. u posljednjem retku. Varijanca je


mjera rasprenosti vrijednosti obiljeja u drugom stupnju pa je izraena u
jedinicama mjere na kvadrat. Dalje se rauna standardna devijacija koja
se izraava u originalnim mjernim jedinicama. Standardna devijacija je
pozitivan korijen iz varijance:
= + 2 = + 130,57 = 11,43 godina.

Dakle, prosjeno odstupanje vrijednosti ovog numerikog


obiljeja od aritmetike sredine je 11,43 godina.
4.1.2. Relativne mjere disperzije
Koeficijent varijacije spada u potpune relativne mjere
rasprenosti jer obuhvaa sve elemente odabranog numerikoga
statistikog niza, a izraava se u postotcima (%).
Koeficijent varijacije je postotak standardne devijacije od
aritmetike sredine.

139

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

V =

100 .

(4.7)

Vrijednost koeficijenta varijacije se kree u intervalu 0 V < + .


Vrijednost od 0% e poprimiti samo u sluaju kada su sve vrijednosti
numerikog obiljeja u jednom nizu jednake, odnosno kada nema
disperzije. Vea vrijednost ovog pokazatelja upuuje na veu disperziju
elemenata promatranog niza.
Taj pokazatelj rasprenosti je izraen u postotcima, pa omoguuje
usporedbu disperzije numerikih nizova s razliitim jedinicama mjere.
Koeficijent kvartilne devijacije je relativna nepotpuna mjera
rasprenosti. Predstavlja relativnu disperziju srednjih 50%
elemenata numerikog niza. Rauna se na temelju samo dviju
vrijednosti obiljeja, a to su donji i gornji kvartil.
Vq =

Q3 Q1
Q3 + Q1

(4.8)

Koeficijent kvartilne devijacije se rauna kao omjer interkvarila


(razlika kvartila) i zbroja donjeg i gornjeg kvartila. Vrijedi da je:
0 Vq < 1

(4.9)

Ovaj pokazatelj je jednak 0 samo kada nema disperzije. Ako se


njegova vrijednost pribliava 1, to znai da je rasprenost vrijednosti
obiljeja vea.
S obzirom na to da je to relativni pokazatelj, pomou njega je
mogue usporeivati rasprenost srednjih 50% elemenata razliitih
numerikih distribucija s razliitim jedinicama mjere.
Analitiki primjer 4.2.
Prema podacima o statistikom numerikom nizu "Zaposleni u
sektoru Obrazovanje u RH prema dobi, stanje 31. oujka 2004. god.",
koji su dani u analitikom primjeru 4.1., zadatak je izraunati koeficijent
varijacije i koeficijent kvartilne devijacije.

140

Mjere disperzije, asimetrija i zaobljenost

Rjeenje 4.2:
Koeficijent varijacije:
V=

100 =

11,4266
100 = 26,132%
43,72595

Postotak standardne devijacije od aritmetike sredine u zadanom


nizu je 26,132%.
Koeficijent kvartilne devijacije.
Vq =

Iq
Q3 Q1
17,08
=
=
= 0,194
Q3 + Q1 Q3 + Q1 52,61 + 35,53

Dakle, dob srednjih 50% zaposlenih u Obrazovanju u ovoj


distribuciji pokazuje slabu rasprenost 0,194 (s obzirom na to da se
pokazatelj kree u intervalu izmeu 0 i 1).

Analitiki primjer 4.3.


Za varijablu (obiljeje) visina u cm (v2) potrebno je odrediti:
a)

Tablicu frekvencija;

b)

Raspon varijacije obiljeja;

c)

Aritmetiku sredinu;

d)

Donji i gornji kvartil;

e)

Varijancu;

f)

Standardnu devijaciju;

g)
Na temelju toga izraunati: interkvartil, koeficijent varijacije i
koeficijent kvartilne devijacije;
h)

Komentirati rezultate!

141

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Rjeenje 4.3:
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Frequencies.
U prozoru Frequencies pomou odgovarajue strelice varijabla v2
- Visina u cm se prebacuje u polje Variable(s). Klikom na ikonu
Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno
aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se
odnose na odabranu varijablu visine u cm (v2).
Da bi se u izlaznim rezultatima dobio raspon varijacije obiljeja
niza, u spomenutom prozoru aktivira se Range. Aritmetika sredina dobit
e se aktiviranjem veliine Mean, a za mod potrebno je oznaiti Mode.
Donji i gornji kvartil dobiju se oznaavanjem Quartiles. Stanardna
devijacija i varijanca dobiju se aktiviranjem Std. deviation i Variance.
Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o
visini ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat
je prikazan u tablici 4.3.
Tablica 4.3.
Statistiki podaci o visini ispitanika
Statistics
Visina u cm
N

Valid
Missing

Mean

4
175,77

Std. Deviation

8,749

Variance

76,539

Range
Percentiles

235

52
25

170,00

50

174,00

75

182,00

Izvor: Simulirani podaci.

Prema podacima iz tablice 4.3. moe se vidjeti da je 235 ispitanika


dalo odgovor o svojoj visini, dok ih 4 nije odgovorilo na to pitanje.
Prosjena visina ispitanika u odabranom uzorku (od onih koji su dali
odgovor), odnosno aritmetika sredina je 175,77 cm.

142

Mjere disperzije, asimetrija i zaobljenost

Razlika izmeu najvee i najmanje visine ispitanika u uzorku, tj.


raspon varijacije obiljeja je 52 cm.
Donji i gornji kvartil dani su kao Percentiles. Donji kvaril
Q1 = 170 cm , to znai da je etvrtina ispitanika imala visinu manju od

170 cm ili jednaku toj visinu, dok je preostalih tri etvrtine ispitanika bilo
s visinom veom od 170 cm. Gornji kvartil Q3 = 182 cm , to znai da je tri
etvrtine ispitanika bilo s visinom manjom od 182 cm ili jednakom toj
visini, dok je preostala etvrtina ispitanika imala visinu veu od 182 cm.
Varijanca zadanog niza, prosjeno kvadratno odstupanje
vrijednosti zadanog obiljeja od prosjeka je 76,539 cm2. Korijen iz
varijance, tj. standardna devijacija zadanog niza je 8,749 cm.
Na temelju ovih podataka iz Outputa programa SPSS moe se
izraunati interkvartil, koeficijent varijacije i koeficijent kvartilne
devijacije.
Interkvartil je razlika kvartila:
I q = Q3 Q1 = 182 170 = 12 cm.

Dakle, visina srednjih 50% ispitanika u ovoj distribuciji varira u


rasponu od 12 cm.
Koeficijent varijacije je:
V=

100 =

8,749
100 = 4,98% .
175,77

Postotak standardne devijacije od aritmetike sredine u zadanom


nizu je 4,98% i upuuje na vrlo malu disperziju i veliku reprezentativnost
aritmetike sredine.
Koeficijent kvartilne devijacije je:
Vq =

Iq
Q3 Q1
12
=
=
= 0,034 .
Q3 + Q1 Q3 + Q1 182 + 170

Dakle, visina srednjih 50% ispitanika u ovoj distribuciji pokazuje


izrazito slabu rasprenost 0,034 (s obzirom na to da se pokazatelj kree u
intervalu izmeu 0 i 1).

143

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Analitiki primjer 4.4.


Za varijablu (obiljeje) teina u kg (v2) potrebno je odrediti:
a)

Tablicu frekvencija;

b)

Raspon varijacije obiljeja;

c)

Aritmetiku sredinu;

d)

Donji i gornji kvartil;

e)

Varijancu;

f)

Standardnu devijaciju;

g)
Na temelju toga izraunati: interkvartil, koeficijent varijacije i
koeficijent kvartilne devijacije;
h)

Komentirati rezultate!
Rjeenje 4.4:

Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na


njezinu padajuem izborniku Descriptive Statistics i Frequencies.
U prozoru Frequencies pomou odgovarajue strelice varijabla v2
- Teina u kg se prebacuje u polje Variable(s). Klikom na ikonu Statistics
otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati
odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na
odabranu varijablu teine u kg (v2).
Da bi se u izlaznim rezultatima dobio raspon varijacije obiljeja
niza, u spomenutom prozoru aktivira se Range. Aritmetika sredina dobit
e se aktiviranjem veliine Mean, a za mod potrebno je oznaiti Mode.
Donji i gornji kvartil dobiju se oznaavanjem Quartiles. Stanardna
devijacija i varijanca dobiju se aktiviranjem Std. deviation i Variance.
Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o
teini ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat
je prikazan u tablici 4.4.
Prema podacima iz tablice 4.4. moe se vidjeti da je 234 ispitanika
dalo odgovor o svojoj teini, dok ih 5 nije odgovorilo na to pitanje.
144

Mjere disperzije, asimetrija i zaobljenost

Prosjena teina ispitanika u odabranom uzorku (od onih koji su dali


odgovor), odnosno aritmetika sredina je 67,1795 kg.
Razlika izmeu najvee i najmanje teine ispitanika u uzorku, tj.
raspon varijacije obiljeja je 64 kg.
Tablica 4.4.
Statistiki podaci o teini ispitanika
Statistics
Tezina u kg
N

Valid

234

Missing
Mean

5
67,1795

Std. Deviation

13,52735

Variance

182,989

Range

64,00

Percentiles

25

56,0000

50

64,0000

75

75,0000

Izvor: Simulirani podaci.

Donji i gornji kvartil dani su kao Percentiles. Donji kvaril


Q1 = 56 kg , to znai da je etvrtina ispitanika imala teinu manju od 56
kg ili jednaku toj teini, dok je preostalih tri etvrtine ispitanika bilo s
teinom veom od 56 kg. Gornji kvartil Q3 = 75 kg , to znai da je tri
etvrtine ispitanika bilo s teinom manjom od 75 kg ili jednakom tom
teinom, dok je preostala etvrtina ispitanika imala teinu veu od 75 kg.
Varijanca zadanog niza, prosjeno kvadratno odstupanje
vrijednosti zadanog obiljeja od prosjeka je 182,989 kg2. Korijen iz
varijance, tj. standardna devijacija zadanog niza je 13,53 kg.
Na temelju ovih podataka iz Outputa programa SPSS moe se
izraunati interkvartil, koeficijent varijacije i koeficijent kvartilne
devijacije.
Interkvartil je razlika kvartila:
I q = Q3 Q1 = 75 56 = 19 kg.

145

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Dakle, teina srednjih 50% ispitanika u ovoj distribuciji varira u


rasponu od 19 kg.
Koeficijent varijacije je:
V=

100 =

13,52735
100 = 20,136%
67,1795

Postotak standardne devijacije od aritmetike sredine u zadanom


nizu je 20,136%. Reprezentativnost je velika, a disperzija mala.
Koeficijent kvartilne devijacije je:
Vq =

Iq
Q3 Q1
19
=
=
= 0,145
Q3 + Q1 Q3 + Q1 75 + 56

Dakle, visina srednjih 50% ispitanika u ovoj distribuciji pokazuje


slabu rasprenost 0,145.

Analitiki primjer 4.5.


Za varijablu (obiljeje) dobiveni deparac (v2) potrebno je odrediti:
a)

Tablicu frekvencija;

b)

Raspon varijacije obiljeja;

c)

Aritmetiku sredinu;

d)

Donji i gornji kvartil;

e)

Varijancu;

f)

Standardnu devijaciju;

g)
Na temelju toga izraunati: interkvartil, koeficijent varijacije i
koeficijent kvartilne devijacije;
h)

Komentirati rezultate!
Rjeenje 4.5:

Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na


njezinu padajuem izborniku Descriptive Statistics i Frequencies.
146

Mjere disperzije, asimetrija i zaobljenost

U prozoru Frequencies pomou odgovarajue strelice varijabla v2


- Dobiveni deparac se prebacuje u polje Variable(s). Klikom na ikonu
Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno
aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se
odnose na odabranu varijablu dobiveni deparac (v2).
Da bi se u izlaznim rezultatima dobio raspon varijacije obiljeja
niza u spomenutom prozoru aktivira se Range. Aritmetika sredina dobit
e se aktiviranjem veliine Mean, a za mod potrebno je oznaiti Mode.
Donji i gornji kvartil dobiju se oznaavanjem Quartiles. Stanardna
devijacija i varijanca dobiju se aktiviranjem Std. deviation i Variance.
Konano, da bi se u Outputu programa SPSS dobili eljeni podaci o
dobivenom deparcu ispitanika, potrebno je kliknuti na Continue, zatim
na OK. Rezultat je prikazan u tablici 4.5.
Tablica 4.5.
Statistiki podaci o deparcu ispitanika
Statistics
Dobiveni dzeparac
N
Valid
Missing
Mean

173
66
371,5491

Std. Deviation

401,30549

Variance

161046,098

Range

3500,00

Percentiles

25

150,0000

50

300,0000

75

500,0000

Izvor: Simulirani podaci.

Prema podacima iz tablice 4.5. moe se vidjeti da je 173 ispitanika


dalo odgovor o svojom deparcu, dok ih 66 nije odgovorilo na to pitanje.
Prosjeni deparac ispitanika u odabranom uzorku (od onih koji su dali
odgovor), odnosno aritmetika sredina je 371,55 kn.
Razlika izmeu najvee i najmanje teine ispitanika u uzorku, tj.
raspon varijacije obiljeja je 3500 kn.
Donji i gornji kvartil dani su kao Percentiles. Donji kvaril
Q1 = 150 kn , to znai da je etvrtina ispitanika imala deparac manji od

147

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

150 kn ili jednak tom iznosu, dok je preostalih tri etvrtine ispitanika bilo
s deparcem veim od 150 kn. Gornji kvartil Q3 = 500 kn , to znai da je
tri etvrtine ispitanika bilo s deparcem manjim od 500 kn ili jednakim
tom iznosu, dok je preostala etvrtina ispitanika imala deparac vei od
500 kn.
Varijanca zadanog niza, prosjeno kvadratno odstupanje
vrijednosti zadanog obiljeja od prosjeka je 161046,1 kn2. Korijen iz
varijance, tj. standardna devijacija zadanog niza je 401,31 kn.
Na temelju ovih podataka iz Outputa programa SPSS moe se
izraunati interkvartil, koeficijent varijacije i koeficijent kvartilne
devijacije.
Interkvartil je razlika kvartila:
I q = Q3 Q1 = 500 150 = 350 kn.

Dakle, deparac srednjih 50% ispitanika u ovoj distribuciji varira


u rasponu od 350 kn.
Koeficijent varijacije je:
V=

100 =

401,30549
100 = 108,01% .
371,5491

Postotak standardne devijacije od aritmetike sredine u zadanom


nizu je 108,01%, to ukazuje na jako veliku disperziju deparca izmeu
promatranih ispitanika i malu reprezentativnost X .
Koeficijent kvartilne devijacije je:
Vq =

Iq
Q3 Q1
350
=
=
= 0,538 .
Q3 + Q1 Q3 + Q1 500 + 150

Dakle, visina srednjih 50% ispitanika u ovoj distribuciji pokazuje


prilinu rasprenost od 0,538.

Analitiki primjer 4.6.


Za varijablu (obiljeje) broj djece u obitelji (v2) potrebno je odrediti:

148

Mjere disperzije, asimetrija i zaobljenost

a)

Tablicu frekvencija;

b)

Raspon varijacije obiljeja;

c)

Aritmetiku sredinu;

d)

Donji i gornji kvartil;

e)

Varijancu;

f)

Standardnu devijaciju;

g)
Na temelju toga izraunati: interkvartil, koeficijent varijacije i
koeficijent kvartilne devijacije;
h)

Komentirati rezultate!
Rjeenje 4.6:

Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na


njezinu padajuem izborniku Descriptive Statistics i Frequencies.
U prozoru Frequencies pomou odgovarajue strelice varijabla v2
- Broj djece u obitelji se prebacuje u polje Variable(s). Klikom na ikonu
Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno
aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se
odnose na odabranu varijablu broj djece u obitelji (v2).
Da bi se u izlaznim rezultatima dobio raspon varijacije obiljeja
niza, u spomenutom prozoru aktivira se Range. Aritmetika sredina dobit
e se aktiviranjem veliine Mean, a za mod potrebno je oznaiti Mode.
Donji i gornji kvartil dobiju se oznaavanjem Quartiles. Stanardna
devijacija i varijanca dobiju se aktiviranjem Std. deviation i Variance.
Konano, da bi se u Outputu programa SPSS dobili eljeni podaci
o broju djece u obitelji ispitanika, potrebno je kliknuti na Continue, zatim
na OK. Rezultat je prikazan u tablici 4.6.
Prema podacima iz tablice 4.6. moe se vidjeti da je 238 ispitanika
dalo odgovor o broju djece u obitelji, dok 1 nije odgovorio na to pitanje.
Prosjeni broj djece u obitelji ispitanika u odabranom uzorku (od onih
koji su dali odgovor), odnosno aritmetika sredina je 2,34. S obzirom na

149

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

to da broj djece spada u diskontinuirana numerika obiljeja, ovaj rezultat


se moe komentirati kao prosjeno 2 djece po obitelji ispitanika.
Tablica 4.6.
Statistiki podaci o broju djece u obitelji ispitanika
Statistics
Broj djece u obitelji
N
Valid

238

Missing

Mean

2,34

Std. Deviation

,870

Variance

,757

Range

Percentiles

25

2,00

50

2,00

75

3,00

Izvor: Simulirani podaci.

Razlika izmeu najveeg i najmanjeg broja djece u obitelji


ispitanika u uzorku, tj. raspon varijacije obiljeja je 6 djece.
Donji i gornji kvartil dani su kao Percentiles. Donji kvaril Q1 = 2
djece, to znai da je etvrtina ispitanika imala broj djece u obitelji manji
od 2 ili jednak 2, dok je preostalih tri etvrtine ispitanika bilo s vie od 2
djece u obitelji. Gornji kvartil Q3 = 3 djece, to znai da je tri etvrtine
ispitanika bilo s brojem djece u obitelji manjim od 3 ili jednakim 3, dok
je preostala etvrtina ispitanika imala vie od 3 djece u obitelji.
Varijanca zadanog niza, prosjeno kvadratno odstupanje
vrijednosti zadanog obiljeja od prosjeka je 0,757 djece2. Korijen iz
varijance, tj. standardna devijacija zadanog niza je 0,87 djece. Obje
vrijednosti se mogu zaokruiti na 1, s obzirom na to da se radi o
diskontinuiranom numerikom obiljeju.
Na temelju ovih podataka iz Outputa programa SPSS moe se
izraunati interkvartil, koeficijent varijacije i koeficijent kvartilne
devijacije.
Interkvartil je razlika kvartila:
I q = Q3 Q1 = 3 2 = 1 dijete.

150

Mjere disperzije, asimetrija i zaobljenost

Dakle, broj djece u obitelji srednjih 50% ispitanika u ovoj


distribuciji varira u rasponu od 1 djeteta.
Koeficijent varijacije je:
V=

100 =

0,870
100 = 37,18% .
2,34

Postotak standardne devijacije od aritmetike sredine u zadanom


nizu je 37,18%.
Koeficijent kvartilne devijacije je:
Vq =

Iq
Q3 Q1
1
=
=
= 0,2 .
Q3 + Q1 Q3 + Q1 3 + 2

Dakle, broj djece srednjih 50% ispitanika u ovoj distribuciji


pokazuje slabu rasprenost od 0,2.
4.1.3. Momenti numerikih nizova
Momenti su prosjena odstupanja vrijednosti numerikog
obiljeja od aritmetike sredine ili neke druge vrijednosti podignuti na rtu potenciju.
Momenti numerikih nizova mogu biti glavni i pomoni.
Glavni ili centralni momenti numerikih nizova su momenti
oko aritmetike sredine:
(x i X )
N

r = i =1

r = 0,1,2,...

f i (x i X )
k

r = i =1

- za negrupirani niz. (4.9)

r = 0,1,2,...

- za grupirani niz.

(4.10)

fi

i =1

Centralni moment nultog reda: 0 = 1 .


Centralni moment prvog reda: 1 = 0 .
151

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Pomoni momenti numerikih nizova su momenti oko nule6:


N

mr =

xi

i =1

r = 0,1,2,...

- za negrupirani niz. (4.11)

mr =

r
f i xi

i =1
k

r = 0,1,2,...

- za grupirani niz.

(4.12)

fi

i =1

Pomoni moment nultog reda: m0 = 1 .


Pomoni moment prvog reda: m1 = X .
Centralni momenti oko aritmetike sredine mogu se izraziti preko
pomonih momenata.
Centralni moment drugog reda:
2 = m 2 m12 .

(4.13)

Centralni moment treeg reda:


3 = m3 3m1 m 2 + 2m13 .

(4.14)

Centralni moment etvrtog reda:


4 = m 4 4m3 m1 + 6m 2 m12 3m14 .

(4.15)

4.2. Mjere asimetrije


Asimetrija distribucije podrazumijeva nagnutost distribucije na
lijevu ili desnu stranu.
Pearsonov koeficijent asimetrije je:
3 =

3
,
3

Postoje pomoni momenti i oko neke konstante a.

152

(4.16)

Mjere disperzije, asimetrija i zaobljenost

gdje je:
3 - centralni moment treeg reda,
3 - standardna devijacija na treu potenciju.

Interval u kojem se uobiajeno kree vrijednost tog koeficijenta


je: 2 3 2 .
U sluaju izrazito asimetrinim distribucijama ovaj koeficijent
moe poprimiti i vrijednosti izvan intervala: [ 2,2] .
Ako je:
3 = 0

simetrina distribucija

3 > 0

pozitivna ili desnostrana asimetrija

3 < 0

negativna ili ljevostrana asimetrija.

U programskom paketu SPSS mjera asimetrije ima oznaku


Skewness i vrijedi da ako je vrijednost ovog pokazatelja:
=0

simetrina distribucija

>0

pozitivna ili desnostrana asimetrija

<0

negativna ili ljevostrana asimetrija.

Pearsonova mjera asimetrije, koja se uobiajeno kree u


intervalu [ 3,3] , je:
Sk =

( X Mo)

(4.17)

gdje je:
X - aritmetika sredina

Mo - mod

- standardna devijacija.

Za umjereno asimetrine distribucije vrijedi da je Pearsonova


mjera asimetrije:

153

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Sk =

3 ( X Me)

(4.18)

gdje je:
X - aritmetika sredina

Me - medijan

- standardna devijacija.

Ako je:
Sk = 0

simetrina distribucija

Sk > 0

pozitivna ili desnostrana asimetrija

Sk < 0

negativna ili ljevostrana asimetrija.

Odnosi meu srednjim vrijednostima kod razliitih distribucija:


a) simetrina distribucija ima jednake aritmetiku sredinu,
medijan i mod:
X = Me = Mo .

b) pozitivno ili desnostrano asimetrina distribucija ima


aritmetiku sredinu veu od medijana koji je vei od moda:
X > Me > Mo .

c) negativno ili ljevostrano asimetrina distribucija ima


aritmetiku sredinu manju od medijana koji je manji od moda:
X < Me < Mo .

Bowleyeva mjera asimetrije (uobiajeno se kree u intervalu


[ 1,1] ) zasnovana je na odnosu medijana i kvartila:
S kq =

Q3 + Q1 2Me
,
Q3 Q1

gdje je:
Me - medijan

Q1 - donji kvartil
154

(4.19)

Mjere disperzije, asimetrija i zaobljenost

Q3 - gornji kvartil.

Vrijedi da ako je:


S kq = 0

(Q3 + Q1 ) = 2Me
(Q3 Me) = ( Me Q1 ) simetrina distribucija

Sk > 0

(Q3 + Q1 ) > 2Me


(Q3 Me) > ( Me Q1 )

pozitivna

ili

desnostrana

negativna

ili

ljevostrana

asimetrija
Sk < 0

(Q3 + Q1 ) < 2 Me
(Q3 Me) < ( Me Q1 )

asimetrija.
Raspored srednjih vrijednosti kod razliitih distribucija prikazan
je na slici 4.2.
Slika 4.2.
Distribucije s razliitom asimetrijom
fi

fi

X
Me
Mo
a) Simetrina
distribucuja

xi

fi

MoMeX

xi

b) Pozitivna ili desnostrana


asimetrija

X MeMo xi

c) Negativna ili ljevostrana


asimetrija

Izvor: Konstrukcija autora.

Prikazana su 3 sluaja rasprenosti podataka oko srednjih


vrijednosti. Na dijelu slike 4.2. pod (a) prikazana je jedna savreno
simetrina distribucija u kojoj su aritmetika sredina (prosjek),

155

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

medijan (vrijednost obiljeja koja skup dijeli na dva jednaka dijela) i


mod (najea vrijednost obiljeja koja odgovara vrhu krivulje) u istoj
toki, odnosno jednaki: X = Me = Mo .
Na dijelu slike pod (b) prikazana je jedna pozitivno ili
desnostrano asimetrina distribucija (vidi se rasipanje vrijednosti
obiljeja na desnu stranu) u kojoj je aritmetika sredina vea od
medijana koji je vei od moda: X > Me > Mo .
Na dijelu slike pod (c) prikazana je jedna negativno ili
ljevostrano asimetrina distribucija (vidi se rasipanje vrijednosti
obiljeja na lijevu stranu) u kojoj je aritmetika sredina manja od
medijana koji je manji od moda: X < Me < Mo .
4.3. Mjera zaobljenosti
Mjera zaobljenosti
distribucije frekvencija:
4 =

4
4

predstavlja

zaobljenost

vrha

krivulje
(4.20)

gdje je:
4 - centralni moment etvrtog reda
4 - standardna devijacija na etvrtu potenciju.

Vrijedi da ako je:


4 = 3

normalno zaobljena distribucija

4 > 3

iljatiji vrh od normalno zaobljene distribucije

4 < 3

tupi oblik distribucije.

U programskom paketu SPSS mjera zaobljenosti ima oznaku


Kurtosis ( Kurtosis = k ; k = 3 3 ) i vrijedi da ako je vrijednost ovog
pokazatelja:
=0

156

normalno zaobljena distribucija

Mjere disperzije, asimetrija i zaobljenost

>0

iljatiji vrh od normalno zaobljene distribucije

<0

tupi oblik distribucije.

Analitiki primjer 4.7.


Za varijablu (obiljeje) visina u cm (v2) potrebno je odrediti:
a)

Asimetriju distribucije (Skewness);

b)
Pearsonovu mjeru asimetrije (aritmetika sredina, mod, medijan,
standardna devijacija);
c)

Bowleyevu mjeru asimetrije (kvartili);

d)

Zaobljenost distribucije (Kurtosis);

e)

Na histogram distribucije ucrtati i normalnu krivulju;

f)

Komentirati rezultate!
Rjeenje 4.7:

Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na


njezinu padajuem izborniku Descriptive Statistics i Frequencies.
U prozoru Frequencies pomou odgovarajue strelice varijabla v2
- Visina u cm se prebacuje u polje Variable(s). Klikom na ikonu
Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno
aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se
odnose na odabranu varijablu visina u cm (v2).
Da bi se u izlaznim rezultatima dobio pokazatelj asimetrije
zadanog niza, u spomenutom prozoru aktivira se Skewness. Ostali
pokazatelji asimetrije mogu se izraunati pomou aritmetike sredine
koja e se dobiti aktiviranjem veliine Mean. Za mod je potrebno
oznaiti Mode. Donji i gornji kvartil dobiju se oznaavanjem Quartiles.
Stanardna devijacija dobije se aktiviranjem Std. deviation, a mjera
zaobljenosti aktiviranjem veliine Kurtosis.
Odabrane veliine u programu SPSS prikazane su na slici 4.3.
157

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slika 4.3.
Prozor "Frequencies Statistics" sa izabranim odgovarajuim statistikim
veliinama

Izvor: Simulirani podaci.

Tablica 4.7.
Statistiki podaci o visini ispitanika
N

Valid
Missing

235

Mean

4
175,77

Median

174,00

Mode

172

Std. Deviation

8,749

Skewness

,485

Std. Error of Skewness


Kurtosis

,159
,184

Std. Error of Kurtosis


Percentiles

,316
25

170,00

50

174,00

75

182,00

Izvor: Simulirani podaci.

Da bi se u izlaznim rezultatima dobio histogram zadane


distribucije, klikom na ikonu Charts otvara se novi prozor Frequencies:
Chatrs u kojem je potrebno aktivirati Histograms: (With normal curve).

158

Mjere disperzije, asimetrija i zaobljenost

Konano, da bi se u Outputu programa SPSS dobili eljeni podaci


o visini ispitanika, potrebno je kliknuti na Continue, zatim na OK.
Rezultat je prikazan u tablici 4.7. Prema podacima iz tablice 4.7 moe se
vidjeti da je 235 ispitanika dalo odgovor o svojoj visini, dok ih 4 nije
odgovorio na to pitanje. Prema pokazatelju Skewness asimetrija zadane
distribucije je 0,485, to upuuje na pozitivu ili desnostranu asimetriju.
Pearsonova mjera asimetrije je:
( X Mo)

Sk =

(175,77 172)
= 0,431 ,
8,749

to opet upuuje da se radi o desnostranoj asimetriji.


Bowleyeva mjera asimetrije je:
S kq =

Q3 + Q1 2Me 182 + 170 2 174


=
= 0,333 ,
182 170
Q3 Q1

to potvruje prethodne zakljuke da je zadana distribucija visine


ispitanika pozitivno ili desnostrano asimetrina.
Slika 4.4.
Histogram s normalnom krivuljom distribucije ispitanika prema visini
Histogram

50

Frequency

40

30

20

10

Mean = 175,77
Std. Dev. = 8,749
N = 235

0
150

160

170

180

190

200

210

Visina u cm

Izvor: Simulirani podaci.


159

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Zaobljenost zadane distribucije moe se komentirati pomou


pokazatelja Kurtosis koji u ovom primjer iznosi 0,184, to upuuje na
iljatiji vrh distribucije u odnosu na normalno zaobljenu distribuciju.
Histogram zadane distribucije s ucrtanom normalnom krivuljom
prikazan je na slici 4.4. te se na osnovi njega moe opet zakljuiti da
zadana distribucija pokazuje blagu asimetriju na desnu stranu i iljatiji
vrh od normalne distribucije.

Analitiki primjer 4.8.


Za varijablu (obiljeje) mjeseni deparac (v2) potrebno je odrediti:
a)

Asimetriju distribucije (Skewness);

b)
Pearsonovu mjeru asimetrije (aritmetika sredina, mod, medijan,
standardna devijacija);
c)

Bowleyevu mjeru asimetrije (kvartili);

d)

Zaobljenost distribucije (Kurtosis);

e)

Na histogram distribucije ucrtati i normalnu krivulju;

f)

Komentirati rezultate!
Rjeenje 4.8:

Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na


njezinu padajuem izborniku Descriptive Statistics i Frequencies.
U prozoru Frequencies pomou odgovarajue strelice varijabla v2
- Mjeseni deparac se prebacuje u polje Variable(s). Klikom na ikonu
Statistics otvara se novi prozor Frequencies Statistics gdje je potrebno
aktivirati odreene statistike veliine prema zahtjevu zadatka, a koje se
odnose na odabranu varijablu mjeseni deparac (v2).
Da bi se u izlaznim rezultatima dobio pokazatelj asimetrije
zadanog niza, u spomenutom prozoru aktivira se Skewness. Ostali
pokazatelji asimetrije mogu se izraunati pomou aritmetike sredine
koja e se dobiti aktiviranjem veliine Mean. Za mod je potrebno
160

Mjere disperzije, asimetrija i zaobljenost

oznaiti Mode. Donji i gornji kvartil dobiju se oznaavanjem Quartiles.


Stanardna devijacija dobije se aktiviranjem Std. deviation, a mjera
zaobljenosti aktiviranjem veliine Kurtosis.
Da bi se u izlaznim rezultatima dobio histogram zadane
distribucije, klikom na ikonu Charts otvara se novi prozor Frequencies:
Chatrs u kojem je potrebno aktivirati Histograms: (With normal curve).
Tablica 4.8.
Statistiki podaci o deparcu ispitanika
Statistics
Mjesecni dzeparac
N

Valid

173

Missing
Mean

66
371,5491

Median

300,0000

Mode

200,00(a)

Std. Deviation

401,30549

Skewness

4,314

Std. Error of Skewness

,185

Kurtosis

26,422

Std. Error of Kurtosis


Percentiles

,367
25

150,0000

50

300,0000

75

500,0000

a Multiple modes exist. The smallest value is shown

Izvor: Simulirani podaci.

Konano, da bi se u Outputu programa SPSS dobili eljeni podaci


o visini ispitanika, potrebno je kliknuti na Continue, zatim na OK.
Rezultat je prikazan u tablici 4.8. Prema podacima iz tablice 4.8. moe se
vidjeti da je 173 ispitanika dalo odgovor o svojem mjesenom deparcu,
dok ih 66 nije odgovorio na to pitanje.
Prema pokazatelju Skewness asimetrija zadane distribucije je
4,314, to upuuje na izrazitu pozitivu ili desnostranu asimetriju.
Pearsonova mjera asimetrije je:
Sk =

( X Mo)

(371,5491 200)
= 0,4275 ,
401,30549

161

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

to opet upuuje da se radi o desnostranoj asimetriji. Ovaj rezultat treba


uzeti s rezervom jer zadana distribucija nije unimodalna, tj. nema samo
jedan mod.
Bowleyeva mjera asimetrije je:
S kq =

Q3 + Q1 2 Me 500 + 150 2 300


=
= 0,143 ,
500 150
Q3 Q1

to potvruje prethodne zakljuke da je zadana distribucija deparca


ispitanika pozitivno ili desnostrano asimetrina. Ovaj pokazatelj ne mjeri
konkretnu asimetriju ekstremnih 25% najveih i najmanjih vrijednosti
distribucije, koji u ovom sluaju prema Skewness pokazatelju upuuju na
izrazito desnu tj. pozitivnu asimetriju. Zaobljenost zadane distribucije
moe se komentirati pomou pokazatelja Kurtosis koji u ovom primjer
iznosi 26,422, to upuuje na izrazito iljatiji vrh distribucije u odnosu na
normalno zaobljenu distribuciju.
Slika 4.5.
Histogram s normalnom krivuljom distribucije ispitanika prema visini
Histogram

80

Frequency

60

40

20

Mean = 371,5491
Std. Dev. = 401,30549
N = 173

0
0,00

1000,00

2000,00

Mjesecni dzeparac

Izvor: Simulirani podaci.

162

3000,00

4000,00

Mjere disperzije, asimetrija i zaobljenost

Histogram zadane distribucije s ucrtanom normalnom krivuljom


prikazan je na slici 4.5. te se na osnovi njega potvruju ranije doneseni
zakljuci da zadana distribucija pokazuje veliku asimetriju na desnu
stranu i izrazito iljatiji vrh od normalne distribucije.

Analitiki primjer 4.9.


Za varijablu (obiljeje) broj cipela (v2) potrebno je odrediti:
a)

Asimetriju distribucije (Skewness);

b)
Pearsonovu mjeru asimetrije (aritmetika sredina, mod, medijan,
standardna devijacija);
c)

Bowleyevu mjeru asimetrije (kvartili);

d)

Zaobljenost distribucije (Kurtosis);

e)

Na histogram distribucije ucrtati i normalnu krivulju;

f)

Komentirati rezultate!
Rjeenje 4.9:

Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na


njezinu padajuem izborniku Descriptive Statistics i Frequencies.
U prozoru Frequencies pomou odgovarajue strelice varijabla v2
- Broj cipela se prebacuje u polje Variable(s). Klikom na ikonu Statistics
otvara se novi prozor Frequencies Statistics gdje je potrebno aktivirati
odreene statistike veliine prema zahtjevu zadatka, a koje se odnose na
odabranu varijablu broj cipela (v2).
Da bi se u izlaznim rezultatima dobio pokazatelj asimetrije
zadanog niza, u spomenutom prozoru aktivira se Skewness. Ostali
pokazatelji asimetrije mogu se izraunati pomou aritmetike sredine
koja e se dobiti aktiviranjem veliine Mean. Za mod je potrebno
oznaiti Mode. Donji i gornji kvartil dobiju se oznaavanjem Quartiles.
Stanardna devijacija dobije se aktiviranjem Std. deviation, a mjera
zaobljenosti aktiviranjem veliine Kurtosis.

163

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Da bi se u izlaznim rezultatima dobio histogram zadane


distribucije, klikom na ikonu Charts otvara se novi prozor Frequencies:
Chatrs u kojem je potrebno aktivirati Histograms: (With normal curve).
Konano, da bi se u Outputu programa SPSS dobili eljeni podaci
o broju cipela ispitanika, potrebno je kliknuti na Continue, zatim na OK.
Rezultat je prikazan u tablici 4.9.
Tablica 4.9.
Statistiki podaci o broju cipela ispitanika
Statistics
Broj cipela
N

Valid

237

Missing

Mean

40,86

Median

40,00

Mode

39

Std. Deviation

3,078

Skewness

,511

Std. Error of Skewness

,158

Kurtosis

-,334

Std. Error of Kurtosis


Percentiles

,315
25

39,00

50

40,00

75

43,00

Izvor: Simulirani podaci.

Prema podacima iz tablice 4.9. moe se vidjeti da je 237 ispitanika


dalo odgovor o svom broju cipela, dok ih 2 nije odgovorio na to pitanje.
Prema pokazatelju Skewness asimetrija zadane distribucije je
0,511, to upuuje na blagu pozitivu ili desnostranu asimetriju.
Pearsonova mjera asimetrije je:
Sk =

( X Mo)

( 40,86 39)
= 0,604 ,
3,078

to opet upuuje da se radi o desnostranoj asimetriji.


Bowleyeva mjera asimetrije je:

164

Mjere disperzije, asimetrija i zaobljenost

S kq =

Q3 + Q1 2 Me 43 + 39 2 40
=
= 0,5 ,
43 39
Q3 Q1

to potvruje prethodne zakljuke da je zadana distribucija o broju cipela


ispitanika pozitivno ili desnostrano asimetrina.
Zaobljenost zadane distribucije moe se komentirati pomou
pokazatelja Kurtosis koji u ovom primjer iznosi -0,334, to upuuje na
blago tupi vrh distribucije u odnosu na normalno zaobljenu distribuciju.
Slika 4.6.
Histogram s normalnom krivuljom distribucije ispitanika prema broju
cipela

Histogram

50

Frequency

40

30

20

10

Mean = 40,86
Std. Dev. = 3,078
N = 237

0
35

40

45

50

Broj cipela

Izvor: Simulirani podaci.

Histogram zadane distribucije s ucrtanom normalnom krivuljom


prikazan je na slici 4.6 te se na osnovi njega moe opet zakljuiti da
zadana distribucija pokazuje laganu asimetriju na desnu stranu i blago
tupi vrh u odnosu na normalnu distribuciju.

165

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

166

Vjerojatnost

5. VJEROJATNOST
5.1. Klasina definicija vjerojatnosti
Sluajni dogaaj je takav dogaaj koji se moe, ali ne mora
realizirati, tj. realizira se uz odreenu vjerojatnost.
Vjerojatnost realizacije sluajnog dogaaja "A" jednaka je
omjeru broja povoljnih ishoda i svih moguih ishoda:
P ( A) =

m( A)
, 0 P 1,
n

(5.1)

gdje je:
m( A) - broj svih povoljnih ishoda za dogaaj A

- broj svih moguih ishoda.


Za siguran dogaaj:

P = 1 (obrat ne vrijedi).

Za nemogu dogaaj: P = 0 (obrat ne vrijedi).


Vjerojatnost da se sluajni dogaaj "A" ne realizira jednaka je
omjeru broja nepovoljnih ishoda i svih moguih ishoda:
P( A ) =

n m( A)
, 0 P 1,
n

(5.2)

gdje je:
n m( A)

- broj svih nepovoljnih ishoda za dogaaj A

- broj svih moguih ishoda.


Vrijedi da je:
P ( A) + P ( A ) = 1 .

(5.3)

167

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Za ovakav sluaj kada je unaprijed poznat broj svih


povoljnih/nepovoljnih i ukupnih ishoda izraunata vjerojatnost se naziva
vjerojatnost "a priori".
Ako vjerojatnost realizacije sluajnog dogaaja A nije poznata
unaprijed, moe se izraunati tzv. vjerojatnost "a posteriori":
P( A) = p lim

m( A)
,
n

(5.4)

gdje je:
p lim - ita se "granina vrijednost po vjerojatnosti" (da se razlikuje od

limesa u linearnoj algebri).


5.2. Teorem o zbrajanju vjerojatnosti
Za meusobno iskljuive dogaaje (tj. one dogaaje koji ne
mogu nastupiti istodobno, odnosno iji su pripadni skupovi elementarnih
dogaaja disjunktni), vjerojatnost realizacije jednog ili drugog dogaaja
jednaka je zbroju vjerojatnosti realizacije jednog i vjerojatnosti realizacije
drugog dogaaja.
P ( A ili B) = P( A) + P ( B ) .

(5.5)

Za dogaaje koji se meusobno ne iskljuuju, vjerojatnost


realizacije jednog ili drugog dogaaja je:
P ( A ili B ) = P( A) + P ( B ) P( AB ) ,

(5.6)

gdje je:
P ( AB) -vjerojatnost da sluajni dogaaji A i B nastupe istovremeno.

Analitiki primjer 5.1.


U posudi se nalazi 400 kuglica, od toga 100 crvenih, 140 plavih i
160 zelenih.
a)
Kolika je vjerojatnost da e sluajnim izvlaenjem 1 kuglice biti
izvuena kuglica zelena boje?

168

Vjerojatnost

b)
Kolika je vjerojatnost da e sluajno izvuena kuglica biti crvena
ili zelena?
Rjeenje 5.1:
U ovom primjeru zadano je:
n = 400 ; to predstavlja broj ukupnih ishoda;
m(C ) = 100 ; to predstavlja broj povoljnih ishoda za crvenu kuglicu;
m( P) = 140 ; to predstavlja broj povoljnih ishoda za plavu kuglicu;
m( Z ) = 160 ; to predstavlja broj povoljnih ishoda za zelenu kuglicu.

a)
Traena vjerojatnost da e sluajnim izvlaenjem 1 kuglice biti
izvuena kuglica zelena boje jednaka je omjeru broja povoljnih ishoda, tj.
broja zelenih kuglica i svih moguih ishoda, tj. svih kuglica:
P(Z ) =

m( Z ) 160
=
= 0,4 .
n
400

b)
Za traenu vjerojatnost da e sluajno izvuena kuglica biti crvena
ili zelena primjenjuje se teorem o zbrajanju vjerojatnosti za meusobno
iskljuive dogaaje jer na 1 izvlaenje ne moe istovremeno biti izvuena
kuglica crvene i zelene boje (dogaaji ne mogu nastupiti istodobno):
P(C ili Z ) =

m(C ) m( Z ) 100 160


+
=
+
= 0,65 .
n
n
400 400

5.3. Teorem o mnoenju vjerojatnosti


Ako se dogaaji A i B meusobno ne iskljuuju, tj. vjerojatnost
realizacije jednog ne ovisi o vjerojatnosti realizacije drugog dogaaja
(nezavisni dogaaji), tada je vjerojatnost istovremene realizacije dogaaja
A i B jednaka produktu vjerojatnosti realizacije dogaaja A i dogaaja B:
P( A i B) = P( A) P( B) .

(5.7)

169

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

5.4. Uvjetna vjerojatnost


Ako je realizacija dogaaja A uvjetovana prethodnom
realizacijom dogaaja B, vrijedi da je uvjetna ili kondicionalna
vjerojatnost dogaaja A:
P( A / B) =

P ( AB )
,
P( B)

P( B) > 0 ,

(5.8)

P ( AB)
,
P ( A)

P ( A) > 0 .

(5.9)

odnosno:
P ( B / A) =

Ako su dogaaji nezavisni, vrijedi da je:


P ( AB) = P ( A) P ( B ) P( A / B ) =

P ( A) P( B)
= P ( A)
P ( A)

(5.10)

Bayesov teorem:
Ako se dogaaj B realizira istovremeno kada nastupi jedan od n
n

disjunktnih dogaaja A1 , A2 ,..., An za koje je P( Ai ) = 1 onda se


i =1

vjerojatnost dogaaja B dobiva po formuli potpune vjerojatnosti:


n

P( B) = P( Ai ) P( B / Ai )

(5.11)

i =1

P( Ai / B) =

P ( Ai ) P( B / Ai )
n

P( A ) P( B / A )
i =1

, P( Ai ) = 1 .
i =1

(5.12)

Analitiki primjer 5.2.


Potrebno je izraunati vjerojatnost da odabrani ispitanik bude
enskog spola (varijabla: Spol (v1)).

170

Vjerojatnost

Rjeenje 5.2:
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Frequencies.
U prozoru Frequencies pomou odgovarajue strelice varijabla v1
- Spol se prebacuje u polje Variable(s).
Konano, da bi se u Outputu programa SPSS dobili eljeni podaci
o spolu ispitanika, potrebno je kliknuti na OK. Rezultat je prikazan u
tablici 5.1.
Tablica 5.1.
Podaci o spolu ispitanika
Spol

Valid

Cumulative
Percent
39,5

60,3

60,5

100,0

99,6

100,0

Percent
39,3

Zensko

144

Total

238

Musko

Missing

Valid Percent
39,5

Frequency
94

System

Total

,4

239

100,0

Izvor: Simulirani podaci.

Prema podacima iz tablice 5.1. u stupcu Valid Percent moe se


vidjeti da je 60,5% ispitanika enskog spola, odnosno vjerojatnost da
ispitanik bude enskog spola je 0,605.

Analitiki primjer 5.3.


Za varijablu grupirana visina (v1) na sljedei nain:
Range: Lowest through

- 160
- 170
- 180
- 190
- 200
- 210

160
170
180
190
200
210
171

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

potrebno je izraunati vjerojatnost da ispitanik bude visok izmeu 171 i


180 cm.
Rjeenje 5.3:
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Frequencies.
U prozoru Frequencies pomou odgovarajue strelice varijabla v1
- Grupirana visina se prebacuje u polje Variable(s).
Konano, da bi se u Outputu programa SPSS dobili eljeni podaci
o visini ispitanika, potrebno je kliknuti na OK. Rezultat je prikazan u
tablici 5.2.
Tablica 5.2.
Podaci o visini ispitanika
Grupirana visina

Valid

160,00

Frequency
7

Percent
2,9

Valid Percent
3,0

Cumulative
Percent
3,0

170,00

62

25,9

26,4

29,4

180,00

103

43,1

43,8

73,2

190,00

50

20,9

21,3

94,5

200,00

11

4,6

4,7

99,1

210,00

,8

,9

100,0

235

98,3

100,0

Total
Missing

System

Total

1,7

239

100,0

Izvor: Simulirani podaci.

Prema podacima iz tablice 5.2. u stupcu Valid Percent moe se


vidjeti da je 43,8% ispitanika s visinom izmeu 171 i 180 cm, odnosno
vjerojatnost da ispitanik bude visok izmeu 171 i 180 cm je 0,438.

172

Vjerojatnost

Analitiki primjer 5.4.


Potrebno je izraunati vjerojatnost da se sluajno odabere osoba
kojoj su roditelji u braku.
Rjeenje 5.4:
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Frequencies.
U prozoru Frequencies pomou odgovarajue strelice varijabla v1
- Brano stanje roditelja se prebacuje u polje Variable(s).
Konano, da bi se u Outputu programa SPSS dobili eljeni podaci
o branom stanju roditelja ispitanika, potrebno je kliknuti na OK.
Rezultat je prikazan u tablici 5.3.
Tablica 5.3.
Podaci o branom stanju roditelja ispitanika
Bracno stanje roditelja
Frequency

Valid

U braku
Rastavljeni
Umro jedan od
roditelja
Ostalo
Total

Percent

Valid Percent

Cumulative
Percent

215
10

90,0
4,2

90,0
4,2

90,0
94,1

11

4,6

4,6

98,7

3
239

1,3
100,0

1,3
100,0

100,0

Izvor: Simulirani podaci.

Prema podacima iz tablice 5.3. u stupcu Valid Percent moe se


vidjeti da 90% ispitanika ima roditelje u braku, odnosno vjerojatnost da
ispitanik ima roditelje u braku je 0,9.

Analitiki primjer 5.5.


Potrebno je izraunati vjerojatnost da se sluajno odabere osoba
koja pije alkoholna pia samo u posebnim prigodama.

173

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Rjeenje 5.5:
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Frequencies.
U prozoru Frequencies pomou odgovarajue strelice varijabla v1
- o Konzumiranju alkohola se prebacuje u polje Variable(s).
Konano, da bi se u Outputu programa SPSS dobili eljeni podaci
o konzumaciji alkohola ispitanika, potrebno je kliknuti na OK. Rezultat je
prikazan u tablici 5.4.
Tablica 5.4.
Podaci o konzumiranju alkohola ispitanika
Konzumirate li alkohol
Frequency

Valid

Missing
Total

Nikada
Samo uz obroke
U posebnim prilikama
Cesto i u svakoj
prigodi
Total
System

Percent

Valid Percent

Cumulative
Percent

54
9
165

22,6
3,8
69,0

22,8
3,8
69,6

22,8
26,6
96,2

3,8

3,8

100,0

237
2
239

99,2
,8
100,0

100,0

Izvor: Simulirani podaci.

Prema podacima iz tablice 5.4. u stupcu Valid Percent moe se


vidjeti da 69,6% ispitanika pije alkohol samo u posebnim prilikama,
odnosno vjerojatnost da ispitanik pije alkohol samo u posebnim prilikama
je 0,696.

Analitiki primjer 5.6.


a)
Potrebno je izraunati vjerojatnost da ispitanik ne pije nikada
alkoholna pia.
b)
Potrebno je izraunati vjerojatnost da ispitanik enskog spola ne
pije nikada alkoholna pia.

174

Vjerojatnost

Rjeenje 5.6:
a)
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Frequencies.
U prozoru Frequencies pomou odgovarajue strelice varijabla v1
- o Konzumiranju alkohola se prebacuje u polje Variable(s).
Konano, da bi se u Outputu programa SPSS dobili eljeni podaci
o konzumaciji alkohola ispitanika, potrebno je kliknuti na OK. Rezultat je
prikazan u tablici 5.4.
Prema podacima iz tablice 5.4. u stupcu Valid Percent moe se
vidjeti da 22,8% ispitanika ne pije nikada alkohol, odnosno vjerojatnost
da ispitanik ne pije alkohol nikada je 0,228.
b)
Da bi se izraunala vjerojatnost da ispitanik enskog spola ne pije
nikada alkoholna pia, potrebno je ostaviti u analizi samo ispitanike
enskog spola, odnosno filtrirati eljeni uzorak.
Na glavnom izborniku potrebno je izabrati ikonu Data, a na
njezinu padajuem izborniku Select Cases.
U prozoru Select Cases potrebno je aktivirati opciju If conditions
is satisfied. Klikom na ikonu if otvara se prozor Select Cases:If gdje je
potrebno odabrati varijablu v2 i postaviti uvjet da je v 2 = 2 , odnosno da
je spol 2, to oznaava enski spol.
Konano, da bi se filtrirali samo ispitanici enskog spola,
potrebno je kliknuti na Continue i OK. Daljnja analiza se sada odnosi
samo na enski spol.
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Frequencies.
U prozoru Frequencies pomou odgovarajue strelice varijabla v1
- o Konzumiranju alkohola se prebacuje u polje Variable(s).
Konano, da bi se u Outputu programa SPSS dobili eljeni podaci
o konzumaciji alkohola ispitanika enskog spola, potrebno je kliknuti na
OK. Rezultat je prikazan u tablici 5.5.

175

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Tablica 5.5.
Podaci o konzumiranju alkohola ispitanika enskog spola
Konzumirate li alkohol
Frequency

Valid

Missing

Nikada
Samo uz obroke
U posebnim
prilikama
Cesto i u svakoj
prigodi
Total
System

Total

Percent

Valid Percent

Cumulative
Percent

37
3

25,7
2,1

26,1
2,1

26,1
28,2

94

65,3

66,2

94,4

5,6

5,6

100,0

142
2
144

98,6
1,4
100,0

100,0

Izvor: Simulirani podaci.

Prema podacima iz tablice 5.5 u stupcu Valid Percent moe se


vidjeti da 26,1% od ispitanika enskog spola ne pije nikada alkohol,
odnosno vjerojatnost da ispitanik enskog spola nikada ne pije alkohol je
0,261.
5.5. Diskontinuirana sluajna varijabla
Diskontinuirana ili diskretna sluajna varijabla je takva varijabla
koja na sluaj moe poprimiti najvie prebrojivo mnogo vrijednosti i
svaku od njih s odreenom vjerojatnou.
Zadovoljava uvjete:

normativnost: P( xi ) = 1

nenegativnost: P( xi ) 0, i .

i =1

Skup svih ureenih parova vrijednosti sluajne varijable i njoj


pripadajuih vjerojatnosti naziva se distribucija vjerojatnosti sluajne
varijable X :

{[xi ; P( xi )], i = 1,2, ..., } .

176

(5.13)

Vjerojatnost

Zakon po kojem svakoj vrijednosti sluajne varijable X pripada


vjerojatnost P( xi ) naziva se zakon vjerojatnosti sluajne varijable X.
Funkcija distribucije sluajne varijable X je funkcija koja daje
vjerojatnost da e sluajna varijabla X poprimiti vrijednost jednaku ili
manju od nekog realnog broja x k :
k

F ( x k ) = P( X x k ) = P( xi )

(5.14)

i =1

Moe se rei da je to kumulativ vjerojatnosti od F ( X = 0) do


F ( X = x k ) . Funkcija distribucije sluajne varijable X je monotono
neopadajua funkcija.
Parametri distribucije:

Oekivanje sluajne varijable je zbroj umnoaka vrijednosti


varijable X i njoj pripadajuih odgovarajuih vjerojatnosti P( x i ) :

E ( X ) = xi P( xi ) = .

(5.15)

i =1

Varijanca sluajne varijable je oekivanje kvadratnog


odstupanja vrijednosti varijable X od njezina oekivanja:

V ( X ) = E ( X 2 ) [E ( X )] = E ( X ) 2 = x i2 P( x i ) 2 .
2

i =1

(5.16)

5.6. Teorijske distribucije diskontinuirane sluajne varijable


5.6.1. Binomna distribucija
Ako sluajni pokus koji se ponavlja n puta ima dva mogua
ishoda: uspjeh i neuspjeh, i ako je vjerojatnost nastupa ishoda uspjeh
poznata, unaprijed utvrena i konstantna tijekom cijelog istraivanja
(iznosi p ), kae se da se diskontinuirana sluajna varijabla X ravna
prema tzv. binomnoj distribuciji.

177

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Vjerojatnost da se neki sluajni dogaaj X u n pokusa realizira x


puta prema binomnom zakonu vjerojatnosti je:
n
n
P ( X = x) = p x (1 p ) n x = p x q n x , x = 0,1,2,..., n (5.17)
x
x

gdje je:
n

- broj ponavljanja pokusa

- vjerojatnost realizacije sluajnog dogaaja (povoljnog ishoda)

- vjerojatnost da se sluajni dogaaj ne realizira

- broj povoljnih ishoda u n ponavljanja sluajnog pokusa

nx

- broj nepovoljnih ishoda u n ponavljanja sluajnog pokusa.


Oekivanje sluajne varijable X kod binomne distribucije:
E( X ) = n p .

(5.18)

Varijanca sluajne varijable X kod binomne distribucije:


2 = n pq .

(5.19)

Koeficijent asimetrije sluajne varijable X kod binomne


distribucije:
3 =

q p
n pq

(5.20)

Koeficijent zaobljenosti sluajne varijable X kod binomne


distribucije:
4 = 3+

1 6 p q
.
n pq

(5.21)

Openito se kae da se sluajna varijabla X ravna po binomnoj


distribuciji koja je odreena parametrima n i p:
X

178

B(n, p) .

(5.22)

Vjerojatnost

U programskom paketu SPSS postoje funkcije gustoe


vjerojatnosti i kumulativne funkcije distribucije vjerojatnosti
Binomne distribucije.
Funkcije gustoe vjerojatnosti (Probability Density Functions)
Transform; Compute; Function group (izabrati: PDF &
Noncentral PDF); izabrati: Pdf.Binom u Numeric Expression:
PDF.BINOM(quant,n,prob)
Rezultat ove funkcije su vjerojatnosti da broj uspjeha u n
pokuaja, uz vjerojatnost realizacije p = prob , budu jednake nekom broju
x = quant .
U Target Variable: potrebno je imenovati novu varijablu
izraunatih vjerojatnosti po Binomnom zakonu.
Kumulativne
funkcije
Distribution Functions)

distribucije

vjerojatnosti

(Cumulative

Transform; Compute; Function group (izabrati: CDF &


Noncentral CDF); izabrati: Cdf.Binom u Numeric
Expression:
CDF.BINOM(quant,n,prob)
Rezultat ove funkcije je kumulativ vjerojatnosti da broj uspjeha u
n pokuaja, uz vjerojatnost realizacije p = prob , bude manji ili jednak
nekom broju x = quant .
U Target Variable: potrebno je imenovati novu varijablu
izraunatih kumulativa vjerojatnosti po Binomnom zakonu.
Analitiki primjer 5.7.
Vjerojatnost da je student Odsjeka za sociologiju Filozofskoga
m( M ) 7
=
= 0,225806451 (gdje je
31
n
n ukupan broj studenata Odjeka za sociologiju, a m( M ) broj je povoljnih

fakulteta u Splitu mukog spola je: p =

ishoda, odnosno broj studenata mukog spola).

179

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

a)
Kolika je vjerojatnost da izmeu 7 sluajno odabranih studenata
budu 3 studenta mukog spola?
b)
Kolika je vjerojatnost da izmeu 7 sluajno odabranih studenata
budu najvie 2 studenta mukog spola?
c)
Kolika je vjerojatnost da izmeu 7 sluajno odabranih studenata
budu najvie 4 ili najmanje 3 studenta mukog spola?
d)
Kolika je vjerojatnost da izmeu 7 sluajno odabranih studenata
bude barem 1 student mukog spola?
e)
Kolika je vjerojatnost da izmeu 7 sluajno odabranih studenata
budu svi studenti mukog spola?
Rjeenje 5.7:
Na glavnom izborniku potrebno je odabrati ikonu Transform, a na
njezinu padajuem izborniku Compute. Nakon toga otvara se prozor
Compute Variable, koji je prikazan na slici 5.1. Da bi se aktivirala
naredba za izraun vjerojatnosti po Binomnom zakonu, potrebno je u
izborniku Function group: odabrati PDF & Noncentral PDF. Nakon
toga se u izborniku Function and Special Variables: bira Pdf.Binom i
klikom dva puta na tu funkciju ona se pojavljuje u prozoru Numeric
Expression: na sljedei nain: PDF.BINOM(?,?,?).
U navedenoj funkciji prvi upitnik predstavlja quant, tj. x
vrijednost koju poprima sluajna varijabla u ovom primjeru X1. Drugi
upitnik funkcije predstavlja n, odnosno veliinu odabranog uzorka. Trei
upitnik je prob, tj. p vjerojatnost realizacije sluajnog dogaaja. U ovom
primjeru je zadano:
quant = X 1 ; n = 7 ; prob = 0,225806451 ,

pa vrijedi da je:
PDF.BINOM(X1,7,0.225806451),
to je i prikazano u prozoru Numeric Expression na slici 5.1.

U Target Variable: potrebno je imenovati novu varijablu


izraunatih vjerojatnosti po Binomnom zakonu i u ovom primjeru
nazvana je X1Bin.
180

Vjerojatnost

Slika 5.1.
Prozor u SPSS-u za izraunavanje vjerojatnosti diskontinuirane sluajne
varijable po Binomnom zakonu

Izvor: Simulirani podaci.

Konano, da bi se u dodatnom stupcu programa SPSS dobili


eljeni podaci vjerojatnosti sluajne varijable X1 po Binomnoj
distribuciji, potrebno je kliknuti na OK. Rezultat je prikazan u tablici 5.6.
Prema rezultatima iz tablice 5.6. mogu se oitati i/ili izraunati
traene vjerojatnosti.
a)
Vjerojatnost da izmeu 7 sluajno odabranih studenata budu 3
studenta mukog spola je:
p( X 1 = 3) = 0,144769 .

b)
Vjerojatnost da izmeu 7 sluajno odabranih studenata budu
najvie 2 studenta mukog spola je:

181

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

p ( X 1 2) = p( X 1 = 0) + p( X 1 = 1) + p ( X 1 = 2) =
= 0,166704 + 0,340355 + 0,297810 = 0,805.

Tablica 5.6.
Podaci u SPSS-u vrijednosti i vjerojatnosti diskontinuirane sluajne
varijable po Binomnom zakonu

Izvor: Simulirani podaci.

c)
Vjerojatnost da izmeu 7 sluajno odabranih studenata budu
najvie 4 ili najmanje 3 studenta mukog spola je:
p ( X 1 4 ili X 1 3) = 1 .

Ovom vjerojatnosti su obuhvaene sve vrijednosti sluajne


varijable X1, a zbroj svih vjerojatnosti u jednoj distribuciji je 1.
d)
Vjerojatnost da izmeu 7 sluajno odabranih studenata bude
barem 1 student mukog spola je:
p ( X 1 1) = p( X 1 = 1) + p( X 1 = 2) + ... + p ( X 1 = 7) =
= 1 p ( X 1 = 0) = 1 0,166704 = 0,8333.

e)
Vjerojatnost da izmeu 7 sluajno odabranih studenata budu svi
studenti mukog spola je:
p ( X 1 = 7) = 0,00003 .

182

Vjerojatnost

5.6.2. Poissonova distribucija


Ako je vjerojatnost da se dogodi neki dogaaj poznata, unaprijed
utvrena, konstantna i jako mala tijekom cijelog istraivanja (iznosi p ),
te broj pokusa tei u beskonanost ( n ) umjesto binomne distribucije,
upotrebljava se Poissonova distribucija.
U praksi vrijedi da ako je:
n 50 i p 0,10

(5.23)

vrijedi Poissonova distribucija. Moe se rei da je ta distribucija


definirana za rijetke dogaaje, odnosno one dogaaje koji imaju veliki
uzorak i malu vjerojatnost.
Zakon vjerojatnosti po Poissonovoj distribuciji je:
P( X = x) =

(np) x e np ( ) x e
=
, x = 0,1,2,..., ,
x!
x!

(5.24)

jer je: = n p ;
gdje je:
n

- broj pokusa

- vjerojatnost realizacije sluajnog dogaaja

- broj povoljnih ishoda u n pokusa.


Oekivanje sluajne varijable X kod Poissonove distribucije:
E( X ) = n p = .

(5.25)

Varijanca sluajne varijable X kod Poissonove distribucije:


2 = n p = .

(5.26)

Koeficijent asimetrije sluajne varijable X kod Poissonove


distribucije:
3 =

(5.27)

183

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Koeficijent zaobljenosti sluajne varijable X kod Poissonove


distribucije:
4 = 3+

(5.28)

Openito se kae da se sluajna varijabla X ravna po


Poissonovoj distribuciji koja je odreena parametrom :
X

P( ) .

(5.29)

U programskom paketu SPSS postoje funkcije gustoe


vjerojatnosti i kumulativne funkcije distribucije vjerojatnosti
Poissonove distribucije.
Funkcije gustoe vjerojatnosti (Probability Density Functions)
Transform; Compute; Function group (izabrati: PDF &
Noncentral PDF); izabrati: Pdf.Poisson u Numeric
Expression:
PDF.POISSON(quant,mean)
Rezultat ove funkcije su vjerojatnosti da broj uspjeha u n
pokuaja, uz vjerojatnost realizacije p = prob , budu jednake nekom broju
x = quant . Vrijedi da je oekivanje mean = = n p .
U Target Variable: potrebno je imenovati novu varijablu
izraunatih vjerojatnosti po Poissonovu zakonu.
Kumulativne
funkcije
Distribution Functions)

distribucije

vjerojatnosti

(Cumulative

Transform; Compute; Function group (izabrati: CDF &


Noncentral CDF); izabrati: Cdf.Poisson u Numeric
Expression:
CDF.POISSON(quant,mean)
Rezultat ove funkcije je kumulativ vjerojatnosti da broj uspjeha u
n pokuaja, uz vjerojatnost realizacije p = prob , bude manji ili jednak
nekom broju x = quant . Vrijedi da je oekivanje mean = = n p .

184

Vjerojatnost

U Target Variable: potrebno je imenovati novu varijablu


izraunatih kumulativa vjerojatnosti po Poissonovu zakonu.

Analitiki primjer 5.8.


Vjerojatnost da se meu studentskom populacijom konzumira
droga je: p = 0,056 .
a)
Kolika je vjerojatnost da izmeu 60 sluajno odabranih studenata
budu 2 studenta koja konzumiraju drogu?
b)
Kolika je vjerojatnost da izmeu 60 sluajno odabranih studenata
barem 1 student konzumira drogu?
c)
Kolika je vjerojatnost da izmeu 60 sluajno odabranih studenata
najvie 10 studenata konzumira drogu?
Rjeenje 5.8:
Zadana vjerojatnost sluajnog dogaaja da se meu studentskom
populacijom konzumira droga je manja od 0,10, a uzorak je u svim
sluajevima vei od 50, pa se u ovom primjeru pretpostavlja da se
sluajna varijabla X2 ravna po Poissonovu zakonu.
Na glavnom izborniku potrebno je odabrati ikonu Transform, a na
njezinu padajuem izborniku Compute. Nakon toga otvara se prozor
Compute Variable. Da bi se aktivirala naredba za izraun vjerojatnosti po
Poissonovu zakonu, potrebno je u izborniku Function group: odabrati
PDF & Noncentral PDF. Nakon toga se u izborniku Function and
Special Variables: bira Pdf.Poisson i klikom dva puta na tu funkciju ona
se pojavljuje u prozoru Numeric Expression: na slijedei nain:
PDF.POISSON(?,?).
U navedenoj funkciji prvi upitnik predstavlja quant, tj. x
vrijednost koju poprima sluajna varijabla u ovom primjeru X2. Drugi
upitnik funkcije predstavlja mean, odnosno oekivanje sluajne varijable
koja se po Poissonovu zakonu rauna na sljedei nain:
n = 60 ; prob = 0,056 : = n p = 60 0,056 = 3,36 .
185

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

U ovom primjeru vrijedi da je:


quant = X 2 ; = 3,36 ,

pa se moe upisati:
PDF.POISSON(X2,3.36),
to je i prikazano u prozoru Numeric Expression na slici 5.2.
Slika 5.2.
Prozor u SPSS-u za izraunavanje vjerojatnosti diskontinuirane sluajne
varijable po Poissonovu zakonu

Izvor: Simulirani podaci.

U Target Variable: potrebno je imenovati novu varijablu


izraunatih vjerojatnosti po Poissonovu zakonu i u ovom primjeru
nazvana je X2Poiss.

186

Vjerojatnost

Konano, da bi se u dodatnom stupcu programa SPSS dobili


eljeni podaci vjerojatnosti sluajne varijable X2 po Poissonovoj
distribuciji, potrebno je kliknuti na OK. Rezultat je prikazan u tablici 5.7.
Da bi se dobile kumulativne vjerojatnosti, potrebno je ponoviti
slian postupak.
Na glavnom izborniku potrebno je odabrati ikonu Transform, a na
njezinu padajuem izborniku Compute. Nakon toga otvara se prozor
Compute Variable. Da bi se aktivirala naredba za izraun kumulativnih
vjerojatnosti po Poissonovu zakonu, potrebno je u izborniku Function
group: odabrati CDF & Noncentral CDF. Nakon toga se u izborniku
Function and Special Variables: bira Cdf.Poisson i klikom dva puta na
tu funkciju ona se pojavljuje u prozoru Numeric Expression: na sljedei
nain: CDF.POISSON(?,?).
Slika 5.3.
Prozor u SPSS-u za izraunavanje kumulativnih vjerojatnosti
diskontinuirane sluajne varijable po Poissonovu zakonu

Izvor: Simulirani podaci.


187

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

U navedenoj funkciji prvi upitnik opet predstavlja quant, tj. x


vrijednost koju poprima sluajna varijabla u ovom primjeru X2. Drugi
upitnik funkcije predstavlja mean, odnosno oekivanje sluajne varijable:
quant = X 2 ; = 3,36 ,

pa se moe upisati:
CDF.POISSON(X2,3.36),
to je i prikazano u prozoru Numeric Expression na slici 5.3.
U Target Variable: potrebno je imenovati novu varijablu
izraunatih vjerojatnosti po Poissonovu zakonu i u ovom primjeru
nazvana je X2CumPoiss.
Konano, da bi se u dodatnom stupcu programa SPSS dobili
eljeni podaci kumulativnih vjerojatnosti sluajne varijable X2 po
Poissonovoj distribuciji, potrebno je kliknuti na OK. Rezultat je prikazan
u tablici 5.7.
Tablica 5.7.
Podaci u SPSS-u vrijednosti, vjerojatnosti i kumulativne vjerojatnosti
diskontinuirane sluajne varijable po Poissonovu zakonu

Izvor: Simulirani podaci.

188

Vjerojatnost

Prema rezultatima iz tablice 5.7. (prikazano je samo 13 vrijednosti


od ukupno 60 vrijednosti zadane diskontinuirane sluajne varijable X2)
mogu se oitati i/ili izraunati traene vjerojatnosti.
a)
Vjerojatnost da izmeu 60 sluajno odabranih studenata budu 2
studenta koja konzumiraju drogu je:
p ( X 1 = 2) = 0,196074 .

b)
Vjerojatnost da izmeu 60 sluajno odabranih studenata barem 1
student konzumira drogu je:
p ( X 1 1) = p ( X 1 = 1) + p ( X 1 = 2) + ... + p ( X 1 = 60) =
= 1 p ( X 1 = 0) = 1 0,034735 = 0,9653.

Ovdje je iskoriteno svojstvo da je zbroj svih vjerojatnosti u


distribuciji 1.
c)
Kolika je vjerojatnost da izmeu 60 sluajno odabranih studenata
najvie 10 studenata konzumira drogu?
p ( X 1 10) = p ( X 1 = 0) + p( X 1 = 1) + ... + p( X 1 = 10) =
= 0,999263.

Ovdje je traena vjerojatnost jednostavno oitana iz rezultata


stupca kumulativnih vjerojatnosti Poissonove distribucije. Jednak rezultat
bi se dobio postupnim zbrajanjem vjerojatnosti iz stupca vjerojatnosti
Poissonove distribucije.
5.6.3. Dvodimenzionalna diskontinuirana distribucija
Diskontinuirana sluajna varijabla X moe poprimiti vrijednosti
x1 , x 2 , x3 ,..., x n , a diskontinuirana sluajna varijabla Y moe istovremeno
poprimiti vrijednosti y1 , y 2 , y 3 ,..., y m .

Vjerojatnost da sluajna varijabla X poprimi vrijednost xi , a


istovremeno sluajna varijabla Y poprimi vrijednost y j je:
P( X = xi , Y = y j ) = P( xi , y j )

(5.30)

189

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Za svaku distribuciju vjerojatnosti mora biti ispunjen uvjet


normativnosti:
n m

P( xi , y j ) = 1

(5.31)

i =1 j =1

Skup svih ureenih parova

{(x , y ); P( x , y )} dvodimenzionalna
i

je distribucija vjerojatnosti sluajnih varijabli ( X , Y ) .


5.6.4. Marginalne distribucije diskontinuirane sluajne varijable
Marginalna distribucija sluajne varijable X skup je ureenih
parova odgovarajuih vrijednosti varijable X i njima pripadajuih
vjerojatnosti da sluajna varijabla X poprimi neku vrijednost xi bez
obzira na to koju e vrijednost poprimiti sluajna varijabla Y.
Marginalna distribucija sluajne varijable Y skup je ureenih
parova odgovarajuih vrijednosti varijable Y i njima pripadajuih
vjerojatnosti da sluajna varijabla Y poprimi neku vrijednost y j bez
obzira na to koju e vrijednost poprimiti sluajna varijabla X.
Marginalna vjerojatnost sluajne varijable X je:
m

P ( x i ) = P ( xi , y j ) ,
j =1

(5.32)

i obino se u dvostrukoj statistikoj tablici nalazi u zbirnom stupcu (ako


se sluajna varijabla X mijenja po redcima).
Marginalna vjerojatnost sluajne varijable Y je:
n

P ( y j ) = P ( x i , y j ) ,
i =1

(5.33)

i obino se u dvostrukoj statistikoj tablici nalazi u zbirnom retku (ako se


sluajna varijabla Y mijenja po stupcima).

190

Vjerojatnost

5.6.5. Uvjetne distribucije diskontinuirane sluajne varijable


Vjerojatnost da sluajna varijabla X poprimi neku vrijednost xi
pod uvjetom da je varijabla Y poprimila neku vrijednost y j uvjetna je ili
kondicionalna vjerojatnost:
P( xi / y j ) =

P( xi , y j )
P( y j )

, P( y j ) > 0 .

(5.34)

Slino, vjerojatnost da sluajna varijabla Y poprimi neku


vrijednost y j pod uvjetom da je varijabla X poprimila neku vrijednost xi
uvjetna je ili kondicionalna vjerojatnost:
P( y j / xi ) =

P( xi , y j )
P( xi )

, P( xi ) > 0 .

Ako su sluajne
multiplikacijski teorem:

varijable

(5.35)
nezavisne,

P( xi , y j ) = P( xi ) P( y j ) ,

primjenjuje

se

(5.36)

pa vrijedi da je:
P( xi / y j ) = P( xi ) ,

(5.37)

P( y j / xi ) = P( y j ) .

(5.38)

Analitiki primjer 5.9.


a)
za

Zadatak je izraunati dvodimenzionalnu distribuciju vjerojatnosti:

- varijablu (obiljeje) grupirani deparac (v1) koja se mijenja po


redcima (row) i za
- varijablu (obiljeje) grupirana ocjena u srednjoj koli (v2) koja
se mijenja po stupcima (column).
b)
Komentirati
distribucije!

izraunate

vjerojatnosti

dvodimenzionalne

191

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

c)

Komentirati izraunate vjerojatnosti marginalne distribucije!

d)
Uz pretpostavku da promatrane sluajne varijable nisu nezavisne
potrebno je izraunati uvjetnu distribuciju vjerojatnosti: P( p 4 / p3 = 400) !
Rjeenje 5.9:
a)
Na glavnom izborniku potrebno je odabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Crosstabs. Nakon
toga otvara se prozor Crosstabs.
Slika 5.4.
Prozor Crosstabs za izraunavanje dvodimenzionalnih vrijednosti zadanih
sluajnih varijabli

Izvor: Simulirani podaci.

Odgovarajuim strelicama prema zahtjevu zadatka potrebno je


varijablu (obiljeje) grupirani deparac (v1) prebaciti u prozor za retke
192

Vjerojatnost

Row(s) i varijablu (obiljeje) grupirana ocjena u srednjoj koli (v2)


prebaciti u prozor za stupce Column(s) kako je prikazano na slici 5.4.
Klikom na ikonu Cells... otvara se prozor Crosstabs: Cell Display
gdje je uz postojee originalne frekvencije (Counts) potrebno aktivirati
Percentages; Total kako je prikazano na slici 5.5.
Da bi se u Outputu programa SPSS dobili traeni podaci potrebno
je kliknuti na Continue i OK.
Slika 5.5.

Izvor: Simulirani podaci.

Rezultati su prikazani u tablici 5.8.


b)
Izraunate vjerojatnosti dvodimenzionalne distribucije u tablici
5.8. izraene su u postotcima.
Vjerojatnost u prvom retku i prvom stupcu numerikog dijela
tablice iznosi 3,5%, to znai da vjerojatnost da ispitanik ima deparac do
200 kn i ocjenu iz srednje kole 3 iznosi 0,035.
Vjerojatnost u prvom retku i drugom stupcu numerikog dijela
tablice iznosi 22,1%, to znai da vjerojatnost da ispitanik ima deparac
do 200 kn i ocjenu iz srednje kole 4 iznosi 0,221.

193

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Tablica 5.8.
Dvostruka tablica obiljeja deparca i prosjene ocjene u srednjoj koli
grupirani dzeparac * grupirana ocjena u srednjoj skoli Crosstabulation

grupirani
dzeparac

200,00
400,00
600,00
800,00
1000,00
3500,00

Total

Count
% of Total
Count
% of Total
Count
% of Total
Count
% of Total
Count
% of Total
Count
% of Total
Count
% of Total

grupirana ocjena u srednjoj skoli


3,00
4,00
5,00
6
38
29
3,5%
22,1%
16,9%
14
20
18
8,1%
11,6%
10,5%
5
14
10
2,9%
8,1%
5,8%
1
3
2
,6%
1,7%
1,2%
0
2
5
,0%
1,2%
2,9%
0
3
2
,0%
1,7%
1,2%
26
80
66
15,1%
46,5%
38,4%

Total
73
42,4%
52
30,2%
29
16,9%
6
3,5%
7
4,1%
5
2,9%
172
100,0%

Izvor: Simulirani podaci.

Vjerojatnost u etvrtom retku i drugom stupcu numerikog dijela


tablice iznosi 1,7%, to znai da vjerojatnost da ispitanik ima deparac
izmeu 600 kn i 800 kn i ocjenu iz srednje kole 4 iznosi 0,071.
Posljednja vjerojatnost numerikog dijela tablice, tj. vjerojatnost u
estom retku i treem stupcu iznosi 2,9%, to znai da vjerojatnost da
ispitanik ima deparac izmeu 1000 kn i 3500 kn i ocjenu iz srednje kole
5 iznosi 0,012.
c)
Izraunate vjerojatnosti marginalne distribucije nalaze se u
zbirnom retku i zbirnom stupcu tablice 5.8.
Na primjer, druga marginalna vjerojatnost u zbirnom stupcu iznosi
30,2%, tj. vjerojatnost da ispitanik ima deparac izmeu 200 kn i 400 kn
bez obzira na prosjenu ocjenu u srednjoj koli iznosi 0,302.
Isto tako trea marginalna vjerojatnost u zbirnom retku iznosi
38,4%, tj. vjerojatnost da ispitanik ima prosjenu ocjenu u srednjoj koli
5 bez obzira na visinu deparca iznosi 0,384.

194

Vjerojatnost

Zbroj svih vjerojatnosti u izraunatoj


distribuciji vjerojatnosti je 1, odnosno 100%.

dvodimenzionalnoj

d)
Uz pretpostavku da promatrane sluajne varijable nisu nezavisne,
uvjetna distribucija vjerojatnosti: P(v 2 / v1 = 400) izraunata je na sljedei
nain i prikazana je u tablici 5.9:
P (v 2 = 3 / v1 = 400) =

P (v 2 = 3, v1 = 400) 0,081
=
= 0,2682 ,
P(v1 = 400)
0,302

P(v 2 = 4 / v1 = 400) =

P(v 2 = 4, v1 = 400) 0,116


=
= 0,3841 ,
0,302
P(v1 = 400)

P (v 2 = 5 / v1 = 400) =

P (v 2 = 5, v1 = 400) 0,105
=
= 0,3477 .
P (v1 = 400)
0,302

Tablica 5.9.
Uvjetna distribucija vjerojatnosti
3

0,2682

0,3841

0,3477

v2
P (v 2 / v1 = 400)

Izvor: Izraunato prema podacima u tablici 5.8.

Druga izraunata vjerojatnost u tablici 5.9. znai da vjerojatnost


da ispitanik ima prosjenu ocjenu iz srednje kole 4 uz uvjet da mu je
deparac izmeu 200 kn i 400 kn, iznosi 0,3841.
5.7. Kontinuirana sluajna varijabla
Kontinuirana ili diskretna sluajna varijabla X takva je varijabla
koja moe poprimiti neprebrojivo beskonano mnogo vrijednosti. Zato se
za kontinuiranu sluajnu varijablu ne rauna vjerojatnost u odreenoj
toki, nego nad odreenim intervalom.
Funkcija vjerojatnosti ili funkcija
kontinuirane sluajne varijable X ima svojstva:

gustoe

vjerojatnosti

f ( x) 0, x ,

195

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

f ( x)dx = 1 , (povrina ispod krivulje funkcije vjerojatnosti je 1),

x2

P ( x1 < X x 2 ) = f ( x)dx, [x 2 > x1 ] , (vjerojatnost da sluajna


x1

varijabla X poprimi vrijednost veu od x1 i manju ili jednaku x 2 ,


jednaka je odreenom integralu funkcije vjerojatnosti f ( x) na
tom intervalu, odnosno povrini koju krivulja funkcije
vjerojatnosti na tom intervalu zatvara s pozitivnim smjerom
osi x).
Funkcija distribucije sluajne varijable X je funkcija koja daje
vjerojatnost da e sluajna varijabla X poprimiti vrijednost jednaku ili
manju od nekog realnog broja x :
x

F ( x) = P ( X x) = f ( x)dx

(5.39)

Parametri distribucije:

Oekivanje sluajne varijable (ako integral konvergira):


+

E ( X ) = x f ( x) dx = .

(5.40)

Varijanca sluajne varijable:


+

V ( X ) = ( x ) 2 f ( x)dx .

(5.41)

5.8. Teorijske distribucije kontinuirane sluajne varijable


5.8.1. Normalna distribucija
Normalna distribucija je simetrina ( 3 = 0 ), unimodalna i ima
oblik zvona. Normalno je zaobljena ( 4 = 3 ):

196

Vjerojatnost

Slika 5.6.
Normalna krivulja

Izvor: Konstrukcija autora.

Prema slici 5.6 moe se uoiti da normalna krivulja u istoj toki


tono na sredini ima aritmetiku sredinu, medijan i mod.
Funkcija vjerojatnosti ili funkcija gustoe vjerojatnosti kod
normalne distribucije je:
f ( x) =

1 x 2
)
(
2

x < ,+ > .

(5.42)

Openito se kae da se kontinuirana sluajna varijabla X ravna


po normalnoj distribuciji koja je odreena parametrima (oekivanje)
i 2 (varijanca):
X

N ( , 2 ) .

(5.43)

Za standardiziranu varijablu Z:
Z=

(5.44)

funkcija vjerojatnosti je:


f (Z ) =

1
2

1
Z2
2

(5.45)

Ova normalna distribucija se naziva standardizirana ili


jedinina normalna distribucija s oekivanjem 0 i jedininom
varijancom, pa vrijedi da je:
X N (0,1) .

(5.46)

197

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Slika 5.7.
Povrina ispod normalne krivulje
P(Z)

Z
0
Izvor: Konstrukcija autora.

Jedinina normalna distribucija ima uvijek iste vrijednosti


parametara, pa se vrijednosti za intervale vrijednosti varijable Z, od 0 do
z kako je prikazano na slici 5.7, (u statistikoj literaturi ima i drugaije
koncipiranih tablica), mogu prikazati u jedinstvenoj tablici povrina
(vjerojatnosti) ispod normalne krivulje.
Na primjer:
x
x
P ( x1 < X x 2 ) = P2 2
P1 1
= P2 (Z 2 ) P1 (Z 1 ) . (5.47)

5.8.2. Studentova distribucija


Studentova distribucija jo se naziva t-distribucija. Ima svoju
primjenu u statistici kod procjene parametara osnovnog skupa i kod
testiranja hipoteza na osnovi uzorka.
Varijabla "t" je definirana na podruju: < ,+ > . Studentova
distribucija je simetrina s obzirom na t = 0 .
Ako je Z N (0,1) i 2 varijabla tzv. hi-kvadrat ili gamadistribucije s (ili df - degree of freedom) stupnjevima slobode i ako su
one nezavisne sluajne varijable, tada je:
t =

(5.48)

t - varijabla Studentove distribucije sa stupnjevima slobode (ili df).

198

Vjerojatnost

Slika 5.8.
Studentova distribucija za razliite stupnjeve slobode
Z~N (0,1)
=5
=2
0

Izvor: Konstrukcija autora.

Na slici 5.8 se vidi da se s poveanjem stupnjeva slobode ,


studentova distribucija pribliava normalnoj distribuciji. Ve za = 30 u
praksi se umjesto t - distribucije upotrebljava normalna distribucija
(pogreka aproksimacije u tom je sluaju manja od 0,03).

199

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

200

Ocjene parametara osnovnog skupa na osnovu uzorka

6. OCJENE PARAMETARA OSNOVNOG SKUPA NA


OSNOVI UZORKA
6.1. Uzorak
Uzorak je podskup osnovnoga statistikog skupa, a uzima se u
svrhu ispitivanja obiljeja elemenata osnovnog skupa (ili populacije).
Uzorak treba biti reprezentativan i sluajan. Sluajan izbor jedinica
osnovnog skupa u uzorak moe se postii pomou tablice sluajnih
brojeva. Jedinice u uzorak mogu se birati sistematski (npr. svaki 10.
element osnovnog skupa).
Frakcija odabiranja (f) omjer je jedinica u uzorku i broja
jedinica u osnovnom skupu:
f =

n
,
N

(6.1)

gdje je :
n

- broj jedinica u uzorku,

- broj jedinica u osnovnom skupu.

Korak izbora je reciprona vrijednost frakcije odabiranja ( 1 f ) i


upotrebljava se kod sistematskog izbora jedinica u uzorak.
Broj svih moguih uzoraka (bez ponavljanja) veliine n iz
osnovnog skupa veliine N jednak je broju kombinacija bez ponavljanja
n -tog razreda:
N
K = .
n

(6.2)

Pomou uzorka vri se procjena odreenih parametara osnovnog


skupa i testiraju se hipoteze o nepoznatim parametrima osnovnog skupa.

201

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Ako se iz osnovnog skupa veliine N izaberu svi mogui uzorci


veliine n , te se za svaki uzorak izrauna neki odgovarajui parametar,
distribucija tih parametara naziva se sampling distribucija.
Pristranost je razlika izmeu oekivane vrijednosti nekog
parametra iz sampling distribucije i tog istog parametra iz osnovnog
skupa:
.
E ()

(6.3)

Ako izmeu oekivane vrijednosti nekog parametra iz sampling


distribucije i tog istog parametra iz osnovnog skupa ne postoji razlika,
onda se to svojstvo naziva nepristranost:
=.
E ()

(6.4)

Standardna devijacija sampling distribucije naziva se standardna


greka.
6.2. Procjena aritmetike sredine osnovnog skupa
Ako veliina uzorka tei prema beskonano sampling
distribucija aritmetikih sredina, tei normalnom obliku. Kod malih
uzoraka sampling distribucija aritmetikih sredina ima oblik Studentove
ili t-distribucije. Stoga vrijedi da ako je:
n > 30

koristi se Normalna distribucija i

n 30

koristi se Studentova ili t-distribucija.

Standardna greka aritmetike sredine


devijacija sampling distribucije aritmetike sredine):

Se( X ) =
n
N n

Se( X ) =

N 1
n

202

ako je f 0,05 i
ako je f > 0,05 .

je

(standardna

Ocjene parametara osnovnog skupa na osnovu uzorka

Ako nije poznata standardna devijacija osnovnog skupa , rauna


se nepristrana (tokasta) ocjena varijance osnovnog skupa na osnovi
uzorka S 2 :
n
S 2 =

n 1

ako je n 30 i

S 2 =

ako je n > 30 .

Tokasta procjena (procjena jednim brojem) aritmetike


sredine osnovnog skupa na osnovi uzorka je:
X .

Intervalna procjena aritmetike sredine osnovnog skupa na


osnovi uzorka je:

Pr X Z Se( X ) < X < X + Z Se( X ) = 1 ,

(6.5)

gdje je:
X

- aritmetika sredina izraunata na osnovi uzorka

Z
- ako je ( n > 30 ) rauna se vrijednost iz tablice povrina Normalne
distribucije (pomou Z 1 )
2

- ako je ( n 30 ) umjesto ( Z ) rauna se vrijednost iz tablice

povrina Studentove ili t-distribucije (pomou t [df2=n 1] )

Se(X )

- standardna greka aritmetike sredine

1 - nivo pouzdanosti procjene (ako nije odreeno drukije, najee


se uzima de je 1 = 95% ).

Veliina uzorka uz zadani nivo pouzdanosti i maksimalnu greku


odreuje se na sljedei nain:
Z
n' =

greka

ako je f 0,05 ili

(6.6)

203

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

n=

n'
n'
1+
N

ako je f > 0,05 ,

(6.7)

gdje je:
Z
- vrijednost iz tablice povrina Normalne distribucije (pomou
Z 1 )
2

- standardna devijacija iz osnovnog skupa

greka - maksimalna greka.

Ako je maksimalna greka odreena u relativnom izrazu


umjesto (standardne devijacije), veliina uzorka se rauna pomou V
(koeficijenta varijacije):
V=

100 .

(6.8)

Analitiki primjer 6.1.


Za zadani uzorak ispitanika potrebno je:
a)

Izraunati prosjenu visinu ispitanika u uzorku (varijabla v1)!

b)
Izraunati interval procjene za prosjenu visinu ispitanika
osnovnog skupa uz pouzdanost procjene od 95%!
c)
Izraunati interval procjene za prosjenu visinu ispitanika
osnovnog skupa uz pouzdanost procjene od 99%!
Rjeenje 6.1:
a)
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Explore.
U otvorenom prozoru Explore potrebno je zadanu numeriku
varijablu v1 - visina u cm pomou odgovarajue strelice prebaciti u
Dependent List. U prostoru Display potrebno je aktivirati Statistics.

204

Ocjene parametara osnovnog skupa na osnovu uzorka

Klikom na ikonu Statistics otvara se novi prozor Explore:


Statistics koji je prikazan na slici 6.1.
Slika 6.1.
Odabrani nivo pouzdanosti procjene za aritmetiku sredinu od 95%

Izvor: Simulirani podaci.

Prema zahtjevu zadatka od (b) ovdje je izabran nivo pouzdanosti


procjene od 95%. Konano, da bi se u Outputu programa SPSS dobili
eljeni podaci o visini ispitanika, potrebno je kliknuti na Continue i OK.
Rezultat je prikazan u tablici 6.1.
Tablica 6.1.
Podaci o visini ispitanika
Descriptives
Visina u cm

Mean
95% Confidence
Interval for Mean
5% Trimmed Mean
Median
Variance
Std. Deviation
Minimum
Maximum
Range
Interquartile Range
Skewness
Kurtosis

Lower Bound
Upper Bound

Statistic
175,77
174,64

Std. Error
,571

176,89
175,54
174,00
76,539
8,749
154
206
52
12
,485
,184

,159
,316

Izvor: Simulirani podaci.

205

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Prema podacima iz tablice 6.1. moe se vidjeti da je prosjena


visina ispitanika u uzorku 175,77cm.
b)
Intervalna procjena aritmetike sredine osnovnog skupa pomou
zadanog uzorka uz nivo pouzdanosti procjene od 95% je:
Pr{174,64 < X < 176,89} = 95% .

Uz traenu intervalnu procjenu u izlaznoj tablici Descriptives u


Outputu programa SPSS dobiju se i sljedei podaci uzorka ispitanika:
Median (medijan), Variance (varijanca), Std. Deviation (standardna
devijacija), Minimum (najmanja vrijednost varijable), Maximum (najvea
vrijednost varijable), Range (raspon varijacije obiljeja), Interquartile
Range (interkvartil), Skewness (mjera asimetrije), Kurtosis (mjera
zaobljenosti), Std. Error Mean (standardna greka aritmetike
sredine),Std. Error Skewness (standardna greka mjere asimetrije) i Std.
Error Kurtosis (standardna greka mjere zaobljenosti).
c)
Da bi se dobila intervalna procjena aritmetike sredine visine
osnovnog skupa pomou zadanog uzorka uz nivo pouzdanosti procjene
od 99%, potrebno je ponoviti slian postupak, samo se u prozor Explore:
Statistics upie novi nivo pouzdanosti procjene 99%.
Tablica 6.2.
Podaci o visini ispitanika
Descriptives
Visina u cm

Mean
99% Confidence
Interval for Mean
5% Trimmed Mean
Median
Variance
Std. Deviation
Minimum
Maximum
Range
Interquartile Range
Skewness
Kurtosis

Izvor: Simulirani podaci.

206

Lower Bound
Upper Bound

Statistic
175,77
174,28

Std. Error
,571

177,25
175,54
174,00
76,539
8,749
154
206
52
12
,485
,184

,159
,316

Ocjene parametara osnovnog skupa na osnovu uzorka

Rezultat je prikazan u tablici 6.2. Intervalna procjena aritmetike


sredine osnovnog skupa pomou zadanog uzorka uz nivo pouzdanosti
procjene od 99% je:
Pr{174,28 < X < 177,25} = 99% .

Moe se zakljuiti da s poveanjem nivoa pouzdanosti procjene


interval procjene postaje iri, odnosno procjena postaje manje precizna.

Analitiki primjer 6.2.


Za zadani uzorak ispitanika potrebno je:
a)

Izraunati prosjenu teinu ispitanika u uzorku (varijabla v1)!

b)
Izraunati interval procjene za prosjenu teinu ispitanika
osnovnog skupa uz pouzdanost procjene od 95%!
c)
Izraunati interval procjene za prosjenu teinu ispitanika
osnovnog skupa uz pouzdanost procjene od 99%!
Rjeenje 6.2:
a)
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Explore.
U otvorenom prozoru Explore potrebno je zadanu numeriku
varijablu v1 - teina u kg pomou odgovarajue strelice prebaciti u
Dependent List. U prostoru Display potrebno je aktivirati Statistics.
Klikom na ikonu Statistics otvara se novi prozor Explore:
Statistics.
Prema zahtjevu zadatka od (b) ovdje izabran nivo pouzdanosti
procjene od 95%. Konano, da bi se u Outputu programa SPSS dobili
eljeni podaci o teini ispitanika, potrebno je kliknuti na Continue i OK.
Rezultat je prikazan u tablici 6.3.
Prema podacima iz tablice 6.3 moe se vidjeti da je prosjena
teina ispitanika u uzorku 61,18 kg.

207

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Tablica 6.3.
Podaci o teini ispitanika
Descriptives
Tezina u kg

Mean
95% Confidence
Interval for Mean

Lower Bound
Upper Bound

5% Trimmed Mean
Median
Variance
Std. Deviation
Minimum
Maximum
Range
Interquartile Range
Skewness
Kurtosis

Statistic
67,1795
65,4372

Std. Error
,88431

68,9218
66,3257
64,0000
182,989
13,52735
46,00
110,00
64,00
19,00
,840
,214

,159
,317

Izvor: Simulirani podaci.

b)
Intervalna procjena aritmetike sredine teine u osnovnom skupu
pomou zadanog uzorka uz nivo pouzdanosti procjene od 95% je:
Pr{65,44 < X < 68,92} = 95% .

c)
Da bi se dobila intervalna procjena aritmetike sredine teine
populacije osnovnog skupa pomou zadanog uzorka uz nivo pouzdanosti
procjene od 99%, potrebno je ponoviti slian postupak, samo se u prozor
Explore: Statistics upie novi nivo pouzdanosti procjene 99%.
Rezultat je prikazan u tablici 6.4. Intervalna procjena aritmetike
sredine teine stanovnika u osnovnom skupu pomou zadanog uzorka uz
nivo pouzdanosti procjene od 99% je:
Pr{64,88 < X < 69,48} = 99% .

Moe se opet zakljuiti da s poveanjem nivoa pouzdanosti


procjene interval procjene postaje iri, odnosno procjena postaje manje
precizna.

208

Ocjene parametara osnovnog skupa na osnovu uzorka

Tablica 6.4.
Podaci o teini ispitanika
Descriptives
Tezina u kg

Mean
99% Confidence
Interval for Mean

Lower Bound
Upper Bound

5% Trimmed Mean
Median
Variance
Std. Deviation
Minimum
Maximum
Range
Interquartile Range
Skewness
Kurtosis

Statistic
67,1795
64,8829

Std. Error
,88431

69,4761
66,3257
64,0000
182,989
13,52735
46,00
110,00
64,00
19,00
,840
,214

,159
,317

Izvor: Simulirani podaci.

6.3. Procjena proporcije osnovnog skupa


Ako veliina uzorka tei prema beskonano, sampling
distribucija proporcija tei normalnom obliku. Kod malih uzoraka
sampling distribucija proporcija ima oblik Studentove ili t-distribucije.
Stoga vrijedi da ako je:
n > 30

koristi se Normalna distribucija i

n 30

koristi se Studentova ili t-distribucija.

Standardna greka proporcije (standardna devijacija sampling


distribucije proporcije) je:

ako je f 0,05 :
Se( p ) =

p q
n

ako je n > 30 i

209

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Se( p ) =

p q
n 1

ako je n 30 .

ako je f > 0,05 :


Se( p ) =

p q
N n

n
N 1

ako je n > 30 i

Se( p ) =

p q
N n

n 1
N 1

ako je n 30 .

Tokasta procjena (procjena jednim brojem) proporcije


osnovnog skupa na osnovi uzorka je: p , odnosno to je proporcija uzorka.
Intervalna procjena proporcije osnovnog skupa na osnovi
uzorka je:
Pr{p Z Se( p ) < P < p + Z Se( p )} = 1

(6.9)

gdje je:
p

- proporcija izraunata na osnovi uzorka; ( q = 1 p )

- ako je ( n > 30 ) rauna se vrijednost iz tablice povrina Normalne


distribucije (pomou Z 1 )
Z

- ako je ( n 30 ) umjesto ( Z ) rauna se vrijednost iz tablice

povrina Studentove ili t-distribucije (pomou t [df2= n 1] )


Se( p ) - standardna greka proporcije
1 - nivo pouzdanosti procjene (ako nije odreeno drugaije,
najee se uzima da je 1 = 95% ).

Veliina uzorka uz zadani nivo pouzdanosti i maksimalnu greku


odreuje se na sljedei nain:
Z P Q
n' =

greka

210

ako je f 0,05 ili

(6.10)

Ocjene parametara osnovnog skupa na osnovu uzorka

n=

n'
n'
1+
N

ako je f > 0,05 ,

(6.11)

gdje je:
Z
- vrijednost iz tablice povrina Normalne distribucije (pomou
Z 1 )
2

PQ

- varijanca osnovnog skupa

greka - maksimalna greka.

Ako je maksimalna greka odreena u relativnom izrazu


umjesto
P Q (standardne devijacije), veliina uzorka se rauna
pomou V (koeficijenta varijacije osnovnog skupa):
V=

Q
,
P

(6.12)

pa vrijedi da je:
2

Q
Z

P
.
n' =
greka

(6.13)

Analitiki primjer 6.3.


Za zadani uzorak ispitanika (koji su odgovorili na postavljeno
pitanje) potrebno je:
a)
Izraunati proporciju uzorka ispitanika kojima su financijske
prilike u obitelji takve da zadovoljavaju osnovne potrebe (varijabla v1)!
b)
Izraunati interval procjene za proporciju ispitanika osnovnog
skupa kojima su financijske prilike u obitelji takve da zadovoljavaju
osnovne potrebe uz pouzdanost procjene od 95%!

211

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

c)
Izraunati interval procjene za proporciju ispitanika osnovnog
skupa kojima su financijske prilike u obitelji takve da zadovoljavaju
osnovne potrebe uz pouzdanost procjene od 99%!
Rjeenje 6.3:
a)
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Frequencies.
U otvorenom prozoru Frequencies potrebno je zadanu numeriku
varijablu v1 - financijske prilike u obitelji pomou odgovarajue strelice
prebaciti u Variable(s).
Da bi se u Outputu programa SPSS dobili eljeni podaci o
financijskim prilikama obitelji ispitanika, potrebno je kliknuti na
Continue i OK. Rezultat je prikazan u tablici 6.5.
Tablica 6.5
Podaci o financijskim prilikama u obitelji ispitanika
Financijske prilike u obitelji
Frequency
Valid

Missing
Total

Nema novca za
normalan standard
Zadovoljava
osnovne potrebe
Nema materijalnih
problema
Zivi odlicno
Total
System

Percent

Valid Percent

Cumulative
Percent

1,7

1,7

1,7

104

43,5

43,9

45,6

122

51,0

51,5

97,0

7
237
2
239

2,9
99,2
,8
100,0

3,0
100,0

100,0

Izvor: Simulirani podaci.

Prema podacima u tablici 6.5. proporcija uzorka ispitanika kojima


su financijske prilike u obitelji takve da zadovoljavaju osnovne potrebe
omjer je povoljnih i svih moguih ishoda, a moe se i direktno oitati iz
izlazne tablice u stupcu Valid Percent:
p =

212

m 104
=
= 0,439 ; q = 1 p = 1 0,439 = 0,561 .
n 237

Ocjene parametara osnovnog skupa na osnovu uzorka

S obzirom na to da je veliina uzorka 237 , vrijedi da je n > 30 , pa


se za intervalnu procjenu koristi normalna distribucija;
b)
Potrebno je napomenuti da program SPSS nema mogunost
direktnog izrauna intervalne procjene proporcije osnovnog skupa na
osnovi uzorka.
Intervalna procjena proporcije osnovnog skupa na osnovi uzorka
uz pouzdanost procjene od 95% je:
Pr{p Z Se( p ) < P < p + Z Se( p )} = 1 ,
n > 30

Se( p) =

p q
=
n

0,439 0,561
= 0,032235879
237

Pomou tablica odgovarajuih povrina ispod normalne krivulje


vrijedi da je:
tab

Z 1

0 , 95
=
= 0 , 475
2
2

Z = 1,96

Uvrtavanjem odgovarajuih veliina u poetni izraz intervalne


procjene dobije se:
Pr{0,439 1,96 0,032235879 < P < 0,439 + 1,96 0,032235879} = 95% ,

Konano je intervalna procjena proporcije ispitanika osnovnog


skupa kojima su financijske prilike u obitelji takve da zadovoljavaju
osnovne potrebe na osnovi zadanog uzorka uz pouzdanost procjene od
95%:
Pr{0,3758 < P < 0,50218} = 95% .

c)
Na slian nain intervalna procjena proporcije ispitanika
osnovnog skupa kojima su financijske prilike u obitelji takve da
zadovoljavaju osnovne potrebe na osnovi uzorka uz pouzdanost procjene
od 99% je:
tab

Z 1
2

0 , 99
= 0 , 495
2

Z = 2,58

Pr{0,439 2,58 0,032235879 < P < 0,439 + 2,58 0,032235879} = 99% ,

213

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Pr{0,35583 < P < 0,52217} = 99% .

Moe se zakljuiti da s poveanjem nivoa pouzdanosti procjene


interval procjene postaje iri, odnosno procjena postaje manje precizna.

Analitiki primjer 6.4.


Za zadani uzorak ispitanika (koji su odgovorili na postavljeno
pitanje) potrebno je:
a)
Izraunati proporciju uzorka ispitanika kojima su roditelji
razvedeni (varijabla v1)!
b)
Izraunati interval procjene za proporciju ispitanika osnovnog
skupa kojima su roditelji razvedeni uz pouzdanost procjene od 95%!
c)
Izraunati interval procjene za proporciju ispitanika osnovnog
skupa kojima su roditelji razvedeni uz pouzdanost procjene od 98%!
Rjeenje 6.4:
a)
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Frequencies.
U otvorenom prozoru Frequencies potrebno je zadanu numeriku
varijablu v1 - brano stanje roditelja pomou odgovarajue strelice
prebaciti u Variable(s).
Tablica 6.6
Podaci o branom stanju roditelja ispitanika
Bracno stanje roditelja

Valid

U braku
Rastavljeni
Umro jedan od roditelja
Ostalo
Total

Izvor: Simulirani podaci.


214

Frequency
215
10
11
3
239

Percent
90,0
4,2
4,6
1,3
100,0

Valid Percent
90,0
4,2
4,6
1,3
100,0

Cumulative
Percent
90,0
94,1
98,7
100,0

Ocjene parametara osnovnog skupa na osnovu uzorka

Da bi se u Outputu programa SPSS dobili eljeni podaci o


branom stanju roditelja ispitanika, potrebno je kliknuti na Continue i
OK. Rezultat je prikazan u tablici 6.6.
Prema podacima u tablici 6.6. proporcija uzorka ispitanika kojima
su roditelji razvedeni omjer je povoljnih i svih moguih ishoda, a moe se
i direktno oitati iz izlazne tablice u stupcu Valid Percent:
p =

m 10
=
= 0,042 ; q = 1 p = 1 0,042 = 0,958 .
n 239

S obzirom na to da je veliina uzorka 239 , vrijedi da je n > 30 , pa


se za intervalnu procjenu koristi normalna distribucija.
b)
Intervalna procjena proporcije u osnovnom skupu onih stanovnika
kojima su roditelji razvedeni na osnovi uzorka uz pouzdanost procjene od
95% je:
Pr{p Z Se( p ) < P < p + Z Se( p )} = 1 ,
n > 30

p q
=
n

Se( p) =

0,042 0,958
= 0,012975032
239

Pomou tablica odgovarajuih povrina ispod normalne krivulje


vrijedi da je:
tab

Z 1

0 ,95
=
= 0 , 475
2
2

Z = 1,96

Uvrtavanjem odgovarajuih veliina u poetni izraz intervalne


procjene dobije se:
Pr{0,042 1,96 0,012975032 < P < 0,042 + 1,96 0,012975032} = 95% .

Konano je intervalna procjena proporcije ispitanika osnovnog


skupa kojima su roditelji razvedeni na osnovi zadanog uzorka uz
pouzdanost procjene od 95%:
Pr{0,0166 < P < 0,0674} = 95% .

c)
Na slian nain intervalna procjena proporcije ispitanika
osnovnog skupa kojima su roditelji razvedeni na osnovi uzorka uz
pouzdanost procjene od 98% je:

215

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA


tab

Z 1

0 , 98
=
= 0, 49
2
2

Z = 2,33 ,

Pr{0,042 2,33 0,032235879 < P < 0,042 + 2,33 0,032235879} = 98% ,


Pr{0,01177 < P < 0,07223} = 98% .

I ovdje vrijedi jednak zakljuak da s poveanjem nivoa


pouzdanosti procjene interval procjene postaje iri, odnosno procjena
postaje manje precizna.

216

Analitiki primjeri za vjebu

7. ANALITIKI PRIMJERI ZA VJEBU

Analitiki primjer 7.1.


Nakon provedene ankete potrebno je u dokument (Variable View)
programa SPSS upisati varijablu (obiljeje): Brano stanje (v3) i kodirati
je prema zadanoj tablici 7.1.
Tablica 7.1.
Kodna lista za varijablu Brano stanje
OBILJEJE
bracno stanje (v3)

OBLICI OBILJEJA
neozenjen (neudana)
ozenjen (udana)
razveden (razvedena)
udovac (udovica)

KOD
1
2
3
4

Izvor: Podaci su simulirani.

Nakon kodiranja zadatak je unijeti konkretne podatke za 50


ispitanika zadane u tablici 7.2. u navedeni dokument (Data View).
Tablica 7.2.
Tablica s kodiranim podacima za varijablu Brano stanje
(1)
(2)
2
1
2
1
1
2
1
2
1
1
1
1
1
3
2
1
2
2
2
1
Izvor: Podaci su simulirani.

Brano stanje
(3)
1
4
1
1
2
2
1
1
3
1

(4)
1
1
1
1
2
2
2
2
3
1

(5)
2
2
2
1
2
2
1
1
1
2

217

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Rjeenje 7.1:
U programu SPSS pitanja, odnosno varijable se definiraju u dijelu
Variable view koji se bira u donjem lijevom kutu ekrana.
Varijablu je potrebno nazvati (Name) v3. Radi lakeg rada s
podacima naznaena je vrsta podataka (Type) Numeric. U stupcu Label
oznaeno je da je varijabla v3: Brano stanje. Zadnji stupac definira skalu
mjerenja (Measure), gdje je za v3 - Brano stanje oznaena opisna, tj.
Nominal skala.
U stupcu Values za varijablu v3 - Brano stanje uneseni su kodovi
prema tablici 7.1. Klikom mia u polje stupca Values otvara se prozor
Value Labels u kojem se definira konkretno kodiranje. To je za ovaj
primjer prikazano na slici 7.1.
Slika 7.1.
Prikaz definiranih varijabli u programu SPSS

Izvor: Podaci su simulirani.

U programu SPSS podaci prema definiranim varijablama se unose


u dijelu Data view koji se bira u donjem lijevom kutu ekrana.
Na slici 7.2 prikazani su podaci o branom stanju dijela ispitanika prema
zadanim podacima u tablici 7.2 (podaci su simulirani).
Naravno, nakon to su se podaci unijeli u program SPSS, potrebno
ih je snimiti na standardan nain kako se to radi kod veine klasinih
programa za raunalo. Na glavnom izborniku odabire se File, a u njegovu
218

Analitiki primjeri za vjebu

padajuem izborniku Save As te se uneseni podaci snimaju pod eljenim


imenom.
Slika 7.2.
Prikaz podataka varijable v3 - Brano stanje za dio ispitanika u programu
SPSS

Izvor: Podaci su simulirani.

Analitiki primjer 7.2.


Zadatak je formirati statistiku tablicu prema obiljeju "Brano
stanje". Komentirajte drugu apsolutnu frekvenciju! Komentirajte prvi
relativni broj strukture (Percent)!

219

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Rjeenje 7.2:
Potrebno je na glavnom izborniku odabrati Analyze, a na njegovu
padajuem izborniku odabrati Descriptive Statistics. Dalje se bira
Frequencies. Varijabla v3 - Brano stanje se prebacuje u polje
Variable(s).
Klikom na OK u Outputu programa SPSS dobije se tablica
frekvencija uzorka prema odabranom obiljeju, odnosno varijabli.
Rezultat je prikazan u tablicama 7.3.
Tablica 7.3.
Bracno stanje
Frequency

Valid

neozenjen
(neudana)
ozenjen (udana)
razveden
(razvedena)
udovac (udovica)
Total

Percent

Valid Percent

Cumulative
Percent

26

52,0

52,0

52,0

20

40,0

40,0

92,0

6,0

6,0

98,0

1
50

2,0
100,0

2,0
100,0

100,0

Izvor: Podaci su simulirani.

Druga apsolutna frekvencija je 20 i ona u prvom sluaju znai da


je od 50 odabranih ispitanika njih 20 bilo oenjenih (udanih). Prvi
relativni broj strukture je 52 i on znai da je meu odabranim
ispitanicima njih 52% neoenjenih (neudanih).

Analitiki primjer 7.3.


Zadatak je 50 anketiranih ispitanika prikazati jednostavnim
stupcima prema obiljeju "Brano stanje" (upisati naslov grafikona)!
Komentirajte sliku!
Rjeenje 7.3:
Potrebno je na glavnom izborniku odabrati Graphs, a na njegovu
padajuem izborniku Bar chart na kojem se aktivira ikona Simple.
220

Analitiki primjeri za vjebu

Odabirom ikone Define otvara se prozor Define Simple Bar:


Summaries for Groups of Cases gdje se u prostor Category Axis prebaci
eljena varijabla, to je u ovom sluaju Brano stanje (v3). Grafikonu se
moe definirati i naslov na nain da se klikne na ikonu Titles... Klikom na
OK u Outputu programa SPSS dobije se traeni grafikon koji je prikazan
na slici 7.3.
Slika 7.3.
Ispitanici prema bracnom stanju

30

25

Count

20

15

10

0
neozenjen (neudana)

ozenjen (udana)

razveden (razvedena)

udovac (udovica)

Bracno stanje

Izvor: Podaci su simulirani.

Prema grafikonu jednostavnih stupaca moe se vidjeti da je meu


odabranim ispitanicima najvie neoenjenih (neudanih), a najmanje onih
koji su udovac ili udovica. Razvedenih ima manje u odnosu na broj
oenjenih (udanih) u odabranom uzorku.

221

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Analitiki primjer 7.4.


Za ispitanike prema obiljeju "Visina u cm" izraunajte:
aritmetiku sredinu, medijan i mod! Komentirajte sve tri srednje
vrijednosti na konkretnom primjeru!

Rjeenje 7.4:
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Frequencies.
U prozoru Frequencies pomou odgovarajue strelice varijabla v2
- visina u cm se prebacuje u polje Variable(s).
Klikom na ikonu Statistics otvara se novi prozor Frequencies
Statistics gdje je potrebno aktivirati odreene statistike veliine prema
zahtjevu zadatka, a koje se odnose na odabranu varijablu visina u cm
(v2).
Aritmetika sredina dobit e se aktiviranjem veliine Mean, a za
mod potrebno je oznaiti Mode, a za medijan Median.
Da bi se u Outputu programa SPSS dobili eljeni podaci o visini
ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je
prikazan u tablici 7.4.
Tablica 7.4.
Statistiki podaci o visini ispitanika
Statistics
Visina u cm
N
Valid

50

Missing

Mean

175,5800

Median

174,5000

Mode
172,00(a)
a Multiple modes exist. The smallest value is shown

Izvor: Podaci su simulirani.

222

Analitiki primjeri za vjebu

Prema podacima iz tablice 3.3. moe se vidjeti da je u analizi 50


ispitanika. Prosjena visina ispitanika u odabranom uzorku (od onih koji
su dali odgovor), odnosno aritmetika sredina je 175,58 cm.
Medijan je 174,5 cm, to znai da je polovica ispitanika s visinom
manjom od 174,5 cm ili jednakom tom visinom, a preostala polovica
ispitanika je s visinom veom od 174,5 cm.
Mod, odnosno najea visina ispitanika, 172 je cm. Ispod tablice
je naznaka da u ovoj distribuciji to nije jedini mod, dakle ovo nije
unimodalna distribucija.

Analitiki primjer 7.5.


Zadatak je za samo ispitanike "mukog spola" formirati tablicu
frekvencija prema varijabli (obiljeju) "kolska sprema". Komentirajte 4.
apsolutnu frekvenciju i opseg ovoga izabranog statistikog skupa!
Rjeenje 7.5:
Nakon odabira (filtriranja) ispitanika mukog spola (Data; Select
cases; If condition is satisfied: v1 = 2 ) koji je u obiljeju spol kodiran s 2,
potrebno je na glavnom izborniku odabrati ikonu Analyze, a na njezinu
padajuem izborniku Descriptive Statistics i Frequencies.
U prozoru Frequencies pomou odgovarajue strelice varijabla v2
- kolska sprema se prebacuje u polje Variable(s).
Da bi se u Outputu programa SPSS dobili eljeni podaci o
kolskoj spremi odabranih ispitanika mukog spola, potrebno je kliknuti
na Continue, zatim na OK. Rezultat je prikazan u tablici 7.5.
Prema podacima iz tablice 7.5 moe se vidjeti da su u analizi 22
ispitanika mukog spola. etvrta apsolutna frekvencija je 13, to znai da
je 13 ispitanika u analizi bilo sa srednjom strunom spremom.

223

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Tablica 7.5.
Statistiki podaci o kolskoj spremi ispitanika
Skolska sprema
Frequency

Valid

Nisam pohadjao
skolu
Osnovna skola
Neka zanatska
skola
Srednja skola
Visa skola
Visoka skola
Magisterij
Total

Percent

Valid Percent

Cumulative
Percent

4,5

4,5

4,5

4,5

4,5

9,1

4,5

4,5

13,6

13
1
4
1
22

59,1
4,5
18,2
4,5
100,0

59,1
4,5
18,2
4,5
100,0

72,7
77,3
95,5
100,0

Izvor: Podaci su simulirani.

Analitiki primjer 7.6.


Svih 50 anketiranih ispitanika prema varijabli (obiljeju) "kolska
sprema" prikaite grafiki pomou strukturnoga kruga (upisati naslov
grafikona)! Komentirajte sliku!
Rjeenje 7.6:
Potrebno je na glavnom izborniku odabrati Graphs, a na njegovu
padajuem izborniku Pie chart, na kojem se aktivira Summaries of
groups of case.
Odabirom ikone Define otvara se prozor Define Pie: Summaries
for Groups of Cases gdje se u prostor Define Slices by prebaci eljena
varijabla, to je u ovom sluaju kolska sprema (v2). Grafikonu se moe
definirati i naslov na nain da se klikne na ikonu Titles... Klikom na OK u
Outputu programa SPSS dobije se traeni grafikon koji je prikazan na
slici 7.4.

224

Analitiki primjeri za vjebu

Slika 7.4.
Ispitanici prema skolskoj spremi

Skolska sprema
Nisam pohadjao skolu
Osnovna skola
Neka zanatska skola
Srednja skola
Visa skola
Visoka skola
Magisterij
Doktorat

Izvor: Podaci su simulirani.

Prema grafikonu strukturnoga kruga moe se vidjeti da je meu


odabranim ispitanicima najvie onih sa srednjom strunom spremom,
zatim slijede oni s zavrenom visokom i viom kolom. Ostale kategorije
strune spreme u ovom su uzorku manje zastupljene.

Analitiki primjer 7.7.


Ispitanike prema obiljeju "teina u kg" potrebno je grupirati na
sljedei nain: 41
51
61
71
81

- 50
- 60
- 70
- 80
- 90

50
60
70
80
90

225

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

91
101

- 100
- 110

100
110.

Nova varijabla je v4, a predstavlja "Grupiranu teinu".


Za ovu varijablu "Grupirana teina" formirajte tablicu frekvencija i
komentirajte 3. relativni broj strukture (Percent)!
Rjeenje 7.7:
Da bi se pomou varijable v3 - "Teina u kg" formirala nova
varijabla v4 - "Grupirana teina" po principu koji je zadan u ovom
primjeru, potrebno je na glavnom izborniku odabrati Transform, a u
njegovu padajuem izborniku odabrati Recode. U njegovu izborniku bira
se Into Different Variables (jer bi se odabirom Into Same Variables
izgubila postojea varijabla). U polje Numeric Variable bira se v3 - "
Teina u kg ", a u Output Variable, Name je v4, a Label "Grupirana
teina".
Tablica 7.6.
Statistiki podaci o kolskoj spremi ispitanika
Grupirana tezina

Valid

50,00
60,00
70,00
80,00
90,00
100,00
110,00
Total

Frequency
4
14
15
7
5
4
1
50

Percent
8,0
28,0
30,0
14,0
10,0
8,0
2,0
100,0

Valid Percent
8,0
28,0
30,0
14,0
10,0
8,0
2,0
100,0

Cumulative
Percent
8,0
36,0
66,0
80,0
90,0
98,0
100,0

Izvor: Podaci su simulirani.

Odabirom ikone Old and New Values otvara se novi prozor


Recode into Different Variables. Aktiviranjem opcije Range upisuju se
odgovarajue grupe ocjena, kako je zadano. Nakon upisivanja svakog
pojedinog Range, upisuje se odgovarajua New Value, koja se svaki put
kao nova grupa dodaje klikom na ikonu Add. Nakon to su unesene sve

226

Analitiki primjeri za vjebu

grupe ikonom Continue, zatim Change i OK, u novom stupcu Data View
kreirat e se nova varijabla "Grupirana teina", odnosno v4.
Trei relativni broj strukture iznosi 30 i znai da je 30% ispitanika
u uzorku s teinom izmeu 61 kg i 70 kg.

Analitiki primjer 7.8.


Za sve ispitanike prema varijabli "teina u kg" izraunajte
medijan, donji i gornji kvartil! Komentirajte sve 3 karakteristine
vrijednosti niza!

Rjeenje 7.8:
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Frequencies.
U prozoru Frequencies pomou odgovarajue strelice varijabla v3
- visina u cm se prebacuje u polje Variable(s).
Klikom na ikonu Statistics otvara se novi prozor Frequencies
Statistics gdje je potrebno aktivirati odreene statistike veliine prema
zahtjevu zadatka, a koje se odnose na odabranu varijablu teina u kg (v3).
Da bi se u Outputu programa SPSS dobili eljeni podaci o teini
ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je
prikazan u tablici 7.7.
Tablica 7.7.
Statistiki podaci o teini ispitanika
N
Median
Percentiles

Valid
Missing
25
50
75

Statistics
50
0
63,5000
55,7500
63,5000
77,2500

Izvor: Podaci su simulirani.

227

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Prema podacima iz tablice 7.7. moe se vidjeti da je u analizi bilo


50 ispitanika.
Medijan je 63,5 kg, to znai da je polovica ispitanika s teinom
manjom od 63,5 kg ili jednakom teinom, a preostala polovica ispitanika
je s teinom veom od 63,5 kg.
Donji kvartil je 55,75 kg, to znai da je 25% ispitanika s teinom
manjom od 55,75 cm ili jednakom teinom, a preostalih 75% ispitanika je
s teinom veom od 55,75 kg.
Gornji kvartil je 77,25 kg, to znai da je 75% ispitanika s
teinom manjom od 77,25 kg ili jednakom teinom, a preostalih 25%
ispitanika je s teinom veom od 77,25 kg.

Analitiki primjer 7.9.


Nakon provedene ankete potrebno je u dokument (Variable View)
programa SPSS upisati varijablu (obiljeje): Materijalno stanje (v3) i
kodirati je prema zadanoj tablici 7.8.
Tablica 7.8.
Kodna lista za varijablu Materijalno stanje
OBILJEJE
materijalno stanje (P3)

OBLICI OBILJEJA
Vrlo dobro
Dobro
Skromno, ali dovoljno
Slabo
Veoma slabo

KOD
1
2
3
4
5

Izvor: Podaci su simulirani.

Nakon kodiranja zadatak je unijeti konkretne podatke za 50


ispitanika zadane u tablici 7.8. u navedeni dokument (Data View).

228

Analitiki primjeri za vjebu

Tablica 7.9.
Tablica s kodiranim podacima za varijablu Materijalno stanje
(1)

(2)

2
2
2
3
3
2
2
2
2
2

2
2
2
2
1
1
4
2
2
2

Materijalno stanje
(3)
1
4
1
1
2

5
2
2
5
2

(4)

(5)

2
4
5
2
3
5
2
2
2
2

2
3
3
2
4
3
2
2
3
2

Izvor: Podaci su simulirani.

Rjeenje 7.9:
U programu SPSS pitanja, odnosno varijable se definiraju u dijelu
Variable view koji se bira u donjem lijevom kutu ekrana.
Slika 7.5.
Prikaz definiranih varijabli u programu SPSS

Izvor: Podaci su simulirani.

Varijablu je potrebno nazvati (Name) v3. Radi lakeg rada s


podacima naznaena je vrsta podataka (Type) Numeric. U stupcu Label
229

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

oznaeno je da je varijabla v3: Materijalno stanje. Zadnji stupac definira


skalu mjerenja (Measure) gdje je za v3 - Materijalno stanje oznaena
opisna, tj. Nominal skala.
U stupcu Values za varijablu v3 - Materijalno stanje uneseni su
kodovi prema tablici 7.8. Klikom mia u polje stupca Values otvara se
prozor Value Labels u kojem se definira konkretno kodiranje. To je za
ovaj primjer prikazano na slici 7.5.
U programu SPSS podaci prema definiranim varijablama unose se
u dijelu Data view koji se bira u donjem lijevom kutu ekrana.
Na slici 7.6 prikazani su podaci o materijalnom stanju dijela
ispitanika prema zadanim podacima u tablici 7.9 (podaci su simulirani).
Naravno, nakon to su se podaci unijeli u program SPSS, potrebno
ih je snimiti na standardan nain kako se to radi kod veine klasinih
programa za raunalo. Na glavnom izborniku odabire se File, a u njegovu
padajuem izborniku Save As te se uneseni podaci snimaju pod eljenim
imenom.
Slika 7.6.
Prikaz podataka varijable v3 - Materijalno stanje za dio ispitanika u
programu SPSS

Izvor: Podaci su simulirani.

230

Analitiki primjeri za vjebu

Analitiki primjer 7.10.


Zadatak je formirati statistiku tablicu prema obiljeju
"Materijalno stanje". Komentirajte drugu apsolutnu frekvenciju!
Komentirajte etvrti i peti relativni broj strukture (Percent)!
Rjeenje 7.10:
Potrebno je na glavnom izborniku odabrati Analyze, a na njegovu
padajuem izborniku odabrati Descriptive Statistics. Dalje se bira
Frequencies. Varijabla v3 - Materijalno stanje se prebacuje u polje
Variable(s).
Klikom na OK u Outputu programa SPSS dobije se tablica
frekvencija uzorka prema odabranom obiljeju, odnosno varijabli.
Rezultat je prikazan u tablici 7.10.
Tablica 7.10.
Materijalno stanje
Frequency

Valid

Vrlo dobro
Dobro
Skromno, ali
dovoljno
Slabo
Veoma slabo
Total

Percent

Valid Percent

Cumulative
Percent

2
32

4,0
64,0

4,0
64,0

4,0
68,0

16,0

16,0

84,0

4
4
50

8,0
8,0
100,0

8,0
8,0
100,0

92,0
100,0

Izvor: Podaci su simulirani.

Druga apsolutna frekvencija je 32 i ona u ovom sluaju znai da je


od 50 odabranih ispitanika njih 32 s dobrim materijalnim stanjem. etvrti
i peti relativni brojevi strukture su 8, to znai da je meu odabranim
ispitanicima njih po 8% sa slabim i veoma slabim materijalnim stanjem.

231

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Analitiki primjer 7.11.


Zadatak je 50 anketiranih ispitanika prikazati strukturnim krugom
prema obiljeju "Materijalno stanje" (upisati naslov grafikona)!
Komentirajte sliku!
Rjeenje 7.11:
Potrebno je na glavnom izborniku odabrati Graphs, a na njegovu
padajuem izborniku Pie chart na kojem se aktivira Summaries of
groups of case.
Odabirom ikone Define otvara se prozor Define Pie: Summaries
for Groups of Cases gdje se u prostor Define Slices by prebaci eljena
varijabla, to je u ovom sluaju Materijalno stanje (v3). Grafikonu se
moe definirati i naslov na nain da se klikne na ikonu Titles... Klikom na
OK u Outputu programa SPSS dobije se traeni grafikon koji je prikazan
na slici 7.7.
Slika 7.7.
Ispitanici prema materijalnom stanju

Materijalno stanje
Vrlo dobro
Dobro
Skromno, ali dovoljno
Slabo
Veoma slabo

Izvor: Podaci su simulirani.

232

Analitiki primjeri za vjebu

Prema grafikonu strukturnog kruga moe se vidjeti da je meu


odabranim ispitanicima najvie onih s dobrim materijalnim stanjem,
zatim slijede oni koji su se izjasnili da im je materijalno stanje skromno,
ali dovoljno. Ostale kategorije materijalnog stanja u ovom su uzorku
manje zastupljene, a moe se uoiti da onih ije je materijalno stanje vrlo
dobro ima najmanje.

Analitiki primjer 7.12.


Za ispitanike prema obiljeju "Teina u kg" izraunajte:
aritmetiku sredinu i medijan! Komentirajte te dvije srednje vrijednosti
na konkretnom primjeru! Pokaite da vrijedi svojstvo aritmetike sredine
da je: xmin X xmax .

Rjeenje 7.12:
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Frequencies.
U prozoru Frequencies pomou odgovarajue strelice varijabla v3
- teina u kg se prebacuje u polje Variable(s).
Klikom na ikonu Statistics otvara se novi prozor Frequencies
Statistics gdje je potrebno aktivirati odreene statistike veliine prema
zahtjevu zadatka, a koje se odnose na odabranu varijablu teina u kg (v3).
Tablica 7.11.
Statistiki podaci o teini ispitanika
Statistics
Tezina u kg
N

Valid
Missing

50
0

Mean

67,5400

Median

63,5000

Minimum

46,00

Maximum

102,00

Izvor: Podaci su simulirani.

233

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Da bi se u Outputu programa SPSS dobili eljeni podaci o teini


ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je
prikazan u tablici 7.11.
Prema podacima iz tablice 7.11. moe se vidjeti da je u analizi
bilo 50 ispitanika.
Aritmetika sredina,
ispitanika je 67,54 kg.

odnosno

prosjena

teina

odabranih

Medijan je 63,5 kg, to znai da je polovica ispitanika s teinom


manjom od 63,5 ili jednakom tom teinom, a preostala polovica
ispitanika je s teinom veom od 63,5 kg.
Da bi se dokazalo svojstvo aritmetike sredine da se ona nalazi
izmeu najmanje i najvee vrijednosti niza, potrebno je pronai najmanju
i najveu vrijednost. Prema podacima u tablici 7.11 vrijedi da je:
x min X x max 46 kg X 102 kg .

Analitiki primjer 7.13.


Zadatak je za samo ispitanike "enskog spola" formirati tablicu
frekvencija prema varijabli (obiljeju) "Abortus". Komentirajte 2.
apsolutnu frekvenciju i 3. relativni broj strukture (Percent) ovog
izabranoga statistikog skupa!
Rjeenje 7.13:
Potrebno je na glavnom izborniku odabrati Analyze, a na njegovu
padajuem izborniku odabrati Descriptive Statistics. Dalje se bira
Frequencies. Varijabla v2 - Abortus se prebacuje u polje Variable(s).
Klikom na OK u Outputu programa SPSS dobije se tablica
frekvencija uzorka prema odabranom obiljeju, odnosno varijabli.
Rezultat je prikazan u tablici 7.12.
Druga apsolutna frekvencija je 17 i ona u ovom sluaju znai da
od 50 odabranih ispitanika njih 17 smatra da je abortus doputen u
sluajevima silovanja. Trei relativni brojevi strukture je 4, to znai da je
234

Analitiki primjeri za vjebu

meu odabranim ispitanicima njih 4% koji su se izjasnili da su za to da


abortus bude doputen onda kada znaajno remeti obiteljski ivot.
Tablica 7.12.
Abortus
Frequency

Valid

Ubojstvo
Dopusten u
slucajevima silovanja
Dopusten kada
znacajno remeti
obiteljski zivot
Iskljuciva odluka zene
Total

Percent

Valid
Percent

Cumulative
Percent

26

52,0

52,0

52,0

17

34,0

34,0

86,0

4,0

4,0

90,0

5
50

10,0
100,0

10,0
100,0

100,0

Izvor: Podaci su simulirani.

Analitiki primjer 7.14.


Svih 50 anketiranih ispitanika prema varijabli (obiljeju)
"Abortus" prikaite grafiki pomou jednostavnih stupaca (upisati naslov
grafikona)! Komentirajte sliku!

Rjeenje 7.14:
Potrebno je na glavnom izborniku odabrati Graphs, a na njegovu
padajuem izborniku Bar chart na kojem se aktivira ikona Simple.
Odabirom ikone Define otvara se prozor Define Simple Bar:
Summaries for Groups of Cases gdje se u prostor Category Axis prebaci
eljena varijabla, to je u ovom sluaju Abortus (v2). Grafikonu se moe
definirati i naslov na nain da se klikne na ikonu Titles... Klikom na OK u
Outputu programa SPSS dobije se traeni grafikon koji je prikazan na
slici 7.8.
Prema grafikonu jednostavnih stupaca moe se vidjeti da je meu
odabranim ispitanicima najvie onih koji smatraju da je abortus ubojstvo,
a najmanje onih koji smatraju da je abortus doputen kada znaajno
235

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

remeti obiteljski ivot. Veliki dio ispitanika smatra da je abortus doputen


u sluajevima silovanja.
Slika 7.8.

Ispitanici prema misljenju o abortusu

30

25

Count

20

15

10

0
Ubojstvo

Dopusten u slucajevima Dopusten kada znacajno


silovanja
remeti obitelski zivot

Iskljuciva odluka zene

Abortus

Izvor: Podaci su simulirani.

Analitiki primjer 7.15.


Za sve ispitanike prema varijabli "visina u cm" izraunajte
aritmetiku sredinu! Komentirajte izraunatu srednju vrijednost! Pokaite
N

da vrijedi svojstvo aritmetike sredine da je: ( xi X ) = 0 (za negrupirani


i =1

niz). (Neka to bude preko nove varijable v4, a trai se njezin zbroj:
Sum = 0 ).

236

Analitiki primjeri za vjebu

Rjeenje 7.15:
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Frequencies.
U prozoru Frequencies pomou odgovarajue strelice varijabla v3
- visina u cm se prebacuje u polje Variable(s).
Klikom na ikonu Statistics otvara se novi prozor Frequencies
Statistics gdje je potrebno aktivirati odreene statistike veliine prema
zahtjevu zadatka, a koje se odnose na odabranu varijablu visina u cm
(v3).
Da bi se u Outputu programa SPSS dobili eljeni podaci o visini
ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je
prikazan u tablici 7.13.
Tablica 7.13.
Statistiki podaci o visini ispitanika
Statistics
Visina u cm
N
Valid

50

Missing
Mean

0
175,0400

Izvor: Podaci su simulirani.

Prema podacima iz tablice 7.13 moe se vidjeti da je u analizi bilo


50 ispitanika.
Aritmetika sredina odnosno prosjena visina odabranih ispitanika
je 175,04 cm.
Da bi se dokazalo svojstvo aritmetike sredine da je zbroj
odstupanja vrijednosti obiljeja od prosjeka jednak 0, potrebno je
formirati novi stupac (varijablu) gdje e se izraunati ta odstupanja. Zbroj
svih podataka iz toga novog stupca mora biti 0. Na glavnom izborniku
potrebno je odabrati Transform, a na njegovu padajuem izborniku bira
se Compute. Na taj se nain otvori prozor Compute Variable gdje se
raunaju odstupanja od prosjeka kao nova varijabla v4.
Pod Target Variable upisuje se novo ime v4, a u Numeric
Expression se upisuje: v3 175,04 , odnosno da se od svih vrijednosti
237

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

varijable v3 oduzme njihov prosjek 175,04. Potrebno je napomenuti da se


decimalni zarez u programu SPSS oznaava tokom. Klikom na OK u
prostoru Data View formira se nova varijabla v4.
Da bi se vidio zbroj podataka u ovom stupcu na glavnom
izborniku, potrebno je izabrati ikonu Analyze, a na njezinu padajuem
izborniku Descriptive Statistics i Descriptives. Varijabla v4 prebacuje se
u Variable(s). U Options je potrebno aktivirati Sum (dok se druge
veliine mogu deaktivirati jer u ovom sluaju nisu potrebne).
Tablica 7.14.
Zbroj odstupanja vrijednosti obiljeja od prosjeka
Descriptive Statistics
N

Sum

v4

50

Valid N (listwise)

50

,00

Izvor: Podaci su simulirani.

Suma vrijednosti novoformirane varijable v4 u zadnjem stupcu


tablice 7.14 je 0, ime je dokazano navedeno svojstvo aritmetike
sredine.

Analitiki primjer 7.16.


Za varijablu (obiljeje) prosjena ocjena na I. godini studija (v1)
odredite: standardnu devijaciju i asimetriju distribucije (Skewness).
Komentirajte izraunate vrijednosti na konkretnom primjeru!
Rjeenje 7.16:
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Frequencies.
U prozoru Frequencies pomou odgovarajue strelice varijabla v1
- prosjena ocjena na I. godini studija prebacuje se u polje Variable(s).

238

Analitiki primjeri za vjebu

Klikom na ikonu Statistics otvara se novi prozor Frequencies


Statistics gdje je potrebno aktivirati odreene statistike veliine prema
zahtjevu zadatka, a koje se odnose na odabranu varijablu (v1).
Da bi se u Outputu programa SPSS dobili eljeni podaci o
varijabli prosjena ocjena na I. godini studija ispitanika, potrebno je
kliknuti na Continue, zatim na OK. Rezultat je prikazan u tablici 7.15.
Tablica 7.15.
Statistics
PROSJECNA OCJENA NA I.GODINI
N
Valid
Missing
Std. Deviation
Skewness
Std. Error of Skewness

40
0
,88252
-,018
,374

Izvor: Podaci su simulirani.

Prema podacima iz tablice 7.15 moe se vidjeti da je u analizi 40


ispitanika.
Standardna devijacija, odnosno prosjeno odstupanje vrijednosti
zadanog obiljeja od aritmetike sredine je 0,88.
Prema pokazatelju asimetrije (Skewness) moe se zakljuiti da je
zadana distribucija lagano negativno ili ljevostrano asimetrina.

Analitiki primjer 7.17.


Izraunati dvodimenzionalnu distribuciju vjerojatnosti: za
- varijablu (obiljeje) prosjena ocjena na I godini studija (v1) koja se
mijenja po redcima (row) i za
- varijablu (obiljeje) grupirani dzeparac (v2) koja se mijenja po
stupcima (column).
a)
Komentirajte marginalnu vjerojatnost da je deparac 400 kn u
izraunatoj dvodimenzionalnoj distribuciji!

239

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

b)
Komentirajte vjerojatnost da ispitanik ima deparac 400 kn i
prosjenu ocjenu na I. godini studija 4 prema izraunatoj
dvodimenzionalnoj distribuciji!

Rjeenje 7.17:
a)
Na glavnom izborniku potrebno je odabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Crosstabs. Nakon
toga otvara se prozor Crosstabs. Odgovarajuim strelicama prema
zahtjevu zadatka potrebno je varijablu (obiljeje) prosjena ocjena na I
godini studija (v1) prebaciti u prozor za retke Row(s) i varijablu
(obiljeje) grupirani dzeparac (v2) prebaciti u prozor za stupce
Column(s).
Klikom na ikonu Cells... otvara se prozor Crosstabs: Cell Display
gdje je uz postojee originalne frekvencije (Counts) potrebno aktivirati
Percentages; Total.
Tablica 7.16.
Dio dvostruke tablice obiljeja prosjena ocjena na I. godini studija i
grupirani deparac

Izvor: Podaci su simulirani.

240

Analitiki primjeri za vjebu

Da bi se u Outputu programa SPSS dobili traeni podaci,


potrebno je kliknuti na Continue i OK.
Rezultati su prikazani u tablici 7.16.
Izraunate vjerojatnosti marginalne distribucije nalaze se u zbirnom retku
i zbirnom stupcu (koji nije prikazan u tablici) tablice 7.16.
Trea marginalna vjerojatnost u zbirnom retku iznosi 20%, tj.
vjerojatnost da ispitanik ima deparac 400 kn, bez obzira na prosjenu
ocjenu na I. godini studija iznosi 0,2.
b)
Vjerojatnost da ispitanik ima deparac 400 kn i prosjenu ocjenu
na I. godini studija 4 prema izraunatoj dvodimenzionalnoj distribuciji u
tablici 7.16 je 12,5%, odnosno 0,125.
Analitiki primjer 7.18.
Uz pretpostavku da promatrane sluajne varijable prosjena
ocjena na I. godini studija (v1) i grupirani dzeparac (v2) nisu nezavisne,
izraunajte uvjetnu distribuciju vjerojatnosti: P(v1 / v 2 = 200) !
Rjeenje 7.18:
Uz pretpostavku da promatrane sluajne varijable nisu nezavisne,
uvjetna distribucija vjerojatnosti P(v1 / v 2 = 200) pomou podataka u
tablici 7.16 izraunata je na sljedei nain i prikazana je u tablici 7.17:
P(v1 = 1 / v 2 = 200) =

P(v1 = 1, v 2 = 200) 0,025


=
= 0,052632 ,
P(v 2 = 200)
0,475

..................
P(v1 = 5 / v 2 = 200) =

P(v1 = 5, v 2 = 200) 0,000


=
= 0,000 .
P(v 2 = 200)
0,475

Zbroj vjerojatnosti u ovoj marginalnoj distribuciji vjerojatnosti


jednak je 1.

241

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Tablica 7.17.
Uvjetna distribucija vjerojatnosti
1

0,05263

0,21053

0,52632

0,21053

0,000

v1
P(v1 / v 2 = 200)

Izvor: Izraunato prema podacima u tablici 7.16.

Analitiki primjer 7.19.


Za zadani uzorak ispitanika izraunajte aritmetiku sredinu
prosjena ocjena na I godini studija (v1). Za izraunatu srednju
vrijednost potrebno je izraunati interval procjene za prosjek osnovnog
skupa uz pouzdanost procjene od 99%! Komentirajte rezultate!
Rjeenje 7.19:
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Explore.
U otvorenom prozoru Explore potrebno je zadanu numeriku
varijablu v1 - prosjena ocjena na I godini studija pomou odgovarajue
strelice prebaciti u Dependent List. U prostoru Display potrebno je
aktivirati Statistics.
Klikom na ikonu Statistics otvara se novi prozor Explore:
Statistics.
Prema zahtjevu zadatka ovdje je izabran nivo pouzdanosti
procjene od 99%. Konano, da bi se u Outputu programa SPSS dobili
eljeni podaci o prosjena ocjena na I. godini studija ispitanika, potrebno
je kliknuti na Continue i OK. Rezultat je prikazan u tablici 7.18.
Prema podacima iz tablice 7.18 moe se vidjeti da je prosjena
ocjena na I. godini studija ispitanika u uzorku 3,125.

242

Analitiki primjeri za vjebu

Tablica 7.18.
Podaci o je prosjenoj ocjeni na I. godini studija ispitanika
Descriptives
PROSJECNA OCJENA
NA I GODINI

Mean
99% Confidence
Interval for Mean
5% Trimmed Mean
Median
Variance
Std. Deviation
Minimum
Maximum
Range
Interquartile Range
Skewness
Kurtosis

Lower Bound
Upper Bound

Statistic
3,1250
2,7471

Std. Error
,13954

3,5029
3,1111
3,0000
,779
,88252
1,00
5,00
4,00
1,00
-,018
-,071

,374
,733

Izvor: Podaci su simulirani.

Intervalna procjena aritmetike sredine teine u osnovnom skupu


pomou zadanog uzorka uz nivo pouzdanosti procjene od 99% je:
Pr{2,75 < X < 3,50} = 99% .

Analitiki primjer 7.20.


Za varijablu (obiljeje) dob ispitanika (v1) odredite: koeficijent
kvartilne devijacije. Komentirajte izraunatu vrijednost na konkretnom
primjeru!
Rjeenje 7.20:
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Frequencies.
U prozoru Frequencies pomou odgovarajue strelice varijabla v1
- dob ispitanika se prebacuje u polje Variable(s).

243

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Klikom na ikonu Statistics otvara se novi prozor Frequencies


Statistics gdje je potrebno aktivirati odreene statistike veliine prema
zahtjevu zadatka, a koje se odnose na odabranu varijablu (v1).
Tablica 7.19.
Statistics
Dob ispitanika (grupirano)
N
Valid
Missing
Percentiles

50
21

25

20,00

50

30,00

75

40,00

Izvor: Podaci su simulirani.

Da bi se u Outputu programa SPSS dobili eljeni podaci o


ispitanicima, potrebno je kliknuti na Continue, zatim na OK. Rezultat je
prikazan u tablici 7.19.
Prema podacima iz tablice 7.19 moe se vidjeti da je u analizi 50
ispitanika.
Koeficijent kvartilne devijacije je:
Vq =

Q3 Q1 40 20
=
= 0,333 .
Q3 + Q1 40 + 20

Analitiki primjer 7.21.


Vjerojatnost da se meu studentskom populacijom konzumira
alkohol samo u posebnoj prigodi je: p = 0,038 .
a)
Kolika je vjerojatnost da izmeu 70 sluajno odabranih studenata
(X1) budu 2 studenta koji konzumiraju alkohol samo u posebnoj prigodi?
b)
Kolika je vjerojatnost da izmeu 70 sluajno odabranih studenata
(X1) najvie 15 studenata konzumira alkohol samo u posebnoj prigodi?

244

Analitiki primjeri za vjebu

Rjeenje 7.21:
Zadana vjerojatnost sluajnog dogaaja da se meu studentskom
populacijom konzumira alkohol je manja od 0,10, a uzorak je vei od 50,
pa se u ovom primjeru pretpostavlja da se sluajna varijabla X1 ravna po
Poissonovu zakonu.
Na glavnom izborniku potrebno je odabrati ikonu Transform, a na
njezinu padajuem izborniku Compute. Nakon toga otvara se prozor
Compute Variable. Da bi se aktivirala naredba za izraun vjerojatnosti po
Poissonovu zakonu, potrebno je u izborniku Function group: odabrati
PDF & Noncentral PDF. Nakon toga se u izborniku Function and
Special Variables: bira Pdf.Poisson i klikom dva puta na tu funkciju ona
se pojavljuje u prozoru Numeric Expression: na sljedei nain:
PDF.POISSON(?,?).
U navedenoj funkciji prvi upitnik predstavlja quant, tj. x
vrijednost koju poprima sluajna varijabla u ovom primjeru X1. Drugi
upitnik funkcije predstavlja mean, odnosno oekivanje sluajne varijable
koja se po Poissonovu zakonu rauna na sljedei nain:
n = 70 ; prob = 0,038 : = n p = 70 0,038 = 2,66 .

U ovom primjeru vrijedi da je:


quant = X 1 ; = 2,66 ,

pa se moe upisati:
PDF.POISSON(X1,2.66).
U Target Variable: potrebno je imenovati novu varijablu
izraunatih vjerojatnosti po Poissonovu zakonu i u ovom primjeru
nazvana je X1Poiss.
Konano, da bi se u dodatnom stupcu programa SPSS dobili
eljeni podaci vjerojatnosti sluajne varijable X1 po Poissonovoj
distribuciji, potrebno je kliknuti na OK.
Da bi se dobile kumulativne vjerojatnosti, potrebno je ponoviti
slian postupak.

245

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Na glavnom izborniku potrebno je odabrati ikonu Transform, a na


njezinu padajuem izborniku Compute. Nakon toga otvara se prozor
Compute Variable. Da bi se aktivirala naredba za izraun kumulativnih
vjerojatnosti po Poissonovu zakonu, potrebno je u izborniku Function
group: odabrati CDF & Noncentral CDF. Nakon toga se u izborniku
Function and Special Variables: bira Cdf.Poisson i klikom dva puta na
tu funkciju ona se pojavljuje u prozoru Numeric Expression: na sljedei
nain: CDF.POISSON(?,?).
U navedenoj funkciji prvi upitnik opet predstavlja quant, tj. x
vrijednost koju poprima sluajna varijabla u ovom primjeru X2. Drugi
upitnik funkcije predstavlja mean, odnosno oekivanje sluajne varijable:
quant = X 1 ; = 2,66 ,

pa se moe upisati:
CDF.POISSON(X1,2.66).
U Target Variable: potrebno je imenovati novu varijablu
izraunatih vjerojatnosti po Poissonovu zakonu i u ovom primjeru
nazvana je X1CumPoiss.
Konano, da bi se u dodatnom stupcu programa SPSS dobili
eljeni podaci kumulativnih vjerojatnosti sluajne varijable X1 po
Poissonovoj distribuciji, potrebno je kliknuti na OK. Rezultat je prikazan
u tablici 7.20.
Prema rezultatima iz tablice 7.20. (prikazano je samo 13
vrijednosti od ukupno 70 vrijednosti zadane diskontinuirane sluajne
varijable X1) mogu se oitati i/ili izraunati traene vjerojatnosti.
a)
Vjerojatnost da izmeu 70 sluajno odabranih studenata (X1)
budu 2 studenta koji konzumiraju alkohol samo u posebnoj prigodi je:
p( X 1 = 2) = 0,2474628 .

b)
Vjerojatnost da izmeu 70 sluajno odabranih studenata (X1)
najvie 15 studenata konzumira alkohol samo u posebnoj prigodi je:
p ( X 1 15) = p( X 1 = 0) + p( X 1 = 1) + ... + p ( X 1 = 15) 1.

246

Analitiki primjeri za vjebu

Izraunata vjerojatnost je priblino jednaka 1 jer je zbroj svih 71


vjerojatnosti 1, ali zbog manjeg broja decimalnih mjesta ovaj je rezultat
izjednaen s 1.
Tablica 7.20.
Podaci u SPSS-u vrijednosti, vjerojatnosti i kumulativne vjerojatnosti
diskontinuirane sluajne varijable po Poissonovu zakonu

Izvor: Podaci su simulirani.

Analitiki primjer 7.22.


Za zadani uzorak ispitanika (onih koji su odgovorili na
postavljeno pitanje) potrebno je izraunati proporciju uzorka ispitanika
koji nikada ne konzumiraju alkohol (varijabla v1) i izraunati interval
procjene za proporciju ispitanika osnovnog skupa koji nikada ne
konzumiraju alkohol uz pouzdanost procjene od 95%!

247

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Rjeenje 7.22:
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Frequencies.
U otvorenom prozoru Frequencies potrebno je zadanu numeriku
varijablu v1 - Konzumirate li alkoholna pia pomou odgovarajue
strelice prebaciti u Variable(s).
Da bi se u Outputu programa SPSS dobili eljeni podaci o
konzumiranju alkohola ispitanika, potrebno je kliknuti na Continue i OK.
Rezultat je prikazan u tablici 7.21.
Tablica 7.21
Podaci o konzumiranju alkohola
Konzumirate li alkoholna pica

Valid

Missing
Total

Frequency
NIKADA
15
SAMO UZ OBROKE
3
U POSEBNIM PRILIKAMA
32
Total
50
System
21
71

Percent
21,1
4,2
45,1
70,4
29,6
100,0

Valid Percent
30,0
6,0
64,0
100,0

Cumulative
Percent
30,0
36,0
100,0

Izvor: Podaci su simulirani.

Prema podacima u tablici 7.21 proporcija uzorka ispitanika koji


nikada ne konzumiraju alkohol omjer je povoljnih i svih moguih ishoda,
a moe se i direktno oitati iz izlazne tablice u stupcu Valid Percent:
p =

m 15
=
= 0,3 ; q = 1 p = 1 0,3 = 0,7 .
n 50

S obzirom na to da je veliina uzorka 50 , vrijedi da je n > 30 , pa


se za intervalnu procjenu koristi normalna distribucija.
Intervalna procjena proporcije u osnovnom skupu onih stanovnika
koji nikada ne konzumiraju alkohol na osnovi uzorka uz pouzdanost
procjene od 95% je:
Pr{p Z Se( p ) < P < p + Z Se( p )} = 1 ,
248

Analitiki primjeri za vjebu

n > 30

p q
0,3 0,7
=
= 0,064807406
n
50

Se( p ) =

Pomou tablica odgovarajuih povrina ispod normalne krivulje


vrijedi da je:
Z 1
2

tab

0 ,95
= 0 , 475
2

Z = 1,96

Uvrtavanjem odgovarajuih veliina u poetni izraz intervalne


procjene dobije se:
Pr{0,3 1,96 0,064807406 < P < 0,3 + 1,96 0,064807406} = 95% ,

Konano je intervalna procjena proporcije ispitanika osnovnog


skupa koji nikada ne konzumiraju alkohol na osnovi zadanog uzorka uz
pouzdanost procjene od 95%:
Pr{0,17298 < P < 0,427} = 95% .

Analitiki primjer 7.23.


Za varijablu (obiljeje) prosjena ocjena na I godini studija (p1)
odredite: interkvartil i zaobljenost distribucije (Kurtosis). Komentirajte
izraunate vrijednosti na konkretnom primjeru!
Rjeenje 7.23:
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Frequencies.
U prozoru Frequencies pomou odgovarajue strelice varijabla v1
- prosjena ocjena na I godini studija prebacuje se u polje Variable(s).
Klikom na ikonu Statistics otvara se novi prozor Frequencies
Statistics gdje je potrebno aktivirati odreene statistike veliine prema
zahtjevu zadatka, a koje se odnose na odabranu varijablu (v1).
Da bi se u Outputu programa SPSS dobili eljeni podaci o
prosjenoj ocjeni na I. godini studija ispitanika, potrebno je kliknuti na
Continue, zatim na OK. Rezultat je prikazan u tablici 7.22.
249

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Tablica 7.22.
PROSJECNA OCJENA NA I. GODINI
Valid

Missing
Kurtosis

40
0
-,071

Std. Error of Kurtosis


Percentiles

,733
25

3,0000

50

3,0000

75

4,0000

Izvor: Podaci su simulirani.

Prema podacima iz tablice 7.22 moe se vidjeti da je u analizi 40


ispitanika.
Interkvartil zadane distribucije moe se izraunati pomou donjeg
i gornjeg kvartila:
I q = Q3 Q1 = 4 3 = 1 .

Rasprenost prosjene ocjene na I. godini za srednjih 50%


ispitanika je 1 ocjena.
Zaobljenost zadane distribucije moe se komentirati pomou
pokazatelja Kurtosis koji u ovom primjer iznosi -0,071, to upuuje na
blago tupi vrh distribucije u odnosu na normalno zaobljenu distribuciju.

Analitiki primjer 7.24.


Za varijablu (obiljeje) dob ispitanika (v1) odredite: varijancu.
Komentirajte izraunatu vrijednost na konkretnom primjeru!
Rjeenje 7.24:
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Frequencies.
U prozoru Frequencies pomou odgovarajue strelice varijabla v1
- dob ispitanika prebacuje se u polje Variable(s).

250

Analitiki primjeri za vjebu

Klikom na ikonu Statistics otvara se novi prozor Frequencies


Statistics gdje je potrebno aktivirati odreene statistike veliine prema
zahtjevu zadatka, a koje se odnose na odabranu varijablu (v1).
Da bi se u Outputu programa SPSS dobili eljeni podaci o dobi
ispitanika, potrebno je kliknuti na Continue, zatim na OK. Rezultat je
prikazan u tablici 7.23.
Tablica 7.23.
Statistics
Dob ispitanika (grupirano)
N
Valid
Missing
Variance

50
0
138,612

Izvor: Podaci su simulirani.

Prema podacima iz tablice 7.23 moe se vidjeti da je u analizi 50


ispitanika.
Varijanca, odnosno prosjeno kvadratno
ispitanika od aritmetike sredine je 138,612 god 2 .

odstupanje

dobi

Analitiki primjer 7.25.


Vjerojatnost da se meu studentskom populacijom ne konzumira
alkohol je: p = 0,228 .
a)
Kolika je vjerojatnost da izmeu 6 sluajno odabranih studenata
(X1) budu 2 studenta koji ne konzumiraju alkohol?
b)
Kolika je vjerojatnost da izmeu 6 sluajno odabranih studenata
(X1) najvie 3 studenta ne konzumiraju alkohol?
Rjeenje 7.25:
Zadana vjerojatnost sluajnog dogaaja da se meu studentskom
populacijom ne konzumira alkohol je vea od 0,10, a uzorak je manji od
50, pa se u ovom primjeru pretpostavlja da se sluajna varijabla X1 ravna
po Binomom zakonu.

251

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

Na glavnom izborniku potrebno je odabrati ikonu Transform, a na


njezinu padajuem izborniku Compute. Nakon toga otvara se prozor
Compute Variable. Da bi se aktivirala naredba za izraun vjerojatnosti po
Binomnom zakonu, potrebno je u izborniku Function group: odabrati
PDF & Noncentral PDF. Nakon toga se u izborniku Function and
Special Variables: bira Pdf.Binom i klikom dva puta na tu funkciju ona
se pojavljuje u prozoru Numeric Expression: na sljedei nain:
PDF.BINOM(?,?,?).
U navedenoj funkciji prvi upitnik predstavlja quant, tj. x
vrijednost koju poprima sluajna varijabla u ovom primjeru X1. Drugi
upitnik funkcije predstavlja veliinu uzorka n , a trei upitnik je
vjerojatnost realizacije sluajnog dogaaja p :
quant = X 1 ; n = 6 ; prob = 0,228 ,

pa se moe upisati:
PDF.BINOM(X1,6,0.228).
U Target Variable: potrebno je imenovati novu varijablu
izraunatih vjerojatnosti po Binomnom zakonu i u ovom primjeru
nazvana je X1Bin.
Konano, da bi se u dodatnom stupcu programa SPSS dobili
eljeni podaci vjerojatnosti sluajne varijable X1 po Binomnoj
distribuciji, potrebno je kliknuti na OK.
Da bi se dobile kumulativne vjerojatnosti, potrebno je ponoviti
slian postupak.
Na glavnom izborniku potrebno je odabrati ikonu Transform, a na
njezinu padajuem izborniku Compute. Nakon toga otvara se prozor
Compute Variable. Da bi se aktivirala naredba za izraun kumulativnih
vjerojatnosti po Binomnom zakonu, potrebno je u izborniku Function
group: odabrati CDF & Noncentral CDF. Nakon toga se u izborniku
Function and Special Variables: bira Cdf.Binom i klikom dva puta na
tu funkciju ona se pojavljuje u prozoru Numeric Expression: na sljedei
nain: CDF.BINOM(?,?,?).
U navedenoj funkciji prvi upitnik opet predstavlja quant, tj. x
vrijednost koju poprima sluajna varijabla u ovom primjeru X1. Drugi
252

Analitiki primjeri za vjebu

upitnik funkcije predstavlja veliinu uzorka n , a trei upitnik je


vjerojatnost realizacije sluajnog dogaaja p :
quant = X 1 ; n = 6 ; prob = 0,228 ,

pa se moe upisati:
CDF.BINOM(X1,6,0.228).
U Target Variable: potrebno je imenovati novu varijablu
izraunatih vjerojatnosti po Binomnom zakonu i u ovom primjeru
nazvana je X1CumBin.
Konano, da bi se u dodatnom stupcu programa SPSS dobili
eljeni podaci kumulativnih vjerojatnosti sluajne varijable X1 po
Binomnoj distribuciji, potrebno je kliknuti na OK. Rezultat je prikazan u
tablici 7.24.
Tablica 7.24.
Podaci u SPSS-u vrijednosti, vjerojatnosti i kumulativne vjerojatnosti
diskontinuirane sluajne varijable po Binomnom zakonu

Izvor: Podaci su simulirani.

Prema rezultatima iz tablice 7.24 mogu se oitati i/ili izraunati


traene vjerojatnosti.
a)
Vjerojatnost da izmeu 6 sluajno odabranih studenata (X1) budu
2 studenta koji ne konzumiraju alkohol je:
p ( X 1 = 2) = 0,277 .

b)
Vjerojatnost da izmeu 6 sluajno odabranih studenata (X1)
najvie 3 studenta ne konzumiraju alkohol je:
253

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

p ( X 1 3) = p ( X 1 = 0) + p ( X 1 = 1) + ... + p ( X 1 = 3) =
= 0,973.

Analitiki primjer 7.26.


Za zadani uzorak ispitanika (onih koji su odgovorili na
postavljeno pitanje) potrebno je izraunati proporciju uzorka ispitanika
koji konzumiraju alkohol samo u posebnoj prigodi (varijabla v1) i
izraunati interval procjene za proporciju ispitanika osnovnog skupa koji
konzumiraju alkohol samo u posebnoj prigodi uz pouzdanost procjene od
99%!
Rjeenje 7.26:
Na glavnom izborniku potrebno je izabrati ikonu Analyze, a na
njezinu padajuem izborniku Descriptive Statistics i Frequencies.
U otvorenom prozoru Frequencies potrebno je zadanu numeriku
varijablu v1 - Konzumirate li alkoholna pia pomou odgovarajue
strelice prebaciti u Variable(s).
Da bi se u Outputu programa SPSS dobili eljeni podaci o
konzumiranju alkohola ispitanika, potrebno je kliknuti na Continue i OK.
Rezultat je prikazan u tablici 7.25.
Tablica 7.25
Podaci o konzumiranju alkohola
Konzumirate li alkoholna pica

Valid

Frequency
NIKADA
15
SAMO UZ OBROKE
3
U POSEBNIM PRILIKAMA
32
Total
50

Percent
30,0
6,0
64,0
100,0

Valid Percent
30,0
6,0
64,0
100,0

Cumulative
Percent
30,0
36,0
100,0

Izvor: Podaci su simulirani.

Prema podacima u tablici 7.25 proporcija uzorka ispitanika koji


konzumiraju alkohol samo u posebnoj prigodi omjer je povoljnih i svih
254

Analitiki primjeri za vjebu

moguih ishoda, a moe se i direktno oitati iz izlazne tablice u stupcu


Valid Percent:
p =

m 32
=
= 0,64 ; q = 1 p = 1 0,64 = 0,36 .
n 50

S obzirom na to da je veliina uzorka 50 , vrijedi da je n > 30 , pa


se za intervalnu procjenu koristi normalna distribucija.
Intervalna procjena proporcije u osnovnom skupu onih stanovnika
koji konzumiraju alkohol samo u posebnim prigodama na osnovi uzorka
uz pouzdanost procjene od 99% je:
Pr{p Z Se( p ) < P < p + Z Se( p )} = 1 ,
n > 30

p q
0,64 0,36
=
= 0,0678822
n
50

Se( p ) =

Pomou tablica odgovarajuih povrina ispod normalne krivulje


vrijedi da je:
Z 1

0 , 99
=
= 0 , 495
2
2

tab

Z = 2,58

Uvrtavanjem odgovarajuih veliina u poetni izraz intervalne


procjene dobije se:
Pr{0,64 2,58 0,0678822 < P < 0,64 + 2,58 0,0678822} = 99% ,

Konano je intervalna procjena proporcije ispitanika osnovnog


skupa koji konzumiraju alkohol samo u posebnoj prigodi na osnovi
zadanog uzorka uz pouzdanost procjene od 99%:
Pr{0,46846 < P < 0,815136} = 99% .

255

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

256

Tablice odabranih statistikih distribucija

8. TABLICE ODABRANIH STATISTIKIH


DISTRIBUCIJA
A. Povrine ispod normalne krivulje
P(Z)

257

S. Pivac, A. Rozga: STATISTIKA ZA SOCIOLOKA ISTRAIVANJA

B. Kritine vrijednosti t, Studentove distribucije

258

9. LITERATURA
1. Anderson, D. R. et al. (2002). Statistics for Business and Economics.
8th. Edt. St Paul: West.
2. Anderson, D. R. et al. (1998). Quantitative Methods for Business. 7th.
Edt. South-Western College Publishing.
3. Babbie, E. Halley, F. Zaino, J. (2000). Adventures in Social Research.
Data Analysis Using SPSSX for Windows 95/98. USA: Pine Forge Press.
4. Beter, M.i Bregar, L. (1986). Ekonomska statistika. Ljubljana.
Ekonomska fakulteta.
5. Blejec, M. (1976). Statistike metode za ekonomiste. Ljubljana:
Ekonomska fakulteta.
6. Canavos, G. C. and Miller, D. M. (1993). An Introduction to Modern
Business Statistics. Belmont. Wadsworth.
7. Cochran, W. G. (1977). Sampling Techniques. New York: Wiley.
8. Dillon, W. R. and Goldstein, M. (1984). Multivariate Analysis,
Methods and Applications. New York: Wiley.
9. Dodge, M., Kinata, C. i Stison, C. (1997). Kako koristiti Microsoft
Excel 97, Zagreb: Znak.
10. Everit, B. S. (1996). Making Sense of Statistics in Psychology,
Oxford: Oxford University Press.
11. Feller, W. (1971). An Introduction to Probability Theory and its
Applications. Vol. I and Vol. II, New York:Wiley.

259

12. Fisher, R. A. (1950). Statistical Methods for Research Workers. 11 th


Edt. Edinburgh: Oliver and Boyd.
13. Fisher, R. A. (1993). Statistical Methods, Eksperimental Design and
Scientific Inference. Oxford: Oxford University Press.
14. Frye, C. (2003). Microsoft Excel 2002 Korak po korak. Zagreb:
Algoritam.
15. Fulton, J. (1997). Vodi kroz Excel 97. Zagreb: Znak.
16. Halmi, A. (2003). Multivarijatna analiza u drutvenim znanostima.
Alinea. Zagreb
17. Hadivukovi, S. (1975). Tehnika metoda uzorka. Beograd: Nauna
knjiga
18. Heij, C. et. al.( 2004). Econometrisc Methods with Applications in
Business and Economics, New York : Oxford University Press.
19. Kendall, M. and Stuart, A. (1973). The Advanced Theory of
Statistics. Vol I. London: Griffin.
20. Kendall, M. and Stuart, A. (1974). The Advanced Theory of
Statistics. Vol II. London: Griffin.
21. Kendall, M. and Stuart, A. (1976). The Advanced Theory of
Statistics. Vol III. London: Griffin.
22. Kish, L. (1965). Survey Sampling. New Yor: Wiley.
23. Kolesari, V. i Petz. B. (2003). Statistiki rjenik. Tuma statistikih
pojmova. Naklada Slap.
24. Leburi, A. i Krneta, M. (2004). Profil poduzetnika u Hrvatskoj.
Socio-ekonomsko istraivanje 2003. Split: Naklada Bokovi.

260

25. de Levie, R. (2004). Advanced Excel for Scientific Data Analysis.


Oxford: Oxford University Press.
26. Marti, Lj. (1986). Mjere nejednakosti i siromatva. Zagreb.
Birotehnika.
27. Mason, D. R. and Lind, D. A. (1993). Statistical Techniques in
Business and Economics. Boston, Masachussetts: IRVIN Publishing.
28. Metre, J. G. and Gilbreath, G. H. (1983). Statistics for Business and
Economics. Plano. Texas: Business Publications.
29. Milton, J. S. et al. (1986). Introduction to Statistics. Lexington: D. C.
Heath.
30. Momirovi, K. (1998). Uvod u analizu nominalnih varijabli.
Metodoloke sveske 2. Ljubljana: JUS.
31. Mood, A. M. and Graybill, F. P. (1963). Introduction to the Theory of
Statistics. New York: McGraw-Hill.
32. Neter, J. et al. (1993). Applied Statistics. 4th Edt. Boston: Allyn and
Bacon.
33. Newbold, P. (1991). Statistics for Business and Economics.
Englewood Cliffs: Prentice-Hall.
34. Paue, . (2003). Vjerojatnost, informacija, stohastiki procesi.
Zagreb: kolska knjiga.
35. Pavli, I. (1971). Statistika teorija i primjena. Zagreb: Tehnika
knjiga.
36. Pivac, S. and Jurun, E. (2005). Parameter Estimation in Excel,
Proceedings of the 28th Internationl Convention MIPRO 2005. Computers
in Education, Opatija, pp 168-173.

261

37. Pivac, S. Jurun, E. and Jujnovi, I. (2006). Ocjena parametara


nelinearnih funkcija u programskom paketu Statistica na primjeru
nezaposlenosti, Proceedings of the 29th Internationl Convention MIPRO
2006. Computers in Education, Opatija, pp 241-245.
38. Pivac, S. Jurun, E. and Jerak. N. (2006). Rjeavanje simultanih
jednadbi kao ekonometrijskog modela pomou programskog paketa
Excel, Proceedings of the 29th Internationl Convention MIPRO 2006.
Computers in Education, Opatija, pp 246-251.
39. Pivac, S. i ego, B. (2005). Statistika, udbenik sa zbirkom zadataka
za IV. razred srednje Ekonomske kole, Zagreb: Alkascript.
40. Rozga, A. (2003). Statistika za ekonomiste, Sveuilite u Splitu.
Ekonomski fakultet Split.
41. Rozga, A. i Gri, B. (2003). Poslovna statistika, Ekonomski fakultet
Split.
42. Seplaki, L. (1991). Atorneys' Dictionary and Handbook of Economics
and Statistics, New York: Professional Horizons Press.
43. Siegel, A. F. (1994). Practical Business Statistics. Boston,
Masachussetts: IRVIN Publishing.
44. oi, I. (1983). Metode statistike analize. Zagreb: Sveuilina
naklada Liber.
45. oi, I. (1985). Zbirka zadataka iz osnova statistike. Zagreb:
Sveuilina naklada Liber.
46. oi, I. i Serdar, V. (2002). Uvod u statistiku. XII. izdanje, Zagreb:
kolska knjiga.
47. oi, I. (2004). Primijenjena statistika. Zagreb: kolska knjiga.

262

48. Tenjovi, L. (2002). Statistika u psihologiji. Beograd: Centar za


primenjenu psihologiju.
49. arkovi, S. S. (1965). Sampling Methods and Censuses. Rim:FAO
50. Whigham, D. (1998). Quantitative Business Methods Using Excel.
Oxford University Press.
51. Wonnacott, T. H. and Wonnacott, R. J. (1990). Introductory Statistics
for Business and Economics (fourth edition). New York: Wiley.
52. The Central Bureau of Statistics. Republic of Croatia: URL: http://
www.dzs.hr

263

BILJEKA O AUTORICI I AUTORU


SNJEANA PIVAC, roena 1972. u Splitu, gdje je zavrila osnovnu i
srednju kolu. Nakon studija na Ekonomskom fakultetu u Splitu, gdje je kao
izvrstan student diplomirala u roku od tri godine, magistrira i doktorira pri
Ekonomskom fakultetu u Zagrebu u znanstvenom polju ekonomije, grani
kvantitativna ekonomija. Trenutno radi kao docentica na katedri
kvantitativnih metoda u ekonomiji, na Ekonomskom fakultetu Sveuilita u
Splitu. Istrauje i objavljuje znanstvene radove iz ekonomske statistike,
ekonometrije, ocjene parametara nelinearnih funkcija, modelske analize
racionalnih oekivanja, modeliranja u uvjetima naruenih osnovnih
pretpostavki, statistike u drutvenim istraivanjima i kvantitativnih financija.
Koautorica je knjige: Statistika, udbenik sa zbirkom zadataka za IV. razred
srednje Ekonomske kole, (Zagreb,Alkascript, 2005.). Trenutno sudjeluje u
meunarodnom projektu The impact of the current and future Europe
enlargement on a financial integrated market, Facolta di Economia, Udine,
Italija, i projektu MZOS R Hrvatske Matematiki modeli u financijskom
upravljanju. Tajnica je Hrvatskog drutva za operacijska istraivanja i
lanica American Statistical Association.
e-mail: spivac@efst.hr
ANTE ROZGA, roen 1951. u Splitu. Diplomirao statistiku na Sveuilitu
u Zagrebu. Poslijediplomske studije pohaao na Ekonomskom fakultetu u
Zagrebu i The London School of Economics. Magistrirao i doktorirao iz
vremenskih nizova. Izabran kao izvanredni profesor na Ekonomskom
fakultetu u Splitu i Medicinskom fakultetu u Zagrebu. Predaje na
Ekonomskom fakultetu, FESB-u, Filozofskom fakultetu, te studiju farmacije.
Izmeu ostalih drao pozvana predavanja u Hrvatskoj narodnoj banci i na
PMF-u Splitu. Gostovao na Sveuilitima u Padovi, Veneciji, Londonu i
Cambridgeu. Sudjelovao na vie znanstvenih skupova. lan je: American
Statistical Association, Royal Statistical Society, International Association
for Statistical Education, Statistical Society of Canada, Bernoulli Society
for Mathematical Statistics and Probability. Podruje interesa: ekonomska
statistika, ekonometrija, biostatistika, vremenski nizovi, statistika u zatiti
ovjekove okoline, multivarijantna analiza.
e-mail: rozga@efst.hr
264

You might also like