1.deskriptivna Statistika

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 147

Deskriptivna statistika

STATISTIKA

Prirodoslovno-matematicki fakultet

doc.dr.sc. Nikola Koceic Bilan

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 1 / 76


Poceci statistike (ako ne racunamo statisticke preglede podataka o broju
umrlih, roenih, zarazenih od neke bolesti, a koji se vode unatrag nekoliko
stoljeca) su usko vezani uz pocetke TEORIJE VJEROJATNOSTI, a
mozemo ih pratiti od pojave hazardnih igara sredinom 17.st. Pojam
vjerojatnosti se od pocetaka vezivao uz intuitivno bliskiji pojam relativne
frekvencije.
Unatoc nepostojanju odgovarajucega matematickog modela i neuspjenih
pokuaja uvoenja aksioma naivnim pristupom postignuti su znacajni
rezultati povezani s imenima Pascala, Fermata, Bernoullija i Laplacea.
A.N. Kolmogorov 1933. uvodi opce prihvacenu aksiomatiku u teoriju
vjerojatnosti koja adekvtno reprezentira nau prirodnu predodzbu o
vjerojatnosti nekoga dogaaja kao broju kojemu konvergiraju relativne
frekvencije tog dogaaja kad se broj pokusa neograniceno (beskonacno
ponavlja).

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 2 / 76


Statistika je grana primijenjene matematike koja se pocelo masovno
primijenjivati u razlicitim prirodnim i drutvenim znanostima tek pocetkom
2. svjetskog rata. Danas je statistika postala dio oceg obrazovanja jer je
covjek izlozen situacijama u kojima mu je potrebno poznavanje nekih
osnovnih statistickih pojmova i statistickog nacina razmiljanja:
pracenje strucne literature i medija,
deskripcija i analiza podataka prikljupljenih istrazivanjem,
zakljucivanje iz konkretnog slucaja na opci zakon,
planiranje istrazivanja i eksperimenta.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 3 / 76


Populacije i varijable

Statisticki skup ili populacija je svaki skup ciji su elementi jedinice


kojima se mjeri (ispituje) jedno ili vie obiljezja (svojstava).
Kardinalni broj (broj elemenata) populacije nazivamo opsegom.
Populacija moze imati konacan ili beskonacan opseg. Ako svakom
elementu populacije S pridruzujemo jedno obiljezje iz skupa obiljezja
O denirana je jedna funkcija X : S ! O koju nazivano statistickom
varijablom. Koji put se i skup X (S ) O svih obiljezja elemenata
statistickog skupa naziva populacija. Skup X (S ) cemo nazivati
skupom obiljezja populacije.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 4 / 76


Populacije i varijable

Statisticki skup ili populacija je svaki skup ciji su elementi jedinice


kojima se mjeri (ispituje) jedno ili vie obiljezja (svojstava).
Kardinalni broj (broj elemenata) populacije nazivamo opsegom.
Populacija moze imati konacan ili beskonacan opseg. Ako svakom
elementu populacije S pridruzujemo jedno obiljezje iz skupa obiljezja
O denirana je jedna funkcija X : S ! O koju nazivano statistickom
varijablom. Koji put se i skup X (S ) O svih obiljezja elemenata
statistickog skupa naziva populacija. Skup X (S ) cemo nazivati
skupom obiljezja populacije.
Svaki podskup populacije nazivamo uzorkom.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 4 / 76


Statisticke varijable dijelimo na numericke i kvalitativne

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 5 / 76


Statisticke varijable dijelimo na numericke i kvalitativne
Kvalitativne varijable su: Nominalne i ordinalne

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 5 / 76


Statisticke varijable dijelimo na numericke i kvalitativne
Kvalitativne varijable su: Nominalne i ordinalne
Nominalna varijabla pridruzuje svakom clanu populacije neki atribut.
Izmeu takvih atributa nema ureaja (redosljeda) cak ni u slucaju kad
su atributi brojcani, jer sluze kao brojcani identikatori. Primjerice,
svima onima koji odgovore na referendumsko pitanje sa da pridruzimo
broj 1, u pritivnom broj 0. S takvim brojevima nema smisla raditi
racunske operacije.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 5 / 76


Statisticke varijable dijelimo na numericke i kvalitativne
Kvalitativne varijable su: Nominalne i ordinalne
Nominalna varijabla pridruzuje svakom clanu populacije neki atribut.
Izmeu takvih atributa nema ureaja (redosljeda) cak ni u slucaju kad
su atributi brojcani, jer sluze kao brojcani identikatori. Primjerice,
svima onima koji odgovore na referendumsko pitanje sa da pridruzimo
broj 1, u pritivnom broj 0. S takvim brojevima nema smisla raditi
racunske operacije.
Ordinalna varijabla pirdruzuje clanovima populacije simbol ili broj
prema intezitetu mjernog svojstva pri cemu je odreen njihov redosljed
prema stupnju inteziteta. Primjerice, varijabla koja studentima nekog
fakulteta pridruzuje ocjenu iz nekog kolegija je ordinalna.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 5 / 76


Numericke varijable dijelimo na: intervalne i omjerne.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 6 / 76


Numericke varijable dijelimo na: intervalne i omjerne.
Intervalna varijabla pridruzuje svakom clanu populacije realan broj,
sukladno intezitetu mjernog svojstva, pri cemu ureaj brojeva denira
i redosljed obiljezja, denirana je mjerna jedinica i dogovorna nula.
Primjerice, varijabla koja svakom danu pridruzuje temperaturu zraka u
isto vrijeme na istom mjestu je intervalna, a temperatura od 00 ne
znaci da temperature nema.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 6 / 76


Numericke varijable dijelimo na: intervalne i omjerne.
Intervalna varijabla pridruzuje svakom clanu populacije realan broj,
sukladno intezitetu mjernog svojstva, pri cemu ureaj brojeva denira
i redosljed obiljezja, denirana je mjerna jedinica i dogovorna nula.
Primjerice, varijabla koja svakom danu pridruzuje temperaturu zraka u
isto vrijeme na istom mjestu je intervalna, a temperatura od 00 ne
znaci da temperature nema.
Omjerna varijabla je numericka varijabla koja ima iste karakteristike
kao i intervalna samo to nula nije dogovorno utvrena, vec znaci
nepostojanje svojstva na promatranom elementu. Primjerice varijabla
koja mjeri visinu neke ljudske populacije je omjerna. Kod omjerne ima
smisla upotrebljavati omjere vrijednosti (npr. duplo veca visina) za
razliku od intervalne varijable (temperatura od 20 nije duplo veca
od temperature 10 ).

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 6 / 76


Ako numericka varijabla moze poprimiti najvie konacno ili prebrojivo
elemenata tj. ako elemenata skupa X (S ) ima najvie koliko i skupa
N nazivamo ju diskretnom. Ako varijabla X poprima sve vrijednosti
iz nekog intervala ha, b i R, tj. ako je ha, b i X (S ), varijablu
nazivamo kontinuiranom

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 7 / 76


Ako numericka varijabla moze poprimiti najvie konacno ili prebrojivo
elemenata tj. ako elemenata skupa X (S ) ima najvie koliko i skupa
N nazivamo ju diskretnom. Ako varijabla X poprima sve vrijednosti
iz nekog intervala ha, b i R, tj. ako je ha, b i X (S ), varijablu
nazivamo kontinuiranom

Primjer
Broj svih pravnih osoba na dan 31.03.2001. je bio 189576. Ako svakoj
pravnoj osobi ispitujemo broj zaposlenika na taj dan denirali smo jednu
diskretnu numericku varijablu X : S ! N, gdje je populacija S konacan
skup svih pravnih osoba na odreeni dan. Ako svakoj pravnoj osobi
ispitujemo najmanju isplacenu placu za taj mjesec denirali smo drugu
diskretnu numericku varijablu X 0 : S ! R. Sjedite pravne osobe je
kvalitativna varijabla, isto kao i mjesto na rang listi HGK-e po godinjoj
bilanci.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 7 / 76


Vie razlicitih varijabli koje djeluju na istoj populaciji mozemo promatrati
kao jednu viedimenzionalnu varijablu koju je najprikladnije prikazati
a11 a12 a1k
.. .. ..
. . .
matricno. Odgovarajuca matrica se sastoji od
ai 1 ai 2 a1k
.. .. ..
. . .
vrijednosti aij koje predstavljaju vrijednosti j-te varijable u i-tom
populacijskom clanu.
Podaci o graanima koje popisivac stanovnitva uzima predstavljaju jednu
viedimenzionalnu varijablu (Spol, dob, mjesto roenja, broj clanova
kucanstva...)

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 8 / 76


Beskonacna populacija je teorijska tvorevina. Populacija ce biti
beskonacna ako je statisticki skup hipotetski skup i vezan je nekim
stohastickim procesom. U tom slucaju su elementi populacije neki
slucajni pokusi, eksperimenti koji se beskonacno puta nastavljaju a
numericka varijabla biljezi njihove ishode. Ishodi tih slucajnih procesa
se ravnaju po zakonima vjerojatnosti odnosno nisu unaprijed poznati.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 9 / 76


Primjer
Bacanje novcica je pokus koji se moze ponavljati beskonacno. Takav
hipotetski skup kojega tvore svi moguci pokusi bacanja novcica je
beskonacna populacija a nominalna varijabla koja ishodu glava pridruzi 1 a
pismo 0 je diskretna

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 10 / 76


Primjer
Bacanje novcica je pokus koji se moze ponavljati beskonacno. Takav
hipotetski skup kojega tvore svi moguci pokusi bacanja novcica je
beskonacna populacija a nominalna varijabla koja ishodu glava pridruzi 1 a
pismo 0 je diskretna

Primjer
Ispitivanje mobitela nekog proizvoaca o broju kvarova u jamstvenom roku
je jedna diskretna numericka varijabla denirana na hipoteteskoj
beskonacnoj populaciji svih mobitela koj su proizvedeni i koji ce se tek
proizvesti u buducnosti u neprekidnoj proizvodnji (iako ih u realnom svijetu
uvijek ima samo konacno) koja svakom mobitelu pripisuje broj kvarova
0, 1, 2, ... u jamstvenom roku.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 10 / 76


Primjer
Visina svih ljudi je jedna kontinuirana varijabla denirana na populaciji
svih ljudi koji su se rodili ili koji ce se roditi u neprekidnosti postojanja
covjecanstva.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 11 / 76


Primjer
Visina svih ljudi je jedna kontinuirana varijabla denirana na populaciji
svih ljudi koji su se rodili ili koji ce se roditi u neprekidnosti postojanja
covjecanstva.

Primjer
Vrijeme potrebno za opsluzivanje neke stranke na jednom alteru odreene
banke za vrijeme smjene odreene djelatnice je jedna kontinuirana
varijabla. Populacija je hipotetski beskonacnan skup koji se sastoji od svih
stranki koje su se pojavile i koje ce se pojaviti na tom alteru u
kontinuitetu, a varijabla biljezi vrijeme opsluzivanja jedne stranke

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 11 / 76


Primjer
Visina svih ljudi je jedna kontinuirana varijabla denirana na populaciji
svih ljudi koji su se rodili ili koji ce se roditi u neprekidnosti postojanja
covjecanstva.

Primjer
Vrijeme potrebno za opsluzivanje neke stranke na jednom alteru odreene
banke za vrijeme smjene odreene djelatnice je jedna kontinuirana
varijabla. Populacija je hipotetski beskonacnan skup koji se sastoji od svih
stranki koje su se pojavile i koje ce se pojaviti na tom alteru u
kontinuitetu, a varijabla biljezi vrijeme opsluzivanja jedne stranke

Primijetimo da varijabla moze biti kontinuirana samo ako je


populacija beskonacna

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 11 / 76


Osobitosti populacija i numerickih varijabli zadanih na njima se
iskazuju razlicitim brojcanim velicinama koje nazivamo parametrom.
Parametar je u funkcijskoj vezi, tj. ovisi o svim vrijednostima varijable
X tj. svim elementima s 2 S populacije i njihovim obiljezjima X (s )

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 12 / 76


Osobitosti populacija i numerickih varijabli zadanih na njima se
iskazuju razlicitim brojcanim velicinama koje nazivamo parametrom.
Parametar je u funkcijskoj vezi, tj. ovisi o svim vrijednostima varijable
X tj. svim elementima s 2 S populacije i njihovim obiljezjima X (s )
Ako se parametar racuna samo na uzorku S0 S populacije onda tu
vrijednost dobivenu temeljem vrijednosti varijable X jS0 samo na
uzorku S0 nazivamo procjenom parametra, a analiticki izraz tj.
formulu kojom je izrazena funkcijska veza izmeu uzorka i vrijednosti
varijable X na njemu nazivamo procjeniteljem.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 12 / 76


Zadaca deskriptivne statistike je ureivanje, grupiranje, tabeliranje,
gracko prikazivanje dostupnih podataka i izracunavanje parametara
varijabli zadanih na konacnoj populaciji cije sve vrijednosti (obiljezja)
su poznati. Pri tome se ne razmatra priroda procesa koji generira te
podatke, a dobiveni parametri i zakljucci o obiljezjima se ne
poopcavaju vec se odnose iskljucivo na dani empirijski materijal.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 13 / 76


Zadaca deskriptivne statistike je ureivanje, grupiranje, tabeliranje,
gracko prikazivanje dostupnih podataka i izracunavanje parametara
varijabli zadanih na konacnoj populaciji cije sve vrijednosti (obiljezja)
su poznati. Pri tome se ne razmatra priroda procesa koji generira te
podatke, a dobiveni parametri i zakljucci o obiljezjima se ne
poopcavaju vec se odnose iskljucivo na dani empirijski materijal.
Zadaca inferencijalne statistike je donoenje zakljucaka o
parametrima varijabli koje su zadane na beskonacnoj populaciji ili su
zadani na konacnom ali prevelikom skupu tako da nisu poznate sve
vrijednosti varijable tj. obiljezja svakog elementa populacije. U oba
slucaja zakljucci o cijeloj populaciji s odgovarajucom varijablom se
donose temeljem dostupnih podataka na uzorku i oni predstavljaju
procjenu parametra s odreenom vjerojatnocu.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 13 / 76


Frekvencija i proporcija

Neka je S = fs1 , ..., sN g konacna populacija opsega N i X : S ! O


varijabla. Neka je skup obiljezja populacije (vrijednosti varijable)
X (S ) = fo1 , o2 , ..., ok g . Oznacimo sa xi = X (si ), i = 1, ..., n,
vrijednosti clanova populacije. Ocito je xi 2 fo1 , o2 , ..., ok g, a neki
razliciti elementi populacije si 6= sj mogu imati iste vrijednosti xi = xj
odnsono mogu imati isto obiljezje

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 14 / 76


Frekvencija i proporcija

Neka je S = fs1 , ..., sN g konacna populacija opsega N i X : S ! O


varijabla. Neka je skup obiljezja populacije (vrijednosti varijable)
X (S ) = fo1 , o2 , ..., ok g . Oznacimo sa xi = X (si ), i = 1, ..., n,
vrijednosti clanova populacije. Ocito je xi 2 fo1 , o2 , ..., ok g, a neki
razliciti elementi populacije si 6= sj mogu imati iste vrijednosti xi = xj
odnsono mogu imati isto obiljezje
Denicija
Broj elemenata skupa X 1 (oi ), odnosno broj svih clanova populacije koji
imaju isto obiljezje oi nazivamo frekvencijom obiljezja oi i oznacujemo
sa fi , a broj pi = Nfi nazivamo relativnom frekvencijom ili proporcijom.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 14 / 76


Frekvencija i proporcija

Neka je S = fs1 , ..., sN g konacna populacija opsega N i X : S ! O


varijabla. Neka je skup obiljezja populacije (vrijednosti varijable)
X (S ) = fo1 , o2 , ..., ok g . Oznacimo sa xi = X (si ), i = 1, ..., n,
vrijednosti clanova populacije. Ocito je xi 2 fo1 , o2 , ..., ok g, a neki
razliciti elementi populacije si 6= sj mogu imati iste vrijednosti xi = xj
odnsono mogu imati isto obiljezje
Denicija
Broj elemenata skupa X 1 (oi ), odnosno broj svih clanova populacije koji
imaju isto obiljezje oi nazivamo frekvencijom obiljezja oi i oznacujemo
sa fi , a broj pi = Nfi nazivamo relativnom frekvencijom ili proporcijom.

k k
fi
Ocito vrijedi N = fi i pi = 1, pi = k .
i =1 i =1 fi
i =1

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 14 / 76


Primjer
Ako osobe s1 , s2 , ..., s10 koje tvore neku promatranu populaciju imaju
redom 20,18,18,30,25,20,20,18,25,20 godina, onda obiljezja (godine)
18, 20, 25 i 30 imaju redom frekvencije 3, 4, 2, 1.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 15 / 76


Primjer
Ako osobe s1 , s2 , ..., s10 koje tvore neku promatranu populaciju imaju
redom 20,18,18,30,25,20,20,18,25,20 godina, onda obiljezja (godine)
18, 20, 25 i 30 imaju redom frekvencije 3, 4, 2, 1.

Buduci da u statistici nisu bitni pojedinacni clanovi populacije vec


samo broj tih jedinki koji imaju isto obiljezje, to cemo ubuduce, bez
gubitka opcenitosti, pretpostaviti da meu svim vrijednostima
x1 , ..., xN varijable X vrijednosti x1 = o1 , ..., xk = ok se razlikuju.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 15 / 76


Primjer

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 16 / 76


STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 17 / 76
Denicija
Funkciju koja svakom obiljezju xi pridruzuje odgovarajucu (relativnu)
frekvenciju (pi ) fi , i = 1, ..., k nazivamo funkcijom distribucije ili
razdiobe (relativne) frekvencije varijable, a skup tocaka
f(xi , fi ) , i = 1, ..., k g (f(xi , pi ) , i = 1, ..., k g) nazivamo grafom te
distribucije. Spajanjem tocaka grafa dobivamo poligon distribucije
varijable.

Ako po nekom kriteriju poredamo obiljezja (numericka poredamo po


ureaju 6, a nenumericka najcece po ureaju izmeu njihovih frekvencija)
u grupirani statisticki niz: x1 , ..., xk , onda uz niz frekvencija f1 , ..., fk ,
deniramo i kumulativni niz F (x1 ) = f1 , F (x2 ) = f1 + f2 , ....,
F (xi ) = f1 + + fi , ..., F (xn ) = x1 + + xn = N.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 18 / 76


Ureivanje kvalitativnih podataka

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 19 / 76


Najjednostavniji nacin zadavanja kvalitativne varijable je tablicni prikaz
distribucije frekvencija.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 20 / 76


STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 21 / 76
Pripadni kut kruznog isjecka u strukturnom krugu koji odgovara frekvenciji
fi iznosi Nfi 360.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 22 / 76


Paretov dijagram prikazuje istovremeno i frekvencije (poredane od vece
prema manjoj) i kumulativne frekvencije iz cega se lake uocava ako manji
broj obiljezja (u ovom slucaju kvarova) daje veci dio ukupne distribucije.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 23 / 76


Za prikazivanje viedimenzionalne kvalitativne varijable najprikladnija je
kombinirana tablica.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 24 / 76


Ureivanje numerickih podataka

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 25 / 76


STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 26 / 76
Osim histograma u kojem frekvencije odgovaraju povrini pravokutnika (ili
visini pravokutnika, ako je baza jedinicna), koristi se i trodimenzionalni
hologram u kojem pojedinacne frekvencije odgovaraju volumenu kvadara.
Buduci je u dvodimenzionalnom prikazu teko usporeivati volumene, to je
ovakav prikaz pogodan za maskiranje pravih podataka.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 27 / 76


Ako je numericka varijabla kontinuirana ili ako je diskretna s velikim
brojem razlicitih vrijednosti onda se distribucija frekvencija formira prema
razredima, tj. podaci se grupiraju u disjunktne podintervale. U tom
slucaju svaki razred je interval [L1i , L2i i a njegova frekvencija fi je ukupan
broj vrijednosti varijable X koji se nalaze u tom intervalu. Ako ima ukupno
k razreda onda je skup svih ureenih parova f([L1i , L2i i , fi ) , i = 1, ..., k g
distribucija frekvencija te numericke varijable grupirane u razrede. Umjesto
fi , u distribuciji mogu biti zastupljene i relativne frekvencije pi = Nfi , a
mozemo govoriti i o kumulativnom nizu gdje su razredi poredani po
ureaju na R. Broj razreda k za grupiranje N vrijednosti numericke
varijable se racuna izrazom k 1 + 3.3 log N. Razredi su jednakih velicina
kad god su podaci priblizno simetricno rasporeeni, no opcenito su uzi
tamo gdje je veca koncentracija podataka.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 28 / 76


Pri brojcanoj analizi distribucije frekvencija s razredima bitno je da vrijedi
L2i = L1i +1 , za svaki i = 1, ..., N 1. Takve granice nazivamo pravim
granicama to se uvijek moze postici zajednickim izjednacavanjem gornje
granice i -tog razreda i donje granice i + 1-og razreda s L2i +2L1i +1 . Nadalje,
vazno je izracunati razrednu sredinu ( L1i +2 L2i ), te velicinu razreda
(L2i L1i ).
Ako se histogramom prikazuje distribucija frekvencija s razredima, onda
osnovica pravokutnika predstavlja velicinu razreda, a visina odgovara
razrednoj frekvenciji, ako su svi razredi jednake velicine. No, ako su razredi
nejednakih velicina, potrebno je jednu velicinu uzeti za jedinicnu, a
frekvencije l puta vecih ili l puta manjih razreda od jedinicne duljine
razreda treba dijeliti ili mnoziti s faktorom da bismo dobili korigiranu
frekvenciju koja nam sluzi kao visina u histogramu. Korigiranim
frekvencijama se koristimo i u poligonu frekvencija, dok u kumulanti
uzimamo originalne frekvencije.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 29 / 76


U tablici su dani podaci o rastavljenim brakovima prema dobi muza u
R.H.1999. (U zagradama su procjenjene granice prvog i zadnjeg razreda)

(U zagradama su procjenjene granice prvog i zadnjeg razreda, odnosno


njihove prave granice pri pretpostavci da bi gornja granica razreda prije
prvoga bila 14, a donja granica razreda poslije zadnjega 80)

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 30 / 76


STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 31 / 76
STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 32 / 76
STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 33 / 76
Za prikazivanje viedimenzionalne numericke varijable najprikladniji je
dijagram rasipanja (Scatterplot).

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 34 / 76


STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 35 / 76
Populacijski parametri

Populacijske parametre (parametre neke varijable ili statistickog niza)


dijelimo na: srednje vrijednosti i mjere disperzije.
Srednje vrijednosti dijelimo na:

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 36 / 76


Populacijski parametri

Populacijske parametre (parametre neke varijable ili statistickog niza)


dijelimo na: srednje vrijednosti i mjere disperzije.
Srednje vrijednosti dijelimo na:
Potpune srednje vrijednosti:

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 36 / 76


Populacijski parametri

Populacijske parametre (parametre neke varijable ili statistickog niza)


dijelimo na: srednje vrijednosti i mjere disperzije.
Srednje vrijednosti dijelimo na:
Potpune srednje vrijednosti:
Aritmeticka sredina

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 36 / 76


Populacijski parametri

Populacijske parametre (parametre neke varijable ili statistickog niza)


dijelimo na: srednje vrijednosti i mjere disperzije.
Srednje vrijednosti dijelimo na:
Potpune srednje vrijednosti:
Aritmeticka sredina
Harmonijska sredina

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 36 / 76


Populacijski parametri

Populacijske parametre (parametre neke varijable ili statistickog niza)


dijelimo na: srednje vrijednosti i mjere disperzije.
Srednje vrijednosti dijelimo na:
Potpune srednje vrijednosti:
Aritmeticka sredina
Harmonijska sredina
Geometrijska sredina

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 36 / 76


Populacijski parametri

Populacijske parametre (parametre neke varijable ili statistickog niza)


dijelimo na: srednje vrijednosti i mjere disperzije.
Srednje vrijednosti dijelimo na:
Potpune srednje vrijednosti:
Aritmeticka sredina
Harmonijska sredina
Geometrijska sredina
Moment

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 36 / 76


Populacijski parametri

Populacijske parametre (parametre neke varijable ili statistickog niza)


dijelimo na: srednje vrijednosti i mjere disperzije.
Srednje vrijednosti dijelimo na:
Potpune srednje vrijednosti:
Aritmeticka sredina
Harmonijska sredina
Geometrijska sredina
Moment

Polozajne srednje vrijednosti (Odreene polozajem unutar danog niza)

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 36 / 76


Populacijski parametri

Populacijske parametre (parametre neke varijable ili statistickog niza)


dijelimo na: srednje vrijednosti i mjere disperzije.
Srednje vrijednosti dijelimo na:
Potpune srednje vrijednosti:
Aritmeticka sredina
Harmonijska sredina
Geometrijska sredina
Moment

Polozajne srednje vrijednosti (Odreene polozajem unutar danog niza)


Mod

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 36 / 76


Populacijski parametri

Populacijske parametre (parametre neke varijable ili statistickog niza)


dijelimo na: srednje vrijednosti i mjere disperzije.
Srednje vrijednosti dijelimo na:
Potpune srednje vrijednosti:
Aritmeticka sredina
Harmonijska sredina
Geometrijska sredina
Moment

Polozajne srednje vrijednosti (Odreene polozajem unutar danog niza)


Mod
Medijan, Kvantil

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 36 / 76


Mjere disperzije dijelimo na:

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 37 / 76


Mjere disperzije dijelimo na:
Nepotpune mjere disperzije

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 37 / 76


Mjere disperzije dijelimo na:
Nepotpune mjere disperzije
Raspon varijacije

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 37 / 76


Mjere disperzije dijelimo na:
Nepotpune mjere disperzije
Raspon varijacije
Interkvartil

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 37 / 76


Mjere disperzije dijelimo na:
Nepotpune mjere disperzije
Raspon varijacije
Interkvartil
Koecijent kvartilne devijacije

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 37 / 76


Mjere disperzije dijelimo na:
Nepotpune mjere disperzije
Raspon varijacije
Interkvartil
Koecijent kvartilne devijacije

Potpune mjere disperzije

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 37 / 76


Mjere disperzije dijelimo na:
Nepotpune mjere disperzije
Raspon varijacije
Interkvartil
Koecijent kvartilne devijacije

Potpune mjere disperzije


Varijanca

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 37 / 76


Mjere disperzije dijelimo na:
Nepotpune mjere disperzije
Raspon varijacije
Interkvartil
Koecijent kvartilne devijacije

Potpune mjere disperzije


Varijanca
Standardna devijacija

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 37 / 76


Mjere disperzije dijelimo na:
Nepotpune mjere disperzije
Raspon varijacije
Interkvartil
Koecijent kvartilne devijacije

Potpune mjere disperzije


Varijanca
Standardna devijacija
Koecijent varijacije

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 37 / 76


Aritmeticka sredina

Neka je X : S ! fx1 , x2 , ..., xk g R numericka varijabla zadana na


konacnom skupu.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 38 / 76


Aritmeticka sredina

Neka je X : S ! fx1 , x2 , ..., xk g R numericka varijabla zadana na


konacnom skupu.
Denicija
Aritmeticka sredina numericke varijable X : P ! S = fx1 , ..., xk g
zadane na konacnoj populaciji je zbroj vrijednosti obiljezja svakoga
elementa populacije podijeljen s opsegom N populacije
N k
X (s ) xi fi x i
s 2S i =1 i =1
(x1 , ..., xN ) = N = N = k .
fi
i =1

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 38 / 76


Aritmeticka sredina

Neka je X : S ! fx1 , x2 , ..., xk g R numericka varijabla zadana na


konacnom skupu.
Denicija
Aritmeticka sredina numericke varijable X : P ! S = fx1 , ..., xk g
zadane na konacnoj populaciji je zbroj vrijednosti obiljezja svakoga
elementa populacije podijeljen s opsegom N populacije
N k
X (s ) xi fi x i
s 2S i =1 i =1
(x1 , ..., xN ) = N = N = k .
fi
i =1

Ako je distribucija numericke varijable grupirana u (prave) razrede,


tada se citav razred identicira s razrednom sredinom, tj. xi fi
predstavlja umnozak frekvencije fi razreda [L1i , L2i i i razredne stedine
xi = L1i +2 L2i . Takvu aritmeticku sredinu nazivamo vaganom.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 38 / 76


Primjer
Proizvodnja deterdzenta Lahor u tijeku jedne dekade iznosila je u tonama
105, 100, 110, 112, 108, 100, 104, 115, 96, 120. Prosjecana proizvodnja je
1
= 10 (105 + 100 + 110 + 112 + 108 + 100 + 104 + 115 + 96 + 120) =
107.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 39 / 76


Primjer
Proizvodnja deterdzenta Lahor u tijeku jedne dekade iznosila je u tonama
105, 100, 110, 112, 108, 100, 104, 115, 96, 120. Prosjecana proizvodnja je
1
= 10 (105 + 100 + 110 + 112 + 108 + 100 + 104 + 115 + 96 + 120) =
107.

Primjer
Dana je distribucija broja dana prema broju odsutnih zaposlenika nekog
poduzeca u ksnom periodu
Broj dana 0 1 2 3 4 5 6 7 8 9 10
Broj odsutnih 4 10 20 27 17 8 8 6 5 3 2
Aritmeticka sredina numericke varijable koja svakom zaposleniku
pridruzuje broj dana u kojima je izostao s posla u ksnom periodu je
= 4 0 +104 +110
+ +3 9 +2 10
+ +2
416
= 110 = 3.78182

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 39 / 76


Primjer
Izracunajte prosjecnu mjesecnu placu u djelatnostima prijevoza,
skladitenja i veza u R.H. u kolovozu 2000.
djelatnost broj zaposlenih u tisucama prosjecna placa
kopneni prijevoz 28.3 3115
vodeni prijevoz 2.7 3430
zracni prijevoz 0.7 5914
pomocne djelatnosti 24.5 3360
pota i telekomunik. 23.3 4560
ukupno 79.5
k
i N i
i =1 3115 28.3 +3430 2.7 + +4560 23.3
= k = 79.5 = 3649.
Ni
i =1

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 40 / 76


Zadatak
Odredite prosjecan promet trgovina zadanih u tablici

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 41 / 76


Zadatak
Odredite prosjecan promet trgovina zadanih u tablici

7
xi fi
i =1
= =
50
71.7 tisuca kuna
STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 41 / 76
Primjer
Udaljenost u kilometrima od mjesta stanovanja do radnog mjesta
udaljenost u km xi broj djelatnika
10 1
15 2
20 5
30 3
40 1
5
fi x i
i =1 1 10 +2 15 + +1 40 270
Prosjecna udaljenost je = 5 = 1 +2 + +1= 22.5.= 12
fi
i =1
Primijetimo da je zbroj svih linearnih individualnih odstupanja xi
5
od srednje vrijednosti jednak 0 tj. fi (xi ) =
i =1
1 (10 22.5) + 2 (15 22.5) + + 1 (40 22.5) = 0

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 42 / 76


Standardna devijacija i varijanca

Neka je X : S ! fx1 , x2 , ..., xk g R numericka varijabla zadana na


konacnom skupu.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 43 / 76


Standardna devijacija i varijanca

Neka je X : S ! fx1 , x2 , ..., xk g R numericka varijabla zadana na


konacnom skupu.
Primijetimo da je zbroj svih linearnih individualnih odstupanja od
srednje vrijednosti je uvijek jednak 0
N k
(xi ) = fi (xi ) = 0
i =1 i =1

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 43 / 76


Standardna devijacija i varijanca

Neka je X : S ! fx1 , x2 , ..., xk g R numericka varijabla zadana na


konacnom skupu.
Primijetimo da je zbroj svih linearnih individualnih odstupanja od
srednje vrijednosti je uvijek jednak 0
N k
(xi ) = fi (xi ) = 0
i =1 i =1
Najpodobniji parametar za mjeru odstupanja (rasprenosti, disperzije)
je srednja vrijednost kvadratnih odstupanja

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 43 / 76


Denicija
Varijanca 2 numericke varijable X : S ! fx1 , ..., xk g zadane na konacnoj
populaciji je zbroj kvadrata svih razlika vrijednosti obiljezja xi svakoga
elementa populacije i aritmeticke sredine te varijable podijeljen s
opsegom N populacije
N k
(x i )2 f i (x i )2
2 (x1 , ..., xN ) = i =1
N = i =1
k .
fi
i =1

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 44 / 76


Denicija
Varijanca 2 numericke varijable X : S ! fx1 , ..., xk g zadane na konacnoj
populaciji je zbroj kvadrata svih razlika vrijednosti obiljezja xi svakoga
elementa populacije i aritmeticke sredine te varijable podijeljen s
opsegom N populacije
N k
(x i )2 f i (x i )2
2 (x1 , ..., xN ) = i =1
N = i =1
k .
fi
i =1

Varijanca je minimum svih srednjih vrijednosti kvadratnih odstupanja


k
f i (x i a )2
i =1
k od nekog broja a
fi
i =1

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 44 / 76


Denicija
Varijanca 2 numericke varijable X : S ! fx1 , ..., xk g zadane na konacnoj
populaciji je zbroj kvadrata svih razlika vrijednosti obiljezja xi svakoga
elementa populacije i aritmeticke sredine te varijable podijeljen s
opsegom N populacije
N k
(x i )2 f i (x i )2
2 (x1 , ..., xN ) = i =1
N = i =1
k .
fi
i =1

Varijanca je minimum svih srednjih vrijednosti kvadratnih odstupanja


k
f i (x i a )2
i =1
k od nekog broja a
fi
i =1

Lako se pokaze da vrijedi


!
i sljedeca formula za varijancu
k k 2

fi x i 2 1
N fi x i
i =1 i =1
2 = N

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 44 / 76


Denicija
Standardna
v n devijacija je drugi korijen iz varijance tj.
u
u f i (x i )2
u
= t i =1 n .
fi
i =1

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 45 / 76


Denicija
Standardna
v n devijacija je drugi korijen iz varijance tj.
u
u f i (x i )2
u
= t i =1 n .
fi
i =1

Standardna devijacija se tumaci se kao prosjecno odstupanje


vrijednosti numericke varijable od njezine aritmeticke sredine.
Devijaciju je potrebno uvijek promatrati skupa sa sredinom ili u
omjeru V = 100% kojega nazivamo koecijentom varijacije a
kojega tumacimo kao prosjecno odstupanje u jedinicama sredine.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 45 / 76


Denicija
Standardna
v n devijacija je drugi korijen iz varijance tj.
u
u f i (x i )2
u
= t i =1 n .
fi
i =1

Standardna devijacija se tumaci se kao prosjecno odstupanje


vrijednosti numericke varijable od njezine aritmeticke sredine.
Devijaciju je potrebno uvijek promatrati skupa sa sredinom ili u
omjeru V = 100% kojega nazivamo koecijentom varijacije a
kojega tumacimo kao prosjecno odstupanje u jedinicama sredine.
Primjerice, ako je prosjecno pakiranje kutije ecera 750 g, a devijacija
5
5 grama, tada je prosjecno odstupanje V = 750 100 = 0.66% od
prosjecne tezine pakiranja.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 45 / 76


Primjer
U tablici je dano stanovnitvo R.H. po starosti 1991.

s
7 7
fi x i f i (x i )2
i =1 175708,2 i =1
= 7 = 47123,3 = 37, 29 i = 47123,3 = 21.7.
fi
i =1

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 46 / 76



Teorem (Cebiev teorem)
Neka su i aritmeticka sredina i standardna devijacija bilo koje
numericke varijable X : S ! R zadane na konacnoj populaciji S, redom, i
k 2 R, k > 1. Tada barem 1 k12 100% clanova ima obiljezje koje se
nalazi u intervalu h k, + ki, tj. zbroj relatvnih frekvencija svih
obiljezja koji pripadaju tom intervalu je najmanje 1 k12 .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 47 / 76



Teorem (Cebiev teorem)
Neka su i aritmeticka sredina i standardna devijacija bilo koje
numericke varijable X : S ! R zadane na konacnoj populaciji S, redom, i
k 2 R, k > 1. Tada barem 1 k12 100% clanova ima obiljezje koje se
nalazi u intervalu h k, + ki, tj. zbroj relatvnih frekvencija svih
obiljezja koji pripadaju tom intervalu je najmanje 1 k12 .


Posljedica Cebieva teorema je da barem 75% elemenata populacije
ima numericko obiljezje u intervalu h 2, + 2i , barem 89%
elemenata je u intervalu h 3, + 3i , barem 93% elemenata je
u intervalu h 4, + 4i

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 47 / 76



Teorem (Cebiev teorem)
Neka su i aritmeticka sredina i standardna devijacija bilo koje
numericke varijable X : S ! R zadane na konacnoj populaciji S, redom, i
k 2 R, k > 1. Tada barem 1 k12 100% clanova ima obiljezje koje se
nalazi u intervalu h k, + ki, tj. zbroj relatvnih frekvencija svih
obiljezja koji pripadaju tom intervalu je najmanje 1 k12 .


Posljedica Cebieva teorema je da barem 75% elemenata populacije
ima numericko obiljezje u intervalu h 2, + 2i , barem 89%
elemenata je u intervalu h 3, + 3i , barem 93% elemenata je
u intervalu h 4, + 4i
Outlayer su ekstremne vrijednosti varijable koje odstupaju od prosjeka

za vie od 4. Cesto se takve vrijednosti izuzimaju iz analize skupa
prikupljenih podataka jer nisu reprezentativne i mogu biti pogrene

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 47 / 76


Primjer
U primjeru s udaljenostima do radnog mjesta varijanca je
k k
f i (x i )2 f i (x i 22.5 )2
2 = i =1
k = i =1
12 =
fi
i =1
1 (10 22.5 )2 +2 (15 22.5 )2 + +1 (40 22.5 )2
12 p = 775
12 = 64.58
a st. devijacija je = 64.58 = 8.04. Primijetimo svi putnici osim
jednoga, dakle oko 91% imaju obiljezje u intervalu
h 2, + 2i = h6.42, 38.58i.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 48 / 76


Standardizirana varijabla

Na pitanje o velicini individualnog odstupanja numerickog obiljezja xi


od aritmeticke sredine u jedinicma standardne devijacije koristi se
relativna mjera odstupanja koju nazivamo standardizirano obiljezje
x
zi = i i ono mjeri "koliko standardnih devijacija xi odstupa od "
odnosno pokazuje polozaj zi pojednog elementa populacije s
obiljezjem xi = + zi u grupi s ostalim elementima

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 49 / 76


Standardizirana varijabla

Na pitanje o velicini individualnog odstupanja numerickog obiljezja xi


od aritmeticke sredine u jedinicma standardne devijacije koristi se
relativna mjera odstupanja koju nazivamo standardizirano obiljezje
x
zi = i i ono mjeri "koliko standardnih devijacija xi odstupa od "
odnosno pokazuje polozaj zi pojednog elementa populacije s
obiljezjem xi = + zi u grupi s ostalim elementima
Standardizirano obiljezje je nova numericka varijabla Z koja djeluje na
istoj populaciji kao i X tako to svakom elementu s populacije S
pridruzi odstupanje njegova obiljezja X (s ) od izrazeno u jedinicima
X (s )
tj. Z (s ) = . Nazivamo ju standardiziranom varijablom.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 49 / 76


Primjer

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 50 / 76


Primjer
Godinja placa zaposlenika s odreenom kvalikacijom u jednom poduzecu
iznosi 57345 kn. Prosjecno odstupanje od toga prosjeka je 7540 kn. Moze li
se reci da je osoba s istom kvalikacijom koja ima godinju placu od 34000
kn diskriminirana?

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 50 / 76


Primjer
Godinja placa zaposlenika s odreenom kvalikacijom u jednom poduzecu
iznosi 57345 kn. Prosjecno odstupanje od toga prosjeka je 7540 kn. Moze li
se reci da je osoba s istom kvalikacijom koja ima godinju placu od 34000
kn diskriminirana?
Odredimo relativan polazaj osobe s placom 34000 prema prosjecnoj placi:
x
z = i = 34000 57345 = 3.09615. Placa te osobe ne pripada intervalu
7540
h 3, + 3i u kojem se po Cebi evom teoremu nalazi barem 89%
placa. Dakle, moze se reci da je ta osoba diskriminirana, jer njezina placa
spada u najvie 11% najloijih i najboljih placa. Tocnije za k = 3.09615 )
interval h 3.09615, + 3.09615 i sadrzi 1 k12 100% placa to je
89,57% ukupnih placa

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 50 / 76


Primjer
Prosjecan broj bodova na 1. kolokviju iznosi 50 bodova, a prosjecno
odstupanje od prosjeka je 10. Na 2. kolokviju prosjecan broj bodova je 90,
a st. devijacija je 20. Ako je student na 1. kolokviju postigao 62 boda, a
na 2. 105 bodova, to mozemo zakljuciti o uspjehu?

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 51 / 76


Primjer
Prosjecan broj bodova na 1. kolokviju iznosi 50 bodova, a prosjecno
odstupanje od prosjeka je 10. Na 2. kolokviju prosjecan broj bodova je 90,
a st. devijacija je 20. Ako je student na 1. kolokviju postigao 62 boda, a
na 2. 105 bodova, to mozemo zakljuciti o uspjehu?
Buduci su rasponi bodovnih skala nepoznati, pa mozemo pretpostaviti da su
razliciti, prosudbu o uspjehu, iako se uspjeh iskazuje u istim mjernim
jedinicama-bodovima, mozemo donijeti jedino temeljem standardiziranog
obiljezja koja eliminira problem raspona skale.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 51 / 76


Primjer
Prosjecan broj bodova na 1. kolokviju iznosi 50 bodova, a prosjecno
odstupanje od prosjeka je 10. Na 2. kolokviju prosjecan broj bodova je 90,
a st. devijacija je 20. Ako je student na 1. kolokviju postigao 62 boda, a
na 2. 105 bodova, to mozemo zakljuciti o uspjehu?
Buduci su rasponi bodovnih skala nepoznati, pa mozemo pretpostaviti da su
razliciti, prosudbu o uspjehu, iako se uspjeh iskazuje u istim mjernim
jedinicama-bodovima, mozemo donijeti jedino temeljem standardiziranog
obiljezja koja eliminira problem raspona skale.
x 1 1 62 50 = 1.2 (uspjeh je za
z1 = 1 = 10 1.2 devijacije bolji od prosjeka)
x 2 2 105 90 = 0.75 (uspjeh na
z2 = 2 = 20 2. kol. je za 0.75 bolji od prosjeka)

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 51 / 76


Primjer
Skupina od 100 mladica natjece se u trcanju na 100 m i skoku udalj. U
prvoj disciplini je 1 = 12.8 s i 1 = 2s, a u drugoj je 2 = 485 cm
2 = 50 cm. Ako mladic A ima rezultat 12.2 s u 1. disciplini i 490 cm u
2., a mladic B trci 13 s na 100 m i skace 580 cm u vis, koji je mladic
uspjeniji?

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 52 / 76


Primjer
Skupina od 100 mladica natjece se u trcanju na 100 m i skoku udalj. U
prvoj disciplini je 1 = 12.8 s i 1 = 2s, a u drugoj je 2 = 485 cm
2 = 50 cm. Ako mladic A ima rezultat 12.2 s u 1. disciplini i 490 cm u
2., a mladic B trci 13 s na 100 m i skace 580 cm u vis, koji je mladic
uspjeniji?
Buduci su mjerne jedinice ovih disciplina razlicite moramo koristiti
standardiziranu varijablu.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 52 / 76


Primjer
Skupina od 100 mladica natjece se u trcanju na 100 m i skoku udalj. U
prvoj disciplini je 1 = 12.8 s i 1 = 2s, a u drugoj je 2 = 485 cm
2 = 50 cm. Ako mladic A ima rezultat 12.2 s u 1. disciplini i 490 cm u
2., a mladic B trci 13 s na 100 m i skace 580 cm u vis, koji je mladic
uspjeniji?
Buduci su mjerne jedinice ovih disciplina razlicite moramo koristiti
standardiziranu varijablu.
zA1 = 12.2 2 12.8 = 0.3 (to je zapravo +0.3 jer je to za 0.3 brze od
prosjeka)

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 52 / 76


Primjer
Skupina od 100 mladica natjece se u trcanju na 100 m i skoku udalj. U
prvoj disciplini je 1 = 12.8 s i 1 = 2s, a u drugoj je 2 = 485 cm
2 = 50 cm. Ako mladic A ima rezultat 12.2 s u 1. disciplini i 490 cm u
2., a mladic B trci 13 s na 100 m i skace 580 cm u vis, koji je mladic
uspjeniji?
Buduci su mjerne jedinice ovih disciplina razlicite moramo koristiti
standardiziranu varijablu.
zA1 = 12.2 2 12.8 = 0.3 (to je zapravo +0.3 jer je to za 0.3 brze od
prosjeka)
zB 1 = 13 212.8 = 0.1 (to je zapravo 0.1 sporije od prosjeka)
zB 2 = 58050485 = 1.9 zA2 = 49050485 = 0.1

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 52 / 76


Primjer
Skupina od 100 mladica natjece se u trcanju na 100 m i skoku udalj. U
prvoj disciplini je 1 = 12.8 s i 1 = 2s, a u drugoj je 2 = 485 cm
2 = 50 cm. Ako mladic A ima rezultat 12.2 s u 1. disciplini i 490 cm u
2., a mladic B trci 13 s na 100 m i skace 580 cm u vis, koji je mladic
uspjeniji?
Buduci su mjerne jedinice ovih disciplina razlicite moramo koristiti
standardiziranu varijablu.
zA1 = 12.2 2 12.8 = 0.3 (to je zapravo +0.3 jer je to za 0.3 brze od
prosjeka)
zB 1 = 13 212.8 = 0.1 (to je zapravo 0.1 sporije od prosjeka)
zB 2 = 58050485 = 1.9 zA2 = 49050485 = 0.1
Prosjek mladica A je 0.2 (ukupno je priblizno prosjecan) a mladica B je 0.9
(ukupno je iznadprosjecan)

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 52 / 76


Example
U primjeru o starosti populacije stanovnitva R.H. 1991. izracunata su
standardizirana obiljezja i dan je graf distribucije frekvencija
standardizirane varijable.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 53 / 76


Primjer
Tecaj jedne dionice zabiljezen u $ na jednoj burzi u 25 dana
uzastopno je: 125, 127, 132, 127, 122, 129, 121, 124, 128, 132, 126,
125, 129, 128, 132, 122, 121, 120, 125, 133, 127, 125, 127, 134, 134.
Jedan broker predvia da ce u vremenu predvienom za prodaju
dionica tecaj izositi 139 $, a drugi da ce u tom istom vremenu
iznositi 133 $. Prosudite rizik procjene za oba brokera.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 54 / 76


Primjer
Tecaj jedne dionice zabiljezen u $ na jednoj burzi u 25 dana
uzastopno je: 125, 127, 132, 127, 122, 129, 121, 124, 128, 132, 126,
125, 129, 128, 132, 122, 121, 120, 125, 133, 127, 125, 127, 134, 134.
Jedan broker predvia da ce u vremenu predvienom za prodaju
dionica tecaj izositi 139 $, a drugi da ce u tom istom vremenu
iznositi 133 $. Prosudite rizik procjene za oba brokera.
Moramo pretpostaviti da je trzite stabilno tj. da je kretanje tecaja
"normalno", isto kao i za zabiljezenih 25 dana. Prosjecna cijena za
navedeno razdoblje je 127 $, a st. devijacija je 4.079 $. Prognozirani
tecaj od 139 $ odstupa od prosjeka za 139 127
4.079 = 2.94 standardne
devijacije, a tecaj od 133 odstupa 1.47. To znaci da prva prognoza
nije u intervalu h127 2.9, 127 + 2.9i to povlaci (sve uz
pretpostavku da je kretanje tecaja uobicajno) da ta cijena nije i nece
biti meu 1 2.91 2 100% = 88, 1 % svih (i buducih) cijena dionica,
dok druga cijena nije u intervalu h127 1.47, 127 + 1.47i, tj. nije i
1
nece biti meu 1 1.47 2 100% = 53, 7% svih cijena dionica. Ocito
je da 1. broker vie riskira.
STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 54 / 76
Geometrijska sredina

Ako je f(x1 , f1 ) , ..., (xk , fk )g distribucija numericke varijable s N


pozitivnih vrijednosti (od toga k-razlicitih). Geometrijskom
sredinom te numericke varijable nazivamo q broj
p
G (x1 , ..., xN ) = N x1 xN = x11N f
xkfk .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 55 / 76


Geometrijska sredina

Ako je f(x1 , f1 ) , ..., (xk , fk )g distribucija numericke varijable s N


pozitivnih vrijednosti (od toga k-razlicitih). Geometrijskom
sredinom te numericke varijable nazivamo q broj
p
G (x1 , ..., xN ) = N x1 xN = x11N f
xkfk .
log x1 + log xN
Vrijedi log G = N

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 55 / 76


Geometrijska sredina

Ako je f(x1 , f1 ) , ..., (xk , fk )g distribucija numericke varijable s N


pozitivnih vrijednosti (od toga k-razlicitih). Geometrijskom
sredinom te numericke varijable nazivamo q broj
p
G (x1 , ..., xN ) = N x1 xN = x11N f
xkfk .
log x1 + log xN
Vrijedi log G = N
Upotrebljava se kao mjera prosjecne brzine nekih promjena.
Primjerice, ako je neko mjesto 2000. imalo 2000 stanovnika, 2005.
9000, a 2010. 18000, onda se broj stanovnika prvo povecao za 4.5
puta, a udrugom razdoblju 2 puta. prosje
p cna promjena stanovnitva
po razdobljima nije 4.52+2 = 3.25, vec 2 4.5 2 = 3. Zaista
2000 3 3 = 18000.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 55 / 76


Harmonijska sredina

Harmonijskom sredinom numericke varijable s N pozitivnih


vrijednosti (od toga k-razlicitih) nazivamo broj
H (x1 , ..., xN ) = 1 + N + 1 = f1 N fk = H
x1 xN x1 + +x
k

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 56 / 76


Harmonijska sredina

Harmonijskom sredinom numericke varijable s N pozitivnih


vrijednosti (od toga k-razlicitih) nazivamo broj
H (x1 , ..., xN ) = 1 + N + 1 = f1 N fk = H
x1 xN x1 + +x
k
Primijenjuje se kao adekvatna srednja vrijednost nekih srednjih
vrijednosti, tj. omjera istih brojnika.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 56 / 76


Harmonijska sredina

Harmonijskom sredinom numericke varijable s N pozitivnih


vrijednosti (od toga k-razlicitih) nazivamo broj
H (x1 , ..., xN ) = 1 + N + 1 = f1 N fk = H
x1 xN x1 + +x
k
Primijenjuje se kao adekvatna srednja vrijednost nekih srednjih
vrijednosti, tj. omjera istih brojnika.
Primjerice ako se vozimo 100 km/h u jednom smjeru, i 50 km/h u
drugom, prosjecna brzina nije 75 km/h vec H = 1 2+ 1 = 66.7
100 50
1 1
(razlomke 100 i 50 shvacamo kao vremena potrebna za prevaliti
jedinicni dio puta, tj. 1 km, pri brzini 100 odnosno 50 km/h)

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 56 / 76


Harmonijska sredina

Harmonijskom sredinom numericke varijable s N pozitivnih


vrijednosti (od toga k-razlicitih) nazivamo broj
H (x1 , ..., xN ) = 1 + N + 1 = f1 N fk = H
x1 xN x1 + +x
k
Primijenjuje se kao adekvatna srednja vrijednost nekih srednjih
vrijednosti, tj. omjera istih brojnika.
Primjerice ako se vozimo 100 km/h u jednom smjeru, i 50 km/h u
drugom, prosjecna brzina nije 75 km/h vec H = 1 2+ 1 = 66.7
100 50
1 1
(razlomke 100 i 50 shvacamo kao vremena potrebna za prevaliti
jedinicni dio puta, tj. 1 km, pri brzini 100 odnosno 50 km/h)
Ako domacinstvu A litra mlijeka traje 5 dana, domacinstvu B 10
dana, a domacinstvu C 15 dana onda prosjecno trajanje litre mlijeka u
ta 3 domacinstva nije 10 dana, vec H = 1 + 13 + 1 = 8.2 (razlomke 15 ,
5 10 15
1 1
10i 15 shvacamo kao dio litre mlijeka u domacinstvima A, B i C,
redom, koja se potroi za 1 dan)
STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 56 / 76
Zadatak
Ako su zadane prosjecne prodajne cijene nekih proizvoda po regijama
i struktura vrijednosti prodaje tih regija u odnosu na cijelo podrucje,
izracunajte prosjecnu prodajnu cijenu.
i-ta regija xi pi 100%
1. sjever 490 35%
2. jug 494 25%
3. sredinja regija 500 40%

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 57 / 76


Zadatak
Ako su zadane prosjecne prodajne cijene nekih proizvoda po regijama
i struktura vrijednosti prodaje tih regija u odnosu na cijelo podrucje,
izracunajte prosjecnu prodajnu cijenu.
i-ta regija xi pi 100%
1. sjever 490 35%
2. jug 494 25%
3. sredinja regija 500 40%
Kad bi ovi postotci predstavljali ukupan udio broja proizvoda ni i-te
regije u ukupnom broju proizvoda N = n1 + n2 + n3 , tj. pi = nNi ,
onda bi prosjecna prodajna cijena bila
x1 p1 + x2 p2 + x3 p3 = 490 0.35 + 494 0.25 + 500 0.4. No postotci
n1 n2 n3
predstavljaju udio ukupne vrijednosti xk1 , xk2 , xk3 svih n1 ,
k =1 k =1 k =1
n2 , n3 proizvoda 1., 2. odnosno 3. regije, redom, u ukupnoj
N n1 n2 n3
vrijednosti xk = xk1 + xk2 + xk3 svih proizvoda.
k =1 k =1 k =1 k =1

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 57 / 76


Zadatak
ni
xki
k =1
Dakle vrijedi pi = N .
xk
k =1
n1 n2 n3 N
xk1 + xk2 + xk3 xk
k =1 k =1 k =1 k =1 1
Stoga je prosjek jednak N = N = n 1 +n 2 +n 3 =
N
xk
k =1

1 1 1
n1
+
n2
+
n3 = n1 n2 n1 = p1 p p
+ x2 + x3
N N N
xk1 xk2 xk3 x1 2 3
xk xk xk k =1 k =1 k =1
k =1 k =1 k =1 N N N
xk xk xk
k =1 k =1 k =1
n1 + n2 + n3
xk1 xk2 xk1
k =1 k =1 k =1
n1 n2 n3
1
0.35 0.25 0.40 = H = 494.96
490 + 494 + 500

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 58 / 76


Momenti

Neka je X : S ! fx1 , x2 , ..., xk g R numericka varijabla zadana na


konacnom skupu, opsega N, cija je arit. sredina . Momenti su
aritmeticke sredine odstupanja vrijednosti numericke varijable od
njezine aritmeticke sredine (centralni moment) ili neke druge
vrijednosti (pomocni moment) podignuta na neku potenciju r 2 N0

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 59 / 76


Momenti

Neka je X : S ! fx1 , x2 , ..., xk g R numericka varijabla zadana na


konacnom skupu, opsega N, cija je arit. sredina . Momenti su
aritmeticke sredine odstupanja vrijednosti numericke varijable od
njezine aritmeticke sredine (centralni moment) ili neke druge
vrijednosti (pomocni moment) podignuta na neku potenciju r 2 N0
k N
f i (x i )r (x i )r
i =1 i =1
r -ti centralni moment: r = k = N
fi
i =1

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 59 / 76


Momenti

Neka je X : S ! fx1 , x2 , ..., xk g R numericka varijabla zadana na


konacnom skupu, opsega N, cija je arit. sredina . Momenti su
aritmeticke sredine odstupanja vrijednosti numericke varijable od
njezine aritmeticke sredine (centralni moment) ili neke druge
vrijednosti (pomocni moment) podignuta na neku potenciju r 2 N0
k N
f i (x i )r (x i )r
i =1 i =1
r -ti centralni moment: r = k = N
fi
i =1

ocito je 1 = 0, 2 = 2 , 3 izrazava asimetriju podataka u odnosu


na , 4 izrazava "zaobljenost" distribucije

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 59 / 76


Momenti

Neka je X : S ! fx1 , x2 , ..., xk g R numericka varijabla zadana na


konacnom skupu, opsega N, cija je arit. sredina . Momenti su
aritmeticke sredine odstupanja vrijednosti numericke varijable od
njezine aritmeticke sredine (centralni moment) ili neke druge
vrijednosti (pomocni moment) podignuta na neku potenciju r 2 N0
k N
f i (x i )r (x i )r
i =1 i =1
r -ti centralni moment: r = k = N
fi
i =1

ocito je 1 = 0, 2 = 2 , 3 izrazava asimetriju podataka u odnosu


na , 4 izrazava "zaobljenost" distribucije
k N
fi xir xir
i =1 i =1
r -ti pomocni moment oko nule: mr = k = N (primijetimo da
fi
i =1
je m1 = )
STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 59 / 76
Mod

U statstickoj varijabli mod, u oznaci Mo , je ono obiljezje koje ima najvecu


frekvenciju. Mozemo reci da je to obiljezje koje se najcece javlja.
Odreuje se za kvalitativna i kvantitativna obiljezja.
Ako je distribucija numericke varijable grupirana u (prave) razrede, tada se
razred s najvecom korigiranom frekvencijom b naziva modalni razred.
Ako je L1 donja granica toga razreda, a i njegova irina, te a frekvencija
razreda koji prethodi modalnom, a c frekvencija razreda koji slijedi iza
modalnoga, onda se mod aproksimira formulom
(b a )
M0 = L1 + (b a )+(b c ) i.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 60 / 76


Primjer

(15183 12613 )
Mo = 25 + (15183 12613 )+(15183 10046 )
= 26.67

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 61 / 76


Medijan

Neka su x1 , ..., xN sve vrijednosti numericke varijable za svih N clanova


populacije. Pretpostavimo da su vrijednosti poredane po ureaju
x1 6 6 xN , odnosno da te vrijednosti tvore jedan uzlazni niz brojeva.
U slucaju da je N neparan, medijan Me deniramo kao vrijednost
sredinjeg clana niza xr , r = Int N2 + 1 (Int oznacuje cijelu vrijednost
broja bez decimala). U slucaju da je N paran medijan deniramo kao
poluzbroj vrijednosti sredinjih clanova, tj. Me = xr 12+xr . Medijan ima
smisla racunati i za ordinalne varijable.
Medijan ima svojstvo da je zbroj apsolutnih odstupanja svih vrijednosti
varijable od nekog ksnog broja minimalan za medijan. U nizu od 100
brojeva s vrijednocu 10 i broja 20 medijan je 10. Iz njegovog tumacenja
da prva polovica clanova niza ima vrijednost 6 10 a druga polovica
vrijednosti > 10 uocavamo manjkavosti polozajnih srednjih vrijednosti. U
ovom primjeru je Mo = 10, a = 10.099.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 62 / 76


Aritmeticku sredinu smijemo zamiljati kao tezite poligona frekvencija,
mod kao tocku u bazi u kojoj je poligon najvii, a medijan kao tocku u
bazi u kojoj okomiti pravac dijeli poligon frekvencija na dva dijela jednakih
povrina.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 63 / 76


Zadatak
U nizu plasmana reprezentacije na svjetskim prvenstvima 1, 3, 3, 2, 5, 3,
7, 7, 8, 8, 10, 11 odredite mod i medijan.
Rjeenje: Mo = 3, Me = 6.

Zadatak
Studenti su polozili ispit sa sljedecim ocjenam A, C, B, A, D, D, D, A, B,
D. Odredite mod i medijan.
Mo = D, medijan je izmeu ocjene B i C (preracunato u brojcane
vrijednosti ove ordinalne varijable Me = 2.5.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 64 / 76


Ako je distribucija numericke varijable grupirana u (prave) razrede, tada
deniramo medijalni razred kao prvi po redu razred cija je kumulativna
frekvencija veca ili jednaka N2 . Ako je L1 donja granica modalnog razreda,
fmed njegova frekvencija (nekorigirana), i velicina medijalnog razreda,
i0 1
fj kumulativna frekvencija (zbroj svih frekvencija) do medijalnog
j =1
razreda,tada se medijan aproksimira vrijednocu
i0 1
N
2 fj
j =1
Me = L1 + i.
fmed

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 65 / 76


STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 66 / 76
Kvantili

Neka su x1 , ..., xN sve vrijednosti numericke varijable za svih N clanova


populacije. Pretpostavimo da su vrijednosti poredane po ureaju
x1 6 6 xN , odnosno da te vrijednosti tvore jedan uzlazni niz brojeva.
Kvantili reda n su n 1 vrijednosti K1 , ..., Kn 1 koje dijele niz na n
jednakih dijelova, tj. u intervalima [x1 , K1 i , hK1 , K2 i , ..., hKn 1 , xN ] se
nalazi jednako mnogo vrijednosti niza. Kvantil reda 2 je medijan, kvantile
Q1 , Q2 , Q3 reda 4 nazivamo kvartilima, reda 10 decilima, a reda 100
percentilima.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 67 / 76


Oznacimo li sa r = Int j Nn + 1, j-ti kvantil Kj reda n racunamo po
formuli
xr , j Nn 2 /N
Kj = x r + x r +1 .
2 , jn 2N
N

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 68 / 76


Zadatak
Odredite kvartile u nizu 1, 3, 0, 1, 1, 5, 0, 3, 1, 2, 3, 3.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 69 / 76


Zadatak
Odredite kvartile u nizu 1, 3, 0, 1, 1, 5, 0, 3, 1, 2, 3, 3.
Niz poredan po ureaju: 3, 3, 1, 1, 1, 0, 0, 1, 2, 3, 3, 5.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 69 / 76


Zadatak
Odredite kvartile u nizu 1, 3, 0, 1, 1, 5, 0, 3, 1, 2, 3, 3.
Niz poredan po ureaju: 3, 3, 1, 1, 1, 0, 0, 1, 2, 3, 3, 5.
N
4= 3, 2 N4 = 6, 3 N4 = 9 ) Q1 = x3 +2 x4 = 1,
Q2 = Me = x6 +2 x7 = 0, Q3 = x9 +2x10 = 2.5.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 69 / 76


Ako je distribucija numericke varijable grupirana u (prave) razrede, tada
deniramo j-ti kvantilni razred kao prvi po redu razred cija je kumulativna
frekvencija veca ili jednaka j Nn . Ako je L1 donja granica j-tog kvantilnog
razreda, fkvant njegova frekvencija (nekorigirana), i velicina j-tog
i0 1
kvantilnog razreda, fk kumulativna frekvencija (zbroj svih frekvencija)
k =1
do j-tog kvantilnog razreda,tada se j-ti kvantil aproksimira vrijednocu
i0 1
j Nn fk
k =1
Kj = L1 + i.
fkvant

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 70 / 76


Primjer

N
4 = 25, 2 N4 = 50, 3 N4 = 75 )1. kvartilni razred je 1500.5-1700.5,
medijalni razred je 1700.5-1900.5, 3. kvartilni razred je 1900.5-2100.5.
Q1 = 1500.5 + 2516.521.7
200 = 1540.5,
50 38.2
Me = 1700.5 + 23.8 200 = 1799.7, Q3 = 1900.5 + 7514.962 200 = 2074.9

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 71 / 76


Nepotpune mjere disperzije

Raspon varijacije RX numericke varijable X jest razlika izmeu


najvece i najmanje vrijednosti varijable ako takve postoje (kod
beskonacnih populacija varijabla ne mora imati svoj minimum i
maksimum)
RX = Xmax Xmin .

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 72 / 76


Nepotpune mjere disperzije

Raspon varijacije RX numericke varijable X jest razlika izmeu


najvece i najmanje vrijednosti varijable ako takve postoje (kod
beskonacnih populacija varijabla ne mora imati svoj minimum i
maksimum)
RX = Xmax Xmin .
Buduci u izracun raspona ulaze samo dvije vrijednosti (koje mogu biti
outlayeri) taj parametar ne uzima u obzir variranje podaci. Raspon
ima smisla i za ordinalnu varijablu.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 72 / 76


Interkvartilom IQ numericke ili ordinalne varijable nazivamo razliku
gornjeg i donjeg kvartila tj.
IQ = Q3 Q1 . Mozemo reci da je interkvartil raspon varijacije
sredinjih 50% clanova ureenog niza. (Interdecil ID = D9 D8 je
raspon sredinjih 80% podataka, interpercentil IP = P99 P1 je
raspon sredinjih 90% podataka)

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 73 / 76


Interkvartilom IQ numericke ili ordinalne varijable nazivamo razliku
gornjeg i donjeg kvartila tj.
IQ = Q3 Q1 . Mozemo reci da je interkvartil raspon varijacije
sredinjih 50% clanova ureenog niza. (Interdecil ID = D9 D8 je
raspon sredinjih 80% podataka, interpercentil IP = P99 P1 je
raspon sredinjih 90% podataka)
Pripadajuca relativna mjera je koecijent interkvartilne devijacije
VQ = Q 3 Q1
Q 1 +Q 3 , koji ima smisla samo za varijable s pozitivnim
vrijednostima. Vrijedi 0 6 VQ < 1. to je V blize 0 to je varijabilnost
sredinjih 50% podataka manja.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 73 / 76


Zadatak
Odredite raspon i koecijent interkvartilne devijacije za niz: 1, 2, 4, 4,
6, 9, 9, 9, 10, 100

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 74 / 76


Zadatak
Odredite raspon i koecijent interkvartilne devijacije za niz: 1, 2, 4, 4,
6, 9, 9, 9, 10, 100
9 4
R = 100 1 = 99, Q1 = 4, Q3 = 9 ) VQ = 9 +4 = 0.38

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 74 / 76


Zadatak
Odredite raspon i koecijent interkvartilne devijacije za niz: 1, 2, 4, 4,
6, 9, 9, 9, 10, 100
9 4
R = 100 1 = 99, Q1 = 4, Q3 = 9 ) VQ = 9 +4= 0.38
Odredite raspon i koecijent interkvartilne devijacije za niz: 1000,
1100, 1111, 1150, 1160, 1180.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 74 / 76


Zadatak
Odredite raspon i koecijent interkvartilne devijacije za niz: 1, 2, 4, 4,
6, 9, 9, 9, 10, 100
9 4
R = 100 1 = 99, Q1 = 4, Q3 = 9 ) VQ = 9 +4= 0.38
Odredite raspon i koecijent interkvartilne devijacije za niz: 1000,
1100, 1111, 1150, 1160, 1180.
60
R = 180, VQ = 2260 = 0.026.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 74 / 76


Mjere asimetrije i zaobljenosti
Mjera asimetrije varijable je parametar koji daje informaciju o
nacinu rasporeda podataka prema aritmetickoj sredini. Najvaznija

mjere asimetrije je: koecijent asimetrije 3 = 33 (najcece
vrijednosti su iz h 2, 2i , u simetricnom rasporedu je 3 = 0),
Pearsonova mjera, Bowleyjeva mjera

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 75 / 76


Mjere asimetrije i zaobljenosti
Mjera asimetrije varijable je parametar koji daje informaciju o
nacinu rasporeda podataka prema aritmetickoj sredini. Najvaznija

mjere asimetrije je: koecijent asimetrije 3 = 33 (najcece
vrijednosti su iz h 2, 2i , u simetricnom rasporedu je 3 = 0),
Pearsonova mjera, Bowleyjeva mjera
Grafovi distribucija frekvencija varijable pokazuju redom simetricnu
3 = 0, pozitivno asimetricnu 3 > 0 i negativno asimetricnu 3 < 0
varijablu

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 75 / 76


Mjera zaobljenosti varijable je parametar koji daje informaciju o
zaobljenosti modalnog vrha na poligonu distribucije frekvencija

varijable. Zaobljenost se mjeri koecijentom zaobljenosti 4 = 44
cija vrijednost je pozitivna.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 76 / 76


Mjera zaobljenosti varijable je parametar koji daje informaciju o
zaobljenosti modalnog vrha na poligonu distribucije frekvencija

varijable. Zaobljenost se mjeri koecijentom zaobljenosti 4 = 44
cija vrijednost je pozitivna.
Grafovi distribucija frekvencije varijable pokazuju redom "normalno"
zaobljenu 4 = 3, vie zaobljenu 3 > 3 i manje zaobljenu 3 < 3
varijablu, te ne zaobljenu 4 = 1.8 i U-zaobljenu < 1.8.

STATISTIKA (PMF) doc.dr.sc. Nikola Koceic Bilan 76 / 76

You might also like