Download as pdf or txt
Download as pdf or txt
You are on page 1of 77

OSNOVE STATISTIKE

Statistiki nizovi, definicija, nain


prikazivanja i analiza
Osnovni pojmovi u statistici
Statistika je posebna znanstvena
disciplina koja na organiziran nain
prikuplja, obrauje, prikazuje i vri
analizu podataka, te interpretira rezultate
provedene analize prema postavljenim
ciljevima istraivanja.
U drugom znaenju statistika predstavlja
sustavan pristup prikupljanju, sreivanju i
analizi podataka za potrebe voenja
dravne politike ili poslovne politike
gospodarskih subjekata.
Statistika kao znanstvena disciplina
Predmet prouavanja masovne pojave
Zajedniko svojstvo tih pojava je
varijabilnost, a statistika prouava
varijacije i kovarijacije podataka koji
predouju razliite pojave ili procese u
prirodi i drutvu
Statistika metodologija u okviru
statistike teorije razvijen je veliki broj
statistikih metoda. Metode mogu biti
kvalitativne i kvantitativne, u statistici
prevladavaju kvantitativne metode
Statistika u znaenju statistiki sustav
za potrebe voenja dravne politike
Statistiki sustav je skup elemenata,
usklaenih i povezanih u jedinstvenu
cjelinu.
Elementi statistikog sustava su:
- Statistike organizacije
- Statistika istraivanja
- Baze podataka
- Jedinstveni statistiki standardi i
metodologija
- Statistiki pokazatelji i statistike
publikacije
Statistiki skup, pojam i definicija
Skup svih elemenata na kojima se
odreena pojava statistiki istrauje zove
se statistiki skup.
Statistiki skup se definira
- Pojmovno, definiraju se svojstva koja
mora imati svaka jedinica da bi pripadala
statistikom skupu,
- Prostorno, odrediti prostor kojem
pripadaju sve jedinice skupa,
- Vremenski, odrediti vremenski interval ili
vremensku toku za koju su vezane sve
jedinice statistikog skupa
Statistiki skup, pojam i definicija
Statistiki skup moe biti realan i
hipotetian.
Jedinice realnog skupa postoje u tekuem
vremenu.
Jedinice hipotetinog skupa se definiraju
odreenim pravilom i rezultat su
statistikog procesa ili statistikog
pokusa.
Broj jedinica nekog skupa se naziva
opsegom skupa. Prema opsegu statistiki
skup moe biti konaan i beskonaan.
Statistiki skup, pojam i definicija
Statistiko istraivanje se moe provoditi
na cijelom statistikom skupu ili na dijelu
statistikog skupa koji se zove uzorak.
Uzorak je reprezentativan dio osnovnog
skupa u kojem se promatrana statistika
pojava ponaa na priblino isti nain kao i
u cijelom skupu.
Rezultati dobiveni istraivanjem na
uzorku se uopavaju i statistikim
zakljuivanjem se donose zakljuci o
osnovnom skupu.
Statistiko obiljeje, pojam i definicija
Statistika obiljeja su svojstva po kojima
su jedinice skupa meusobno sline ili se
razlikuju.
Dijele se na:
- Nominalna, svojstva jedinica statistikog
skupa koja se izraavaju opisno
- Redoslijedna, svojstva jedinica
statistikog skupa za koja se moe
utvrditi stupanj posjedovanja
promatranog obiljeja.
- Numerika, svojstva jedinica statistikog
skupa koja se izraavaju pomou brojeva.
Statistiki podaci
Statistiki podaci su rezultat mjerenja
svojstava jedinica statistikog skupa
Mjerenje je pridruivanje numerikih i
nenumerikih oznaka jedinicama skupa
prema odreenom pravilu. Pravila
pridruivanja odreena su mjernom
skalom koja se koristi kod mjerenja.
Svakom mjerenju prethodi definiranje
mjerne skale. S obzirom na metrika
svojstva razlikuju se nominalna,
ordinalna, intervalna i omj erna skala.
Statistiki podaci
Nominalna skala je dana u obliku liste
naziva (atributa ili geografskih pojmova).
Mjerenje nominalnom skalom znai
pridruivanje statistikim jedinicama
odgovarajueg naziva (atributa ili
geografskog pojma) iz liste.
Ordinalna skala je dana u obliku liste
modaliteta rangiranih prema intenzitetu
mjernog svojstva. Modaliteti na listi su
rangovi koji mogu biti izraeni opisno ili
brojem.
Statistiki podaci
Intervalna skala je numerika skala
koju karakterizira definirana mjerna
jedinica i dogovorno utvrena nula.
Mjerenje intervalnom skalom znai
pridruivanje brojeva jedinicama skupa
prema intenzitetu mjerenog svojstva,
izraeno u definiranim mjernim
jedinicama.
Omjerna skala je numerika skala koju
karakterizira definirana mjerna jedinica i
nula koja oznauje nepostojanje svojstva.
Statistiki podaci
Statistiki podaci mogu biti izvorni i
izvedeni.
Izvorni podaci su rezultat izravnog
mjerenja obiljeja pomou mjerne skale.
Izvedeni se dobiju raunskim operacijama
nad podacima koji se odnose na jednu ili
vie varijabli.
Izvori podataka mogu biti primarni i
sekundarni
UREIVANJE STATISTIKIH PODATAKA.
STATISTIKI NIZ
Za dobivanje preglednih podataka nuno
je izvriti klasifikaciju istih ili grupiranje
podataka, kako se taj postupak
uobiajeno naziva u obradi statistikih
podataka. Grupiranjem statistikih
podataka nastaju statistiki nizovi.
Grupiranje statistikih podataka je
postupak kojim se statistiki skup dijeli na
odreeni broj grupa ili podskupova prema
prethodno utvrenim modalitetima
istraivanog obiljeja i uz uvaavanje
principa iskljuivosti i iscrpnosti.
Nominalni statistiki niz
Nominalni niz nastaje ureenjem
podataka prema modalitetima nominalne
varijable.
Ako se modaliteti nominalne varijable
oznae sa , gdje je k broj
razliitih modaliteta, a pripadajue
frekvencije sa , onda skup
ureenih parova
predstavlja nominalni niz.
Redoslijed grupa u nominalnom nizu je
proizvoljan.
k i
a a a a ,..., ,..., ,
2 1
k i
f f f f ,..., ,..., ,
2 1
( ) , , k i f a
i i
,..., 2 , 1 , , =
Nominalni statistiki niz
Veliine f
i
zovu se apsolutne frekvencij e.
Apsolutna frekvencija je broj statistikih
jedinica koje imaju istu vrijednost obiljeja.
Zbroj apsolutnih frekvencija jednak je
opsegu statistikog skupa.
U statistikoj analizi nominalnih nizova
koriste se i relativne frekvencije.
Relativna frekvencija p
i
je relativni broj koji
pokazuje udio grupe podataka u ukupnom
broju podataka.
Dobiva se tako da se frekvencija grupe
podijeli ukupnim brojem podataka.
Nominalni statistiki niz
Relativna postotna frekvencija P
i
dobiva se
tako da se relativna frekvencija pomnoi sa
100.
Mogunosti brojane analize nominalnih
nizova su ograniene, osim ve spomenutih
relativnih frekvencija mogu se koristiti
indeksni brojevi i relativni brojevi
koordinacije.
Nominalni nizovi se prikazuju u statistikim
tablicama i pomou grafikona.
Nominalna varijabla ima najslabija metrika
svojstva pa su mogunosti brojane analize
ograniene. Od srednjih vrijednosti u njihovoj
analizi moe se odrediti mod ili najei
modalitet.
Redoslijedni (ordinalni) statistiki niz
Redoslijedni niz se dobiva ureenjem
podataka prema modalitetima varijable
ranga.
Ako se mogui rangovi odreene
varijable oznae sa
gdje je k broj rangova, a pripadajue
frekvencije sa
onda skup ureenih parova
predstavlja redoslijedni niz.
k i
r r r r ,..., ,..., ,
2 1
k i
f f f f ,..., ,..., ,
2 1
, , k i f r
i i
,..., 2 , 1 ); , ( =
Redoslijedni (ordinalni) statistiki niz
Kod prikazivanja redoslijednog niza pored
apsolutnih frekvencija mogu se koristiti
relativne frekvencije i relativne postotne
frekvencije. Osim toga mogu se
izraunavati i kumulativne frekvencije.
Redoslijedni nizovi se prikazuju u tablici i
grafiki, slino kao i nominalni nizovi.
U analizi redoslijednih nizova mogu se
odrediti poloajne srednje vrijednosti,
mod i medijan.
Numeriki statistiki niz
Numeriki niz se dobiva ureenjem podataka
prema modalitetima numerike varijable.
Ako se mogue vrijednosti numerike varijable
oznae sa
gdje je k broj razliitih vrijednosti diskretne
numerike varijable, a pripadajue frekvencije
sa
onda skup ureenih parova
predstavlja numeriki niz.
k i
x x x x ,..., ,..., ,
2 1
k i
f f f f ,..., ,..., ,
2 1
, , k i f x
i i
,..., 2 , 1 ); , ( =
Numeriki statistiki niz
Ako diskretna numerika varijabla
poprima veliki broj razliitih vrijednosti ili
se radi o kontinuiranoj varijabli,
grupiranje se provodi tako da se interval
vrijednosti podijeli na podintervale ili
razrede veliina. Pojedinani podaci se
razvrstavaju u grupe prema vrijednosti.
U tom sluaju numeriki niz je skup
ureenih parova
Kod analize statistikih nizova sa
razredima koristi se razredna sredina.
( ) , , k i f L L
i i i
,..., 2 , 1 ; , ,
2 1
=
Numeriki statistiki niz
Numeriki nizovi se prikazuju u tablicama i
pomou grafikona. Za prikazivanje numerikih
nizova mogu se koristiti pored povrinskih i linijski
grafikoni. Za prikazivanje kumulativnog niza
koristi se posebna vrsta linijskog grafikona koji se
naziva kumulantom.
Mogunosti brojane analize numerikih nizova su
velike. U analizi se izraunavaju razliiti
pokazatelji koji se mogu svrstati u etiri skupine.
To su pokazatelji centralne tendencije numerikih
podataka, pokazatelji disperzije podataka,
pokazatelji simetrinosti distribucije i pokazatelji
zaobljenosti modalnog vrha.
Statistike tablice
R E D A K Z B I R N I
....
Modalitet 2
modalitet 1
LJ E L A V
Sadraj kolone
Z A G
Sadraj kolone
Obiljeje
Statistike tablice
Statistike tablice mogu biti proste,
skupne i kombinirane.
Prosta statistika tablica sadri samo
jedan statistiki niz. Statistiko obiljeje i
njegovi modaliteti se prikazuju u
pretkoloni, a frekvencije su u drugom
stupcu.
Skupna statistika tablica sadri dva
statistika niza kojima je zajedniko
istraivano obiljeje.
Statistike tablice
Kombinirane statistike tablice imaju dva
ili vie statistikih nizova koji
predstavljaju podatke istog statistikog
skupa prema modalitetima dva ili
obiljeja. Modaliteti jednog obiljeja se
navode u pretkoloni, a drugog u zaglavlju
tablice.
Proste i skupne tablice imaju zbirni redak,
a kombinirane pored zbirnog retka imaju i
zbirnu kolonu.
Grafiko prikazivanje statistikih nizova
Statistiki nizovi se mogu prikazati
pomou razliitih vrsta grafikona.
Grafikoni se dijele na
- Piktograme ili tokaste dijagrame,
- Povrinske dijagrame,
- Linijske dijagrame i
- Prostorne ili 3D dijagrame.
Tokasti dijagram ili piktogram
Podaci o prodanim garniturama
namjetaja
15 20 25 30 35 40 45 50 55 60 65
Dnevna prodaja
Dvostruki stupci
Roeni i umrli u Federaciji BiH, prosinac 2007.
0
50
100
150
200
250
300
350
400
1 2 3 4 5 6 7 8 9 10
Kanton / upanija
F
r
e
k
v
e
n
c
i
j
e
Roeni
Umrli
Razdijeljeni stupci
Noenja turista u Federaciji BiH u 2007. godini
0%
20%
40%
60%
80%
100%
H
o
t
e
l
i
M
o
t
e
l
i
P
a
n
s
i
o
n
i
K
u

a
n
s
t
v
a
O
s
t
a
l
o
U
k
u
p
n
o
S
t
r
u
k
t
u
r
a

t
u
r
i
s
t
a
Strani
Domai
Histogram
Nepismeno stanovnitvo preko 10 godina starosti u
BiH po popisu 1991.
0
10000
20000
30000
40000
50000
60000
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80
Godi ne starosti
K
o
r
i
g
i
r
a
n
e

f
r
e
k
v
e
n
c
i
j
e
Strukturni krug
Registrirana vozila u Federaciji BiH 2007. godine prema
starosti
do 1 god
1 - 2
3 - 5
6 - 10
11 - 15
vie od 15
Linijski dijagram-poligon frekvencija
Sklopljeni brakovi u Bosni i Hercegovini u 2006.
godini
0
2.000
4.000
6.000
8.000
10.000
0 10 20 30 40 50 60 70
Starost nevjeste
K
o
r
i
g
i
r
a
n
e

f
r
e
k
v
e
n
c
i
j
e
Kumulanta
Funkcija distribucije sklopljenih brakova u Bosni i
Hercegovini 2006. godine
0,00
0,20
0,40
0,60
0,80
1,00
1,20
10 15 20 25 30 35 40 45 50 55 60 65 70
Starost nevjeste
K
u
m
u
l
a
t
i
v
n
e

f
r
e
k
v
e
n
c
i
j
e
Kumulanta
Kuanstva u BiH prema broju lanova po popisu iz 1991.
0
200.000
400.000
600.000
800.000
1.000.000
1.200.000
1.400.000
0 1 2 3 4 5 6 7 8 9 10
Broj lanova
K
u
m
u
l
a
t
i
v
n
e

f
r
e
k
v
e
n
c
i
j
e
Prostorni ili 3D dijagram
H
o
t
e
l
i
M
o
t
e
l
i
P
a
n
s
i
o
n
i
K
u

a
n
s
t
v
a
O
s
t
a
l
o
Domai
Strani
Ukupno
0
100.000
200.000
300.000
400.000
500.000
600.000
700.000
B
r
o
j

n
o

e
n
j
a
Noenja turista u F BiH u 2007. g. prema vrstama objekta
Domai
Strani
Ukupno
Analiza statistikih nizova
Skupine mjera u analizi statistikih nizova
- srednje vrijednosti
- mjere disperzije podataka
- mjere asimetrije podataka
- mjere razvuenosti podataka po brojnoj osi
ili mjere zaobljenosti modalnog vrha
Srednje vrijednosti
Srednje vrijednosti su konstante kojima se
predouju nizovi varijabilnih podataka. One
pokazuju tendenciju koncentracije podataka pa se
jo zovu i mjere centralne tendencije.
Dijele se na potpune i poloajne.
Analiza statistikih nizova
Potpune srednje vrijednosti se
izraunavaju na temelju svih podataka, a
najvanije su aritmetika, geometrijska i
harmonijska sredina.
Poloajne srednje vrijednosti se odreuju
prema poloaju u nizu, sukladno definiciji
srednje vrijednosti. To moe biti jedan
modalitet obiljeja ili vrijednost koja se
izrauna pomou manjeg broja podataka.
Poloajne srednje vrijednosti su mod i
medijan.
Aritmetika sredina
Aritmetika sredina je prosjena
vrijednost numerike varijable.
Za negrupirane podatke izraunava se
prosta ili jednostavna aritmetika sredina
N
x
N
x x x
x
N
i
i
N

=
=
+ + +
=
1 2 1
...
Aritmetika sredina
Za grupirane podatke izraunava se
vagana ili ponderirana aritmetika
sredina

=
=
=
= =
+ + +
+ + +
=
k
i
i i k
i
i
k
i
i i
k
k k
x f
N
f
x f
f f f
x f x f x f
x
1
1
1
2 1
2 2 1 1
1
...
....
Aritmetika sredina
Karakteristike aritmetike sredine su:
Svaki numeriki niz podataka ima aritmetiku
sredinu.
Za izraunavanje aritmetike sredine koriste se svi
podaci numerikog niza.
Numeriki niz ima samo jednu aritmetiku sredinu.
Aritmetika sredina se uvijek nalazi izmeu
najmanje i najvee vrijednosti u nizu, .
Ako su sve vrijednosti u nizu jednake nekoj
konstanti, onda je i aritmetika sredina jednaka toj
konstanti,
Zbroj odstupanja vrijednosti numerikog obiljeja
od aritmetike sredine jednak je nuli.
Zbroj kvadrata odstupanja pojedinanih vrijednosti
numerikog obiljeja od aritmetike sredine je
minimalan.
Geometrijska sredina
Geometrijska sredina N vrijednosti
numerike varijable X se definira kao N-ti
korijen iz produkta njezinih vrijednosti i
oznaava se sa G. Izraz za izraunavanje
je:
N
N
i
i
N
N i
x x x x x G
[
=
= =
1
2 1
... ...

=
=
N
i
i
x
N
G
1
log
1
log
Geometrijska sredina
Ako su podaci grupirani, geometrijska
sredinu distribucije frekvencija se rauna
kao ponderirana sredina pomou formule:
N
k
i
f
i
N
f
k
f
i
f f
i k i
x x x x x G
[
=
= =
1
2 1
... ...
2 1

=
=
k
i
i i
x f
N
G
1
log
1
log
Geometrijska sredina
Karakteristike geometrijske sredine su:
Geometrijska sredina se nalazi izmeu
najvee i najmanje vrijednosti obiljeja,
Ako su sve vrijednosti obiljeja jednake
nekoj konstanti, onda je i geometrijska
sredina jednaka toj konstanti,
Produkt omjera geometrijske sredine i
vrijednosti obiljeja manjih od
geometrijske sredine jednak je produktu
omjera veih vrijednosti obiljeja i
geometrijske sredine.
Harmonijska sredina
Harmonijska sredina je reciprona
vrijednost aritmetike sredine recipronih
vrijednosti obiljeja. Za negrupirane
podatke rauna se prosta harmonijska
sredina prema izrazu:

=
=
+ + + + +
=
N
i
i
N i
x
N
x x x x
N
H
1 2 1
1
1
...
1
...
1 1
Harmonijska sredina
a za grupirane podatke se rauna
ponderirana harmonijska sredina
prema izrazu:

=
=
=
+ + + + +
+ + + + +
=
k
i
i
i
k
i
i
k
k
i
i
k i
x
f
f
x
f
x
f
x
f
x
f
f f f f
H
1
1
2
2
1
1
2 1
... ...
... ...
Harmonijska sredina
Harmonijsku sredinu ima smisla raunati
samo za obiljeja ije su sve vrijednosti
vee od nule. Ima svojstva srednje
vrijednosti, ali njezino tumaenje nije
jednostavno.
Koristi se uglavnom kao prosjena
vrijednost izvedenih podataka prikazanih
kao reciprone vrijednosti. Primjer
izvedenih podataka kod kojih se koristi
harmonijska sredina kao srednja
vrijednost jesu relativni brojevi
koordinacije s jednakim brojnicima.
Momenti numerikog niza
Moment r-tog reda oko broja a se
definira kao aritmetika sredina odstupanja
numerike varijable od zadanog broja a,
podignute na r-tu potenciju. Izraz za
momente je:
( )

=
=
N
i
r
i r
a x
N
m
1
1
Momenti numerikog niza
Za vrijednost broja a kod
izraunavanja momenata obino se
uzima vrijednost 0 (nula), pa se
takvi momenti zovu momenti oko
nule ili pomoni momenti;
ili vrijednost aritmetike sredine, pa
se takvi momenti zovu momenti oko
sredine ili centralni momenti.
Momenti numerikog niza
Momenti oko nule se oznaavaju sa m
r
a
raunaju se za negrupirane i grupirane
podatke pomou izraza:
Prvi moment oko nule je aritmetika
sredina, a ostali momenti oko nule nisu kao
takvi pokazatelji u analizi numerikog niza
ve se koriste za jednostavnije
izraunavanje momenata oko sredine, pa
se zbog toga i nazivaju pomoni momenti.

=
=
N
i
r
i r
x
N
m
1
1

=
=
N
i
r
i i r
x f
N
m
1
1
Momenti numerikog niza
Momenti oko sredine se uobiajeno oznaavaju sa M
r
,
a izraunavaju se za negrupirane i grupirane podatke
prema izrazima:
Prvi moment oko sredine je jednak nuli, zbog svojstva
aritmetike sredine da je zbroj odstupanja vrijednosti
numerikog obiljeja od aritmetike sredine jednak
nuli.
Drugi moment oko sredine slui za mjerenje disperzije
podataka, trei moment za mjerenje simetrinosti
podataka, a etvrti moment za mjerenje zaobljenosti
distribucije.
( )

=
=
N
i
r
i r
x x
N
M
1
1
( )

=
=
N
i
r
i i r
x x f
N
M
1
1
Momenti numerikog niza
U statistikoj analizi se koriste momenti drugog
(za mjerenje disperzije), treeg (za mjerenje
simetrinosti) i etvrtog reda (za mjerenje
razvuenosti podataka),
Momenti oko sredine mogu se odrediti
koritenjem pomonih momenata. Odgovarajui
izrazi za drugi, trei i etvrti moment oko
sredine su:
4
1 2
2
1 3 1 4 4
3
1 2 1 3 3
2
1 2 2
3 6 4
2 3
m m m m m m M
m m m m M
m m M
+ =
+ =
=
Mod
Mod je najea vrijednost
kvantitativne ili kvalitativne
varijable.
To je vrijednost u nizu koja se javlja
najvei broj puta
Ako su podaci grupirani, to je
modalitet sa najveom frekvencijom
Mod
Ako je grupiranje provedeno s razredima, onda
se pomou frekvencija odreuje modalni
razred, a vrijednost moda se aproksimira
pomou izraza:
Ako su razredi iste veliine koriste se originalne
frekvencije (apsolutne ili relativne), a ako su
razredi razliite veliine koriste se korigirane
frekvencije.
( )
( ) ( )
i
c b a b
a b
L Mo
+

+ =
1
Mod
Mod ima sljedea svojstva:
Mod se moe odrediti za svaku vrstu statistikog
niza.
Svaki niz podataka ne mora imati mod. Ako su
sve vrijednosti obiljeja razliite, niz nema mod.
Jedan statistiki niz moe imati jedan ili vie
modova, pa se kae da se radi o unimodalnoj ili o
multimodalnoj distribuciji.
Kod numerikih nizova mod se nalazi izmeu
najvee i najmanje vrijednosti obiljeja, s tim to
moe biti i jednak najveoj vrijednosti obiljeja,
odnosno najmanjoj vrijednosti obiljeja ak i onda
kada nisu sve vrijednosti u nizu jednake.
Grafiko odreivanje moda
Sklopljeni brakovi u BiH 2006. godine
0
2.000
4.000
6.000
8.000
10.000
10 15 20 25 30 35 40 45 50 55 60 65
Starost nevjeste
K
o
r
i
g
i
r
a
n
e

f
r
e
k
v
e
n
c
i
j
e
Mo
Medijan
Medijan je ona vrijednost obiljeja koja niz
ureen po veliini dijeli na dva jednakobrojna
dijela.
Postupak odreivanja medijana poinje
utvrivanjem rednog broja podatka ija
vrijednost predstavlja medijalnu vrijednost.
Ako je broj podataka neparan redni broj
medijalnog podatka je:
1
2
+ =
N
INT r
r
x Me =
Medijan
Ako je broj podataka paran,
medijan je poluzbroj dva sredinja
podatka u nizu. Redni broj prvog
podatka je:
2
N
r =
2
1 +
+
=
r r
x x
Me
Medijan
U distribuciji frekvencija s
razredima prvo se odredi medijalni
razred, a to je onaj ija kumulativna
frekvencija prvi put ukljuuje
vrijednost N/2.
i
f
f
N
L Me
med

+ =
1
1
2
Grafiko odreivanje medijana
Kumulativna distribucija sklopljenih brakova u BiH
2006. godine
0
0,2
0,4
0,6
0,8
1
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70
Starost nevjeste
K
u
m
u
l
a
t
i
v
n
e

r
e
l
a
t
i
v
n
e

f
r
e
k
v
e
n
c
i
j
e
Me
Kvantili
Vrijednosti numerike varijable ili modaliteti rang-
varijable koji niz podataka ureen po veliini dijele
na odreeni broj dijelova, r dijelova, zovu se
kvantili.
Broj dijelova r predstavlja red kvantila. U statistikoj
analizi se koriste kvantili etvrtog reda i zovu se
kvartili, kvantili desetog reda ili decili i kvantili
stotog reda ili percentili.
Broj kvartila je za jedan manji od njegovog reda, pa
tako imaju tri kvartila, devet decila i devedeset
devet percentila. Naini odreivanja kvantila su
analogni onima za odreivanje medijana.
Od kvantila u statistikoj analizi se najvie koriste
kvartili. Kvartila imaju tri i to prvi kvartil Q
1
, drugi
kvartil Q
2
(ili medijan) i trei kvartil Q
3
.
Kvartili
Za prvi ili donji kvartil, redni broj podatka ija
vrijednost obiljeja predstavlja kvartilnu
vrijednost odreuje se prema vrijednosti N/4.
Ako N/4 nije cjelobrojna vrijednost, redni broj
broj prvog kvartila je:
Ako je N/4 cjelobrojna vrijednost redni broj
donjeg kvartila je:
1
4
+ =
N
INT r
r
x Q =
1
4
N
r =
2
1
1
+
+
=
r r
x x
Q
Kvartili
Za podatke grupirane u razrede
kvartilni razred je onaj ija
kumulativna frekvencija prvi put
ukljuuje veliinu N/4. Vrijednost
kvartila se aproksimira izrazom:
i
f
f
N
L Q
k

+ =

var
1
1 1
4
Kvartili
Za trei ili gornji kvartil, redni broj podatka ija
vrijednost obiljeja predstavlja kvartilnu
vrijednost odreuje se prema vrijednosti 3N/4.
Ako 3N/4 nije cjelobrojna vrijednost, redni broj
broj treeg kvartila je:
Ako je 3N/4 cjelobrojna vrijednost, redni
broj gornjeg kvartila je:
1
4
3
+ =
N
INT r r
x Q =
3
4
3N
r =
2
1
3
+
+
=
r r
x x
Q
Kvartili
Za podatke grupirane u razrede kvartilni
razred je onaj ija kumulativna frekvencija
prvi put ukljuuje veliinu 3N/4. Vrijednost
kvartila se aproksimira izrazom:
i
f
f
N
L Q
k

+ =

var
1
1 3
4
3
MJ ERENE DISPERZIJ E PODATAKA
Mjere disperzije su brojani pokazatelji kojima se
opisuje stupanj varijabilnosti statistikih
podataka.
Za mjerenje disperzije koristi se vie pokazatelja,
koji mogu biti apsolutni ili relativni. Apsolutne
mjere iskazuju disperziju u mjernim jedinicama
promatranog obiljeja, a relativnim mjerama
disperzija je iskazana u postotcima ili nekim
drugim relativnim brojevima.
Prema broju podataka koji se koriste kod
raunanja odreenog pokazatelja, razlikuju se
potpune i nepotpune mjere disperzije.
MJ ERENE DISPERZIJ E PODATAKA
Od nepotpunih mjera u statistikoj analizi se
koriste raspon varijacije, interkvartil i
koeficijent kvartilne devijacije
a od potpunih mjera se koriste srednje
apsolutno odstupanje, varijanca, standardna
devijacija i koeficijent varijacije.
Raspon varijacije je najjednostavnija mjera
disperzije, a predstavlja razliku izmeu najvee
i najmanje vrijednosti u nizu kvantitativnih
podataka:
min max
x x R =
MJ ERENE DISPERZIJ E PODATAKA
Interkvartil je raspon varijacija sredinjih
pedeset posto lanova niza ureenih podataka.
Dobiva se kao razlika gornjeg i donjeg kvartila:
Koeficijent kvartilne devijacije je relativna
mjera disperzije koja se izraunava pomou
kvartila. Dobiva se kao omjer interkvartila i
zbroja kvartila:
1 3
Q Q I
Q
=
1 3
1 3
Q Q
Q Q
V
Q
+

=
MJ ERENE DISPERZIJ E PODATAKA
Mjera koja polazi od apsolutnih vrijednosti
odstupanja podataka od aritmetike sredine
poznata je pod nazivom prosjeno apsolutno
odstupanje, oznaava se sa MAD (skraenica
od engleskog naziva ove mjere, Mean Absolute
Deviation). Za negrupirane i grupirane podatke
izraunava se prema izrazima:

=
=
N
i
i
x x
N
MAD
1
1

=
=
k
i
i i
x x f
N
MAD
1
1
MJ ERENE DISPERZIJ E PODATAKA
Prosjeno apsolutno odstupanje esto se rauna
kao odstupanje podataka od medijana, zbog
svojstva da je zbroj odstupanja vrijednosti
numerike varijable od medijana minimalan.
Izrazi za njegovo raunanje, za negrupirane i
grupirane podatke su:

=
=
N
i
i
Me x
N
MAD
1
1

=
=
k
i
i i
Me x f
N
MAD
1
1
MJ ERENE DISPERZIJ E PODATAKA
Varijanca je aritmetika sredina kvadrata
odstupanja numerike varijable od njezine
aritmetike sredine, a rauna se pomou izraza
(za negrupirane i grupirane podatke):
Kod raunanja varijance ee se koristi izraz u
tzv. razvijenom obliku koji glasi (za
negrupirane i grupirane podatke):
( )

=
=
N
i
i
x x
N
s
1
2
2
1
( )

=
=
k
i
i i
x x f
N
s
1
2
2
1
2
1 1
2 2
1 1

= =
|
.
|

\
|
=
N
i
N
i
i i
x
N
x
N
s
2
1 1
2 2
1 1

= =
|
.
|

\
|
=
k
i
k
i
i i i i
x f
N
x f
N
s
MJ ERENE DISPERZIJ E PODATAKA
Standardna devijacija se tumai kao
prosjeno odstupanje vrijednosti numerike
varijable od njezine aritmetike sredine. Izrazi
za raunanje standardne devijacije izvedeni su
iz izraza za varijancu. Dobiva se kao pozitivni
drugi korijen iz varijance.
Koeficijent varijacije predstavlja omjer
standardne devijacije i aritmetike sredine
podataka pomnoen sa 100. Izraz za koeficijent
varijacije je:
100 =
x
s
V
Standardizirana varijabla
Standardizirana varijabla predstavlja odstupanja
vrijednosti numerike varijable od aritmetike
sredine izraena u jedinicama standardnih devijacija.
Izraunava se pomou izraza:
Vrijednost standardizirane varijable moe biti
pozitivna ili negativna
Aritmetika sredina distribucije frekvencija
standardizirane varijable jednaka je nuli, a
standardna devijacija je jednaka jedan.
Pravilo ebieva najmanja proporcija podataka
obuhvaena intervalom iznosi
s
x x
z
i
i

=
ks x
|
.
|

\
|

2
1
1
k
1 > k
Standardizirana varijabla
Prema navedenom pravilu u intervalu nalazi
se 75% podataka, u intervalu nalazi se
88,89% podataka, u intervalu nalazi se
93,75% podataka, a u intervalu ima 96%
podataka. Dakle, 96% lanova bilo kojeg niza
standardiziranih vrijednosti imat e vrijednost od -5
do +5.
Prema pravilima normalne distribucije u intervalu
nalazi se 68,26% podataka, u intervalu
ima 95,44%, a u intervalu ima 99,73%
podataka. Znai, gotovo svi podaci simetrine
distribucije imaju vrijednost standardizirane
varijable u intervalu od -3 do +3.
s x 2
s x 3
s x 4
s x 5
s x
s x 2
s x 3
Mjetrenje simetrinosti podataka
Najvaniji pokazatelji asimetrinosti rasporeda
podataka su koeficijent asimetrije, Pearson-ov i
Bowley-ev koeficijent asimetrije.
Koeficijent asimetrije - K predstavlja omjer
treeg momenta oko sredine i standardne devijacije
podignute na treu potenciju.
Trei moment oko sredine za negrupirane podatke i
za distribuciju frekvencija se dobivaju prema
izrazima:
( )

=
=
N
i
i
x x
N
M
1
3
3
1
( )

=
=
k
i
i i
x x f
N
M
1
3
3
1
3
3
s
M
K =
Mjerenje simetrinosti podataka
Pearson-ov koeficijent asimetrije temelji se
na poloaju srednjih vrijednosti numerike
varijable.
Bowley-ev koeficijent asimetrije temelji se
na odnosu kvartila i medijana
( )
s
Me x
K
s

=
3
( )
s
Mo x
K
s

=
1 3
3 1
2
Q Q
Me Q Q
K
Q

+
=
Simetrina distribucija
Vrijednost obiljeja
F
r
e
k
v
e
n
c
i
j
e
x=Me=Mo
Asimetrine distribucije
Vrijednost obiljeja
F
r
e
k
v
e
n
c
i
j
a
Mo<Me<x
Vrijednost obiljeja
F
r
e
k
v
e
n
c
i
j
e
x<Me<Mo
Mjerenje zaobljenosti distribucije
Zaobljenost modalnog vrha distribucije mjeri se
koeficijentom zaobljenosti. Koeficijent
zaobljenosti - E dobiva se kao omjer etvrtog
momenta oko sredine i standardne devijacije
dignute na etvrtu potenciju, to jest:
A etvrti moment oko sredine za negrupirane i
grupirane podatke je:
4
4
s
M
E =
( )

=
=
N
i
i
x x
N
M
1
4
4
1
( )

=
=
k
i
i i
x x f
N
M
1
4
4
1

You might also like