Professional Documents
Culture Documents
Osnove Statistike-Statisticki Nizovi
Osnove Statistike-Statisticki Nizovi
a
n
s
t
v
a
O
s
t
a
l
o
U
k
u
p
n
o
S
t
r
u
k
t
u
r
a
t
u
r
i
s
t
a
Strani
Domai
Histogram
Nepismeno stanovnitvo preko 10 godina starosti u
BiH po popisu 1991.
0
10000
20000
30000
40000
50000
60000
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80
Godi ne starosti
K
o
r
i
g
i
r
a
n
e
f
r
e
k
v
e
n
c
i
j
e
Strukturni krug
Registrirana vozila u Federaciji BiH 2007. godine prema
starosti
do 1 god
1 - 2
3 - 5
6 - 10
11 - 15
vie od 15
Linijski dijagram-poligon frekvencija
Sklopljeni brakovi u Bosni i Hercegovini u 2006.
godini
0
2.000
4.000
6.000
8.000
10.000
0 10 20 30 40 50 60 70
Starost nevjeste
K
o
r
i
g
i
r
a
n
e
f
r
e
k
v
e
n
c
i
j
e
Kumulanta
Funkcija distribucije sklopljenih brakova u Bosni i
Hercegovini 2006. godine
0,00
0,20
0,40
0,60
0,80
1,00
1,20
10 15 20 25 30 35 40 45 50 55 60 65 70
Starost nevjeste
K
u
m
u
l
a
t
i
v
n
e
f
r
e
k
v
e
n
c
i
j
e
Kumulanta
Kuanstva u BiH prema broju lanova po popisu iz 1991.
0
200.000
400.000
600.000
800.000
1.000.000
1.200.000
1.400.000
0 1 2 3 4 5 6 7 8 9 10
Broj lanova
K
u
m
u
l
a
t
i
v
n
e
f
r
e
k
v
e
n
c
i
j
e
Prostorni ili 3D dijagram
H
o
t
e
l
i
M
o
t
e
l
i
P
a
n
s
i
o
n
i
K
u
a
n
s
t
v
a
O
s
t
a
l
o
Domai
Strani
Ukupno
0
100.000
200.000
300.000
400.000
500.000
600.000
700.000
B
r
o
j
n
o
e
n
j
a
Noenja turista u F BiH u 2007. g. prema vrstama objekta
Domai
Strani
Ukupno
Analiza statistikih nizova
Skupine mjera u analizi statistikih nizova
- srednje vrijednosti
- mjere disperzije podataka
- mjere asimetrije podataka
- mjere razvuenosti podataka po brojnoj osi
ili mjere zaobljenosti modalnog vrha
Srednje vrijednosti
Srednje vrijednosti su konstante kojima se
predouju nizovi varijabilnih podataka. One
pokazuju tendenciju koncentracije podataka pa se
jo zovu i mjere centralne tendencije.
Dijele se na potpune i poloajne.
Analiza statistikih nizova
Potpune srednje vrijednosti se
izraunavaju na temelju svih podataka, a
najvanije su aritmetika, geometrijska i
harmonijska sredina.
Poloajne srednje vrijednosti se odreuju
prema poloaju u nizu, sukladno definiciji
srednje vrijednosti. To moe biti jedan
modalitet obiljeja ili vrijednost koja se
izrauna pomou manjeg broja podataka.
Poloajne srednje vrijednosti su mod i
medijan.
Aritmetika sredina
Aritmetika sredina je prosjena
vrijednost numerike varijable.
Za negrupirane podatke izraunava se
prosta ili jednostavna aritmetika sredina
N
x
N
x x x
x
N
i
i
N
=
=
+ + +
=
1 2 1
...
Aritmetika sredina
Za grupirane podatke izraunava se
vagana ili ponderirana aritmetika
sredina
=
=
=
= =
+ + +
+ + +
=
k
i
i i k
i
i
k
i
i i
k
k k
x f
N
f
x f
f f f
x f x f x f
x
1
1
1
2 1
2 2 1 1
1
...
....
Aritmetika sredina
Karakteristike aritmetike sredine su:
Svaki numeriki niz podataka ima aritmetiku
sredinu.
Za izraunavanje aritmetike sredine koriste se svi
podaci numerikog niza.
Numeriki niz ima samo jednu aritmetiku sredinu.
Aritmetika sredina se uvijek nalazi izmeu
najmanje i najvee vrijednosti u nizu, .
Ako su sve vrijednosti u nizu jednake nekoj
konstanti, onda je i aritmetika sredina jednaka toj
konstanti,
Zbroj odstupanja vrijednosti numerikog obiljeja
od aritmetike sredine jednak je nuli.
Zbroj kvadrata odstupanja pojedinanih vrijednosti
numerikog obiljeja od aritmetike sredine je
minimalan.
Geometrijska sredina
Geometrijska sredina N vrijednosti
numerike varijable X se definira kao N-ti
korijen iz produkta njezinih vrijednosti i
oznaava se sa G. Izraz za izraunavanje
je:
N
N
i
i
N
N i
x x x x x G
[
=
= =
1
2 1
... ...
=
=
N
i
i
x
N
G
1
log
1
log
Geometrijska sredina
Ako su podaci grupirani, geometrijska
sredinu distribucije frekvencija se rauna
kao ponderirana sredina pomou formule:
N
k
i
f
i
N
f
k
f
i
f f
i k i
x x x x x G
[
=
= =
1
2 1
... ...
2 1
=
=
k
i
i i
x f
N
G
1
log
1
log
Geometrijska sredina
Karakteristike geometrijske sredine su:
Geometrijska sredina se nalazi izmeu
najvee i najmanje vrijednosti obiljeja,
Ako su sve vrijednosti obiljeja jednake
nekoj konstanti, onda je i geometrijska
sredina jednaka toj konstanti,
Produkt omjera geometrijske sredine i
vrijednosti obiljeja manjih od
geometrijske sredine jednak je produktu
omjera veih vrijednosti obiljeja i
geometrijske sredine.
Harmonijska sredina
Harmonijska sredina je reciprona
vrijednost aritmetike sredine recipronih
vrijednosti obiljeja. Za negrupirane
podatke rauna se prosta harmonijska
sredina prema izrazu:
=
=
+ + + + +
=
N
i
i
N i
x
N
x x x x
N
H
1 2 1
1
1
...
1
...
1 1
Harmonijska sredina
a za grupirane podatke se rauna
ponderirana harmonijska sredina
prema izrazu:
=
=
=
+ + + + +
+ + + + +
=
k
i
i
i
k
i
i
k
k
i
i
k i
x
f
f
x
f
x
f
x
f
x
f
f f f f
H
1
1
2
2
1
1
2 1
... ...
... ...
Harmonijska sredina
Harmonijsku sredinu ima smisla raunati
samo za obiljeja ije su sve vrijednosti
vee od nule. Ima svojstva srednje
vrijednosti, ali njezino tumaenje nije
jednostavno.
Koristi se uglavnom kao prosjena
vrijednost izvedenih podataka prikazanih
kao reciprone vrijednosti. Primjer
izvedenih podataka kod kojih se koristi
harmonijska sredina kao srednja
vrijednost jesu relativni brojevi
koordinacije s jednakim brojnicima.
Momenti numerikog niza
Moment r-tog reda oko broja a se
definira kao aritmetika sredina odstupanja
numerike varijable od zadanog broja a,
podignute na r-tu potenciju. Izraz za
momente je:
( )
=
=
N
i
r
i r
a x
N
m
1
1
Momenti numerikog niza
Za vrijednost broja a kod
izraunavanja momenata obino se
uzima vrijednost 0 (nula), pa se
takvi momenti zovu momenti oko
nule ili pomoni momenti;
ili vrijednost aritmetike sredine, pa
se takvi momenti zovu momenti oko
sredine ili centralni momenti.
Momenti numerikog niza
Momenti oko nule se oznaavaju sa m
r
a
raunaju se za negrupirane i grupirane
podatke pomou izraza:
Prvi moment oko nule je aritmetika
sredina, a ostali momenti oko nule nisu kao
takvi pokazatelji u analizi numerikog niza
ve se koriste za jednostavnije
izraunavanje momenata oko sredine, pa
se zbog toga i nazivaju pomoni momenti.
=
=
N
i
r
i r
x
N
m
1
1
=
=
N
i
r
i i r
x f
N
m
1
1
Momenti numerikog niza
Momenti oko sredine se uobiajeno oznaavaju sa M
r
,
a izraunavaju se za negrupirane i grupirane podatke
prema izrazima:
Prvi moment oko sredine je jednak nuli, zbog svojstva
aritmetike sredine da je zbroj odstupanja vrijednosti
numerikog obiljeja od aritmetike sredine jednak
nuli.
Drugi moment oko sredine slui za mjerenje disperzije
podataka, trei moment za mjerenje simetrinosti
podataka, a etvrti moment za mjerenje zaobljenosti
distribucije.
( )
=
=
N
i
r
i r
x x
N
M
1
1
( )
=
=
N
i
r
i i r
x x f
N
M
1
1
Momenti numerikog niza
U statistikoj analizi se koriste momenti drugog
(za mjerenje disperzije), treeg (za mjerenje
simetrinosti) i etvrtog reda (za mjerenje
razvuenosti podataka),
Momenti oko sredine mogu se odrediti
koritenjem pomonih momenata. Odgovarajui
izrazi za drugi, trei i etvrti moment oko
sredine su:
4
1 2
2
1 3 1 4 4
3
1 2 1 3 3
2
1 2 2
3 6 4
2 3
m m m m m m M
m m m m M
m m M
+ =
+ =
=
Mod
Mod je najea vrijednost
kvantitativne ili kvalitativne
varijable.
To je vrijednost u nizu koja se javlja
najvei broj puta
Ako su podaci grupirani, to je
modalitet sa najveom frekvencijom
Mod
Ako je grupiranje provedeno s razredima, onda
se pomou frekvencija odreuje modalni
razred, a vrijednost moda se aproksimira
pomou izraza:
Ako su razredi iste veliine koriste se originalne
frekvencije (apsolutne ili relativne), a ako su
razredi razliite veliine koriste se korigirane
frekvencije.
( )
( ) ( )
i
c b a b
a b
L Mo
+
+ =
1
Mod
Mod ima sljedea svojstva:
Mod se moe odrediti za svaku vrstu statistikog
niza.
Svaki niz podataka ne mora imati mod. Ako su
sve vrijednosti obiljeja razliite, niz nema mod.
Jedan statistiki niz moe imati jedan ili vie
modova, pa se kae da se radi o unimodalnoj ili o
multimodalnoj distribuciji.
Kod numerikih nizova mod se nalazi izmeu
najvee i najmanje vrijednosti obiljeja, s tim to
moe biti i jednak najveoj vrijednosti obiljeja,
odnosno najmanjoj vrijednosti obiljeja ak i onda
kada nisu sve vrijednosti u nizu jednake.
Grafiko odreivanje moda
Sklopljeni brakovi u BiH 2006. godine
0
2.000
4.000
6.000
8.000
10.000
10 15 20 25 30 35 40 45 50 55 60 65
Starost nevjeste
K
o
r
i
g
i
r
a
n
e
f
r
e
k
v
e
n
c
i
j
e
Mo
Medijan
Medijan je ona vrijednost obiljeja koja niz
ureen po veliini dijeli na dva jednakobrojna
dijela.
Postupak odreivanja medijana poinje
utvrivanjem rednog broja podatka ija
vrijednost predstavlja medijalnu vrijednost.
Ako je broj podataka neparan redni broj
medijalnog podatka je:
1
2
+ =
N
INT r
r
x Me =
Medijan
Ako je broj podataka paran,
medijan je poluzbroj dva sredinja
podatka u nizu. Redni broj prvog
podatka je:
2
N
r =
2
1 +
+
=
r r
x x
Me
Medijan
U distribuciji frekvencija s
razredima prvo se odredi medijalni
razred, a to je onaj ija kumulativna
frekvencija prvi put ukljuuje
vrijednost N/2.
i
f
f
N
L Me
med
+ =
1
1
2
Grafiko odreivanje medijana
Kumulativna distribucija sklopljenih brakova u BiH
2006. godine
0
0,2
0,4
0,6
0,8
1
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70
Starost nevjeste
K
u
m
u
l
a
t
i
v
n
e
r
e
l
a
t
i
v
n
e
f
r
e
k
v
e
n
c
i
j
e
Me
Kvantili
Vrijednosti numerike varijable ili modaliteti rang-
varijable koji niz podataka ureen po veliini dijele
na odreeni broj dijelova, r dijelova, zovu se
kvantili.
Broj dijelova r predstavlja red kvantila. U statistikoj
analizi se koriste kvantili etvrtog reda i zovu se
kvartili, kvantili desetog reda ili decili i kvantili
stotog reda ili percentili.
Broj kvartila je za jedan manji od njegovog reda, pa
tako imaju tri kvartila, devet decila i devedeset
devet percentila. Naini odreivanja kvantila su
analogni onima za odreivanje medijana.
Od kvantila u statistikoj analizi se najvie koriste
kvartili. Kvartila imaju tri i to prvi kvartil Q
1
, drugi
kvartil Q
2
(ili medijan) i trei kvartil Q
3
.
Kvartili
Za prvi ili donji kvartil, redni broj podatka ija
vrijednost obiljeja predstavlja kvartilnu
vrijednost odreuje se prema vrijednosti N/4.
Ako N/4 nije cjelobrojna vrijednost, redni broj
broj prvog kvartila je:
Ako je N/4 cjelobrojna vrijednost redni broj
donjeg kvartila je:
1
4
+ =
N
INT r
r
x Q =
1
4
N
r =
2
1
1
+
+
=
r r
x x
Q
Kvartili
Za podatke grupirane u razrede
kvartilni razred je onaj ija
kumulativna frekvencija prvi put
ukljuuje veliinu N/4. Vrijednost
kvartila se aproksimira izrazom:
i
f
f
N
L Q
k
+ =
var
1
1 1
4
Kvartili
Za trei ili gornji kvartil, redni broj podatka ija
vrijednost obiljeja predstavlja kvartilnu
vrijednost odreuje se prema vrijednosti 3N/4.
Ako 3N/4 nije cjelobrojna vrijednost, redni broj
broj treeg kvartila je:
Ako je 3N/4 cjelobrojna vrijednost, redni
broj gornjeg kvartila je:
1
4
3
+ =
N
INT r r
x Q =
3
4
3N
r =
2
1
3
+
+
=
r r
x x
Q
Kvartili
Za podatke grupirane u razrede kvartilni
razred je onaj ija kumulativna frekvencija
prvi put ukljuuje veliinu 3N/4. Vrijednost
kvartila se aproksimira izrazom:
i
f
f
N
L Q
k
+ =
var
1
1 3
4
3
MJ ERENE DISPERZIJ E PODATAKA
Mjere disperzije su brojani pokazatelji kojima se
opisuje stupanj varijabilnosti statistikih
podataka.
Za mjerenje disperzije koristi se vie pokazatelja,
koji mogu biti apsolutni ili relativni. Apsolutne
mjere iskazuju disperziju u mjernim jedinicama
promatranog obiljeja, a relativnim mjerama
disperzija je iskazana u postotcima ili nekim
drugim relativnim brojevima.
Prema broju podataka koji se koriste kod
raunanja odreenog pokazatelja, razlikuju se
potpune i nepotpune mjere disperzije.
MJ ERENE DISPERZIJ E PODATAKA
Od nepotpunih mjera u statistikoj analizi se
koriste raspon varijacije, interkvartil i
koeficijent kvartilne devijacije
a od potpunih mjera se koriste srednje
apsolutno odstupanje, varijanca, standardna
devijacija i koeficijent varijacije.
Raspon varijacije je najjednostavnija mjera
disperzije, a predstavlja razliku izmeu najvee
i najmanje vrijednosti u nizu kvantitativnih
podataka:
min max
x x R =
MJ ERENE DISPERZIJ E PODATAKA
Interkvartil je raspon varijacija sredinjih
pedeset posto lanova niza ureenih podataka.
Dobiva se kao razlika gornjeg i donjeg kvartila:
Koeficijent kvartilne devijacije je relativna
mjera disperzije koja se izraunava pomou
kvartila. Dobiva se kao omjer interkvartila i
zbroja kvartila:
1 3
Q Q I
Q
=
1 3
1 3
Q Q
Q Q
V
Q
+
=
MJ ERENE DISPERZIJ E PODATAKA
Mjera koja polazi od apsolutnih vrijednosti
odstupanja podataka od aritmetike sredine
poznata je pod nazivom prosjeno apsolutno
odstupanje, oznaava se sa MAD (skraenica
od engleskog naziva ove mjere, Mean Absolute
Deviation). Za negrupirane i grupirane podatke
izraunava se prema izrazima:
=
=
N
i
i
x x
N
MAD
1
1
=
=
k
i
i i
x x f
N
MAD
1
1
MJ ERENE DISPERZIJ E PODATAKA
Prosjeno apsolutno odstupanje esto se rauna
kao odstupanje podataka od medijana, zbog
svojstva da je zbroj odstupanja vrijednosti
numerike varijable od medijana minimalan.
Izrazi za njegovo raunanje, za negrupirane i
grupirane podatke su:
=
=
N
i
i
Me x
N
MAD
1
1
=
=
k
i
i i
Me x f
N
MAD
1
1
MJ ERENE DISPERZIJ E PODATAKA
Varijanca je aritmetika sredina kvadrata
odstupanja numerike varijable od njezine
aritmetike sredine, a rauna se pomou izraza
(za negrupirane i grupirane podatke):
Kod raunanja varijance ee se koristi izraz u
tzv. razvijenom obliku koji glasi (za
negrupirane i grupirane podatke):
( )
=
=
N
i
i
x x
N
s
1
2
2
1
( )
=
=
k
i
i i
x x f
N
s
1
2
2
1
2
1 1
2 2
1 1
= =
|
.
|
\
|
=
N
i
N
i
i i
x
N
x
N
s
2
1 1
2 2
1 1
= =
|
.
|
\
|
=
k
i
k
i
i i i i
x f
N
x f
N
s
MJ ERENE DISPERZIJ E PODATAKA
Standardna devijacija se tumai kao
prosjeno odstupanje vrijednosti numerike
varijable od njezine aritmetike sredine. Izrazi
za raunanje standardne devijacije izvedeni su
iz izraza za varijancu. Dobiva se kao pozitivni
drugi korijen iz varijance.
Koeficijent varijacije predstavlja omjer
standardne devijacije i aritmetike sredine
podataka pomnoen sa 100. Izraz za koeficijent
varijacije je:
100 =
x
s
V
Standardizirana varijabla
Standardizirana varijabla predstavlja odstupanja
vrijednosti numerike varijable od aritmetike
sredine izraena u jedinicama standardnih devijacija.
Izraunava se pomou izraza:
Vrijednost standardizirane varijable moe biti
pozitivna ili negativna
Aritmetika sredina distribucije frekvencija
standardizirane varijable jednaka je nuli, a
standardna devijacija je jednaka jedan.
Pravilo ebieva najmanja proporcija podataka
obuhvaena intervalom iznosi
s
x x
z
i
i
=
ks x
|
.
|
\
|
2
1
1
k
1 > k
Standardizirana varijabla
Prema navedenom pravilu u intervalu nalazi
se 75% podataka, u intervalu nalazi se
88,89% podataka, u intervalu nalazi se
93,75% podataka, a u intervalu ima 96%
podataka. Dakle, 96% lanova bilo kojeg niza
standardiziranih vrijednosti imat e vrijednost od -5
do +5.
Prema pravilima normalne distribucije u intervalu
nalazi se 68,26% podataka, u intervalu
ima 95,44%, a u intervalu ima 99,73%
podataka. Znai, gotovo svi podaci simetrine
distribucije imaju vrijednost standardizirane
varijable u intervalu od -3 do +3.
s x 2
s x 3
s x 4
s x 5
s x
s x 2
s x 3
Mjetrenje simetrinosti podataka
Najvaniji pokazatelji asimetrinosti rasporeda
podataka su koeficijent asimetrije, Pearson-ov i
Bowley-ev koeficijent asimetrije.
Koeficijent asimetrije - K predstavlja omjer
treeg momenta oko sredine i standardne devijacije
podignute na treu potenciju.
Trei moment oko sredine za negrupirane podatke i
za distribuciju frekvencija se dobivaju prema
izrazima:
( )
=
=
N
i
i
x x
N
M
1
3
3
1
( )
=
=
k
i
i i
x x f
N
M
1
3
3
1
3
3
s
M
K =
Mjerenje simetrinosti podataka
Pearson-ov koeficijent asimetrije temelji se
na poloaju srednjih vrijednosti numerike
varijable.
Bowley-ev koeficijent asimetrije temelji se
na odnosu kvartila i medijana
( )
s
Me x
K
s
=
3
( )
s
Mo x
K
s
=
1 3
3 1
2
Q Q
Me Q Q
K
Q
+
=
Simetrina distribucija
Vrijednost obiljeja
F
r
e
k
v
e
n
c
i
j
e
x=Me=Mo
Asimetrine distribucije
Vrijednost obiljeja
F
r
e
k
v
e
n
c
i
j
a
Mo<Me<x
Vrijednost obiljeja
F
r
e
k
v
e
n
c
i
j
e
x<Me<Mo
Mjerenje zaobljenosti distribucije
Zaobljenost modalnog vrha distribucije mjeri se
koeficijentom zaobljenosti. Koeficijent
zaobljenosti - E dobiva se kao omjer etvrtog
momenta oko sredine i standardne devijacije
dignute na etvrtu potenciju, to jest:
A etvrti moment oko sredine za negrupirane i
grupirane podatke je:
4
4
s
M
E =
( )
=
=
N
i
i
x x
N
M
1
4
4
1
( )
=
=
k
i
i i
x x f
N
M
1
4
4
1