Download as pdf or txt
Download as pdf or txt
You are on page 1of 138

Statistika analiza

1. OSNOVE DESKRIPTIVNE I INFERENCIJALNE STATISTIKE

Elektronski udbenik s uputama o koritenju programa STATISTICA dostupan je na


web stranicama www.statsoft.com. Za poetak potrebno je ponoviti osnove deskriptivne
i inferencijalne statistike upotrebom programskog paketa STATISTICA.

Pokretanjem programa STATISTICA verzija 7.0 pojavljuje se prazan radni list


Spreadsheet1 s 10 stupaca i 10 redaka (10v by 10c). Svaki stupac predstavlja jednu
varijablu (engl. variable): Var1, Var2, Var3, ..., Var10. Svaki redak predstavlja jedno
opaanje ili sluaj (engl. case) kao to je prikazano na slici.

U tablicu radnog lista Spreadsheet1 potrebno je unijeti podatke koji su predmet


statistike analize. Naime, unos podataka esto je sloen i dugotrajan posao. Podaci koji
e se analizirati prikupljeni su na temelju sekundarnih izvora i spremljeni su u xls
formatu. Zato je dovoljno postojeu bazu podataka importirati u program
STATISTICA. Baze podataka formirane na temelju sekundarnih izvora u praksi su
najee i dostupne u xls formatu.

Prikupljeni podaci koji e se analizirati u ovom poglavlju spremljeni su u Excel datoteci


pod nazivom Poduzeca.xls. Navedena datoteka moe se otvoriti izborom opcija File
Open [vrsta datoteke: Excel Files (*.xls)]. Nakon izbora vrste datoteke program nudi
mogunost unosa svih radnih listova unutar radne knjige ili samo jednog radnog lista.
1

Statistika analiza

Budui da se prikupljeni podaci nalaze samo u prvom radnom listu Sheet1 dovoljno je
izabrati drugu opciju Import selected sheet to a Spreadsheet i zatim oznaiti Sheet1.

U sljedeem koraku potrebno je specificirati toan raspon redaka i stupaca. Najee


program automatski prepoznaje retke i stupce u kojima se nalaze prikupljeni podaci, ali
nudi i mogunost da neke retke ili stupce izostavimo.

Unutar datoteke Poduzeca.xls podaci su obuhvaeni s 8 stupaca (Columns: from 1 to 8) i


51 retkom (Rows: from 1 to 51). Kako su u prvom retku dani nazivi varijabli tada je
potrebno aktivirati opciju Get variable names from first row kao to je prikazano na
slici.

Prikupljeni podaci se odnose na 50 poduzea ili opaanja prema 8 varijabli ili obiljeja
(8v by 50c). Promatrane varijable mogu se klasificirati na slijedei nain:
(a) Nominalne varijable: Djelatnost, Kotacija na burzi
(b) Ordinalne varijable: Ocjena rizika, Ocjena uspjenosti
(c) Numerike varijable: Prihod u mil. kn, Zaduenost, Broj zaposlenih i Ulaganje u

reklamu u tis. kn.

Statistike metode i tehnike u programu STATISTICA mogu se pokrenuti unutar


glavnog izbornika Statistics kao to je prikazano na slici.

Statistika analiza

Zadatak 1.1. Za varijablu Prihod u mil. kn izraunajte: aritmetiku sredinu, medijan,


standardnu devijaciju, koeficijent varijacije, standardnu pogreku aritmetike sredine, mjeru
asimetrije, mjeru zaobljenosti, minimum i maksimum, te donji i gornji kvartil.

Rjeenje 1.1. Navedeni parametri mogu se izraunati izborom opcija Statistics Basic
Statistics/Tables Descriptive Statistics OK.

Unutar prozora Descriptive Statistics potrebno je izabrati jednu ili vie varijabli klikom
. U ovom primjeru izabire se samo varijabla Prihod u mil. kn.
na gumb
Zatim se unutar kartice Advanced oznae samo oni parametri koje elimo izraunati,
kao to je prikazano na slici.
3

Statistika analiza

Klikom na Summary: Statistics dobiju se pokazatelji deskriptivne statistike koje je


trebalo izraunati u zadatku 1.1.

Napomena: Sve pojedine statistike procedure spremaju se unutar jedne radne knjige
Workbook1*, to se vidi iz popisa mapa (direktorija) s lijeve strane programa. Time program
korisniku olakava posao tako da iste procedure nije potrebno ponavljati. Naime, izborom
opcija File Saves as aktivna radna knjiga sprema se u obliku datoteke STATISTICA
Workbook Files (*.stw). Program nudi i mogunost spremanja radne knjige u obliku
izvjetaja STATISTICA Report Files (*.str).

Rezultate deskriptivne statistike upiite u odgovarajua polja. Objasnite znaenje


dobivenih rezultata konkretno!

Statistika analiza
X=

......................................

Q1 = .................................... Se ( x ) = ....................................

Me = ...................................... Q3 = .....................................

a3 = ....................................

Min =

4 =

Max =

....................................
....................................

=
V=

......................................

....................................

......................................

Zadatak 1.2. Prema varijabli Prihod u mil. kn formirajte distribuciju frekvencija.


Rjeenje 1.2. Ponovno pokrenite prozor deskriptivne statistike (u donjem ljevom uglu
kliknite na gumb Descriptive Statistics:...). Unutar kartice Quick izaberite Frequency tables.
Dobivene rezultate upiite u stupce 2 - 5 slijedee tablice:
Prihod u
mil. kn

Broj poduzea
(frekvencije)

Kumulativne
frekvencije

Postoci

Kumulativni
postoci

Oekivane
frekvencije

0-50
50-100
100-150
150-200
200-250
Ukupno

Ponovite proceduru formiranja distribucije frekvencija tako da izraunate teorijske


frekvencije koje se mogu oekivati kada bi distribucija frekvencija imala normalni oblik
(unutar kartice Normality prozora Descriptive Statistics potrebno je aktivirati opciju
Normal expected frequencies i ponovno kliknuti na gumb Frequency tables). Teorijske
ili tzv. oekivane frekvencije upiite u stupac 6 gore navedene tablice.

Zadatak 1.3. Empirijske (opaene) frekvencije usporedite s oekivanim (teorijskim)


frekvencijama pomou histograma. to zakljuujete? Moe li se prihvatiti nulta hipoteza da
distribucija poduzea prema ostvarenim prihodima ima normalni oblik s obzirom na mjeru
asimetrije i mjeru zaobljenosti? to pokazuje Kolmogorov-Smirnov test normalnosti?
Zakljuak donesite na temelju p-vrijednosti!

Rjeenje 1.3. Ponovno pokrenite prozor deskriptivne statistike. Unutar kartice Quick
izaberite opciju Histograms.

Statistika analiza
Histogram: Prihod u mil. kn
K-S d=,07304, p> .20; Lilliefors p> .20
Expected Normal
30

25

No. of obs.

20

15

10

-50

50

100

150

200

250

X <= Category Boundary

Kolmogorov-Smirnov test (K-S test) koristi se da bi se testirala hipoteza jeli funkcija


distribucije vjerojatnosti iz uzorka jednaka nekoj pretpostavljenoj (teorijskoj) funkciji
distribucije vjerojatnosti. Najee se ispituje jeli funkcija distribucije vjerojatnosti
normalnog oblika. Zato se po defaultu programa uvijek provodi Kolmogorov-Smirnov
test normalnosti. Test veliina se definira kao najvea okomita udaljenost izmeu
empirijske i pretpostavljene funkcije distribucije vjerojatnosti i oznaava se s malo d.
Ako je p-vrijednost vea od 5% ne moe se odbaciti nulta hipoteza da distribucija
poduzea prema ostvarenim prihodima ima normalni oblik.1

Zadatak 1.4. Medijan, minimum i maksimum, te donji i gornji kvartil za varijablu Prihod u
mil. kn prikaite grafiki koristei B-P dijagram (tzv. Box-Plot).
Rjeenje 1.4. Unutar posljednje kartice Options prozora Descriptive Statistics potrebno je
aktivirati opciju Median/Quartiles/Range. Zatim se treba vratiti na karticu Quick i izabrati
Box & Whisker plot.

Modificirani K-S test je Lillieforsov test. Lillieforsov test se takoer koristi kod testiranja normalnosti
distribucije, ali bez unaprijed specificirane sredine i varijance (standardne devijacije) iz uzorka. Oba testa spadaju
u neparametrijske testove.

Statistika analiza
Box & Whisker Plot
220
200
180
160
140
120
100
80
60
40

Median = 100,2957
25%-75%
= (70,2793, 120,6493)
Min-Max
= (10,8081, 200,016)

20
0

Prihod u mil. kn

Zadatak 1.5. Koristei Box & Whisker plot odredite intervalne granice procjene prosjenog
prihoda svih poduzea u populaciji na temelju razine pouzdanosti od 95% (procjena
aritmetike sredine osnovnoga skupa). Komentirajte Normal Probability-Plot!

Rjeenje 1.5. Unutar kartice Options prozora Descriptive Statistics aktivirajte opciju
Mean/SE/1.96*SE. Vratite se na karticu Quick i izaberite Summary: Graphs.

Statistika analiza

Osim pokazatelja deskriptivne statistike i grafikog prikaza histograma s normalnom


distribucijom, dobiven je B-P dijagram s intervalnom procjenom aritmetike sredine i N-P
dijagram (tzv. Normal Probability-Plot).
Interval procjene prosjenog prihoda poduzea je:

Pr {85, 204 < x < 105, 758} = 0,95


Pouzdanost procjene od 95% pokazuje da je udaljenost donje odnosno gornje granice od
oekivane sredine 1,96 standardiziranih vrijednosti ( Z = 1,96 ). Stoga se oekuje da e
prosjean prihod svih poduzea u populaciji biti izmeu 85,2 i 105,8 mil. kuna.

Normal Probability-Plot prikazuje raspored oekivanih standardiziranih vrijednosti prema


ostvarenim prihodima (ije su vrijednosti na osi X poredane po veliini od najmanjeg
prihoda prema najveem). Standardizirane vrijednosti pokazuju odstupanja od aritmetike
sredine izraena u standardnim devijacijama prema formuli:

Zi =

xi x

Statistika analiza
Na primjer, Z i = 1 pokazuje da je ostvareni prihod i-tog poduzea manji od prosjenog
prihoda za jednu standardnu devijaciju. Zato prihod tog poduzea iznosi 58,4 mil. kuna
( xi = x 1 = 95, 4809 37 ,0758 = 58, 4051 ). Ako je Z i = +2 znai da je ostvareni prihod itog poduzea vei od prosjenog prihoda za dvije standardne devijacije. Stoga je
xi = x + 2 = 95, 4809 + 2 37 ,0758 = 169 ,6325 mil. kuna.
Na temelju grafikog prikaza N-P dijagrama moe se zakljuiti da kumulativni raspored
standardiziranih vrijednosti prihoda slijedi pravac pod kutem od 450 to znai da distribucija
poduzea prema ostvarenim prihodima ima normalni oblik (Gaussova distribucija).

Zadatak 1.6. Pod pretpostavkom da distribucija poduzea prema ostvarenim prihodima ima
normalni oblik s aritmetikom sredinom 95,4809 i standardnom devijacijom 37,0758
izraunajte vjerojatnost da izabrano poduzee ostvaruje prihode:
(a) od 80 mil. kn ili manje,
(b) vee od 80 mil. kn i
(c) vee od 120 mil. kn.

Rjeenje 1.6. Unutar glavnog izbornika Statistics pokrenite Probability Calculator


Distributions Z(Normal). Nakon unosa tri parametra: X, mean i st.dev. kliknite Compute
da bi izraunali vjerojatnost (p). Dodatno, za izraunavanje povrine na desnom kraju
normalne krivulje potrebno je oznaiti opciju (1-Cumulative p).
(a) P ( x 80 ) = 0,338139

(b) P ( x > 80 ) = 0, 661861

Statistika analiza
(c) P ( x > 120 ) = 0, 254202

VJEBA BR. 11
(a) Za varijablu Ulaganje u reklamu u tis. kn izraunajte: aritmetiku sredinu, standardnu
devijaciju, koeficijent varijacije i interkvartil. Objasnite znaenje dobivenih rezultata
konkretno. [Statistics Basic Statistics/Tables Descriptive Statistics Variables
(Ulaganje u reklamu u tis. kn) Advanced Summary: Statistics]

x = ___________
= ___________
V = ___________
Iq = ___________
(b) Za varijablu Ulaganje u reklamu u tis. kn izraunajte granice intervalne procjene
aritmetike sredine na razini 95% pouzdanosti. Dobivene granice prikaite BoxWhiskerovim dijagramom. Na dijagramu upiite dobivene vrijednosti. [Descriptive
Statistics Options Mean/SE/1.96*SE Quick Box & Whisker plot]
Box & Whisker Plot
54

53

52

51

50

49

48

Mean = ..............
MeanSE= (..............; ...............)
Mean1,96*SE= (................; ...............)

47
Ulaganje u reklamu u tis.kn

10

Statistika analiza
(c) Izraunajte nove granice intervalne procjene aritmetike sredine na razini pouzdanosti
od 99%. to moete zakljuiti usporeujui interval procjene na razini pouzdanosti od
95% i 99%? [Descriptive Statistics Advanced Conf. Limits for means Interval: 99,00
Summary: Statistics]

Pr {............. < x < ...........} = 0 ,95


Pr {............. < x < ...........} = 0 ,99
(d) Formirajte distribuciju poduzea prema varijabli Ulaganje u reklamu u tis. kn
(vrijednosti obiljeja grupirajte u 5 razreda jednakih veliina). Objasnite znaenje tree
po redu kumulativne relativne frekvencije. Izraunajte i oekivane frekvencije kada bi
distribucija imala normalni oblik. Provedit K-S test! [Descriptive Statistics Normality
Number of intervals: 5 Normal expected frequencies Kolmogorov-Smirnov and
Liliefors test for normality Frequency tables]
Ulaganje u
reklamu
30-40
40-50
50-60
60-70
70-80
Ukupno

Broj poduzea
(frekvencije)

Kumulativne
frekvencije

------

Postoci

Kumulativni
postoci

Oekivane
frekvencije

------

Trea po redu kumulativna relativna frekvencija pokazuje __________________________


____________________________________________________________________________.
K-S test velina iznosi:___________. Na razini p-vrijednosti __________________ moe se
prihvatiti hipoteza ___________________________________________________________.
(e) Stvarne i oekivane frekvencije iz prethodnog postupka usporedite pomou histograma
(na grafikonu skicirajte odgovarajue stupce). [Descriptive Statistics Normality
Histograms]

11

Statistika analiza
Histogram: Ulaganje u reklamu u tis.k
Expected Normal
25

No. of obs.

20

15

10

0
20

30

40

50

60

70

80

X <= Category Boundary

(f) Ako se pretpostavi da distribucija poduzea prema ulaganjima u reklamu ima noramalni
oblik koliko iznosi vjerojatnost da e izabrano poduzea uloiti u reklamu: (a) vie od 60
tisua kuna, (b) 60 ili manje od 60 tisua kuna, (c) vie od 40 tisua kuna i (d) izmeu 40
i 60 tisua kuna? Skicirajte slike! [Statistics Probability Calculator Distributions
Z (Normal ) X:..., mean: ...., st.dev: ..... Compute]
(a) P ( x > 60 ) = .............

(b) P ( x 60 ) = ..............

(c) P ( x > 40 ) = .............

(d) P ( 40 < x 60 ) = .............

(g) Moe li se kao istinita prihvatiti hipoteza da prosjeno ulaganje u reklamu svih
poduzea u osvnom skupu iznosi: (a) 50 tisua kuna i (b) 60 tisua kuna. Postavite
odgovarajue hipoteze i provedite testiranje. [Statistics Basic Statistics/Tables t
test, single sample OK Variables (Ulaganje u reklamu u tis. kn) Reference
values (test all mean against: 50 / 60) Summary: T-tests]
12

Statistika analiza
(a)

(b)

H 0 : ...

H 0 : ...

H1 : ...

H1 : ...

t=

.....................

......................

= 0 ,365439

t=

................................

.....................

......................

= ...................

................................

df =
p=

df =
p=

Moe se prihvatiti hipoteza __________ Moe se prihvatiti hipoteza __________

(h) Moe li se kao istinita prihvatiti nulta hipoteza da ne postoji statistiki znaajne razlike
u ulaganjima u reklame izmeu poduzea s obzirom na kotaciju na burzi? Zakljuak
donesite na temelju empirijske razine signifikantnosti (odredite empirijsku razinu
signifikantnosti i pomou kalkulatora vjerojatnosti ispod povrine Studentove tdistribucije za dobivenu vrijednost t-testa i stupnjeve slobode df). [Basic Statistics/Tables
ttest, independent, by groups OK Variables (Dependent: Ulaganje u reklamu u
tis. kn, Grouping: Kotacija na burzi ) Summary: T-tests]; [Statistics Probability
Calculator Distributions t (Student) Two-tailed (1-Cumulative p) t:...,
df:... Compute]

H 0 : ...
H1 : ...
t=

.....................

......................

= 2 , 06964

................................

df =
p=
Moe se prihvatiti hipoteza __________

(i) Moe li se kao istinita prihvatiti hipoteza da ne postoji statistiki znaajne razlike u
ulaganjima u reklame izmeu poduzea koja se bave trgovinom u odnosu na poduzea
koja se bave proizvodnjom? Provedite dvosmjerni i jednosmjerni test! Prije provedbe
odgovarajuih testova izraunajte pokazatelje M (sredina), StDv (standardna devijacija) i
N (broj poduzea u svakoj grupi) s obzirom na djelatnost. [Statistics Basic
Statistics/Tables Descriptive Statistics Variables (Ulaganje u reklamu u tis. kn)
13

Statistika analiza
Advanced By Group... Grouping variables (Djelatnost) OK Summary:
Statistics]; [Basic Statistics/Tables Difference tests: r, %, means OK M 1:..., M
2:..., StDv 1:..., StDv 2:..., N1:..., N2:... Two-sided / One-sided Compute]
(a) Dvosmjerni test

H 0 : ...
H1 : ...

Moe se prihvatiti hipoteza ____________


(b) Jednosmjerni test

H 0 : ...
H1 : ...

Moe se prihvatiti hipoteza ____________


(j) Formirajte dvodimenzionalnu distribuciju poduzea s obzirom na djelatnost i kotaciju
na burzi. [Basic Statistics/Tables Multiple response tables OK Specify table
(select variables) Set 1: 3, Set 2: 4 OKOK Summary: Review summary tables]
Djelatnost

Kotacija na burzi
ne
da

Ukupno

trgovina
proizvodnja
usluge
Ukupno

14

Statistika analiza
2. ANALIZA VARIJANCE (Analysis of Variance)

Analiza varijance se upotrebljava kada se eli testirati postoji li znaajna razlika izmeu
aritmetikih sredina tri ili vie osnovnih skupova, odnosno jeli promatrani uzorci
pripadaju istoj populaciji.

Najee je u primjeni analiza varijance s jednim promjenjivim faktorom (One-Way


ANOVA) i analiza varijance s dva promjenjiva faktora (Two-Way ANOVA).

Kod analize varijance polazi se od slijedeih pretpostavki:


(a)
(b)
(c)
(d)

Populacije iz kojih uzorci potjeu jesu normalno distribuirane


Uzorci su nezavisni (osim ako se npr. ne radi o ponovljenim mjerenjima)
Varijance osnovnih skupova su jednake (pretpostavka homogenosti)
Uzorci su jednakih veliina2

2.1. ANALIZA VARIJANCE S JEDNIM PROMJENJIVIM FAKTOROM


(One-Way ANOVA)

Kod analize varijance s jednim promjenjivim faktorom cilj je ispitati odnos varijacija
izmeu uzoraka s varijacijama unutar uzoraka. Taj odnos varijacija naziva se empirijski
F-omjer. F-omjer je sluajna varijabla koja pripada F-distribuciji. Ako je F-omjer
statistiki znaajan tada se moe odbaciti nulta hipoteza da se aritmetike sredine
statistiki znaajno ne razlikuju. Drugim rijeima, nultom hipotezom se pretpostavlja da
odreeni faktor znaajno ne djeluje na promatranu sluajnu varijablu, dok se
alternativnom hipotezom pretpostavlja da odreeni faktor statistiki znaajno djeluje na
promatranu sluajnu varijablu.

Jednadba analize varijance za k uzoraka sa n opaanja dana je izrazom3:

(
j =1 i =1
k

X ij X

(
j =1 i =1
k

= X ij X j

+ nj X j X
j =1

Pretpostavka da su uzorci jednakih veliina nuna je samo ako su uzorci zavisni. Ako uzorci nisu jednakih
veliina ili su podaci nepotpuni (engl. missing data) analizu varijance je mogue provesti pomou zbroja kvadrata
odstupnja treeg tipa (engl. Type III Sum of Squares). To je najee sluaj kod multifaktorske analize varijance
(MANOVA).
3

Vrijedi da je n = n j .
j =1

15

Statistika analiza

Tabela ANOVA:

Izvor
varijacije
Izmeu
uzoraka

Zbroj kvadrata
odstupanja (SS)

nj ( X j X )
k

(X

Unutar
uzoraka

j =1 i =1

ij

(X
k

Ukupno

n j (X j X ) / (k 1)

F-omjer

k-1

Xj

n-k

n-1

j =1

2
(X ij X j ) / (n k )
k

j =1 i =1

S A2
S E2

j =1 i =1

Sredina kvadrata
odstupanja (MS)

j =1

Stupnjevi
slobode (df)

ij

Zadatak 2.1.1. Moe li se prihvatiti nulta hipoteza da se promatrana poduzea znaajno ne


razlikuju prema prosjenom prihodu s obzirom na djelatnost koju obavljaju? Zakljuak
donesite na temelju empirijske razine signifikantnosti (p-vrijednost).4
Rjeenje 2.1.1. Unutar glavnog izbornika Statistics potrebno je izabrati: ANOVA Oneway ANOVA OK, kao to je prikazano na slici.

U slijedeem koraku potrebno je izabrati jednu (zavisnu) varijablu ili vie njih, te
odgovarajui faktor (engl. Categorical factor). Za zavisnu varijablu (engl. Dependent
variable) biramo Prihod u mil. kn, dok za faktor biramo Djelatnost, kao to je prikazano
na slici.

Razina signifikantnosti predstavlja vjerojatnost da se nulta hipoteza odbaci premda je ona istinita i jo se naziva
grekom tipa I. Ako je p-vrijednost manja od teorijske razine signifikantnosti (najee 5%) nulta hipoteza se moe
odbaciti. Ako je p-vrijednost vea od 5% nulta hipoteza se ne moe odbaciti.

16

Statistika analiza

Nakon to kliknite OK unutar kartice Summary izaberite opciju Univariate results.

Popunite tabelu ANOVA dobivenim rezultatima pomou programa STATISTICA:


Izvor varijacije

Zbroj kvadrata
odstupanja (SS)

Stupnjevi
slobode (df)

Sredina kvadrata
odstupanja (MS)

F-omjer

Izmeu uzoraka
Unutar uzoraka
Ukupno
Napomena: Varijacije izmeu uzoraka (engl. between groups variation) se pripisuju
djelovanju promatranog faktora Djelatnost, dok se varijacije unutar uzoraka (engl. within
groups variation) pripisuju sluajnom djelovanju, odnosno nepoznatom faktoru i
predstavljaju komponentu pogreke (engl. Error).
Postavite odgovarajue hipoteze:

H 0 : ...
H 1 : ...

17

Statistika analiza
Empirijska razina signifikantnosti (p-vrijednost) iznosi:_____________, stoga se nulta
hipoteza _________________________________________.
Empirijsku razinu signifikantnosti na temelju empirijskog F-omjera iz prethodnog zadatka
izraunajte pomou kalkulatora vjerojatnosti i objasnite njeno znaenje konkretno.5 Unutar
glavnog izbornika Statistics pokrenite Probability Calculator Distributions F(Fisher).
Nakon unosa parametara F, df1 i df2, oznaite opciju (1-Cumulative p) i kliknite Compute.

Ponovno pokrenite prozor ANOVA Results i unutar kartice Summary izaberite opciju
Cell Statistics. Protumaite dobivene rezultate!

Ponovno pokrenite prozor ANOVA Results i unutar kartice Summary izaberite opciju
All effects/Graphs. Komentirajte dobiveni grafikon.

Density Function je funkcija gustoe vjerojatnosti, koja se u literaturi oznaava s f ( x ) . Distribution Function

je funkcija distribucije vjerojatnosti, koja se u literaturi oznaava s F ( x ) i predstavlja vjerojatnost da sluajna


varijabla X ne premai odreenu vrijednost xi odnosno F ( x ) = P ( X xi ) .

18

Statistika analiza
Djelatnost; LS Means
Current effect: F(2, 47)=,70198, p=,50072
Effective hypothesis decomposition
Vertical bars denote 0,95 confidence intervals
130
125
120
115

Prihod u mil. kn

110
105
100
95
90
85
80
75
70
65

trgovina

proizvodnja

usluge

Djelatnost

Moe li se prihvatiti pretpostavka da sve tri distribucije pripadaju istoj populaciji?

Zadatak 2.1.2. Moe li se prihvatiti nulta hipoteza da se promatrana poduzea znaajno ne


razlikuju prema zaduenosti s obzirom na djelatnost koju obavljaju? Koliko iznosi empirijski
F-omjer, a koliko empirijska razina signifikantnosti? to zakljuujete? Napiite kako glase
95%-tni intervali pouzdanosti procjene (engl. confidence intervals) prosjene zaduenosti
poduzea za pojedine djelatnosti!

Rjeenje 2.1.2. Ponovite proceduru kao u zadatku 2.1.1.

19

Statistika analiza

Postavite odgovarajue hipoteze:

H 0 : ...
H 1 : ...

Popunite tabelu ANOVA:


Izvor varijacije

Zbroj kvadrata
odstupanja (SS)

Stupnjevi
slobode (df)

Sredina kvadrata
odstupanja (MS)

F-omjer

Izmeu uzoraka
Unutar uzoraka
Ukupno
Na temelju empirijske razine signifikantnosti od:_______%, moe se zakljuiti __________
____________________________________________________________________________
__________________________________________________________________________.

Pr

...................

< X trgov . < ................... = 0,95

Pr

...................

< X proiz . < ................... = 0,95

Pr

...................

< X usluge < ................... = 0,95

2.2. ANALIZA VARIJANCE S DVA PROMJENJIVA FAKTORA


(Two-Way ANOVA)

Na vrijednost neke sluajne varijable moe djelovati vie od jednoga promjenjivog


faktora. Ovdje e biti prikazano testiranje znaajnosti djelovanja dvaju promjenjivih
faktora.

Tri su hipoteze koje se mogu testirati kod analize varijance s dva promjenjiva faktora:
(a) Jednakost sredina populacija s obzirom na prvi faktor.
(b) Jednakost sredina populacija s obzirom na drugi faktor.
(c) Promatrani faktori meusobno (interaktivno) djeluju na promatranu
sluajnu varijablu.

20

Statistika analiza
Zadatak 2.2.1. Moe li se prihvatiti hipoteza da su faktor Djelatnost i faktor Kotacija na
burzi znaajno djelovali na ostvarenje prosjenog prihoda promatranih poduzea? Da li
promatrani faktori meusobno (interaktivno) znaajno djeluju na prosjean prihod
poduzea?

Rjeenje 2.2.1. Unutar glavnog izbornika Statistics izaberete ANOVA Factorial ANOVA.6
Za varijablu izaberite Prihod u mil. kn, a za faktore izaberite Djelatnost i Kotacija na burzi
kao to je prikazano na slici. Zatim kliknite OK.

U slijedeem prozoru unutar kartice Summary izaberite Univariate Results. Popunite


tabelu ANOVA rezultatima dobivenim pomou programa STATISTICA.
Izvor varijacije

Zbroj kvadrata
odstupanja (SS)

Stupnjevi
slobode (df)

Sredina kvadrata
odstupanja (MS)

Fomjer

pvrijednost

Djelatnost
Kotacija na burzi
Interakcija
Ostatak (Error)
Ukupno
Napomena: Za svaku od postavljenih hipoteza F-test predstavlja omjer sredine kvadrata
odstupanja odgovarajueg faktora sa sredinom kvadrata odstupanja ostatka. Dakle, u ovom
primjeru tri su empirijska F-testa.

Ponovno pokrenite prozor ANOVA Results i unutar kartice Summary izaberite opciju
Cell Statistics. Na temelju dobivenih rezultata odgovorite koja poduzea ostvaruju

Ako se eli testirati znaajnost djelovanja vie faktora na promatranu sluajnu varijablu bez efekta interakcije
tada je umjesto Factorial ANOVA potrebno izabrati Main effects ANOVA.

21

Statistika analiza
najvei prihod, a koja najmanji prihod s obzirom na to da li kotiraju na burzi i koju
djelatnost obavljaju?

Grafiki prikaite interaktivno djelovanje dvaju faktora na prosjean prihod


promatranih poduzea (ponovno pokrenite prozor ANOVA Results i unutar kartice
Summary izaberite opciju All effects/Graphs).
Djelatnost*Kotacija na burzi; LS Means
Current effect: F(2, 44)=1,5414, p=,22541
Effective hypothesis decomposition
Vertical bars denote 0,95 confidence intervals
180
160

Prihod u mil. kn

140
120
100
80
60
40
20

ne

da
Kotacija na burzi

Djelatnost
trgovina
Djelatnost
proizvodnja
Djelatnost
usluge

Zadatak 2.2.2. Moe li se prihvatiti hipoteza da su faktor Djelatnost i faktor Kotacija na


burzi znaajno djelovali na zaduenost promatranih poduzea? Da li promatrani faktori
interaktivno znaajno djeluju na varijablu Zaduenost?
Rjeenje 2.2.2. Ponovite proceduru kao u zadatku 2.2.1. Popunite tabelu ANOVA i objasnite
znaenje dobivenih rezultata.
Izvor varijacije

Zbroj kvadrata
odstupanja (SS)

Stupnjevi
slobode (df)

Sredina kvadrata
odstupanja (MS)

Fomjer

pvrijednost

Djelatnost
Kotacija na burzi
Interakcija
Ostatak (Error)
Ukupno
Objasnite dobivene rezultate:
____________________________________________________________________________
____________________________________________________________________________.

22

Statistika analiza
VJEBA BR. 21

(a) Moe li se kao istinita prihvatiti nulta hipoteza da ne postoji statistiki znaajne razlike
u prosjenim ulaganjima u reklame izmeu poduzea s obzirom na kotaciju na burzi?
Postavljenu hipotezu testirajte pomou analize varijance s jednim promjenjivim
faktorom. Popunite tabelu ANOVA i provedite F-test. Izraunajte empirijsku razinu
signifikantnosti (p-vrijednost) pomou kalkulatora vjerojatnosti ispod povrine Fdistribucije. Dobivene rezultate usporedite s rezultatima t-testa u zadatku (h) vjeba br.
1. U kakvom su odnosu t-test i F-test kada se eli ispitati jeli postoji statistiki znaajna
razlika izmeu dva nezavisna uzorka? [Statistics ANOVA One-way ANOVA
Quick specs dialog OK Dependent Variables (Ulaganje u reklamu u tis. kn )
Categorical factor (Kotacija na burzi ) OK Summary Univariate results]
Izvor varijacije

Zbroj kvadrata
odstupanja (SS)

df

Sredina kvadrata
odstupanja (MS)

F-omjer

pvrijednost

Izmeu uzoraka
Unutar uzoraka
Ukupno
Prihvaa se hipoteza ___________________________________________________________
____________________________________________________________________________.

Moe se zakljuiti _____________________________________________________________


____________________________________________________________________________
____________________________________________________________________________.

23

Statistika analiza
(b) Moe li se prihvatiti hipoteza da faktor Djelatnost i faktor Kotacija na burzi znaajno
djeluju na ulaganje u reklame promatranih poduzea? Provedite analizu varijancu s dva
promjenjiva faktora bez efekta interakcije. to zakljuujete? [Statistics ANOVA
Main effects ANOVA Quick specs dialog OK Dependent Variables (Ulaganje u
reklamu u tis. kn ) Categorical factors (Djelatnost-Kotacija na burzi ) OK
Summary Univariate results]
Zbroj kvadrata
odstupanja (SS)

Izvor varijacije

df

Sredina kvadrata
odstupanja (MS)

F-omjer

pvrijednost

Djelatnost
Kotacija na burzi
Error
Total
(c) U testiranju hipoteze pod (b) ukljuite i efekt interakcije. to zakljuujete? Efekte
interakcije prikaite odgovarajuim grafikonom. [Statistics ANOVA Factorial
ANOVA Quick specs dialog OK Dependent Variables (Ulaganje u reklamu u
tis. kn ) Categorical factors (Djelatnost-Kotacija na burzi ) OK Summary
Univariate results]; [ANOVA results All effects/Graphs Djelatnost *Kotacija na
burzi OK OK]
Zbroj kvadrata
odstupanja (SS)

Izvor varijacije

df

Sredina kvadrata
odstupanja (MS)

F-omjer

pvrijednost

Djelatnost
Kotacija na burzi
Interakcija
Error
Total
Djelatnost*Kotacija na burzi; LS Means
Current effect: F(2, 44)=2,3494, p=,10729
Effective hypothesis decomposition
Vertical bars denote 0,95 confidence intervals
75

Ulaganje u reklamu u tis.kn

70
65
60
55
50
45
40
35
ne

da
Kotacija na burzi

Djelatnost
trgovina
Djelatnost
proizvodnja
Djelatnost
usluge

24

Statistika analiza
(d) Izraunajte granice intervalne procjene prosjenog ulaganja u reklame na temelju razine
pouzdanosti od 95% za poduzea (a) koja se bave trgovinom i ne kotiraju na burzi i (b)
koja se bave proizvodnjom i kotiraju na burzi. [ANOVA results Cell statistics]

Pr {............. < X trgov. ne < ..............} = 0,95


Pr {............. < X proizv . da < .............} = 0,95

25

Statistika analiza
3. KORELACIJA

esto u praksi opaamo da dvije ili vie pojava pokazuju meusobnu zavisnost. Na
primjer znamo da postoji obrnuto proporcionalna povezanost izmeu potranje za
odreenim proizvodom i njegove cijene.

Engleski matematiar Karl Pearson razradio je raunski postupak za izraunavanje


stupnja povezanosti jednim brojem, kojeg je nazvao koeficijentom linearne korelacije
(engl. linear correlation).

Osim raunski, korelacija izmeu dviju varijabli npr. X i Y moe se utvrditi i grafiki
pomou dijagrama rasipanja (engl. scatterplot). Ako korelacija (povezanost) postoji
mogue je odrediti njezin smjer i intenzitet, ali i testirati njezinu znaajnost uobiajenim
t-testom.

Pretpostavimo slijedei primjer: za osam trgovinskih radnji ( n = 8 ) poznat je broj


zaposlenih (varijabla X) i ostvareni dnevni promet u 000 kuna (varijabla Y). U slijedeoj
tablici dane su vrijednosti promatranih varijabli, izraunata su odstupanja vrijednosti
promatranih varijabli od njihove aritmetike sredine, te su izraunati umnoci tih
odstupanja:7

xi
1
3
7
5
5
9
4
8
Ukupno

yi

xi x

yi y

3
5
10
6
9
14
7
14

-4,25
-2,25
1,75
-0,25
-0,25
3,75
-1,25
2,75
0

-5,5
-3,5
1,5
-2,5
0,5
5,5
-1,5
5,5
0

( xi x ) ( y i y )
23,375
7,875
2,625
0,625
-0,125
20,625
1,875
15,125
72

Smjer i intenzitet povezanosti izmeu dviju varijabli ovisi o njihovoj kovarijaciji, to


znai da varijacije jedne varijable ovise o varijacijama druge varijable. Iz tablice je
uoljivo kako negativne varijacije broja zaposlenih prate negativne varijacije ostvarenog
prometa i obratno.

Aritmetike sredine izraunate su prema formuli za jednostavnu aritmetiku sredinu: x =

xi
i =1

, y=

yi
i =1

26

Statistika analiza

Mjera kovarijacije naziva se kovarijancom i definira se formulom:


n

Cov ( x, y ) =

i =1

72
=9>0
8

Da bi izmjerili intenzitet povezanosti izmeu varijabli potrebno je izvriti


standardizaciju kovarijance na slijedei nain:8

r=

( xi x ) ( yi y )

Cov ( x, y )

X Y

9
= 0,9585 < 1
2, 48747 3, 77492

Dobiveni rezultat naziva se koeficijentom linearne korelacije ( r ). Budui da kovarijanca


po apsolutnoj vrijednosti ne moe biti vea od umnoka standardnih devijacija varijabli
X i Y, tada koeficijent linearne korelacije moe poprimiti vrijednost iz
segmenta 1 r +1 . Rijedak je sluaj funkcionalne korelacije kada je r = 1 . Najei je
sluaj statistike ili stohastike korelacije (veza izmeu varijabli vrijedi priblino).

Prema intenzitetu korelacija moe biti:

r 0.8 ... jaka


0.5 < r < 0.8 ... polujaka
r 0.5 ... slaba

Ako je korelacija linearna, tada se ista moe analitiki opisati linearnom regresijskom
jednadbom (jednadba pravca koja doputa odstupanja). Ipak, ako korelacija jest jaka i
pozitivna ba kao u naem primjeru ( r = +0,9585 ), ne mora biti linearna. Moe biti i
nelinearna!

Linearna povezanost izmeu broja zaposlenih i ostvarenog prometa za osam trgovinskih


radnji prikazana je dijagramom rasipanja.

Standardne

X =

devijacije

( xi x )
n

i =1

izraunate

, Y =

su

( yi y )
n

i =1

prema

formulama

za

jednostavnu

standardnu

devijaciju:

27

Statistika analiza

Testiranje znaajnosti koeficijenta korelacije provodi se uobiajenim t-testom


postavljajui hipoteze:9

H 0 : ... r = 0
H 1 : ... r 0

Empirijski t-omjer, odnosno Z-omjer, definiran je izrazom:

t* =

r 0
Se ( r )

U sluaju malog uzorka ( n 30 ) test veliina pripada Studenovoj t-distribuciji sa n-2


stupnjeva slobode, dok za velike uzorke ( n > 30 ) test veliina pripada normalnoj
distribuciji.

Ako su jedna ili dvije varijable dane u rangu, tj. rezultati nisu mjerne vrijednosti ve su
dani samo u redoslijedu, rauna se tzv. Spearmanov koeficijent korelacije ranga prema
formuli:10
n

rS = 1

6 di2
i =1
3

n n

Znaajnost Spearmanovog koeficijenta korelacije ranga se testira na isti nain kao i


znaajnost Pearsonovog koeficijenta korelacije!

Testiranje znaajnosti koeficijenta korelacije moe biti i jednosmjerno (engl. one-tailed test)
Spearmanov koeficijent korelacije ranga spada u neparametrijske pokazatelje korelacije.

10

28

Statistika analiza

Na dvije promatrane varijable, koje su u korelaciji, mogu utjecati i druge varijable koje
daju prividnu (lanu) mjeru korelacije izmeu dviju promatranih varijabli. Zato, da bi se
iskljuio utjecaj drugih varijabli na promatranu korelaciju potrebno je izraunati
parcijalni koeficijent korelacije.

Zadatak 3.1. Izraunajte koeficijente linearne korelacije u parovima izmeu varijabli:


Prihod u mil. kn, Broj zaposlenih i Ulaganje u reklamu u 000 kn. Objasnite znaenje
dobivenih koeficijenata. Koji su procijenjeni koeficijenti statistiki znaajni pri razini
signifikantnosti od 1%? Vrijednosti varijabli prikaite dijagramom rasipanja u
trodimenzionalnom prostoru. Vrijednosti varijabli u parovima prikaite dijagramima
rasipanja u matrinom obliku.

Rjeenje 3.1. Unutar glavnog izbornika Statistics izaberite Basic Statistics/Tables


Correlation matrices OK. Nakon izbora odgovarajuih varijabli unutar prozora One
variable list u kartici Options podesite p-vrijednost na razinu 0,01.

Vratite se na karticu Quick i kliknite Summary: Correlations.

Koeficijent linearne korelacije izmeu ostvarenih prihoda i broja zaposlenih


iznosi:_____________, to pokazuje _____________________________________________
____________________________________________________________________________.
Koeficijent linearne korelacije izmeu ostvarenih prihoda i ulaganja u reklamu
iznosi:_____________, to pokazuje _____________________________________________
____________________________________________________________________________.
Koeficijent linearne korelacije izmeu broja zaposlenih i ulaganja u reklamu
iznosi:_____________, to pokazuje _____________________________________________
____________________________________________________________________________.

29

Statistika analiza
Pri teorijskoj razini signifikantnosti od 0,01 statistiki nisu znaajni slijedei koeficijenti:
____________________________________________________________________________.

Ponovno pokrenite prozor Product-Moment and Partial Correlations, te unutar kartice


Advanced/plot izaberite 3D-scatterplots (potrebno je specificirati koja e od varijabli biti
na osi X, koja na osi Y, a koja na Z osi).

Ponovno pokrenite prozor Product-Moment and Partial Correlations, te unutar kartice


Quick izaberite Scatterplot matrix for selected variables.

30

Statistika analiza
Zadatak 3.2. Izraunajte koeficijent parcijalne korelacije izmeu ostvarenih prihoda i broja
zaposlenih neutralizirajui utjecaj zaduenosti.

Rjeenje 3.2. Ponovno pokrenite prozor Product-Moment and Partial Correlations, te


unutar kartice Advanced/plot izaberite Partial Correlations (za kontrolnu varijablu izaberite
Zaduenost).

Parcijalni koeficijent korelacije iznosi:____________, te pokazuje_____________________


____________________________________________________________________________
__________________________________________________________________________.

Zadatak 3.3. Izraunajte koeficijent korelacije ranga izmeu Ocjene rizika i Ocjene
uspjenosti poduzea. Objasnite znaenje dobivenog koeficijenta korelacije i testirajte
njegovu znaajnost. Signifikantnost testa iznosi 5%.

Rjeenje 3.3. Unutar glavnog izbornika Statistics izaberite: Nonparametrics Correlations


(Spearman,) OK. Nakon izbora odgovarajuih varijabli kliknite Spearman rank R, kao
to je prikazano na slici.

31

Statistika analiza

Spermanov koeficijent korelacije iznosi -0,238485 i nije statistiki znaajan pri teorijskoj
razini signifikantnosti od 5%!
VJEBA BR. 31

(a) Izraunajte i objasnite znaenje koeficijenta linearne korelacije izmeu prihoda i


zaduenosti promatranih poduzea. Jeli koeficijent korelacije statistiki znaajan?
Postavite odgovarajue hipoteze! [Statistics Basic Statistics/Tables Correlation
matrices OK One variable list (Prihod u mil. kn-Zaduenost ) Quick
Summary: Correlations]
Koeficijent linearne korelacije iznosi:____________, te pokazuje___________________
_________________________________________________________________________
_________________________________________________________________________.

H 0 : ...
H1 : ...
Nulta hipoteza se (a) moe odbaciti ili (b) ne moe odbaciti (zaokruite toan odgovor!)
pri empirijskoj razini signifikantnosti_________________________________________.
(b) Izraunajte i objasnite znaenje parcijalnog koeficijenta linearne korelacije izmeu
prihoda i zaduenosti promatranih poduzea uz neutraliziran utjecaj broja zaposlenih. Je
li koeficijent parcijalne korelacije statistiki znaajan? [Product-Moment and Partial
Correlations Advanced/plot Partial correlations Second var.list (Broj
zaposlenih ) OK]
Parcijalni koeficijent korelacije iznosi:____________, te pokazuje__________________
_________________________________________________________________________
_________________________________________________________________________.
Procijenjen koeficijent parcijalne korelacije je (a) statistiki znaajan ili (b) nije
statistiki znaajan (zaokruite toan odgovor)!

32

Statistika analiza
(c) Izraunajte granice intervalne procjene koeficijenta linearne korelacije pod
temelju razine pouzdanosti od 95%. Koristite Fisherovu transformaciju Z
[Statistics Power Analysis Interval Estimation One Correlation,
QuickObserved R:..., Sample size (N):..., Conf. Level:... Fisher Z
Compute]

(a) na
Crude.

t-Test
Crude

Pr {.............. < r < .............} = 0,95

(d) Izraunajte i testirajte znaajnost koeficijenta linearne korelacije izmeu prihoda i


zaduenosti za svaku vrstu djelatnosti posebno. Jeli se intenzitet promatrane korelacije
razlikuje s obzirom na djelatnost koju poduzea obavljaju? [Statistics Basic
Statistics/Tables Correlation matrices OK One variable list (Prihod u mil. knZaduenost ) By Group Grouping Variable(s)...(Djelatnost) OK OK
Options Display r, p-levels, and N's Summary]
Djelatnost
trgovina
proizvodnja
usluge

Koeficijent korelacije

p-vrijednost

(e) Postoji li statistiki znaajna razlika u koeficijentima linearne korelacije izmeu podzea
koja se bave proizvodnjom i trgovinom? Provedite dvosmjerni i jednosmjerni test
(koristite se rezultatima iz prethodnog postupka). [Basic Statistics/Tables Difference
tests: r, %, means OK r1:..., r2:..., N1:..., N2:... Two-sided / One-sided
Compute]
(a) Dvosmjerni test

H 0 : ...
H1 : ...

Moe se prihvatiti hipoteza ____________


(b) Jednosmjerni test

H 0 : ...
H1 : ...

Moe se prihvatiti hipoteza ____________


33

Statistika analiza
(f) Izraunajte i testirajte znaajnost koeficijenta linearne korelacije izmeu prihoda i
ulaganja u reklame za sva poduzea zajedno. Kolika veliina uzorka je potrebna da bi
koeficijent korleacije bio statistiki znaajan: (a) pri teorijskoj razini signifikantnosti od
5% i snazi testa od 90%, (b) pri teorijskoj razini signifikantnosti od 1% i snazi testa od
95%? [Statistics Power Analysis Sample Size Calculation One Correlation, tTest Quick Rho:..., Alpha:..., Power Goal:... OK Fisher Z Crude Calculate
N]11
Potrebna veliina uzorka pod (a) iznosi:______________ i pod (b) iznosi:____________.
(g) Varijable pod (a) prikaite dijagramom rasipanja s pripadajuom jednadbom pravca i
koeficijentom linearne korelacije. Na dijagramu rasipanja eliminirajte najvie pet
netipinih opaanja. to se moe zakljuiti na temelju usporedbe dijagrama rasipanja
prije i nakon eliminiranja netipinih opaanja? Koja ste opaanja (poduzea) eliminirali?
[Graphs Scatterplots... Variables (X: Prihod u mil. kn, Y: Zaduenost) OK

Advanced Corr. and p (linear fit) Grpah type: Regular Fit: Linear OK
Brushing (Auto Apply, Normal: Exclude, Selection Brush: Simple, Save Brushing
settings )]

Scatterplot of Zaduenost against Prihod u mil. kn

Scatterplot of Zaduenost against Prihod u mil. kn


Poduzeca 8v*50c

Poduzeca 8v*50c

Zaduenost = 1,2075-0,0071*x

Zaduenost = 1,5314-0,0103*x
1,2

1,2
1,0

1,0

0,8
Zaduenost

Zaduenost

0,8

0,6
0,4

0,6

0,4

0,2
0,2

0,0

Prihod u mil. kn:Zaduenost: r = -0,9833; p = 0.0000

Prihod u mil. kn:Zaduenost: r = -0,8468; p = 0.0000

-0,2
0

20

40

60

80

100

120

Prihod u mil. kn

140

160

180

200

220

0,0
20

40

60

80

100

120

140

Prihod u mil. kn

Eliminirana su podzea pod rednim brojem: ____________________________________.

11

Parametar Rho je koeficijent korelacije iz osnovnog skupa, Alpha je teorijska razina signifikantnosti i Power
Goal je snaga testa. Kada koeficijent linerane korelacije osnovnog skupa nije poznat on se zamjenjuje njegovom
procjenom na temelju vrijednosti iz uzorka ( r ). Parametri Alpha i Power Goal se unose kao decimalni brojevi.

34

160

Statistika analiza
4. REGRESIJSKA ANALIZA

Budui da je cilj regresijske analize pronai analitiki izraz u obliku jednadbe, kojom se
najbolje opisuje statistika povezanost jedne numerike varijable s drugom ili vie
numerikih varijabli, potrebno je razlikovati slijedee modele:

(a)
(b)
(c)
(d)

jednostruke ili jednostavne (jedna zavisna i jedna nezavisna varijabla),


viestruke (jedna zavisna i dvije ili vie nezavisnih varijabli),
linearne (linearne modele u parametrima i varijablama) i
nelinearne (nelinearne modele u parametrima i/ili varijablama koje je prikladnim
transformacijama mogue svesti na linearne).

Nuno ne znai da su nezavisne varijable uzrok, a zavisna varijabla posljedica. Uzronost


(engl. causality) se mora opravdati na temelju ekonomske teorije!

4.1. JEDNOSTAVNA LINEARNA REGRESIJA

Jednostruki (jednostavni) linearni regresijski model ima slijedei oblik:

yi = 0 + 1 xi + ei

i = 1, 2,3,..., n

U navedenom modelu yi su vrijednosti zavisne varijable (tzv. regresand varijabla), dok


su xi vrijednosti nezavisne varijable (tzv. regresorska varijabla), a ei su vrijednosti

sluajne varijable, tzv. greke relacije koje modelu daju karakter stohastinosti (engl.
stohastic term or random error). Vrijednost sluajne varijable predstavlja nepoznata
odstupanja od funkcionalnog odnosa.
Za svako opaanje i = 1,2,3,..., n postoji distribucija vjerojatnosti varijabli yi pa prema
tome postoji i distribucija vjerojatnosti varijabli ei . Ako pretpostavimo da sluajne
varijable ei imaju normalnu distribuciju s oekivanjem jednakim nuli i konstantnom
varijancom tada model poprima slijedei oblik:

yi = 0 + 1 xi

i = 1, 2,3,..., n

Parametri 0 i 1 se procjenjuju na temelju vrijednosti iz uzorka. Najee koritena


metoda kojom se procjenjuju nepoznati parametri u jednadbi regresije je metoda
najmanjih kvadrata OLS (engl. Ordinary Least Squares). Cilj metode najmanjih kvadrata
je izraunati one procijene parametara koje minimiziraju zbroj kvadrata odstupanja
opaenih vrijednosti yi od oekivanih vrijednosti E [ yi ] = yi .

35

Statistika analiza
2

min ( yi y i ) = min ei2


i =1

i =1

Metoda najmanjih kvadrata daje BLUE procijene parametara. (engl. Best Linear
Unbiased Estimate).

Gauss-Markovljev teorem: U klasi svih linearnih nepristranih procjenitelja,


procjenitelji dobiveni metodom najmanjih kvadrata imaju najmanju varijancu.

Da bi procijene parametara bile konzistentne, a testovi znaajnosti pouzdani potrebno je


zadovoljiti slijedee pretpostavke: linearnost, homoskedastinost, nezavisnost,
normalnost.

Znaajnost procijenjenih parametara se provodi uobiajenim t-testom:

H 0 : ... j = 0
H 1 : ... j 0

t =

j 0

( )

Se j

Testiranje znaajnosti procijenjenih parametara moe biti i jednosmjerno. U sluaju


jednosmjernog testa p-vrijednost je dvostruko manja od p-vrijednosti za dvosmjerni test!

Mogue je provesti i skupni test o znaajnosti regresijskog modela kao cjeline pomou
analize varijance (F-test):

H 0 : ... 0 = 1 = 0
H1 : ... j 0 j = 1, 2
Tabela ANOVA:12
Izvor varijacije
Regresija
(protumaeni dio)
Reziduali
(neprotumaeni dio)

Zbroj kvadrata
odstupanja (SS)

Sredina kvadrata
odstupanja (MS)

SP / k

n-k-1

SR / (n k 1)

F-omjer

SP = ( y i y )
i =1
n

SR = ( yi y i )

i =1
n

Ukupno

Stupnjevi
slobode
(df)

SP / k
SR / (n k 1)

ST = ( yi y )

n-1

i =1

12

U regresijskoj analizi malo n oznaava broj opaanja (veliina uzorka), dok malo k oznaava broj nezavisnih
varijabli u jednadbi regresije.

36

Statistika analiza

Apsolutna mjera reprezentativnosti regresije zove se standardna pogreka regresije (engl.


standard error of estimate):
n

Y =

ei

SR
i =1
=
n k 1
n k 1

U relativne mjere reprezentativnosti regresije spadaju koeficijent varijacije regresije ( VY )


i koeficijent determinacije ( R 2 ):

VY =

Y
Y

100

R2 =

SP
;
ST

1 R2 =

SR
;
ST

0 R2 1

Zadatak 4.1.1. Koristei se podacima iz datoteke Poduzeca.xls napravite slijedee:


(a) Procijenite parametre linearne regresije koja pokazuje ovisnost ostvarenih prihoda o
zaduenosti poduzea. Kako glasi dobivena regresijska jednadba? to pokazuju
parametri 0 i 1 ? Jesu li procijenjeni parametri statistiki znaajni? Dobivenu

(b)
(c)

(d)
(e)

(f)

jednadbu regresije prikaite na dijagramu rasipanja.


Pomou analize varijance testirajte znaajnost regresijskog modela kao cjeline (postavite
odgovarajue hipoteze).
Koliko iznosi standardna pogreka regresije. to ona pokazuje? Na temelju odgovarajue
relativne mjere disperzije odgovorite jeli prosjeno odstupanje od regresijskog pravca
relativno veliko ili relativno malo?
Protumaite znaenje koeficijenta determinacije konkretno! Na temelju koeficijenta
determinacije ocijenite reprezentativnost linearne regresije.
Izraunajte intervalne granice procjene prihoda poduzea kada zaduenost iznosi
0,24055 na temelju razine pouzdanosti od 95%. Koliko iznosi rezidualno odstupanje i to
ono pokazuje?
Koja se opaanja mogu identificirati kao netipina opaanja (engl. outliers) polazei od
kriterija da su to ona opaanja ije su vrijednosti standardiziranih reziduala vee od 2?

Rjeenje 4.1.1. Iz padajueg glavnog izbornika Statistics potrebno je izabrati Multiple


Regression. Nakon to izaberete koja je varijabla zavisna (engl. dependent), a koja nezavisna
(engl. independent) kliknite OK. Unutar prozora Multiple Regression Results u kartici
Advanced kliknite Summary: Regression results, kao to je prikazano na slici.

37

Statistika analiza

Napomena: Po defaultu programa znaajnost procijenjenih parametara se testira na razini


signifikantnosti od 5% (Alpha for highlighting effects: ,05). Svi parametri koji su statistiki
znaajni bit e istaknuti crvenom bojom.

= i
= .
(a) Procijenjeni su slijedei parametri:
0
1

Jednadba regresije ima sljedei analitiki izraz: yi = .


Parametar pokazuje:________________________________________________________
0

________________________________________________________________________, dok
parametar 1 pokazuje: ________________________________________________________
____________________________________________________________________________
____________________________________________________________________________.

38

Statistika analiza

Da bi linearnu regresijsku jednadbu prikazali na dijagramu rasipanja potrebno je unutar


prozora Multiple Regression Results izabrati karticu Residual/assumptions/prediction i
zatim Perform residual analysis. Nadalje, unutar kartice Scatterplots potrebno je izabrati
Bivariate correlation i zatim OK.

Prihod u mil. kn vs. Zaduenost

Prihod u mil. kn = 149,03 - 101,1 * Zaduenost


Correlation: r = -,8468
220
200
180

Prihod u mil. kn

160
140
120
100
80
60
40
20
0
-0,2

0,0

0,2

0,4

0,6

Zaduenost

0,8

1,0

1,2

95% confidence

Na dijagramu rasipanja, osim regresijskog pravca, iscrtkanim linijama prikazane su donje


i gornje granice procjene oekivane vrijednosti prihoda pri svim razinama zaduenosti iz
uzorka na temelju pouzdanosti (engl. confidence) od 95%.

39

Statistika analiza
(b) Pomou analize varijance testira se znaajnost regresijskog modela kao cjeline. Zato je
unutar kartice Advanced prozora Multiple Regression Results, potrebno izabrati ANOVA
(Overall goodness of fit).

H 0 : ... 0 = 1 = 0
H 1 : ... j 0 j = 1, 2

(c) Standardna pogreka regresije (engl. standard error of estimate) iznosi 19,924 to se vidi
iz prve dobivene tablice Regression Summary. To znai da prosjeno odstupanje stvarnih
vrijednosti prihoda od oekivanih vrijednosti prihoda svih poduzea iznosi 19,924 mil. kn.
Standardna pogreka regresije izraunava se kao drugi korijen iz prosjene kvadratne
pogreke (engl. Mean Square Error) jer je 19 ,924 = 396,97 . Na temelju koeficijenta
varijacije moe se procijeniti da je prosjeno odstupanje od regresijskog pravca relativno
malo jer je VY = 20,87% (prethodno je potrebno izraunati aritmetiku sredinu zavisne
varijable kao to je opisano u prvom poglavlju).
(d) Koeficijent determinacije ( R 2 = 0, 7171 ) pokazuje kako je 71,71% ukupnog zbroja
kvadrata odstupanja protumaeno regresijom, to se vidi iz prve dobivene tablice Regression
Summary. Koeficijent determinacije moe se lako izraunati na temelju tabele ANOVA jer
48301, 46
je 0 , 7171 =
.
67356,13
Relativno visoka vrijednost koeficijenta determinacije upuuje na zakljuak da je regresijski
model reprezentativan.
(e) U odreivanju intervalnih granica procjene prihoda poduzea kada zaduenost iznosi
0,24055 na razini pouzdanosti od 95% koristite proceduru izbora opcija Multiple Regression
Results Residuals/assumption/prediction Predict dependent variable (Compute
confidence limits). Prije pritiska na OK potrebno je specificirati vrijednost nezavisne
varijable iz uzorka upisujui broj 0,24055.

40

Statistika analiza

Iz prethodne tablice je uoljivo kako se moe oekivati prihod od 124,7255 mil. kn kada
zaduenost poduzea iznosi 24,055% (radi se o procjeni jednim brojem, tzv. tokastoj
procjeni engl. point estimation).

y X =0,24055 = 149,035 101,058 0,24055 = 124,7255

Za razinu zaduenosti od 0,24055 ostvareni prihod je vei od oekivanog prihoda, stoga


rezidualno odstupanje iznosi 170, 6037 124, 7255 = 45,8782 mil. kn.

Interval pouzdanosti procijene glasi:

Pr 116,9465 < y( X =0,24055) < 132,5044 = 0,95 .13


(f) Da bi identificirali netipina opaanja potrebno je unutar opcije Perform residual
analysis prozora Multiple Regression Results kliknuti na karticu Outliers. Unutar kartice
Outliers potrebno je izabrati Casewise plot of outliers. Pet opaanja se moe identificirati
kao netipina opaanja i to redom: 2, 7, 23, 36 i 45, ba kao u zadatku pod (g) vjebe br. 2.
Ipak, drugo opaanje je najudaljenije od regresijskog pravca (odstupanje je vee od 4
standardne devijacije ispod regresijskog pravca).14

Zadatak 4.1.2. Koristei se podacima iz udbenika Statistika za ekonomiste pomou


programa STATISTICA rijeite primjer 12.5 (str. 218).

Rjeenje 4.1.2. U programu STATISTICA otvorite novi radni list u kojem ete samostalno
unijeti podatke iz primjera 12.5 (potronja benzina u litrama i broj prijeenih kilometara).
13

Potrebno je razlikovati granice intervalne procijene (engl. confidence limits) od granica prognostike procijene
(engl. prediction limits). Intervalna procjena zavisne varijable se rauna uvrtavajui vrijednost nezavisne varijable
iz uzorka, dok se granice prognostike procijene dobiju uvrtavajui neku pretpostavljenu vrijednost nezavisne
varijable koja nije zadana u uzorku.
14
Ako je rezidualno odstupanje negativno znai da se radi o toki koja se nalazi ispod regresijskog pravca. Ako je
rezidualno odstupanje pozitivno znai da se radi o toki koja se nalazi iznad regresijskog pravca.

41

Statistika analiza
Novi radni list kreirajte tako da u glavnom izborniku File izaberete New. U novom
dobivenom prozoru potrebno je specificirati toan broj varijabli (2) i toan broj opaanja
(15) unutar kartice Spreadsheet.

Nakon unosa podataka napravite slijedee:

(a) Nacrtajte dijagram rasipanja. Koristite proceduru izbora opcija Graphs Scatterplots
Quick Variables OK OK.15

15

Nemojte zaboraviti specificirati koja je varijabla zavisna (Y), a koja nezavisna (X).

42

Statistika analiza
(b) Izraunajte parametre linearne regresijske jednadbe koja pokazuje ovisnost broja
prijeenih kilometara o potronji benzina (koristite rezultate dobivene pod (a)).

0 = 39,8686

1 = 9, 7054

(c) Ispitajte znaajnost regresije pomou analize varijance i F-testa uz razinu


signifikantnosti od 5%. Koristite proceduru izbora opcija Statistics Multiple
Regression Quick Variables OK Advanced ANOVA(Overal goodness of

fit).16

(d) Testirajte znaajnost parametra uz regresorsku varijablu na razini signifikantnosti od


1%. Koristite proceduru izbora opcija Multiple Regression Results Advanced

Summary: Regression results.17

Napomena: Iako konstantni lan (engl. Intercept) u jednadbi regresije nije statistiki
znaajan (p-vrijednost je vea od 0,05 pa nije oznaen crvenom bojom) ne preporua se
izostavljanje tog lana. Izostavljane konstantnog lana moe uzrokovati pristranost
koeficijenta regresije 1 i nerealno visoku vrijednosti t-testa.
(e) Izraunajte i objasnite znaenje koeficijenta determinacije! Koliko iznosi korigirani
koeficijent determinacije?18

16

Da bi izraunali kritinu vrijednost F-distribucije na razini 5% signifikantnosti s 1 stupnjem slobode u brojniku i


13 stupnjeva slobode u nazivniku koristite proceduru izbora opcija Statistics Probability Calculator
Distributions F(Fisher); vidi str. 18.
17
Da bi izraunali kritinu vrijednost t-distribucije na razini 1% signifikantnosti s 13 stupnjeva slobode koristite
proceduru izbora opcija Statistics Probability Calculator Distributions t(Student); vidi str. 13.
18
Adjusted R2 je korigirani koeficijent determinacije ( R ). Korigirani koeficijent determinacije je nepristran
procjenitelj populacijskog koeficijenta determinacije. Naime, uvodei dodatne varijable s desne strane jednakosti
regresijske jednadbe poveava se broj ocijenjenih parametara (k+1), ime se uz nepromijenjenu veliinu uzorka
(n) smanjuje broj stupnjeva slobode. Stoga je prednost korigiranog koeficijenta determinacije to uravnoteuje
koristi od uvoenja dodatnih prediktorskih varijabli s gubitkom u stupnjevima slobode, pa ga je prikladno koristi
za usporedbu modela koji sadre razliit broj nezavisnih varijabli.
2

43

Statistika analiza
R 2 = 0,9777976

R2 = 1

15 1
1 R 2 = 0,9760897
15 2

(f) Izraunajte oekivani broj prijeenih kilometara ako potronja iznosi 80 litara. Za
pretpostavljenu vrijednost nezavisne varijable izraunajte donju i gornju granicu
prognostike procjene na razini pouzdanosti od 99%. Koristite proceduru izbora opcija
Multiple Regression Results Residuals/assumptions/predictin Predict dependent
variable Cmpute prediction limits Alpha: 0,01 OK.

4.2. MODELI NELINEARNE REGRESIJE

Ako je funkcionalni dio regresijskog modela linearan, ako su potencije varijabli jednake
jedan i ako je sluajna varijabla u zbroju s funkcionalnim djelom modela, rije je o
modelu linearne regresije. Ipak, odnosi meu pojavama mogu biti nelinearni. Modeli
kojima se izraavaju nelinearni odnosi nazivaju se modelima nelinearne (krivolinijske)
regresije.

Vei dio nelinearnih modela analiziraju se na isti nain kao i model jednostavne
linearne regresije jer se prikladnim transformacijama mogu linearizirati. Najee se
provodi logaritamska transformacija.

Pregled odabrani nelinearnih modela i njihovih transformacija prikazan je u sljedeoj


tablici:
Nelinearni model
regresije

Transformacije
varijabli

Polinom 2. stupnja

Jednadba
modela
yi = 0 + 1 xi + 2 xi2

Eksponencijalni

yi = 0 1xi

log Y

Logaritamski

yi = 0 + 1 log xi

log X

Dvostrukologaritamski

yi = 0 xi1

log Y , log X

X2

Linearizirani
oblik modela
yi = 0 + 1 xi + 2 xi2

log yi = log 0 + log 1 xi


yi = 0 + 1 log xi

log yi = log 0 + 1 log xi

44

Statistika analiza

U gornjoj tablici linearizirani modeli regresijskog polinoma drugog stupnja i


logaritamske regresije jednaki su originalnom obliku jer se radi o modelima koji su ve
linearni u parametrima iako su nelinearni u varijablama.

Program STATISTICA omoguuje procjenu parametara lineariziranog ili


nelineariziranog modela regresije na nain da se specificira njegov funkcionalni dio
pomou operatora: +, -, /, *, ^, i funkcija: exp, log, ln.

Na prvom grafu prikazane su dvije jednadbe eksponencijalne funkcije, dok su na


drugom grafu prikazane dvije jednadbe dvostruko-logaritamske funkcije. Protumaite
znaenje zadanih parametara u navedenim jednadabama!
45

14

40

12

35

Y=5*1,16^X

30

Y=30*0,75^X

25

20

15

Y=5*X^1,2

10

0
0

Y=5*X^0,7

10

10

15

0,5

1,5

2,5

Drugi pristup procijeni parametara nelinearnih modela regresije je automatski izbor


odreenog modela prilikom prikazivanja dijagrama rasipanja. Dijagram rasipanja nas
upuuje na zakljuak koji bi od modela nelinearne regresije bio prikladan za opisivanje
povezanosti izmeu promatranih varijabli.

Zadatak 4.2.1. Koristei se podacima iz udbenika Statistika za ekonomiste pomou


programa STATISTICA rijeite primjer 12.8 (str. 225).

Rjeenje 4.2.1. U programu STATISTICA otvorite novi radni list u kojem ete unijeti
podatke iz primjera 12.8 (proizvodnja u 000 komada i ostvareni dohodak u mil. kuna). Novi
radni list kreirajte kao u zadatku 4.1.2. (podatke moete i importirati iz datoteke Zadatci iz
udzbenika.xls). Nakon unosa podataka napravite slijedee:
(a) Nacrtajte dijagram rasipanja. Na istom grafu prikaite jednadbu regresijskog polinoma
drugoga stupnja. Koristite proceduru izbora opcija Graphs Scatterplots Quick
Variables Advanced Graph type: Regular Fit: Polynomial OK.

45

Statistika analiza
Napomena: Unutar kartice Advanced moete izabrati koji e od modela regresije biti
prikazan na dijagramu rasipanja.

(b) Provedite skupni test i pojedinane testove znaajnosti. Izraunajte standardnu


pogreku regresije. Procijenite u kojim granicama se mogu oekivati parametri 1 i 2
uz razinu pouzdanosti procjene od 95%. Koristite proceduru izbora opcija Statistics
Advanced Linear/Nonlinear Models Nonlinear estimation User-specified
regression, least squares OK Function to be estimated. Unutar prozora Estimated
function potrebno je definirati funkcionalni dio modela upisujui:
v2=b0+b1*v1+b2*v1^2. Varijabla v2 je dohodak, varijabla v1 je proizvodnja, dok su b0,

46

Statistika analiza
b1 i b2 parametri koje je potrebno procijeniti. Zatim kliknite OK OK OK
Summary: Parameter estimates.

t0* = 10, 08934

p = 0, 00002

t1* = 2,59329

p = 0, 03577

t2* = 11,81241

p = 0, 000007

Pr {5, 2872 < 1 < 0, 2439} = 0,95


Pr {0, 2628 < 2 < 0,3944} = 0,95

Nakon provedenih t-testova i intervalnih procjena parametara 1 i 2 na razini


pouzdanosti od 95% potrebno je izvriti analizu varijance izborom opcija Results

Analysis of Variance.

Na temelju tabele ANOVA moe se izraunati vrijednost empirijskog F-testa i


standardna pogreka regresijskog polinoma drugog stupnja:

F * = 16932, 21 p = 0, 00000...

Y =

45,8
= 6,5 = 2,55
7

(c) Izraunajte parametre linearne regresijske jednadbe. Izraunajte standardnu pogreku


regresije. Usporedite rezultate pod (c) i (b), te odgovorite koji regresijski polinom je
reprezentativniji? Koristite proceduru izbora opcija istu kao u postupku pod (b), ali
unutar prozora Estimated function definirajte funkcionalni dio linearnog modela
regresije upisujui: v2=b0+b1*v1.

47

Statistika analiza

yi = 11,503 + 9, 7212 xi

Y = 119, 7 = 10,94
Moe se zakljuiti da je reprezentativniji regresijski polinom drugog stupnja, jer je
procijenjena standardna pogreka manja!

Zadatak 4.2.2. Koristei podatke iz udbenika Statistika za ekonomiste pomou programa


STATISTICA rijeite primjer 12.6 (str. 222).

Rjeenje 4.2.2. U programu STATISTICA otvorite novi radni list u kojem ete unijeti
podatke iz primjera 12.6 (ukupna likvidna sredstva M4 i prosjena kamata na kunske
kredite). Nakon unosa ili importiranja podataka izvrite logaritamsku transformaciju
varijabli X i Y. Procijenite parametre dvostruko-logaritamske regresije u lineariziranom
.
obliku. Napiite jednadbu regresije u originalnom obliku. Protumaite znaenje
1

Novu varijablu log x moete kreirati u treem stupcu radnog lista. Dvostrukim klikom
pojavljuje se prozor Variable 3. U tom prozoru potrebno je
mia na eliju
napisati ime nove varijable npr. log x, i u dijalokom okviru za formule upisati
=Log10(v1) 19. To znai da vrijednosti nove varijable log x predstavljaju logaritmirane
vrijednosti likvidnih sredstava M4. Novu varijablu log y kreirajte na isti nain u
etvrtom stupcu radnoga lista (Var4).

19

Pomou funkcije Log10(x) dobiju se logaritmirane vrijednosti varijable X po bazi 10, dok se pomou funkcije
Log(x) dobiju logaritmirane vrijednosti varijable X po bazi e, tj. po bazi prirodnog logaritma ( e = 2 , 718282828 ).

48

Statistika analiza

Nakon logaritamske transformacije varijabli ponovite proceduru procijene jednostavnog


linearnog regresijskog modela kao u zadatku 4.1. (za zavisnu varijablu oznaite log y, a
za nezavisnu varijablu log x).

49

Statistika analiza

log y i = 2, 41954 0, 73066 log xi


y i = 262, 75 x 0,73066
Zadatak 4.2.3. Koristei se podacima iz udbenika Statistika za ekonomiste pomou
programa STATISTICA rijeite primjer 12.9 (str. 229).

Rjeenje 4.2.3. U programu STATISTICA otvorite novi radni list u kojem ete unijeti
podatke iz primjera 12.9 (proizvodnja u 000 komada i trokovi u tisuama kuna). Nakon
unosa podataka izvrite logaritamsku transformaciju varijable Y. Procijenite parametre
eksponencijalnog regresijskog modela u lineariziranom obliku. Napiite jednadbu
.
eksponencijalne regresije u originalnom obliku. Protumaite znaenje
1

log 0 = 2, 683019
log = 0, 004204
1

log yi = 2, 683019 + 0, 004204 xi

0 = 481,96915
1 = 1, 009727

x
yi = 481,96915 1, 009727 i

log 1 > 0

1 > 1

S = (1, 009727 1) 100 = +0,97%

50

Statistika analiza
VJEBA BR. 41
(a) Izraunajte i objasnite znaenje parametara linearne regresije koja pokazuje ovisnost
broja zaposlenih o prihodima poduzea (koristite podatke iz datoteke Poduzeca.xls).
Napiite kako glasi regresijska jednadba! Jesu li procijenjeni parametri statistiki
znaajni (postavite odgovarajue hipoteze)? [Statistics Multiple Regression Quick
Variables (Dependent: Broj zaposlenih, Independent: Prihod u mil. kn) OK
Advanced Summary: Regression results]
iznosi:______________, te pokazuje __________________________________
Parametar
0

____________________________________________________________________________.
iznosi:______________, te pokazuje ___________________________________
Parametar
1
____________________________________________________________________________
____________________________________________________________________________.
Regresijska jednadba je oblika: yi = ______________________________.

H 0 : ...0 =

H 0 : ...1 =

H1 : ...0

H1 : ... 1

t0 =

____
____
= 2,3717 df = ____ p = _______; t1 =
= 27 ,1406 p = _______
____
____

Procijenjeni parametri su (a) statistiki znaajni ili (b) nisu statistiki znaajni (zaokruite
toan odgovor)!
(b) Izraunajte vrijednost F-testa na temelju tabele ANOVA. Postavite odgovarajue
hipoteze! to zakljuujete? [Multiple Regression Results ANOVA (Overall goodness
of fit)]

H 0 : ...
H1 : ...

F=

_____ ___
= _ _ _ _ _ _ p = __________
______ ___

Moe se zakljuiti _____________________________________________________________


____________________________________________________________________________.
(c) Izraunajte i objasnite znaenje pokazatelja reprezentativnosti linearne regresijske
jednadbe (koristite se rezultatima dobivenim pod (a) i (b)).

R2 =

____
= 0,9388232
____

Y =

_____
2,7473
= 2,7473 ; VY =
100 = 9,1577%
___ _ _
_____

Koeficijent determinacije ( R 2 ) pokazuje ___________________________________________


____________________________________________________________________________
____________________________________________________________________________.

51

Statistika analiza
Standardna pogreka regresije ( Y ) pokazuje _______________________________________
____________________________________________________________________________.
Koeficijent varijacije regresije ( VY ) pokazuje _______________________________________
____________________________________________________________________________.
(d) Izraunajte i objasnite znaenje rezidualnog odstupanja za sedmo opaanje? Izraunajte
standardiziranu vrijednost rezidualnog odstupanja! Koja se opaanja (poduzea) mogu
identificirati kao netipina opaanja (engl. outliers)? [Multiple Regression results
Residuals/assumptions/prediction Perform residual analysis Quick Summary:
Residuals & predicted]
Rezidualno odstupanje za sedmo opaanje iznosi e7 = _ _ _ _ _ _ _ _ _ _ _ _ = 2 ,3172 .
Rezidualno odstupanje e 7 pokazuje ____________________________________________
____________________________________________________________________________.
Standardizirana vrijednost rezidualnog odstupanja je 2,3172 / _ _ _ _ _ _ = 0 ,84346 .
Netipina opaanja su poduzea pod rednim brojem:________________________________.
(e) Kreirajte transformirane vrijednosti varijabli broja zapolsenih i prihoda u mil. kn u
logaritamskom obliku po bazi 10. [Insert Add Variables How many: 1, After: 8,
Name: log(zaposleni) Long name (Functions): =Log10(v5) OK; Insert Add
Variables How many: 1, After: 9, Name: log(prihodi) Long name (Functions):
=Log10(v1) OK]. Nakon transformacije varijabli procijenite dvostruko-logaritamsku
jednadbu regresije u linearnom obliku (koristite proceduru Multiple Regression kao
pod (a)). Napiite jednadbu regresije u originalnom obliku. Protumaite znaenje
i
!
procijenjenih parametara
0
1
Dvostruko-logaritamska regresija u linearnom obliku log yi = _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ .
Dvostruko-logaritamska regresija u originalnom obliku yi = _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ .
iznosi:______________, te pokazuje __________________________________
Parametar
0

____________________________________________________________________________.
iznosi:______________, te pokazuje ___________________________________
Parametar
1
____________________________________________________________________________
____________________________________________________________________________.
(f) Za dvostruko-logaritamski model regresije izraunajte vrijednosti koeficijenta
determinacije i koeficijenta varijacije regresije. Dobivene pokazatelje usporedite s
pokazateljima u zadatku pod (c), te odgovorite koji je model regresije reprezentativniji
(linearni ili dvostruko-logaritamski model)?

R2 =

_____
= ______
_____

_____
; Vlog Y =
100 = _ _ _ _ _%
_____

Reprezentativniji je _____________________________ model regresije!

52

Statistika analiza
(g) Prema reprezentativnijem modelu regresije izraunajte prognostiku vrijednost broja
zaposlenih kada prihod poduzea iznosi 10 mil. kn. Dodatno, izraunajte granice
pouzdanosti prognostike vrijednosti na 99%-tnoj razini. [Multiple Regression results
Residuals/assumptions/prediction Compute prediction limits Alpha: 0,01
Predict dependent variable log(prihodi): 1 OK]

log y(log X =1) = _ _ _ _ _ _ _ _ y( X =10) = _ _ _ _ _ _ _ _ zaposlenih.

{
Pr { _ _ _ _ _ _ _ _ < y

Pr _ _ _ _ _ _ _ _ < log y(log X =1) < _ _ _ _ _ _ _ _ = 0,99


( X =10 )

< _ _ _ _ _ _ _ _ _ = 0,99

(h) Procijenite regresijski polinom drugog stupnja. Napiite kako glasi regresijska jednadba.
Jesu li procijenjeni parametri statistiki znaajni. Dijagramom rasipanja usporedite
regresijske i stvarne vrijednosti broja zaposlenih. [Statistics Advanced
Linear/Nonlinear Models Nonlinear estimation User-specified regression, least
squares OK Function to be estimated. Unutar prozora Estimated function upiite:
v5=b0+b1*v1+b2*v1^2 OK OK OK Quick Summary: Parameter estimates.
Nadalje, da bi kreirali dijagram rasipanja izaberiteResults: Poduzeca Fitted 2D
function & observed vals]

Scatterplot of Broj zaposlenih against Prihod u mil. kn


Poduzeca 8v*50c

Broj zaposlenih = -6,433+0,4986*x-0,0011*x^2


60

50

Broj zaposlenih

40

30

20

10

-10
0

20

40

60

80

100

120

140

160

180

200

220

Prihod u mil. kn

53

Statistika analiza
4.3. VIESTRUKA REGRESIJA

Ako pretpostavimo da se linearna regresijska veza izmeu regresand varijable Y i


odabranog skupa regresorskih varijabli X 1 , X 2 , X 3 , ..., X k eli utvrditi na osnovu n
opaanja, tada se vektorska jednadba moe napisati u obliku sustava od n jednadbi:

y1 = 0 + 1 x11 + 2 x12 + ... + j x1 j + ... + k x1k + e1


y 2 = 0 + 1 x 21 + 2 x 22 + ... + j x 2 j + ... + k x 2 k + e2
y i = 0 + 1 xi 1 + 2 xi 2 + ... + j xij + ... + k xik + ei

y n = 0 + 1 x n1 + 2 x n 2 + ... + j x nj + ... + k x nk + en

Sustav jednadbi se moe zapisati u matrinom obliku:

y = X +e,
pri emu je:

y1
y
2


y = yi



y
n

X = 1

x11 x12

x1 j

x 21 x 22

x2 j

xi 1 xi 2

xij

x n1 x n 2

x nj

x1 k
0
e1


e
x2 k
1
2



xik = i e = ei

e
x nk
n
k

U matrinom zapisu y je vektor stupac opaenih vrijednosti zavisne varijable, X je


matrica vrijednosti nezavisnih varijabli sa n redaka i (k+1) stupaca, je vektor stupac
nepoznatih parametara, dok vektor e predstavlja n -dimenzionalni sluajni vektor.

Model viestruke linearne regresije ima oblik:

yi = 0 + 1 x1,i + 2 x2 ,i + ... + k xk ,i + ei
54

Statistika analiza

Prilikom procjene nepoznatih parametara metodom najmanjih kvadrata pretpostavka o


normalnosti distribucije sluajnog vektora nije bitna. Ista je vana zato da bi se mogli
provesti postupci testiranja hipoteza o znaajnosti pojedinih parametara i modela kao
cjeline, te ostali dijagnostiki testovi.

Cilj metode najmanjih kvadrata jest minimizirati zbroj kvadrata odstupanja sluajnih
varijabli ei na temelju vrijednosti iz uzorka:

min( e T e )

min(( y X )T ( y X ))

S obzirom da su u toki u kojoj funkcija dostie minimum njene prve parcijalne


derivacije jednake nuli, tada se minimizacija funkcije svodi na rjeavanje sustava
slijedeih jednadbi:

( e T e )
=0
j

j = 0 ,1,2 ,..., k

XT( y X )=0

Ako sustav jednadbi sredimo u matrinom obliku dobije se:

XT y = XT X
odnosno:

= ( X T X ) 1 X T y

Moe se zakljuiti da vektor y predstavlja ortogonalnu projekciju vektora y na kdimnezionalni prostor:

y = X

Parametri j su nestandardizirani regresijski koeficijenti, koji pokazuju oekivanu


promjenu zavisne varijable ako se varijabla X j promijeni za jednu jedinicu uz
pretpostavku da se ostale varijable nee promijeniti (pretpostavka ceteris paribus).

t =
*
j

Se ( j )

Y S jj S jj = diag ( X T X )
; Se ( j ) =

j = 1, 2,...,k
55

Statistika analiza

Parametri b j su standardizirani regresijski koeficijenti, koji pokazuju za koliko


standardnih devijacija e se promijeniti varijabla Y ako se varijabla X j promijeni za
jednu standardnu devijaciju:20

b j = j

j = 1, 2, ..., k

Pretpostavke viestrukog regresijskog modela su:

(a) Linearnost: varijabla Y je linearna funkcija X-eva.


(b) Homoskedastinost: varijanca reziduala je konstantna i konana, odnosno reziduali su
nezavisno
distribuirani
o
regresorskim
varijablama
(ispituje
se
problem
heteroskedastinosti).
(c) Normalnost: reziduali su normalno distribuirani s oekivanjem jednakim nuli.
(d) Nezavisnost 1: rezidualna odstupanja su meusobno nezavisna (ispituje se problem
autokorelacije prvog ili vieg reda).
(e) Nezavisnost 2: regresorske varijable su meusobno nezavisne (ispituje se problem
multikolinearnosti).

Problemi multikolinearnosti su:


(a)
(b)
(c)
(d)

Problem invertiranja matrice X T X ,


Visoke standardne pogreke procijenjenih parametara,
Nepouzdane ocijene parametara (moda i netonog predznaka) i
Relevantne varijable nisu statistiki znaajne.

Ozbiljan problem multikolineranosti postoji ako je barem jedan od koeficijenata


linearne korelacije nultog reda izmeu dviju regresorskih varijabli po apsolutnoj
vrijednosti vei od koeficijenta multiple linearne korelcije ( rij > R ).21

20

Standardizirani regresijski koeficijenti, za razliku od nestandardiziranih, omoguuju usporedbu relativne


vanosti pojedinih regresorskih varijabli u modelu viestruke regresije.
21
Ozbiljan problem multikolinearnosti moe postojati ako je koeficijent determinacije dovoljno velik ( R 2 0, 7 ),
a istovremeno su vrijednosti empirijskih t-omjera visoke.

56

Statistika analiza

Testiranje jeli multikolinearnost ozbiljan problem moe se provesti pomou FarrarGlauberovog testa. Nultom hipotezom se pretpostavlja da je korelacijeka matrica C
jedinina matrica:

H 0 :... C = I
H1 :... C I

2 = n 1 ( 2k + 5 ) ln ( det C )
6

Problem multikolinearnosti se moe otkriti ako je faktor inflacije varijance (engl.


Variance Inflation Factor) vei od 5 ili alternativno ako je tolerancija manja od 0,2.

VIFj =

1
1
=
2
1 R j TOL j

Problem autokorelacije najee se pojavljuje zbog netone specifikacije modela ili krivo
odabranog funkcionalnog oblika samog modela, a moe se otkriti analizom rezidualnih
odstupanja. Taj problem se javlja ee kod vremenskih regresijskih modela (engl. time
series regression) nego kod prostornih (engl. cross-section regression).

Testiranje znaajnost autokorelacije rezidualnih odstupanja prvog reda ( ) provodi se


pomou Durbin-Watson testa:22
n

2
( et et 1 )

DW = t =2

et

t =1

Zadatak 4.3.1. Koristei podatke iz datoteke Poduzeca.xls napravite slijedee:


(a) Procijenite parametre viestruke regresije koja pokazuje zavisnost ostvarenih prihoda o
zaduenosti poduzea i broju zaposlenih. Kako glasi dobivena regresijska jednadba?
to pokazuju procijenjeni parametri? Da li su procijenjeni parametri statistiki
znaajni?
(b) Regresijske vrijednosti prikaite u trodimenzionalnom prostoru.
(c) Pomou analize varijance testirajte znaajnost regresijskog modela kao cjeline
(postavite odgovarajue hipoteze).
22

Problem autokorelacije vieg reda se testira pomou Ljung-Box testa. Grafiki prikaz koeficijenta autokorelacije
za vie vremenskih pomaka naziva se korelogram.

57

Statistika analiza
(d) Koliko iznosi standardna pogreka regresije. to ona pokazuje? Na temelju odgovarajue
relativne mjere disperzije ocijenite reprezentativnost viestruke (multiple) regresije.
(e) Protumaite znaenje korigiranog koeficijenta determinacije.
(f) Izraunajte prognostike granice procjene prihoda poduzea kada zaduenost iznosi 0,5
i broj zaposlenih 50, na temelju razine pouzdanosti od 90%.
(g) Napiite regresijsku jednadbu u standardiziranom obliku, te odgovorite koja od
regresorskih varijabli ima vei relativan utjecaj na promatranu regresand varijablu?
(h) Ispitajte je li postoji problem kolinearnosti izmeu skupa regresorskih varijabli!
(i) Protumaite znaenje parcijalnih koeficijenata korelacije.
(j) Ispitajte jesu li rezidualna odstupanja autokorelirana s pomakom jedan!

Rjeenje 4.3.1. Unutar glavnog izbornika Statistics potrebno je izabrati Multiple Regression.
Nakon to izaberete koja je varijabla zavisna, a koje su varijable nezavisne kliknite OK.
Unutar prozora Multiple Regression Results u kartici Advanced izaberite Summary:
Regression results.
(a)

(b) Da bi regresijske vrijednosti prikazali u 3D prostoru koristite se izborom opcija Graphs


Surface Plots. Unutar prozora 3D Surface Plots izaberite linearnu plohu (ravninu).23
Zatim aktivirajte opciju Show raw data points, kao to je prikazano na slici.

23

Grafiko prikazivanje s vie od dvije regresorske varijable je vrlo sloeno jer se radi o hiperravninama.

58

Statistika analiza

(c)

(d) Y =

(e)

R2 =

8, 6951
75, 60 = 8, 6951 mil. kn prihoda VY =
100 = 9,11%
95, 4809

63802, 71
= 0,94724 R 2 = 0,945
67356,13

(f) Pr 136,5096 < y p < 168,5884 = 0,90


(g)

ZY = 0,16022 z1 + 0,83759 z2

b1 = 0,16022

b2 = 0,83759

59

Statistika analiza
(h) Da bi ispitali postojanje problema (multi)kolinearnosti izmeu varijabli x1 i x2 koristite
se izborom opcija Multiple Regression Results Advanced Partial Correlations.

1
1
=
= 3, 0484
0,32804 1 0, 67196
TOL j > 0, 2 VIFj < 5, 0 ne postoji kolinearnost
TOL1 = TOL2 = 0,32804 VIF1 = VIF2 =

(i) r12.3 = 0,371016

r13.2 = 0.901951

(j) Da bi ispitali postojanje problema autokorelacije prvoga reda potrebno je izraunati


vrijednost Durbin-Watson testa. Koristite se izborom opcija Multiple Regression Results
Residuals/assumptions/prediction Perform residual analysis Advanced
Durbin-Watson statistic.

H 0 :... = 0
H1 :... > 0

dUk = 2, n =50 = 1.628


DW > dU H 0
VJEBA BR. 51

(a) U program STATISTCA unesite podatke iz zadatka 12.11 na str. 234 udbenika
"Statistika za ekonomiste". Izraunajte ocjene parametara jednadbe viestruke regresije.
Zavisna varijabla je stopa nataliteta, dok su ostale varijable nezavisne. Objasnite
znaenje svakog parametra pojedinano.[Statistics Multiple Regression Quick
Variables (Dependent: Stopa nataliteta, Independent: Postotak nepismenih - Broj
lijenika na 1000 stanovnika) OK Advanced Summary: Regression results]

60

Statistika analiza
iznosi:______________, te pokazuje __________________________________
Parametar
0

____________________________________________________________________________.
iznosi:______________, te pokazuje ___________________________________
Parametar
1
____________________________________________________________________________
____________________________________________________________________________.
iznosi:______________, te pokazuje __________________________________
Parametar
2
____________________________________________________________________________
____________________________________________________________________________.
Regresijska jednadba je oblika yi = ______________________________________________.
(b) Ispitajte znaajnost viestruke regresije standardnim F-testom. Signifikantnost testa
iznosi 1%. Postavite odgovarajue hipoteze! [Multiple Regression Results ANOVA
(Overall goodness of fit)]

H 0 : ...
H1 : ...

F=

____ ___
= _ _ _ _ _ _ p = __________
____ ___

Moe se zakljuiti ____________________________________________________________


____________________________________________________________________________.
(c) Ispitajte znaajnost parametara u regresiji na nivou 5% signifikantnosti (koristite se
rezultatima dobivenim pod (a)). Postavite odgovarajue hipoteze!

H 0 : ...0 =

H 0 : ...1 =

H 0 : ...2 =

H1 : ...0

H1 : ... 1

H1 : ... 2

t0 = _ _ _ _ _ p = _______; t1 = _ _ _ _ _ p = ______;t2 = _ _ _ _ _ p = _______


Statistiki je znaajan parametar_______, dok ostali parametri nisu statistiki znaajni!
(d) Izraunajte koeficijent determinacije i korigirani koeficijent determinacije. Protumaite
njihovo znaenje konkretno (koristite se rezultatima dobivenim pod (a)).

R2 =

____
=______ ;
____

R2 = _ _ _ _ _ _ _

Koeficijent determinacije ( R 2 ) pokazuje ___________________________________________


____________________________________________________________________________.
Korigirani (engl. adjusted) koeficijent determinacije ( R 2 ) pokazuje ____________________
____________________________________________________________________________
____________________________________________________________________________.

61

Statistika analiza
(e) Ako postotak nepismenih iznosi 3, a broj lijenika na 1000 stanovnika 22, kolika se stopa
nataliteta moe oekivati prema viestrukom regresijskom modelu? Izraunajte i granice
prognostike procjene na razini pouzdanosti od 90%. [Multiple Regression results
Residuals/assumptions/prediction Compute prediction limits Alpha: 0,10
Predict dependent variable Postotak3, Broj lijenika na22 OK]

y( X1 =3 ; X 2 =22) = _ _ _ _ _ _ _ Pr _ _ _ _ _ _ _ < y( X1 =3 ; X 2 =22) < _ _ _ _ _ _ _ = 0,99


(f) U program STATISTCA unesite podatke iz zadatka 12.12 na str. 239 udbenika
"Statistika za ekonomiste". Izraunajte ocjene parametara jednadbe viestruke regresije.
Objasnite znaenje svakog parametra pojedinano. [Statistics Multiple Regression
Quick Variables (Dependent: ..., Independent: ...) OK Advanced Summary:
Regression results]
iznosi:______________, te pokazuje __________________________________
Parametar
0
____________________________________________________________________________.
iznosi:______________, te pokazuje ___________________________________
Parametar
1
____________________________________________________________________________
____________________________________________________________________________.
iznosi:______________, te pokazuje __________________________________
Parametar
2
____________________________________________________________________________
____________________________________________________________________________.
iznosi:______________, te pokazuje __________________________________
Parametar
3
____________________________________________________________________________
____________________________________________________________________________.
Regresijska jednadba je oblika: yi = _____________________________________________.
(g) Ispitajte znaajnost pojedinog parametra uz regresorske varijable (koristite rezultate pod
(f)). Ispitajte znaajnost viestruke regresije pomou F-testa. Nivo signifikantnosti iznosi
5%. [Multiple Regression Results ANOVA (Overall goodness of fit)]

t1 = _ _ _ _ _ _ p = __________ prihvaa se hipoteza _____


t2 = _ _ _ _ _ _ p = __________ prihvaa se hipoteza _____
t3 = _ _ _ _ _ _ p = __________ prihvaa se hipoteza _____
F=

______/ ___
= ________ p = __________ prihvaa se hipoteza _____
______ / ___

62

Statistika analiza
(h) Izraunajte vrijednost korigiranog koeficijenta determinacije i objasnite njegovo
znaenje konkretno (koristite rezultate pod (f)).
Korigirani koeficijent determinacije iznosi:____________, te pokazuje __________________
____________________________________________________________________________
____________________________________________________________________________.

(i) Ispitajte postoji li problem multikolinearnosti pomou pokazatelja tolerancije. [Multiple


Regression Results Advanced Partial correlations]

TOL1 = _ _ _ _ _ _ _ ; TOL2 = _ _ _ _ _ _ _ ; TOL3 = _ _ _ _ _ _ _


(j) Pomou standardiziranih regresijskih koeficijenata ispitajte koja od nezavisnih varijabli
ima najvei utjecaj na zavisnu varijablu (koristite rezultate pod (f))?

b1 = _ _ _ _ _ _ _ ; b2 = _ _ _ _ _ _ _ ; b3 = _ _ _ _ _ _ _

63

Statistika analiza
5. BROJANA ANALIZA VREMENSKIH NIZOVA I GRAFIKO PRIKAZIVANJE

Prve diferencije vrijednosti vremenskog niza:

yt = yt yt 1

t = 2 ,3, 4 ,...,T

Druge diferencije vrijednosti vremenskog niza:

2 yt = yt yt 1 = yt 2 yt 1 + yt 2

Sezonske diferencije, npr. za kvartalne podatke raunaju se sezonske diferencije prvih


diferencija s pomakom 4:

yt yt 4 = ( yt yt 1 ) ( yt 4 yt 5 )

t = 6 , 7 ,8,...,T

Prosjena prva diferencija:

yt =

t = 3, 4 ,5,...,T

(y

y1 ) + ( y3 y2 ) + ... + ( yT yT 1 )
T 1

yT y1
T 1

Pojedinane stope promjene (diskretne):

St = Vt 100 = t 100 100 = ....%


yt 1

Pojedinane stope promjene (kontinuirane):

y
St = ( ln yt ln yt 1 ) 100 = ln t 100 = ....%
yt 1

Pojedinane stope promjene na stalnoj bazi:

St = I t 100 = t 100 100 = ....%


yb

Prosjena stopa promjene na temelju koeficijenata dinamike verinih indeksa:

St =

T 1

v2 v3 v4 ... vn 1 100 = T 1 T 1 100 = ....%


y1

Ako je geometrijska sredina reprezentativna srednja vrijednost tada se moe upotrijebiti


u prognostike svrhe:

yT + k = yT G k

G = T 1

yT
I
= T 1 T
y1
I1

64

Statistika analiza

Posebni oblici skupnih indeksa koji se najee pojavljuju u praktinim primjenama jesu
skupni indeks potroakih cijena kao posebni skupni indeks cijena, te skupni indeks
fizikog obujma kao posebni skupni indeks koliina.

Indeks potroakih cijena (engl. Consumer Price Index) odraava promjene u razini
cijena dobara i usluga koje kupuje referentno stanovnitvo radi finalne potronje.
Izraunava se kao ponderirana (vagana) aritmetika sredina Laspeyresovog tipa za
reprezentativnu koaricu koju ini 540 proizvoda, a za pondere se uzimaju udjeli u
potronji rezidentnih kuanstava koji se temelje na rezultatima Ankete o potronji
kuanstava. Namjena indeksa potroakih cijena je slijedea:

mjerenje inflacije
indeksiranje plaa
deflacioniranje pojedinih kategorija na makro-razini

Zadatak 5.1. U programu STATISTICA otvorite novu bazu podataka iz datoteke pod
nazivom Vremenski nizovi.xls koristei Excelovo suelje. Vremenski niz prosjenih
nominalnih neto plaa prikaite odgovarajuim grafikonom. Izraunajte bazne indekse
potroakih cijena (prosinac 2002=100). Na temelju baznih indeksa izraunajte vrijednosti
realnih plaa. Vrijednosti realnih i nominalnih plaa usporedite na istom grafikonu.
Objasnite odnos izmeu nominalne i realne plae u kolovozu 1996. godine, te u kolovozu
2005. godine.

Rjeenje 5.1. U programu STATISTICA otvorite datoteku Vremenski nizovi.xls izborom


opcija File Open File name: Vremenski nizovi Open. U slijedeem koraku
izaberite Open as an Excel Workbook. Izborom te opcije omoguuje se koritenje Excelova
suelja to znaajno olakava izraun odgovarajuih indeksa pomou osnovnih
matematikih operacija.

Nakon otvaranja Excelove radnje knjige pojavljuje se radni list pod nazivom trziste rada
i cijene. Iz slike se vidi kako Excelova radna knjiga sadri vie radnih listova pod
razliitim nazivima, npr. turizam i trgovina itd. Vrijednosti vremenskih nizova
uglavnom su prikupljeni na mjesenoj razini.

65

Statistika analiza

Da bi grafiki prikazali kretanje prosjenih nominalnih neto plaa u glavnoj izbornikoj


traci izaberite Graphs 2D Graphs Line plots (Variables)..., kao to je prikazano na
slici.

66

Statistika analiza

esto je potrebno promijeniti ili tono specificirati adresu prvog stupca u kojem se
nalaze prikupljeni podaci i adresu stupca u kojem se nalazi vremensko obiljeje. Kako su
u prvom stupcu navedeni mjeseci potrebno je podesiti Read case names from column: A.
To znai da se podaci, koji e se analizirati, nalaze u ostalim stupcima poevi od drugog
stupca. Zato je takoer potrebno podesiti First data column: B.

Nakon to unutar prozora 2D Line Plots Variables izaberete koji vremenski niz elite
prikazati grafiki kliknite OK.

Na X osi grafikog prikaza nalaze se datumi odnosno mjeseci u kojima su vrijednosti


nominalnih neto plaa opaene. Program automatski jedinice vremena stavlja na os X jer
je prilikom otvaranja Excelove radnje knjige bila postavljena opcija Read case names

from column: A.
67

Statistika analiza

Da bi izraunali prosjene realne neto plae potrebno je preraunati verine indekse


potroakih cijena na bazne indekse potroakih cijena koristei se opcijom kopiranja
formule u Excelovom suelju (baza je prosinac 2002. godine).

Slijedea slika prikazuje postupak preraunavanja verinih indeksa u bazne indekse


iznad baze i ispod baze, koristei se adresama elija.

Nakon preraunavanja verinih indeksa na bazne indekse potroakih cijena potrebno je


izraunati vrijednosti prosjenih realnih neto plaa, koristei se adresama elija i
kopiranjem osnovne formule:

Re a ln a plaa =

No min a ln a plaa
100
bazni IPC
68

Statistika analiza

Nakon to ste izraunali prosjene realne neto plae, iste usporedite s nominalnim
plaama na istom grafikonu (ponovno pokrenite prozor 2D Line Plots Variables , te
izaberite tip grafa: Multiple).

Napomena: U ovom primjeru koritene su formule za preraunavnje verinih indeksa


potroakih cijena u bazne indekse potroakih cijena ispod i iznad baze:

Ispod baze :

It =

I t 1 Vt
100

Iznad baze :

I t 1 =

It
100
Vt
69

Statistika analiza
Line Plot of multiple variables
Vremenski nizovi (B2:DV126) 10v*125c
5000

4500

4000

Prosjena nom neto plaa


Prosjena realna neto plaa

3500

3000

2500

2000

1500
1.1.1996
1.7.1997
1.1.1999
1.7.2000
1.1.2002
1.7.2003
1.1.2005
1.10.1996
1.4.1998
1.10.1999
1.4.2001
1.10.2002
1.4.2004
1.10.2005

Zadatak 5.2. U programu STATISTICA otvorite novu bazu podataka iz datoteke pod
nazivom Vremenski nizovi.xls koristei Excelovo suelje. Koristei se podacima iz radnog
lista pod nazivom trziste rada i cijene izraunajte bazne indekse nezaposlenih uzimajui za
bazu mjesec sijeanj 2001. godine. Objasnite znaenje dobivenog indeksa u mjesecu svibnju
2006. godine konkretno. Izraunajte verine indekse nezaposlenih, te prosjenu stopu
promjene nezaposlenih pomou Excelove funkcije =GEOMEAN(...).

Rjeenje 5.2. U programu STATISTICA otvorite datoteku Vremenski nizovi.xls izborom


opcija: File Open File name: Vremenski nizovi Open. U slijedeem koraku
izaberite opciju Open as an Excel Workbook. Koristei Excelovo suelje rijeite zadatak.
Bazni indeks nezaposlenih u svibnju 2006. godine iznosi: __________, to pokazuje _______
____________________________________________________________________________
____________________________________________________________________________.
Geometrijska sredina verinih indeksa iznosi: ______________, to pokazuje ____________
____________________________________________________________________________.

Zadatak 5.3. Koristei se podacima iz udbenika Statistika za ekonomiste pomou


programa STATISTICA rijeite zadatak 13.5 (str. 269).

Rjeenje 5.3. U programu STATISTICA otvorite novi radni list u kojem ete unijeti podatke
iz primjera 13.5 (investicije u graevinske radove, opremu i ostalo). Nakon unosa podataka

70

Statistika analiza
pokrenite prozor 2D Line Plots Variables , te u kartici Advanced izaberite tip grafa:
Double-Y. Na lijevoj ordinati oznaite varijablu: graevinski radovi i oprema, a na desnoj
ordinati: ostalo.

Nadalje, unutar kartice Options 1 u dijalikom okviru Case labels izaberite Variable:
Godina. Za skalu na osi Y izaberite tip logaritamske skale (Axis: Y, Type: Logarithmic).

71

Statistika analiza
Line Plot of multiple variables
Spreadsheet1 4v*13c
100000
90000
80000
70000
60000
50000

Graevinski radovi(L)
Oprema(L)
Ostalo(R)

18000
17000
16000
15000
14000
13000
12000
11000
10000
9000
8000

40000

7000
6000

30000

5000
4000

20000

3000
2000

10000

1000

1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987

VJEBA BR. 61

(a) U program STATISTCA unesite podatke iz datoteke Vremenski nizovi.xls. Prilikom


importiranja podataka izaberite opciju Open as an Excel WorkBook. U novom stupcu
radnog lista trite rada i cijene izraunajte indekse nominalnih neto plaa na stalnoj
bazi iz prosinca 1999. godine. Objasnite znaenje dobivenog indeksa u oujku 2000.
godine! [U eliji J1 upiite: It nominalnih plaa u eliji J2 upiite formulu
=D2/$D$49*100 kopirajte formulu]
Bazni indeks nominalnih plaa u oujku 2000. godine iznosi:_________, te pokazuje______
____________________________________________________________________________
____________________________________________________________________________.
(b) Verine indekse potroakih cijena (ukupno) iz stupca G preraunajte u bazne indekse
potroakih cijena uzimajui za bazu mjesec prosinac 1999. godine. Izraunajte indekse
realnih plaa. Objasnite znaenje indeksa realnih plaa za mjesec lipanj 2001. godine. [U
eliji K1 upiete: Bazni IPC u eliji K49 upiite broj 100 u eliji K50 ispod baze
upiite formulu =K49*G50/100 kopirajte formulu prema dolje u eliji K48 iznad
baze upiite formulu =K49/G49*100 kopirajte formulu prema gore u eliji L1
upiite: It realnih plaa u eliji L2 upiite formulu =J2/K2*100 kopirajte formulu]

72

Statistika analiza
Bazni indeks realnih plaa u lipnju 2001. godine iznosi:___________, te pokazuje_________
____________________________________________________________________________
____________________________________________________________________________.
(c) U stupcu M izraunajte vrijednosti realnih plaa u kunama na temelju baznih indeksa
relanih plaa iz stupca L. Objasnite odnos realne i nominalne plae u svibnju 2006.
godine (jesu li u tom mjesecu realne plae bile vee ili manje od nominalnih, zato i za
koliko posto?). [U eliji M1 upiite: Realne plae u kunama u eliji M2 upiite
formulu =L2*3232/100 kopirajte formulu]
U svibnju 2006. godine realna plaa je iznosila:_______________kn, dok je nominalna plaa
iznosila:_______________kn, to znai ____________________________________________
____________________________________________________________________________
____________________________________________________________________________.
(d) Izraunajte i objasnite znaenje geometrijske sredine verinih indeksa potroakih
cijena (dobra) i geometrijske sredine verinih indeksa potroakih cijena (usluge).
[koristite formulu =GEOMEAN(H3:H126) i formulu =GEOMEAN(I3:I126)]
Geometrijska sredina verinih indeksa potroakih cijena za dobra iznosi:____________, to
pokazuje_____________________________________________________________________
____________________________________________________________________________.
Geometrijska sredina verinih indeksa potroakih cijena za usluge iznosi:___________, to
pokazuje_____________________________________________________________________
____________________________________________________________________________.

73

Statistika analiza
6. TREND

Vremenski niz, intervalni ili trenutani, moe biti stacionaran ili moe imati trend. Ako
vremenski niz sadri trend komponentu znai da ima dugoronu tendenciju rasta ili
pada. Za razliku od regresije kod trenda uvijek je nezavisna varijabla vrijeme (npr.
godine, mjeseci, tjedni, dani,...).

Najee se u praktinim primjenama koriste ovi trend modeli:

+
x
(a) Jednostavni linearni: yt =
0
1
t
(b) Trend polinom drugog stupnja:

+
x +
x2
yt =
0
1
t
2
t

(c) Eksponencijalni jednostavni trend:


X t ili y = e 0 + 1 X t
yt =
0
1
t

(d) Eksponencijalni sloeni trend (logaritamska parabola):


X t
X t2 ili y = e 0 + 1 X t + 2 X t2
yt =
0
1
2
t
(e) Asimptotski trend modeli (npr. modificirani eksponencijalni trend, Gompertzov trend
ili logistiki trend).

se procjenjuju kao i kod regresije primjenom


U trend modelima (a) do (d) parametri
j
metode najmanjih kvadrata, samo to varijabla Xt poprima vrijednosti: 0, 1, 2,....,T-1.

Asimptoski trend modeli pod (e) ne mogu se procijeniti metodom najmanjih kvadrata,
zato se nee dalje analizirati. Openito, asimptotski trend modeli za razliku od
jednostavnog eksponencijalnog trenda razlikuju se za dodatni parametar L koji
predstavlja vrijednost asimptote kojoj promatrana pojava tei u dugom roku, a nikada je
nee dostii.

Zadatak 6.1. U programu STATISTICA otvorite bazu podataka iz datoteke pod nazivom
Vremenski nizovi.xls koristei Excelovo suelje. Koristei se podacima iz radnog lista pod
nazivom financijski sektor izraunajte parametre jednostavnog linearnog trenda za varijablu
M1. Objasnite znaenje dobivenih rezultata konkretno! Prema linearnom trendu
prognozirajte vrijednost novane mase M1 u mjesecu rujnu 2011. godine. Izraunajte i
prognostike granice procjene na temelju 95%-tne razine pouzdanosti. Jednadbu linearnog
trenda prikaite odgovarajuim grafikonom.

74

Statistika analiza
Rjeenje 6.1. U programu STATISTICA otvorite datoteku Vremenski nizovi.xls izborom
opcijea File Open File name: Vremenski nizovi Open. U slijedeem koraku
izaberite opciju Open as an Excel Workbook. Unutar radnog lista financijski sektor
formirajte varijablu vrijeme s ishoditem na poetku promatranog razdoblje, tj. Xt =0, 1, 2,
3, 4, 5, 6, ...., 134, 135, 136. Koristei proceduru Multiple Regression, kao u poglavlju 4,
procijenite parametre linearnog trenda. Za zavisnu varijablu oznaite M1, a za nezavisnu
varijablu Xt, kao to je prikazano na slijedeoj slici.

Jednadba linearnog trenda glasi:

yt =

Konstantni lan iznosi:____________, te pokazuje___________________________________


____________________________________________________________________________.
Parametar uz varijablu vrijeme pokazuje___________________________________________
____________________________________________________________________________.
Koeficijent determinacije pokazuje_______________________________________________
____________________________________________________________________________.

75

Statistika analiza
Standardna pogreka procijenjenog linearnog trenda iznosi:_____________, dok koeficijent
varijacije trenda od ___________% pokazuje _______________________________________
____________________________________________________________________________.
Empirijski F-omjer iznosi: ________________. Pri empirijskoj razini signifikantnosti ______
______________________________________moe se prihvatiti hipoteza________________
____________________________________________________________________________.

Da bi prognozirali vrijednost novane mase M1 u buduem periodu pokrenite prozor


Multiple Regression Results, te unutar kartice Residuals/assumptions/prediction
izaberite opciju Compute prediction limits. Zatim izaberite Predict dependent variable,
te u dijalokom okviru za vrijednost varijable Xt upiite broj 200.

76

Statistika analiza

y( Xt = 200) = 54284 ,96

Pr 48450 ,14 < y( Xt = 200) < 60119 , 79 = 0 ,95


Scatterplot of M1 against Xt
Vremenski nizovi (B2:EH138) 13v*137c
M1 = 3332,0679+254,7645*x
45000
40000
35000

M1

30000
25000
20000
15000
10000
5000
-20

20

40

60

80

100

120

140

160

Xt

Zadatak 6.2. Koristei podatke iz radnog lista pod nazivom financijski sektor izraunajte
parametre trend polinoma drugog stupnja za varijablu: kamatna stopa na kunske kredite s
valutnom klauzulom (prosjek). Objasnite znaenje dobivenih rezultata konkretno! Prema
trend polinomu drugog stupnja izraunajte oekivane vrijednosti KS i procijenjene greke
relacije (rezidualna odstupanja). Objasnite znaenje rezidualnog odstupanja za mjesec
prosinac 1995. godine. Jednadbu procijenjenog trenda prikaite na dijagramu rasipanja.
Procijenite jednadbu eksponencijalnog trenda na istom grafikonu. Protumaite znaenje
dobivenih parametara eksponencijalnog trenda. Koji je model trenda reprezentativniji?

77

Statistika analiza
Rjeenje 6.2. Unutar radnog lista financijski sektor formirajte varijablu vrijeme s ishoditem
na poetku promatranog razdoblje, tj. Xt =0, 1, 2, 3, 4, 5, 6, ...., 134, 135, 136. Koristei
proceduru Nonlinear Estimation, kao u poglavlju 4, procijenite parametre trend polinoma
drugog stupnja definirajui funkciju oblika: v9=b0+b1*v13+b2*(v13^2).

Da bi izraunali oekivane vrijednosti KS i procijenjene greke relacije (rezidualna


odstupanja) unutar kartice Residuals prozora Results potrebno je izabrati Observed,
predicted, residual vals.

Rezidualno odstupanje za mjesec prosinac 1995. godine iznosi:__________________, to


znai _____________________________________________________________________
_________________________________________________________________________.

78

Statistika analiza

Da bi na istom dijagramu usporedili jednadbu trend polinoma i eksponencijalnog


trenda unutar prozora Results kartice Quick izaberiteFitted 2D function & observed
vals. Desnim klikom mia aktivirajte prozor Graph Properties (All Options)...., a zatim u
kartici Plot: Point Labels u dijalokom okviru Properties iskljuiti opciju Text labels.
Nadalje, u kartici Plot: General potrebno je iskljuiti opciju Markers..., a ukljuiti
Line...(Line width: 1,0). U zadnjem koraku u kartici Plot: Fitting potrebno je kliknuti na
gumb Add new fit, zatim u dijalokom okviru Fit type izabrati Exponential kao to je
prikazano na slici (novo dobivenu jednadbu moete oznaiti zelenom bojom da se
razlikuje od jednadbe trend polinoma).

79

Statistika analiza
Model: v9=b0+b1*v13+b2*(v13^2)

Y = 22,3815*exp(-0,01*x)
Function = y=(22,8101)+(-,21574)*x+(,685e-3)*(x^2)
30
28

KS na kunske kredite s v.k. (prosjek)

26
24
22
20
18
16
14
12
10
8
6
4
-20

20

40

60

80

100

120

140

160

Xt

Iz gornje slike se vidi da su oba nelinearna trend modela prikladna za opisivanje kretanja
kamatne stope na kunske kredite (izmeu dviju jednadbi nema znaajne razlike). Ipak,
potrebno je procijeniti parametre eksponencijalnog trenda i donjeti odluku o izboru boljeg
modela na temelju pokazatelja reprezentativnosti i dijagnostikih testova. Eksponencijalni trend
moe se izravno procijeniti u originalnom obliku, ba kao i trend polinom drugog stupnja,
definirajui funkciju: v9=b0*b1^v13 u dijalokom okviru Function to be estimated
procedure Nonlinear Estimation.

Trend polinom drugog stupnja:

yt = 22,81014 0, 21574 xt + 0, 00069 xt2

pokazuje prosjenu
Prema trend polinomu drugog stupnja procijenjeni parametar
1

promjenu pojave u jedinici vremena, dok su promjene promjena uzastopnih trend


, tj. 2 y = 2
. To znai da se
vrijednosti u jedinici vremena konstantne i jednake 2
2
2
t
kamatna stopa u promatranom periodu mjeseno smanjivala u prosjeku za 0,2157% s tim
da se pad kamatne stope u prosjeku mjeseno poveavao za 0,00138%.

80

Statistika analiza

Eksponencijalni trend:

yt = 22 ,3815 e 0 ,010218 X t ili

yt = 22 ,88604 0 ,98983 X t

Prema eksponencijalnom trendu prosjena


S = 1, 017% odnosno S = 1, 002% .

mjesena

stopa

promjene

iznosi

Svi procijenjeni parametri u promatranim modelima su statistiki znaajni, a bolji se


pokazuje trend polinom drugog stupnja jer je procijenjena prosjena kvadratna pogreka
tog trenda manja (iznosi 3,332 u odnosu na 3,420) iako nema znaajne razlike izmeu
procijenjenih koeficijenata determinacije.

VJEBA BR. 71

(a) U program STATISTCA unesite podatke iz primjera 16.6 na str. 234 udbenika
"Statistika za ekonomiste" (prilikom importiranja podataka iz datoteke Zadatci iz
udzbenika.xls koristite opciju Insert selected sheet to a Spreadsheet 16.6 OK
Get variable names from first row OK). Izraunajte ocjene parametara jednadbe


X t
X t2 (logaritamska parabola). Kreirajte transformirane vrijednosti
trenda: Yt =
0
1
2
varijable broja stanovnika u logaritamskom obliku po bazi 10. Formirajte varijablu
vrijeme (Xt) s ishoditem na poetku promatranog razdoblja, a ne s ishoditem na sredini
promatranog razdoblja kao u udbeniku (promijenom ishodinog razdoblja mijenja se
, dok procijenjene vrijednosti ostalih parametara ostaju
vrijednost parametra
0
nepromijenjene). [Insert Add Variables How many: 1, After: 2, Name: log(Yt)
Long name (Functions): =Log10(v2) OK; Insert Add Variables How many: 1,
After: 3, Name: Xt OK upiite brojeve 0, 1, 2, 3, ..., 8; Insert Add Variables
How many: 1, After: 4, Name: Xt^2 Long name (Functions): =v4^2 OK ].
Jednadbu trenda napiite u logaritamskom (linearnom) i originalnom (nelinearnom)
obliku. Objasnite znaenje procijenjenih parametara konkretno! [Statistics Multiple
Regression Quick Variables (Dependent: log(Yt), Independent: Xt Xt^2 )
OK Advanced Summary: Regression results]
Jednadba trenda u logaritamskom obliku je log yi = _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ .
Jednadba trenda u originalnom obliku je yi = _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __ .
iznosi:______________, te pokazuje _________________________________
Parametar
0

____________________________________________________________________________.

81

Statistika analiza
iznosi:______________, te pokazuje _________________________________
Parametar
1

____________________________________________________________________________
____________________________________________________________________________.

iznosi:______________, te pokazuje _________________________________


Parametar
2
____________________________________________________________________________
____________________________________________________________________________.
(b) Testirajte znaajnost procijenjenog trenda F-testom. Postavite odgovarajue hipoteze!
[Multiple Regression Results ANOVA (Overall goodness of fit)]

H 0 : ...
H1 : ...

F=

______ ___
= _ _ _ _ _ _ p = ______
______ ___

Moe se zakljuiti ____________________________________________________________


___________________________________________________________________________.
(c) Ocijenite reprezentativnost trenda odgovarajuom apsolutnom i relativnom mjerom
disperzije (koristite rezultate pod (a) i (b))

log Y =

_______
______
= __________ ; Vlog Y =
100 = _______ %
___ _ ___
_______

Na temelju koeficijenta varijacije procijenjenog trenda moe se zakljuiti da je trend model


(a) reprezentativan ili (b) nije reprezentativan (zaokruite toan odgovor)!

(d) U program STATISTCA unesite podatke iz zadatka 16.9 na str. 337 udbenika "Statistika
za ekonomiste" (prilikom importiranja podataka iz datoteke Zadatci iz udzbenika
koristite opciju Insert selected sheet to a Spreadsheet 16.9 OK Get variable
names from first row OK). Formirajte varijablu vrijeme (Xt) s ishoditem na poetku
promatranog razdoblja, a ne s ishoditem na sredini promatranog razdoblja kao u
udbeniku. [Insert Add Variables How many: 1, After: 2, Name: Xt OK
upiite brojeve 0, 1, 2, 3, ..., 10]. Odredite parametre optimalnog trend-polinoma
(procijenite parametre trend-polinoma prvog stupnja, drugog stupnja, treeg stupnja i
etvrtog stupnja). [Statistics Advanced Linear/Nonlinear Models Nonlinear
estimation User-specified regression, least squares OK Function to be
estimated. Unutar dijalokog okvira Estimated function upiite v2=b0+b1*v3 OK
OK OK Quick Summary: Parameter estimates ponovite postupak za trendpolinom drugog stupnja tako da unutar dijalokog okvira Estimated function upiete
v2=b0+b1*v3+b2*v3^2 OK OK OK Quick Summary: Parameter estimates
ponovite postupak za trend-polinom treeg stupnja tako da unutar dijalokog okvira

82

Statistika analiza
Estimated function upiete v2=b0+b1*v3+b2*v3^2+b3*v3^3 OK OK OK Quick
Summary: Parameter estimates ponovite postupak za trend-polinom etvrtog
stupnja tako da unutar dijalokog okvira Estimated function upiete
v2=b0+b1*v3+b2*v3^2+b3*v3^3+b4*v3^4 OK OK OK Quick Summary:
Parameter estimates]
Jednadba trend polinoma prvog stupnja je yi = _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ .
Jednadba trend polinoma drugog stupnja je yi = _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ .
Jednadba trend polinoma treeg stupnja je yi = _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ .
Jednadba trend polinoma etvrtog stupnja je yi = _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ .
Da bi odredili optimalan trend-polinom potrebno je testirati kada e smanjenje rezidualnog
zbroja kvadrata odstupanja (engl. Residual Sum of Squares) biti statistiki beznaajno
(pogledati str. 337 iz udbenika). To znai da je za svaki od procijenjenih trend polinoma
potrebno izvriti analizu varijance izborom opcija Results: ... Quick Analysis of
Variance.
Optimalan trend-polinom je ________________ stupnja jer je _________________________
____________________________________________________________________________
____________________________________________________________________________.
(e) Ocjenite znaajnost optimalnog trend polinoma pod (d) na temelju standardne pogreke
trenda i koeficijenta varijacije trenda (koristite se rezultatima pod (d))!

Y =

_______
______
= __________ ; VY =
100 = _______ %
___ _ ___
_______

Na temelju koeficijenta varijacije procijenjenog trenda moe se zakljuiti da je trend model


(a) reprezentativan ili (b) nije reprezentativan (zaokruite toan odgovor)!
(f) Koliko iznosi koeficijent determinacije optimalnog trend polinoma? Objasnite njegovo
znaenje konkretno!

R2 =

_____
= __________
______

Koeficijent determinacije ( R 2 ) pokazuje _________________________________________


____________________________________________________________________________
____________________________________________________________________________.
i
prema trend polinomu prvog stupnja!
(g) Objasnite znaenje parametra
0
1

83

Statistika analiza
iznosi:______________, te pokazuje __________________________________
Parametar
0

____________________________________________________________________________.
iznosi:______________, te pokazuje ___________________________________
Parametar
1

____________________________________________________________________________
____________________________________________________________________________.
(h) Trend polinom prvog stupnja i trend polinom drugog stupnja usporedite na istom
grafikonu! [Graphs Scatterplots... Variables (X: Xt Y: Proizvodnja u 000 kom.)
OK dvostrukim klikom mia toke zamijenite linijom (iskljuite Markers; ukljuite
Line) OK nakon desnog klika miem izaberite Graph Properties (All Options)...
Plot: Fitting Add new fit Fit type: Polynomial OK]
Scatterplot of Proizvodnja u 000 kom. against Xt
Zadatci iz udzbenika 3v*11c
Proizvodnja u 000 kom. = 132,9545+50,9545*x
Proizvodnja u 000 kom. = 99,6503+73,1573*x-2,2203*x^2
700

Proizvodnja u 000 kom.

600
500
400
300
200
100
0
-2

10

12

Xt

(i) Prema trend-polinomu drugog stupnja kolika proizvodnja se moe oekivati u 2012.
godini?

( Xt =16; Xt2 =256)

= __________ tisua kom.

84

Statistika analiza
7. MJERENJE I ELIMINIRANJE SEZONSKIH VARIJACIJA

Kod modeliranja vremenskih nizova cilj je pronai onaj analitiki izraz, tj. jednadbu
kojom se najbolje opisuje ili predoava kretanje promatrane pojave u ovisnosti o
vremenu ( xt ). U prethodnom poglavlju su navedeni oblici deterministikog trenda:
linearnog, eksponencijalnog i trend polinoma. Na primjer, ako su prve diferencije
promatranog vremenskog niza priblino jednake i konstantne ( yt const. ) moe se
zakljuiti da isti sadri linearni trend ili ako su druge diferencije priblino jednake i
konstantne ( 2 yt const. ) moemo zakljuiti da se vremenski niz razvija prema trend
polinomu drugog stupnja. Ako su pak pojedinane stope promjene verinih indeksa
priblino jednake ( St const. ) moemo zakljuiti da vremenski niz sadri
eksponencijalni trend.

Osim deterministikog trenda vremenski niz moe sadrati i stohastiki trend.


Vremenski niz koji sadri deterministiki i/ili stohastiki trend nije stacionaran. Najei
sluaj stohastikog trenda je vremenski niz koji slijedi proces sluajnog pomaka (engl.
random walk). Stohastiki trend se najee moe ukloniti prvim ili drugim
diferencijama. Ako je vremenski niz diferenciran d puta da bi se postigla stacionarnost
tada se kae da je integriran reda d. Oznaka I ( d ) pokazuje red integracije vremenskog
niza. Na primjer, I (1) pokazuje da je vremenski niz integriran reda jedan, te da je
potrebno izraunati prve diferencije da bi se postigla stacionarnost, dok I ( 2 ) pokazuje
da je vremenski niz integriran reda dva, te da je niz potrebno diferencirati dva puta da bi
se postigla stacionarnost. Vremenski niz I ( 0 ) je stacionaran (ne sadri stohastiki
trend).

Ekonomski vremenski nizovi osim trenda (deterministikog i/ili stohastikog) mogu


sadrati i druge periodine komponente, npr. sezonske ili ciklike. Dva su temeljna
pristupa u analizi sezonskih varijacija odnosno pojava. Prvi se pristup sastoji u
dekompoziciji vremenskog niza na trend-cikliku, sezonsku i iregularnu komponentu
na temelju pominih procjeka (engl. moving average). Ovaj klasian pristup
dekompozicije vremenskog niza na temelju pominih prosjeka ima obiljeja
neparametrijske statistike. Drugi pristup ima obiljeja parametrijske statistike kojim se
definira model stohastikog procesa koji generira vremenski niz.

Postoje noviji pristupi u otkrivanju periodinosti vremenskih nizova koji se temelje na


spektralnoj analizi odnosno na analizi vremenskih nizova u domeni frekvencija. Cilj
spektralne analize je dati odgovor na pitanja: pri kojoj frekvenciji je funkcija gustoe
spektra najvea, te koliki period je potreban da se zavri jedan ciklus. Odgovore na ova

85

Statistika analiza
pitanja daje periodogram. U osnovi spektralna analiza se temelji na Fourierovim
transformacijama vrijednosti vremenskog niza pomou funkcija sinusa i kosinusa.
Spektralna analiza ovdje se nee razmatrati.

Prema klasinoj dekompoziciji vremenskih nizova (prvi pristup) najee se polazi od


aditivnog modela ili multiplikativnog modela dekompozicije:

yt = (Tt + Ct ) + St + et

ili

yt = (Tt Ct ) St et

pri emu je:

Tt - trend komponenta (opisuje dugoroni razvoj pojave u vremenu),


Ct - ciklika komponenta (opisuje periodino obnavljanje pojave s periodom od dvije ili vie
godina, npr. svake tri godine),

St - sezonska komponenta (opisuje periodino obnavljanje pojave unutar jedne godine, npr.
mjeseci, kvartali, tjedni, dani) i

et - iregularna ili sluajna komponenta (ne moe se objasniti).

Aditivni model dekompozicije se ee primjenjuje kada su amplitude sezonskih


varijacija jednake (konstantne), dok se multiplikativni model dekompozicije ee
primjenjuje kada su amplitude sezonskih varijacija razliite (npr. rastue).

Ako je vremenski niz opaen u kratkim vremenskim intervalima ciklika se


komponenta teko identificira, pa se esto ne razdvaja od trend komponente (Tt + Ct ) .

U praktinim primjenama ee se koristi multiplikativni model dekompozicije


vremenskog niza kod kojeg se utjecaji sezonskih i iregularnih komponenti iskazuju u
obliku indeksa:

I t*,S I t ,e
yt = Tt

100 100

86

Statistika analiza

Sljedee slike prikazuju vremenske nizove s razliitim komponentama:

Postupak mjerenja i eliminiranja sezonskih varijacija, kada nije mogue identificirati


cikliku komponentu, polazei od multiplikativnog modela dekompozicije vremenskog
niza moe se opisati u slijedeim koracima:

1. U prvom koraku se trend komponenta procjenjuje metodom pominih prosjeka (npr.


ako su podaci prikupljeni na mjesenoj razini raunaju se dvanaestolani centrirani
pomini prosjeci, a ako su podaci prikupljeni na kvartalnoj razini raunaju se
etverolani centrirani pomini prosjeci). Pomini prosjeci zapravo "izglauju"
promatrani vremenski niz. Kada je broj lanova pominog prosjeka paran provodi se
postupak centriranja.

1
1
yt 2 + yt 1 + yt + yt +1 + yt + 2
2
CMAt ( 4 ) = 2
4
1
1
yt 6 + yt 5 + ... + yt 1 + yt + yt +1 + ... + yt + 5 + yt + 6
2
CMAt (12 ) = 2
12
2. U drugom koraku izraunavaju se prve procjene sezonskih faktora (indeksa) pomou
omjera originalnih vrijednosti vremenskog niza i pripadajuih centriranih pominih
prosjeka, pri emu zbroj prosjenih sezonskih faktora istih mjeseci ili kvartala mora biti

87

Statistika analiza
jednak 12, odnosno 4. U protivnom se sezonski faktori istoimenih mjeseci odnosno
kvartala korigiraju.

I t ,S =

yt
100
CMAt ( k )

3. U treem koraku raunaju se desezionirane vrijednosti vremenskog niza tj. vrijednosti


oiene od sezonskih utjecaja, tako da se originalne vrijednosti vremenskog niza
podijele sa sezonskim faktorima (indeksima).

yt* =

yt
100
I t*,S

4. U posljednjem koraku raunaju se faktori (indeksi) rezidualnih odstupanja, tako da se


desezionirane vrijednosti pojave podijele s pominim prosjecima.

yt*
100
I t , =
CMAt ( k )

Postoji vie metoda analize sezonskih pojava u sklopu navedenih pristupa. Relativno je
jednostavna metoda odnosa prema pominim prosjecima, zatim regresijski model sa
sezonskim indikator varijablama (engl. dummy). Posebno je rairena CENZUS metoda i
njezine varijante, kao na primjer X-12-ARIMA, koji rabi veina dravnih zavoda za
statistiku, te TRAMO/SEATS, STAMP i druge.

Zadatak 7.1. Koristei podatke iz datoteke Vremenski nizovi.xls unutar radnog lista BDP
kvartalni izvrite klasinu dekompoziciju vremenskog niza multiplikativnom metodom
(Cenzus I ). Objasnite znaenje dobivenih rezultata konkretno!
Rjeenje 7.1. U programu STATISTICA otvorite datoteku Vremenski nizovi.xls birajui
opcije: File Open File name: Vremenski nizovi Open. Otvorite radni list pod
nazivom BDP kvartalni u kojem se nalaze vrijednosti bruto-domaeg proizvoda u mil. kn
(tekue cijene) od prvog kvartala 2002. godine do zadnjeg kvartala 2008. godine, to ini
ukupno 28 opaanja.

U glavnom izborniku Statistics izaberite Advanced Linear/Nonlinear Models Time


Series/Forecasting.
Za varijablu oznaite BDP u tekuim cijenama (mil. kn).
Unutar kartice Quick prozora Time Series Analysis izaberite Seasonal decomposition
(Cenzus I), kao to je prikazano na sljedeoj slici.

88

Statistika analiza

U prozoru Ratios-to-Moving Average Classical Sesonal Decomposition... unutar kartice


Advanced oznaite model Multiplicative, sa centriranim pominim prosjecima Centered
moving averages. Broj sezonskih pomaka postavite na 4. Oznaite est komponenti koje
e biti aktivne u radnom outputu: (1) Moving averages, (2) Ratios/Differences, (3)
Seasonal factors, (4) Seasonally adj. series, (5) Smoothed trend cycle i (6) Irregular
component. Zatim kliknite Summary: Seasonal decomposition.

89

Statistika analiza

Na temelju rezultata iz gornje tablice prvi centrirani pomini prosjek jednak je:

1
1
41220 + 44397 + 50500 + 4581 + 4400
2
CMA1 ( 4 ) = 2
= 45827 ,00 .
4
Drugi centrirani pomini prosjek jednak je:

1
1
44397 + 50500 + 4581 + 4400 + 49034
2
CMA2 ( 4 ) = 2
= 46754 ,13... itd .
4
Prema gore navedenim izraunima centrirani etverolani pomini prosjek je peterolani
1 1 1 1 1
ponderirani pomini prosjek s ponderima , , , i , to znai da tri sredinja lana
8 4 4 4 8
imaju jednake pondere (25%) dok prvi i zadnji lan imaju dvostruko manje pondere
(12,5%).

90

Statistika analiza
Prve procjene sezonskih indeksa su jednake omjerima (engl. ratios) originalnih vrijednosti
vremenskog niza i pripadajuih centriranih pominih prosjeka:

I1,S =

50500
100 = 110,19700
45827

I 2 ,S =

45801
100 = 97 ,9614 ...itd .
46754,13

Vrijednosti prosjenih sezonskih indeksa istih kvartala su:

S1 =

91,9908 + 93, 2826 + 91, 7088 + ... + 91,1574


= 92 ,55929
6

S2 =

100, 4232 + 99,9230 + 100 , 467 + ... + 104,1214


= 100,83602
6

S3 =

110 ,1970 + 109, 2388 + 109 , 0956 + ... + 111, 4586


= 109 , 71246
6

S4 =

97 ,9614 + 97 ,8815 + 98,1252 + ... + 94 ,8440


= 97 ,17174
6

Zbroj vrijednosti prosjenih sezonskih indeksa istih kvartala nije jednak 400 jer je:

S1 + S 2 + S3 + S 4 = 400 , 27951 .
Zato se prosjeni sezonski indeksi istih kvartala korigiraju za faktor:

k=

400
= 0,9993017 .
400, 27951

Konana procjena sezonskog indeksa, na primjer, za prvi kvartal jednaka je:

I1*,S = S1 0 ,9993017 = 92 , 49466 itd.


Naime, konana procjena sezonskog indeksa za prvi kvartal dobivena pomou programa
STATISTICA jednaka je 92,6571 i razlikuje se od konane procjene sezonskog indeksa od
92,49466 jer se po defaultu programa koriste prosjeni sezonski indeksi kada su iskljuene
vrijednosti najmanjeg i najveeg sezonskog indeksa.24

24

Konane procijene sezonskih indeksa mogu se dobiti upotrebom korektivnog faktora na temelju medijalnih
vrijednosti prvih procijena sezonskih indeksa istih kvartala.

91

Statistika analiza
Prosjene vrijednosti sezonskih indeksa kada su iskljuene vrijednosti prvih procjena
najmanjeg i najveeg sezonskog indeksa su:

S1 =

91,9908 + 93, 2826 + 91, 7088 + 93,5068 + 93, 7094 + 91,1574


= 92 , 62224
4

S2 =

100, 4232 + 99 ,9230 + 100, 4647 + 99,8355 + 100, 2483 + 104 ,1214
= 100, 2648
4

S3 =

110 ,1970 + 109 , 2388 + 109 ,0956 + 109 , 2570 + 109 , 0277 + 111, 4586
= 109, 4471
4

S4 =

97 ,9614 + 97 ,8815 + 98,1252 + 97 , 4036 + 96 ,8138 + 94,8440


= 97 ,51532
4

Zbroj vrijednosti prosjenih sezonskih indeksa istih kvartala nije jednak 400 jer je:

S1 + S 2 + S3 + S 4 = 399 ,8495 .
Zato se prosjeni sezonski indeksi istih kvartala korigiraju za faktor:

k=

400
= 1,000376 .
399,8495

Konana procjena sezonskog indeksa za prvi kvartal jednaka je:

I1*,S = S1 k = 92 , 62224 1, 000376 = 92 , 6571 itd.


Konane procijene sezonskih indeksa i pripadajue stope promjene su ove:
Kvartal
Sezonski
indeksi
Stope
promjene

I.

II.

III.

IV.

Ukupno

92,6571

100,3025

109,4883

97,5520

400

-7,3429%

+0,3025%

+9,4883

-2,4480%

92

Statistika analiza
Desezionirane vrijednosti vremenskog niza, tj. vrijednosti oiene od sezonskih utjecaja,
raunaju se tako da se originalne vrijednosti vremenskog niza podijele sa konanim
procjenama sezonskih indeksa i pomnoe sa sto:

y1* =

41220
100 = 44486 , 6
92 , 6571

y*2 =

44397
100 = 44263,1
100 ,3025

y3* =

50500
100 = 46123,6 ...itd .
109 , 4883

U posljednjem koraku raunaju se faktori (indeksi) rezidualnih odstupanja, tzv. iregularna


komponenta, tako da se desezionirane vrijednosti pojave podijele s pominim prosjecima.
Naime, prema defaultu programa STATISTICA iregularna komponenta rauna se tako da se
desezionirane vrijednosti podijele s izglaenim vrijednostima desezioniranog vremenskog
niza (engl. Smoothed Trend component). Vrijednosti desezioniranog vremenskog niza
raunaju se upotrebom centriranih ponderiranih peterolanih pominih prosjeka iji su
ponderi redom: 1, 2, 3, 2, 1 odnosno 11,11%, 22,22%, 33,33%, 22,22% i 11,11%. Postupkom
izglaivanja desezioniranih vrijednosti dobiju su aproksimativne procjene trend-ciklike
komponente za prva dva i zadnja dva kvartala koje dosada nisu bile poznate. Indeksi
rezidualnih odstupanja su ovi:

I1,e =

44486 , 6
100 = 99 ,9588
44504 ,93

I 2 ,e =

44263,1
100 = 98, 4548
44957 ,78

I 3 ,e =

46123, 6
100 = 100 ,5673 ...itd .
45863, 47

Vrijednosti vremenskog niza za prva dva opaanja mogu se dekomponirati na slijedei


nain:

41220 = 44504,93

92, 6571 99 ,9588

100
100

44397 = 44957 , 78

100,3025 98, 4548

,....itd .
100
100

93

Statistika analiza

pokrenite prozor Ratios-to-Moving Average Classical Sesonal


Decomposition..... Nadalje, unutar kartice Review series izaberite Plot (multiple
variables).25 Iz pripadajueg izbornika oznaite varijable (komponente) koje elite
usporediti na istom grafikonu (koristite se tipkom Ctrl). Na primjer oznaite vrijednosti
originalnog vremenskog niza (BDP u tekuim cijenama (mil. kn)) i izglaene trendciklike vrijednosti (Smoothed tr-cycle). Nakon izbora odgovarajuih komponenti
kliknite OK.
Ponovno

25

Ako po defaultu nije aktivirana opcija Case names u dijalokom okviru Label data points with, tada oznaite tu
opciju. Aktiviranjem opcije Case names na osi X bit e navedene jedinice vremena (kvartal/godina).

94

Statistika analiza
Plot of selected variables (series)
90000

90000

85000

85000

80000

80000
BDP u tekuim cijenama (mil. kn)
BDP u tekuim cijenama (mil. kn); trns.

75000

70000

70000

65000

65000

60000

60000

55000

55000

50000

50000

45000

45000

40000

40000

35000

35000
Q1/2002
Q2/2002
Q3/2002
Q4/2002
Q1/2003
Q2/2003
Q3/2003
Q4/2003
Q1/2004
Q2/2004
Q3/2004
Q4/2004
Q1/2005
Q2/2005
Q3/2005
Q4/2005
Q1/2006
Q2/2006
Q3/2006
Q4/2006
Q1/2007
Q2/2007
Q3/2007
Q4/2007
Q1/2008
Q2/2008
Q3/2008
Q4/2008

Value

75000

Case Names

pokrenite prozor Ratios-to-Moving Average Classical Sesonal


Decomposition..... Nadalje, unutar kartice Review series izaberite Plot (multiple
variables) i oznaite sezonske indekse (Seasonal factors).
Ponovno

Plot of selected variables (series)


115

115

110

110

105

105

100

100

95

95

90

90
Q1/2002
Q2/2002
Q3/2002
Q4/2002
Q1/2003
Q2/2003
Q3/2003
Q4/2003
Q1/2004
Q2/2004
Q3/2004
Q4/2004
Q1/2005
Q2/2005
Q3/2005
Q4/2005
Q1/2006
Q2/2006
Q3/2006
Q4/2006
Q1/2007
Q2/2007
Q3/2007
Q4/2007
Q1/2008
Q2/2008
Q3/2008
Q4/2008

BDP u tekuim cijenama (mil. kn):Seasonal factors


(season=4);

BDP u tekuim cijenama (mil. kn); trns.

95

Statistika analiza
Zadatak 7.2. Koristei podatke iz datoteke Vremenski nizovi.xls unutar radnog lista BDP
kvartalni procijenite viestruki regresijski model s linearnim trendom i sezonskim indikator

+
x +
Q +
Q +
Q . Objasnite znaenje
(dummy) varijablama: yt =
0
1
t
2
2 ,t
3
3 ,t
4
4 ,t

procijenjenih parametara konkretno! Izraunajte prognostiku vrijednost i granice


prognostike procjene BDP-a u tekuim cijenama za trei kvartal 2009 godine. Stvarne
vrijednosti i oekivane vrijednosti BDP-a usporedite na istom grafikonu!

Rjeenje 7.2. U programu STATISTICA otvorite datoteku Vremenski nizovi.xls birajui


opcije: File Open File name: Vremenski nizovi Open. Otvorite radni list pod
nazivom BDP kvartalni u kojem se nalaze vrijednosti bruto-domaeg proizvoda u mil. kn
(tekue cijene), varijabla vrijeme s ishoditem na poetku promatranog razdoblja (Xt) i
sezonske dummy varijable (Q2, Q3 i Q4).

S obzirom na prisutnost sezonskog utjecaja, koji se mjere po kvartalima, uvode se


sezonske dummy varijable:

1 za drugi k var tal


Q2 ,t =
0 za ostale k var tale
1 za trei k var tal
Q3 ,t =
0 za ostale k var tale
1 za etvrti k var tal
Q4 ,t =
0 za ostale k var tale

Openito, dummy ili tzv. binarne varijable poprimaju unaprijed poznate vrijednosti 0 i
1. Vrijednost 1 govori o prisutnosti odreenog svojstva, a vrijednost 0 govori o
odsutnosti odreenog svojstva, pa su one sredstvo kojim se u model ukljuuje
kvalitativna varijabla.

Kvartal je kvalitativna varijabla s etiri modaliteta, pa e se u regresijski model ukljuiti


tri binarne varijable Q2 ,t , Q3 ,t i Q4 ,t , dok e efekt sezonskog utjecaja u prvom kvartalu bit
. Bilo bi pogreno u model uvrstiti dummy varijablu za
sadran u konstantnom lanu
0

prvi kvartal, jer je potreban broj binarnih varijabli uvijek za jedan manji od broja
modaliteta kvalitativne varijable. Kad bi se sezonski utjecaj u modelu predoio s etiri
binarne varijable, sustav normalnih jednadbi koji slijede primjenom metode najmanjih
kvadrata ne bi imao rjeenje. Takoer, ako se u modelu sezonski utjecaji mjere na
temelju mjesenih podataka potrebno je uvrstiti 11 dummy varijabli.

Da bi procijenili viestruki regresijski model s linearnim trendom i sezonskim indikator


(dummy) varijablama koristite proceduru Multiple Regression.

96

Statistika analiza

yt = 38232, 41 + 1216,05 xt + 4589,38 Q2 ,t + 9746,33 Q3 ,t + 2198,85 Q4 ,t

Da bi izraunali prognostiku vrijednost BDP-a u tekuim cijenama potrebno je


ponovno pokrenuti prozor Multiple Regression Results. Nadalje, koristite proceduru
izbora opcija Residuals/assumption/prediction Predict dependent variable (Compute
prediction limits). Prije pritiska na OK potrebno je specificirati vrijednosti nezavisnih
varijabli kao to je prikazano na slici:

yQ3 ,2009. = 84460 , 21

Pr 80585, 08 < yQ3 ,2009. < 88335,35 = 0 ,95

Da bi na istom grafikonu usporedili stvarne i oekivane vrijednosti BDP-a u tekuim


cijenama ponovno pokrenite prozor Multiple Regression Results. Zatim koristite
proceduru izbora opcija Residuals/assumption/prediction Perform residual analysis
Save Save residuals & predicted. Prije pritiska na OK potrebno je specificirati koje
vrijednosti varijabli elite dodatno spremiti u novom radnom listu. Nakon kreiranja
novog radnog lista stvarne i oekivane vrijednosti BDP-a usporedite linijskim
grafikonom (Graphs 2D Graphs Line plots (Variables) Graph type: Multiple).

97

Statistika analiza
Line Plot of multiple variables
Spreadsheet7 13v*28c
85000
80000
75000

BDP u tekuim cijenama (mil. kn)


Predicted

70000
65000
60000
55000
50000
45000
40000
35000
Q1/2002
Q1/2003
Q1/2004
Q1/2005
Q1/2006
Q1/2007
Q1/2008
Q3/2002
Q3/2003
Q3/2004
Q3/2005
Q3/2006
Q3/2007
Q3/2008

Zadatak 7.3. Koristei podatke iz datoteke Vremenski nizovi.xls unutar radnog lista turizam
i trgovina izvrite klasinu dekompoziciju vremenskog niza noenja turista
multiplikativnom metodom (Cenzus I ).
Rjeenje 7.3. U programu STATISTICA otvorite datoteku Vremenski nizovi.xls birajui
opcije: File Open File name: Vremenski nizovi Open. Otvorite radni list pod
nazivom turizam i trgovina u kojem se nalazi broj ukupnog noenja turista od sijenja 1994.
godine do svibnja 2006. godine (ukupno 149 opaanja). Ponovite proceduru dekompozicije
kao u zadatku 7.1. Napomena: broj sezonskih pomaka postavite na 12.

98

Statistika analiza

U slijedeu tablicu upiite sezonske indekse i pripadajue stope promjene:


sijeanj veljaa oujak travanj svibanj

Mjesec

lipanj

srpanj kolovoz rujan listopad studeni prosinac

Sezonski indeks
Stopa promjene

Izvrite dekompoziciju noenja turista za prva tri opaanja:

231 =

239 =

.......................

.......................

337 = .......................

100

100

100

100

100

100

Plot of selected variables (series)


20000

15000

15000

10000

10000

5000

5000

Value

20000

-5000
1.1.1994
1.7.1994
1.1.1995
1.7.1995
1.1.1996
1.7.1996
1.1.1997
1.7.1997
1.1.1998
1.7.1998
1.1.1999
1.7.1999
1.1.2000
1.7.2000
1.1.2001
1.7.2001
1.1.2002
1.7.2002
1.1.2003
1.7.2003
1.1.2004
1.7.2004
1.1.2005
1.7.2005
1.1.2006

-5000

Noenja turista

Noenja turista (izglaene trend vrijednosti)

99

Statistika analiza

Noenja turista ukupno:Seasonal factors (season=12);

Plot of selected variables (series)


500

500

450

450

400

400

350

350

300

300

250

250

200

200

150

150

100

100

50

50

0
-50
1.1.1994
1.7.1994
1.1.1995
1.7.1995
1.1.1996
1.7.1996
1.1.1997
1.7.1997
1.1.1998
1.7.1998
1.1.1999
1.7.1999
1.1.2000
1.7.2000
1.1.2001
1.7.2001
1.1.2002
1.7.2002
1.1.2003
1.7.2003
1.1.2004
1.7.2004
1.1.2005
1.7.2005
1.1.2006

-50

Noenja turista ukupno (sezonski indeksi)

U kojim su mjesecima najvei sezonski utjecaji?

U kojem mjesecu su najvei utjecaji iregularne komponente?

VJEBA BR. 81

(a) Prije pokretanja programa STATISTICA otvorite Excel datoteku Vremenski nizovi.xls,
te u radnom listu industrija i gradj. u stupcu M formirajte varijablu vrijeme Xt s
ishoditem na poetku promatranog razdoblja upisujui brojeve 0, 1, 2, 3, ...,147, 148. U
slijedeim stupcima od N do X formirajte sezonske dummy varijable: M2, M3, M4, M5,
M6, M7, M8, M9, M10, M11 i M12 (stupce popunite nulama i jedinicama). Sauvajte
promjene u Excelu: FileSave. Zatvorite Excel datoteku. Pokrenite program
STATISTICA, te u program importirajte podatke iz prethodne spremljene datoteke.

100

Statistika analiza
Prilikom importiranja podataka izaberite opciju Open as an Excel Workbook. Na
temelju podataka iz radnog lista industrija i gradj. procijenite regresijsku jednadbu:

+
X +
M 2+
M3+
M 4+
M5+
M6+
M7+
M8+
Yt =
0
1
t
2
3
4
5
6
7
8
M9+
M 10 +
M 11 +
M 12.
+
9

10

11

12

Varijabla Y = elektrina energija, varijabla X = vrijeme, a varijable M2, M3, M4, M5,
M6, ..., M12 su sezonske dummy varijable. [Statistics Multiple Regression (uredite
podatke upisujui Firsta data column: B Read case name from column: A)OK
Quick Variables (Dependent: Elektrina energija, Independent: Xt, M2, M3, M4,
M5, ..., M12 ) OK Advanced Summary: Regression results]
Objasnite znaenje parametara 0 , 1 , 4 i 6 konkretno! U kojem mjesecu je najvei
sezonski utjecaj? Koji od procijenjenih parametara nije statistiki znaajan?
Parametar 0 iznosi:______________, te pokazuje __________________________________
____________________________________________________________________________.
Parametar 1 iznosi:______________, te pokazuje __________________________________
____________________________________________________________________________
____________________________________________________________________________.
Parametar 4 iznosi:______________, te pokazuje __________________________________
____________________________________________________________________________
____________________________________________________________________________.
Parametar 6 iznosi:_____________, te pokazuje ___________________________________
____________________________________________________________________________
____________________________________________________________________________.
Najvei sezonski utjecaj je u mjesecu ________. Parametar _______ nije statistiki znaajan.
(b) Prognozirajte vrijednost indeksa proizvodnje elektrine energije u mjesecu lipnju 2010.
godine? Izraunajte i prognostike granice procjene na razini pouzdanosti od 99%.
[Multiple Regression results Residuals/assumptions/prediction Compute
prediction limits Alpha: 0,01 Predict dependent variable Xt: 197, M6: 1 OK]

ylipanj' 10. = _ _ _ _ _ _ _ Pr { _ _ _ _ _ _ _ < ylipanj' 10. < _ _ _ _ _ _ _} = 0 ,99

101

Statistika analiza
(c) Grafiki usporedite stvarne vrijednosti indeksa elektrine energije s oekivanim
vrijednostima (engl. predicted). [Multiple Regression results Perform residual
analysis Save Save residuals & predicted Select All Graphs 2DGraphs
Line Plots (Variables)... Graph type: Multiple Variables: Elektrina energijaPredicted OK OK]
Line Plot of multiple variables
Spreadsheet5 31v*149c
140
130
120
110
100
90
80
70
60

Elektrina energija
Predicted

50
40
1.1.1994
1.9.1995
1.5.1997
1.1.1999
1.9.2000
1.5.2002
1.1.2004
1.9.2005
1.11.1994
1.7.1996
1.3.1998
1.11.1999
1.7.2001
1.3.2003
1.11.2004

(d) Dekomponirajte vremenski niz indeksa proizvodnje elektrine energije


multiplikativnom metodom Cenzus I. [Statistics Advanced Linear/Nonlinear Models
Time Series/Forecasting Variables Elektrina energija Seasonal decomposition
(Census 1) Advanced Seasonal model: Multiplicative Seasonal lag: 12
ukljuite opciju Centered moving averages oznaite est komponenti koje e biti
aktivne u radnom outputu Number of backups per variable (series): 6 Summary:
Seasonal decomposition]. U sljedeu tablicu upiite sezonske indekse i pripadajue stope
promjene:
Mjesec

sijeanj veljaa oujak travanj svibanj

lipanj

srpanj kolovoz rujan listopad studeni prosinac

Sezonski indeks
Stopa promjene

(e) Napiite kako se izraunava prvi centrirani dvanaestolani pomini prosjek! Koliki
ponder je pridrueni prvom i zadnjem lanu, a koliko iznose ponderi ostalih lanova?

CMA1 (12 ) =

___________________________________
= 62, 2042
12

Prvom i zadanjem lanu pridruen je ponder od ____________%, dok su ostalim lanovima


pridrueni ponderi od ___________%.

102

Statistika analiza
(f) Napiite kako se izraunava prva procjena sezonskog indeksa za mjesec srpanj 1994.
godine. Za isti mjesec napiite kako se izraunava desezionirana vrijednost i indeks
iregularne komponente.

I 7 ,S =

______
100 = 94 ,5274
______

y7* =

______
______
100 = 62 , 7327 I 7 ,e =
100 = 100,3102
______
______

(g) Za prva dva opaanja u tablici napiite dekompoziciju vrijednosti indeksa elektrine
energije. Pojedinano objasnite dobivene komponente!

72 , 2 = .......................

100

100

59 ,9 = .......................

100

100

Trend vrijednost u mjesecu sijenju 1994. godine iznosi:_____________ nakon to se ukloni


sezonski utjecaj. Sezonski indeks u istom mjesecu iznosi:___________, te pokazuje _______
____________________________________________________________________________
_____________________________________________________________. Indeks iregularne
komponente u tom mjesecu iznosi:_________, te pokazuje____________________________
____________________________________________________________________________.
Trend vrijednost u mjesecu veljai 1994. godine iznosi:______________ nakon to se ukloni
sezonski utjecaj. Sezonski indeks u istom mjesecu iznosi:___________, te pokazuje _______
____________________________________________________________________________
_____________________________________________________________. Indeks iregularne
komponente u tom mjesecu iznosi:_________, te pokazuje____________________________
____________________________________________________________________________.
(h) Grafiki usporedite originalne vrijednosti indeksa elektrine energije s izglaenim trenciklikim vrijednostima. [Ratios-To-Moving Averages Review series Plot (Review
multiple variables) pomou tipke Ctrl oznaite prvi niz Elektrina energija i esti niz
Elektrina energija: Smoothed tr-cycle (season=12) OK]

103

Statistika analiza

Value

Plot of selected variables (series)


140

140

130

130

120

120

110

110

100

100

90

90

80

80

70

70

60

60

50

50

40
-10

10

20

30

40

50

60

70

Elektrina energija

80

90

40
100 110 120 130 140 150 160

Elektrina energija; trns.

(i) Grafiki prikaite sezonske indekse vremenskog niza. [Ratios-To-Moving Averages


Plot (Review multiple variables) oznaite trei niz po redu Elektrina energija:
Seasonal factors (season=12) OK]

Elektrina energija:Seasonal factors (season=12);

Plot of selected variables (series)


120

120

115

115

110

110

105

105

100

100

95

95

90

90

85
-10

10

20

30

40

50

60

70

80

90

85
100 110 120 130 140 150 160

Elektrina energija; trns.

104

Statistika analiza
8. PROGNOSTIKI MODELI

Ve je istaknuto da se drugi pristup u analizi vremenskih nizova oslanja na modele


kojima se analitiki, pomou procijenjenih parametara izraavaju periodine
komponente koje promatrani vremenski niz moe sadrati. Takvi su modeli najee
linearni stohastiki modeli (ne mogu se tono predvidjeti, ve se mogu samo procijeniti
na temelju vrijednosti promatranog vremenskog niza).

Najee je rije o modelima pomou kojih se izraava ovisnost tekue vrijednosti


vremenskog niza yt o njegovim proteklim vrijednostima yt 1 , yt 2 , yt 3 ,... , to znai da je
oekivana vrijednost vremenskog niza uvjetovana skupom informacija I t 1 . Skup I t 1
predstavlja skup proteklih informacija do trenutka t 1 koji sadri informacije na
temelju kojih je mogue predvidjeti budue vrijednosti vremenskog niza
yt +1 , yt + 2 , yt +3 ,... . Ipak, dio procesa koji se ne moe predvidjeti na temelju skupa
informacija I t 1 prezentira se kao proces bijelog uma (engl. white noise). Stohastiki
proces je "white noise" proces ije su sluajne varijable meusobno nekorelirane s
oekivanjem jednakim nuli, konstantnom varijancom i kovarijancom jednakom nuli za
bilo koji vremenski pomak k 0 .

Vremenski niz je stacionaran kada su mu lanovi meusobno nekorelirani, kada ima


konstantno oekivanje i konstantnu varijancu, te autokovarijancu koja je funkcija
vremenskog pomaka. Drugim rijeima, vremenski niz je stacionaran ako ne sadri trend
(npr. prve diferencije su jednake nuli pa je yt = yt 1 ). Isto tako, ako se vremenski niz
kree prema trend polinomu k-tog stupnja tada su nune i dovoljne k-te diferencije
vremenskog niza da se postigne stacionarnost.

Najvaniji linearni modeli stacionarnih stohastikih procesa su:


(a) Autoregresijski model reda p odnosno AR(p) model:

yt = 0 + 1 yt 1 + 2 yt 2 + ... + p yt p + t
(b) Model pominih prosjeka reda q odnosno MA(q) model:

yt = t 1 t 1 2 t 2 ... q t q
(c) Mjeoviti ARMA model reda p,q odnosno ARMA(p,q) model:

yt = 0 + 1 yt 1 + 2 yt 2 + ... + p yt p + t 1 t 1 2 t 2 ... q t q
105

Statistika analiza

Navedeni modeli se odnose na stacionarne procese, koje u vremenu ne sadre trend,


periodine ili druge sistemske komponente. U sluaju pojave sistemskih komponenti iste
je potrebno odstraniti. Najee se trend komponenta moe ukloniti diferenciranjem.
Vrijednosti vremenskog niza koje su diferencirane d puta oznaavaju se d yt . Ako u
ARMA(p,q) modelu yt zamijenimo s d yt dobiva tzv. integrirani ARMA model reda

p,d,q odnosno ARIMA(p,d,q) model.

Ako promatrana vremenska pojava sadri sezonsku komponentu model se proiruje


dodatnim lanovima: ARIMA(p,d,q)x(P,D,Q)S.

Osim postupka transformacije vremenskih nizova uporabom operatora diferenciranja, u


empirijskim se analizama provode i druge transformacije. Na primjer esto se koriste
logaritamske transformacije da se postigne stabilnost varijance vremenskog niza.
Takoer se vrijednosti vremenskog niza obino centriraju (odstupanja od aritmetike
sredine). Za centrirane vrijednosti vremenskog niza konstantni lanovi u navedenim
modelima se ne procjenjuju. Isto tako, konstantni lanovi se iskljuuju iz specifikacije
modela kada je vremenski niz diferenciran.

Za primjenu ARIMA modela nuno je ustanoviti jesu li ispunjeni uvjeti stacionarnosti


koji se odnose na AR dio, te uvjete invertibilnosti koji se odnose na MA dio modela. Ako
su navedeni uvjeti zadovoljeni moe se izraunati oekivanje i varijanca stohastikog
procesa u dugom roku ( t ). Slijedea tablica prezentira ogranienja u parametrima
koja moraju biti ispunjena da se zadovolje navedeni uvjeti:

Prognostiki
model
AR(1)

Uvjet
stacionarnosti
1 < 1

Uvjet
invertibilnosti
----

2 + 1 < 1
AR(2)

2 1 < 1

----

1 < 2 < 1
MA(1)

----

1 < 1

Oekivanje
procesa

= 0
1 1

0
=
1 1 2

----

2 1 < 1

2
1 12

(1 )
(1 + ) (1 )

12

= 0

= (1 + 12 ) 2

= 0

= (1 + 12 + 22 ) 2

= 0
1 1

1 + 2 1 1 + 12 2
=

1 12

2 + 1 < 1
MA(2)

Varijanca procesa

1 < 2 < 1
ARMA(1,1)

1 < 1

1 < 1

106

Statistika analiza
esto se u zapisima prognostikih modela koristi operator pomaka L za koji vrijedi

Lk yt = yt k odnosno:

Lyt = yt 1
L2 yt = yt 2
L3 yt = yt 3

yt = (1 L ) yt
d yt = (1 L ) yt
d

Zadatak 8.1. Napiite kako glase modeli predoeni pomou operatora pomaka L, te u
eksplicitnom obliku:

(a)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(i)
(j)

ARIMA(0,1,0)
ARIMA(2,0,0)
AR(1)
MA(2)
ARIMA(1,0,1)
ARIMA(1,1,1)
ARIMA(1,1,0)
ARIMA(2,1,1)
ARIMA(2,0,1)
ARIMA(1,0,0)x(1,1,0)12

Zadatak 8.2. Navedene modele predoite odgovarajuom oznakom, te ispitajte jesu li nuni
uvjeti stacionarnosti i/ili invertibilnosti zadovoljeni. Ako su navedeni uvjeti zadovoljeni
izraunajte oekivanje i varijancu stohastikog procesa ako je u svim modelima 2 = 0, 09 .

(a)
(b)
(c)
(d)
(e)
(f)
(g)
(h)

yt
yt
yt
yt
yt
yt
yt
yt

= 0,5 + 0,8 yt 1 + t
= 0, 2 + 1, 05 yt 1 0 , 4 yt 2 + t
= t 0,8 t 1
= t 1, 25 t 1
= t + 0,7 t 1 0,5 t 2
= 0, 4 0, 6 yt 1 + 3 yt 2 + t 0 , 6 t 1
= 0,8 yt 1 + 0 ,5 yt 2 + t 0 , 6 t 1
= 0,5 + yt 1 + t

107

Statistika analiza

Pri izboru modela najee se polazi od Box-Jenkinsova pristupa. Box-Jenkinsov pristup


se provodi u slijedeim koracima:

1. IDENTIFIKACIJA MODELA poetna je faza u kojoj specificiramo kojim bi se modelom


mogao predoiti promatrani vremenski niz. U ovoj fazi vanu ulogu imaju autokorelacijska
funkcija i parcijalna autokorelacijska funkcija. Autokorelacijsku funkciju (ACF) ini niz
koeficijenata linearne korelacije izmeu lanova niza pomaknutih za k razdoblja, a njezin
grafiki prikaz naziva se korelogram. Parcijalni autokorelacijski koeficijenti (PACF) su
koeficijenti korelacije izmeu lanova niza yt i yt k uz neutraliziran utjecaj ostalih lanova

yt 1 , yt 2 , yt 3 ,..., yt k +1 . Procjena PACF na temelju vrijednosti iz uzorka rauna se pomou


Yule-Walkerovih jednadbi.

Slijedea tablica opisuje ponaanje ACF i PACF stacionarnih procesa:

Proces
AR(p)
MA(q)
ARMA(p,q)

ACF
Opadajua
Iezava nakon pomaka q
Opadajua

PACF
Iezava nakon pomaka p
Opadajua
Opadajua

U sluaju da obje funkcije ACF i PACF opadaju prepoznajemo da se radi o mjeovitom


modelu. Dakle, kod mjeovitih modela ACF se ponaa kao i ACF autoregresijskog
modela, dok se PACF mjeovitog modela ponaa kao i PACF modela pominih prosjeka.
Ovisno o predznaku procijenjenih parametara j ili j koeficijenti ACF i PACF mogu
opadati izravno (najee eksponencijalno) ili oscilirajue (najee u obliku priguenih
sinusoida). Za dovoljno veliki uzorak T znaajnost koeficijenata autokorelacije se testira
Z
kada se
uobiajenim Z-testom, a granice znaajnosti su odreene intervalom 0
T
pretpostavlja da vremenski niz slijedi isti sluajni proces. Na primjer, to znai da su na
razini signifikantnosti testa od 5% (kada je Z = 1,96 ) i veliinu uzorka T = 1000 znaajni
koeficijenti autokorelacije koji su po apsolutnoj vrijednosti vei od 0,06198. Osim
pojedinanih testova upotrebljavaju se i skupni testovi znaajnosti koeficijenata
autokorelacije. Najee je u uporabi Ljung-Box test, ija je test veliina Q rasporeena
prema hi-kvadrat distribuciji sa m stupnjeva slobode.

2. FAZA PROCJENE - kada izaberemo odreeni model procjenjujemo parametre bilo j ili

j . Danas se u procjeni parametara najee koristi uvjetna metoda najmanjih kvadrata


(uvjetna je s obzirom na pretpostavku da su vrijednosti niza prije prvog promatranja jednake
sredini niza) ili metoda maksimalne vjerodostojnosti (MLE Maximum Likelihood
Estimation).

108

Statistika analiza
3. FAZA DIJAGNOSTIKE ispituje se da li je procijenjen model reprezentativan, da li je
statistiki znaajan i da li ispunjava sve polazne pretpostavke (kao npr. da li je model
stacionaran). Ako model nije stacionaran ili ako je u modelu znaajno prisutna
autokorelacija ponavljamo faze 1 - 3 sve dok ne pronaemo zadovoljavajui model. esto se
procjenjuje vie modela izmeu kojih se bira najbolji na temelju AIC i SBIC kriterija.
Akaikeov AIC i Schwartz Bayesian SBIC informacijski kriteriji mjere koliko dobro model
opisuje podatke. to je model bolji, manja je vrijednost navedenih pokazatelja. Pri izboru
konanog oblika modela sukladno Box-Jenkinsovu pristupu vano je naelo parsimonije
(daje se prednost modelu s manjim brojem parametara, a priblino istih pokazatelja kakvoe
u odnosu prema modelu veih dimenzija).

4. FAZA PREDVIANJA - kada smo pronali zadovoljavajui model isti se moe koristiti u
prognostike svrhe.

Zadatak 8.3. Na temelju prikaza ACF i PACF koeficijenata za 6 simuliranih vremenskih


nizova (Series x1, x2,..., x6) veliine T = 200 specificirajte prikladan model. Koje su granice
znaajnosti ACF i PACF koeficijenata?

109

Statistika analiza

110

Statistika analiza
Zadatak 8.4. Na temelju podataka o vremenskom nizu Zakljuna cijena radnog lista INA
tjedni datoteke Vremenski nizovi.xls napravite slijedee:
(a) Vremenski niz zakljunih cijena trgovanja dionicama INA-e, na temelju tjednih
opaanja, prikaite linijskim grafikonom.
(b) Procijenite koeficijente ACF i PACF do pomaka 10. to zakljuujete?
(c) Procijenite modele koji bi bili prikladni u konkretnom problemu modeliranja? Izaberite
adekvatan model u skladu s Box-Jenkinsovim pristupom.
(d) Za izabrani model provjerite jesu li uvjeti stacionarnosti i/ili invertibilnosti zadovoljeni.
(e) Koliko iznosi oekivanje, a koliko standardna devijacija vremenskog niza u dugom roku?
(f) Na temelju izabranog modela izvrite prognozu za 20 perioda unaprijed od posljednjeg
opaanja. Prognostike vrijednosti i granice prognostikih procjena na temelju 90%-tne
razine pouzdanosti prikaite grafiki.

Rjeenje 8.4. Nakon uitavanja odgovarajuih podataka u program STATISTICA pokrenite


Time Series/Forecasting proceduru i oznaite varijablu Zakljuna cijena. Zatim izaberite
ARIMA & autocorrelation functions Review series. Dok je vremenski niz u radnom
dijalokom okviru oznaen kliknite Plot (highlighted variable). Za nazive opaanja oznaite
Case names kao to je prikazano na slici:

111

Statistika analiza

1800

7.4.2008

29.9.2008

1800

25.8.2008

2000

21.7.2008

2000

16.6.2008

2200

12.5.2008

2200

3.3.2008

2400

28.1.2008

2400

27.12.2007

2600

19.11.2007

2600

15.10.2007

2800

10.9.2007

2800

6.8.2007

3000

2.7.2007

3000

28.5.2007

3200

23.4.2007

3200

19.3.2007

3400

12.2.2007

3400

8.1.2007

3600

4.12.2006

Zakljuna cijena

Plot of variable: Zakljuna cijena


3600

Case Names

Da bi prikazali ACF i PACF koeficijente ponovno pokrenite prozor Single Series


ARIMA i izaberite karticu Autocorrelations. Broj pomaka podesite na 10 i kliknite
Autocorrelations. Ponovite proceduru za PACF koeficijente Partial autocorrelations.
Autocorrelation Function
Zakljuna cijena
Lag

(Standard errors are white-noise estimates)


Corr. S.E.

+,917 ,1005

83,20 0,000

+,838 ,1000

153,5 0,000

+,763 ,0994

212,3 0,000

+,671 ,0989

258,4 0,000

+,584 ,0983

293,7 0,000

+,509 ,0978

320,8 0,000

+,445 ,0973

341,7 0,000

+,407 ,0967

359,5 0,000

+,366 ,0962

373,9 0,000

10

+,312 ,0956

384,6 0,000

0
-1,0

-0,5

0,0

0,5

0
1,0

Conf. Limit

112

Statistika analiza

Na temelju korelograma se zakljuuje da koeficijenti ACF opadaju brzo


(eksponencijalno) s vremenskim pomakom. Ljung-Box Q test veliine pokazuju da su
ACF koeficijenti do zakljuno s pomakom k statistiki znaajni (p-vrijednost 0,000...).
To znai da vremenski niz zakljunih cijena dionica INA-e slijedi autoregresijski proces
reda p.
Partial Autocorrelation Function
Zakljuna cijena
(Standard errors assume AR order of k-1)
Lag

Corr. S.E.

+,917 ,1021

-,015 ,1021

-,018 ,1021

-,145 ,1021

-,031 ,1021

+,019 ,1021

+,032 ,1021

+,131 ,1021

-,061 ,1021

10

-,117 ,1021
0
-1,0

-0,5

0,0

0,5

1,0

Conf. Limit

Statistiki je znaajan koeficijent PACF samo pri pomaku jedan (+0,917), dok ostali
PACF koeficijenti nisu statistiki znaajni pri teorijskoj razini signifikantnosti od 5%.

Iz slijedee tablice se vidi da su standardne pogreke svih PACF koeficijenata jednake


1 96 = 0 ,1021 , a granice znaajnosti (Conf. Limit) odreene su intervalom
1
0 1,96
= 0, 2001 . Budui da PACF iezava nakon prvog pomaka dovoljno je
96
procijeniti autoregresijski model reda jedan odnosno AR(p) model s pomakom p=1.

113

Statistika analiza

Da bi procijenili AR(1) model ponovno pokrenite prozor Single Series ARIMA, te


unutar kartice Advanced izaberite pomak 1 u dijalokom okviru p-Autoregressive. U
model ukljuite i konstantni lan. Izaberite metodu procjene Exact (Melard).26 Zatim
kliknite OK (Begin parameter estimation).

26

Osim egzaktne metode alternativni je pristup primjene aproksimativne metode procjene parametara. Naime,
aproksimativna metoda se ee koristi ako je broj opaanja veoma dugaak (vei od 30.000), a alogoritmi koji se
koriste u procesu optimizacije jesu numeriki algoritmi iz klase kvazi-Newtonovih metoda.

114

Statistika analiza
1 < 1 mod el je stacionaran
= 2655,33549 0 = (1 1 ) = 2655,335 0 ,081 = 216,0646
yt = 216,0646 + 0,91863 yt 1 + t (1 0,91863 L ) yt = 216,0646 + t
=

0
= 2655,33549
1 1

2
14962
=
=
= 95837 , 21125 = 95837 , 21125 = 309,57586
1 12 1 0,918632
Histogram; variable: Zakljuna cijena
ARIMA (1,0,0) residuals;
Expected Normal
26
24
22
20
18
No of obs

16
14
12
10
8
6
4
2
0
-500
-400
-300
-200
-100
0
-450
-350
-250
-150
-50

100
50

200
150

300
250

400
350

500
450

600
550

Upper Boundaries (x<=boundary)

Na temelju histograma zakljuuje se da su rezidualna odstupanja normalno distribuirana.

115

Statistika analiza
Autocorrelation Function
Zakljuna cijena: ARIMA (1,0,0) residuals;
Lag

(Standard errors are white-noise estimates)


Corr. S.E.

-,024 ,1005

,06 ,8118

+,013 ,1000

,07 ,9643

+,138 ,0994

2,00 ,5720

-,000 ,0989

2,00 ,7354

-,046 ,0983

2,22 ,8176

-,037 ,0978

2,37 ,8830

-,120 ,0973

3,88 ,7936

+,047 ,0967

4,11 ,8470

+,096 ,0962

5,10 ,8257

10

+,044 ,0956

5,31 ,8694

0
-1,0

-0,5

0,0

0,5

0
1,0

Conf. Limit

Korelogram rezdiduala pokazuje da u procijenjenom ARIMA(1,0,0) modelu nije


preostalo autokorelacije jer se na temelju Ljung-Box Q test veliine nulta hipoteza ne
moe odbaciti (p-vrijednost je vea od 0,05 pri svim vremenskim pomacima). Ako u
procijenjenom modelu nije preostalo autokorelacije tada je model tono specificiran.
Da bi izvrili prognozu prema procijenjeom ARIMA(1,0,0) modelu za 20 perioda
unaprijed od posljednjeg opaanja ponovno pokrenite prozor Single Series ARIMA
Results. U kartici Advanced izaberite broj opaanja 20 i razinu pouzdanosti 90%, zatim
kliknite Plot series & forecasts, kao to je prikazano na slici.

116

Statistika analiza

Forecasts; Model:(1,0,0) Seasonal lag: 12


Input: Zakljuna cijena
Start of origin: 1

End of origin: 96

Observed

Forecast

116

111

106

101

29.9.2008

1800

25.8.2008

1800

21.7.2008

2000
16.6.2008

2000
12.5.2008

2200

7.4.2008

2200

3.3.2008

2400

28.1.2008

2400

27.12.2007

2600

19.11.2007

2600

15.10.2007

2800

6.8.2007

2800

10.9.2007

3000

2.7.2007

3000

28.5.2007

3200

23.4.2007

3200

19.3.2007

3400

8.1.2007

3400

12.2.2007

3600

4.12.2006

3600

90,0000%

117

Statistika analiza
Zadatak 8.5. Na temelju podataka o vremenskom nizu HRK/USD radnog lista tecaj datoteke
Vremenski nizovi.xls napravite slijedee:
(a) Vremenski niz teaja HRK/EUR prikaite linijskim grafikonom.
(a) Procijenite koeficijente ACF i PACF do pomaka 25. to zakljuujete? Koju
transformaciju vremenskog niza bi upotrijebili?
(b) Za transformirane vrijednosti vremenskog niza procijenite koeficijente ACF i PACF do
pomaka 25. to zakljuujete?
(c) Procijenite modele koji bi bili prikladni u konkretnom problemu modeliranja? Izaberite
adekvatan model u skladu s Box-Jenkinsovim pristupom (koristite AIC i SBIC
informacijske kriterije).
(d) Za izabrani model provjerite jesu li uvjeti stacionarnosti i/ili invertibilnosti zadovoljeni.
(e) Na temelju izabranog modela izraunajte prognostike vrijednosti teaja za 20 perioda
unaprijed od posljednjeg opaanja. Izraunajte i granice prognostikih procjena na
temelju 90%-tne razine pouzdanosti.

Rjeenje 8.5. Nakon uitavanja odgovarajuih podataka u program STATISTICA pokrenite


Time Series/Forecasting proceduru kao u zadatku 8.4.

HRK/USD

Plot of variable: HRK/USD


10

10

4
1.1.1999
1.1.2001
1.1.2003
1.1.2005
1.1.2007
1.1.2009
1.1.2000
1.1.2002
1.1.2004
1.1.2006
1.1.2008

Case Names

118

Statistika analiza

Autocorrelation Function

Partial Autocorrelation Function

HRK/USD
Lag
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

(Standard errors are white-noise estimates)


Corr. S.E.
+,984 ,0861
+,963 ,0857
+,943 ,0854
+,924 ,0851
+,906 ,0847
+,886 ,0844
+,864 ,0841
+,845 ,0837
+,827 ,0834
+,808 ,0831
+,789 ,0827
+,767 ,0824
+,744 ,0820
+,723 ,0817
+,698 ,0813
+,671 ,0810
+,643 ,0806
+,610 ,0803
+,574 ,0799
+,537 ,0796
+,501 ,0792
+,466 ,0789
+,436 ,0785
+,405 ,0781
+,371 ,0778
0
-1,0
-0,5
0,0
0,5

HRK/USD
Q
130,8
257,0
378,8
496,8
611,0
721,1
826,8
928,6
1027,
1122,
1213,
1299,
1381,
1460,
1533,
1602,
1666,
1723,
1775,
1820,
1860,
1895,
1926,
1953,
1976,
0
1,0

p
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
Conf. Limit

Lag
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

(Standard errors assume AR order of k-1)


Corr. S.E.
+,984 ,0870
-,175 ,0870
+,048 ,0870
+,018 ,0870
-,008 ,0870
-,060 ,0870
-,034 ,0870
+,051 ,0870
+,024 ,0870
-,049 ,0870
-,007 ,0870
-,118 ,0870
+,000 ,0870
+,052 ,0870
-,175 ,0870
-,050 ,0870
-,007 ,0870
-,204 ,0870
-,092 ,0870
-,058 ,0870
+,018 ,0870
+,007 ,0870
+,077 ,0870
-,042 ,0870
-,139 ,0870
0
-1,0
-0,5
0,0

0,5

1,0

ACF opada sporo, a PACF iezava nakon pomaka 2. Sporo opadanje ACF koeficijenata
znai da je vremenski niz nestacionaran, odnosno da isti sadri stohastiki trend.
Stohastiki trend moe se ukloniti prvim diferencijama. Upotrebom prvih diferencija
vremenski niz postaje stacionaran.

Da bi transformirali vrijednosti vremenskog niza upotrebom prvih diferencija unutar


prozora Sinle Series ARIMA kartice Advanced izaberite Other transformation & plots. U
prozoru Transformations of Variables izaberite karticu Difference, integrate. Zatim broj
diferencija postavite na 1 i kliknite OK (Transform selected series), kao to je prikazano
na slici.

119

Conf. Limit

Statistika analiza
Plot of variable: HRK/USD

HRK/USD

D(-1)
0,6

0,6

0,4

0,4

0,2

0,2

0,0

0,0

-0,2

-0,2

-0,4

-0,4

-0,6
1.1.1999
1.1.2001
1.1.2003
1.1.2005
1.1.2007
1.1.2009
1.1.2000
1.1.2002
1.1.2004
1.1.2006
1.1.2008

-0,6

Case Names

Ponovno pokrenite prozor Trnasformations of Variables te unutar kartice Autocorrs


izaberite Autocorrelations i Partial autocorrelations.
Autocorrelation Function

Partial Autocorrelation Function

HRK/USD : D(-1)
Lag
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

(Standard errors are white-noise estimates)


Corr. S.E.
+,249 ,0864
-,036 ,0860
-,010 ,0857
+,024 ,0854
+,109 ,0850
+,068 ,0847
-,017 ,0844
-,003 ,0840
+,062 ,0837
+,074 ,0833
+,071 ,0830
-,039 ,0826
-,022 ,0823
+,100 ,0819
-,023 ,0816
-,031 ,0812
+,141 ,0809
+,183 ,0805
+,062 ,0802
-,074 ,0798
-,072 ,0795
-,092 ,0791
+,008 ,0787
+,136 ,0784
-,028 ,0780
0
-1,0
-0,5
0,0
0,5

HRK/USD : D(-1)

Q
8,33
8,51
8,52
8,60
10,24
10,89
10,93
10,93
11,48
12,28
13,02
13,25
13,32
14,82
14,90
15,04
18,08
23,24
23,84
24,70
25,52
26,89
26,90
29,91
30,04
0
1,0

p
,0039
,0142
,0364
,0720
,0687
,0920
,1417
,2057
,2443
,2670
,2922
,3515
,4238
,3907
,4589
,5218
,3838
,1815
,2025
,2134
,2253
,2157
,2605
,1879
,2231

Lag
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

Conf. Limit

(Standard errors assume AR order of k-1)


Corr. S.E.
+,249 ,0874
-,104 ,0874
+,028 ,0874
+,017 ,0874
+,106 ,0874
+,016 ,0874
-,027 ,0874
+,016 ,0874
+,057 ,0874
+,036 ,0874
+,046 ,0874
-,066 ,0874
+,016 ,0874
+,091 ,0874
-,098 ,0874
+,002 ,0874
+,167 ,0874
+,121 ,0874
-,029 ,0874
-,088 ,0874
-,015 ,0874
-,114 ,0874
+,008 ,0874
+,129 ,0874
-,087 ,0874
0
-1,0
-0,5
0,0

0,5

1,0

ACF iezava nakon pomaka jedan i PACF iezava nakon pomaka jedan. Budui ACF
iezava oito je da je transformirani vremenski niz stacionaran. Ponaanje PACF
upuuje na zakljuak da bi AR(1) model bio prikladan za diferencirani vremenski niz,
odnosno bio bi prikladan ARIMA(1,1,0). Ponaanje ACF upuuje na zakljuak da bi
MA(1) model bio prikladan za diferencirani vremenski niz, odnosno bio bi prikladan
ARIMA(0,1,1) ili IMA(1,1) model.

120

Conf. Limit

Statistika analiza

Da bi procijenili navedene modele ponovno pokrenite Transformations of Variables i


zatim kliknite Cancel da bi se vratili na proceduru Single Series ARIMA i specificirali
odgovarajui model. Iz modela iskljuite konstanti lan i izaberite red diferencija jedan.
Postavite pomak p=1 i kliknite OK (Begin parameter estimation).

Zatim kliknite Summary: Parameter esimates.

121

Statistika analiza

(1 L )(1

L ) yt = t

(1 L ( L L ) ) y
2

= t yt = yt 1 + 1 ( yt 1 yt 2 ) + t

< 1 mod el je stacionaran


1
2 = 0, 02622 var ijanca procesa je konana tj. =

0, 02622
= 0,028128
1 0, 260432

y133 = y132 + 1 ( y132 y131 ) = 4,979623 + 0, 26043 ( 4,979623 4,885203) = 5,004213


y134 = y133 + 1 ( y133 y132 ) = 5, 004213 + 0, 26043 ( 5,004213 4 ,979623) = 5,010617
y135 = y134 + 1 ( y134 y133 ) = 5, 012285
yt = = 5, 012872 ( oekivana vrijednost procesa je kons tan tna )

Ponovite proceduru za model s pomakom p=0 i q=1.

Parametri u oba modela su statistiki znaajni. Bolji je model ARIMA(0,1,1) nego


ARIMA(1,1,0) jer je kod modela ARIMA(0,1,1) manja varijanca reziduala (srednja
kvadratna pogreka, tj. MS Residual=0,02596).

122

Statistika analiza
yt = t 1 t 1 (1 L ) yt = (1 1 L ) t
yt = yt 1 + t 1 t 1
1 < 1 mod el je invertibilan
yt = yt 1 1 t 1 = yt 1 1 ( yt 1 yt 1 )
yt = yt 1 + 0, 294894 ( yt 1 yt 1 )
y133 = y132 + 0, 294894 132 = 4,979623 + 0, 294894 0, 086133 = 5, 00502
132 = y132 y132 = 4,979623 4,89349 = 0,086133
y134 = y133 = 5, 00502
y135 = y134 = 5,00502 sredina procesa je kons tan tna
2 = 0, 02596

var ijanca procesa je konana tj. = (1 + 0, 2948942 ) 0 ,02596 = 0 ,028217

Iako program STATISTICA automatski ne ispisuje vrijednosti informacijskih kriterija,


lako ih se moe izraunati prema formulama:

2 + 2 k
AIC ( k ) = T log
2 + 2 k log T ,
SBIC ( k ) = T log
gdje je T broja opaanja (131=132-1, tj. nakon postupka diferenciranja gubi se jedno
2 je procijenjena varijanca reziduala.
opaanje), k je broj procijenjenih parametara (1), a

123

Statistika analiza

U slijedeoj tablici izraunate su vrijednosti informacijskih kriterija:


Residual Diagnostics
ARIMA(0,1,1) ARIMA(1,1,0)
Number of Residuals
131
131
Number of Parameters
1
1
Residual Sum of Squares
3,37679
3,40837
Residual Variance
0,02594
0,02620
Akaike's Information Criterion (AIC)
-205,76534
-205,19635
Schwarz's Bayesian Criterion (SBIC)
-203,53080
-202,96180

Manja vrijednost informacijskih kriterija upuuje na zakljuak da je ARIMA(0,1,1)


model neto bolji od modela ARIMA(1,1,0). Drugim, rijeima IMA(1,1) model se bolje
prilagoava podacima jer ima nie vrijednosti AIC i SBIC.

Zadatak 8.6. Na temelju podataka o vremenskom nizu Izvoz ukupno radnog lista izvoz i
uvoz datoteke Vremenski nizovi.xls napravite slijedee:
(a) Vremenski niz ukupnog izvoza prikaite linijskim grafikonom. to zakljuujete?
(b) Procijenite koeficijente ACF i PACF do pomaka 24. to zakljuujete?
(c) Procijenite modele koji bi bili prikladni u konkretnom problemu modeliranja? Izaberite
adekvatan model u skladu s Box-Jenkinsovim pristupom.
(d) Za izabrani model provjerite jesu li uvjeti stacionarnosti i/ili invertibilnosti zadovoljeni.
(e) Na temelju izabranog modela izvrite prognozu za 15 perioda unaprijed od posljednjeg
opaanja. Prognostike vrijednosti i granice prognostikih procjena na temelju 90%-tne
razine pouzdanosti prikaite grafiki.

Rjeenje 8.6. Nakon uitavanja odgovarajuih podataka u program STATISTICA pokrenite


Time Series/Forecasting proceduru kao u zadatku 8.4.

124

Statistika analiza
Plot of variable: Izvoz ukupno
6500000
6000000
5500000
5000000

Izvoz ukupno

4500000
4000000
3500000
3000000
2500000
2000000
1500000
1000000
1.1.1994
1.1.1996
1.1.1998
1.1.2000
1.1.2002
1.1.2004
1.1.2006
1.1.1995
1.1.1997
1.1.1999
1.1.2001
1.1.2003
1.1.2005
Case Names

Vremenski niz sadri trend komponentu, sezonsku komponentu i sluajnu komponentu.


Autocorrelation Function

Partial Autocorrelation Function


Izvoz ukupno

Izvoz ukupno
Lag
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

(Standard errors are white-noise estimates)


Corr. S.E.
+,793 ,0811
+,814 ,0808
+,777 ,0806
+,753 ,0803
+,758 ,0800
+,719 ,0797
+,725 ,0794
+,684 ,0792
+,686 ,0789
+,621 ,0786
+,652 ,0783
+,644 ,0780
+,594 ,0777
+,582 ,0775
+,551 ,0772
+,542 ,0769
+,543 ,0766
+,526 ,0763
+,494 ,0760
+,487 ,0757
+,444 ,0754
+,443 ,0751
+,415 ,0748
+,440 ,0745
+,377 ,0742
0
-1,0
-0,5
0,0
0,5

Q
95,51
196,8
289,9
377,8
467,5
548,8
632,1
706,7
782,3
844,8
914,1
982,1
1041,
1097,
1148,
1198,
1248,
1296,
1338,
1379,
1414,
1449,
1479,
1514,
1540,
0
1,0

p
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000

Lag
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Conf. Limit

(Standard errors assume AR order of k-1)


Corr. S.E.
+,793 ,0819
+,499 ,0819
+,209 ,0819
+,078 ,0819
+,144 ,0819
+,009 ,0819
+,070 ,0819
-,041 ,0819
+,034 ,0819
-,159 ,0819
+,106 ,0819
+,119 ,0819
-,103 ,0819
-,100 ,0819
-,011 ,0819
-,005 ,0819
+,096 ,0819
+,024 ,0819
-,084 ,0819
-,036 ,0819
-,060 ,0819
+,051 ,0819
-,065 ,0819
+,123 ,0819
-,126 ,0819
0
-1,0
-0,5
0,0

0,5

1,0

ACF pokazuje da vremenski niz nije stacionaran. Nuno je transformirati vremenski niz
upotrebom prvih diferencija. Nakon transformacije vremenskog niza potrebno je
ponovni ispitati ponaanje ACF i PACF.

125

Conf. Limit

Statistika analiza
Plot of variable: Izvoz ukupno
D(-1)
2E6

2E6

Izvoz ukupno

1,5E6

1,5E6

1E6

1E6

5E5

5E5

-5E5

-5E5

-1E6

-1E6

-1,5E6

-1,5E6

-2E6
-10

10

20

30

40

50

60

70

80

-2E6
90 100 110 120 130 140 150 160

Case Numbers

Diferencirani vremenski niz nije stabilan odnosno varijacije diferenciranog vremenskog


niza su sve vee u vremenu, to je i za oekivati kada su periodine amplitude rastue.
Zato je najee potrebno prvo transformirati vrijednosti vremenskog niza u obliku
prirodnih logaritama.
Plot of variable: Izvoz ukupno

Izvoz ukupno

ln(x); D(-1)
0,6

0,6

0,4

0,4

0,2

0,2

0,0

0,0

-0,2

-0,2

-0,4

-0,4

-0,6
-10

10

20

30

40

50

60

70

80

-0,6
90 100 110 120 130 140 150 160

Case Numbers

Prve diferencije logaritamskih vrijednosti vremenskog niza su stabilne.

126

Statistika analiza

ACF i PACF pokazuju da je transformirani vremenski niz stacionaran jer se upotrebom


prvih diferencija logaritamskih vrijednosti otklonila trend komponenta. Ipak, nune su i
sezonske diferencije jer ACF pokazuje znaajne vrhove pri pomacima 1, 12 i 24,
odnosno s periodom od 12 pomaka. PACF je padajua.

Autocorrelation Function

Partial Autocorrelation Function

Izvoz ukupno: ln(x); D(-1)


Lag
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

(Standard errors are white-noise estimates)


Corr. S.E.
-,554 ,0814
+,051 ,0811
+,042 ,0808
-,074 ,0805
+,104 ,0803
-,104 ,0800
+,066 ,0797
-,048 ,0794
+,114 ,0791
-,185 ,0788
+,035 ,0786
+,176 ,0783
-,162 ,0780
+,088 ,0777
-,080 ,0774
+,056 ,0771
-,033 ,0768
+,020 ,0765
-,039 ,0762
+,071 ,0759
-,070 ,0756
+,050 ,0753
-,146 ,0750
+,251 ,0747
-,104 ,0744
0
-1,0
-0,5
0,0
0,5

Izvoz ukupno: ln(x); D(-1)


(Standard errors assume AR order of k-1)
Q
46,41
46,80
47,07
47,92
49,59
51,29
51,98
52,34
54,44
59,93
60,13
65,22
69,52
70,81
71,88
72,41
72,60
72,67
72,93
73,81
74,65
75,10
78,86
90,10
92,07
0
1,0

p
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000

Lag
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Conf. Limit

Corr. S.E.
-,554 ,0822
-,371 ,0822
-,209 ,0822
-,223 ,0822
-,070 ,0822
-,124 ,0822
-,066 ,0822
-,106 ,0822
+,093 ,0822
-,111 ,0822
-,222 ,0822
+,027 ,0822
+,013 ,0822
+,047 ,0822
-,011 ,0822
+,014 ,0822
-,051 ,0822
-,005 ,0822
-,063 ,0822
+,016 ,0822
-,105 ,0822
+,056 ,0822
-,232 ,0822
+,068 ,0822
+,107 ,0822
0
-1,0

-0,5

0,0

0,5

1,0

127

Conf. Limit

Statistika analiza

Nuno je procijeniti vie modela od kojih treba izabrati najbolji:

model u kojem su svi parametri statistiki znaajni,


model koji ima relativno najmanju srednju kvadratnu pogreku u odnosu na broj
procijenjenih parametara,
model u kojim procijenjeni parametri nisu statistiki znaajno korelirani,
model u kojem nije preostalo znaajne autokorelacije.

Da bi provjerili stupanj korelacije izmeu procijenjenih parametara ponovno pokrenite


prozor Single Series ARIMA, te u kartici Advanced izaberite Parameter
covariances/correlations.

128

Statistika analiza

129

Statistika analiza

Lag
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

Autocorrelation Function

Partial Autocorrelation Function

Izvoz ukupno: ARIMA (1,1,1)(1,1,0) residuals;

Izvoz ukupno: ARIMA (1,1,1)(1,1,0) residuals;

(Standard errors are white-noise estimates)


Corr. S.E.
-,020 ,0848
+,003 ,0845
+,031 ,0842
-,112 ,0839
+,002 ,0835
-,058 ,0832
+,024 ,0829
+,024 ,0826
+,090 ,0823
-,125 ,0819
+,132 ,0816
-,137 ,0813
-,041 ,0810
+,109 ,0806
+,011 ,0803
-,005 ,0800
-,084 ,0796
+,071 ,0793
-,085 ,0790
+,056 ,0786
-,004 ,0783
+,090 ,0779
+,046 ,0776
-,181 ,0773
+,008 ,0769
0
-1,0
-0,5
0,0
0,5

Q
,06
,06
,19
1,97
1,97
2,46
2,54
2,63
3,84
6,18
8,82
11,65
11,91
13,74
13,76
13,76
14,88
15,68
16,85
17,36
17,37
18,69
19,05
24,56
24,57
0
1,0

p
,8102
,9710
,9788
,7414
,8533
,8734
,9239
,9555
,9218
,7998
,6389
,4741
,5348
,4694
,5441
,6165
,6045
,6149
,6002
,6292
,6886
,6641
,6985
,4301
,4868

Lag
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Conf. Limit

(Standard errors assume AR order of k-1)


Corr. S.E.
-,020 ,0857
+,002 ,0857
+,031 ,0857
-,111 ,0857
-,002 ,0857
-,059 ,0857
+,029 ,0857
+,013 ,0857
+,096 ,0857
-,141 ,0857
+,142 ,0857
-,156 ,0857
+,004 ,0857
+,066 ,0857
+,071 ,0857
-,071 ,0857
-,067 ,0857
+,060 ,0857
-,059 ,0857
+,042 ,0857
+,031 ,0857
+,063 ,0857
+,022 ,0857
-,168 ,0857
-,017 ,0857
0
-1,0
-0,5
0,0

0,5

1,0

Model ARIMA(1,1,1)x(1,1,0)12 pokazuje se adekvatnim.

130

Conf. Limit

Statistika analiza

(1 L ) (1 L ) (1 L ) (1
12

(1 L L

12

L12 ) yt = (1 1 ) t

+ L13 ) (1 1 L ) (1 12 L12 ) yt = (1 1 ) t

(1 L L + L

12

L12 + 1 L13 + L13 1 L14 )(1 12 L12 ) yt = (1 1 ) t

1 12 L12 1 L + 112 L13 L + 12 L13 + 1 L2 112 L14 L12 + 12 L24 +

+ 1 L13 112 L25 + L13 12 L25 1 L14 + 112 L26

) = (1 )
1

yt = ( 1 + 1) yt 1 1 yt 2 + ( 12 + 1) yt 12 ( 112 + 12 + 1 + 1) yt 13 + ( 112 + 1 ) yt 14 +
12 yt 24 + ( 112 + 1 ) yt 25 112 yt 26 + t 1t 1
= 0, 216198
1
= 0,549632
12

= +0, 776635
1
Forecasts; Model:(1,1,1)(1,1,0) Seasonal lag: 12
Input: Izvoz ukupno
Start of origin: 1

End of origin: 149

9000000
8000000
7000000
6000000
5000000
4000000
3000000
2000000
1000000
0
-10

10

20

30

40

50

60

Observed

70

80

90 100 110 120 130 140 150 160 170 180

Forecast

90,0000%

131

Statistika analiza
VJEBA BR. 91
(a) Napiite kako glase prognostiki modeli predoeni pomou operatora pomaka L, te u
eksplicitnom obliku:
- ARIMA(1,1,0)

- ARIMA(1,1,2)

- ARIMA(0,1,1)

(b) Navedene modele predoite odgovarajuom oznakom, te ispitajte jesu li nuni uvjeti
stacionarnosti i/ili invertibilnosti zadovoljeni. Ako su navedeni uvjeti zadovoljeni
izraunajte oekivanu vrijednost procesa u dugome roku:
- yt = 0, 2 + 1,3 yt 1 0, 4 yt 2 + t

- yt = t 0,8 t 1

- yt = 0, 4 0,6 yt 1 + t 0 ,5 t 1

(c) Procijenite koeficijente ACF i PACF do pomaka 15 za vremenski niz KS na kunske


kredite s v.k (prosjek) u radnom listu financijski sektor. Opiite ponaanje
autokorelacijske i parcijalne autokorelacijske funkcije! Koji prognostiki model bi bio
prikladan u konkretnom problemu modeliranja? [Statistics Advanced
Linear/Nonlinear Models Time Series/Forecasting (uredite podatke upisujui Firsta
data column: B Read case name from column: A) OKVariables Elektrina energija
OK ARIMA & autocorrelation functions Autocorrelations Autocorrelations
(p-level for highlighting: 0,05 Number of lags: 15) Single Series ARIMA Partial
autocorrelations]

132

Statistika analiza
Opis ACF i PACF:__________________________________________________________
_________________________________________________________________________
_________________________________________________________________________.

(d) Procijenite modele ARIMA(2,0,0), ARIMA(1,1,0) i ARIMA(0,1,1). Procijenjene modele


napiite u eksplicitnom obliku! Izaberite adekvatan model u skladu s Box-Jenkinsovim
p-Autoregressive: 2
pristupom. [Single Series ARIMA Quick
OK (Begin parameter estimation) Summary: Parameter estimates ponovite
proceduru za model ARIMA(1,1,0) Single Series ARIMA Cancel iskljuite
konstantni lan, a vremenski pomak p postavite na 1 ukljuite transformaciju niza
Difference 1. Lag: 1 - N of passes: 1 OK (Begin parameter estimation) Summary:
Parameter estimates ponovite proceduru za model ARIMA(0,1,1) Single Series
ARIMA Cancel vremenski pomak p postavite na 0, a vremenski pomak q postavite
na 1 ostavite transformacije niza u obliku prvih diferencija OK (Begin parameter
estimation) Summary: Parameter estimates]
ARIMA(2,0,0) model u eksplicitnom obliku je yt = _________________________________ .
ARIMA(1,1,0) model u eksplicitnom obliku je yt = _________________________________ .
ARIMA(0,1,1) model u eksplicitnom obliku je yt = _________________________________ .
Model ARIMA(___, ___, ___) pokazuje se prikladnim!
(e) Na temelju izabranog modela izvrite prognozu za 20 perioda unaprijed od posljednjeg
opaanja. Prognostike vrijednosti i granice prognostikih procjena na temelju
pouzdanosti od 95% prikaite grafiki. [Single Series ARIMA Advanced Number
of cases: 20 Cofidence level: 0,95 Plot series & forecasts]

133

Statistika analiza
PRIMJERI ZA VJEBU IZ UDBENIKA

134

Statistika analiza

135

Statistika analiza

136

Statistika analiza

137

Statistika analiza

138

You might also like