Professional Documents
Culture Documents
STATISTICA Vjezbe 2011
STATISTICA Vjezbe 2011
Statistika analiza
Budui da se prikupljeni podaci nalaze samo u prvom radnom listu Sheet1 dovoljno je
izabrati drugu opciju Import selected sheet to a Spreadsheet i zatim oznaiti Sheet1.
Prikupljeni podaci se odnose na 50 poduzea ili opaanja prema 8 varijabli ili obiljeja
(8v by 50c). Promatrane varijable mogu se klasificirati na slijedei nain:
(a) Nominalne varijable: Djelatnost, Kotacija na burzi
(b) Ordinalne varijable: Ocjena rizika, Ocjena uspjenosti
(c) Numerike varijable: Prihod u mil. kn, Zaduenost, Broj zaposlenih i Ulaganje u
Statistika analiza
Rjeenje 1.1. Navedeni parametri mogu se izraunati izborom opcija Statistics Basic
Statistics/Tables Descriptive Statistics OK.
Unutar prozora Descriptive Statistics potrebno je izabrati jednu ili vie varijabli klikom
. U ovom primjeru izabire se samo varijabla Prihod u mil. kn.
na gumb
Zatim se unutar kartice Advanced oznae samo oni parametri koje elimo izraunati,
kao to je prikazano na slici.
3
Statistika analiza
Napomena: Sve pojedine statistike procedure spremaju se unutar jedne radne knjige
Workbook1*, to se vidi iz popisa mapa (direktorija) s lijeve strane programa. Time program
korisniku olakava posao tako da iste procedure nije potrebno ponavljati. Naime, izborom
opcija File Saves as aktivna radna knjiga sprema se u obliku datoteke STATISTICA
Workbook Files (*.stw). Program nudi i mogunost spremanja radne knjige u obliku
izvjetaja STATISTICA Report Files (*.str).
Statistika analiza
X=
......................................
Q1 = .................................... Se ( x ) = ....................................
Me = ...................................... Q3 = .....................................
a3 = ....................................
Min =
4 =
Max =
....................................
....................................
=
V=
......................................
....................................
......................................
Broj poduzea
(frekvencije)
Kumulativne
frekvencije
Postoci
Kumulativni
postoci
Oekivane
frekvencije
0-50
50-100
100-150
150-200
200-250
Ukupno
Rjeenje 1.3. Ponovno pokrenite prozor deskriptivne statistike. Unutar kartice Quick
izaberite opciju Histograms.
Statistika analiza
Histogram: Prihod u mil. kn
K-S d=,07304, p> .20; Lilliefors p> .20
Expected Normal
30
25
No. of obs.
20
15
10
-50
50
100
150
200
250
Zadatak 1.4. Medijan, minimum i maksimum, te donji i gornji kvartil za varijablu Prihod u
mil. kn prikaite grafiki koristei B-P dijagram (tzv. Box-Plot).
Rjeenje 1.4. Unutar posljednje kartice Options prozora Descriptive Statistics potrebno je
aktivirati opciju Median/Quartiles/Range. Zatim se treba vratiti na karticu Quick i izabrati
Box & Whisker plot.
Modificirani K-S test je Lillieforsov test. Lillieforsov test se takoer koristi kod testiranja normalnosti
distribucije, ali bez unaprijed specificirane sredine i varijance (standardne devijacije) iz uzorka. Oba testa spadaju
u neparametrijske testove.
Statistika analiza
Box & Whisker Plot
220
200
180
160
140
120
100
80
60
40
Median = 100,2957
25%-75%
= (70,2793, 120,6493)
Min-Max
= (10,8081, 200,016)
20
0
Prihod u mil. kn
Zadatak 1.5. Koristei Box & Whisker plot odredite intervalne granice procjene prosjenog
prihoda svih poduzea u populaciji na temelju razine pouzdanosti od 95% (procjena
aritmetike sredine osnovnoga skupa). Komentirajte Normal Probability-Plot!
Rjeenje 1.5. Unutar kartice Options prozora Descriptive Statistics aktivirajte opciju
Mean/SE/1.96*SE. Vratite se na karticu Quick i izaberite Summary: Graphs.
Statistika analiza
Zi =
xi x
Statistika analiza
Na primjer, Z i = 1 pokazuje da je ostvareni prihod i-tog poduzea manji od prosjenog
prihoda za jednu standardnu devijaciju. Zato prihod tog poduzea iznosi 58,4 mil. kuna
( xi = x 1 = 95, 4809 37 ,0758 = 58, 4051 ). Ako je Z i = +2 znai da je ostvareni prihod itog poduzea vei od prosjenog prihoda za dvije standardne devijacije. Stoga je
xi = x + 2 = 95, 4809 + 2 37 ,0758 = 169 ,6325 mil. kuna.
Na temelju grafikog prikaza N-P dijagrama moe se zakljuiti da kumulativni raspored
standardiziranih vrijednosti prihoda slijedi pravac pod kutem od 450 to znai da distribucija
poduzea prema ostvarenim prihodima ima normalni oblik (Gaussova distribucija).
Zadatak 1.6. Pod pretpostavkom da distribucija poduzea prema ostvarenim prihodima ima
normalni oblik s aritmetikom sredinom 95,4809 i standardnom devijacijom 37,0758
izraunajte vjerojatnost da izabrano poduzee ostvaruje prihode:
(a) od 80 mil. kn ili manje,
(b) vee od 80 mil. kn i
(c) vee od 120 mil. kn.
Statistika analiza
(c) P ( x > 120 ) = 0, 254202
VJEBA BR. 11
(a) Za varijablu Ulaganje u reklamu u tis. kn izraunajte: aritmetiku sredinu, standardnu
devijaciju, koeficijent varijacije i interkvartil. Objasnite znaenje dobivenih rezultata
konkretno. [Statistics Basic Statistics/Tables Descriptive Statistics Variables
(Ulaganje u reklamu u tis. kn) Advanced Summary: Statistics]
x = ___________
= ___________
V = ___________
Iq = ___________
(b) Za varijablu Ulaganje u reklamu u tis. kn izraunajte granice intervalne procjene
aritmetike sredine na razini 95% pouzdanosti. Dobivene granice prikaite BoxWhiskerovim dijagramom. Na dijagramu upiite dobivene vrijednosti. [Descriptive
Statistics Options Mean/SE/1.96*SE Quick Box & Whisker plot]
Box & Whisker Plot
54
53
52
51
50
49
48
Mean = ..............
MeanSE= (..............; ...............)
Mean1,96*SE= (................; ...............)
47
Ulaganje u reklamu u tis.kn
10
Statistika analiza
(c) Izraunajte nove granice intervalne procjene aritmetike sredine na razini pouzdanosti
od 99%. to moete zakljuiti usporeujui interval procjene na razini pouzdanosti od
95% i 99%? [Descriptive Statistics Advanced Conf. Limits for means Interval: 99,00
Summary: Statistics]
Broj poduzea
(frekvencije)
Kumulativne
frekvencije
------
Postoci
Kumulativni
postoci
Oekivane
frekvencije
------
11
Statistika analiza
Histogram: Ulaganje u reklamu u tis.k
Expected Normal
25
No. of obs.
20
15
10
0
20
30
40
50
60
70
80
(f) Ako se pretpostavi da distribucija poduzea prema ulaganjima u reklamu ima noramalni
oblik koliko iznosi vjerojatnost da e izabrano poduzea uloiti u reklamu: (a) vie od 60
tisua kuna, (b) 60 ili manje od 60 tisua kuna, (c) vie od 40 tisua kuna i (d) izmeu 40
i 60 tisua kuna? Skicirajte slike! [Statistics Probability Calculator Distributions
Z (Normal ) X:..., mean: ...., st.dev: ..... Compute]
(a) P ( x > 60 ) = .............
(b) P ( x 60 ) = ..............
(g) Moe li se kao istinita prihvatiti hipoteza da prosjeno ulaganje u reklamu svih
poduzea u osvnom skupu iznosi: (a) 50 tisua kuna i (b) 60 tisua kuna. Postavite
odgovarajue hipoteze i provedite testiranje. [Statistics Basic Statistics/Tables t
test, single sample OK Variables (Ulaganje u reklamu u tis. kn) Reference
values (test all mean against: 50 / 60) Summary: T-tests]
12
Statistika analiza
(a)
(b)
H 0 : ...
H 0 : ...
H1 : ...
H1 : ...
t=
.....................
......................
= 0 ,365439
t=
................................
.....................
......................
= ...................
................................
df =
p=
df =
p=
(h) Moe li se kao istinita prihvatiti nulta hipoteza da ne postoji statistiki znaajne razlike
u ulaganjima u reklame izmeu poduzea s obzirom na kotaciju na burzi? Zakljuak
donesite na temelju empirijske razine signifikantnosti (odredite empirijsku razinu
signifikantnosti i pomou kalkulatora vjerojatnosti ispod povrine Studentove tdistribucije za dobivenu vrijednost t-testa i stupnjeve slobode df). [Basic Statistics/Tables
ttest, independent, by groups OK Variables (Dependent: Ulaganje u reklamu u
tis. kn, Grouping: Kotacija na burzi ) Summary: T-tests]; [Statistics Probability
Calculator Distributions t (Student) Two-tailed (1-Cumulative p) t:...,
df:... Compute]
H 0 : ...
H1 : ...
t=
.....................
......................
= 2 , 06964
................................
df =
p=
Moe se prihvatiti hipoteza __________
(i) Moe li se kao istinita prihvatiti hipoteza da ne postoji statistiki znaajne razlike u
ulaganjima u reklame izmeu poduzea koja se bave trgovinom u odnosu na poduzea
koja se bave proizvodnjom? Provedite dvosmjerni i jednosmjerni test! Prije provedbe
odgovarajuih testova izraunajte pokazatelje M (sredina), StDv (standardna devijacija) i
N (broj poduzea u svakoj grupi) s obzirom na djelatnost. [Statistics Basic
Statistics/Tables Descriptive Statistics Variables (Ulaganje u reklamu u tis. kn)
13
Statistika analiza
Advanced By Group... Grouping variables (Djelatnost) OK Summary:
Statistics]; [Basic Statistics/Tables Difference tests: r, %, means OK M 1:..., M
2:..., StDv 1:..., StDv 2:..., N1:..., N2:... Two-sided / One-sided Compute]
(a) Dvosmjerni test
H 0 : ...
H1 : ...
H 0 : ...
H1 : ...
Kotacija na burzi
ne
da
Ukupno
trgovina
proizvodnja
usluge
Ukupno
14
Statistika analiza
2. ANALIZA VARIJANCE (Analysis of Variance)
Analiza varijance se upotrebljava kada se eli testirati postoji li znaajna razlika izmeu
aritmetikih sredina tri ili vie osnovnih skupova, odnosno jeli promatrani uzorci
pripadaju istoj populaciji.
Kod analize varijance s jednim promjenjivim faktorom cilj je ispitati odnos varijacija
izmeu uzoraka s varijacijama unutar uzoraka. Taj odnos varijacija naziva se empirijski
F-omjer. F-omjer je sluajna varijabla koja pripada F-distribuciji. Ako je F-omjer
statistiki znaajan tada se moe odbaciti nulta hipoteza da se aritmetike sredine
statistiki znaajno ne razlikuju. Drugim rijeima, nultom hipotezom se pretpostavlja da
odreeni faktor znaajno ne djeluje na promatranu sluajnu varijablu, dok se
alternativnom hipotezom pretpostavlja da odreeni faktor statistiki znaajno djeluje na
promatranu sluajnu varijablu.
(
j =1 i =1
k
X ij X
(
j =1 i =1
k
= X ij X j
+ nj X j X
j =1
Pretpostavka da su uzorci jednakih veliina nuna je samo ako su uzorci zavisni. Ako uzorci nisu jednakih
veliina ili su podaci nepotpuni (engl. missing data) analizu varijance je mogue provesti pomou zbroja kvadrata
odstupnja treeg tipa (engl. Type III Sum of Squares). To je najee sluaj kod multifaktorske analize varijance
(MANOVA).
3
Vrijedi da je n = n j .
j =1
15
Statistika analiza
Tabela ANOVA:
Izvor
varijacije
Izmeu
uzoraka
Zbroj kvadrata
odstupanja (SS)
nj ( X j X )
k
(X
Unutar
uzoraka
j =1 i =1
ij
(X
k
Ukupno
n j (X j X ) / (k 1)
F-omjer
k-1
Xj
n-k
n-1
j =1
2
(X ij X j ) / (n k )
k
j =1 i =1
S A2
S E2
j =1 i =1
Sredina kvadrata
odstupanja (MS)
j =1
Stupnjevi
slobode (df)
ij
U slijedeem koraku potrebno je izabrati jednu (zavisnu) varijablu ili vie njih, te
odgovarajui faktor (engl. Categorical factor). Za zavisnu varijablu (engl. Dependent
variable) biramo Prihod u mil. kn, dok za faktor biramo Djelatnost, kao to je prikazano
na slici.
Razina signifikantnosti predstavlja vjerojatnost da se nulta hipoteza odbaci premda je ona istinita i jo se naziva
grekom tipa I. Ako je p-vrijednost manja od teorijske razine signifikantnosti (najee 5%) nulta hipoteza se moe
odbaciti. Ako je p-vrijednost vea od 5% nulta hipoteza se ne moe odbaciti.
16
Statistika analiza
Zbroj kvadrata
odstupanja (SS)
Stupnjevi
slobode (df)
Sredina kvadrata
odstupanja (MS)
F-omjer
Izmeu uzoraka
Unutar uzoraka
Ukupno
Napomena: Varijacije izmeu uzoraka (engl. between groups variation) se pripisuju
djelovanju promatranog faktora Djelatnost, dok se varijacije unutar uzoraka (engl. within
groups variation) pripisuju sluajnom djelovanju, odnosno nepoznatom faktoru i
predstavljaju komponentu pogreke (engl. Error).
Postavite odgovarajue hipoteze:
H 0 : ...
H 1 : ...
17
Statistika analiza
Empirijska razina signifikantnosti (p-vrijednost) iznosi:_____________, stoga se nulta
hipoteza _________________________________________.
Empirijsku razinu signifikantnosti na temelju empirijskog F-omjera iz prethodnog zadatka
izraunajte pomou kalkulatora vjerojatnosti i objasnite njeno znaenje konkretno.5 Unutar
glavnog izbornika Statistics pokrenite Probability Calculator Distributions F(Fisher).
Nakon unosa parametara F, df1 i df2, oznaite opciju (1-Cumulative p) i kliknite Compute.
Ponovno pokrenite prozor ANOVA Results i unutar kartice Summary izaberite opciju
Cell Statistics. Protumaite dobivene rezultate!
Ponovno pokrenite prozor ANOVA Results i unutar kartice Summary izaberite opciju
All effects/Graphs. Komentirajte dobiveni grafikon.
Density Function je funkcija gustoe vjerojatnosti, koja se u literaturi oznaava s f ( x ) . Distribution Function
18
Statistika analiza
Djelatnost; LS Means
Current effect: F(2, 47)=,70198, p=,50072
Effective hypothesis decomposition
Vertical bars denote 0,95 confidence intervals
130
125
120
115
Prihod u mil. kn
110
105
100
95
90
85
80
75
70
65
trgovina
proizvodnja
usluge
Djelatnost
19
Statistika analiza
H 0 : ...
H 1 : ...
Zbroj kvadrata
odstupanja (SS)
Stupnjevi
slobode (df)
Sredina kvadrata
odstupanja (MS)
F-omjer
Izmeu uzoraka
Unutar uzoraka
Ukupno
Na temelju empirijske razine signifikantnosti od:_______%, moe se zakljuiti __________
____________________________________________________________________________
__________________________________________________________________________.
Pr
...................
Pr
...................
Pr
...................
Tri su hipoteze koje se mogu testirati kod analize varijance s dva promjenjiva faktora:
(a) Jednakost sredina populacija s obzirom na prvi faktor.
(b) Jednakost sredina populacija s obzirom na drugi faktor.
(c) Promatrani faktori meusobno (interaktivno) djeluju na promatranu
sluajnu varijablu.
20
Statistika analiza
Zadatak 2.2.1. Moe li se prihvatiti hipoteza da su faktor Djelatnost i faktor Kotacija na
burzi znaajno djelovali na ostvarenje prosjenog prihoda promatranih poduzea? Da li
promatrani faktori meusobno (interaktivno) znaajno djeluju na prosjean prihod
poduzea?
Rjeenje 2.2.1. Unutar glavnog izbornika Statistics izaberete ANOVA Factorial ANOVA.6
Za varijablu izaberite Prihod u mil. kn, a za faktore izaberite Djelatnost i Kotacija na burzi
kao to je prikazano na slici. Zatim kliknite OK.
Zbroj kvadrata
odstupanja (SS)
Stupnjevi
slobode (df)
Sredina kvadrata
odstupanja (MS)
Fomjer
pvrijednost
Djelatnost
Kotacija na burzi
Interakcija
Ostatak (Error)
Ukupno
Napomena: Za svaku od postavljenih hipoteza F-test predstavlja omjer sredine kvadrata
odstupanja odgovarajueg faktora sa sredinom kvadrata odstupanja ostatka. Dakle, u ovom
primjeru tri su empirijska F-testa.
Ponovno pokrenite prozor ANOVA Results i unutar kartice Summary izaberite opciju
Cell Statistics. Na temelju dobivenih rezultata odgovorite koja poduzea ostvaruju
Ako se eli testirati znaajnost djelovanja vie faktora na promatranu sluajnu varijablu bez efekta interakcije
tada je umjesto Factorial ANOVA potrebno izabrati Main effects ANOVA.
21
Statistika analiza
najvei prihod, a koja najmanji prihod s obzirom na to da li kotiraju na burzi i koju
djelatnost obavljaju?
Prihod u mil. kn
140
120
100
80
60
40
20
ne
da
Kotacija na burzi
Djelatnost
trgovina
Djelatnost
proizvodnja
Djelatnost
usluge
Zbroj kvadrata
odstupanja (SS)
Stupnjevi
slobode (df)
Sredina kvadrata
odstupanja (MS)
Fomjer
pvrijednost
Djelatnost
Kotacija na burzi
Interakcija
Ostatak (Error)
Ukupno
Objasnite dobivene rezultate:
____________________________________________________________________________
____________________________________________________________________________.
22
Statistika analiza
VJEBA BR. 21
(a) Moe li se kao istinita prihvatiti nulta hipoteza da ne postoji statistiki znaajne razlike
u prosjenim ulaganjima u reklame izmeu poduzea s obzirom na kotaciju na burzi?
Postavljenu hipotezu testirajte pomou analize varijance s jednim promjenjivim
faktorom. Popunite tabelu ANOVA i provedite F-test. Izraunajte empirijsku razinu
signifikantnosti (p-vrijednost) pomou kalkulatora vjerojatnosti ispod povrine Fdistribucije. Dobivene rezultate usporedite s rezultatima t-testa u zadatku (h) vjeba br.
1. U kakvom su odnosu t-test i F-test kada se eli ispitati jeli postoji statistiki znaajna
razlika izmeu dva nezavisna uzorka? [Statistics ANOVA One-way ANOVA
Quick specs dialog OK Dependent Variables (Ulaganje u reklamu u tis. kn )
Categorical factor (Kotacija na burzi ) OK Summary Univariate results]
Izvor varijacije
Zbroj kvadrata
odstupanja (SS)
df
Sredina kvadrata
odstupanja (MS)
F-omjer
pvrijednost
Izmeu uzoraka
Unutar uzoraka
Ukupno
Prihvaa se hipoteza ___________________________________________________________
____________________________________________________________________________.
23
Statistika analiza
(b) Moe li se prihvatiti hipoteza da faktor Djelatnost i faktor Kotacija na burzi znaajno
djeluju na ulaganje u reklame promatranih poduzea? Provedite analizu varijancu s dva
promjenjiva faktora bez efekta interakcije. to zakljuujete? [Statistics ANOVA
Main effects ANOVA Quick specs dialog OK Dependent Variables (Ulaganje u
reklamu u tis. kn ) Categorical factors (Djelatnost-Kotacija na burzi ) OK
Summary Univariate results]
Zbroj kvadrata
odstupanja (SS)
Izvor varijacije
df
Sredina kvadrata
odstupanja (MS)
F-omjer
pvrijednost
Djelatnost
Kotacija na burzi
Error
Total
(c) U testiranju hipoteze pod (b) ukljuite i efekt interakcije. to zakljuujete? Efekte
interakcije prikaite odgovarajuim grafikonom. [Statistics ANOVA Factorial
ANOVA Quick specs dialog OK Dependent Variables (Ulaganje u reklamu u
tis. kn ) Categorical factors (Djelatnost-Kotacija na burzi ) OK Summary
Univariate results]; [ANOVA results All effects/Graphs Djelatnost *Kotacija na
burzi OK OK]
Zbroj kvadrata
odstupanja (SS)
Izvor varijacije
df
Sredina kvadrata
odstupanja (MS)
F-omjer
pvrijednost
Djelatnost
Kotacija na burzi
Interakcija
Error
Total
Djelatnost*Kotacija na burzi; LS Means
Current effect: F(2, 44)=2,3494, p=,10729
Effective hypothesis decomposition
Vertical bars denote 0,95 confidence intervals
75
70
65
60
55
50
45
40
35
ne
da
Kotacija na burzi
Djelatnost
trgovina
Djelatnost
proizvodnja
Djelatnost
usluge
24
Statistika analiza
(d) Izraunajte granice intervalne procjene prosjenog ulaganja u reklame na temelju razine
pouzdanosti od 95% za poduzea (a) koja se bave trgovinom i ne kotiraju na burzi i (b)
koja se bave proizvodnjom i kotiraju na burzi. [ANOVA results Cell statistics]
25
Statistika analiza
3. KORELACIJA
esto u praksi opaamo da dvije ili vie pojava pokazuju meusobnu zavisnost. Na
primjer znamo da postoji obrnuto proporcionalna povezanost izmeu potranje za
odreenim proizvodom i njegove cijene.
Osim raunski, korelacija izmeu dviju varijabli npr. X i Y moe se utvrditi i grafiki
pomou dijagrama rasipanja (engl. scatterplot). Ako korelacija (povezanost) postoji
mogue je odrediti njezin smjer i intenzitet, ali i testirati njezinu znaajnost uobiajenim
t-testom.
xi
1
3
7
5
5
9
4
8
Ukupno
yi
xi x
yi y
3
5
10
6
9
14
7
14
-4,25
-2,25
1,75
-0,25
-0,25
3,75
-1,25
2,75
0
-5,5
-3,5
1,5
-2,5
0,5
5,5
-1,5
5,5
0
( xi x ) ( y i y )
23,375
7,875
2,625
0,625
-0,125
20,625
1,875
15,125
72
xi
i =1
, y=
yi
i =1
26
Statistika analiza
Cov ( x, y ) =
i =1
72
=9>0
8
r=
( xi x ) ( yi y )
Cov ( x, y )
X Y
9
= 0,9585 < 1
2, 48747 3, 77492
Ako je korelacija linearna, tada se ista moe analitiki opisati linearnom regresijskom
jednadbom (jednadba pravca koja doputa odstupanja). Ipak, ako korelacija jest jaka i
pozitivna ba kao u naem primjeru ( r = +0,9585 ), ne mora biti linearna. Moe biti i
nelinearna!
Standardne
X =
devijacije
( xi x )
n
i =1
izraunate
, Y =
su
( yi y )
n
i =1
prema
formulama
za
jednostavnu
standardnu
devijaciju:
27
Statistika analiza
H 0 : ... r = 0
H 1 : ... r 0
t* =
r 0
Se ( r )
Ako su jedna ili dvije varijable dane u rangu, tj. rezultati nisu mjerne vrijednosti ve su
dani samo u redoslijedu, rauna se tzv. Spearmanov koeficijent korelacije ranga prema
formuli:10
n
rS = 1
6 di2
i =1
3
n n
Testiranje znaajnosti koeficijenta korelacije moe biti i jednosmjerno (engl. one-tailed test)
Spearmanov koeficijent korelacije ranga spada u neparametrijske pokazatelje korelacije.
10
28
Statistika analiza
Na dvije promatrane varijable, koje su u korelaciji, mogu utjecati i druge varijable koje
daju prividnu (lanu) mjeru korelacije izmeu dviju promatranih varijabli. Zato, da bi se
iskljuio utjecaj drugih varijabli na promatranu korelaciju potrebno je izraunati
parcijalni koeficijent korelacije.
29
Statistika analiza
Pri teorijskoj razini signifikantnosti od 0,01 statistiki nisu znaajni slijedei koeficijenti:
____________________________________________________________________________.
30
Statistika analiza
Zadatak 3.2. Izraunajte koeficijent parcijalne korelacije izmeu ostvarenih prihoda i broja
zaposlenih neutralizirajui utjecaj zaduenosti.
Zadatak 3.3. Izraunajte koeficijent korelacije ranga izmeu Ocjene rizika i Ocjene
uspjenosti poduzea. Objasnite znaenje dobivenog koeficijenta korelacije i testirajte
njegovu znaajnost. Signifikantnost testa iznosi 5%.
31
Statistika analiza
Spermanov koeficijent korelacije iznosi -0,238485 i nije statistiki znaajan pri teorijskoj
razini signifikantnosti od 5%!
VJEBA BR. 31
H 0 : ...
H1 : ...
Nulta hipoteza se (a) moe odbaciti ili (b) ne moe odbaciti (zaokruite toan odgovor!)
pri empirijskoj razini signifikantnosti_________________________________________.
(b) Izraunajte i objasnite znaenje parcijalnog koeficijenta linearne korelacije izmeu
prihoda i zaduenosti promatranih poduzea uz neutraliziran utjecaj broja zaposlenih. Je
li koeficijent parcijalne korelacije statistiki znaajan? [Product-Moment and Partial
Correlations Advanced/plot Partial correlations Second var.list (Broj
zaposlenih ) OK]
Parcijalni koeficijent korelacije iznosi:____________, te pokazuje__________________
_________________________________________________________________________
_________________________________________________________________________.
Procijenjen koeficijent parcijalne korelacije je (a) statistiki znaajan ili (b) nije
statistiki znaajan (zaokruite toan odgovor)!
32
Statistika analiza
(c) Izraunajte granice intervalne procjene koeficijenta linearne korelacije pod
temelju razine pouzdanosti od 95%. Koristite Fisherovu transformaciju Z
[Statistics Power Analysis Interval Estimation One Correlation,
QuickObserved R:..., Sample size (N):..., Conf. Level:... Fisher Z
Compute]
(a) na
Crude.
t-Test
Crude
Koeficijent korelacije
p-vrijednost
(e) Postoji li statistiki znaajna razlika u koeficijentima linearne korelacije izmeu podzea
koja se bave proizvodnjom i trgovinom? Provedite dvosmjerni i jednosmjerni test
(koristite se rezultatima iz prethodnog postupka). [Basic Statistics/Tables Difference
tests: r, %, means OK r1:..., r2:..., N1:..., N2:... Two-sided / One-sided
Compute]
(a) Dvosmjerni test
H 0 : ...
H1 : ...
H 0 : ...
H1 : ...
Statistika analiza
(f) Izraunajte i testirajte znaajnost koeficijenta linearne korelacije izmeu prihoda i
ulaganja u reklame za sva poduzea zajedno. Kolika veliina uzorka je potrebna da bi
koeficijent korleacije bio statistiki znaajan: (a) pri teorijskoj razini signifikantnosti od
5% i snazi testa od 90%, (b) pri teorijskoj razini signifikantnosti od 1% i snazi testa od
95%? [Statistics Power Analysis Sample Size Calculation One Correlation, tTest Quick Rho:..., Alpha:..., Power Goal:... OK Fisher Z Crude Calculate
N]11
Potrebna veliina uzorka pod (a) iznosi:______________ i pod (b) iznosi:____________.
(g) Varijable pod (a) prikaite dijagramom rasipanja s pripadajuom jednadbom pravca i
koeficijentom linearne korelacije. Na dijagramu rasipanja eliminirajte najvie pet
netipinih opaanja. to se moe zakljuiti na temelju usporedbe dijagrama rasipanja
prije i nakon eliminiranja netipinih opaanja? Koja ste opaanja (poduzea) eliminirali?
[Graphs Scatterplots... Variables (X: Prihod u mil. kn, Y: Zaduenost) OK
Advanced Corr. and p (linear fit) Grpah type: Regular Fit: Linear OK
Brushing (Auto Apply, Normal: Exclude, Selection Brush: Simple, Save Brushing
settings )]
Poduzeca 8v*50c
Zaduenost = 1,2075-0,0071*x
Zaduenost = 1,5314-0,0103*x
1,2
1,2
1,0
1,0
0,8
Zaduenost
Zaduenost
0,8
0,6
0,4
0,6
0,4
0,2
0,2
0,0
-0,2
0
20
40
60
80
100
120
Prihod u mil. kn
140
160
180
200
220
0,0
20
40
60
80
100
120
140
Prihod u mil. kn
11
Parametar Rho je koeficijent korelacije iz osnovnog skupa, Alpha je teorijska razina signifikantnosti i Power
Goal je snaga testa. Kada koeficijent linerane korelacije osnovnog skupa nije poznat on se zamjenjuje njegovom
procjenom na temelju vrijednosti iz uzorka ( r ). Parametri Alpha i Power Goal se unose kao decimalni brojevi.
34
160
Statistika analiza
4. REGRESIJSKA ANALIZA
Budui da je cilj regresijske analize pronai analitiki izraz u obliku jednadbe, kojom se
najbolje opisuje statistika povezanost jedne numerike varijable s drugom ili vie
numerikih varijabli, potrebno je razlikovati slijedee modele:
(a)
(b)
(c)
(d)
yi = 0 + 1 xi + ei
i = 1, 2,3,..., n
sluajne varijable, tzv. greke relacije koje modelu daju karakter stohastinosti (engl.
stohastic term or random error). Vrijednost sluajne varijable predstavlja nepoznata
odstupanja od funkcionalnog odnosa.
Za svako opaanje i = 1,2,3,..., n postoji distribucija vjerojatnosti varijabli yi pa prema
tome postoji i distribucija vjerojatnosti varijabli ei . Ako pretpostavimo da sluajne
varijable ei imaju normalnu distribuciju s oekivanjem jednakim nuli i konstantnom
varijancom tada model poprima slijedei oblik:
yi = 0 + 1 xi
i = 1, 2,3,..., n
35
Statistika analiza
2
i =1
Metoda najmanjih kvadrata daje BLUE procijene parametara. (engl. Best Linear
Unbiased Estimate).
H 0 : ... j = 0
H 1 : ... j 0
t =
j 0
( )
Se j
Mogue je provesti i skupni test o znaajnosti regresijskog modela kao cjeline pomou
analize varijance (F-test):
H 0 : ... 0 = 1 = 0
H1 : ... j 0 j = 1, 2
Tabela ANOVA:12
Izvor varijacije
Regresija
(protumaeni dio)
Reziduali
(neprotumaeni dio)
Zbroj kvadrata
odstupanja (SS)
Sredina kvadrata
odstupanja (MS)
SP / k
n-k-1
SR / (n k 1)
F-omjer
SP = ( y i y )
i =1
n
SR = ( yi y i )
i =1
n
Ukupno
Stupnjevi
slobode
(df)
SP / k
SR / (n k 1)
ST = ( yi y )
n-1
i =1
12
U regresijskoj analizi malo n oznaava broj opaanja (veliina uzorka), dok malo k oznaava broj nezavisnih
varijabli u jednadbi regresije.
36
Statistika analiza
Y =
ei
SR
i =1
=
n k 1
n k 1
VY =
Y
Y
100
R2 =
SP
;
ST
1 R2 =
SR
;
ST
0 R2 1
(b)
(c)
(d)
(e)
(f)
37
Statistika analiza
= i
= .
(a) Procijenjeni su slijedei parametri:
0
1
________________________________________________________________________, dok
parametar 1 pokazuje: ________________________________________________________
____________________________________________________________________________
____________________________________________________________________________.
38
Statistika analiza
Prihod u mil. kn
160
140
120
100
80
60
40
20
0
-0,2
0,0
0,2
0,4
0,6
Zaduenost
0,8
1,0
1,2
95% confidence
39
Statistika analiza
(b) Pomou analize varijance testira se znaajnost regresijskog modela kao cjeline. Zato je
unutar kartice Advanced prozora Multiple Regression Results, potrebno izabrati ANOVA
(Overall goodness of fit).
H 0 : ... 0 = 1 = 0
H 1 : ... j 0 j = 1, 2
(c) Standardna pogreka regresije (engl. standard error of estimate) iznosi 19,924 to se vidi
iz prve dobivene tablice Regression Summary. To znai da prosjeno odstupanje stvarnih
vrijednosti prihoda od oekivanih vrijednosti prihoda svih poduzea iznosi 19,924 mil. kn.
Standardna pogreka regresije izraunava se kao drugi korijen iz prosjene kvadratne
pogreke (engl. Mean Square Error) jer je 19 ,924 = 396,97 . Na temelju koeficijenta
varijacije moe se procijeniti da je prosjeno odstupanje od regresijskog pravca relativno
malo jer je VY = 20,87% (prethodno je potrebno izraunati aritmetiku sredinu zavisne
varijable kao to je opisano u prvom poglavlju).
(d) Koeficijent determinacije ( R 2 = 0, 7171 ) pokazuje kako je 71,71% ukupnog zbroja
kvadrata odstupanja protumaeno regresijom, to se vidi iz prve dobivene tablice Regression
Summary. Koeficijent determinacije moe se lako izraunati na temelju tabele ANOVA jer
48301, 46
je 0 , 7171 =
.
67356,13
Relativno visoka vrijednost koeficijenta determinacije upuuje na zakljuak da je regresijski
model reprezentativan.
(e) U odreivanju intervalnih granica procjene prihoda poduzea kada zaduenost iznosi
0,24055 na razini pouzdanosti od 95% koristite proceduru izbora opcija Multiple Regression
Results Residuals/assumption/prediction Predict dependent variable (Compute
confidence limits). Prije pritiska na OK potrebno je specificirati vrijednost nezavisne
varijable iz uzorka upisujui broj 0,24055.
40
Statistika analiza
Iz prethodne tablice je uoljivo kako se moe oekivati prihod od 124,7255 mil. kn kada
zaduenost poduzea iznosi 24,055% (radi se o procjeni jednim brojem, tzv. tokastoj
procjeni engl. point estimation).
Rjeenje 4.1.2. U programu STATISTICA otvorite novi radni list u kojem ete samostalno
unijeti podatke iz primjera 12.5 (potronja benzina u litrama i broj prijeenih kilometara).
13
Potrebno je razlikovati granice intervalne procijene (engl. confidence limits) od granica prognostike procijene
(engl. prediction limits). Intervalna procjena zavisne varijable se rauna uvrtavajui vrijednost nezavisne varijable
iz uzorka, dok se granice prognostike procijene dobiju uvrtavajui neku pretpostavljenu vrijednost nezavisne
varijable koja nije zadana u uzorku.
14
Ako je rezidualno odstupanje negativno znai da se radi o toki koja se nalazi ispod regresijskog pravca. Ako je
rezidualno odstupanje pozitivno znai da se radi o toki koja se nalazi iznad regresijskog pravca.
41
Statistika analiza
Novi radni list kreirajte tako da u glavnom izborniku File izaberete New. U novom
dobivenom prozoru potrebno je specificirati toan broj varijabli (2) i toan broj opaanja
(15) unutar kartice Spreadsheet.
(a) Nacrtajte dijagram rasipanja. Koristite proceduru izbora opcija Graphs Scatterplots
Quick Variables OK OK.15
15
Nemojte zaboraviti specificirati koja je varijabla zavisna (Y), a koja nezavisna (X).
42
Statistika analiza
(b) Izraunajte parametre linearne regresijske jednadbe koja pokazuje ovisnost broja
prijeenih kilometara o potronji benzina (koristite rezultate dobivene pod (a)).
0 = 39,8686
1 = 9, 7054
fit).16
Napomena: Iako konstantni lan (engl. Intercept) u jednadbi regresije nije statistiki
znaajan (p-vrijednost je vea od 0,05 pa nije oznaen crvenom bojom) ne preporua se
izostavljanje tog lana. Izostavljane konstantnog lana moe uzrokovati pristranost
koeficijenta regresije 1 i nerealno visoku vrijednosti t-testa.
(e) Izraunajte i objasnite znaenje koeficijenta determinacije! Koliko iznosi korigirani
koeficijent determinacije?18
16
43
Statistika analiza
R 2 = 0,9777976
R2 = 1
15 1
1 R 2 = 0,9760897
15 2
(f) Izraunajte oekivani broj prijeenih kilometara ako potronja iznosi 80 litara. Za
pretpostavljenu vrijednost nezavisne varijable izraunajte donju i gornju granicu
prognostike procjene na razini pouzdanosti od 99%. Koristite proceduru izbora opcija
Multiple Regression Results Residuals/assumptions/predictin Predict dependent
variable Cmpute prediction limits Alpha: 0,01 OK.
Ako je funkcionalni dio regresijskog modela linearan, ako su potencije varijabli jednake
jedan i ako je sluajna varijabla u zbroju s funkcionalnim djelom modela, rije je o
modelu linearne regresije. Ipak, odnosi meu pojavama mogu biti nelinearni. Modeli
kojima se izraavaju nelinearni odnosi nazivaju se modelima nelinearne (krivolinijske)
regresije.
Vei dio nelinearnih modela analiziraju se na isti nain kao i model jednostavne
linearne regresije jer se prikladnim transformacijama mogu linearizirati. Najee se
provodi logaritamska transformacija.
Transformacije
varijabli
Polinom 2. stupnja
Jednadba
modela
yi = 0 + 1 xi + 2 xi2
Eksponencijalni
yi = 0 1xi
log Y
Logaritamski
yi = 0 + 1 log xi
log X
Dvostrukologaritamski
yi = 0 xi1
log Y , log X
X2
Linearizirani
oblik modela
yi = 0 + 1 xi + 2 xi2
44
Statistika analiza
14
40
12
35
Y=5*1,16^X
30
Y=30*0,75^X
25
20
15
Y=5*X^1,2
10
0
0
Y=5*X^0,7
10
10
15
0,5
1,5
2,5
Rjeenje 4.2.1. U programu STATISTICA otvorite novi radni list u kojem ete unijeti
podatke iz primjera 12.8 (proizvodnja u 000 komada i ostvareni dohodak u mil. kuna). Novi
radni list kreirajte kao u zadatku 4.1.2. (podatke moete i importirati iz datoteke Zadatci iz
udzbenika.xls). Nakon unosa podataka napravite slijedee:
(a) Nacrtajte dijagram rasipanja. Na istom grafu prikaite jednadbu regresijskog polinoma
drugoga stupnja. Koristite proceduru izbora opcija Graphs Scatterplots Quick
Variables Advanced Graph type: Regular Fit: Polynomial OK.
45
Statistika analiza
Napomena: Unutar kartice Advanced moete izabrati koji e od modela regresije biti
prikazan na dijagramu rasipanja.
46
Statistika analiza
b1 i b2 parametri koje je potrebno procijeniti. Zatim kliknite OK OK OK
Summary: Parameter estimates.
p = 0, 00002
t1* = 2,59329
p = 0, 03577
t2* = 11,81241
p = 0, 000007
Analysis of Variance.
F * = 16932, 21 p = 0, 00000...
Y =
45,8
= 6,5 = 2,55
7
47
Statistika analiza
yi = 11,503 + 9, 7212 xi
Y = 119, 7 = 10,94
Moe se zakljuiti da je reprezentativniji regresijski polinom drugog stupnja, jer je
procijenjena standardna pogreka manja!
Rjeenje 4.2.2. U programu STATISTICA otvorite novi radni list u kojem ete unijeti
podatke iz primjera 12.6 (ukupna likvidna sredstva M4 i prosjena kamata na kunske
kredite). Nakon unosa ili importiranja podataka izvrite logaritamsku transformaciju
varijabli X i Y. Procijenite parametre dvostruko-logaritamske regresije u lineariziranom
.
obliku. Napiite jednadbu regresije u originalnom obliku. Protumaite znaenje
1
Novu varijablu log x moete kreirati u treem stupcu radnog lista. Dvostrukim klikom
pojavljuje se prozor Variable 3. U tom prozoru potrebno je
mia na eliju
napisati ime nove varijable npr. log x, i u dijalokom okviru za formule upisati
=Log10(v1) 19. To znai da vrijednosti nove varijable log x predstavljaju logaritmirane
vrijednosti likvidnih sredstava M4. Novu varijablu log y kreirajte na isti nain u
etvrtom stupcu radnoga lista (Var4).
19
Pomou funkcije Log10(x) dobiju se logaritmirane vrijednosti varijable X po bazi 10, dok se pomou funkcije
Log(x) dobiju logaritmirane vrijednosti varijable X po bazi e, tj. po bazi prirodnog logaritma ( e = 2 , 718282828 ).
48
Statistika analiza
49
Statistika analiza
Rjeenje 4.2.3. U programu STATISTICA otvorite novi radni list u kojem ete unijeti
podatke iz primjera 12.9 (proizvodnja u 000 komada i trokovi u tisuama kuna). Nakon
unosa podataka izvrite logaritamsku transformaciju varijable Y. Procijenite parametre
eksponencijalnog regresijskog modela u lineariziranom obliku. Napiite jednadbu
.
eksponencijalne regresije u originalnom obliku. Protumaite znaenje
1
log 0 = 2, 683019
log = 0, 004204
1
0 = 481,96915
1 = 1, 009727
x
yi = 481,96915 1, 009727 i
log 1 > 0
1 > 1
50
Statistika analiza
VJEBA BR. 41
(a) Izraunajte i objasnite znaenje parametara linearne regresije koja pokazuje ovisnost
broja zaposlenih o prihodima poduzea (koristite podatke iz datoteke Poduzeca.xls).
Napiite kako glasi regresijska jednadba! Jesu li procijenjeni parametri statistiki
znaajni (postavite odgovarajue hipoteze)? [Statistics Multiple Regression Quick
Variables (Dependent: Broj zaposlenih, Independent: Prihod u mil. kn) OK
Advanced Summary: Regression results]
iznosi:______________, te pokazuje __________________________________
Parametar
0
____________________________________________________________________________.
iznosi:______________, te pokazuje ___________________________________
Parametar
1
____________________________________________________________________________
____________________________________________________________________________.
Regresijska jednadba je oblika: yi = ______________________________.
H 0 : ...0 =
H 0 : ...1 =
H1 : ...0
H1 : ... 1
t0 =
____
____
= 2,3717 df = ____ p = _______; t1 =
= 27 ,1406 p = _______
____
____
Procijenjeni parametri su (a) statistiki znaajni ili (b) nisu statistiki znaajni (zaokruite
toan odgovor)!
(b) Izraunajte vrijednost F-testa na temelju tabele ANOVA. Postavite odgovarajue
hipoteze! to zakljuujete? [Multiple Regression Results ANOVA (Overall goodness
of fit)]
H 0 : ...
H1 : ...
F=
_____ ___
= _ _ _ _ _ _ p = __________
______ ___
R2 =
____
= 0,9388232
____
Y =
_____
2,7473
= 2,7473 ; VY =
100 = 9,1577%
___ _ _
_____
51
Statistika analiza
Standardna pogreka regresije ( Y ) pokazuje _______________________________________
____________________________________________________________________________.
Koeficijent varijacije regresije ( VY ) pokazuje _______________________________________
____________________________________________________________________________.
(d) Izraunajte i objasnite znaenje rezidualnog odstupanja za sedmo opaanje? Izraunajte
standardiziranu vrijednost rezidualnog odstupanja! Koja se opaanja (poduzea) mogu
identificirati kao netipina opaanja (engl. outliers)? [Multiple Regression results
Residuals/assumptions/prediction Perform residual analysis Quick Summary:
Residuals & predicted]
Rezidualno odstupanje za sedmo opaanje iznosi e7 = _ _ _ _ _ _ _ _ _ _ _ _ = 2 ,3172 .
Rezidualno odstupanje e 7 pokazuje ____________________________________________
____________________________________________________________________________.
Standardizirana vrijednost rezidualnog odstupanja je 2,3172 / _ _ _ _ _ _ = 0 ,84346 .
Netipina opaanja su poduzea pod rednim brojem:________________________________.
(e) Kreirajte transformirane vrijednosti varijabli broja zapolsenih i prihoda u mil. kn u
logaritamskom obliku po bazi 10. [Insert Add Variables How many: 1, After: 8,
Name: log(zaposleni) Long name (Functions): =Log10(v5) OK; Insert Add
Variables How many: 1, After: 9, Name: log(prihodi) Long name (Functions):
=Log10(v1) OK]. Nakon transformacije varijabli procijenite dvostruko-logaritamsku
jednadbu regresije u linearnom obliku (koristite proceduru Multiple Regression kao
pod (a)). Napiite jednadbu regresije u originalnom obliku. Protumaite znaenje
i
!
procijenjenih parametara
0
1
Dvostruko-logaritamska regresija u linearnom obliku log yi = _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ .
Dvostruko-logaritamska regresija u originalnom obliku yi = _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ .
iznosi:______________, te pokazuje __________________________________
Parametar
0
____________________________________________________________________________.
iznosi:______________, te pokazuje ___________________________________
Parametar
1
____________________________________________________________________________
____________________________________________________________________________.
(f) Za dvostruko-logaritamski model regresije izraunajte vrijednosti koeficijenta
determinacije i koeficijenta varijacije regresije. Dobivene pokazatelje usporedite s
pokazateljima u zadatku pod (c), te odgovorite koji je model regresije reprezentativniji
(linearni ili dvostruko-logaritamski model)?
R2 =
_____
= ______
_____
_____
; Vlog Y =
100 = _ _ _ _ _%
_____
52
Statistika analiza
(g) Prema reprezentativnijem modelu regresije izraunajte prognostiku vrijednost broja
zaposlenih kada prihod poduzea iznosi 10 mil. kn. Dodatno, izraunajte granice
pouzdanosti prognostike vrijednosti na 99%-tnoj razini. [Multiple Regression results
Residuals/assumptions/prediction Compute prediction limits Alpha: 0,01
Predict dependent variable log(prihodi): 1 OK]
{
Pr { _ _ _ _ _ _ _ _ < y
< _ _ _ _ _ _ _ _ _ = 0,99
(h) Procijenite regresijski polinom drugog stupnja. Napiite kako glasi regresijska jednadba.
Jesu li procijenjeni parametri statistiki znaajni. Dijagramom rasipanja usporedite
regresijske i stvarne vrijednosti broja zaposlenih. [Statistics Advanced
Linear/Nonlinear Models Nonlinear estimation User-specified regression, least
squares OK Function to be estimated. Unutar prozora Estimated function upiite:
v5=b0+b1*v1+b2*v1^2 OK OK OK Quick Summary: Parameter estimates.
Nadalje, da bi kreirali dijagram rasipanja izaberiteResults: Poduzeca Fitted 2D
function & observed vals]
50
Broj zaposlenih
40
30
20
10
-10
0
20
40
60
80
100
120
140
160
180
200
220
Prihod u mil. kn
53
Statistika analiza
4.3. VIESTRUKA REGRESIJA
y n = 0 + 1 x n1 + 2 x n 2 + ... + j x nj + ... + k x nk + en
y = X +e,
pri emu je:
y1
y
2
y = yi
y
n
X = 1
x11 x12
x1 j
x 21 x 22
x2 j
xi 1 xi 2
xij
x n1 x n 2
x nj
x1 k
0
e1
e
x2 k
1
2
xik = i e = ei
e
x nk
n
k
yi = 0 + 1 x1,i + 2 x2 ,i + ... + k xk ,i + ei
54
Statistika analiza
Cilj metode najmanjih kvadrata jest minimizirati zbroj kvadrata odstupanja sluajnih
varijabli ei na temelju vrijednosti iz uzorka:
min( e T e )
min(( y X )T ( y X ))
( e T e )
=0
j
j = 0 ,1,2 ,..., k
XT( y X )=0
XT y = XT X
odnosno:
= ( X T X ) 1 X T y
y = X
t =
*
j
Se ( j )
Y S jj S jj = diag ( X T X )
; Se ( j ) =
j = 1, 2,...,k
55
Statistika analiza
b j = j
j = 1, 2, ..., k
20
56
Statistika analiza
Testiranje jeli multikolinearnost ozbiljan problem moe se provesti pomou FarrarGlauberovog testa. Nultom hipotezom se pretpostavlja da je korelacijeka matrica C
jedinina matrica:
H 0 :... C = I
H1 :... C I
2 = n 1 ( 2k + 5 ) ln ( det C )
6
VIFj =
1
1
=
2
1 R j TOL j
Problem autokorelacije najee se pojavljuje zbog netone specifikacije modela ili krivo
odabranog funkcionalnog oblika samog modela, a moe se otkriti analizom rezidualnih
odstupanja. Taj problem se javlja ee kod vremenskih regresijskih modela (engl. time
series regression) nego kod prostornih (engl. cross-section regression).
2
( et et 1 )
DW = t =2
et
t =1
Problem autokorelacije vieg reda se testira pomou Ljung-Box testa. Grafiki prikaz koeficijenta autokorelacije
za vie vremenskih pomaka naziva se korelogram.
57
Statistika analiza
(d) Koliko iznosi standardna pogreka regresije. to ona pokazuje? Na temelju odgovarajue
relativne mjere disperzije ocijenite reprezentativnost viestruke (multiple) regresije.
(e) Protumaite znaenje korigiranog koeficijenta determinacije.
(f) Izraunajte prognostike granice procjene prihoda poduzea kada zaduenost iznosi 0,5
i broj zaposlenih 50, na temelju razine pouzdanosti od 90%.
(g) Napiite regresijsku jednadbu u standardiziranom obliku, te odgovorite koja od
regresorskih varijabli ima vei relativan utjecaj na promatranu regresand varijablu?
(h) Ispitajte je li postoji problem kolinearnosti izmeu skupa regresorskih varijabli!
(i) Protumaite znaenje parcijalnih koeficijenata korelacije.
(j) Ispitajte jesu li rezidualna odstupanja autokorelirana s pomakom jedan!
Rjeenje 4.3.1. Unutar glavnog izbornika Statistics potrebno je izabrati Multiple Regression.
Nakon to izaberete koja je varijabla zavisna, a koje su varijable nezavisne kliknite OK.
Unutar prozora Multiple Regression Results u kartici Advanced izaberite Summary:
Regression results.
(a)
23
Grafiko prikazivanje s vie od dvije regresorske varijable je vrlo sloeno jer se radi o hiperravninama.
58
Statistika analiza
(c)
(d) Y =
(e)
R2 =
8, 6951
75, 60 = 8, 6951 mil. kn prihoda VY =
100 = 9,11%
95, 4809
63802, 71
= 0,94724 R 2 = 0,945
67356,13
ZY = 0,16022 z1 + 0,83759 z2
b1 = 0,16022
b2 = 0,83759
59
Statistika analiza
(h) Da bi ispitali postojanje problema (multi)kolinearnosti izmeu varijabli x1 i x2 koristite
se izborom opcija Multiple Regression Results Advanced Partial Correlations.
1
1
=
= 3, 0484
0,32804 1 0, 67196
TOL j > 0, 2 VIFj < 5, 0 ne postoji kolinearnost
TOL1 = TOL2 = 0,32804 VIF1 = VIF2 =
r13.2 = 0.901951
H 0 :... = 0
H1 :... > 0
(a) U program STATISTCA unesite podatke iz zadatka 12.11 na str. 234 udbenika
"Statistika za ekonomiste". Izraunajte ocjene parametara jednadbe viestruke regresije.
Zavisna varijabla je stopa nataliteta, dok su ostale varijable nezavisne. Objasnite
znaenje svakog parametra pojedinano.[Statistics Multiple Regression Quick
Variables (Dependent: Stopa nataliteta, Independent: Postotak nepismenih - Broj
lijenika na 1000 stanovnika) OK Advanced Summary: Regression results]
60
Statistika analiza
iznosi:______________, te pokazuje __________________________________
Parametar
0
____________________________________________________________________________.
iznosi:______________, te pokazuje ___________________________________
Parametar
1
____________________________________________________________________________
____________________________________________________________________________.
iznosi:______________, te pokazuje __________________________________
Parametar
2
____________________________________________________________________________
____________________________________________________________________________.
Regresijska jednadba je oblika yi = ______________________________________________.
(b) Ispitajte znaajnost viestruke regresije standardnim F-testom. Signifikantnost testa
iznosi 1%. Postavite odgovarajue hipoteze! [Multiple Regression Results ANOVA
(Overall goodness of fit)]
H 0 : ...
H1 : ...
F=
____ ___
= _ _ _ _ _ _ p = __________
____ ___
H 0 : ...0 =
H 0 : ...1 =
H 0 : ...2 =
H1 : ...0
H1 : ... 1
H1 : ... 2
R2 =
____
=______ ;
____
R2 = _ _ _ _ _ _ _
61
Statistika analiza
(e) Ako postotak nepismenih iznosi 3, a broj lijenika na 1000 stanovnika 22, kolika se stopa
nataliteta moe oekivati prema viestrukom regresijskom modelu? Izraunajte i granice
prognostike procjene na razini pouzdanosti od 90%. [Multiple Regression results
Residuals/assumptions/prediction Compute prediction limits Alpha: 0,10
Predict dependent variable Postotak3, Broj lijenika na22 OK]
______/ ___
= ________ p = __________ prihvaa se hipoteza _____
______ / ___
62
Statistika analiza
(h) Izraunajte vrijednost korigiranog koeficijenta determinacije i objasnite njegovo
znaenje konkretno (koristite rezultate pod (f)).
Korigirani koeficijent determinacije iznosi:____________, te pokazuje __________________
____________________________________________________________________________
____________________________________________________________________________.
b1 = _ _ _ _ _ _ _ ; b2 = _ _ _ _ _ _ _ ; b3 = _ _ _ _ _ _ _
63
Statistika analiza
5. BROJANA ANALIZA VREMENSKIH NIZOVA I GRAFIKO PRIKAZIVANJE
yt = yt yt 1
t = 2 ,3, 4 ,...,T
2 yt = yt yt 1 = yt 2 yt 1 + yt 2
yt yt 4 = ( yt yt 1 ) ( yt 4 yt 5 )
t = 6 , 7 ,8,...,T
yt =
t = 3, 4 ,5,...,T
(y
y1 ) + ( y3 y2 ) + ... + ( yT yT 1 )
T 1
yT y1
T 1
y
St = ( ln yt ln yt 1 ) 100 = ln t 100 = ....%
yt 1
St =
T 1
yT + k = yT G k
G = T 1
yT
I
= T 1 T
y1
I1
64
Statistika analiza
Posebni oblici skupnih indeksa koji se najee pojavljuju u praktinim primjenama jesu
skupni indeks potroakih cijena kao posebni skupni indeks cijena, te skupni indeks
fizikog obujma kao posebni skupni indeks koliina.
Indeks potroakih cijena (engl. Consumer Price Index) odraava promjene u razini
cijena dobara i usluga koje kupuje referentno stanovnitvo radi finalne potronje.
Izraunava se kao ponderirana (vagana) aritmetika sredina Laspeyresovog tipa za
reprezentativnu koaricu koju ini 540 proizvoda, a za pondere se uzimaju udjeli u
potronji rezidentnih kuanstava koji se temelje na rezultatima Ankete o potronji
kuanstava. Namjena indeksa potroakih cijena je slijedea:
mjerenje inflacije
indeksiranje plaa
deflacioniranje pojedinih kategorija na makro-razini
Zadatak 5.1. U programu STATISTICA otvorite novu bazu podataka iz datoteke pod
nazivom Vremenski nizovi.xls koristei Excelovo suelje. Vremenski niz prosjenih
nominalnih neto plaa prikaite odgovarajuim grafikonom. Izraunajte bazne indekse
potroakih cijena (prosinac 2002=100). Na temelju baznih indeksa izraunajte vrijednosti
realnih plaa. Vrijednosti realnih i nominalnih plaa usporedite na istom grafikonu.
Objasnite odnos izmeu nominalne i realne plae u kolovozu 1996. godine, te u kolovozu
2005. godine.
Nakon otvaranja Excelove radnje knjige pojavljuje se radni list pod nazivom trziste rada
i cijene. Iz slike se vidi kako Excelova radna knjiga sadri vie radnih listova pod
razliitim nazivima, npr. turizam i trgovina itd. Vrijednosti vremenskih nizova
uglavnom su prikupljeni na mjesenoj razini.
65
Statistika analiza
66
Statistika analiza
esto je potrebno promijeniti ili tono specificirati adresu prvog stupca u kojem se
nalaze prikupljeni podaci i adresu stupca u kojem se nalazi vremensko obiljeje. Kako su
u prvom stupcu navedeni mjeseci potrebno je podesiti Read case names from column: A.
To znai da se podaci, koji e se analizirati, nalaze u ostalim stupcima poevi od drugog
stupca. Zato je takoer potrebno podesiti First data column: B.
Nakon to unutar prozora 2D Line Plots Variables izaberete koji vremenski niz elite
prikazati grafiki kliknite OK.
from column: A.
67
Statistika analiza
Re a ln a plaa =
No min a ln a plaa
100
bazni IPC
68
Statistika analiza
Nakon to ste izraunali prosjene realne neto plae, iste usporedite s nominalnim
plaama na istom grafikonu (ponovno pokrenite prozor 2D Line Plots Variables , te
izaberite tip grafa: Multiple).
Ispod baze :
It =
I t 1 Vt
100
Iznad baze :
I t 1 =
It
100
Vt
69
Statistika analiza
Line Plot of multiple variables
Vremenski nizovi (B2:DV126) 10v*125c
5000
4500
4000
3500
3000
2500
2000
1500
1.1.1996
1.7.1997
1.1.1999
1.7.2000
1.1.2002
1.7.2003
1.1.2005
1.10.1996
1.4.1998
1.10.1999
1.4.2001
1.10.2002
1.4.2004
1.10.2005
Zadatak 5.2. U programu STATISTICA otvorite novu bazu podataka iz datoteke pod
nazivom Vremenski nizovi.xls koristei Excelovo suelje. Koristei se podacima iz radnog
lista pod nazivom trziste rada i cijene izraunajte bazne indekse nezaposlenih uzimajui za
bazu mjesec sijeanj 2001. godine. Objasnite znaenje dobivenog indeksa u mjesecu svibnju
2006. godine konkretno. Izraunajte verine indekse nezaposlenih, te prosjenu stopu
promjene nezaposlenih pomou Excelove funkcije =GEOMEAN(...).
Rjeenje 5.3. U programu STATISTICA otvorite novi radni list u kojem ete unijeti podatke
iz primjera 13.5 (investicije u graevinske radove, opremu i ostalo). Nakon unosa podataka
70
Statistika analiza
pokrenite prozor 2D Line Plots Variables , te u kartici Advanced izaberite tip grafa:
Double-Y. Na lijevoj ordinati oznaite varijablu: graevinski radovi i oprema, a na desnoj
ordinati: ostalo.
Nadalje, unutar kartice Options 1 u dijalikom okviru Case labels izaberite Variable:
Godina. Za skalu na osi Y izaberite tip logaritamske skale (Axis: Y, Type: Logarithmic).
71
Statistika analiza
Line Plot of multiple variables
Spreadsheet1 4v*13c
100000
90000
80000
70000
60000
50000
Graevinski radovi(L)
Oprema(L)
Ostalo(R)
18000
17000
16000
15000
14000
13000
12000
11000
10000
9000
8000
40000
7000
6000
30000
5000
4000
20000
3000
2000
10000
1000
1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987
VJEBA BR. 61
72
Statistika analiza
Bazni indeks realnih plaa u lipnju 2001. godine iznosi:___________, te pokazuje_________
____________________________________________________________________________
____________________________________________________________________________.
(c) U stupcu M izraunajte vrijednosti realnih plaa u kunama na temelju baznih indeksa
relanih plaa iz stupca L. Objasnite odnos realne i nominalne plae u svibnju 2006.
godine (jesu li u tom mjesecu realne plae bile vee ili manje od nominalnih, zato i za
koliko posto?). [U eliji M1 upiite: Realne plae u kunama u eliji M2 upiite
formulu =L2*3232/100 kopirajte formulu]
U svibnju 2006. godine realna plaa je iznosila:_______________kn, dok je nominalna plaa
iznosila:_______________kn, to znai ____________________________________________
____________________________________________________________________________
____________________________________________________________________________.
(d) Izraunajte i objasnite znaenje geometrijske sredine verinih indeksa potroakih
cijena (dobra) i geometrijske sredine verinih indeksa potroakih cijena (usluge).
[koristite formulu =GEOMEAN(H3:H126) i formulu =GEOMEAN(I3:I126)]
Geometrijska sredina verinih indeksa potroakih cijena za dobra iznosi:____________, to
pokazuje_____________________________________________________________________
____________________________________________________________________________.
Geometrijska sredina verinih indeksa potroakih cijena za usluge iznosi:___________, to
pokazuje_____________________________________________________________________
____________________________________________________________________________.
73
Statistika analiza
6. TREND
Vremenski niz, intervalni ili trenutani, moe biti stacionaran ili moe imati trend. Ako
vremenski niz sadri trend komponentu znai da ima dugoronu tendenciju rasta ili
pada. Za razliku od regresije kod trenda uvijek je nezavisna varijabla vrijeme (npr.
godine, mjeseci, tjedni, dani,...).
+
x
(a) Jednostavni linearni: yt =
0
1
t
(b) Trend polinom drugog stupnja:
+
x +
x2
yt =
0
1
t
2
t
X t ili y = e 0 + 1 X t
yt =
0
1
t
X t
X t2 ili y = e 0 + 1 X t + 2 X t2
yt =
0
1
2
t
(e) Asimptotski trend modeli (npr. modificirani eksponencijalni trend, Gompertzov trend
ili logistiki trend).
Asimptoski trend modeli pod (e) ne mogu se procijeniti metodom najmanjih kvadrata,
zato se nee dalje analizirati. Openito, asimptotski trend modeli za razliku od
jednostavnog eksponencijalnog trenda razlikuju se za dodatni parametar L koji
predstavlja vrijednost asimptote kojoj promatrana pojava tei u dugom roku, a nikada je
nee dostii.
Zadatak 6.1. U programu STATISTICA otvorite bazu podataka iz datoteke pod nazivom
Vremenski nizovi.xls koristei Excelovo suelje. Koristei se podacima iz radnog lista pod
nazivom financijski sektor izraunajte parametre jednostavnog linearnog trenda za varijablu
M1. Objasnite znaenje dobivenih rezultata konkretno! Prema linearnom trendu
prognozirajte vrijednost novane mase M1 u mjesecu rujnu 2011. godine. Izraunajte i
prognostike granice procjene na temelju 95%-tne razine pouzdanosti. Jednadbu linearnog
trenda prikaite odgovarajuim grafikonom.
74
Statistika analiza
Rjeenje 6.1. U programu STATISTICA otvorite datoteku Vremenski nizovi.xls izborom
opcijea File Open File name: Vremenski nizovi Open. U slijedeem koraku
izaberite opciju Open as an Excel Workbook. Unutar radnog lista financijski sektor
formirajte varijablu vrijeme s ishoditem na poetku promatranog razdoblje, tj. Xt =0, 1, 2,
3, 4, 5, 6, ...., 134, 135, 136. Koristei proceduru Multiple Regression, kao u poglavlju 4,
procijenite parametre linearnog trenda. Za zavisnu varijablu oznaite M1, a za nezavisnu
varijablu Xt, kao to je prikazano na slijedeoj slici.
yt =
75
Statistika analiza
Standardna pogreka procijenjenog linearnog trenda iznosi:_____________, dok koeficijent
varijacije trenda od ___________% pokazuje _______________________________________
____________________________________________________________________________.
Empirijski F-omjer iznosi: ________________. Pri empirijskoj razini signifikantnosti ______
______________________________________moe se prihvatiti hipoteza________________
____________________________________________________________________________.
76
Statistika analiza
M1
30000
25000
20000
15000
10000
5000
-20
20
40
60
80
100
120
140
160
Xt
Zadatak 6.2. Koristei podatke iz radnog lista pod nazivom financijski sektor izraunajte
parametre trend polinoma drugog stupnja za varijablu: kamatna stopa na kunske kredite s
valutnom klauzulom (prosjek). Objasnite znaenje dobivenih rezultata konkretno! Prema
trend polinomu drugog stupnja izraunajte oekivane vrijednosti KS i procijenjene greke
relacije (rezidualna odstupanja). Objasnite znaenje rezidualnog odstupanja za mjesec
prosinac 1995. godine. Jednadbu procijenjenog trenda prikaite na dijagramu rasipanja.
Procijenite jednadbu eksponencijalnog trenda na istom grafikonu. Protumaite znaenje
dobivenih parametara eksponencijalnog trenda. Koji je model trenda reprezentativniji?
77
Statistika analiza
Rjeenje 6.2. Unutar radnog lista financijski sektor formirajte varijablu vrijeme s ishoditem
na poetku promatranog razdoblje, tj. Xt =0, 1, 2, 3, 4, 5, 6, ...., 134, 135, 136. Koristei
proceduru Nonlinear Estimation, kao u poglavlju 4, procijenite parametre trend polinoma
drugog stupnja definirajui funkciju oblika: v9=b0+b1*v13+b2*(v13^2).
78
Statistika analiza
79
Statistika analiza
Model: v9=b0+b1*v13+b2*(v13^2)
Y = 22,3815*exp(-0,01*x)
Function = y=(22,8101)+(-,21574)*x+(,685e-3)*(x^2)
30
28
26
24
22
20
18
16
14
12
10
8
6
4
-20
20
40
60
80
100
120
140
160
Xt
Iz gornje slike se vidi da su oba nelinearna trend modela prikladna za opisivanje kretanja
kamatne stope na kunske kredite (izmeu dviju jednadbi nema znaajne razlike). Ipak,
potrebno je procijeniti parametre eksponencijalnog trenda i donjeti odluku o izboru boljeg
modela na temelju pokazatelja reprezentativnosti i dijagnostikih testova. Eksponencijalni trend
moe se izravno procijeniti u originalnom obliku, ba kao i trend polinom drugog stupnja,
definirajui funkciju: v9=b0*b1^v13 u dijalokom okviru Function to be estimated
procedure Nonlinear Estimation.
pokazuje prosjenu
Prema trend polinomu drugog stupnja procijenjeni parametar
1
80
Statistika analiza
Eksponencijalni trend:
yt = 22 ,88604 0 ,98983 X t
mjesena
stopa
promjene
iznosi
VJEBA BR. 71
(a) U program STATISTCA unesite podatke iz primjera 16.6 na str. 234 udbenika
"Statistika za ekonomiste" (prilikom importiranja podataka iz datoteke Zadatci iz
udzbenika.xls koristite opciju Insert selected sheet to a Spreadsheet 16.6 OK
Get variable names from first row OK). Izraunajte ocjene parametara jednadbe
X t
X t2 (logaritamska parabola). Kreirajte transformirane vrijednosti
trenda: Yt =
0
1
2
varijable broja stanovnika u logaritamskom obliku po bazi 10. Formirajte varijablu
vrijeme (Xt) s ishoditem na poetku promatranog razdoblja, a ne s ishoditem na sredini
promatranog razdoblja kao u udbeniku (promijenom ishodinog razdoblja mijenja se
, dok procijenjene vrijednosti ostalih parametara ostaju
vrijednost parametra
0
nepromijenjene). [Insert Add Variables How many: 1, After: 2, Name: log(Yt)
Long name (Functions): =Log10(v2) OK; Insert Add Variables How many: 1,
After: 3, Name: Xt OK upiite brojeve 0, 1, 2, 3, ..., 8; Insert Add Variables
How many: 1, After: 4, Name: Xt^2 Long name (Functions): =v4^2 OK ].
Jednadbu trenda napiite u logaritamskom (linearnom) i originalnom (nelinearnom)
obliku. Objasnite znaenje procijenjenih parametara konkretno! [Statistics Multiple
Regression Quick Variables (Dependent: log(Yt), Independent: Xt Xt^2 )
OK Advanced Summary: Regression results]
Jednadba trenda u logaritamskom obliku je log yi = _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ .
Jednadba trenda u originalnom obliku je yi = _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __ .
iznosi:______________, te pokazuje _________________________________
Parametar
0
____________________________________________________________________________.
81
Statistika analiza
iznosi:______________, te pokazuje _________________________________
Parametar
1
____________________________________________________________________________
____________________________________________________________________________.
H 0 : ...
H1 : ...
F=
______ ___
= _ _ _ _ _ _ p = ______
______ ___
log Y =
_______
______
= __________ ; Vlog Y =
100 = _______ %
___ _ ___
_______
(d) U program STATISTCA unesite podatke iz zadatka 16.9 na str. 337 udbenika "Statistika
za ekonomiste" (prilikom importiranja podataka iz datoteke Zadatci iz udzbenika
koristite opciju Insert selected sheet to a Spreadsheet 16.9 OK Get variable
names from first row OK). Formirajte varijablu vrijeme (Xt) s ishoditem na poetku
promatranog razdoblja, a ne s ishoditem na sredini promatranog razdoblja kao u
udbeniku. [Insert Add Variables How many: 1, After: 2, Name: Xt OK
upiite brojeve 0, 1, 2, 3, ..., 10]. Odredite parametre optimalnog trend-polinoma
(procijenite parametre trend-polinoma prvog stupnja, drugog stupnja, treeg stupnja i
etvrtog stupnja). [Statistics Advanced Linear/Nonlinear Models Nonlinear
estimation User-specified regression, least squares OK Function to be
estimated. Unutar dijalokog okvira Estimated function upiite v2=b0+b1*v3 OK
OK OK Quick Summary: Parameter estimates ponovite postupak za trendpolinom drugog stupnja tako da unutar dijalokog okvira Estimated function upiete
v2=b0+b1*v3+b2*v3^2 OK OK OK Quick Summary: Parameter estimates
ponovite postupak za trend-polinom treeg stupnja tako da unutar dijalokog okvira
82
Statistika analiza
Estimated function upiete v2=b0+b1*v3+b2*v3^2+b3*v3^3 OK OK OK Quick
Summary: Parameter estimates ponovite postupak za trend-polinom etvrtog
stupnja tako da unutar dijalokog okvira Estimated function upiete
v2=b0+b1*v3+b2*v3^2+b3*v3^3+b4*v3^4 OK OK OK Quick Summary:
Parameter estimates]
Jednadba trend polinoma prvog stupnja je yi = _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ .
Jednadba trend polinoma drugog stupnja je yi = _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ .
Jednadba trend polinoma treeg stupnja je yi = _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ .
Jednadba trend polinoma etvrtog stupnja je yi = _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ .
Da bi odredili optimalan trend-polinom potrebno je testirati kada e smanjenje rezidualnog
zbroja kvadrata odstupanja (engl. Residual Sum of Squares) biti statistiki beznaajno
(pogledati str. 337 iz udbenika). To znai da je za svaki od procijenjenih trend polinoma
potrebno izvriti analizu varijance izborom opcija Results: ... Quick Analysis of
Variance.
Optimalan trend-polinom je ________________ stupnja jer je _________________________
____________________________________________________________________________
____________________________________________________________________________.
(e) Ocjenite znaajnost optimalnog trend polinoma pod (d) na temelju standardne pogreke
trenda i koeficijenta varijacije trenda (koristite se rezultatima pod (d))!
Y =
_______
______
= __________ ; VY =
100 = _______ %
___ _ ___
_______
R2 =
_____
= __________
______
83
Statistika analiza
iznosi:______________, te pokazuje __________________________________
Parametar
0
____________________________________________________________________________.
iznosi:______________, te pokazuje ___________________________________
Parametar
1
____________________________________________________________________________
____________________________________________________________________________.
(h) Trend polinom prvog stupnja i trend polinom drugog stupnja usporedite na istom
grafikonu! [Graphs Scatterplots... Variables (X: Xt Y: Proizvodnja u 000 kom.)
OK dvostrukim klikom mia toke zamijenite linijom (iskljuite Markers; ukljuite
Line) OK nakon desnog klika miem izaberite Graph Properties (All Options)...
Plot: Fitting Add new fit Fit type: Polynomial OK]
Scatterplot of Proizvodnja u 000 kom. against Xt
Zadatci iz udzbenika 3v*11c
Proizvodnja u 000 kom. = 132,9545+50,9545*x
Proizvodnja u 000 kom. = 99,6503+73,1573*x-2,2203*x^2
700
600
500
400
300
200
100
0
-2
10
12
Xt
(i) Prema trend-polinomu drugog stupnja kolika proizvodnja se moe oekivati u 2012.
godini?
84
Statistika analiza
7. MJERENJE I ELIMINIRANJE SEZONSKIH VARIJACIJA
Kod modeliranja vremenskih nizova cilj je pronai onaj analitiki izraz, tj. jednadbu
kojom se najbolje opisuje ili predoava kretanje promatrane pojave u ovisnosti o
vremenu ( xt ). U prethodnom poglavlju su navedeni oblici deterministikog trenda:
linearnog, eksponencijalnog i trend polinoma. Na primjer, ako su prve diferencije
promatranog vremenskog niza priblino jednake i konstantne ( yt const. ) moe se
zakljuiti da isti sadri linearni trend ili ako su druge diferencije priblino jednake i
konstantne ( 2 yt const. ) moemo zakljuiti da se vremenski niz razvija prema trend
polinomu drugog stupnja. Ako su pak pojedinane stope promjene verinih indeksa
priblino jednake ( St const. ) moemo zakljuiti da vremenski niz sadri
eksponencijalni trend.
85
Statistika analiza
pitanja daje periodogram. U osnovi spektralna analiza se temelji na Fourierovim
transformacijama vrijednosti vremenskog niza pomou funkcija sinusa i kosinusa.
Spektralna analiza ovdje se nee razmatrati.
yt = (Tt + Ct ) + St + et
ili
yt = (Tt Ct ) St et
St - sezonska komponenta (opisuje periodino obnavljanje pojave unutar jedne godine, npr.
mjeseci, kvartali, tjedni, dani) i
I t*,S I t ,e
yt = Tt
100 100
86
Statistika analiza
1
1
yt 2 + yt 1 + yt + yt +1 + yt + 2
2
CMAt ( 4 ) = 2
4
1
1
yt 6 + yt 5 + ... + yt 1 + yt + yt +1 + ... + yt + 5 + yt + 6
2
CMAt (12 ) = 2
12
2. U drugom koraku izraunavaju se prve procjene sezonskih faktora (indeksa) pomou
omjera originalnih vrijednosti vremenskog niza i pripadajuih centriranih pominih
prosjeka, pri emu zbroj prosjenih sezonskih faktora istih mjeseci ili kvartala mora biti
87
Statistika analiza
jednak 12, odnosno 4. U protivnom se sezonski faktori istoimenih mjeseci odnosno
kvartala korigiraju.
I t ,S =
yt
100
CMAt ( k )
yt* =
yt
100
I t*,S
yt*
100
I t , =
CMAt ( k )
Postoji vie metoda analize sezonskih pojava u sklopu navedenih pristupa. Relativno je
jednostavna metoda odnosa prema pominim prosjecima, zatim regresijski model sa
sezonskim indikator varijablama (engl. dummy). Posebno je rairena CENZUS metoda i
njezine varijante, kao na primjer X-12-ARIMA, koji rabi veina dravnih zavoda za
statistiku, te TRAMO/SEATS, STAMP i druge.
Zadatak 7.1. Koristei podatke iz datoteke Vremenski nizovi.xls unutar radnog lista BDP
kvartalni izvrite klasinu dekompoziciju vremenskog niza multiplikativnom metodom
(Cenzus I ). Objasnite znaenje dobivenih rezultata konkretno!
Rjeenje 7.1. U programu STATISTICA otvorite datoteku Vremenski nizovi.xls birajui
opcije: File Open File name: Vremenski nizovi Open. Otvorite radni list pod
nazivom BDP kvartalni u kojem se nalaze vrijednosti bruto-domaeg proizvoda u mil. kn
(tekue cijene) od prvog kvartala 2002. godine do zadnjeg kvartala 2008. godine, to ini
ukupno 28 opaanja.
88
Statistika analiza
89
Statistika analiza
Na temelju rezultata iz gornje tablice prvi centrirani pomini prosjek jednak je:
1
1
41220 + 44397 + 50500 + 4581 + 4400
2
CMA1 ( 4 ) = 2
= 45827 ,00 .
4
Drugi centrirani pomini prosjek jednak je:
1
1
44397 + 50500 + 4581 + 4400 + 49034
2
CMA2 ( 4 ) = 2
= 46754 ,13... itd .
4
Prema gore navedenim izraunima centrirani etverolani pomini prosjek je peterolani
1 1 1 1 1
ponderirani pomini prosjek s ponderima , , , i , to znai da tri sredinja lana
8 4 4 4 8
imaju jednake pondere (25%) dok prvi i zadnji lan imaju dvostruko manje pondere
(12,5%).
90
Statistika analiza
Prve procjene sezonskih indeksa su jednake omjerima (engl. ratios) originalnih vrijednosti
vremenskog niza i pripadajuih centriranih pominih prosjeka:
I1,S =
50500
100 = 110,19700
45827
I 2 ,S =
45801
100 = 97 ,9614 ...itd .
46754,13
S1 =
S2 =
S3 =
S4 =
Zbroj vrijednosti prosjenih sezonskih indeksa istih kvartala nije jednak 400 jer je:
S1 + S 2 + S3 + S 4 = 400 , 27951 .
Zato se prosjeni sezonski indeksi istih kvartala korigiraju za faktor:
k=
400
= 0,9993017 .
400, 27951
24
Konane procijene sezonskih indeksa mogu se dobiti upotrebom korektivnog faktora na temelju medijalnih
vrijednosti prvih procijena sezonskih indeksa istih kvartala.
91
Statistika analiza
Prosjene vrijednosti sezonskih indeksa kada su iskljuene vrijednosti prvih procjena
najmanjeg i najveeg sezonskog indeksa su:
S1 =
S2 =
100, 4232 + 99 ,9230 + 100, 4647 + 99,8355 + 100, 2483 + 104 ,1214
= 100, 2648
4
S3 =
110 ,1970 + 109 , 2388 + 109 ,0956 + 109 , 2570 + 109 , 0277 + 111, 4586
= 109, 4471
4
S4 =
Zbroj vrijednosti prosjenih sezonskih indeksa istih kvartala nije jednak 400 jer je:
S1 + S 2 + S3 + S 4 = 399 ,8495 .
Zato se prosjeni sezonski indeksi istih kvartala korigiraju za faktor:
k=
400
= 1,000376 .
399,8495
I.
II.
III.
IV.
Ukupno
92,6571
100,3025
109,4883
97,5520
400
-7,3429%
+0,3025%
+9,4883
-2,4480%
92
Statistika analiza
Desezionirane vrijednosti vremenskog niza, tj. vrijednosti oiene od sezonskih utjecaja,
raunaju se tako da se originalne vrijednosti vremenskog niza podijele sa konanim
procjenama sezonskih indeksa i pomnoe sa sto:
y1* =
41220
100 = 44486 , 6
92 , 6571
y*2 =
44397
100 = 44263,1
100 ,3025
y3* =
50500
100 = 46123,6 ...itd .
109 , 4883
I1,e =
44486 , 6
100 = 99 ,9588
44504 ,93
I 2 ,e =
44263,1
100 = 98, 4548
44957 ,78
I 3 ,e =
46123, 6
100 = 100 ,5673 ...itd .
45863, 47
41220 = 44504,93
100
100
44397 = 44957 , 78
,....itd .
100
100
93
Statistika analiza
25
Ako po defaultu nije aktivirana opcija Case names u dijalokom okviru Label data points with, tada oznaite tu
opciju. Aktiviranjem opcije Case names na osi X bit e navedene jedinice vremena (kvartal/godina).
94
Statistika analiza
Plot of selected variables (series)
90000
90000
85000
85000
80000
80000
BDP u tekuim cijenama (mil. kn)
BDP u tekuim cijenama (mil. kn); trns.
75000
70000
70000
65000
65000
60000
60000
55000
55000
50000
50000
45000
45000
40000
40000
35000
35000
Q1/2002
Q2/2002
Q3/2002
Q4/2002
Q1/2003
Q2/2003
Q3/2003
Q4/2003
Q1/2004
Q2/2004
Q3/2004
Q4/2004
Q1/2005
Q2/2005
Q3/2005
Q4/2005
Q1/2006
Q2/2006
Q3/2006
Q4/2006
Q1/2007
Q2/2007
Q3/2007
Q4/2007
Q1/2008
Q2/2008
Q3/2008
Q4/2008
Value
75000
Case Names
115
110
110
105
105
100
100
95
95
90
90
Q1/2002
Q2/2002
Q3/2002
Q4/2002
Q1/2003
Q2/2003
Q3/2003
Q4/2003
Q1/2004
Q2/2004
Q3/2004
Q4/2004
Q1/2005
Q2/2005
Q3/2005
Q4/2005
Q1/2006
Q2/2006
Q3/2006
Q4/2006
Q1/2007
Q2/2007
Q3/2007
Q4/2007
Q1/2008
Q2/2008
Q3/2008
Q4/2008
95
Statistika analiza
Zadatak 7.2. Koristei podatke iz datoteke Vremenski nizovi.xls unutar radnog lista BDP
kvartalni procijenite viestruki regresijski model s linearnim trendom i sezonskim indikator
+
x +
Q +
Q +
Q . Objasnite znaenje
(dummy) varijablama: yt =
0
1
t
2
2 ,t
3
3 ,t
4
4 ,t
Openito, dummy ili tzv. binarne varijable poprimaju unaprijed poznate vrijednosti 0 i
1. Vrijednost 1 govori o prisutnosti odreenog svojstva, a vrijednost 0 govori o
odsutnosti odreenog svojstva, pa su one sredstvo kojim se u model ukljuuje
kvalitativna varijabla.
prvi kvartal, jer je potreban broj binarnih varijabli uvijek za jedan manji od broja
modaliteta kvalitativne varijable. Kad bi se sezonski utjecaj u modelu predoio s etiri
binarne varijable, sustav normalnih jednadbi koji slijede primjenom metode najmanjih
kvadrata ne bi imao rjeenje. Takoer, ako se u modelu sezonski utjecaji mjere na
temelju mjesenih podataka potrebno je uvrstiti 11 dummy varijabli.
96
Statistika analiza
97
Statistika analiza
Line Plot of multiple variables
Spreadsheet7 13v*28c
85000
80000
75000
70000
65000
60000
55000
50000
45000
40000
35000
Q1/2002
Q1/2003
Q1/2004
Q1/2005
Q1/2006
Q1/2007
Q1/2008
Q3/2002
Q3/2003
Q3/2004
Q3/2005
Q3/2006
Q3/2007
Q3/2008
Zadatak 7.3. Koristei podatke iz datoteke Vremenski nizovi.xls unutar radnog lista turizam
i trgovina izvrite klasinu dekompoziciju vremenskog niza noenja turista
multiplikativnom metodom (Cenzus I ).
Rjeenje 7.3. U programu STATISTICA otvorite datoteku Vremenski nizovi.xls birajui
opcije: File Open File name: Vremenski nizovi Open. Otvorite radni list pod
nazivom turizam i trgovina u kojem se nalazi broj ukupnog noenja turista od sijenja 1994.
godine do svibnja 2006. godine (ukupno 149 opaanja). Ponovite proceduru dekompozicije
kao u zadatku 7.1. Napomena: broj sezonskih pomaka postavite na 12.
98
Statistika analiza
Mjesec
lipanj
Sezonski indeks
Stopa promjene
231 =
239 =
.......................
.......................
337 = .......................
100
100
100
100
100
100
15000
15000
10000
10000
5000
5000
Value
20000
-5000
1.1.1994
1.7.1994
1.1.1995
1.7.1995
1.1.1996
1.7.1996
1.1.1997
1.7.1997
1.1.1998
1.7.1998
1.1.1999
1.7.1999
1.1.2000
1.7.2000
1.1.2001
1.7.2001
1.1.2002
1.7.2002
1.1.2003
1.7.2003
1.1.2004
1.7.2004
1.1.2005
1.7.2005
1.1.2006
-5000
Noenja turista
99
Statistika analiza
500
450
450
400
400
350
350
300
300
250
250
200
200
150
150
100
100
50
50
0
-50
1.1.1994
1.7.1994
1.1.1995
1.7.1995
1.1.1996
1.7.1996
1.1.1997
1.7.1997
1.1.1998
1.7.1998
1.1.1999
1.7.1999
1.1.2000
1.7.2000
1.1.2001
1.7.2001
1.1.2002
1.7.2002
1.1.2003
1.7.2003
1.1.2004
1.7.2004
1.1.2005
1.7.2005
1.1.2006
-50
VJEBA BR. 81
(a) Prije pokretanja programa STATISTICA otvorite Excel datoteku Vremenski nizovi.xls,
te u radnom listu industrija i gradj. u stupcu M formirajte varijablu vrijeme Xt s
ishoditem na poetku promatranog razdoblja upisujui brojeve 0, 1, 2, 3, ...,147, 148. U
slijedeim stupcima od N do X formirajte sezonske dummy varijable: M2, M3, M4, M5,
M6, M7, M8, M9, M10, M11 i M12 (stupce popunite nulama i jedinicama). Sauvajte
promjene u Excelu: FileSave. Zatvorite Excel datoteku. Pokrenite program
STATISTICA, te u program importirajte podatke iz prethodne spremljene datoteke.
100
Statistika analiza
Prilikom importiranja podataka izaberite opciju Open as an Excel Workbook. Na
temelju podataka iz radnog lista industrija i gradj. procijenite regresijsku jednadbu:
+
X +
M 2+
M3+
M 4+
M5+
M6+
M7+
M8+
Yt =
0
1
t
2
3
4
5
6
7
8
M9+
M 10 +
M 11 +
M 12.
+
9
10
11
12
Varijabla Y = elektrina energija, varijabla X = vrijeme, a varijable M2, M3, M4, M5,
M6, ..., M12 su sezonske dummy varijable. [Statistics Multiple Regression (uredite
podatke upisujui Firsta data column: B Read case name from column: A)OK
Quick Variables (Dependent: Elektrina energija, Independent: Xt, M2, M3, M4,
M5, ..., M12 ) OK Advanced Summary: Regression results]
Objasnite znaenje parametara 0 , 1 , 4 i 6 konkretno! U kojem mjesecu je najvei
sezonski utjecaj? Koji od procijenjenih parametara nije statistiki znaajan?
Parametar 0 iznosi:______________, te pokazuje __________________________________
____________________________________________________________________________.
Parametar 1 iznosi:______________, te pokazuje __________________________________
____________________________________________________________________________
____________________________________________________________________________.
Parametar 4 iznosi:______________, te pokazuje __________________________________
____________________________________________________________________________
____________________________________________________________________________.
Parametar 6 iznosi:_____________, te pokazuje ___________________________________
____________________________________________________________________________
____________________________________________________________________________.
Najvei sezonski utjecaj je u mjesecu ________. Parametar _______ nije statistiki znaajan.
(b) Prognozirajte vrijednost indeksa proizvodnje elektrine energije u mjesecu lipnju 2010.
godine? Izraunajte i prognostike granice procjene na razini pouzdanosti od 99%.
[Multiple Regression results Residuals/assumptions/prediction Compute
prediction limits Alpha: 0,01 Predict dependent variable Xt: 197, M6: 1 OK]
101
Statistika analiza
(c) Grafiki usporedite stvarne vrijednosti indeksa elektrine energije s oekivanim
vrijednostima (engl. predicted). [Multiple Regression results Perform residual
analysis Save Save residuals & predicted Select All Graphs 2DGraphs
Line Plots (Variables)... Graph type: Multiple Variables: Elektrina energijaPredicted OK OK]
Line Plot of multiple variables
Spreadsheet5 31v*149c
140
130
120
110
100
90
80
70
60
Elektrina energija
Predicted
50
40
1.1.1994
1.9.1995
1.5.1997
1.1.1999
1.9.2000
1.5.2002
1.1.2004
1.9.2005
1.11.1994
1.7.1996
1.3.1998
1.11.1999
1.7.2001
1.3.2003
1.11.2004
lipanj
Sezonski indeks
Stopa promjene
(e) Napiite kako se izraunava prvi centrirani dvanaestolani pomini prosjek! Koliki
ponder je pridrueni prvom i zadnjem lanu, a koliko iznose ponderi ostalih lanova?
CMA1 (12 ) =
___________________________________
= 62, 2042
12
102
Statistika analiza
(f) Napiite kako se izraunava prva procjena sezonskog indeksa za mjesec srpanj 1994.
godine. Za isti mjesec napiite kako se izraunava desezionirana vrijednost i indeks
iregularne komponente.
I 7 ,S =
______
100 = 94 ,5274
______
y7* =
______
______
100 = 62 , 7327 I 7 ,e =
100 = 100,3102
______
______
(g) Za prva dva opaanja u tablici napiite dekompoziciju vrijednosti indeksa elektrine
energije. Pojedinano objasnite dobivene komponente!
72 , 2 = .......................
100
100
59 ,9 = .......................
100
100
103
Statistika analiza
Value
140
130
130
120
120
110
110
100
100
90
90
80
80
70
70
60
60
50
50
40
-10
10
20
30
40
50
60
70
Elektrina energija
80
90
40
100 110 120 130 140 150 160
120
115
115
110
110
105
105
100
100
95
95
90
90
85
-10
10
20
30
40
50
60
70
80
90
85
100 110 120 130 140 150 160
104
Statistika analiza
8. PROGNOSTIKI MODELI
yt = 0 + 1 yt 1 + 2 yt 2 + ... + p yt p + t
(b) Model pominih prosjeka reda q odnosno MA(q) model:
yt = t 1 t 1 2 t 2 ... q t q
(c) Mjeoviti ARMA model reda p,q odnosno ARMA(p,q) model:
yt = 0 + 1 yt 1 + 2 yt 2 + ... + p yt p + t 1 t 1 2 t 2 ... q t q
105
Statistika analiza
Prognostiki
model
AR(1)
Uvjet
stacionarnosti
1 < 1
Uvjet
invertibilnosti
----
2 + 1 < 1
AR(2)
2 1 < 1
----
1 < 2 < 1
MA(1)
----
1 < 1
Oekivanje
procesa
= 0
1 1
0
=
1 1 2
----
2 1 < 1
2
1 12
(1 )
(1 + ) (1 )
12
= 0
= (1 + 12 ) 2
= 0
= (1 + 12 + 22 ) 2
= 0
1 1
1 + 2 1 1 + 12 2
=
1 12
2 + 1 < 1
MA(2)
Varijanca procesa
1 < 2 < 1
ARMA(1,1)
1 < 1
1 < 1
106
Statistika analiza
esto se u zapisima prognostikih modela koristi operator pomaka L za koji vrijedi
Lk yt = yt k odnosno:
Lyt = yt 1
L2 yt = yt 2
L3 yt = yt 3
yt = (1 L ) yt
d yt = (1 L ) yt
d
Zadatak 8.1. Napiite kako glase modeli predoeni pomou operatora pomaka L, te u
eksplicitnom obliku:
(a)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(i)
(j)
ARIMA(0,1,0)
ARIMA(2,0,0)
AR(1)
MA(2)
ARIMA(1,0,1)
ARIMA(1,1,1)
ARIMA(1,1,0)
ARIMA(2,1,1)
ARIMA(2,0,1)
ARIMA(1,0,0)x(1,1,0)12
Zadatak 8.2. Navedene modele predoite odgovarajuom oznakom, te ispitajte jesu li nuni
uvjeti stacionarnosti i/ili invertibilnosti zadovoljeni. Ako su navedeni uvjeti zadovoljeni
izraunajte oekivanje i varijancu stohastikog procesa ako je u svim modelima 2 = 0, 09 .
(a)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
yt
yt
yt
yt
yt
yt
yt
yt
= 0,5 + 0,8 yt 1 + t
= 0, 2 + 1, 05 yt 1 0 , 4 yt 2 + t
= t 0,8 t 1
= t 1, 25 t 1
= t + 0,7 t 1 0,5 t 2
= 0, 4 0, 6 yt 1 + 3 yt 2 + t 0 , 6 t 1
= 0,8 yt 1 + 0 ,5 yt 2 + t 0 , 6 t 1
= 0,5 + yt 1 + t
107
Statistika analiza
Proces
AR(p)
MA(q)
ARMA(p,q)
ACF
Opadajua
Iezava nakon pomaka q
Opadajua
PACF
Iezava nakon pomaka p
Opadajua
Opadajua
2. FAZA PROCJENE - kada izaberemo odreeni model procjenjujemo parametre bilo j ili
108
Statistika analiza
3. FAZA DIJAGNOSTIKE ispituje se da li je procijenjen model reprezentativan, da li je
statistiki znaajan i da li ispunjava sve polazne pretpostavke (kao npr. da li je model
stacionaran). Ako model nije stacionaran ili ako je u modelu znaajno prisutna
autokorelacija ponavljamo faze 1 - 3 sve dok ne pronaemo zadovoljavajui model. esto se
procjenjuje vie modela izmeu kojih se bira najbolji na temelju AIC i SBIC kriterija.
Akaikeov AIC i Schwartz Bayesian SBIC informacijski kriteriji mjere koliko dobro model
opisuje podatke. to je model bolji, manja je vrijednost navedenih pokazatelja. Pri izboru
konanog oblika modela sukladno Box-Jenkinsovu pristupu vano je naelo parsimonije
(daje se prednost modelu s manjim brojem parametara, a priblino istih pokazatelja kakvoe
u odnosu prema modelu veih dimenzija).
4. FAZA PREDVIANJA - kada smo pronali zadovoljavajui model isti se moe koristiti u
prognostike svrhe.
109
Statistika analiza
110
Statistika analiza
Zadatak 8.4. Na temelju podataka o vremenskom nizu Zakljuna cijena radnog lista INA
tjedni datoteke Vremenski nizovi.xls napravite slijedee:
(a) Vremenski niz zakljunih cijena trgovanja dionicama INA-e, na temelju tjednih
opaanja, prikaite linijskim grafikonom.
(b) Procijenite koeficijente ACF i PACF do pomaka 10. to zakljuujete?
(c) Procijenite modele koji bi bili prikladni u konkretnom problemu modeliranja? Izaberite
adekvatan model u skladu s Box-Jenkinsovim pristupom.
(d) Za izabrani model provjerite jesu li uvjeti stacionarnosti i/ili invertibilnosti zadovoljeni.
(e) Koliko iznosi oekivanje, a koliko standardna devijacija vremenskog niza u dugom roku?
(f) Na temelju izabranog modela izvrite prognozu za 20 perioda unaprijed od posljednjeg
opaanja. Prognostike vrijednosti i granice prognostikih procjena na temelju 90%-tne
razine pouzdanosti prikaite grafiki.
111
Statistika analiza
1800
7.4.2008
29.9.2008
1800
25.8.2008
2000
21.7.2008
2000
16.6.2008
2200
12.5.2008
2200
3.3.2008
2400
28.1.2008
2400
27.12.2007
2600
19.11.2007
2600
15.10.2007
2800
10.9.2007
2800
6.8.2007
3000
2.7.2007
3000
28.5.2007
3200
23.4.2007
3200
19.3.2007
3400
12.2.2007
3400
8.1.2007
3600
4.12.2006
Zakljuna cijena
Case Names
+,917 ,1005
83,20 0,000
+,838 ,1000
153,5 0,000
+,763 ,0994
212,3 0,000
+,671 ,0989
258,4 0,000
+,584 ,0983
293,7 0,000
+,509 ,0978
320,8 0,000
+,445 ,0973
341,7 0,000
+,407 ,0967
359,5 0,000
+,366 ,0962
373,9 0,000
10
+,312 ,0956
384,6 0,000
0
-1,0
-0,5
0,0
0,5
0
1,0
Conf. Limit
112
Statistika analiza
Corr. S.E.
+,917 ,1021
-,015 ,1021
-,018 ,1021
-,145 ,1021
-,031 ,1021
+,019 ,1021
+,032 ,1021
+,131 ,1021
-,061 ,1021
10
-,117 ,1021
0
-1,0
-0,5
0,0
0,5
1,0
Conf. Limit
Statistiki je znaajan koeficijent PACF samo pri pomaku jedan (+0,917), dok ostali
PACF koeficijenti nisu statistiki znaajni pri teorijskoj razini signifikantnosti od 5%.
113
Statistika analiza
26
Osim egzaktne metode alternativni je pristup primjene aproksimativne metode procjene parametara. Naime,
aproksimativna metoda se ee koristi ako je broj opaanja veoma dugaak (vei od 30.000), a alogoritmi koji se
koriste u procesu optimizacije jesu numeriki algoritmi iz klase kvazi-Newtonovih metoda.
114
Statistika analiza
1 < 1 mod el je stacionaran
= 2655,33549 0 = (1 1 ) = 2655,335 0 ,081 = 216,0646
yt = 216,0646 + 0,91863 yt 1 + t (1 0,91863 L ) yt = 216,0646 + t
=
0
= 2655,33549
1 1
2
14962
=
=
= 95837 , 21125 = 95837 , 21125 = 309,57586
1 12 1 0,918632
Histogram; variable: Zakljuna cijena
ARIMA (1,0,0) residuals;
Expected Normal
26
24
22
20
18
No of obs
16
14
12
10
8
6
4
2
0
-500
-400
-300
-200
-100
0
-450
-350
-250
-150
-50
100
50
200
150
300
250
400
350
500
450
600
550
115
Statistika analiza
Autocorrelation Function
Zakljuna cijena: ARIMA (1,0,0) residuals;
Lag
-,024 ,1005
,06 ,8118
+,013 ,1000
,07 ,9643
+,138 ,0994
2,00 ,5720
-,000 ,0989
2,00 ,7354
-,046 ,0983
2,22 ,8176
-,037 ,0978
2,37 ,8830
-,120 ,0973
3,88 ,7936
+,047 ,0967
4,11 ,8470
+,096 ,0962
5,10 ,8257
10
+,044 ,0956
5,31 ,8694
0
-1,0
-0,5
0,0
0,5
0
1,0
Conf. Limit
116
Statistika analiza
End of origin: 96
Observed
Forecast
116
111
106
101
29.9.2008
1800
25.8.2008
1800
21.7.2008
2000
16.6.2008
2000
12.5.2008
2200
7.4.2008
2200
3.3.2008
2400
28.1.2008
2400
27.12.2007
2600
19.11.2007
2600
15.10.2007
2800
6.8.2007
2800
10.9.2007
3000
2.7.2007
3000
28.5.2007
3200
23.4.2007
3200
19.3.2007
3400
8.1.2007
3400
12.2.2007
3600
4.12.2006
3600
90,0000%
117
Statistika analiza
Zadatak 8.5. Na temelju podataka o vremenskom nizu HRK/USD radnog lista tecaj datoteke
Vremenski nizovi.xls napravite slijedee:
(a) Vremenski niz teaja HRK/EUR prikaite linijskim grafikonom.
(a) Procijenite koeficijente ACF i PACF do pomaka 25. to zakljuujete? Koju
transformaciju vremenskog niza bi upotrijebili?
(b) Za transformirane vrijednosti vremenskog niza procijenite koeficijente ACF i PACF do
pomaka 25. to zakljuujete?
(c) Procijenite modele koji bi bili prikladni u konkretnom problemu modeliranja? Izaberite
adekvatan model u skladu s Box-Jenkinsovim pristupom (koristite AIC i SBIC
informacijske kriterije).
(d) Za izabrani model provjerite jesu li uvjeti stacionarnosti i/ili invertibilnosti zadovoljeni.
(e) Na temelju izabranog modela izraunajte prognostike vrijednosti teaja za 20 perioda
unaprijed od posljednjeg opaanja. Izraunajte i granice prognostikih procjena na
temelju 90%-tne razine pouzdanosti.
HRK/USD
10
4
1.1.1999
1.1.2001
1.1.2003
1.1.2005
1.1.2007
1.1.2009
1.1.2000
1.1.2002
1.1.2004
1.1.2006
1.1.2008
Case Names
118
Statistika analiza
Autocorrelation Function
HRK/USD
Lag
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
HRK/USD
Q
130,8
257,0
378,8
496,8
611,0
721,1
826,8
928,6
1027,
1122,
1213,
1299,
1381,
1460,
1533,
1602,
1666,
1723,
1775,
1820,
1860,
1895,
1926,
1953,
1976,
0
1,0
p
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
Conf. Limit
Lag
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
0,5
1,0
ACF opada sporo, a PACF iezava nakon pomaka 2. Sporo opadanje ACF koeficijenata
znai da je vremenski niz nestacionaran, odnosno da isti sadri stohastiki trend.
Stohastiki trend moe se ukloniti prvim diferencijama. Upotrebom prvih diferencija
vremenski niz postaje stacionaran.
119
Conf. Limit
Statistika analiza
Plot of variable: HRK/USD
HRK/USD
D(-1)
0,6
0,6
0,4
0,4
0,2
0,2
0,0
0,0
-0,2
-0,2
-0,4
-0,4
-0,6
1.1.1999
1.1.2001
1.1.2003
1.1.2005
1.1.2007
1.1.2009
1.1.2000
1.1.2002
1.1.2004
1.1.2006
1.1.2008
-0,6
Case Names
HRK/USD : D(-1)
Lag
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
HRK/USD : D(-1)
Q
8,33
8,51
8,52
8,60
10,24
10,89
10,93
10,93
11,48
12,28
13,02
13,25
13,32
14,82
14,90
15,04
18,08
23,24
23,84
24,70
25,52
26,89
26,90
29,91
30,04
0
1,0
p
,0039
,0142
,0364
,0720
,0687
,0920
,1417
,2057
,2443
,2670
,2922
,3515
,4238
,3907
,4589
,5218
,3838
,1815
,2025
,2134
,2253
,2157
,2605
,1879
,2231
Lag
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Conf. Limit
0,5
1,0
ACF iezava nakon pomaka jedan i PACF iezava nakon pomaka jedan. Budui ACF
iezava oito je da je transformirani vremenski niz stacionaran. Ponaanje PACF
upuuje na zakljuak da bi AR(1) model bio prikladan za diferencirani vremenski niz,
odnosno bio bi prikladan ARIMA(1,1,0). Ponaanje ACF upuuje na zakljuak da bi
MA(1) model bio prikladan za diferencirani vremenski niz, odnosno bio bi prikladan
ARIMA(0,1,1) ili IMA(1,1) model.
120
Conf. Limit
Statistika analiza
121
Statistika analiza
(1 L )(1
L ) yt = t
(1 L ( L L ) ) y
2
= t yt = yt 1 + 1 ( yt 1 yt 2 ) + t
0, 02622
= 0,028128
1 0, 260432
122
Statistika analiza
yt = t 1 t 1 (1 L ) yt = (1 1 L ) t
yt = yt 1 + t 1 t 1
1 < 1 mod el je invertibilan
yt = yt 1 1 t 1 = yt 1 1 ( yt 1 yt 1 )
yt = yt 1 + 0, 294894 ( yt 1 yt 1 )
y133 = y132 + 0, 294894 132 = 4,979623 + 0, 294894 0, 086133 = 5, 00502
132 = y132 y132 = 4,979623 4,89349 = 0,086133
y134 = y133 = 5, 00502
y135 = y134 = 5,00502 sredina procesa je kons tan tna
2 = 0, 02596
2 + 2 k
AIC ( k ) = T log
2 + 2 k log T ,
SBIC ( k ) = T log
gdje je T broja opaanja (131=132-1, tj. nakon postupka diferenciranja gubi se jedno
2 je procijenjena varijanca reziduala.
opaanje), k je broj procijenjenih parametara (1), a
123
Statistika analiza
Zadatak 8.6. Na temelju podataka o vremenskom nizu Izvoz ukupno radnog lista izvoz i
uvoz datoteke Vremenski nizovi.xls napravite slijedee:
(a) Vremenski niz ukupnog izvoza prikaite linijskim grafikonom. to zakljuujete?
(b) Procijenite koeficijente ACF i PACF do pomaka 24. to zakljuujete?
(c) Procijenite modele koji bi bili prikladni u konkretnom problemu modeliranja? Izaberite
adekvatan model u skladu s Box-Jenkinsovim pristupom.
(d) Za izabrani model provjerite jesu li uvjeti stacionarnosti i/ili invertibilnosti zadovoljeni.
(e) Na temelju izabranog modela izvrite prognozu za 15 perioda unaprijed od posljednjeg
opaanja. Prognostike vrijednosti i granice prognostikih procjena na temelju 90%-tne
razine pouzdanosti prikaite grafiki.
124
Statistika analiza
Plot of variable: Izvoz ukupno
6500000
6000000
5500000
5000000
Izvoz ukupno
4500000
4000000
3500000
3000000
2500000
2000000
1500000
1000000
1.1.1994
1.1.1996
1.1.1998
1.1.2000
1.1.2002
1.1.2004
1.1.2006
1.1.1995
1.1.1997
1.1.1999
1.1.2001
1.1.2003
1.1.2005
Case Names
Izvoz ukupno
Lag
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Q
95,51
196,8
289,9
377,8
467,5
548,8
632,1
706,7
782,3
844,8
914,1
982,1
1041,
1097,
1148,
1198,
1248,
1296,
1338,
1379,
1414,
1449,
1479,
1514,
1540,
0
1,0
p
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
Lag
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Conf. Limit
0,5
1,0
ACF pokazuje da vremenski niz nije stacionaran. Nuno je transformirati vremenski niz
upotrebom prvih diferencija. Nakon transformacije vremenskog niza potrebno je
ponovni ispitati ponaanje ACF i PACF.
125
Conf. Limit
Statistika analiza
Plot of variable: Izvoz ukupno
D(-1)
2E6
2E6
Izvoz ukupno
1,5E6
1,5E6
1E6
1E6
5E5
5E5
-5E5
-5E5
-1E6
-1E6
-1,5E6
-1,5E6
-2E6
-10
10
20
30
40
50
60
70
80
-2E6
90 100 110 120 130 140 150 160
Case Numbers
Izvoz ukupno
ln(x); D(-1)
0,6
0,6
0,4
0,4
0,2
0,2
0,0
0,0
-0,2
-0,2
-0,4
-0,4
-0,6
-10
10
20
30
40
50
60
70
80
-0,6
90 100 110 120 130 140 150 160
Case Numbers
126
Statistika analiza
Autocorrelation Function
p
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
Lag
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Conf. Limit
Corr. S.E.
-,554 ,0822
-,371 ,0822
-,209 ,0822
-,223 ,0822
-,070 ,0822
-,124 ,0822
-,066 ,0822
-,106 ,0822
+,093 ,0822
-,111 ,0822
-,222 ,0822
+,027 ,0822
+,013 ,0822
+,047 ,0822
-,011 ,0822
+,014 ,0822
-,051 ,0822
-,005 ,0822
-,063 ,0822
+,016 ,0822
-,105 ,0822
+,056 ,0822
-,232 ,0822
+,068 ,0822
+,107 ,0822
0
-1,0
-0,5
0,0
0,5
1,0
127
Conf. Limit
Statistika analiza
128
Statistika analiza
129
Statistika analiza
Lag
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Autocorrelation Function
Q
,06
,06
,19
1,97
1,97
2,46
2,54
2,63
3,84
6,18
8,82
11,65
11,91
13,74
13,76
13,76
14,88
15,68
16,85
17,36
17,37
18,69
19,05
24,56
24,57
0
1,0
p
,8102
,9710
,9788
,7414
,8533
,8734
,9239
,9555
,9218
,7998
,6389
,4741
,5348
,4694
,5441
,6165
,6045
,6149
,6002
,6292
,6886
,6641
,6985
,4301
,4868
Lag
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Conf. Limit
0,5
1,0
130
Conf. Limit
Statistika analiza
(1 L ) (1 L ) (1 L ) (1
12
(1 L L
12
L12 ) yt = (1 1 ) t
+ L13 ) (1 1 L ) (1 12 L12 ) yt = (1 1 ) t
(1 L L + L
12
) = (1 )
1
yt = ( 1 + 1) yt 1 1 yt 2 + ( 12 + 1) yt 12 ( 112 + 12 + 1 + 1) yt 13 + ( 112 + 1 ) yt 14 +
12 yt 24 + ( 112 + 1 ) yt 25 112 yt 26 + t 1t 1
= 0, 216198
1
= 0,549632
12
= +0, 776635
1
Forecasts; Model:(1,1,1)(1,1,0) Seasonal lag: 12
Input: Izvoz ukupno
Start of origin: 1
9000000
8000000
7000000
6000000
5000000
4000000
3000000
2000000
1000000
0
-10
10
20
30
40
50
60
Observed
70
80
Forecast
90,0000%
131
Statistika analiza
VJEBA BR. 91
(a) Napiite kako glase prognostiki modeli predoeni pomou operatora pomaka L, te u
eksplicitnom obliku:
- ARIMA(1,1,0)
- ARIMA(1,1,2)
- ARIMA(0,1,1)
(b) Navedene modele predoite odgovarajuom oznakom, te ispitajte jesu li nuni uvjeti
stacionarnosti i/ili invertibilnosti zadovoljeni. Ako su navedeni uvjeti zadovoljeni
izraunajte oekivanu vrijednost procesa u dugome roku:
- yt = 0, 2 + 1,3 yt 1 0, 4 yt 2 + t
- yt = t 0,8 t 1
- yt = 0, 4 0,6 yt 1 + t 0 ,5 t 1
132
Statistika analiza
Opis ACF i PACF:__________________________________________________________
_________________________________________________________________________
_________________________________________________________________________.
133
Statistika analiza
PRIMJERI ZA VJEBU IZ UDBENIKA
134
Statistika analiza
135
Statistika analiza
136
Statistika analiza
137
Statistika analiza
138