STATISTICA Vjezbe 2011

Statistika analiza
1. OSNOVE DESKRIPTIVNE I INFERENCIJALNE STATISTIKE
Elektronski udbenik s uputama o koritenju programa STATISTICA dostupan je na

web stranicama www.statsoft.com. Za poetak potrebno je ponoviti osnove deskriptivne
i inferencijalne statistike upotrebom programskog paketa STATISTICA.
Pokretanjem programa STATISTICA verzija 7.0 pojavljuje se prazan radni list

Spreadsheet1 s 10 stupaca i 10 redaka (10v by 10c). Svaki stupac predstavlja jednu
varijablu (engl. variable): Var1, Var2, Var3, ..., Var10. Svaki redak predstavlja jedno
opaanje ili sluaj (engl. case) kao to je prikazano na slici.
U tablicu radnog lista Spreadsheet1 potrebno je unijeti podatke koji su predmet

statistike analize. Naime, unos podataka esto je sloen i dugotrajan posao. Podaci koji
e se analizirati prikupljeni su na temelju sekundarnih izvora i spremljeni su u xls
formatu. Zato je dovoljno postojeu bazu podataka importirati u program
STATISTICA. Baze podataka formirane na temelju sekundarnih izvora u praksi su
najee i dostupne u xls formatu.
Prikupljeni podaci koji e se analizirati u ovom poglavlju spremljeni su u Excel datoteci

pod nazivom Poduzeca.xls. Navedena datoteka moe se otvoriti izborom opcija File
Open [vrsta datoteke: Excel Files (*.xls)]. Nakon izbora vrste datoteke program nudi
mogunost unosa svih radnih listova unutar radne knjige ili samo jednog radnog lista.
1
Statistika analiza
Budui da se prikupljeni podaci nalaze samo u prvom radnom listu Sheet1 dovoljno je
izabrati drugu opciju Import selected sheet to a Spreadsheet i zatim oznaiti Sheet1.
U sljedeem koraku potrebno je specificirati toan raspon redaka i stupaca. Najee

program automatski prepoznaje retke i stupce u kojima se nalaze prikupljeni podaci, ali
nudi i mogunost da neke retke ili stupce izostavimo.
Unutar datoteke Poduzeca.xls podaci su obuhvaeni s 8 stupaca (Columns: from 1 to 8) i

51 retkom (Rows: from 1 to 51). Kako su u prvom retku dani nazivi varijabli tada je
potrebno aktivirati opciju Get variable names from first row kao to je prikazano na
slici.
Prikupljeni podaci se odnose na 50 poduzea ili opaanja prema 8 varijabli ili obiljeja
(8v by 50c). Promatrane varijable mogu se klasificirati na slijedei nain:
(a) Nominalne varijable: Djelatnost, Kotacija na burzi
(b) Ordinalne varijable: Ocjena rizika, Ocjena uspjenosti
(c) Numerike varijable: Prihod u mil. kn, Zaduenost, Broj zaposlenih i Ulaganje u
reklamu u tis. kn.
Statistike metode i tehnike u programu STATISTICA mogu se pokrenuti unutar

glavnog izbornika Statistics kao to je prikazano na slici.
Statistika analiza
Zadatak 1.1. Za varijablu Prihod u mil. kn izraunajte: aritmetiku sredinu, medijan,

standardnu devijaciju, koeficijent varijacije, standardnu pogreku aritmetike sredine, mjeru
asimetrije, mjeru zaobljenosti, minimum i maksimum, te donji i gornji kvartil.
Rjeenje 1.1. Navedeni parametri mogu se izraunati izborom opcija Statistics Basic
Statistics/Tables Descriptive Statistics OK.
Unutar prozora Descriptive Statistics potrebno je izabrati jednu ili vie varijabli klikom
. U ovom primjeru izabire se samo varijabla Prihod u mil. kn.
na gumb
Zatim se unutar kartice Advanced oznae samo oni parametri koje elimo izraunati,
kao to je prikazano na slici.
3
Statistika analiza
Klikom na Summary: Statistics dobiju se pokazatelji deskriptivne statistike koje je

trebalo izraunati u zadatku 1.1.
Napomena: Sve pojedine statistike procedure spremaju se unutar jedne radne knjige
Workbook1*, to se vidi iz popisa mapa (direktorija) s lijeve strane programa. Time program
korisniku olakava posao tako da iste procedure nije potrebno ponavljati. Naime, izborom
opcija File Saves as aktivna radna knjiga sprema se u obliku datoteke STATISTICA
Workbook Files (*.stw). Program nudi i mogunost spremanja radne knjige u obliku
izvjetaja STATISTICA Report Files (*.str).
Rezultate deskriptivne statistike upiite u odgovarajua polja. Objasnite znaenje

dobivenih rezultata konkretno!
Statistika analiza
X=
......................................
Q1 = .................................... Se ( x ) = ....................................
Me = ...................................... Q3 = .....................................
a3 = ....................................
Min =
4 =
Max =
....................................
....................................
=
V=
......................................
....................................
......................................
Zadatak 1.2. Prema varijabli Prihod u mil. kn formirajte distribuciju frekvencija.

Rjeenje 1.2. Ponovno pokrenite prozor deskriptivne statistike (u donjem ljevom uglu
kliknite na gumb Descriptive Statistics:...). Unutar kartice Quick izaberite Frequency tables.
Dobivene rezultate upiite u stupce 2 - 5 slijedee tablice:
Prihod u
mil. kn
Broj poduzea
(frekvencije)
Kumulativne
frekvencije
Postoci
Kumulativni
postoci
Oekivane
frekvencije
0-50
50-100
100-150
150-200
200-250
Ukupno
Ponovite proceduru formiranja distribucije frekvencija tako da izraunate teorijske

frekvencije koje se mogu oekivati kada bi distribucija frekvencija imala normalni oblik
(unutar kartice Normality prozora Descriptive Statistics potrebno je aktivirati opciju
Normal expected frequencies i ponovno kliknuti na gumb Frequency tables). Teorijske
ili tzv. oekivane frekvencije upiite u stupac 6 gore navedene tablice.
Zadatak 1.3. Empirijske (opaene) frekvencije usporedite s oekivanim (teorijskim)

frekvencijama pomou histograma. to zakljuujete? Moe li se prihvatiti nulta hipoteza da
distribucija poduzea prema ostvarenim prihodima ima normalni oblik s obzirom na mjeru
asimetrije i mjeru zaobljenosti? to pokazuje Kolmogorov-Smirnov test normalnosti?
Zakljuak donesite na temelju p-vrijednosti!
Rjeenje 1.3. Ponovno pokrenite prozor deskriptivne statistike. Unutar kartice Quick
izaberite opciju Histograms.
Statistika analiza
Histogram: Prihod u mil. kn
K-S d=,07304, p> .20; Lilliefors p> .20
Expected Normal
30
25
No. of obs.
20
15
10
-50
50
100
150
200
250
X <= Category Boundary
Kolmogorov-Smirnov test (K-S test) koristi se da bi se testirala hipoteza jeli funkcija

distribucije vjerojatnosti iz uzorka jednaka nekoj pretpostavljenoj (teorijskoj) funkciji
distribucije vjerojatnosti. Najee se ispituje jeli funkcija distribucije vjerojatnosti
normalnog oblika. Zato se po defaultu programa uvijek provodi Kolmogorov-Smirnov
test normalnosti. Test veliina se definira kao najvea okomita udaljenost izmeu
empirijske i pretpostavljene funkcije distribucije vjerojatnosti i oznaava se s malo d.
Ako je p-vrijednost vea od 5% ne moe se odbaciti nulta hipoteza da distribucija
poduzea prema ostvarenim prihodima ima normalni oblik.1
Zadatak 1.4. Medijan, minimum i maksimum, te donji i gornji kvartil za varijablu Prihod u
mil. kn prikaite grafiki koristei B-P dijagram (tzv. Box-Plot).
Rjeenje 1.4. Unutar posljednje kartice Options prozora Descriptive Statistics potrebno je
aktivirati opciju Median/Quartiles/Range. Zatim se treba vratiti na karticu Quick i izabrati
Box & Whisker plot.
Modificirani K-S test je Lillieforsov test. Lillieforsov test se takoer koristi kod testiranja normalnosti
distribucije, ali bez unaprijed specificirane sredine i varijance (standardne devijacije) iz uzorka. Oba testa spadaju
u neparametrijske testove.
Statistika analiza
Box & Whisker Plot
220
200
180
160
140
120
100
80
60
40
Median = 100,2957
25%-75%
= (70,2793, 120,6493)
Min-Max
= (10,8081, 200,016)
20
0
Prihod u mil. kn
Zadatak 1.5. Koristei Box & Whisker plot odredite intervalne granice procjene prosjenog
prihoda svih poduzea u populaciji na temelju razine pouzdanosti od 95% (procjena
aritmetike sredine osnovnoga skupa). Komentirajte Normal Probability-Plot!
Rjeenje 1.5. Unutar kartice Options prozora Descriptive Statistics aktivirajte opciju
Mean/SE/1.96*SE. Vratite se na karticu Quick i izaberite Summary: Graphs.
Statistika analiza
Osim pokazatelja deskriptivne statistike i grafikog prikaza histograma s normalnom

distribucijom, dobiven je B-P dijagram s intervalnom procjenom aritmetike sredine i N-P
dijagram (tzv. Normal Probability-Plot).
Interval procjene prosjenog prihoda poduzea je:
Pr {85, 204 < x < 105, 758} = 0,95

Pouzdanost procjene od 95% pokazuje da je udaljenost donje odnosno gornje granice od
oekivane sredine 1,96 standardiziranih vrijednosti ( Z = 1,96 ). Stoga se oekuje da e
prosjean prihod svih poduzea u populaciji biti izmeu 85,2 i 105,8 mil. kuna.
Normal Probability-Plot prikazuje raspored oekivanih standardiziranih vrijednosti prema

ostvarenim prihodima (ije su vrijednosti na osi X poredane po veliini od najmanjeg
prihoda prema najveem). Standardizirane vrijednosti pokazuju odstupanja od aritmetike
sredine izraena u standardnim devijacijama prema formuli:
Zi =
xi x
Statistika analiza
Na primjer, Z i = 1 pokazuje da je ostvareni prihod i-tog poduzea manji od prosjenog
prihoda za jednu standardnu devijaciju. Zato prihod tog poduzea iznosi 58,4 mil. kuna
( xi = x 1 = 95, 4809 37 ,0758 = 58, 4051 ). Ako je Z i = +2 znai da je ostvareni prihod itog poduzea vei od prosjenog prihoda za dvije standardne devijacije. Stoga je
xi = x + 2 = 95, 4809 + 2 37 ,0758 = 169 ,6325 mil. kuna.
Na temelju grafikog prikaza N-P dijagrama moe se zakljuiti da kumulativni raspored
standardiziranih vrijednosti prihoda slijedi pravac pod kutem od 450 to znai da distribucija
poduzea prema ostvarenim prihodima ima normalni oblik (Gaussova distribucija).
Zadatak 1.6. Pod pretpostavkom da distribucija poduzea prema ostvarenim prihodima ima
normalni oblik s aritmetikom sredinom 95,4809 i standardnom devijacijom 37,0758
izraunajte vjerojatnost da izabrano poduzee ostvaruje prihode:
(a) od 80 mil. kn ili manje,
(b) vee od 80 mil. kn i
(c) vee od 120 mil. kn.
Rjeenje 1.6. Unutar glavnog izbornika Statistics pokrenite Probability Calculator

Distributions Z(Normal). Nakon unosa tri parametra: X, mean i st.dev. kliknite Compute
da bi izraunali vjerojatnost (p). Dodatno, za izraunavanje povrine na desnom kraju
normalne krivulje potrebno je oznaiti opciju (1-Cumulative p).
(a) P ( x 80 ) = 0,338139
(b) P ( x > 80 ) = 0, 661861
Statistika analiza
(c) P ( x > 120 ) = 0, 254202
VJEBA BR. 11
(a) Za varijablu Ulaganje u reklamu u tis. kn izraunajte: aritmetiku sredinu, standardnu
devijaciju, koeficijent varijacije i interkvartil. Objasnite znaenje dobivenih rezultata
konkretno. [Statistics Basic Statistics/Tables Descriptive Statistics Variables
(Ulaganje u reklamu u tis. kn) Advanced Summary: Statistics]
x = ___________
= ___________
V = ___________
Iq = ___________
(b) Za varijablu Ulaganje u reklamu u tis. kn izraunajte granice intervalne procjene
aritmetike sredine na razini 95% pouzdanosti. Dobivene granice prikaite BoxWhiskerovim dijagramom. Na dijagramu upiite dobivene vrijednosti. [Descriptive
Statistics Options Mean/SE/1.96*SE Quick Box & Whisker plot]
Box & Whisker Plot
54
53
52
51
50
49
48
Mean = ..............
MeanSE= (..............; ...............)
Mean1,96*SE= (................; ...............)
47
Ulaganje u reklamu u tis.kn
10
Statistika analiza
(c) Izraunajte nove granice intervalne procjene aritmetike sredine na razini pouzdanosti
od 99%. to moete zakljuiti usporeujui interval procjene na razini pouzdanosti od
95% i 99%? [Descriptive Statistics Advanced Conf. Limits for means Interval: 99,00
Summary: Statistics]
Pr {............. < x < ...........} = 0 ,95

Pr {............. < x < ...........} = 0 ,99
(d) Formirajte distribuciju poduzea prema varijabli Ulaganje u reklamu u tis. kn
(vrijednosti obiljeja grupirajte u 5 razreda jednakih veliina). Objasnite znaenje tree
po redu kumulativne relativne frekvencije. Izraunajte i oekivane frekvencije kada bi
distribucija imala normalni oblik. Provedit K-S test! [Descriptive Statistics Normality
Number of intervals: 5 Normal expected frequencies Kolmogorov-Smirnov and
Liliefors test for normality Frequency tables]
Ulaganje u
reklamu
30-40
40-50
50-60
60-70
70-80
Ukupno
Broj poduzea
(frekvencije)
Kumulativne
frekvencije
------
Postoci
Kumulativni
postoci
Oekivane
frekvencije
------
Trea po redu kumulativna relativna frekvencija pokazuje __________________________

____________________________________________________________________________.
K-S test velina iznosi:___________. Na razini p-vrijednosti __________________ moe se
prihvatiti hipoteza ___________________________________________________________.
(e) Stvarne i oekivane frekvencije iz prethodnog postupka usporedite pomou histograma
(na grafikonu skicirajte odgovarajue stupce). [Descriptive Statistics Normality
Histograms]
11
Statistika analiza
Histogram: Ulaganje u reklamu u tis.k
Expected Normal
25
No. of obs.
20
15
10
0
20
30
40
50
60
70
80
X <= Category Boundary
(f) Ako se pretpostavi da distribucija poduzea prema ulaganjima u reklamu ima noramalni
oblik koliko iznosi vjerojatnost da e izabrano poduzea uloiti u reklamu: (a) vie od 60
tisua kuna, (b) 60 ili manje od 60 tisua kuna, (c) vie od 40 tisua kuna i (d) izmeu 40
i 60 tisua kuna? Skicirajte slike! [Statistics Probability Calculator Distributions
Z (Normal ) X:..., mean: ...., st.dev: ..... Compute]
(a) P ( x > 60 ) = .............
(b) P ( x 60 ) = ..............
(c) P ( x > 40 ) = .............
(d) P ( 40 < x 60 ) = .............
(g) Moe li se kao istinita prihvatiti hipoteza da prosjeno ulaganje u reklamu svih
poduzea u osvnom skupu iznosi: (a) 50 tisua kuna i (b) 60 tisua kuna. Postavite
odgovarajue hipoteze i provedite testiranje. [Statistics Basic Statistics/Tables t
test, single sample OK Variables (Ulaganje u reklamu u tis. kn) Reference
values (test all mean against: 50 / 60) Summary: T-tests]
12
Statistika analiza
(a)
(b)
H 0 : ...
H 0 : ...
H1 : ...
H1 : ...
t=
.....................
......................
= 0 ,365439
t=
................................
.....................
......................
= ...................
................................
df =
p=
df =
p=
Moe se prihvatiti hipoteza __________ Moe se prihvatiti hipoteza __________
(h) Moe li se kao istinita prihvatiti nulta hipoteza da ne postoji statistiki znaajne razlike
u ulaganjima u reklame izmeu poduzea s obzirom na kotaciju na burzi? Zakljuak
donesite na temelju empirijske razine signifikantnosti (odredite empirijsku razinu
signifikantnosti i pomou kalkulatora vjerojatnosti ispod povrine Studentove tdistribucije za dobivenu vrijednost t-testa i stupnjeve slobode df). [Basic Statistics/Tables
ttest, independent, by groups OK Variables (Dependent: Ulaganje u reklamu u
tis. kn, Grouping: Kotacija na burzi ) Summary: T-tests]; [Statistics Probability
Calculator Distributions t (Student) Two-tailed (1-Cumulative p) t:...,
df:... Compute]
H 0 : ...
H1 : ...
t=
.....................
......................
= 2 , 06964
................................
df =
p=
Moe se prihvatiti hipoteza __________
(i) Moe li se kao istinita prihvatiti hipoteza da ne postoji statistiki znaajne razlike u
ulaganjima u reklame izmeu poduzea koja se bave trgovinom u odnosu na poduzea
koja se bave proizvodnjom? Provedite dvosmjerni i jednosmjerni test! Prije provedbe
odgovarajuih testova izraunajte pokazatelje M (sredina), StDv (standardna devijacija) i
N (broj poduzea u svakoj grupi) s obzirom na djelatnost. [Statistics Basic
Statistics/Tables Descriptive Statistics Variables (Ulaganje u reklamu u tis. kn)
13
Statistika analiza
Advanced By Group... Grouping variables (Djelatnost) OK Summary:
Statistics]; [Basic Statistics/Tables Difference tests: r, %, means OK M 1:..., M
2:..., StDv 1:..., StDv 2:..., N1:..., N2:... Two-sided / One-sided Compute]
(a) Dvosmjerni test
H 0 : ...
H1 : ...
Moe se prihvatiti hipoteza ____________

(b) Jednosmjerni test
H 0 : ...
H1 : ...

(j) Formirajte dvodimenzionalnu distribuciju poduzea s obzirom na djelatnost i kotaciju
na burzi. [Basic Statistics/Tables Multiple response tables OK Specify table
(select variables) Set 1: 3, Set 2: 4 OKOK Summary: Review summary tables]
Djelatnost
Kotacija na burzi
ne
da
Ukupno
trgovina
proizvodnja
usluge
Ukupno
14
Statistika analiza
2. ANALIZA VARIJANCE (Analysis of Variance)
Analiza varijance se upotrebljava kada se eli testirati postoji li znaajna razlika izmeu
aritmetikih sredina tri ili vie osnovnih skupova, odnosno jeli promatrani uzorci
pripadaju istoj populaciji.
Najee je u primjeni analiza varijance s jednim promjenjivim faktorom (One-Way

ANOVA) i analiza varijance s dva promjenjiva faktora (Two-Way ANOVA).
Kod analize varijance polazi se od slijedeih pretpostavki:

(a)
(b)
(c)
(d)
Populacije iz kojih uzorci potjeu jesu normalno distribuirane

Uzorci su nezavisni (osim ako se npr. ne radi o ponovljenim mjerenjima)
Varijance osnovnih skupova su jednake (pretpostavka homogenosti)
Uzorci su jednakih veliina2
2.1. ANALIZA VARIJANCE S JEDNIM PROMJENJIVIM FAKTOROM

(One-Way ANOVA)
Kod analize varijance s jednim promjenjivim faktorom cilj je ispitati odnos varijacija
izmeu uzoraka s varijacijama unutar uzoraka. Taj odnos varijacija naziva se empirijski
F-omjer. F-omjer je sluajna varijabla koja pripada F-distribuciji. Ako je F-omjer
statistiki znaajan tada se moe odbaciti nulta hipoteza da se aritmetike sredine
statistiki znaajno ne razlikuju. Drugim rijeima, nultom hipotezom se pretpostavlja da
odreeni faktor znaajno ne djeluje na promatranu sluajnu varijablu, dok se
alternativnom hipotezom pretpostavlja da odreeni faktor statistiki znaajno djeluje na
promatranu sluajnu varijablu.
Jednadba analize varijance za k uzoraka sa n opaanja dana je izrazom3:
(
j =1 i =1
k
X ij X
(
j =1 i =1
k
= X ij X j
+ nj X j X
j =1
Pretpostavka da su uzorci jednakih veliina nuna je samo ako su uzorci zavisni. Ako uzorci nisu jednakih
veliina ili su podaci nepotpuni (engl. missing data) analizu varijance je mogue provesti pomou zbroja kvadrata
odstupnja treeg tipa (engl. Type III Sum of Squares). To je najee sluaj kod multifaktorske analize varijance
(MANOVA).
3
Vrijedi da je n = n j .
j =1
15
Statistika analiza
Tabela ANOVA:
Izvor
varijacije
Izmeu
uzoraka
Zbroj kvadrata
odstupanja (SS)
nj ( X j X )
k
(X
Unutar
uzoraka
j =1 i =1
ij
(X
k
Ukupno
n j (X j X ) / (k 1)
F-omjer
k-1
Xj
n-k
n-1
j =1
2
(X ij X j ) / (n k )
k
j =1 i =1
S A2
S E2
j =1 i =1
Sredina kvadrata
odstupanja (MS)
j =1
Stupnjevi
slobode (df)
ij
Zadatak 2.1.1. Moe li se prihvatiti nulta hipoteza da se promatrana poduzea znaajno ne

razlikuju prema prosjenom prihodu s obzirom na djelatnost koju obavljaju? Zakljuak
donesite na temelju empirijske razine signifikantnosti (p-vrijednost).4
Rjeenje 2.1.1. Unutar glavnog izbornika Statistics potrebno je izabrati: ANOVA Oneway ANOVA OK, kao to je prikazano na slici.
U slijedeem koraku potrebno je izabrati jednu (zavisnu) varijablu ili vie njih, te
odgovarajui faktor (engl. Categorical factor). Za zavisnu varijablu (engl. Dependent
variable) biramo Prihod u mil. kn, dok za faktor biramo Djelatnost, kao to je prikazano
na slici.
Razina signifikantnosti predstavlja vjerojatnost da se nulta hipoteza odbaci premda je ona istinita i jo se naziva
grekom tipa I. Ako je p-vrijednost manja od teorijske razine signifikantnosti (najee 5%) nulta hipoteza se moe
odbaciti. Ako je p-vrijednost vea od 5% nulta hipoteza se ne moe odbaciti.
16
Statistika analiza
Nakon to kliknite OK unutar kartice Summary izaberite opciju Univariate results.
Popunite tabelu ANOVA dobivenim rezultatima pomou programa STATISTICA:

Izvor varijacije
Zbroj kvadrata
odstupanja (SS)
Stupnjevi
slobode (df)
Sredina kvadrata
odstupanja (MS)
F-omjer
Izmeu uzoraka
Unutar uzoraka
Ukupno
Napomena: Varijacije izmeu uzoraka (engl. between groups variation) se pripisuju
djelovanju promatranog faktora Djelatnost, dok se varijacije unutar uzoraka (engl. within
groups variation) pripisuju sluajnom djelovanju, odnosno nepoznatom faktoru i
predstavljaju komponentu pogreke (engl. Error).
Postavite odgovarajue hipoteze:
H 0 : ...
H 1 : ...
17
Statistika analiza
Empirijska razina signifikantnosti (p-vrijednost) iznosi:_____________, stoga se nulta
hipoteza _________________________________________.
Empirijsku razinu signifikantnosti na temelju empirijskog F-omjera iz prethodnog zadatka
izraunajte pomou kalkulatora vjerojatnosti i objasnite njeno znaenje konkretno.5 Unutar
glavnog izbornika Statistics pokrenite Probability Calculator Distributions F(Fisher).
Nakon unosa parametara F, df1 i df2, oznaite opciju (1-Cumulative p) i kliknite Compute.
Ponovno pokrenite prozor ANOVA Results i unutar kartice Summary izaberite opciju
Cell Statistics. Protumaite dobivene rezultate!
All effects/Graphs. Komentirajte dobiveni grafikon.
Density Function je funkcija gustoe vjerojatnosti, koja se u literaturi oznaava s f ( x ) . Distribution Function
je funkcija distribucije vjerojatnosti, koja se u literaturi oznaava s F ( x ) i predstavlja vjerojatnost da sluajna

varijabla X ne premai odreenu vrijednost xi odnosno F ( x ) = P ( X xi ) .
18
Statistika analiza
Djelatnost; LS Means
Current effect: F(2, 47)=,70198, p=,50072
Effective hypothesis decomposition
Vertical bars denote 0,95 confidence intervals
130
125
120
115
Prihod u mil. kn
110
105
100
95
90
85
80
75
70
65
trgovina
proizvodnja
usluge
Djelatnost
Moe li se prihvatiti pretpostavka da sve tri distribucije pripadaju istoj populaciji?
Zadatak 2.1.2. Moe li se prihvatiti nulta hipoteza da se promatrana poduzea znaajno ne

razlikuju prema zaduenosti s obzirom na djelatnost koju obavljaju? Koliko iznosi empirijski
F-omjer, a koliko empirijska razina signifikantnosti? to zakljuujete? Napiite kako glase
95%-tni intervali pouzdanosti procjene (engl. confidence intervals) prosjene zaduenosti
poduzea za pojedine djelatnosti!
Rjeenje 2.1.2. Ponovite proceduru kao u zadatku 2.1.1.
19
Statistika analiza
Postavite odgovarajue hipoteze:
H 0 : ...
H 1 : ...
Popunite tabelu ANOVA:

Izvor varijacije
Zbroj kvadrata
odstupanja (SS)
Stupnjevi
slobode (df)
Sredina kvadrata
odstupanja (MS)
F-omjer
Izmeu uzoraka
Unutar uzoraka
Ukupno
Na temelju empirijske razine signifikantnosti od:_______%, moe se zakljuiti __________
____________________________________________________________________________
__________________________________________________________________________.
Pr
...................
< X trgov . < ................... = 0,95
Pr
...................
< X proiz . < ................... = 0,95
Pr
...................
< X usluge < ................... = 0,95
2.2. ANALIZA VARIJANCE S DVA PROMJENJIVA FAKTORA

(Two-Way ANOVA)
Na vrijednost neke sluajne varijable moe djelovati vie od jednoga promjenjivog

faktora. Ovdje e biti prikazano testiranje znaajnosti djelovanja dvaju promjenjivih
faktora.
Tri su hipoteze koje se mogu testirati kod analize varijance s dva promjenjiva faktora:
(a) Jednakost sredina populacija s obzirom na prvi faktor.
(b) Jednakost sredina populacija s obzirom na drugi faktor.
(c) Promatrani faktori meusobno (interaktivno) djeluju na promatranu
sluajnu varijablu.
20
Statistika analiza
Zadatak 2.2.1. Moe li se prihvatiti hipoteza da su faktor Djelatnost i faktor Kotacija na
burzi znaajno djelovali na ostvarenje prosjenog prihoda promatranih poduzea? Da li
promatrani faktori meusobno (interaktivno) znaajno djeluju na prosjean prihod
poduzea?
Rjeenje 2.2.1. Unutar glavnog izbornika Statistics izaberete ANOVA Factorial ANOVA.6
Za varijablu izaberite Prihod u mil. kn, a za faktore izaberite Djelatnost i Kotacija na burzi
kao to je prikazano na slici. Zatim kliknite OK.
U slijedeem prozoru unutar kartice Summary izaberite Univariate Results. Popunite

tabelu ANOVA rezultatima dobivenim pomou programa STATISTICA.
Izvor varijacije
Zbroj kvadrata
odstupanja (SS)
Stupnjevi
slobode (df)
Sredina kvadrata
odstupanja (MS)
Fomjer
pvrijednost
Djelatnost
Kotacija na burzi
Interakcija
Ostatak (Error)
Ukupno
Napomena: Za svaku od postavljenih hipoteza F-test predstavlja omjer sredine kvadrata
odstupanja odgovarajueg faktora sa sredinom kvadrata odstupanja ostatka. Dakle, u ovom
primjeru tri su empirijska F-testa.
Cell Statistics. Na temelju dobivenih rezultata odgovorite koja poduzea ostvaruju
Ako se eli testirati znaajnost djelovanja vie faktora na promatranu sluajnu varijablu bez efekta interakcije
tada je umjesto Factorial ANOVA potrebno izabrati Main effects ANOVA.
21
Statistika analiza
najvei prihod, a koja najmanji prihod s obzirom na to da li kotiraju na burzi i koju
djelatnost obavljaju?
Grafiki prikaite interaktivno djelovanje dvaju faktora na prosjean prihod

promatranih poduzea (ponovno pokrenite prozor ANOVA Results i unutar kartice
Summary izaberite opciju All effects/Graphs).
Djelatnost*Kotacija na burzi; LS Means
Current effect: F(2, 44)=1,5414, p=,22541
180
160
Prihod u mil. kn
140
120
100
80
60
40
20
ne
da
Kotacija na burzi
Djelatnost
trgovina
Djelatnost
proizvodnja
Djelatnost
usluge
Zadatak 2.2.2. Moe li se prihvatiti hipoteza da su faktor Djelatnost i faktor Kotacija na

burzi znaajno djelovali na zaduenost promatranih poduzea? Da li promatrani faktori
interaktivno znaajno djeluju na varijablu Zaduenost?
Rjeenje 2.2.2. Ponovite proceduru kao u zadatku 2.2.1. Popunite tabelu ANOVA i objasnite
znaenje dobivenih rezultata.
Izvor varijacije
Zbroj kvadrata
odstupanja (SS)
Stupnjevi
slobode (df)
Sredina kvadrata
odstupanja (MS)
Fomjer
pvrijednost
Djelatnost
Kotacija na burzi
Interakcija
Ostatak (Error)
Ukupno
Objasnite dobivene rezultate:
____________________________________________________________________________
____________________________________________________________________________.
22
Statistika analiza
VJEBA BR. 21
(a) Moe li se kao istinita prihvatiti nulta hipoteza da ne postoji statistiki znaajne razlike
u prosjenim ulaganjima u reklame izmeu poduzea s obzirom na kotaciju na burzi?
Postavljenu hipotezu testirajte pomou analize varijance s jednim promjenjivim
faktorom. Popunite tabelu ANOVA i provedite F-test. Izraunajte empirijsku razinu
signifikantnosti (p-vrijednost) pomou kalkulatora vjerojatnosti ispod povrine Fdistribucije. Dobivene rezultate usporedite s rezultatima t-testa u zadatku (h) vjeba br.
1. U kakvom su odnosu t-test i F-test kada se eli ispitati jeli postoji statistiki znaajna
razlika izmeu dva nezavisna uzorka? [Statistics ANOVA One-way ANOVA
Quick specs dialog OK Dependent Variables (Ulaganje u reklamu u tis. kn )
Categorical factor (Kotacija na burzi ) OK Summary Univariate results]
Izvor varijacije
Zbroj kvadrata
odstupanja (SS)
df
Sredina kvadrata
odstupanja (MS)
F-omjer
pvrijednost
Izmeu uzoraka
Unutar uzoraka
Ukupno
Prihvaa se hipoteza ___________________________________________________________
____________________________________________________________________________.
Moe se zakljuiti _____________________________________________________________

____________________________________________________________________________
____________________________________________________________________________.
23
Statistika analiza
(b) Moe li se prihvatiti hipoteza da faktor Djelatnost i faktor Kotacija na burzi znaajno
djeluju na ulaganje u reklame promatranih poduzea? Provedite analizu varijancu s dva
promjenjiva faktora bez efekta interakcije. to zakljuujete? [Statistics ANOVA
Main effects ANOVA Quick specs dialog OK Dependent Variables (Ulaganje u
reklamu u tis. kn ) Categorical factors (Djelatnost-Kotacija na burzi ) OK
Summary Univariate results]
Zbroj kvadrata
odstupanja (SS)
Izvor varijacije
df
Sredina kvadrata
odstupanja (MS)
F-omjer
pvrijednost
Djelatnost
Kotacija na burzi
Error
Total
(c) U testiranju hipoteze pod (b) ukljuite i efekt interakcije. to zakljuujete? Efekte
interakcije prikaite odgovarajuim grafikonom. [Statistics ANOVA Factorial
ANOVA Quick specs dialog OK Dependent Variables (Ulaganje u reklamu u
tis. kn ) Categorical factors (Djelatnost-Kotacija na burzi ) OK Summary
Univariate results]; [ANOVA results All effects/Graphs Djelatnost *Kotacija na
burzi OK OK]
Zbroj kvadrata
odstupanja (SS)
Izvor varijacije
df
Sredina kvadrata
odstupanja (MS)
F-omjer
pvrijednost
Djelatnost
Kotacija na burzi
Interakcija
Error
Total
Djelatnost*Kotacija na burzi; LS Means
Current effect: F(2, 44)=2,3494, p=,10729
75
Ulaganje u reklamu u tis.kn
70
65
60
55
50
45
40
35
ne
da
Kotacija na burzi
Djelatnost
trgovina
Djelatnost
proizvodnja
Djelatnost
usluge
24
Statistika analiza
(d) Izraunajte granice intervalne procjene prosjenog ulaganja u reklame na temelju razine
pouzdanosti od 95% za poduzea (a) koja se bave trgovinom i ne kotiraju na burzi i (b)
koja se bave proizvodnjom i kotiraju na burzi. [ANOVA results Cell statistics]
Pr {............. < X trgov. ne < ..............} = 0,95

Pr {............. < X proizv . da < .............} = 0,95
25
Statistika analiza
3. KORELACIJA
esto u praksi opaamo da dvije ili vie pojava pokazuju meusobnu zavisnost. Na
primjer znamo da postoji obrnuto proporcionalna povezanost izmeu potranje za
odreenim proizvodom i njegove cijene.
Engleski matematiar Karl Pearson razradio je raunski postupak za izraunavanje

stupnja povezanosti jednim brojem, kojeg je nazvao koeficijentom linearne korelacije
(engl. linear correlation).
Osim raunski, korelacija izmeu dviju varijabli npr. X i Y moe se utvrditi i grafiki
pomou dijagrama rasipanja (engl. scatterplot). Ako korelacija (povezanost) postoji
mogue je odrediti njezin smjer i intenzitet, ali i testirati njezinu znaajnost uobiajenim
t-testom.
Pretpostavimo slijedei primjer: za osam trgovinskih radnji ( n = 8 ) poznat je broj

zaposlenih (varijabla X) i ostvareni dnevni promet u 000 kuna (varijabla Y). U slijedeoj
tablici dane su vrijednosti promatranih varijabli, izraunata su odstupanja vrijednosti
promatranih varijabli od njihove aritmetike sredine, te su izraunati umnoci tih
odstupanja:7
xi
1
3
7
5
5
9
4
8
Ukupno
yi
xi x
yi y
3
5
10
6
9
14
7
14
-4,25
-2,25
1,75
-0,25
-0,25
3,75
-1,25
2,75
0
-5,5
-3,5
1,5
-2,5
0,5
5,5
-1,5
5,5
0
( xi x ) ( y i y )
23,375
7,875
2,625
0,625
-0,125
20,625
1,875
15,125
72
Smjer i intenzitet povezanosti izmeu dviju varijabli ovisi o njihovoj kovarijaciji, to

znai da varijacije jedne varijable ovise o varijacijama druge varijable. Iz tablice je
uoljivo kako negativne varijacije broja zaposlenih prate negativne varijacije ostvarenog
prometa i obratno.
Aritmetike sredine izraunate su prema formuli za jednostavnu aritmetiku sredinu: x =
xi
i =1
, y=
yi
i =1
26
Statistika analiza
Mjera kovarijacije naziva se kovarijancom i definira se formulom:

n
Cov ( x, y ) =
i =1
72
=9>0
8
Da bi izmjerili intenzitet povezanosti izmeu varijabli potrebno je izvriti

standardizaciju kovarijance na slijedei nain:8
r=
( xi x ) ( yi y )
Cov ( x, y )
X Y
9
= 0,9585 < 1
2, 48747 3, 77492
Dobiveni rezultat naziva se koeficijentom linearne korelacije ( r ). Budui da kovarijanca

po apsolutnoj vrijednosti ne moe biti vea od umnoka standardnih devijacija varijabli
X i Y, tada koeficijent linearne korelacije moe poprimiti vrijednost iz
segmenta 1 r +1 . Rijedak je sluaj funkcionalne korelacije kada je r = 1 . Najei je
sluaj statistike ili stohastike korelacije (veza izmeu varijabli vrijedi priblino).
Prema intenzitetu korelacija moe biti:
r 0.8 ... jaka

0.5 < r < 0.8 ... polujaka
r 0.5 ... slaba
Ako je korelacija linearna, tada se ista moe analitiki opisati linearnom regresijskom
jednadbom (jednadba pravca koja doputa odstupanja). Ipak, ako korelacija jest jaka i
pozitivna ba kao u naem primjeru ( r = +0,9585 ), ne mora biti linearna. Moe biti i
nelinearna!
Linearna povezanost izmeu broja zaposlenih i ostvarenog prometa za osam trgovinskih

radnji prikazana je dijagramom rasipanja.
Standardne
X =
devijacije
( xi x )
n
i =1
izraunate
, Y =
su
( yi y )
n
i =1
prema
formulama
za
jednostavnu
standardnu
devijaciju:
27
Statistika analiza
Testiranje znaajnosti koeficijenta korelacije provodi se uobiajenim t-testom

postavljajui hipoteze:9
H 0 : ... r = 0
H 1 : ... r 0
Empirijski t-omjer, odnosno Z-omjer, definiran je izrazom:
t* =
r 0
Se ( r )
U sluaju malog uzorka ( n 30 ) test veliina pripada Studenovoj t-distribuciji sa n-2

stupnjeva slobode, dok za velike uzorke ( n > 30 ) test veliina pripada normalnoj
distribuciji.
Ako su jedna ili dvije varijable dane u rangu, tj. rezultati nisu mjerne vrijednosti ve su
dani samo u redoslijedu, rauna se tzv. Spearmanov koeficijent korelacije ranga prema
formuli:10
n
rS = 1
6 di2
i =1
3
n n
Znaajnost Spearmanovog koeficijenta korelacije ranga se testira na isti nain kao i

znaajnost Pearsonovog koeficijenta korelacije!
Testiranje znaajnosti koeficijenta korelacije moe biti i jednosmjerno (engl. one-tailed test)
Spearmanov koeficijent korelacije ranga spada u neparametrijske pokazatelje korelacije.
10
28
Statistika analiza
Na dvije promatrane varijable, koje su u korelaciji, mogu utjecati i druge varijable koje
daju prividnu (lanu) mjeru korelacije izmeu dviju promatranih varijabli. Zato, da bi se
iskljuio utjecaj drugih varijabli na promatranu korelaciju potrebno je izraunati
parcijalni koeficijent korelacije.
Zadatak 3.1. Izraunajte koeficijente linearne korelacije u parovima izmeu varijabli:

Prihod u mil. kn, Broj zaposlenih i Ulaganje u reklamu u 000 kn. Objasnite znaenje
dobivenih koeficijenata. Koji su procijenjeni koeficijenti statistiki znaajni pri razini
signifikantnosti od 1%? Vrijednosti varijabli prikaite dijagramom rasipanja u
trodimenzionalnom prostoru. Vrijednosti varijabli u parovima prikaite dijagramima
rasipanja u matrinom obliku.
Rjeenje 3.1. Unutar glavnog izbornika Statistics izaberite Basic Statistics/Tables

Correlation matrices OK. Nakon izbora odgovarajuih varijabli unutar prozora One
variable list u kartici Options podesite p-vrijednost na razinu 0,01.
Vratite se na karticu Quick i kliknite Summary: Correlations.
Koeficijent linearne korelacije izmeu ostvarenih prihoda i broja zaposlenih

iznosi:_____________, to pokazuje _____________________________________________
____________________________________________________________________________.
Koeficijent linearne korelacije izmeu ostvarenih prihoda i ulaganja u reklamu
____________________________________________________________________________.
Koeficijent linearne korelacije izmeu broja zaposlenih i ulaganja u reklamu
____________________________________________________________________________.
29
Statistika analiza
Pri teorijskoj razini signifikantnosti od 0,01 statistiki nisu znaajni slijedei koeficijenti:
____________________________________________________________________________.
Ponovno pokrenite prozor Product-Moment and Partial Correlations, te unutar kartice

Advanced/plot izaberite 3D-scatterplots (potrebno je specificirati koja e od varijabli biti
na osi X, koja na osi Y, a koja na Z osi).
Ponovno pokrenite prozor Product-Moment and Partial Correlations, te unutar kartice

Quick izaberite Scatterplot matrix for selected variables.
30
Statistika analiza
Zadatak 3.2. Izraunajte koeficijent parcijalne korelacije izmeu ostvarenih prihoda i broja
zaposlenih neutralizirajui utjecaj zaduenosti.
Rjeenje 3.2. Ponovno pokrenite prozor Product-Moment and Partial Correlations, te

unutar kartice Advanced/plot izaberite Partial Correlations (za kontrolnu varijablu izaberite
Zaduenost).
Parcijalni koeficijent korelacije iznosi:____________, te pokazuje_____________________

____________________________________________________________________________
__________________________________________________________________________.
Zadatak 3.3. Izraunajte koeficijent korelacije ranga izmeu Ocjene rizika i Ocjene
uspjenosti poduzea. Objasnite znaenje dobivenog koeficijenta korelacije i testirajte
njegovu znaajnost. Signifikantnost testa iznosi 5%.
Rjeenje 3.3. Unutar glavnog izbornika Statistics izaberite: Nonparametrics Correlations

(Spearman,) OK. Nakon izbora odgovarajuih varijabli kliknite Spearman rank R, kao
to je prikazano na slici.
31
Statistika analiza
Spermanov koeficijent korelacije iznosi -0,238485 i nije statistiki znaajan pri teorijskoj
razini signifikantnosti od 5%!
VJEBA BR. 31
(a) Izraunajte i objasnite znaenje koeficijenta linearne korelacije izmeu prihoda i

zaduenosti promatranih poduzea. Jeli koeficijent korelacije statistiki znaajan?
Postavite odgovarajue hipoteze! [Statistics Basic Statistics/Tables Correlation
matrices OK One variable list (Prihod u mil. kn-Zaduenost ) Quick
Summary: Correlations]
Koeficijent linearne korelacije iznosi:____________, te pokazuje___________________
_________________________________________________________________________
_________________________________________________________________________.
H 0 : ...
H1 : ...
Nulta hipoteza se (a) moe odbaciti ili (b) ne moe odbaciti (zaokruite toan odgovor!)
pri empirijskoj razini signifikantnosti_________________________________________.
(b) Izraunajte i objasnite znaenje parcijalnog koeficijenta linearne korelacije izmeu
prihoda i zaduenosti promatranih poduzea uz neutraliziran utjecaj broja zaposlenih. Je
li koeficijent parcijalne korelacije statistiki znaajan? [Product-Moment and Partial
Correlations Advanced/plot Partial correlations Second var.list (Broj
zaposlenih ) OK]
Parcijalni koeficijent korelacije iznosi:____________, te pokazuje__________________
_________________________________________________________________________
_________________________________________________________________________.
Procijenjen koeficijent parcijalne korelacije je (a) statistiki znaajan ili (b) nije
statistiki znaajan (zaokruite toan odgovor)!
32
Statistika analiza
(c) Izraunajte granice intervalne procjene koeficijenta linearne korelacije pod
temelju razine pouzdanosti od 95%. Koristite Fisherovu transformaciju Z
[Statistics Power Analysis Interval Estimation One Correlation,
QuickObserved R:..., Sample size (N):..., Conf. Level:... Fisher Z
Compute]
(a) na
Crude.
t-Test
Crude
Pr {.............. < r < .............} = 0,95
(d) Izraunajte i testirajte znaajnost koeficijenta linearne korelacije izmeu prihoda i

zaduenosti za svaku vrstu djelatnosti posebno. Jeli se intenzitet promatrane korelacije
razlikuje s obzirom na djelatnost koju poduzea obavljaju? [Statistics Basic
Statistics/Tables Correlation matrices OK One variable list (Prihod u mil. knZaduenost ) By Group Grouping Variable(s)...(Djelatnost) OK OK
Options Display r, p-levels, and N's Summary]
Djelatnost
trgovina
proizvodnja
usluge
Koeficijent korelacije
p-vrijednost
(e) Postoji li statistiki znaajna razlika u koeficijentima linearne korelacije izmeu podzea
koja se bave proizvodnjom i trgovinom? Provedite dvosmjerni i jednosmjerni test
(koristite se rezultatima iz prethodnog postupka). [Basic Statistics/Tables Difference
tests: r, %, means OK r1:..., r2:..., N1:..., N2:... Two-sided / One-sided
Compute]
(a) Dvosmjerni test
H 0 : ...
H1 : ...

(b) Jednosmjerni test
H 0 : ...
H1 : ...

33
Statistika analiza
(f) Izraunajte i testirajte znaajnost koeficijenta linearne korelacije izmeu prihoda i
ulaganja u reklame za sva poduzea zajedno. Kolika veliina uzorka je potrebna da bi
koeficijent korleacije bio statistiki znaajan: (a) pri teorijskoj razini signifikantnosti od
5% i snazi testa od 90%, (b) pri teorijskoj razini signifikantnosti od 1% i snazi testa od
95%? [Statistics Power Analysis Sample Size Calculation One Correlation, tTest Quick Rho:..., Alpha:..., Power Goal:... OK Fisher Z Crude Calculate
N]11
Potrebna veliina uzorka pod (a) iznosi:______________ i pod (b) iznosi:____________.
(g) Varijable pod (a) prikaite dijagramom rasipanja s pripadajuom jednadbom pravca i
koeficijentom linearne korelacije. Na dijagramu rasipanja eliminirajte najvie pet
netipinih opaanja. to se moe zakljuiti na temelju usporedbe dijagrama rasipanja
prije i nakon eliminiranja netipinih opaanja? Koja ste opaanja (poduzea) eliminirali?
[Graphs Scatterplots... Variables (X: Prihod u mil. kn, Y: Zaduenost) OK
Advanced Corr. and p (linear fit) Grpah type: Regular Fit: Linear OK
Brushing (Auto Apply, Normal: Exclude, Selection Brush: Simple, Save Brushing
settings )]
Scatterplot of Zaduenost against Prihod u mil. kn
Scatterplot of Zaduenost against Prihod u mil. kn

Poduzeca 8v*50c
Poduzeca 8v*50c
Zaduenost = 1,2075-0,0071*x
Zaduenost = 1,5314-0,0103*x
1,2
1,2
1,0
1,0
0,8
Zaduenost
Zaduenost
0,8
0,6
0,4
0,6
0,4
0,2
0,2
0,0
Prihod u mil. kn:Zaduenost: r = -0,9833; p = 0.0000
Prihod u mil. kn:Zaduenost: r = -0,8468; p = 0.0000
-0,2
0
20
40
60
80
100
120
Prihod u mil. kn
140
160
180
200
220
0,0
20
40
60
80
100
120
140
Prihod u mil. kn
Eliminirana su podzea pod rednim brojem: ____________________________________.
11
Parametar Rho je koeficijent korelacije iz osnovnog skupa, Alpha je teorijska razina signifikantnosti i Power
Goal je snaga testa. Kada koeficijent linerane korelacije osnovnog skupa nije poznat on se zamjenjuje njegovom
procjenom na temelju vrijednosti iz uzorka ( r ). Parametri Alpha i Power Goal se unose kao decimalni brojevi.
34
160
Statistika analiza
4. REGRESIJSKA ANALIZA
Budui da je cilj regresijske analize pronai analitiki izraz u obliku jednadbe, kojom se
najbolje opisuje statistika povezanost jedne numerike varijable s drugom ili vie
numerikih varijabli, potrebno je razlikovati slijedee modele:
(a)
(b)
(c)
(d)
jednostruke ili jednostavne (jedna zavisna i jedna nezavisna varijabla),

viestruke (jedna zavisna i dvije ili vie nezavisnih varijabli),
linearne (linearne modele u parametrima i varijablama) i
nelinearne (nelinearne modele u parametrima i/ili varijablama koje je prikladnim
transformacijama mogue svesti na linearne).
Nuno ne znai da su nezavisne varijable uzrok, a zavisna varijabla posljedica. Uzronost

(engl. causality) se mora opravdati na temelju ekonomske teorije!
4.1. JEDNOSTAVNA LINEARNA REGRESIJA
Jednostruki (jednostavni) linearni regresijski model ima slijedei oblik:
yi = 0 + 1 xi + ei
i = 1, 2,3,..., n
U navedenom modelu yi su vrijednosti zavisne varijable (tzv. regresand varijabla), dok

su xi vrijednosti nezavisne varijable (tzv. regresorska varijabla), a ei su vrijednosti
sluajne varijable, tzv. greke relacije koje modelu daju karakter stohastinosti (engl.
stohastic term or random error). Vrijednost sluajne varijable predstavlja nepoznata
odstupanja od funkcionalnog odnosa.
Za svako opaanje i = 1,2,3,..., n postoji distribucija vjerojatnosti varijabli yi pa prema
tome postoji i distribucija vjerojatnosti varijabli ei . Ako pretpostavimo da sluajne
varijable ei imaju normalnu distribuciju s oekivanjem jednakim nuli i konstantnom
varijancom tada model poprima slijedei oblik:
yi = 0 + 1 xi
i = 1, 2,3,..., n
Parametri 0 i 1 se procjenjuju na temelju vrijednosti iz uzorka. Najee koritena

metoda kojom se procjenjuju nepoznati parametri u jednadbi regresije je metoda
najmanjih kvadrata OLS (engl. Ordinary Least Squares). Cilj metode najmanjih kvadrata
je izraunati one procijene parametara koje minimiziraju zbroj kvadrata odstupanja
opaenih vrijednosti yi od oekivanih vrijednosti E [ yi ] = yi .
35
Statistika analiza
2
min ( yi y i ) = min ei2

i =1
i =1
Metoda najmanjih kvadrata daje BLUE procijene parametara. (engl. Best Linear
Unbiased Estimate).
Gauss-Markovljev teorem: U klasi svih linearnih nepristranih procjenitelja,

procjenitelji dobiveni metodom najmanjih kvadrata imaju najmanju varijancu.
Da bi procijene parametara bile konzistentne, a testovi znaajnosti pouzdani potrebno je

zadovoljiti slijedee pretpostavke: linearnost, homoskedastinost, nezavisnost,
normalnost.
Znaajnost procijenjenih parametara se provodi uobiajenim t-testom:
H 0 : ... j = 0
H 1 : ... j 0
t =
j 0
( )
Se j
Testiranje znaajnosti procijenjenih parametara moe biti i jednosmjerno. U sluaju

jednosmjernog testa p-vrijednost je dvostruko manja od p-vrijednosti za dvosmjerni test!
Mogue je provesti i skupni test o znaajnosti regresijskog modela kao cjeline pomou
analize varijance (F-test):
H 0 : ... 0 = 1 = 0
H1 : ... j 0 j = 1, 2
Tabela ANOVA:12
Izvor varijacije
Regresija
(protumaeni dio)
Reziduali
(neprotumaeni dio)
Zbroj kvadrata
odstupanja (SS)
Sredina kvadrata
odstupanja (MS)
SP / k
n-k-1
SR / (n k 1)
F-omjer
SP = ( y i y )
i =1
n
SR = ( yi y i )
i =1
n
Ukupno
Stupnjevi
slobode
(df)
SP / k
SR / (n k 1)
ST = ( yi y )
n-1
i =1
12
U regresijskoj analizi malo n oznaava broj opaanja (veliina uzorka), dok malo k oznaava broj nezavisnih
varijabli u jednadbi regresije.
36
Statistika analiza
Apsolutna mjera reprezentativnosti regresije zove se standardna pogreka regresije (engl.

standard error of estimate):
n
Y =
ei
SR
i =1
=
n k 1
n k 1
U relativne mjere reprezentativnosti regresije spadaju koeficijent varijacije regresije ( VY )

i koeficijent determinacije ( R 2 ):
VY =
Y
Y
100
R2 =
SP
;
ST
1 R2 =
SR
;
ST
0 R2 1
Zadatak 4.1.1. Koristei se podacima iz datoteke Poduzeca.xls napravite slijedee:

(a) Procijenite parametre linearne regresije koja pokazuje ovisnost ostvarenih prihoda o
zaduenosti poduzea. Kako glasi dobivena regresijska jednadba? to pokazuju
parametri 0 i 1 ? Jesu li procijenjeni parametri statistiki znaajni? Dobivenu
(b)
(c)
(d)
(e)
(f)
jednadbu regresije prikaite na dijagramu rasipanja.

Pomou analize varijance testirajte znaajnost regresijskog modela kao cjeline (postavite
odgovarajue hipoteze).
Koliko iznosi standardna pogreka regresije. to ona pokazuje? Na temelju odgovarajue
relativne mjere disperzije odgovorite jeli prosjeno odstupanje od regresijskog pravca
relativno veliko ili relativno malo?
Protumaite znaenje koeficijenta determinacije konkretno! Na temelju koeficijenta
determinacije ocijenite reprezentativnost linearne regresije.
Izraunajte intervalne granice procjene prihoda poduzea kada zaduenost iznosi
0,24055 na temelju razine pouzdanosti od 95%. Koliko iznosi rezidualno odstupanje i to
ono pokazuje?
Koja se opaanja mogu identificirati kao netipina opaanja (engl. outliers) polazei od
kriterija da su to ona opaanja ije su vrijednosti standardiziranih reziduala vee od 2?
Rjeenje 4.1.1. Iz padajueg glavnog izbornika Statistics potrebno je izabrati Multiple

Regression. Nakon to izaberete koja je varijabla zavisna (engl. dependent), a koja nezavisna
(engl. independent) kliknite OK. Unutar prozora Multiple Regression Results u kartici
Advanced kliknite Summary: Regression results, kao to je prikazano na slici.
37
Statistika analiza
Napomena: Po defaultu programa znaajnost procijenjenih parametara se testira na razini

signifikantnosti od 5% (Alpha for highlighting effects: ,05). Svi parametri koji su statistiki
znaajni bit e istaknuti crvenom bojom.
= i
= .
(a) Procijenjeni su slijedei parametri:
0
1
Jednadba regresije ima sljedei analitiki izraz: yi = .

Parametar pokazuje:________________________________________________________
0
________________________________________________________________________, dok
parametar 1 pokazuje: ________________________________________________________
____________________________________________________________________________
____________________________________________________________________________.
38
Statistika analiza
Da bi linearnu regresijsku jednadbu prikazali na dijagramu rasipanja potrebno je unutar

prozora Multiple Regression Results izabrati karticu Residual/assumptions/prediction i
zatim Perform residual analysis. Nadalje, unutar kartice Scatterplots potrebno je izabrati
Bivariate correlation i zatim OK.
Prihod u mil. kn vs. Zaduenost
Prihod u mil. kn = 149,03 - 101,1 * Zaduenost

Correlation: r = -,8468
220
200
180
Prihod u mil. kn
160
140
120
100
80
60
40
20
0
-0,2
0,0
0,2
0,4
0,6
Zaduenost
0,8
1,0
1,2
95% confidence
Na dijagramu rasipanja, osim regresijskog pravca, iscrtkanim linijama prikazane su donje

i gornje granice procjene oekivane vrijednosti prihoda pri svim razinama zaduenosti iz
uzorka na temelju pouzdanosti (engl. confidence) od 95%.
39
Statistika analiza
(b) Pomou analize varijance testira se znaajnost regresijskog modela kao cjeline. Zato je
unutar kartice Advanced prozora Multiple Regression Results, potrebno izabrati ANOVA
(Overall goodness of fit).
H 0 : ... 0 = 1 = 0
H 1 : ... j 0 j = 1, 2
(c) Standardna pogreka regresije (engl. standard error of estimate) iznosi 19,924 to se vidi
iz prve dobivene tablice Regression Summary. To znai da prosjeno odstupanje stvarnih
vrijednosti prihoda od oekivanih vrijednosti prihoda svih poduzea iznosi 19,924 mil. kn.
Standardna pogreka regresije izraunava se kao drugi korijen iz prosjene kvadratne
pogreke (engl. Mean Square Error) jer je 19 ,924 = 396,97 . Na temelju koeficijenta
varijacije moe se procijeniti da je prosjeno odstupanje od regresijskog pravca relativno
malo jer je VY = 20,87% (prethodno je potrebno izraunati aritmetiku sredinu zavisne
varijable kao to je opisano u prvom poglavlju).
(d) Koeficijent determinacije ( R 2 = 0, 7171 ) pokazuje kako je 71,71% ukupnog zbroja
kvadrata odstupanja protumaeno regresijom, to se vidi iz prve dobivene tablice Regression
Summary. Koeficijent determinacije moe se lako izraunati na temelju tabele ANOVA jer
48301, 46
je 0 , 7171 =
.
67356,13
Relativno visoka vrijednost koeficijenta determinacije upuuje na zakljuak da je regresijski
model reprezentativan.
(e) U odreivanju intervalnih granica procjene prihoda poduzea kada zaduenost iznosi
0,24055 na razini pouzdanosti od 95% koristite proceduru izbora opcija Multiple Regression
Results Residuals/assumption/prediction Predict dependent variable (Compute
confidence limits). Prije pritiska na OK potrebno je specificirati vrijednost nezavisne
varijable iz uzorka upisujui broj 0,24055.
40
Statistika analiza
Iz prethodne tablice je uoljivo kako se moe oekivati prihod od 124,7255 mil. kn kada
zaduenost poduzea iznosi 24,055% (radi se o procjeni jednim brojem, tzv. tokastoj
procjeni engl. point estimation).
y X =0,24055 = 149,035 101,058 0,24055 = 124,7255
Za razinu zaduenosti od 0,24055 ostvareni prihod je vei od oekivanog prihoda, stoga

rezidualno odstupanje iznosi 170, 6037 124, 7255 = 45,8782 mil. kn.
Interval pouzdanosti procijene glasi:
Pr 116,9465 < y( X =0,24055) < 132,5044 = 0,95 .13

(f) Da bi identificirali netipina opaanja potrebno je unutar opcije Perform residual
analysis prozora Multiple Regression Results kliknuti na karticu Outliers. Unutar kartice
Outliers potrebno je izabrati Casewise plot of outliers. Pet opaanja se moe identificirati
kao netipina opaanja i to redom: 2, 7, 23, 36 i 45, ba kao u zadatku pod (g) vjebe br. 2.
Ipak, drugo opaanje je najudaljenije od regresijskog pravca (odstupanje je vee od 4
standardne devijacije ispod regresijskog pravca).14
Zadatak 4.1.2. Koristei se podacima iz udbenika Statistika za ekonomiste pomou

programa STATISTICA rijeite primjer 12.5 (str. 218).
Rjeenje 4.1.2. U programu STATISTICA otvorite novi radni list u kojem ete samostalno
unijeti podatke iz primjera 12.5 (potronja benzina u litrama i broj prijeenih kilometara).
13
Potrebno je razlikovati granice intervalne procijene (engl. confidence limits) od granica prognostike procijene
(engl. prediction limits). Intervalna procjena zavisne varijable se rauna uvrtavajui vrijednost nezavisne varijable
iz uzorka, dok se granice prognostike procijene dobiju uvrtavajui neku pretpostavljenu vrijednost nezavisne
varijable koja nije zadana u uzorku.
14
Ako je rezidualno odstupanje negativno znai da se radi o toki koja se nalazi ispod regresijskog pravca. Ako je
rezidualno odstupanje pozitivno znai da se radi o toki koja se nalazi iznad regresijskog pravca.
41
Statistika analiza
Novi radni list kreirajte tako da u glavnom izborniku File izaberete New. U novom
dobivenom prozoru potrebno je specificirati toan broj varijabli (2) i toan broj opaanja
(15) unutar kartice Spreadsheet.
Nakon unosa podataka napravite slijedee:
(a) Nacrtajte dijagram rasipanja. Koristite proceduru izbora opcija Graphs Scatterplots
Quick Variables OK OK.15
15
Nemojte zaboraviti specificirati koja je varijabla zavisna (Y), a koja nezavisna (X).
42
Statistika analiza
(b) Izraunajte parametre linearne regresijske jednadbe koja pokazuje ovisnost broja
prijeenih kilometara o potronji benzina (koristite rezultate dobivene pod (a)).
0 = 39,8686
1 = 9, 7054
(c) Ispitajte znaajnost regresije pomou analize varijance i F-testa uz razinu

signifikantnosti od 5%. Koristite proceduru izbora opcija Statistics Multiple
Regression Quick Variables OK Advanced ANOVA(Overal goodness of
fit).16
(d) Testirajte znaajnost parametra uz regresorsku varijablu na razini signifikantnosti od

1%. Koristite proceduru izbora opcija Multiple Regression Results Advanced
Summary: Regression results.17
Napomena: Iako konstantni lan (engl. Intercept) u jednadbi regresije nije statistiki
znaajan (p-vrijednost je vea od 0,05 pa nije oznaen crvenom bojom) ne preporua se
izostavljanje tog lana. Izostavljane konstantnog lana moe uzrokovati pristranost
koeficijenta regresije 1 i nerealno visoku vrijednosti t-testa.
(e) Izraunajte i objasnite znaenje koeficijenta determinacije! Koliko iznosi korigirani
koeficijent determinacije?18
16
Da bi izraunali kritinu vrijednost F-distribucije na razini 5% signifikantnosti s 1 stupnjem slobode u brojniku i

13 stupnjeva slobode u nazivniku koristite proceduru izbora opcija Statistics Probability Calculator
Distributions F(Fisher); vidi str. 18.
17
Da bi izraunali kritinu vrijednost t-distribucije na razini 1% signifikantnosti s 13 stupnjeva slobode koristite
proceduru izbora opcija Statistics Probability Calculator Distributions t(Student); vidi str. 13.
18
Adjusted R2 je korigirani koeficijent determinacije ( R ). Korigirani koeficijent determinacije je nepristran
procjenitelj populacijskog koeficijenta determinacije. Naime, uvodei dodatne varijable s desne strane jednakosti
regresijske jednadbe poveava se broj ocijenjenih parametara (k+1), ime se uz nepromijenjenu veliinu uzorka
(n) smanjuje broj stupnjeva slobode. Stoga je prednost korigiranog koeficijenta determinacije to uravnoteuje
koristi od uvoenja dodatnih prediktorskih varijabli s gubitkom u stupnjevima slobode, pa ga je prikladno koristi
za usporedbu modela koji sadre razliit broj nezavisnih varijabli.
2
43
Statistika analiza
R 2 = 0,9777976
R2 = 1
15 1
1 R 2 = 0,9760897
15 2
(f) Izraunajte oekivani broj prijeenih kilometara ako potronja iznosi 80 litara. Za
pretpostavljenu vrijednost nezavisne varijable izraunajte donju i gornju granicu
prognostike procjene na razini pouzdanosti od 99%. Koristite proceduru izbora opcija
Multiple Regression Results Residuals/assumptions/predictin Predict dependent
variable Cmpute prediction limits Alpha: 0,01 OK.
4.2. MODELI NELINEARNE REGRESIJE
Ako je funkcionalni dio regresijskog modela linearan, ako su potencije varijabli jednake
jedan i ako je sluajna varijabla u zbroju s funkcionalnim djelom modela, rije je o
modelu linearne regresije. Ipak, odnosi meu pojavama mogu biti nelinearni. Modeli
kojima se izraavaju nelinearni odnosi nazivaju se modelima nelinearne (krivolinijske)
regresije.
Vei dio nelinearnih modela analiziraju se na isti nain kao i model jednostavne
linearne regresije jer se prikladnim transformacijama mogu linearizirati. Najee se
provodi logaritamska transformacija.
Pregled odabrani nelinearnih modela i njihovih transformacija prikazan je u sljedeoj

tablici:
Nelinearni model
regresije
Transformacije
varijabli
Polinom 2. stupnja
Jednadba
modela
yi = 0 + 1 xi + 2 xi2
Eksponencijalni
yi = 0 1xi
log Y
Logaritamski
yi = 0 + 1 log xi
log X
Dvostrukologaritamski
yi = 0 xi1
log Y , log X
X2
Linearizirani
oblik modela
yi = 0 + 1 xi + 2 xi2
log yi = log 0 + log 1 xi

yi = 0 + 1 log xi
log yi = log 0 + 1 log xi
44
Statistika analiza
U gornjoj tablici linearizirani modeli regresijskog polinoma drugog stupnja i

logaritamske regresije jednaki su originalnom obliku jer se radi o modelima koji su ve
linearni u parametrima iako su nelinearni u varijablama.
Program STATISTICA omoguuje procjenu parametara lineariziranog ili

nelineariziranog modela regresije na nain da se specificira njegov funkcionalni dio
pomou operatora: +, -, /, *, ^, i funkcija: exp, log, ln.
Na prvom grafu prikazane su dvije jednadbe eksponencijalne funkcije, dok su na

drugom grafu prikazane dvije jednadbe dvostruko-logaritamske funkcije. Protumaite
znaenje zadanih parametara u navedenim jednadabama!
45
14
40
12
35
Y=5*1,16^X
30
Y=30*0,75^X
25
20
15
Y=5*X^1,2
10
0
0
Y=5*X^0,7
10
10
15
0,5
1,5
2,5
Drugi pristup procijeni parametara nelinearnih modela regresije je automatski izbor

odreenog modela prilikom prikazivanja dijagrama rasipanja. Dijagram rasipanja nas
upuuje na zakljuak koji bi od modela nelinearne regresije bio prikladan za opisivanje
povezanosti izmeu promatranih varijabli.

Rjeenje 4.2.1. U programu STATISTICA otvorite novi radni list u kojem ete unijeti
podatke iz primjera 12.8 (proizvodnja u 000 komada i ostvareni dohodak u mil. kuna). Novi
radni list kreirajte kao u zadatku 4.1.2. (podatke moete i importirati iz datoteke Zadatci iz
udzbenika.xls). Nakon unosa podataka napravite slijedee:
(a) Nacrtajte dijagram rasipanja. Na istom grafu prikaite jednadbu regresijskog polinoma
drugoga stupnja. Koristite proceduru izbora opcija Graphs Scatterplots Quick
Variables Advanced Graph type: Regular Fit: Polynomial OK.
45
Statistika analiza
Napomena: Unutar kartice Advanced moete izabrati koji e od modela regresije biti
prikazan na dijagramu rasipanja.
(b) Provedite skupni test i pojedinane testove znaajnosti. Izraunajte standardnu

pogreku regresije. Procijenite u kojim granicama se mogu oekivati parametri 1 i 2
uz razinu pouzdanosti procjene od 95%. Koristite proceduru izbora opcija Statistics
Advanced Linear/Nonlinear Models Nonlinear estimation User-specified
regression, least squares OK Function to be estimated. Unutar prozora Estimated
function potrebno je definirati funkcionalni dio modela upisujui:
v2=b0+b1*v1+b2*v1^2. Varijabla v2 je dohodak, varijabla v1 je proizvodnja, dok su b0,
46
Statistika analiza
b1 i b2 parametri koje je potrebno procijeniti. Zatim kliknite OK OK OK
Summary: Parameter estimates.
t0* = 10, 08934
p = 0, 00002
t1* = 2,59329
p = 0, 03577
t2* = 11,81241
p = 0, 000007
Pr {5, 2872 < 1 < 0, 2439} = 0,95

Pr {0, 2628 < 2 < 0,3944} = 0,95
Nakon provedenih t-testova i intervalnih procjena parametara 1 i 2 na razini

pouzdanosti od 95% potrebno je izvriti analizu varijance izborom opcija Results
Analysis of Variance.
Na temelju tabele ANOVA moe se izraunati vrijednost empirijskog F-testa i

standardna pogreka regresijskog polinoma drugog stupnja:
F * = 16932, 21 p = 0, 00000...
Y =
45,8
= 6,5 = 2,55
7
(c) Izraunajte parametre linearne regresijske jednadbe. Izraunajte standardnu pogreku

regresije. Usporedite rezultate pod (c) i (b), te odgovorite koji regresijski polinom je
reprezentativniji? Koristite proceduru izbora opcija istu kao u postupku pod (b), ali
unutar prozora Estimated function definirajte funkcionalni dio linearnog modela
regresije upisujui: v2=b0+b1*v1.
47
Statistika analiza
yi = 11,503 + 9, 7212 xi
Y = 119, 7 = 10,94
Moe se zakljuiti da je reprezentativniji regresijski polinom drugog stupnja, jer je
procijenjena standardna pogreka manja!
Zadatak 4.2.2. Koristei podatke iz udbenika Statistika za ekonomiste pomou programa

STATISTICA rijeite primjer 12.6 (str. 222).
podatke iz primjera 12.6 (ukupna likvidna sredstva M4 i prosjena kamata na kunske
kredite). Nakon unosa ili importiranja podataka izvrite logaritamsku transformaciju
varijabli X i Y. Procijenite parametre dvostruko-logaritamske regresije u lineariziranom
.
obliku. Napiite jednadbu regresije u originalnom obliku. Protumaite znaenje
1
Novu varijablu log x moete kreirati u treem stupcu radnog lista. Dvostrukim klikom
pojavljuje se prozor Variable 3. U tom prozoru potrebno je
mia na eliju
napisati ime nove varijable npr. log x, i u dijalokom okviru za formule upisati
=Log10(v1) 19. To znai da vrijednosti nove varijable log x predstavljaju logaritmirane
vrijednosti likvidnih sredstava M4. Novu varijablu log y kreirajte na isti nain u
etvrtom stupcu radnoga lista (Var4).
19
Pomou funkcije Log10(x) dobiju se logaritmirane vrijednosti varijable X po bazi 10, dok se pomou funkcije
Log(x) dobiju logaritmirane vrijednosti varijable X po bazi e, tj. po bazi prirodnog logaritma ( e = 2 , 718282828 ).
48
Statistika analiza
Nakon logaritamske transformacije varijabli ponovite proceduru procijene jednostavnog

linearnog regresijskog modela kao u zadatku 4.1. (za zavisnu varijablu oznaite log y, a
za nezavisnu varijablu log x).
49
Statistika analiza
log y i = 2, 41954 0, 73066 log xi

y i = 262, 75 x 0,73066
podatke iz primjera 12.9 (proizvodnja u 000 komada i trokovi u tisuama kuna). Nakon
unosa podataka izvrite logaritamsku transformaciju varijable Y. Procijenite parametre
eksponencijalnog regresijskog modela u lineariziranom obliku. Napiite jednadbu
.
eksponencijalne regresije u originalnom obliku. Protumaite znaenje
1
log 0 = 2, 683019
log = 0, 004204
1
log yi = 2, 683019 + 0, 004204 xi
0 = 481,96915
1 = 1, 009727
x
yi = 481,96915 1, 009727 i
log 1 > 0
1 > 1
S = (1, 009727 1) 100 = +0,97%
50
Statistika analiza
VJEBA BR. 41
(a) Izraunajte i objasnite znaenje parametara linearne regresije koja pokazuje ovisnost
broja zaposlenih o prihodima poduzea (koristite podatke iz datoteke Poduzeca.xls).
Napiite kako glasi regresijska jednadba! Jesu li procijenjeni parametri statistiki
znaajni (postavite odgovarajue hipoteze)? [Statistics Multiple Regression Quick
Variables (Dependent: Broj zaposlenih, Independent: Prihod u mil. kn) OK
Advanced Summary: Regression results]
iznosi:______________, te pokazuje __________________________________
Parametar
0
____________________________________________________________________________.
iznosi:______________, te pokazuje ___________________________________
Parametar
1
____________________________________________________________________________
____________________________________________________________________________.
Regresijska jednadba je oblika: yi = ______________________________.
H 0 : ...0 =
H 0 : ...1 =
H1 : ...0
H1 : ... 1
t0 =
____
____
= 2,3717 df = ____ p = _______; t1 =
= 27 ,1406 p = _______
____
____
Procijenjeni parametri su (a) statistiki znaajni ili (b) nisu statistiki znaajni (zaokruite
toan odgovor)!
(b) Izraunajte vrijednost F-testa na temelju tabele ANOVA. Postavite odgovarajue
hipoteze! to zakljuujete? [Multiple Regression Results ANOVA (Overall goodness
of fit)]
H 0 : ...
H1 : ...
F=
_____ ___
= _ _ _ _ _ _ p = __________
______ ___
Moe se zakljuiti _____________________________________________________________

____________________________________________________________________________.
(c) Izraunajte i objasnite znaenje pokazatelja reprezentativnosti linearne regresijske
jednadbe (koristite se rezultatima dobivenim pod (a) i (b)).
R2 =
____
= 0,9388232
____
Y =
_____
2,7473
= 2,7473 ; VY =
100 = 9,1577%
___ _ _
_____
Koeficijent determinacije ( R 2 ) pokazuje ___________________________________________

____________________________________________________________________________
____________________________________________________________________________.
51
Statistika analiza
Standardna pogreka regresije ( Y ) pokazuje _______________________________________
____________________________________________________________________________.
Koeficijent varijacije regresije ( VY ) pokazuje _______________________________________
____________________________________________________________________________.
(d) Izraunajte i objasnite znaenje rezidualnog odstupanja za sedmo opaanje? Izraunajte
standardiziranu vrijednost rezidualnog odstupanja! Koja se opaanja (poduzea) mogu
identificirati kao netipina opaanja (engl. outliers)? [Multiple Regression results
Residuals/assumptions/prediction Perform residual analysis Quick Summary:
Residuals & predicted]
Rezidualno odstupanje za sedmo opaanje iznosi e7 = _ _ _ _ _ _ _ _ _ _ _ _ = 2 ,3172 .
Rezidualno odstupanje e 7 pokazuje ____________________________________________
____________________________________________________________________________.
Standardizirana vrijednost rezidualnog odstupanja je 2,3172 / _ _ _ _ _ _ = 0 ,84346 .
Netipina opaanja su poduzea pod rednim brojem:________________________________.
(e) Kreirajte transformirane vrijednosti varijabli broja zapolsenih i prihoda u mil. kn u
logaritamskom obliku po bazi 10. [Insert Add Variables How many: 1, After: 8,
Name: log(zaposleni) Long name (Functions): =Log10(v5) OK; Insert Add
Variables How many: 1, After: 9, Name: log(prihodi) Long name (Functions):
=Log10(v1) OK]. Nakon transformacije varijabli procijenite dvostruko-logaritamsku
jednadbu regresije u linearnom obliku (koristite proceduru Multiple Regression kao
pod (a)). Napiite jednadbu regresije u originalnom obliku. Protumaite znaenje
i
!
procijenjenih parametara
0
1
Dvostruko-logaritamska regresija u linearnom obliku log yi = _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ .
Dvostruko-logaritamska regresija u originalnom obliku yi = _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ .
Parametar
0
____________________________________________________________________________.
Parametar
1
____________________________________________________________________________
____________________________________________________________________________.
(f) Za dvostruko-logaritamski model regresije izraunajte vrijednosti koeficijenta
determinacije i koeficijenta varijacije regresije. Dobivene pokazatelje usporedite s
pokazateljima u zadatku pod (c), te odgovorite koji je model regresije reprezentativniji
(linearni ili dvostruko-logaritamski model)?
R2 =
_____
= ______
_____
_____
; Vlog Y =
100 = _ _ _ _ _%
_____
Reprezentativniji je _____________________________ model regresije!
52
Statistika analiza
(g) Prema reprezentativnijem modelu regresije izraunajte prognostiku vrijednost broja
zaposlenih kada prihod poduzea iznosi 10 mil. kn. Dodatno, izraunajte granice
pouzdanosti prognostike vrijednosti na 99%-tnoj razini. [Multiple Regression results
Residuals/assumptions/prediction Compute prediction limits Alpha: 0,01
Predict dependent variable log(prihodi): 1 OK]
log y(log X =1) = _ _ _ _ _ _ _ _ y( X =10) = _ _ _ _ _ _ _ _ zaposlenih.
{
Pr { _ _ _ _ _ _ _ _ < y
Pr _ _ _ _ _ _ _ _ < log y(log X =1) < _ _ _ _ _ _ _ _ = 0,99

( X =10 )
< _ _ _ _ _ _ _ _ _ = 0,99
(h) Procijenite regresijski polinom drugog stupnja. Napiite kako glasi regresijska jednadba.
Jesu li procijenjeni parametri statistiki znaajni. Dijagramom rasipanja usporedite
regresijske i stvarne vrijednosti broja zaposlenih. [Statistics Advanced
Linear/Nonlinear Models Nonlinear estimation User-specified regression, least
squares OK Function to be estimated. Unutar prozora Estimated function upiite:
v5=b0+b1*v1+b2*v1^2 OK OK OK Quick Summary: Parameter estimates.
Nadalje, da bi kreirali dijagram rasipanja izaberiteResults: Poduzeca Fitted 2D
function & observed vals]
Scatterplot of Broj zaposlenih against Prihod u mil. kn

Poduzeca 8v*50c
Broj zaposlenih = -6,433+0,4986*x-0,0011*x^2

60
50
Broj zaposlenih
40
30
20
10
-10
0
20
40
60
80
100
120
140
160
180
200
220
Prihod u mil. kn
53
Statistika analiza
4.3. VIESTRUKA REGRESIJA
Ako pretpostavimo da se linearna regresijska veza izmeu regresand varijable Y i

odabranog skupa regresorskih varijabli X 1 , X 2 , X 3 , ..., X k eli utvrditi na osnovu n
opaanja, tada se vektorska jednadba moe napisati u obliku sustava od n jednadbi:
y1 = 0 + 1 x11 + 2 x12 + ... + j x1 j + ... + k x1k + e1

y 2 = 0 + 1 x 21 + 2 x 22 + ... + j x 2 j + ... + k x 2 k + e2
y i = 0 + 1 xi 1 + 2 xi 2 + ... + j xij + ... + k xik + ei
y n = 0 + 1 x n1 + 2 x n 2 + ... + j x nj + ... + k x nk + en
Sustav jednadbi se moe zapisati u matrinom obliku:
y = X +e,
pri emu je:
y1
y
2

y = yi

y
n
X = 1
x11 x12
x1 j
x 21 x 22
x2 j
xi 1 xi 2
xij
x n1 x n 2
x nj
x1 k
0
e1

e
x2 k
1
2

xik = i e = ei
e
x nk
n
k
U matrinom zapisu y je vektor stupac opaenih vrijednosti zavisne varijable, X je

matrica vrijednosti nezavisnih varijabli sa n redaka i (k+1) stupaca, je vektor stupac
nepoznatih parametara, dok vektor e predstavlja n -dimenzionalni sluajni vektor.
Model viestruke linearne regresije ima oblik:
yi = 0 + 1 x1,i + 2 x2 ,i + ... + k xk ,i + ei
54
Statistika analiza
Prilikom procjene nepoznatih parametara metodom najmanjih kvadrata pretpostavka o

normalnosti distribucije sluajnog vektora nije bitna. Ista je vana zato da bi se mogli
provesti postupci testiranja hipoteza o znaajnosti pojedinih parametara i modela kao
cjeline, te ostali dijagnostiki testovi.
Cilj metode najmanjih kvadrata jest minimizirati zbroj kvadrata odstupanja sluajnih
varijabli ei na temelju vrijednosti iz uzorka:
min( e T e )
min(( y X )T ( y X ))
S obzirom da su u toki u kojoj funkcija dostie minimum njene prve parcijalne

derivacije jednake nuli, tada se minimizacija funkcije svodi na rjeavanje sustava
slijedeih jednadbi:
( e T e )
=0
j
j = 0 ,1,2 ,..., k
XT( y X )=0
Ako sustav jednadbi sredimo u matrinom obliku dobije se:
XT y = XT X
odnosno:
= ( X T X ) 1 X T y
Moe se zakljuiti da vektor y predstavlja ortogonalnu projekciju vektora y na kdimnezionalni prostor:
y = X
Parametri j su nestandardizirani regresijski koeficijenti, koji pokazuju oekivanu

promjenu zavisne varijable ako se varijabla X j promijeni za jednu jedinicu uz
pretpostavku da se ostale varijable nee promijeniti (pretpostavka ceteris paribus).
t =
*
j
Se ( j )
Y S jj S jj = diag ( X T X )
; Se ( j ) =
j = 1, 2,...,k
55
Statistika analiza
Parametri b j su standardizirani regresijski koeficijenti, koji pokazuju za koliko

standardnih devijacija e se promijeniti varijabla Y ako se varijabla X j promijeni za
jednu standardnu devijaciju:20
b j = j
j = 1, 2, ..., k
Pretpostavke viestrukog regresijskog modela su:
(a) Linearnost: varijabla Y je linearna funkcija X-eva.

(b) Homoskedastinost: varijanca reziduala je konstantna i konana, odnosno reziduali su
nezavisno
distribuirani
o
regresorskim
varijablama
(ispituje
se
problem
heteroskedastinosti).
(c) Normalnost: reziduali su normalno distribuirani s oekivanjem jednakim nuli.
(d) Nezavisnost 1: rezidualna odstupanja su meusobno nezavisna (ispituje se problem
autokorelacije prvog ili vieg reda).
(e) Nezavisnost 2: regresorske varijable su meusobno nezavisne (ispituje se problem
multikolinearnosti).
Problemi multikolinearnosti su:

(a)
(b)
(c)
(d)
Problem invertiranja matrice X T X ,

Visoke standardne pogreke procijenjenih parametara,
Nepouzdane ocijene parametara (moda i netonog predznaka) i
Relevantne varijable nisu statistiki znaajne.
Ozbiljan problem multikolineranosti postoji ako je barem jedan od koeficijenata

linearne korelacije nultog reda izmeu dviju regresorskih varijabli po apsolutnoj
vrijednosti vei od koeficijenta multiple linearne korelcije ( rij > R ).21
20
Standardizirani regresijski koeficijenti, za razliku od nestandardiziranih, omoguuju usporedbu relativne

vanosti pojedinih regresorskih varijabli u modelu viestruke regresije.
21
Ozbiljan problem multikolinearnosti moe postojati ako je koeficijent determinacije dovoljno velik ( R 2 0, 7 ),
a istovremeno su vrijednosti empirijskih t-omjera visoke.
56
Statistika analiza
Testiranje jeli multikolinearnost ozbiljan problem moe se provesti pomou FarrarGlauberovog testa. Nultom hipotezom se pretpostavlja da je korelacijeka matrica C
jedinina matrica:
H 0 :... C = I
H1 :... C I
2 = n 1 ( 2k + 5 ) ln ( det C )
6
Problem multikolinearnosti se moe otkriti ako je faktor inflacije varijance (engl.

Variance Inflation Factor) vei od 5 ili alternativno ako je tolerancija manja od 0,2.
VIFj =
1
1
=
2
1 R j TOL j
Problem autokorelacije najee se pojavljuje zbog netone specifikacije modela ili krivo
odabranog funkcionalnog oblika samog modela, a moe se otkriti analizom rezidualnih
odstupanja. Taj problem se javlja ee kod vremenskih regresijskih modela (engl. time
series regression) nego kod prostornih (engl. cross-section regression).
Testiranje znaajnost autokorelacije rezidualnih odstupanja prvog reda ( ) provodi se

pomou Durbin-Watson testa:22
n
2
( et et 1 )
DW = t =2
et
t =1
Zadatak 4.3.1. Koristei podatke iz datoteke Poduzeca.xls napravite slijedee:

(a) Procijenite parametre viestruke regresije koja pokazuje zavisnost ostvarenih prihoda o
zaduenosti poduzea i broju zaposlenih. Kako glasi dobivena regresijska jednadba?
to pokazuju procijenjeni parametri? Da li su procijenjeni parametri statistiki
znaajni?
(b) Regresijske vrijednosti prikaite u trodimenzionalnom prostoru.
(c) Pomou analize varijance testirajte znaajnost regresijskog modela kao cjeline
(postavite odgovarajue hipoteze).
22
Problem autokorelacije vieg reda se testira pomou Ljung-Box testa. Grafiki prikaz koeficijenta autokorelacije
za vie vremenskih pomaka naziva se korelogram.
57
Statistika analiza
(d) Koliko iznosi standardna pogreka regresije. to ona pokazuje? Na temelju odgovarajue
relativne mjere disperzije ocijenite reprezentativnost viestruke (multiple) regresije.
(e) Protumaite znaenje korigiranog koeficijenta determinacije.
(f) Izraunajte prognostike granice procjene prihoda poduzea kada zaduenost iznosi 0,5
i broj zaposlenih 50, na temelju razine pouzdanosti od 90%.
(g) Napiite regresijsku jednadbu u standardiziranom obliku, te odgovorite koja od
regresorskih varijabli ima vei relativan utjecaj na promatranu regresand varijablu?
(h) Ispitajte je li postoji problem kolinearnosti izmeu skupa regresorskih varijabli!
(i) Protumaite znaenje parcijalnih koeficijenata korelacije.
(j) Ispitajte jesu li rezidualna odstupanja autokorelirana s pomakom jedan!
Rjeenje 4.3.1. Unutar glavnog izbornika Statistics potrebno je izabrati Multiple Regression.
Nakon to izaberete koja je varijabla zavisna, a koje su varijable nezavisne kliknite OK.
Unutar prozora Multiple Regression Results u kartici Advanced izaberite Summary:
Regression results.
(a)
(b) Da bi regresijske vrijednosti prikazali u 3D prostoru koristite se izborom opcija Graphs

Surface Plots. Unutar prozora 3D Surface Plots izaberite linearnu plohu (ravninu).23
Zatim aktivirajte opciju Show raw data points, kao to je prikazano na slici.
23
Grafiko prikazivanje s vie od dvije regresorske varijable je vrlo sloeno jer se radi o hiperravninama.
58
Statistika analiza
(c)
(d) Y =
(e)
R2 =
8, 6951
75, 60 = 8, 6951 mil. kn prihoda VY =
100 = 9,11%
95, 4809
63802, 71
= 0,94724 R 2 = 0,945
67356,13
(f) Pr 136,5096 < y p < 168,5884 = 0,90

(g)
ZY = 0,16022 z1 + 0,83759 z2
b1 = 0,16022
b2 = 0,83759
59
Statistika analiza
(h) Da bi ispitali postojanje problema (multi)kolinearnosti izmeu varijabli x1 i x2 koristite
se izborom opcija Multiple Regression Results Advanced Partial Correlations.
1
1
=
= 3, 0484
0,32804 1 0, 67196
TOL j > 0, 2 VIFj < 5, 0 ne postoji kolinearnost
TOL1 = TOL2 = 0,32804 VIF1 = VIF2 =
(i) r12.3 = 0,371016
r13.2 = 0.901951
(j) Da bi ispitali postojanje problema autokorelacije prvoga reda potrebno je izraunati

vrijednost Durbin-Watson testa. Koristite se izborom opcija Multiple Regression Results
Residuals/assumptions/prediction Perform residual analysis Advanced
Durbin-Watson statistic.
H 0 :... = 0
H1 :... > 0
dUk = 2, n =50 = 1.628

DW > dU H 0
VJEBA BR. 51
(a) U program STATISTCA unesite podatke iz zadatka 12.11 na str. 234 udbenika
"Statistika za ekonomiste". Izraunajte ocjene parametara jednadbe viestruke regresije.
Zavisna varijabla je stopa nataliteta, dok su ostale varijable nezavisne. Objasnite
znaenje svakog parametra pojedinano.[Statistics Multiple Regression Quick
Variables (Dependent: Stopa nataliteta, Independent: Postotak nepismenih - Broj
lijenika na 1000 stanovnika) OK Advanced Summary: Regression results]
60
Statistika analiza
Parametar
0
____________________________________________________________________________.
Parametar
1
____________________________________________________________________________
____________________________________________________________________________.
Parametar
2
____________________________________________________________________________
____________________________________________________________________________.
Regresijska jednadba je oblika yi = ______________________________________________.
(b) Ispitajte znaajnost viestruke regresije standardnim F-testom. Signifikantnost testa
iznosi 1%. Postavite odgovarajue hipoteze! [Multiple Regression Results ANOVA
(Overall goodness of fit)]
H 0 : ...
H1 : ...
F=
____ ___
= _ _ _ _ _ _ p = __________
____ ___
Moe se zakljuiti ____________________________________________________________

____________________________________________________________________________.
(c) Ispitajte znaajnost parametara u regresiji na nivou 5% signifikantnosti (koristite se
rezultatima dobivenim pod (a)). Postavite odgovarajue hipoteze!
H 0 : ...0 =
H 0 : ...1 =
H 0 : ...2 =
H1 : ...0
H1 : ... 1
H1 : ... 2
t0 = _ _ _ _ _ p = _______; t1 = _ _ _ _ _ p = ______;t2 = _ _ _ _ _ p = _______

Statistiki je znaajan parametar_______, dok ostali parametri nisu statistiki znaajni!
(d) Izraunajte koeficijent determinacije i korigirani koeficijent determinacije. Protumaite
njihovo znaenje konkretno (koristite se rezultatima dobivenim pod (a)).
R2 =
____
=______ ;
____
R2 = _ _ _ _ _ _ _
Koeficijent determinacije ( R 2 ) pokazuje ___________________________________________

____________________________________________________________________________.
Korigirani (engl. adjusted) koeficijent determinacije ( R 2 ) pokazuje ____________________
____________________________________________________________________________
____________________________________________________________________________.
61
Statistika analiza
(e) Ako postotak nepismenih iznosi 3, a broj lijenika na 1000 stanovnika 22, kolika se stopa
nataliteta moe oekivati prema viestrukom regresijskom modelu? Izraunajte i granice
prognostike procjene na razini pouzdanosti od 90%. [Multiple Regression results
Residuals/assumptions/prediction Compute prediction limits Alpha: 0,10
Predict dependent variable Postotak3, Broj lijenika na22 OK]
y( X1 =3 ; X 2 =22) = _ _ _ _ _ _ _ Pr _ _ _ _ _ _ _ < y( X1 =3 ; X 2 =22) < _ _ _ _ _ _ _ = 0,99

(f) U program STATISTCA unesite podatke iz zadatka 12.12 na str. 239 udbenika
"Statistika za ekonomiste". Izraunajte ocjene parametara jednadbe viestruke regresije.
Objasnite znaenje svakog parametra pojedinano. [Statistics Multiple Regression
Quick Variables (Dependent: ..., Independent: ...) OK Advanced Summary:
Regression results]
Parametar
0
____________________________________________________________________________.
Parametar
1
____________________________________________________________________________
____________________________________________________________________________.
Parametar
2
____________________________________________________________________________
____________________________________________________________________________.
Parametar
3
____________________________________________________________________________
____________________________________________________________________________.
Regresijska jednadba je oblika: yi = _____________________________________________.
(g) Ispitajte znaajnost pojedinog parametra uz regresorske varijable (koristite rezultate pod
(f)). Ispitajte znaajnost viestruke regresije pomou F-testa. Nivo signifikantnosti iznosi
5%. [Multiple Regression Results ANOVA (Overall goodness of fit)]
t1 = _ _ _ _ _ _ p = __________ prihvaa se hipoteza _____

F=
______/ ___
= ________ p = __________ prihvaa se hipoteza _____
______ / ___
62
Statistika analiza
(h) Izraunajte vrijednost korigiranog koeficijenta determinacije i objasnite njegovo
znaenje konkretno (koristite rezultate pod (f)).
Korigirani koeficijent determinacije iznosi:____________, te pokazuje __________________
____________________________________________________________________________
____________________________________________________________________________.
(i) Ispitajte postoji li problem multikolinearnosti pomou pokazatelja tolerancije. [Multiple

Regression Results Advanced Partial correlations]
TOL1 = _ _ _ _ _ _ _ ; TOL2 = _ _ _ _ _ _ _ ; TOL3 = _ _ _ _ _ _ _

(j) Pomou standardiziranih regresijskih koeficijenata ispitajte koja od nezavisnih varijabli
ima najvei utjecaj na zavisnu varijablu (koristite rezultate pod (f))?
b1 = _ _ _ _ _ _ _ ; b2 = _ _ _ _ _ _ _ ; b3 = _ _ _ _ _ _ _
63
Statistika analiza
5. BROJANA ANALIZA VREMENSKIH NIZOVA I GRAFIKO PRIKAZIVANJE
Prve diferencije vrijednosti vremenskog niza:
yt = yt yt 1
t = 2 ,3, 4 ,...,T
Druge diferencije vrijednosti vremenskog niza:
2 yt = yt yt 1 = yt 2 yt 1 + yt 2
Sezonske diferencije, npr. za kvartalne podatke raunaju se sezonske diferencije prvih

diferencija s pomakom 4:
yt yt 4 = ( yt yt 1 ) ( yt 4 yt 5 )
t = 6 , 7 ,8,...,T
Prosjena prva diferencija:
yt =
t = 3, 4 ,5,...,T
(y
y1 ) + ( y3 y2 ) + ... + ( yT yT 1 )
T 1
yT y1
T 1
Pojedinane stope promjene (diskretne):
St = Vt 100 = t 100 100 = ....%

yt 1
Pojedinane stope promjene (kontinuirane):
y
St = ( ln yt ln yt 1 ) 100 = ln t 100 = ....%
yt 1
Pojedinane stope promjene na stalnoj bazi:
St = I t 100 = t 100 100 = ....%

yb
Prosjena stopa promjene na temelju koeficijenata dinamike verinih indeksa:
St =
T 1
v2 v3 v4 ... vn 1 100 = T 1 T 1 100 = ....%

y1
Ako je geometrijska sredina reprezentativna srednja vrijednost tada se moe upotrijebiti

u prognostike svrhe:
yT + k = yT G k
G = T 1
yT
I
= T 1 T
y1
I1
64
Statistika analiza
Posebni oblici skupnih indeksa koji se najee pojavljuju u praktinim primjenama jesu
skupni indeks potroakih cijena kao posebni skupni indeks cijena, te skupni indeks
fizikog obujma kao posebni skupni indeks koliina.
Indeks potroakih cijena (engl. Consumer Price Index) odraava promjene u razini
cijena dobara i usluga koje kupuje referentno stanovnitvo radi finalne potronje.
Izraunava se kao ponderirana (vagana) aritmetika sredina Laspeyresovog tipa za
reprezentativnu koaricu koju ini 540 proizvoda, a za pondere se uzimaju udjeli u
potronji rezidentnih kuanstava koji se temelje na rezultatima Ankete o potronji
kuanstava. Namjena indeksa potroakih cijena je slijedea:
mjerenje inflacije
indeksiranje plaa
deflacioniranje pojedinih kategorija na makro-razini
Zadatak 5.1. U programu STATISTICA otvorite novu bazu podataka iz datoteke pod
nazivom Vremenski nizovi.xls koristei Excelovo suelje. Vremenski niz prosjenih
nominalnih neto plaa prikaite odgovarajuim grafikonom. Izraunajte bazne indekse
potroakih cijena (prosinac 2002=100). Na temelju baznih indeksa izraunajte vrijednosti
realnih plaa. Vrijednosti realnih i nominalnih plaa usporedite na istom grafikonu.
Objasnite odnos izmeu nominalne i realne plae u kolovozu 1996. godine, te u kolovozu
2005. godine.
Rjeenje 5.1. U programu STATISTICA otvorite datoteku Vremenski nizovi.xls izborom

opcija File Open File name: Vremenski nizovi Open. U slijedeem koraku
izaberite Open as an Excel Workbook. Izborom te opcije omoguuje se koritenje Excelova
suelja to znaajno olakava izraun odgovarajuih indeksa pomou osnovnih
matematikih operacija.
Nakon otvaranja Excelove radnje knjige pojavljuje se radni list pod nazivom trziste rada
i cijene. Iz slike se vidi kako Excelova radna knjiga sadri vie radnih listova pod
razliitim nazivima, npr. turizam i trgovina itd. Vrijednosti vremenskih nizova
uglavnom su prikupljeni na mjesenoj razini.
65
Statistika analiza
Da bi grafiki prikazali kretanje prosjenih nominalnih neto plaa u glavnoj izbornikoj

traci izaberite Graphs 2D Graphs Line plots (Variables)..., kao to je prikazano na
slici.
66
Statistika analiza
esto je potrebno promijeniti ili tono specificirati adresu prvog stupca u kojem se
nalaze prikupljeni podaci i adresu stupca u kojem se nalazi vremensko obiljeje. Kako su
u prvom stupcu navedeni mjeseci potrebno je podesiti Read case names from column: A.
To znai da se podaci, koji e se analizirati, nalaze u ostalim stupcima poevi od drugog
stupca. Zato je takoer potrebno podesiti First data column: B.
Nakon to unutar prozora 2D Line Plots Variables izaberete koji vremenski niz elite
prikazati grafiki kliknite OK.
Na X osi grafikog prikaza nalaze se datumi odnosno mjeseci u kojima su vrijednosti

nominalnih neto plaa opaene. Program automatski jedinice vremena stavlja na os X jer
je prilikom otvaranja Excelove radnje knjige bila postavljena opcija Read case names
from column: A.
67
Statistika analiza
Da bi izraunali prosjene realne neto plae potrebno je preraunati verine indekse

potroakih cijena na bazne indekse potroakih cijena koristei se opcijom kopiranja
formule u Excelovom suelju (baza je prosinac 2002. godine).
Slijedea slika prikazuje postupak preraunavanja verinih indeksa u bazne indekse

iznad baze i ispod baze, koristei se adresama elija.
Nakon preraunavanja verinih indeksa na bazne indekse potroakih cijena potrebno je

izraunati vrijednosti prosjenih realnih neto plaa, koristei se adresama elija i
kopiranjem osnovne formule:
Re a ln a plaa =
No min a ln a plaa
100
bazni IPC
68
Statistika analiza
Nakon to ste izraunali prosjene realne neto plae, iste usporedite s nominalnim
plaama na istom grafikonu (ponovno pokrenite prozor 2D Line Plots Variables , te
izaberite tip grafa: Multiple).
Napomena: U ovom primjeru koritene su formule za preraunavnje verinih indeksa

potroakih cijena u bazne indekse potroakih cijena ispod i iznad baze:
Ispod baze :
It =
I t 1 Vt
100
Iznad baze :
I t 1 =
It
100
Vt
69
Statistika analiza
Line Plot of multiple variables
Vremenski nizovi (B2:DV126) 10v*125c
5000
4500
4000
Prosjena nom neto plaa

Prosjena realna neto plaa
3500
3000
2500
2000
1500
1.1.1996
1.7.1997
1.1.1999
1.7.2000
1.1.2002
1.7.2003
1.1.2005
1.10.1996
1.4.1998
1.10.1999
1.4.2001
1.10.2002
1.4.2004
1.10.2005
Zadatak 5.2. U programu STATISTICA otvorite novu bazu podataka iz datoteke pod
nazivom Vremenski nizovi.xls koristei Excelovo suelje. Koristei se podacima iz radnog
lista pod nazivom trziste rada i cijene izraunajte bazne indekse nezaposlenih uzimajui za
bazu mjesec sijeanj 2001. godine. Objasnite znaenje dobivenog indeksa u mjesecu svibnju
2006. godine konkretno. Izraunajte verine indekse nezaposlenih, te prosjenu stopu
promjene nezaposlenih pomou Excelove funkcije =GEOMEAN(...).

opcija: File Open File name: Vremenski nizovi Open. U slijedeem koraku
izaberite opciju Open as an Excel Workbook. Koristei Excelovo suelje rijeite zadatak.
Bazni indeks nezaposlenih u svibnju 2006. godine iznosi: __________, to pokazuje _______
____________________________________________________________________________
____________________________________________________________________________.
Geometrijska sredina verinih indeksa iznosi: ______________, to pokazuje ____________
____________________________________________________________________________.
Zadatak 5.3. Koristei se podacima iz udbenika Statistika za ekonomiste pomou

programa STATISTICA rijeite zadatak 13.5 (str. 269).
Rjeenje 5.3. U programu STATISTICA otvorite novi radni list u kojem ete unijeti podatke
iz primjera 13.5 (investicije u graevinske radove, opremu i ostalo). Nakon unosa podataka
70
Statistika analiza
pokrenite prozor 2D Line Plots Variables , te u kartici Advanced izaberite tip grafa:
Double-Y. Na lijevoj ordinati oznaite varijablu: graevinski radovi i oprema, a na desnoj
ordinati: ostalo.
Nadalje, unutar kartice Options 1 u dijalikom okviru Case labels izaberite Variable:
Godina. Za skalu na osi Y izaberite tip logaritamske skale (Axis: Y, Type: Logarithmic).
71
Statistika analiza
Spreadsheet1 4v*13c
100000
90000
80000
70000
60000
50000
Graevinski radovi(L)
Oprema(L)
Ostalo(R)
18000
17000
16000
15000
14000
13000
12000
11000
10000
9000
8000
40000
7000
6000
30000
5000
4000
20000
3000
2000
10000
1000
1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987
VJEBA BR. 61
(a) U program STATISTCA unesite podatke iz datoteke Vremenski nizovi.xls. Prilikom

importiranja podataka izaberite opciju Open as an Excel WorkBook. U novom stupcu
radnog lista trite rada i cijene izraunajte indekse nominalnih neto plaa na stalnoj
bazi iz prosinca 1999. godine. Objasnite znaenje dobivenog indeksa u oujku 2000.
godine! [U eliji J1 upiite: It nominalnih plaa u eliji J2 upiite formulu
=D2/$D$49*100 kopirajte formulu]
Bazni indeks nominalnih plaa u oujku 2000. godine iznosi:_________, te pokazuje______
____________________________________________________________________________
____________________________________________________________________________.
(b) Verine indekse potroakih cijena (ukupno) iz stupca G preraunajte u bazne indekse
potroakih cijena uzimajui za bazu mjesec prosinac 1999. godine. Izraunajte indekse
realnih plaa. Objasnite znaenje indeksa realnih plaa za mjesec lipanj 2001. godine. [U
eliji K1 upiete: Bazni IPC u eliji K49 upiite broj 100 u eliji K50 ispod baze
upiite formulu =K49*G50/100 kopirajte formulu prema dolje u eliji K48 iznad
baze upiite formulu =K49/G49*100 kopirajte formulu prema gore u eliji L1
upiite: It realnih plaa u eliji L2 upiite formulu =J2/K2*100 kopirajte formulu]
72
Statistika analiza
Bazni indeks realnih plaa u lipnju 2001. godine iznosi:___________, te pokazuje_________
____________________________________________________________________________
____________________________________________________________________________.
(c) U stupcu M izraunajte vrijednosti realnih plaa u kunama na temelju baznih indeksa
relanih plaa iz stupca L. Objasnite odnos realne i nominalne plae u svibnju 2006.
godine (jesu li u tom mjesecu realne plae bile vee ili manje od nominalnih, zato i za
koliko posto?). [U eliji M1 upiite: Realne plae u kunama u eliji M2 upiite
formulu =L2*3232/100 kopirajte formulu]
U svibnju 2006. godine realna plaa je iznosila:_______________kn, dok je nominalna plaa
iznosila:_______________kn, to znai ____________________________________________
____________________________________________________________________________
____________________________________________________________________________.
(d) Izraunajte i objasnite znaenje geometrijske sredine verinih indeksa potroakih
cijena (dobra) i geometrijske sredine verinih indeksa potroakih cijena (usluge).
[koristite formulu =GEOMEAN(H3:H126) i formulu =GEOMEAN(I3:I126)]
Geometrijska sredina verinih indeksa potroakih cijena za dobra iznosi:____________, to
pokazuje_____________________________________________________________________
____________________________________________________________________________.
Geometrijska sredina verinih indeksa potroakih cijena za usluge iznosi:___________, to
pokazuje_____________________________________________________________________
____________________________________________________________________________.
73
Statistika analiza
6. TREND
Vremenski niz, intervalni ili trenutani, moe biti stacionaran ili moe imati trend. Ako
vremenski niz sadri trend komponentu znai da ima dugoronu tendenciju rasta ili
pada. Za razliku od regresije kod trenda uvijek je nezavisna varijabla vrijeme (npr.
godine, mjeseci, tjedni, dani,...).
Najee se u praktinim primjenama koriste ovi trend modeli:
+
x
(a) Jednostavni linearni: yt =
0
1
t
(b) Trend polinom drugog stupnja:
+
x +
x2
yt =
0
1
t
2
t
(c) Eksponencijalni jednostavni trend:

X t ili y = e 0 + 1 X t
yt =
0
1
t
(d) Eksponencijalni sloeni trend (logaritamska parabola):

X t
X t2 ili y = e 0 + 1 X t + 2 X t2
yt =
0
1
2
t
(e) Asimptotski trend modeli (npr. modificirani eksponencijalni trend, Gompertzov trend
ili logistiki trend).
se procjenjuju kao i kod regresije primjenom

U trend modelima (a) do (d) parametri
j
metode najmanjih kvadrata, samo to varijabla Xt poprima vrijednosti: 0, 1, 2,....,T-1.
Asimptoski trend modeli pod (e) ne mogu se procijeniti metodom najmanjih kvadrata,
zato se nee dalje analizirati. Openito, asimptotski trend modeli za razliku od
jednostavnog eksponencijalnog trenda razlikuju se za dodatni parametar L koji
predstavlja vrijednost asimptote kojoj promatrana pojava tei u dugom roku, a nikada je
nee dostii.
Zadatak 6.1. U programu STATISTICA otvorite bazu podataka iz datoteke pod nazivom
Vremenski nizovi.xls koristei Excelovo suelje. Koristei se podacima iz radnog lista pod
nazivom financijski sektor izraunajte parametre jednostavnog linearnog trenda za varijablu
M1. Objasnite znaenje dobivenih rezultata konkretno! Prema linearnom trendu
prognozirajte vrijednost novane mase M1 u mjesecu rujnu 2011. godine. Izraunajte i
prognostike granice procjene na temelju 95%-tne razine pouzdanosti. Jednadbu linearnog
trenda prikaite odgovarajuim grafikonom.
74
Statistika analiza
opcijea File Open File name: Vremenski nizovi Open. U slijedeem koraku
izaberite opciju Open as an Excel Workbook. Unutar radnog lista financijski sektor
formirajte varijablu vrijeme s ishoditem na poetku promatranog razdoblje, tj. Xt =0, 1, 2,
3, 4, 5, 6, ...., 134, 135, 136. Koristei proceduru Multiple Regression, kao u poglavlju 4,
procijenite parametre linearnog trenda. Za zavisnu varijablu oznaite M1, a za nezavisnu
varijablu Xt, kao to je prikazano na slijedeoj slici.
Jednadba linearnog trenda glasi:
yt =
Konstantni lan iznosi:____________, te pokazuje___________________________________

____________________________________________________________________________.
Parametar uz varijablu vrijeme pokazuje___________________________________________
____________________________________________________________________________.
Koeficijent determinacije pokazuje_______________________________________________
____________________________________________________________________________.
75
Statistika analiza
Standardna pogreka procijenjenog linearnog trenda iznosi:_____________, dok koeficijent
varijacije trenda od ___________% pokazuje _______________________________________
____________________________________________________________________________.
Empirijski F-omjer iznosi: ________________. Pri empirijskoj razini signifikantnosti ______
______________________________________moe se prihvatiti hipoteza________________
____________________________________________________________________________.
Da bi prognozirali vrijednost novane mase M1 u buduem periodu pokrenite prozor

Multiple Regression Results, te unutar kartice Residuals/assumptions/prediction
izaberite opciju Compute prediction limits. Zatim izaberite Predict dependent variable,
te u dijalokom okviru za vrijednost varijable Xt upiite broj 200.
76
Statistika analiza
y( Xt = 200) = 54284 ,96
Pr 48450 ,14 < y( Xt = 200) < 60119 , 79 = 0 ,95

Scatterplot of M1 against Xt
Vremenski nizovi (B2:EH138) 13v*137c
M1 = 3332,0679+254,7645*x
45000
40000
35000
M1
30000
25000
20000
15000
10000
5000
-20
20
40
60
80
100
120
140
160
Xt
Zadatak 6.2. Koristei podatke iz radnog lista pod nazivom financijski sektor izraunajte
parametre trend polinoma drugog stupnja za varijablu: kamatna stopa na kunske kredite s
valutnom klauzulom (prosjek). Objasnite znaenje dobivenih rezultata konkretno! Prema
trend polinomu drugog stupnja izraunajte oekivane vrijednosti KS i procijenjene greke
relacije (rezidualna odstupanja). Objasnite znaenje rezidualnog odstupanja za mjesec
prosinac 1995. godine. Jednadbu procijenjenog trenda prikaite na dijagramu rasipanja.
Procijenite jednadbu eksponencijalnog trenda na istom grafikonu. Protumaite znaenje
dobivenih parametara eksponencijalnog trenda. Koji je model trenda reprezentativniji?
77
Statistika analiza
Rjeenje 6.2. Unutar radnog lista financijski sektor formirajte varijablu vrijeme s ishoditem
na poetku promatranog razdoblje, tj. Xt =0, 1, 2, 3, 4, 5, 6, ...., 134, 135, 136. Koristei
proceduru Nonlinear Estimation, kao u poglavlju 4, procijenite parametre trend polinoma
drugog stupnja definirajui funkciju oblika: v9=b0+b1*v13+b2*(v13^2).
Da bi izraunali oekivane vrijednosti KS i procijenjene greke relacije (rezidualna

odstupanja) unutar kartice Residuals prozora Results potrebno je izabrati Observed,
predicted, residual vals.
Rezidualno odstupanje za mjesec prosinac 1995. godine iznosi:__________________, to

znai _____________________________________________________________________
_________________________________________________________________________.
78
Statistika analiza
Da bi na istom dijagramu usporedili jednadbu trend polinoma i eksponencijalnog

trenda unutar prozora Results kartice Quick izaberiteFitted 2D function & observed
vals. Desnim klikom mia aktivirajte prozor Graph Properties (All Options)...., a zatim u
kartici Plot: Point Labels u dijalokom okviru Properties iskljuiti opciju Text labels.
Nadalje, u kartici Plot: General potrebno je iskljuiti opciju Markers..., a ukljuiti
Line...(Line width: 1,0). U zadnjem koraku u kartici Plot: Fitting potrebno je kliknuti na
gumb Add new fit, zatim u dijalokom okviru Fit type izabrati Exponential kao to je
prikazano na slici (novo dobivenu jednadbu moete oznaiti zelenom bojom da se
razlikuje od jednadbe trend polinoma).
79
Statistika analiza
Model: v9=b0+b1*v13+b2*(v13^2)
Y = 22,3815*exp(-0,01*x)
Function = y=(22,8101)+(-,21574)*x+(,685e-3)*(x^2)
30
28
KS na kunske kredite s v.k. (prosjek)
26
24
22
20
18
16
14
12
10
8
6
4
-20
20
40
60
80
100
120
140
160
Xt
Iz gornje slike se vidi da su oba nelinearna trend modela prikladna za opisivanje kretanja
kamatne stope na kunske kredite (izmeu dviju jednadbi nema znaajne razlike). Ipak,
potrebno je procijeniti parametre eksponencijalnog trenda i donjeti odluku o izboru boljeg
modela na temelju pokazatelja reprezentativnosti i dijagnostikih testova. Eksponencijalni trend
moe se izravno procijeniti u originalnom obliku, ba kao i trend polinom drugog stupnja,
definirajui funkciju: v9=b0*b1^v13 u dijalokom okviru Function to be estimated
procedure Nonlinear Estimation.
Trend polinom drugog stupnja:
yt = 22,81014 0, 21574 xt + 0, 00069 xt2
pokazuje prosjenu
Prema trend polinomu drugog stupnja procijenjeni parametar
1
promjenu pojave u jedinici vremena, dok su promjene promjena uzastopnih trend

, tj. 2 y = 2
. To znai da se
vrijednosti u jedinici vremena konstantne i jednake 2
2
2
t
kamatna stopa u promatranom periodu mjeseno smanjivala u prosjeku za 0,2157% s tim
da se pad kamatne stope u prosjeku mjeseno poveavao za 0,00138%.
80
Statistika analiza
Eksponencijalni trend:
yt = 22 ,3815 e 0 ,010218 X t ili
yt = 22 ,88604 0 ,98983 X t
Prema eksponencijalnom trendu prosjena

S = 1, 017% odnosno S = 1, 002% .
mjesena
stopa
promjene
iznosi
Svi procijenjeni parametri u promatranim modelima su statistiki znaajni, a bolji se

pokazuje trend polinom drugog stupnja jer je procijenjena prosjena kvadratna pogreka
tog trenda manja (iznosi 3,332 u odnosu na 3,420) iako nema znaajne razlike izmeu
procijenjenih koeficijenata determinacije.
VJEBA BR. 71
(a) U program STATISTCA unesite podatke iz primjera 16.6 na str. 234 udbenika
"Statistika za ekonomiste" (prilikom importiranja podataka iz datoteke Zadatci iz
udzbenika.xls koristite opciju Insert selected sheet to a Spreadsheet 16.6 OK
Get variable names from first row OK). Izraunajte ocjene parametara jednadbe

X t
X t2 (logaritamska parabola). Kreirajte transformirane vrijednosti
trenda: Yt =
0
1
2
varijable broja stanovnika u logaritamskom obliku po bazi 10. Formirajte varijablu
vrijeme (Xt) s ishoditem na poetku promatranog razdoblja, a ne s ishoditem na sredini
promatranog razdoblja kao u udbeniku (promijenom ishodinog razdoblja mijenja se
, dok procijenjene vrijednosti ostalih parametara ostaju
vrijednost parametra
0
nepromijenjene). [Insert Add Variables How many: 1, After: 2, Name: log(Yt)
Long name (Functions): =Log10(v2) OK; Insert Add Variables How many: 1,
After: 3, Name: Xt OK upiite brojeve 0, 1, 2, 3, ..., 8; Insert Add Variables
How many: 1, After: 4, Name: Xt^2 Long name (Functions): =v4^2 OK ].
Jednadbu trenda napiite u logaritamskom (linearnom) i originalnom (nelinearnom)
obliku. Objasnite znaenje procijenjenih parametara konkretno! [Statistics Multiple
Regression Quick Variables (Dependent: log(Yt), Independent: Xt Xt^2 )
OK Advanced Summary: Regression results]
Jednadba trenda u logaritamskom obliku je log yi = _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ .
Jednadba trenda u originalnom obliku je yi = _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __ .
iznosi:______________, te pokazuje _________________________________
Parametar
0
____________________________________________________________________________.
81
Statistika analiza
Parametar
1
____________________________________________________________________________
____________________________________________________________________________.

Parametar
2
____________________________________________________________________________
____________________________________________________________________________.
(b) Testirajte znaajnost procijenjenog trenda F-testom. Postavite odgovarajue hipoteze!
[Multiple Regression Results ANOVA (Overall goodness of fit)]
H 0 : ...
H1 : ...
F=
______ ___
= _ _ _ _ _ _ p = ______
______ ___
Moe se zakljuiti ____________________________________________________________

___________________________________________________________________________.
(c) Ocijenite reprezentativnost trenda odgovarajuom apsolutnom i relativnom mjerom
disperzije (koristite rezultate pod (a) i (b))
log Y =
_______
______
= __________ ; Vlog Y =
100 = _______ %
___ _ ___
_______
Na temelju koeficijenta varijacije procijenjenog trenda moe se zakljuiti da je trend model

(a) reprezentativan ili (b) nije reprezentativan (zaokruite toan odgovor)!
(d) U program STATISTCA unesite podatke iz zadatka 16.9 na str. 337 udbenika "Statistika
za ekonomiste" (prilikom importiranja podataka iz datoteke Zadatci iz udzbenika
koristite opciju Insert selected sheet to a Spreadsheet 16.9 OK Get variable
names from first row OK). Formirajte varijablu vrijeme (Xt) s ishoditem na poetku
promatranog razdoblja, a ne s ishoditem na sredini promatranog razdoblja kao u
udbeniku. [Insert Add Variables How many: 1, After: 2, Name: Xt OK
upiite brojeve 0, 1, 2, 3, ..., 10]. Odredite parametre optimalnog trend-polinoma
(procijenite parametre trend-polinoma prvog stupnja, drugog stupnja, treeg stupnja i
etvrtog stupnja). [Statistics Advanced Linear/Nonlinear Models Nonlinear
estimation User-specified regression, least squares OK Function to be
estimated. Unutar dijalokog okvira Estimated function upiite v2=b0+b1*v3 OK
OK OK Quick Summary: Parameter estimates ponovite postupak za trendpolinom drugog stupnja tako da unutar dijalokog okvira Estimated function upiete
v2=b0+b1*v3+b2*v3^2 OK OK OK Quick Summary: Parameter estimates
ponovite postupak za trend-polinom treeg stupnja tako da unutar dijalokog okvira
82
Statistika analiza
Estimated function upiete v2=b0+b1*v3+b2*v3^2+b3*v3^3 OK OK OK Quick
Summary: Parameter estimates ponovite postupak za trend-polinom etvrtog
stupnja tako da unutar dijalokog okvira Estimated function upiete
v2=b0+b1*v3+b2*v3^2+b3*v3^3+b4*v3^4 OK OK OK Quick Summary:
Parameter estimates]
Jednadba trend polinoma prvog stupnja je yi = _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ .
Jednadba trend polinoma drugog stupnja je yi = _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ .
Jednadba trend polinoma treeg stupnja je yi = _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ .
Jednadba trend polinoma etvrtog stupnja je yi = _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ .
Da bi odredili optimalan trend-polinom potrebno je testirati kada e smanjenje rezidualnog
zbroja kvadrata odstupanja (engl. Residual Sum of Squares) biti statistiki beznaajno
(pogledati str. 337 iz udbenika). To znai da je za svaki od procijenjenih trend polinoma
potrebno izvriti analizu varijance izborom opcija Results: ... Quick Analysis of
Variance.
Optimalan trend-polinom je ________________ stupnja jer je _________________________
____________________________________________________________________________
____________________________________________________________________________.
(e) Ocjenite znaajnost optimalnog trend polinoma pod (d) na temelju standardne pogreke
trenda i koeficijenta varijacije trenda (koristite se rezultatima pod (d))!
Y =
_______
______
= __________ ; VY =
100 = _______ %
___ _ ___
_______
Na temelju koeficijenta varijacije procijenjenog trenda moe se zakljuiti da je trend model

(a) reprezentativan ili (b) nije reprezentativan (zaokruite toan odgovor)!
(f) Koliko iznosi koeficijent determinacije optimalnog trend polinoma? Objasnite njegovo
znaenje konkretno!
R2 =
_____
= __________
______
Koeficijent determinacije ( R 2 ) pokazuje _________________________________________

____________________________________________________________________________
____________________________________________________________________________.
i
prema trend polinomu prvog stupnja!
(g) Objasnite znaenje parametra
0
1
83
Statistika analiza
Parametar
0
____________________________________________________________________________.
Parametar
1
____________________________________________________________________________
____________________________________________________________________________.
(h) Trend polinom prvog stupnja i trend polinom drugog stupnja usporedite na istom
grafikonu! [Graphs Scatterplots... Variables (X: Xt Y: Proizvodnja u 000 kom.)
OK dvostrukim klikom mia toke zamijenite linijom (iskljuite Markers; ukljuite
Line) OK nakon desnog klika miem izaberite Graph Properties (All Options)...
Plot: Fitting Add new fit Fit type: Polynomial OK]
Scatterplot of Proizvodnja u 000 kom. against Xt
Zadatci iz udzbenika 3v*11c
Proizvodnja u 000 kom. = 132,9545+50,9545*x
Proizvodnja u 000 kom. = 99,6503+73,1573*x-2,2203*x^2
700
Proizvodnja u 000 kom.
600
500
400
300
200
100
0
-2
10
12
Xt
(i) Prema trend-polinomu drugog stupnja kolika proizvodnja se moe oekivati u 2012.
godini?
( Xt =16; Xt2 =256)
= __________ tisua kom.
84
Statistika analiza
7. MJERENJE I ELIMINIRANJE SEZONSKIH VARIJACIJA
Kod modeliranja vremenskih nizova cilj je pronai onaj analitiki izraz, tj. jednadbu
kojom se najbolje opisuje ili predoava kretanje promatrane pojave u ovisnosti o
vremenu ( xt ). U prethodnom poglavlju su navedeni oblici deterministikog trenda:
linearnog, eksponencijalnog i trend polinoma. Na primjer, ako su prve diferencije
promatranog vremenskog niza priblino jednake i konstantne ( yt const. ) moe se
zakljuiti da isti sadri linearni trend ili ako su druge diferencije priblino jednake i
konstantne ( 2 yt const. ) moemo zakljuiti da se vremenski niz razvija prema trend
polinomu drugog stupnja. Ako su pak pojedinane stope promjene verinih indeksa
priblino jednake ( St const. ) moemo zakljuiti da vremenski niz sadri
eksponencijalni trend.
Osim deterministikog trenda vremenski niz moe sadrati i stohastiki trend.

Vremenski niz koji sadri deterministiki i/ili stohastiki trend nije stacionaran. Najei
sluaj stohastikog trenda je vremenski niz koji slijedi proces sluajnog pomaka (engl.
random walk). Stohastiki trend se najee moe ukloniti prvim ili drugim
diferencijama. Ako je vremenski niz diferenciran d puta da bi se postigla stacionarnost
tada se kae da je integriran reda d. Oznaka I ( d ) pokazuje red integracije vremenskog
niza. Na primjer, I (1) pokazuje da je vremenski niz integriran reda jedan, te da je
potrebno izraunati prve diferencije da bi se postigla stacionarnost, dok I ( 2 ) pokazuje
da je vremenski niz integriran reda dva, te da je niz potrebno diferencirati dva puta da bi
se postigla stacionarnost. Vremenski niz I ( 0 ) je stacionaran (ne sadri stohastiki
trend).
Ekonomski vremenski nizovi osim trenda (deterministikog i/ili stohastikog) mogu

sadrati i druge periodine komponente, npr. sezonske ili ciklike. Dva su temeljna
pristupa u analizi sezonskih varijacija odnosno pojava. Prvi se pristup sastoji u
dekompoziciji vremenskog niza na trend-cikliku, sezonsku i iregularnu komponentu
na temelju pominih procjeka (engl. moving average). Ovaj klasian pristup
dekompozicije vremenskog niza na temelju pominih prosjeka ima obiljeja
neparametrijske statistike. Drugi pristup ima obiljeja parametrijske statistike kojim se
definira model stohastikog procesa koji generira vremenski niz.
Postoje noviji pristupi u otkrivanju periodinosti vremenskih nizova koji se temelje na

spektralnoj analizi odnosno na analizi vremenskih nizova u domeni frekvencija. Cilj
spektralne analize je dati odgovor na pitanja: pri kojoj frekvenciji je funkcija gustoe
spektra najvea, te koliki period je potreban da se zavri jedan ciklus. Odgovore na ova
85
Statistika analiza
pitanja daje periodogram. U osnovi spektralna analiza se temelji na Fourierovim
transformacijama vrijednosti vremenskog niza pomou funkcija sinusa i kosinusa.
Spektralna analiza ovdje se nee razmatrati.
Prema klasinoj dekompoziciji vremenskih nizova (prvi pristup) najee se polazi od

aditivnog modela ili multiplikativnog modela dekompozicije:
yt = (Tt + Ct ) + St + et
ili
yt = (Tt Ct ) St et
pri emu je:
Tt - trend komponenta (opisuje dugoroni razvoj pojave u vremenu),

Ct - ciklika komponenta (opisuje periodino obnavljanje pojave s periodom od dvije ili vie
godina, npr. svake tri godine),
St - sezonska komponenta (opisuje periodino obnavljanje pojave unutar jedne godine, npr.
mjeseci, kvartali, tjedni, dani) i
et - iregularna ili sluajna komponenta (ne moe se objasniti).
Aditivni model dekompozicije se ee primjenjuje kada su amplitude sezonskih

varijacija jednake (konstantne), dok se multiplikativni model dekompozicije ee
primjenjuje kada su amplitude sezonskih varijacija razliite (npr. rastue).
Ako je vremenski niz opaen u kratkim vremenskim intervalima ciklika se

komponenta teko identificira, pa se esto ne razdvaja od trend komponente (Tt + Ct ) .
U praktinim primjenama ee se koristi multiplikativni model dekompozicije

vremenskog niza kod kojeg se utjecaji sezonskih i iregularnih komponenti iskazuju u
obliku indeksa:
I t*,S I t ,e
yt = Tt
100 100
86
Statistika analiza
Sljedee slike prikazuju vremenske nizove s razliitim komponentama:
Postupak mjerenja i eliminiranja sezonskih varijacija, kada nije mogue identificirati

cikliku komponentu, polazei od multiplikativnog modela dekompozicije vremenskog
niza moe se opisati u slijedeim koracima:
1. U prvom koraku se trend komponenta procjenjuje metodom pominih prosjeka (npr.

ako su podaci prikupljeni na mjesenoj razini raunaju se dvanaestolani centrirani
pomini prosjeci, a ako su podaci prikupljeni na kvartalnoj razini raunaju se
etverolani centrirani pomini prosjeci). Pomini prosjeci zapravo "izglauju"
promatrani vremenski niz. Kada je broj lanova pominog prosjeka paran provodi se
postupak centriranja.
1
1
yt 2 + yt 1 + yt + yt +1 + yt + 2
2
CMAt ( 4 ) = 2
4
1
1
yt 6 + yt 5 + ... + yt 1 + yt + yt +1 + ... + yt + 5 + yt + 6
2
CMAt (12 ) = 2
12
2. U drugom koraku izraunavaju se prve procjene sezonskih faktora (indeksa) pomou
omjera originalnih vrijednosti vremenskog niza i pripadajuih centriranih pominih
prosjeka, pri emu zbroj prosjenih sezonskih faktora istih mjeseci ili kvartala mora biti
87
Statistika analiza
jednak 12, odnosno 4. U protivnom se sezonski faktori istoimenih mjeseci odnosno
kvartala korigiraju.
I t ,S =
yt
100
CMAt ( k )
3. U treem koraku raunaju se desezionirane vrijednosti vremenskog niza tj. vrijednosti

oiene od sezonskih utjecaja, tako da se originalne vrijednosti vremenskog niza
podijele sa sezonskim faktorima (indeksima).
yt* =
yt
100
I t*,S
4. U posljednjem koraku raunaju se faktori (indeksi) rezidualnih odstupanja, tako da se

desezionirane vrijednosti pojave podijele s pominim prosjecima.
yt*
100
I t , =
CMAt ( k )
Postoji vie metoda analize sezonskih pojava u sklopu navedenih pristupa. Relativno je
jednostavna metoda odnosa prema pominim prosjecima, zatim regresijski model sa
sezonskim indikator varijablama (engl. dummy). Posebno je rairena CENZUS metoda i
njezine varijante, kao na primjer X-12-ARIMA, koji rabi veina dravnih zavoda za
statistiku, te TRAMO/SEATS, STAMP i druge.
Zadatak 7.1. Koristei podatke iz datoteke Vremenski nizovi.xls unutar radnog lista BDP
kvartalni izvrite klasinu dekompoziciju vremenskog niza multiplikativnom metodom
(Cenzus I ). Objasnite znaenje dobivenih rezultata konkretno!
Rjeenje 7.1. U programu STATISTICA otvorite datoteku Vremenski nizovi.xls birajui
opcije: File Open File name: Vremenski nizovi Open. Otvorite radni list pod
nazivom BDP kvartalni u kojem se nalaze vrijednosti bruto-domaeg proizvoda u mil. kn
(tekue cijene) od prvog kvartala 2002. godine do zadnjeg kvartala 2008. godine, to ini
ukupno 28 opaanja.
U glavnom izborniku Statistics izaberite Advanced Linear/Nonlinear Models Time

Series/Forecasting.
Za varijablu oznaite BDP u tekuim cijenama (mil. kn).
Unutar kartice Quick prozora Time Series Analysis izaberite Seasonal decomposition
(Cenzus I), kao to je prikazano na sljedeoj slici.
88
Statistika analiza
U prozoru Ratios-to-Moving Average Classical Sesonal Decomposition... unutar kartice

Advanced oznaite model Multiplicative, sa centriranim pominim prosjecima Centered
moving averages. Broj sezonskih pomaka postavite na 4. Oznaite est komponenti koje
e biti aktivne u radnom outputu: (1) Moving averages, (2) Ratios/Differences, (3)
Seasonal factors, (4) Seasonally adj. series, (5) Smoothed trend cycle i (6) Irregular
component. Zatim kliknite Summary: Seasonal decomposition.
89
Statistika analiza
Na temelju rezultata iz gornje tablice prvi centrirani pomini prosjek jednak je:
1
1
41220 + 44397 + 50500 + 4581 + 4400
2
CMA1 ( 4 ) = 2
= 45827 ,00 .
4
Drugi centrirani pomini prosjek jednak je:
1
1
44397 + 50500 + 4581 + 4400 + 49034
2
CMA2 ( 4 ) = 2
= 46754 ,13... itd .
4
Prema gore navedenim izraunima centrirani etverolani pomini prosjek je peterolani
1 1 1 1 1
ponderirani pomini prosjek s ponderima , , , i , to znai da tri sredinja lana
8 4 4 4 8
imaju jednake pondere (25%) dok prvi i zadnji lan imaju dvostruko manje pondere
(12,5%).
90
Statistika analiza
Prve procjene sezonskih indeksa su jednake omjerima (engl. ratios) originalnih vrijednosti
vremenskog niza i pripadajuih centriranih pominih prosjeka:
I1,S =
50500
100 = 110,19700
45827
I 2 ,S =
45801
100 = 97 ,9614 ...itd .
46754,13
Vrijednosti prosjenih sezonskih indeksa istih kvartala su:
S1 =
91,9908 + 93, 2826 + 91, 7088 + ... + 91,1574

= 92 ,55929
6
S2 =
100, 4232 + 99,9230 + 100 , 467 + ... + 104,1214

= 100,83602
6
S3 =
110 ,1970 + 109, 2388 + 109 , 0956 + ... + 111, 4586

= 109 , 71246
6
S4 =
97 ,9614 + 97 ,8815 + 98,1252 + ... + 94 ,8440

= 97 ,17174
6
Zbroj vrijednosti prosjenih sezonskih indeksa istih kvartala nije jednak 400 jer je:
S1 + S 2 + S3 + S 4 = 400 , 27951 .
Zato se prosjeni sezonski indeksi istih kvartala korigiraju za faktor:
k=
400
= 0,9993017 .
400, 27951
Konana procjena sezonskog indeksa, na primjer, za prvi kvartal jednaka je:
I1*,S = S1 0 ,9993017 = 92 , 49466 itd.

Naime, konana procjena sezonskog indeksa za prvi kvartal dobivena pomou programa
STATISTICA jednaka je 92,6571 i razlikuje se od konane procjene sezonskog indeksa od
92,49466 jer se po defaultu programa koriste prosjeni sezonski indeksi kada su iskljuene
vrijednosti najmanjeg i najveeg sezonskog indeksa.24
24
Konane procijene sezonskih indeksa mogu se dobiti upotrebom korektivnog faktora na temelju medijalnih
vrijednosti prvih procijena sezonskih indeksa istih kvartala.
91
Statistika analiza
Prosjene vrijednosti sezonskih indeksa kada su iskljuene vrijednosti prvih procjena
najmanjeg i najveeg sezonskog indeksa su:
S1 =
91,9908 + 93, 2826 + 91, 7088 + 93,5068 + 93, 7094 + 91,1574

= 92 , 62224
4
S2 =
100, 4232 + 99 ,9230 + 100, 4647 + 99,8355 + 100, 2483 + 104 ,1214
= 100, 2648
4
S3 =
110 ,1970 + 109 , 2388 + 109 ,0956 + 109 , 2570 + 109 , 0277 + 111, 4586
= 109, 4471
4
S4 =
97 ,9614 + 97 ,8815 + 98,1252 + 97 , 4036 + 96 ,8138 + 94,8440

= 97 ,51532
4
Zbroj vrijednosti prosjenih sezonskih indeksa istih kvartala nije jednak 400 jer je:
S1 + S 2 + S3 + S 4 = 399 ,8495 .
Zato se prosjeni sezonski indeksi istih kvartala korigiraju za faktor:
k=
400
= 1,000376 .
399,8495
Konana procjena sezonskog indeksa za prvi kvartal jednaka je:
I1*,S = S1 k = 92 , 62224 1, 000376 = 92 , 6571 itd.

Konane procijene sezonskih indeksa i pripadajue stope promjene su ove:
Kvartal
Sezonski
indeksi
Stope
promjene
I.
II.
III.
IV.
Ukupno
92,6571
100,3025
109,4883
97,5520
400
-7,3429%
+0,3025%
+9,4883
-2,4480%
92
Statistika analiza
Desezionirane vrijednosti vremenskog niza, tj. vrijednosti oiene od sezonskih utjecaja,
raunaju se tako da se originalne vrijednosti vremenskog niza podijele sa konanim
procjenama sezonskih indeksa i pomnoe sa sto:
y1* =
41220
100 = 44486 , 6
92 , 6571
y*2 =
44397
100 = 44263,1
100 ,3025
y3* =
50500
100 = 46123,6 ...itd .
109 , 4883
U posljednjem koraku raunaju se faktori (indeksi) rezidualnih odstupanja, tzv. iregularna

komponenta, tako da se desezionirane vrijednosti pojave podijele s pominim prosjecima.
Naime, prema defaultu programa STATISTICA iregularna komponenta rauna se tako da se
desezionirane vrijednosti podijele s izglaenim vrijednostima desezioniranog vremenskog
niza (engl. Smoothed Trend component). Vrijednosti desezioniranog vremenskog niza
raunaju se upotrebom centriranih ponderiranih peterolanih pominih prosjeka iji su
ponderi redom: 1, 2, 3, 2, 1 odnosno 11,11%, 22,22%, 33,33%, 22,22% i 11,11%. Postupkom
izglaivanja desezioniranih vrijednosti dobiju su aproksimativne procjene trend-ciklike
komponente za prva dva i zadnja dva kvartala koje dosada nisu bile poznate. Indeksi
rezidualnih odstupanja su ovi:
I1,e =
44486 , 6
100 = 99 ,9588
44504 ,93
I 2 ,e =
44263,1
100 = 98, 4548
44957 ,78
I 3 ,e =
46123, 6
100 = 100 ,5673 ...itd .
45863, 47
Vrijednosti vremenskog niza za prva dva opaanja mogu se dekomponirati na slijedei

nain:
41220 = 44504,93
92, 6571 99 ,9588
100
100
44397 = 44957 , 78
100,3025 98, 4548
,....itd .
100
100
93
Statistika analiza
pokrenite prozor Ratios-to-Moving Average Classical Sesonal

Decomposition..... Nadalje, unutar kartice Review series izaberite Plot (multiple
variables).25 Iz pripadajueg izbornika oznaite varijable (komponente) koje elite
usporediti na istom grafikonu (koristite se tipkom Ctrl). Na primjer oznaite vrijednosti
originalnog vremenskog niza (BDP u tekuim cijenama (mil. kn)) i izglaene trendciklike vrijednosti (Smoothed tr-cycle). Nakon izbora odgovarajuih komponenti
kliknite OK.
Ponovno
25
Ako po defaultu nije aktivirana opcija Case names u dijalokom okviru Label data points with, tada oznaite tu
opciju. Aktiviranjem opcije Case names na osi X bit e navedene jedinice vremena (kvartal/godina).
94
Statistika analiza
Plot of selected variables (series)
90000
90000
85000
85000
80000
80000
BDP u tekuim cijenama (mil. kn)
BDP u tekuim cijenama (mil. kn); trns.
75000
70000
70000
65000
65000
60000
60000
55000
55000
50000
50000
45000
45000
40000
40000
35000
35000
Q1/2002
Q2/2002
Q3/2002
Q4/2002
Q1/2003
Q2/2003
Q3/2003
Q4/2003
Q1/2004
Q2/2004
Q3/2004
Q4/2004
Q1/2005
Q2/2005
Q3/2005
Q4/2005
Q1/2006
Q2/2006
Q3/2006
Q4/2006
Q1/2007
Q2/2007
Q3/2007
Q4/2007
Q1/2008
Q2/2008
Q3/2008
Q4/2008
Value
75000
Case Names
pokrenite prozor Ratios-to-Moving Average Classical Sesonal

Decomposition..... Nadalje, unutar kartice Review series izaberite Plot (multiple
variables) i oznaite sezonske indekse (Seasonal factors).
Ponovno

115
115
110
110
105
105
100
100
95
95
90
90
Q1/2002
Q2/2002
Q3/2002
Q4/2002
Q1/2003
Q2/2003
Q3/2003
Q4/2003
Q1/2004
Q2/2004
Q3/2004
Q4/2004
Q1/2005
Q2/2005
Q3/2005
Q4/2005
Q1/2006
Q2/2006
Q3/2006
Q4/2006
Q1/2007
Q2/2007
Q3/2007
Q4/2007
Q1/2008
Q2/2008
Q3/2008
Q4/2008
BDP u tekuim cijenama (mil. kn):Seasonal factors

(season=4);
BDP u tekuim cijenama (mil. kn); trns.
95
Statistika analiza
Zadatak 7.2. Koristei podatke iz datoteke Vremenski nizovi.xls unutar radnog lista BDP
kvartalni procijenite viestruki regresijski model s linearnim trendom i sezonskim indikator
+
x +
Q +
Q +
Q . Objasnite znaenje
(dummy) varijablama: yt =
0
1
t
2
2 ,t
3
3 ,t
4
4 ,t
procijenjenih parametara konkretno! Izraunajte prognostiku vrijednost i granice

prognostike procjene BDP-a u tekuim cijenama za trei kvartal 2009 godine. Stvarne
vrijednosti i oekivane vrijednosti BDP-a usporedite na istom grafikonu!

nazivom BDP kvartalni u kojem se nalaze vrijednosti bruto-domaeg proizvoda u mil. kn
(tekue cijene), varijabla vrijeme s ishoditem na poetku promatranog razdoblja (Xt) i
sezonske dummy varijable (Q2, Q3 i Q4).
S obzirom na prisutnost sezonskog utjecaja, koji se mjere po kvartalima, uvode se

sezonske dummy varijable:
1 za drugi k var tal

Q2 ,t =
0 za ostale k var tale
1 za trei k var tal
Q3 ,t =
1 za etvrti k var tal
Q4 ,t =
Openito, dummy ili tzv. binarne varijable poprimaju unaprijed poznate vrijednosti 0 i
1. Vrijednost 1 govori o prisutnosti odreenog svojstva, a vrijednost 0 govori o
odsutnosti odreenog svojstva, pa su one sredstvo kojim se u model ukljuuje
kvalitativna varijabla.
Kvartal je kvalitativna varijabla s etiri modaliteta, pa e se u regresijski model ukljuiti

tri binarne varijable Q2 ,t , Q3 ,t i Q4 ,t , dok e efekt sezonskog utjecaja u prvom kvartalu bit
. Bilo bi pogreno u model uvrstiti dummy varijablu za
sadran u konstantnom lanu
0
prvi kvartal, jer je potreban broj binarnih varijabli uvijek za jedan manji od broja
modaliteta kvalitativne varijable. Kad bi se sezonski utjecaj u modelu predoio s etiri
binarne varijable, sustav normalnih jednadbi koji slijede primjenom metode najmanjih
kvadrata ne bi imao rjeenje. Takoer, ako se u modelu sezonski utjecaji mjere na
temelju mjesenih podataka potrebno je uvrstiti 11 dummy varijabli.
Da bi procijenili viestruki regresijski model s linearnim trendom i sezonskim indikator

(dummy) varijablama koristite proceduru Multiple Regression.
96
Statistika analiza
yt = 38232, 41 + 1216,05 xt + 4589,38 Q2 ,t + 9746,33 Q3 ,t + 2198,85 Q4 ,t
Da bi izraunali prognostiku vrijednost BDP-a u tekuim cijenama potrebno je

ponovno pokrenuti prozor Multiple Regression Results. Nadalje, koristite proceduru
izbora opcija Residuals/assumption/prediction Predict dependent variable (Compute
prediction limits). Prije pritiska na OK potrebno je specificirati vrijednosti nezavisnih
varijabli kao to je prikazano na slici:
yQ3 ,2009. = 84460 , 21
Pr 80585, 08 < yQ3 ,2009. < 88335,35 = 0 ,95
Da bi na istom grafikonu usporedili stvarne i oekivane vrijednosti BDP-a u tekuim

cijenama ponovno pokrenite prozor Multiple Regression Results. Zatim koristite
proceduru izbora opcija Residuals/assumption/prediction Perform residual analysis
Save Save residuals & predicted. Prije pritiska na OK potrebno je specificirati koje
vrijednosti varijabli elite dodatno spremiti u novom radnom listu. Nakon kreiranja
novog radnog lista stvarne i oekivane vrijednosti BDP-a usporedite linijskim
grafikonom (Graphs 2D Graphs Line plots (Variables) Graph type: Multiple).
97
Statistika analiza
Spreadsheet7 13v*28c
85000
80000
75000
BDP u tekuim cijenama (mil. kn)

Predicted
70000
65000
60000
55000
50000
45000
40000
35000
Q1/2002
Q1/2003
Q1/2004
Q1/2005
Q1/2006
Q1/2007
Q1/2008
Q3/2002
Q3/2003
Q3/2004
Q3/2005
Q3/2006
Q3/2007
Q3/2008
Zadatak 7.3. Koristei podatke iz datoteke Vremenski nizovi.xls unutar radnog lista turizam
i trgovina izvrite klasinu dekompoziciju vremenskog niza noenja turista
multiplikativnom metodom (Cenzus I ).
nazivom turizam i trgovina u kojem se nalazi broj ukupnog noenja turista od sijenja 1994.
godine do svibnja 2006. godine (ukupno 149 opaanja). Ponovite proceduru dekompozicije
kao u zadatku 7.1. Napomena: broj sezonskih pomaka postavite na 12.
98
Statistika analiza
U slijedeu tablicu upiite sezonske indekse i pripadajue stope promjene:

sijeanj veljaa oujak travanj svibanj
Mjesec
lipanj
srpanj kolovoz rujan listopad studeni prosinac
Sezonski indeks
Stopa promjene
Izvrite dekompoziciju noenja turista za prva tri opaanja:
231 =
239 =
.......................
.......................
337 = .......................
100
100
100
100
100
100

20000
15000
15000
10000
10000
5000
5000
Value
20000
-5000
1.1.1994
1.7.1994
1.1.1995
1.7.1995
1.1.1996
1.7.1996
1.1.1997
1.7.1997
1.1.1998
1.7.1998
1.1.1999
1.7.1999
1.1.2000
1.7.2000
1.1.2001
1.7.2001
1.1.2002
1.7.2002
1.1.2003
1.7.2003
1.1.2004
1.7.2004
1.1.2005
1.7.2005
1.1.2006
-5000
Noenja turista
Noenja turista (izglaene trend vrijednosti)
99
Statistika analiza
Noenja turista ukupno:Seasonal factors (season=12);

500
500
450
450
400
400
350
350
300
300
250
250
200
200
150
150
100
100
50
50
0
-50
1.1.1994
1.7.1994
1.1.1995
1.7.1995
1.1.1996
1.7.1996
1.1.1997
1.7.1997
1.1.1998
1.7.1998
1.1.1999
1.7.1999
1.1.2000
1.7.2000
1.1.2001
1.7.2001
1.1.2002
1.7.2002
1.1.2003
1.7.2003
1.1.2004
1.7.2004
1.1.2005
1.7.2005
1.1.2006
-50
Noenja turista ukupno (sezonski indeksi)
U kojim su mjesecima najvei sezonski utjecaji?
U kojem mjesecu su najvei utjecaji iregularne komponente?
VJEBA BR. 81
(a) Prije pokretanja programa STATISTICA otvorite Excel datoteku Vremenski nizovi.xls,
te u radnom listu industrija i gradj. u stupcu M formirajte varijablu vrijeme Xt s
ishoditem na poetku promatranog razdoblja upisujui brojeve 0, 1, 2, 3, ...,147, 148. U
slijedeim stupcima od N do X formirajte sezonske dummy varijable: M2, M3, M4, M5,
M6, M7, M8, M9, M10, M11 i M12 (stupce popunite nulama i jedinicama). Sauvajte
promjene u Excelu: FileSave. Zatvorite Excel datoteku. Pokrenite program
STATISTICA, te u program importirajte podatke iz prethodne spremljene datoteke.
100
Statistika analiza
Prilikom importiranja podataka izaberite opciju Open as an Excel Workbook. Na
temelju podataka iz radnog lista industrija i gradj. procijenite regresijsku jednadbu:
+
X +
M 2+
M3+
M 4+
M5+
M6+
M7+
M8+
Yt =
0
1
t
2
3
4
5
6
7
8
M9+
M 10 +
M 11 +
M 12.
+
9
10
11
12
Varijabla Y = elektrina energija, varijabla X = vrijeme, a varijable M2, M3, M4, M5,
M6, ..., M12 su sezonske dummy varijable. [Statistics Multiple Regression (uredite
podatke upisujui Firsta data column: B Read case name from column: A)OK
Quick Variables (Dependent: Elektrina energija, Independent: Xt, M2, M3, M4,
M5, ..., M12 ) OK Advanced Summary: Regression results]
Objasnite znaenje parametara 0 , 1 , 4 i 6 konkretno! U kojem mjesecu je najvei
sezonski utjecaj? Koji od procijenjenih parametara nije statistiki znaajan?
Parametar 0 iznosi:______________, te pokazuje __________________________________
____________________________________________________________________________.
____________________________________________________________________________
____________________________________________________________________________.
____________________________________________________________________________
____________________________________________________________________________.
Parametar 6 iznosi:_____________, te pokazuje ___________________________________
____________________________________________________________________________
____________________________________________________________________________.
Najvei sezonski utjecaj je u mjesecu ________. Parametar _______ nije statistiki znaajan.
(b) Prognozirajte vrijednost indeksa proizvodnje elektrine energije u mjesecu lipnju 2010.
godine? Izraunajte i prognostike granice procjene na razini pouzdanosti od 99%.
[Multiple Regression results Residuals/assumptions/prediction Compute
prediction limits Alpha: 0,01 Predict dependent variable Xt: 197, M6: 1 OK]
ylipanj' 10. = _ _ _ _ _ _ _ Pr { _ _ _ _ _ _ _ < ylipanj' 10. < _ _ _ _ _ _ _} = 0 ,99
101
Statistika analiza
(c) Grafiki usporedite stvarne vrijednosti indeksa elektrine energije s oekivanim
vrijednostima (engl. predicted). [Multiple Regression results Perform residual
analysis Save Save residuals & predicted Select All Graphs 2DGraphs
Line Plots (Variables)... Graph type: Multiple Variables: Elektrina energijaPredicted OK OK]
Spreadsheet5 31v*149c
140
130
120
110
100
90
80
70
60
Elektrina energija
Predicted
50
40
1.1.1994
1.9.1995
1.5.1997
1.1.1999
1.9.2000
1.5.2002
1.1.2004
1.9.2005
1.11.1994
1.7.1996
1.3.1998
1.11.1999
1.7.2001
1.3.2003
1.11.2004
(d) Dekomponirajte vremenski niz indeksa proizvodnje elektrine energije

multiplikativnom metodom Cenzus I. [Statistics Advanced Linear/Nonlinear Models
Time Series/Forecasting Variables Elektrina energija Seasonal decomposition
(Census 1) Advanced Seasonal model: Multiplicative Seasonal lag: 12
ukljuite opciju Centered moving averages oznaite est komponenti koje e biti
aktivne u radnom outputu Number of backups per variable (series): 6 Summary:
Seasonal decomposition]. U sljedeu tablicu upiite sezonske indekse i pripadajue stope
promjene:
Mjesec
sijeanj veljaa oujak travanj svibanj
lipanj
srpanj kolovoz rujan listopad studeni prosinac
Sezonski indeks
Stopa promjene
(e) Napiite kako se izraunava prvi centrirani dvanaestolani pomini prosjek! Koliki
ponder je pridrueni prvom i zadnjem lanu, a koliko iznose ponderi ostalih lanova?
CMA1 (12 ) =
___________________________________
= 62, 2042
12
Prvom i zadanjem lanu pridruen je ponder od ____________%, dok su ostalim lanovima

pridrueni ponderi od ___________%.
102
Statistika analiza
(f) Napiite kako se izraunava prva procjena sezonskog indeksa za mjesec srpanj 1994.
godine. Za isti mjesec napiite kako se izraunava desezionirana vrijednost i indeks
iregularne komponente.
I 7 ,S =
______
100 = 94 ,5274
______
y7* =
______
______
100 = 62 , 7327 I 7 ,e =
100 = 100,3102
______
______
(g) Za prva dva opaanja u tablici napiite dekompoziciju vrijednosti indeksa elektrine
energije. Pojedinano objasnite dobivene komponente!
72 , 2 = .......................
100
100
59 ,9 = .......................
100
100
Trend vrijednost u mjesecu sijenju 1994. godine iznosi:_____________ nakon to se ukloni

sezonski utjecaj. Sezonski indeks u istom mjesecu iznosi:___________, te pokazuje _______
____________________________________________________________________________
_____________________________________________________________. Indeks iregularne
komponente u tom mjesecu iznosi:_________, te pokazuje____________________________
____________________________________________________________________________.
Trend vrijednost u mjesecu veljai 1994. godine iznosi:______________ nakon to se ukloni
sezonski utjecaj. Sezonski indeks u istom mjesecu iznosi:___________, te pokazuje _______
____________________________________________________________________________
_____________________________________________________________. Indeks iregularne
komponente u tom mjesecu iznosi:_________, te pokazuje____________________________
____________________________________________________________________________.
(h) Grafiki usporedite originalne vrijednosti indeksa elektrine energije s izglaenim trenciklikim vrijednostima. [Ratios-To-Moving Averages Review series Plot (Review
multiple variables) pomou tipke Ctrl oznaite prvi niz Elektrina energija i esti niz
Elektrina energija: Smoothed tr-cycle (season=12) OK]
103
Statistika analiza
Value

140
140
130
130
120
120
110
110
100
100
90
90
80
80
70
70
60
60
50
50
40
-10
10
20
30
40
50
60
70
Elektrina energija
80
90
40
100 110 120 130 140 150 160
Elektrina energija; trns.
(i) Grafiki prikaite sezonske indekse vremenskog niza. [Ratios-To-Moving Averages

Plot (Review multiple variables) oznaite trei niz po redu Elektrina energija:
Seasonal factors (season=12) OK]
Elektrina energija:Seasonal factors (season=12);

120
120
115
115
110
110
105
105
100
100
95
95
90
90
85
-10
10
20
30
40
50
60
70
80
90
85
100 110 120 130 140 150 160
Elektrina energija; trns.
104
Statistika analiza
8. PROGNOSTIKI MODELI
Ve je istaknuto da se drugi pristup u analizi vremenskih nizova oslanja na modele

kojima se analitiki, pomou procijenjenih parametara izraavaju periodine
komponente koje promatrani vremenski niz moe sadrati. Takvi su modeli najee
linearni stohastiki modeli (ne mogu se tono predvidjeti, ve se mogu samo procijeniti
na temelju vrijednosti promatranog vremenskog niza).
Najee je rije o modelima pomou kojih se izraava ovisnost tekue vrijednosti

vremenskog niza yt o njegovim proteklim vrijednostima yt 1 , yt 2 , yt 3 ,... , to znai da je
oekivana vrijednost vremenskog niza uvjetovana skupom informacija I t 1 . Skup I t 1
predstavlja skup proteklih informacija do trenutka t 1 koji sadri informacije na
temelju kojih je mogue predvidjeti budue vrijednosti vremenskog niza
yt +1 , yt + 2 , yt +3 ,... . Ipak, dio procesa koji se ne moe predvidjeti na temelju skupa
informacija I t 1 prezentira se kao proces bijelog uma (engl. white noise). Stohastiki
proces je "white noise" proces ije su sluajne varijable meusobno nekorelirane s
oekivanjem jednakim nuli, konstantnom varijancom i kovarijancom jednakom nuli za
bilo koji vremenski pomak k 0 .
Vremenski niz je stacionaran kada su mu lanovi meusobno nekorelirani, kada ima

konstantno oekivanje i konstantnu varijancu, te autokovarijancu koja je funkcija
vremenskog pomaka. Drugim rijeima, vremenski niz je stacionaran ako ne sadri trend
(npr. prve diferencije su jednake nuli pa je yt = yt 1 ). Isto tako, ako se vremenski niz
kree prema trend polinomu k-tog stupnja tada su nune i dovoljne k-te diferencije
vremenskog niza da se postigne stacionarnost.
Najvaniji linearni modeli stacionarnih stohastikih procesa su:

(a) Autoregresijski model reda p odnosno AR(p) model:
yt = 0 + 1 yt 1 + 2 yt 2 + ... + p yt p + t
(b) Model pominih prosjeka reda q odnosno MA(q) model:
yt = t 1 t 1 2 t 2 ... q t q
(c) Mjeoviti ARMA model reda p,q odnosno ARMA(p,q) model:
yt = 0 + 1 yt 1 + 2 yt 2 + ... + p yt p + t 1 t 1 2 t 2 ... q t q
105
Statistika analiza
Navedeni modeli se odnose na stacionarne procese, koje u vremenu ne sadre trend,

periodine ili druge sistemske komponente. U sluaju pojave sistemskih komponenti iste
je potrebno odstraniti. Najee se trend komponenta moe ukloniti diferenciranjem.
Vrijednosti vremenskog niza koje su diferencirane d puta oznaavaju se d yt . Ako u
ARMA(p,q) modelu yt zamijenimo s d yt dobiva tzv. integrirani ARMA model reda
p,d,q odnosno ARIMA(p,d,q) model.
Ako promatrana vremenska pojava sadri sezonsku komponentu model se proiruje

dodatnim lanovima: ARIMA(p,d,q)x(P,D,Q)S.
Osim postupka transformacije vremenskih nizova uporabom operatora diferenciranja, u

empirijskim se analizama provode i druge transformacije. Na primjer esto se koriste
logaritamske transformacije da se postigne stabilnost varijance vremenskog niza.
Takoer se vrijednosti vremenskog niza obino centriraju (odstupanja od aritmetike
sredine). Za centrirane vrijednosti vremenskog niza konstantni lanovi u navedenim
modelima se ne procjenjuju. Isto tako, konstantni lanovi se iskljuuju iz specifikacije
modela kada je vremenski niz diferenciran.
Za primjenu ARIMA modela nuno je ustanoviti jesu li ispunjeni uvjeti stacionarnosti

koji se odnose na AR dio, te uvjete invertibilnosti koji se odnose na MA dio modela. Ako
su navedeni uvjeti zadovoljeni moe se izraunati oekivanje i varijanca stohastikog
procesa u dugom roku ( t ). Slijedea tablica prezentira ogranienja u parametrima
koja moraju biti ispunjena da se zadovolje navedeni uvjeti:
Prognostiki
model
AR(1)
Uvjet
stacionarnosti
1 < 1
Uvjet
invertibilnosti
----
2 + 1 < 1
AR(2)
2 1 < 1
----
1 < 2 < 1
MA(1)
----
1 < 1
Oekivanje
procesa
= 0
1 1
0
=
1 1 2
----
2 1 < 1
2
1 12
(1 )
(1 + ) (1 )
12
= 0
= (1 + 12 ) 2
= 0
= (1 + 12 + 22 ) 2
= 0
1 1
1 + 2 1 1 + 12 2
=

1 12
2 + 1 < 1
MA(2)
Varijanca procesa
1 < 2 < 1
ARMA(1,1)
1 < 1
1 < 1
106
Statistika analiza
esto se u zapisima prognostikih modela koristi operator pomaka L za koji vrijedi
Lk yt = yt k odnosno:
Lyt = yt 1
L2 yt = yt 2
L3 yt = yt 3
yt = (1 L ) yt
d yt = (1 L ) yt
d
Zadatak 8.1. Napiite kako glase modeli predoeni pomou operatora pomaka L, te u
eksplicitnom obliku:
(a)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
(i)
(j)
ARIMA(0,1,0)
ARIMA(2,0,0)
AR(1)
MA(2)
ARIMA(1,0,1)
ARIMA(1,1,1)
ARIMA(1,1,0)
ARIMA(2,1,1)
ARIMA(2,0,1)
ARIMA(1,0,0)x(1,1,0)12
Zadatak 8.2. Navedene modele predoite odgovarajuom oznakom, te ispitajte jesu li nuni
uvjeti stacionarnosti i/ili invertibilnosti zadovoljeni. Ako su navedeni uvjeti zadovoljeni
izraunajte oekivanje i varijancu stohastikog procesa ako je u svim modelima 2 = 0, 09 .
(a)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
yt
yt
yt
yt
yt
yt
yt
yt
= 0,5 + 0,8 yt 1 + t
= 0, 2 + 1, 05 yt 1 0 , 4 yt 2 + t
= t 0,8 t 1
= t 1, 25 t 1
= t + 0,7 t 1 0,5 t 2
= 0, 4 0, 6 yt 1 + 3 yt 2 + t 0 , 6 t 1
= 0,8 yt 1 + 0 ,5 yt 2 + t 0 , 6 t 1
= 0,5 + yt 1 + t
107
Statistika analiza
Pri izboru modela najee se polazi od Box-Jenkinsova pristupa. Box-Jenkinsov pristup

se provodi u slijedeim koracima:
1. IDENTIFIKACIJA MODELA poetna je faza u kojoj specificiramo kojim bi se modelom

mogao predoiti promatrani vremenski niz. U ovoj fazi vanu ulogu imaju autokorelacijska
funkcija i parcijalna autokorelacijska funkcija. Autokorelacijsku funkciju (ACF) ini niz
koeficijenata linearne korelacije izmeu lanova niza pomaknutih za k razdoblja, a njezin
grafiki prikaz naziva se korelogram. Parcijalni autokorelacijski koeficijenti (PACF) su
koeficijenti korelacije izmeu lanova niza yt i yt k uz neutraliziran utjecaj ostalih lanova
yt 1 , yt 2 , yt 3 ,..., yt k +1 . Procjena PACF na temelju vrijednosti iz uzorka rauna se pomou

Yule-Walkerovih jednadbi.
Slijedea tablica opisuje ponaanje ACF i PACF stacionarnih procesa:
Proces
AR(p)
MA(q)
ARMA(p,q)
ACF
Opadajua
Iezava nakon pomaka q
Opadajua
PACF
Iezava nakon pomaka p
Opadajua
Opadajua
U sluaju da obje funkcije ACF i PACF opadaju prepoznajemo da se radi o mjeovitom

modelu. Dakle, kod mjeovitih modela ACF se ponaa kao i ACF autoregresijskog
modela, dok se PACF mjeovitog modela ponaa kao i PACF modela pominih prosjeka.
Ovisno o predznaku procijenjenih parametara j ili j koeficijenti ACF i PACF mogu
opadati izravno (najee eksponencijalno) ili oscilirajue (najee u obliku priguenih
sinusoida). Za dovoljno veliki uzorak T znaajnost koeficijenata autokorelacije se testira
Z
kada se
uobiajenim Z-testom, a granice znaajnosti su odreene intervalom 0
T
pretpostavlja da vremenski niz slijedi isti sluajni proces. Na primjer, to znai da su na
razini signifikantnosti testa od 5% (kada je Z = 1,96 ) i veliinu uzorka T = 1000 znaajni
koeficijenti autokorelacije koji su po apsolutnoj vrijednosti vei od 0,06198. Osim
pojedinanih testova upotrebljavaju se i skupni testovi znaajnosti koeficijenata
autokorelacije. Najee je u uporabi Ljung-Box test, ija je test veliina Q rasporeena
prema hi-kvadrat distribuciji sa m stupnjeva slobode.
2. FAZA PROCJENE - kada izaberemo odreeni model procjenjujemo parametre bilo j ili
j . Danas se u procjeni parametara najee koristi uvjetna metoda najmanjih kvadrata

(uvjetna je s obzirom na pretpostavku da su vrijednosti niza prije prvog promatranja jednake
sredini niza) ili metoda maksimalne vjerodostojnosti (MLE Maximum Likelihood
Estimation).
108
Statistika analiza
3. FAZA DIJAGNOSTIKE ispituje se da li je procijenjen model reprezentativan, da li je
statistiki znaajan i da li ispunjava sve polazne pretpostavke (kao npr. da li je model
stacionaran). Ako model nije stacionaran ili ako je u modelu znaajno prisutna
autokorelacija ponavljamo faze 1 - 3 sve dok ne pronaemo zadovoljavajui model. esto se
procjenjuje vie modela izmeu kojih se bira najbolji na temelju AIC i SBIC kriterija.
Akaikeov AIC i Schwartz Bayesian SBIC informacijski kriteriji mjere koliko dobro model
opisuje podatke. to je model bolji, manja je vrijednost navedenih pokazatelja. Pri izboru
konanog oblika modela sukladno Box-Jenkinsovu pristupu vano je naelo parsimonije
(daje se prednost modelu s manjim brojem parametara, a priblino istih pokazatelja kakvoe
u odnosu prema modelu veih dimenzija).
4. FAZA PREDVIANJA - kada smo pronali zadovoljavajui model isti se moe koristiti u
prognostike svrhe.
Zadatak 8.3. Na temelju prikaza ACF i PACF koeficijenata za 6 simuliranih vremenskih

nizova (Series x1, x2,..., x6) veliine T = 200 specificirajte prikladan model. Koje su granice
znaajnosti ACF i PACF koeficijenata?
109
Statistika analiza
110
Statistika analiza
Zadatak 8.4. Na temelju podataka o vremenskom nizu Zakljuna cijena radnog lista INA
tjedni datoteke Vremenski nizovi.xls napravite slijedee:
(a) Vremenski niz zakljunih cijena trgovanja dionicama INA-e, na temelju tjednih
opaanja, prikaite linijskim grafikonom.
(b) Procijenite koeficijente ACF i PACF do pomaka 10. to zakljuujete?
(c) Procijenite modele koji bi bili prikladni u konkretnom problemu modeliranja? Izaberite
adekvatan model u skladu s Box-Jenkinsovim pristupom.
(d) Za izabrani model provjerite jesu li uvjeti stacionarnosti i/ili invertibilnosti zadovoljeni.
(e) Koliko iznosi oekivanje, a koliko standardna devijacija vremenskog niza u dugom roku?
(f) Na temelju izabranog modela izvrite prognozu za 20 perioda unaprijed od posljednjeg
opaanja. Prognostike vrijednosti i granice prognostikih procjena na temelju 90%-tne
razine pouzdanosti prikaite grafiki.
Rjeenje 8.4. Nakon uitavanja odgovarajuih podataka u program STATISTICA pokrenite

Time Series/Forecasting proceduru i oznaite varijablu Zakljuna cijena. Zatim izaberite
ARIMA & autocorrelation functions Review series. Dok je vremenski niz u radnom
dijalokom okviru oznaen kliknite Plot (highlighted variable). Za nazive opaanja oznaite
Case names kao to je prikazano na slici:
111
Statistika analiza
1800
7.4.2008
29.9.2008
1800
25.8.2008
2000
21.7.2008
2000
16.6.2008
2200
12.5.2008
2200
3.3.2008
2400
28.1.2008
2400
27.12.2007
2600
19.11.2007
2600
15.10.2007
2800
10.9.2007
2800
6.8.2007
3000
2.7.2007
3000
28.5.2007
3200
23.4.2007
3200
19.3.2007
3400
12.2.2007
3400
8.1.2007
3600
4.12.2006
Zakljuna cijena
Plot of variable: Zakljuna cijena

3600
Case Names
Da bi prikazali ACF i PACF koeficijente ponovno pokrenite prozor Single Series

ARIMA i izaberite karticu Autocorrelations. Broj pomaka podesite na 10 i kliknite
Autocorrelations. Ponovite proceduru za PACF koeficijente Partial autocorrelations.
Autocorrelation Function
Zakljuna cijena
Lag
(Standard errors are white-noise estimates)

Corr. S.E.
+,917 ,1005
83,20 0,000
+,838 ,1000
153,5 0,000
+,763 ,0994
212,3 0,000
+,671 ,0989
258,4 0,000
+,584 ,0983
293,7 0,000
+,509 ,0978
320,8 0,000
+,445 ,0973
341,7 0,000
+,407 ,0967
359,5 0,000
+,366 ,0962
373,9 0,000
10
+,312 ,0956
384,6 0,000
0
-1,0
-0,5
0,0
0,5
0
1,0
Conf. Limit
112
Statistika analiza
Na temelju korelograma se zakljuuje da koeficijenti ACF opadaju brzo

(eksponencijalno) s vremenskim pomakom. Ljung-Box Q test veliine pokazuju da su
ACF koeficijenti do zakljuno s pomakom k statistiki znaajni (p-vrijednost 0,000...).
To znai da vremenski niz zakljunih cijena dionica INA-e slijedi autoregresijski proces
reda p.
Partial Autocorrelation Function
Zakljuna cijena
(Standard errors assume AR order of k-1)
Lag
Corr. S.E.
+,917 ,1021
-,015 ,1021
-,018 ,1021
-,145 ,1021
-,031 ,1021
+,019 ,1021
+,032 ,1021
+,131 ,1021
-,061 ,1021
10
-,117 ,1021
0
-1,0
-0,5
0,0
0,5
1,0
Conf. Limit
Statistiki je znaajan koeficijent PACF samo pri pomaku jedan (+0,917), dok ostali
PACF koeficijenti nisu statistiki znaajni pri teorijskoj razini signifikantnosti od 5%.
Iz slijedee tablice se vidi da su standardne pogreke svih PACF koeficijenata jednake

1 96 = 0 ,1021 , a granice znaajnosti (Conf. Limit) odreene su intervalom
1
0 1,96
= 0, 2001 . Budui da PACF iezava nakon prvog pomaka dovoljno je
96
procijeniti autoregresijski model reda jedan odnosno AR(p) model s pomakom p=1.
113
Statistika analiza
Da bi procijenili AR(1) model ponovno pokrenite prozor Single Series ARIMA, te

unutar kartice Advanced izaberite pomak 1 u dijalokom okviru p-Autoregressive. U
model ukljuite i konstantni lan. Izaberite metodu procjene Exact (Melard).26 Zatim
kliknite OK (Begin parameter estimation).
26
Osim egzaktne metode alternativni je pristup primjene aproksimativne metode procjene parametara. Naime,
aproksimativna metoda se ee koristi ako je broj opaanja veoma dugaak (vei od 30.000), a alogoritmi koji se
koriste u procesu optimizacije jesu numeriki algoritmi iz klase kvazi-Newtonovih metoda.
114
Statistika analiza
1 < 1 mod el je stacionaran
= 2655,33549 0 = (1 1 ) = 2655,335 0 ,081 = 216,0646
yt = 216,0646 + 0,91863 yt 1 + t (1 0,91863 L ) yt = 216,0646 + t
=
0
= 2655,33549
1 1
2
14962
=
=
= 95837 , 21125 = 95837 , 21125 = 309,57586
1 12 1 0,918632
Histogram; variable: Zakljuna cijena
ARIMA (1,0,0) residuals;
Expected Normal
26
24
22
20
18
No of obs
16
14
12
10
8
6
4
2
0
-500
-400
-300
-200
-100
0
-450
-350
-250
-150
-50
100
50
200
150
300
250
400
350
500
450
600
550
Upper Boundaries (x<=boundary)
Na temelju histograma zakljuuje se da su rezidualna odstupanja normalno distribuirana.
115
Statistika analiza
Zakljuna cijena: ARIMA (1,0,0) residuals;
Lag

Corr. S.E.
-,024 ,1005
,06 ,8118
+,013 ,1000
,07 ,9643
+,138 ,0994
2,00 ,5720
-,000 ,0989
2,00 ,7354
-,046 ,0983
2,22 ,8176
-,037 ,0978
2,37 ,8830
-,120 ,0973
3,88 ,7936
+,047 ,0967
4,11 ,8470
+,096 ,0962
5,10 ,8257
10
+,044 ,0956
5,31 ,8694
0
-1,0
-0,5
0,0
0,5
0
1,0
Conf. Limit
Korelogram rezdiduala pokazuje da u procijenjenom ARIMA(1,0,0) modelu nije

preostalo autokorelacije jer se na temelju Ljung-Box Q test veliine nulta hipoteza ne
moe odbaciti (p-vrijednost je vea od 0,05 pri svim vremenskim pomacima). Ako u
procijenjenom modelu nije preostalo autokorelacije tada je model tono specificiran.
Da bi izvrili prognozu prema procijenjeom ARIMA(1,0,0) modelu za 20 perioda
unaprijed od posljednjeg opaanja ponovno pokrenite prozor Single Series ARIMA
Results. U kartici Advanced izaberite broj opaanja 20 i razinu pouzdanosti 90%, zatim
kliknite Plot series & forecasts, kao to je prikazano na slici.
116
Statistika analiza
Forecasts; Model:(1,0,0) Seasonal lag: 12

Input: Zakljuna cijena
Start of origin: 1
End of origin: 96
Observed
Forecast
116
111
106
101
29.9.2008
1800
25.8.2008
1800
21.7.2008
2000
16.6.2008
2000
12.5.2008
2200
7.4.2008
2200
3.3.2008
2400
28.1.2008
2400
27.12.2007
2600
19.11.2007
2600
15.10.2007
2800
6.8.2007
2800
10.9.2007
3000
2.7.2007
3000
28.5.2007
3200
23.4.2007
3200
19.3.2007
3400
8.1.2007
3400
12.2.2007
3600
4.12.2006
3600
90,0000%
117
Statistika analiza
Zadatak 8.5. Na temelju podataka o vremenskom nizu HRK/USD radnog lista tecaj datoteke
Vremenski nizovi.xls napravite slijedee:
(a) Vremenski niz teaja HRK/EUR prikaite linijskim grafikonom.
(a) Procijenite koeficijente ACF i PACF do pomaka 25. to zakljuujete? Koju
transformaciju vremenskog niza bi upotrijebili?
(b) Za transformirane vrijednosti vremenskog niza procijenite koeficijente ACF i PACF do
pomaka 25. to zakljuujete?
adekvatan model u skladu s Box-Jenkinsovim pristupom (koristite AIC i SBIC
informacijske kriterije).
(e) Na temelju izabranog modela izraunajte prognostike vrijednosti teaja za 20 perioda
unaprijed od posljednjeg opaanja. Izraunajte i granice prognostikih procjena na
temelju 90%-tne razine pouzdanosti.

Time Series/Forecasting proceduru kao u zadatku 8.4.
HRK/USD
Plot of variable: HRK/USD

10
10
4
1.1.1999
1.1.2001
1.1.2003
1.1.2005
1.1.2007
1.1.2009
1.1.2000
1.1.2002
1.1.2004
1.1.2006
1.1.2008
Case Names
118
Statistika analiza
HRK/USD
Lag
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

Corr. S.E.
+,984 ,0861
+,963 ,0857
+,943 ,0854
+,924 ,0851
+,906 ,0847
+,886 ,0844
+,864 ,0841
+,845 ,0837
+,827 ,0834
+,808 ,0831
+,789 ,0827
+,767 ,0824
+,744 ,0820
+,723 ,0817
+,698 ,0813
+,671 ,0810
+,643 ,0806
+,610 ,0803
+,574 ,0799
+,537 ,0796
+,501 ,0792
+,466 ,0789
+,436 ,0785
+,405 ,0781
+,371 ,0778
0
-1,0
-0,5
0,0
0,5
HRK/USD
Q
130,8
257,0
378,8
496,8
611,0
721,1
826,8
928,6
1027,
1122,
1213,
1299,
1381,
1460,
1533,
1602,
1666,
1723,
1775,
1820,
1860,
1895,
1926,
1953,
1976,
0
1,0
p
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
Conf. Limit
Lag
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

Corr. S.E.
+,984 ,0870
-,175 ,0870
+,048 ,0870
+,018 ,0870
-,008 ,0870
-,060 ,0870
-,034 ,0870
+,051 ,0870
+,024 ,0870
-,049 ,0870
-,007 ,0870
-,118 ,0870
+,000 ,0870
+,052 ,0870
-,175 ,0870
-,050 ,0870
-,007 ,0870
-,204 ,0870
-,092 ,0870
-,058 ,0870
+,018 ,0870
+,007 ,0870
+,077 ,0870
-,042 ,0870
-,139 ,0870
0
-1,0
-0,5
0,0
0,5
1,0
ACF opada sporo, a PACF iezava nakon pomaka 2. Sporo opadanje ACF koeficijenata
znai da je vremenski niz nestacionaran, odnosno da isti sadri stohastiki trend.
Stohastiki trend moe se ukloniti prvim diferencijama. Upotrebom prvih diferencija
vremenski niz postaje stacionaran.
Da bi transformirali vrijednosti vremenskog niza upotrebom prvih diferencija unutar

prozora Sinle Series ARIMA kartice Advanced izaberite Other transformation & plots. U
prozoru Transformations of Variables izaberite karticu Difference, integrate. Zatim broj
diferencija postavite na 1 i kliknite OK (Transform selected series), kao to je prikazano
na slici.
119
Conf. Limit
Statistika analiza
Plot of variable: HRK/USD
HRK/USD
D(-1)
0,6
0,6
0,4
0,4
0,2
0,2
0,0
0,0
-0,2
-0,2
-0,4
-0,4
-0,6
1.1.1999
1.1.2001
1.1.2003
1.1.2005
1.1.2007
1.1.2009
1.1.2000
1.1.2002
1.1.2004
1.1.2006
1.1.2008
-0,6
Case Names
Ponovno pokrenite prozor Trnasformations of Variables te unutar kartice Autocorrs

izaberite Autocorrelations i Partial autocorrelations.
HRK/USD : D(-1)
Lag
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

Corr. S.E.
+,249 ,0864
-,036 ,0860
-,010 ,0857
+,024 ,0854
+,109 ,0850
+,068 ,0847
-,017 ,0844
-,003 ,0840
+,062 ,0837
+,074 ,0833
+,071 ,0830
-,039 ,0826
-,022 ,0823
+,100 ,0819
-,023 ,0816
-,031 ,0812
+,141 ,0809
+,183 ,0805
+,062 ,0802
-,074 ,0798
-,072 ,0795
-,092 ,0791
+,008 ,0787
+,136 ,0784
-,028 ,0780
0
-1,0
-0,5
0,0
0,5
HRK/USD : D(-1)
Q
8,33
8,51
8,52
8,60
10,24
10,89
10,93
10,93
11,48
12,28
13,02
13,25
13,32
14,82
14,90
15,04
18,08
23,24
23,84
24,70
25,52
26,89
26,90
29,91
30,04
0
1,0
p
,0039
,0142
,0364
,0720
,0687
,0920
,1417
,2057
,2443
,2670
,2922
,3515
,4238
,3907
,4589
,5218
,3838
,1815
,2025
,2134
,2253
,2157
,2605
,1879
,2231
Lag
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Conf. Limit

Corr. S.E.
+,249 ,0874
-,104 ,0874
+,028 ,0874
+,017 ,0874
+,106 ,0874
+,016 ,0874
-,027 ,0874
+,016 ,0874
+,057 ,0874
+,036 ,0874
+,046 ,0874
-,066 ,0874
+,016 ,0874
+,091 ,0874
-,098 ,0874
+,002 ,0874
+,167 ,0874
+,121 ,0874
-,029 ,0874
-,088 ,0874
-,015 ,0874
-,114 ,0874
+,008 ,0874
+,129 ,0874
-,087 ,0874
0
-1,0
-0,5
0,0
0,5
1,0
ACF iezava nakon pomaka jedan i PACF iezava nakon pomaka jedan. Budui ACF
iezava oito je da je transformirani vremenski niz stacionaran. Ponaanje PACF
upuuje na zakljuak da bi AR(1) model bio prikladan za diferencirani vremenski niz,
odnosno bio bi prikladan ARIMA(1,1,0). Ponaanje ACF upuuje na zakljuak da bi
MA(1) model bio prikladan za diferencirani vremenski niz, odnosno bio bi prikladan
ARIMA(0,1,1) ili IMA(1,1) model.
120
Conf. Limit
Statistika analiza
Da bi procijenili navedene modele ponovno pokrenite Transformations of Variables i

zatim kliknite Cancel da bi se vratili na proceduru Single Series ARIMA i specificirali
odgovarajui model. Iz modela iskljuite konstanti lan i izaberite red diferencija jedan.
Postavite pomak p=1 i kliknite OK (Begin parameter estimation).
Zatim kliknite Summary: Parameter esimates.
121
Statistika analiza
(1 L )(1
L ) yt = t
(1 L ( L L ) ) y
2
= t yt = yt 1 + 1 ( yt 1 yt 2 ) + t
< 1 mod el je stacionaran

1
2 = 0, 02622 var ijanca procesa je konana tj. =
0, 02622
= 0,028128
1 0, 260432
y133 = y132 + 1 ( y132 y131 ) = 4,979623 + 0, 26043 ( 4,979623 4,885203) = 5,004213

y134 = y133 + 1 ( y133 y132 ) = 5, 004213 + 0, 26043 ( 5,004213 4 ,979623) = 5,010617
y135 = y134 + 1 ( y134 y133 ) = 5, 012285
yt = = 5, 012872 ( oekivana vrijednost procesa je kons tan tna )
Ponovite proceduru za model s pomakom p=0 i q=1.
Parametri u oba modela su statistiki znaajni. Bolji je model ARIMA(0,1,1) nego

ARIMA(1,1,0) jer je kod modela ARIMA(0,1,1) manja varijanca reziduala (srednja
kvadratna pogreka, tj. MS Residual=0,02596).
122
Statistika analiza
yt = t 1 t 1 (1 L ) yt = (1 1 L ) t
yt = yt 1 + t 1 t 1
1 < 1 mod el je invertibilan
yt = yt 1 1 t 1 = yt 1 1 ( yt 1 yt 1 )
yt = yt 1 + 0, 294894 ( yt 1 yt 1 )
y133 = y132 + 0, 294894 132 = 4,979623 + 0, 294894 0, 086133 = 5, 00502
132 = y132 y132 = 4,979623 4,89349 = 0,086133
y134 = y133 = 5, 00502
y135 = y134 = 5,00502 sredina procesa je kons tan tna
2 = 0, 02596
var ijanca procesa je konana tj. = (1 + 0, 2948942 ) 0 ,02596 = 0 ,028217
Iako program STATISTICA automatski ne ispisuje vrijednosti informacijskih kriterija,

lako ih se moe izraunati prema formulama:
2 + 2 k
AIC ( k ) = T log
2 + 2 k log T ,
SBIC ( k ) = T log
gdje je T broja opaanja (131=132-1, tj. nakon postupka diferenciranja gubi se jedno
2 je procijenjena varijanca reziduala.
opaanje), k je broj procijenjenih parametara (1), a
123
Statistika analiza
U slijedeoj tablici izraunate su vrijednosti informacijskih kriterija:

Residual Diagnostics
ARIMA(0,1,1) ARIMA(1,1,0)
Number of Residuals
131
131
Number of Parameters
1
1
Residual Sum of Squares
3,37679
3,40837
Residual Variance
0,02594
0,02620
Akaike's Information Criterion (AIC)
-205,76534
-205,19635
Schwarz's Bayesian Criterion (SBIC)
-203,53080
-202,96180
Manja vrijednost informacijskih kriterija upuuje na zakljuak da je ARIMA(0,1,1)

model neto bolji od modela ARIMA(1,1,0). Drugim, rijeima IMA(1,1) model se bolje
prilagoava podacima jer ima nie vrijednosti AIC i SBIC.
Zadatak 8.6. Na temelju podataka o vremenskom nizu Izvoz ukupno radnog lista izvoz i
uvoz datoteke Vremenski nizovi.xls napravite slijedee:
(a) Vremenski niz ukupnog izvoza prikaite linijskim grafikonom. to zakljuujete?
(b) Procijenite koeficijente ACF i PACF do pomaka 24. to zakljuujete?
adekvatan model u skladu s Box-Jenkinsovim pristupom.
(e) Na temelju izabranog modela izvrite prognozu za 15 perioda unaprijed od posljednjeg
opaanja. Prognostike vrijednosti i granice prognostikih procjena na temelju 90%-tne
razine pouzdanosti prikaite grafiki.

Time Series/Forecasting proceduru kao u zadatku 8.4.
124
Statistika analiza
Plot of variable: Izvoz ukupno
6500000
6000000
5500000
5000000
Izvoz ukupno
4500000
4000000
3500000
3000000
2500000
2000000
1500000
1000000
1.1.1994
1.1.1996
1.1.1998
1.1.2000
1.1.2002
1.1.2004
1.1.2006
1.1.1995
1.1.1997
1.1.1999
1.1.2001
1.1.2003
1.1.2005
Case Names
Vremenski niz sadri trend komponentu, sezonsku komponentu i sluajnu komponentu.


Izvoz ukupno
Izvoz ukupno
Lag
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

Corr. S.E.
+,793 ,0811
+,814 ,0808
+,777 ,0806
+,753 ,0803
+,758 ,0800
+,719 ,0797
+,725 ,0794
+,684 ,0792
+,686 ,0789
+,621 ,0786
+,652 ,0783
+,644 ,0780
+,594 ,0777
+,582 ,0775
+,551 ,0772
+,542 ,0769
+,543 ,0766
+,526 ,0763
+,494 ,0760
+,487 ,0757
+,444 ,0754
+,443 ,0751
+,415 ,0748
+,440 ,0745
+,377 ,0742
0
-1,0
-0,5
0,0
0,5
Q
95,51
196,8
289,9
377,8
467,5
548,8
632,1
706,7
782,3
844,8
914,1
982,1
1041,
1097,
1148,
1198,
1248,
1296,
1338,
1379,
1414,
1449,
1479,
1514,
1540,
0
1,0
p
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
0,000
Lag
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Conf. Limit

Corr. S.E.
+,793 ,0819
+,499 ,0819
+,209 ,0819
+,078 ,0819
+,144 ,0819
+,009 ,0819
+,070 ,0819
-,041 ,0819
+,034 ,0819
-,159 ,0819
+,106 ,0819
+,119 ,0819
-,103 ,0819
-,100 ,0819
-,011 ,0819
-,005 ,0819
+,096 ,0819
+,024 ,0819
-,084 ,0819
-,036 ,0819
-,060 ,0819
+,051 ,0819
-,065 ,0819
+,123 ,0819
-,126 ,0819
0
-1,0
-0,5
0,0
0,5
1,0
ACF pokazuje da vremenski niz nije stacionaran. Nuno je transformirati vremenski niz
upotrebom prvih diferencija. Nakon transformacije vremenskog niza potrebno je
ponovni ispitati ponaanje ACF i PACF.
125
Conf. Limit
Statistika analiza
D(-1)
2E6
2E6
Izvoz ukupno
1,5E6
1,5E6
1E6
1E6
5E5
5E5
-5E5
-5E5
-1E6
-1E6
-1,5E6
-1,5E6
-2E6
-10
10
20
30
40
50
60
70
80
-2E6
90 100 110 120 130 140 150 160
Case Numbers
Diferencirani vremenski niz nije stabilan odnosno varijacije diferenciranog vremenskog

niza su sve vee u vremenu, to je i za oekivati kada su periodine amplitude rastue.
Zato je najee potrebno prvo transformirati vrijednosti vremenskog niza u obliku
prirodnih logaritama.
Izvoz ukupno
ln(x); D(-1)
0,6
0,6
0,4
0,4
0,2
0,2
0,0
0,0
-0,2
-0,2
-0,4
-0,4
-0,6
-10
10
20
30
40
50
60
70
80
-0,6
90 100 110 120 130 140 150 160
Case Numbers
Prve diferencije logaritamskih vrijednosti vremenskog niza su stabilne.
126
Statistika analiza
ACF i PACF pokazuju da je transformirani vremenski niz stacionaran jer se upotrebom

prvih diferencija logaritamskih vrijednosti otklonila trend komponenta. Ipak, nune su i
sezonske diferencije jer ACF pokazuje znaajne vrhove pri pomacima 1, 12 i 24,
odnosno s periodom od 12 pomaka. PACF je padajua.
Izvoz ukupno: ln(x); D(-1)

Lag
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

Corr. S.E.
-,554 ,0814
+,051 ,0811
+,042 ,0808
-,074 ,0805
+,104 ,0803
-,104 ,0800
+,066 ,0797
-,048 ,0794
+,114 ,0791
-,185 ,0788
+,035 ,0786
+,176 ,0783
-,162 ,0780
+,088 ,0777
-,080 ,0774
+,056 ,0771
-,033 ,0768
+,020 ,0765
-,039 ,0762
+,071 ,0759
-,070 ,0756
+,050 ,0753
-,146 ,0750
+,251 ,0747
-,104 ,0744
0
-1,0
-0,5
0,0
0,5
Izvoz ukupno: ln(x); D(-1)

Q
46,41
46,80
47,07
47,92
49,59
51,29
51,98
52,34
54,44
59,93
60,13
65,22
69,52
70,81
71,88
72,41
72,60
72,67
72,93
73,81
74,65
75,10
78,86
90,10
92,07
0
1,0
p
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
,0000
Lag
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Conf. Limit
Corr. S.E.
-,554 ,0822
-,371 ,0822
-,209 ,0822
-,223 ,0822
-,070 ,0822
-,124 ,0822
-,066 ,0822
-,106 ,0822
+,093 ,0822
-,111 ,0822
-,222 ,0822
+,027 ,0822
+,013 ,0822
+,047 ,0822
-,011 ,0822
+,014 ,0822
-,051 ,0822
-,005 ,0822
-,063 ,0822
+,016 ,0822
-,105 ,0822
+,056 ,0822
-,232 ,0822
+,068 ,0822
+,107 ,0822
0
-1,0
-0,5
0,0
0,5
1,0
127
Conf. Limit
Statistika analiza
Nuno je procijeniti vie modela od kojih treba izabrati najbolji:
model u kojem su svi parametri statistiki znaajni,

model koji ima relativno najmanju srednju kvadratnu pogreku u odnosu na broj
procijenjenih parametara,
model u kojim procijenjeni parametri nisu statistiki znaajno korelirani,
model u kojem nije preostalo znaajne autokorelacije.
Da bi provjerili stupanj korelacije izmeu procijenjenih parametara ponovno pokrenite

prozor Single Series ARIMA, te u kartici Advanced izaberite Parameter
covariances/correlations.
128
Statistika analiza
129
Statistika analiza
Lag
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Izvoz ukupno: ARIMA (1,1,1)(1,1,0) residuals;
Izvoz ukupno: ARIMA (1,1,1)(1,1,0) residuals;

Corr. S.E.
-,020 ,0848
+,003 ,0845
+,031 ,0842
-,112 ,0839
+,002 ,0835
-,058 ,0832
+,024 ,0829
+,024 ,0826
+,090 ,0823
-,125 ,0819
+,132 ,0816
-,137 ,0813
-,041 ,0810
+,109 ,0806
+,011 ,0803
-,005 ,0800
-,084 ,0796
+,071 ,0793
-,085 ,0790
+,056 ,0786
-,004 ,0783
+,090 ,0779
+,046 ,0776
-,181 ,0773
+,008 ,0769
0
-1,0
-0,5
0,0
0,5
Q
,06
,06
,19
1,97
1,97
2,46
2,54
2,63
3,84
6,18
8,82
11,65
11,91
13,74
13,76
13,76
14,88
15,68
16,85
17,36
17,37
18,69
19,05
24,56
24,57
0
1,0
p
,8102
,9710
,9788
,7414
,8533
,8734
,9239
,9555
,9218
,7998
,6389
,4741
,5348
,4694
,5441
,6165
,6045
,6149
,6002
,6292
,6886
,6641
,6985
,4301
,4868
Lag
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Conf. Limit

Corr. S.E.
-,020 ,0857
+,002 ,0857
+,031 ,0857
-,111 ,0857
-,002 ,0857
-,059 ,0857
+,029 ,0857
+,013 ,0857
+,096 ,0857
-,141 ,0857
+,142 ,0857
-,156 ,0857
+,004 ,0857
+,066 ,0857
+,071 ,0857
-,071 ,0857
-,067 ,0857
+,060 ,0857
-,059 ,0857
+,042 ,0857
+,031 ,0857
+,063 ,0857
+,022 ,0857
-,168 ,0857
-,017 ,0857
0
-1,0
-0,5
0,0
0,5
1,0
Model ARIMA(1,1,1)x(1,1,0)12 pokazuje se adekvatnim.
130
Conf. Limit
Statistika analiza
(1 L ) (1 L ) (1 L ) (1
12
(1 L L
12
L12 ) yt = (1 1 ) t
+ L13 ) (1 1 L ) (1 12 L12 ) yt = (1 1 ) t
(1 L L + L
12
L12 + 1 L13 + L13 1 L14 )(1 12 L12 ) yt = (1 1 ) t
1 12 L12 1 L + 112 L13 L + 12 L13 + 1 L2 112 L14 L12 + 12 L24 +
+ 1 L13 112 L25 + L13 12 L25 1 L14 + 112 L26
) = (1 )
1
yt = ( 1 + 1) yt 1 1 yt 2 + ( 12 + 1) yt 12 ( 112 + 12 + 1 + 1) yt 13 + ( 112 + 1 ) yt 14 +
12 yt 24 + ( 112 + 1 ) yt 25 112 yt 26 + t 1t 1
= 0, 216198
1
= 0,549632
12
= +0, 776635
1
Forecasts; Model:(1,1,1)(1,1,0) Seasonal lag: 12
Input: Izvoz ukupno
Start of origin: 1
End of origin: 149
9000000
8000000
7000000
6000000
5000000
4000000
3000000
2000000
1000000
0
-10
10
20
30
40
50
60
Observed
70
80
90 100 110 120 130 140 150 160 170 180
Forecast
90,0000%
131
Statistika analiza
VJEBA BR. 91
(a) Napiite kako glase prognostiki modeli predoeni pomou operatora pomaka L, te u
eksplicitnom obliku:
- ARIMA(1,1,0)
- ARIMA(1,1,2)
- ARIMA(0,1,1)
(b) Navedene modele predoite odgovarajuom oznakom, te ispitajte jesu li nuni uvjeti
stacionarnosti i/ili invertibilnosti zadovoljeni. Ako su navedeni uvjeti zadovoljeni
izraunajte oekivanu vrijednost procesa u dugome roku:
- yt = 0, 2 + 1,3 yt 1 0, 4 yt 2 + t
- yt = t 0,8 t 1
- yt = 0, 4 0,6 yt 1 + t 0 ,5 t 1
(c) Procijenite koeficijente ACF i PACF do pomaka 15 za vremenski niz KS na kunske

kredite s v.k (prosjek) u radnom listu financijski sektor. Opiite ponaanje
autokorelacijske i parcijalne autokorelacijske funkcije! Koji prognostiki model bi bio
prikladan u konkretnom problemu modeliranja? [Statistics Advanced
Linear/Nonlinear Models Time Series/Forecasting (uredite podatke upisujui Firsta
data column: B Read case name from column: A) OKVariables Elektrina energija
OK ARIMA & autocorrelation functions Autocorrelations Autocorrelations
(p-level for highlighting: 0,05 Number of lags: 15) Single Series ARIMA Partial
autocorrelations]
132
Statistika analiza
Opis ACF i PACF:__________________________________________________________
_________________________________________________________________________
_________________________________________________________________________.
(d) Procijenite modele ARIMA(2,0,0), ARIMA(1,1,0) i ARIMA(0,1,1). Procijenjene modele

napiite u eksplicitnom obliku! Izaberite adekvatan model u skladu s Box-Jenkinsovim
p-Autoregressive: 2
pristupom. [Single Series ARIMA Quick
OK (Begin parameter estimation) Summary: Parameter estimates ponovite
proceduru za model ARIMA(1,1,0) Single Series ARIMA Cancel iskljuite
konstantni lan, a vremenski pomak p postavite na 1 ukljuite transformaciju niza
Difference 1. Lag: 1 - N of passes: 1 OK (Begin parameter estimation) Summary:
Parameter estimates ponovite proceduru za model ARIMA(0,1,1) Single Series
ARIMA Cancel vremenski pomak p postavite na 0, a vremenski pomak q postavite
na 1 ostavite transformacije niza u obliku prvih diferencija OK (Begin parameter
estimation) Summary: Parameter estimates]
ARIMA(2,0,0) model u eksplicitnom obliku je yt = _________________________________ .
Model ARIMA(___, ___, ___) pokazuje se prikladnim!
(e) Na temelju izabranog modela izvrite prognozu za 20 perioda unaprijed od posljednjeg
opaanja. Prognostike vrijednosti i granice prognostikih procjena na temelju
pouzdanosti od 95% prikaite grafiki. [Single Series ARIMA Advanced Number
of cases: 20 Cofidence level: 0,95 Plot series & forecasts]
133
Statistika analiza
PRIMJERI ZA VJEBU IZ UDBENIKA
134
Statistika analiza
135
Statistika analiza
136
Statistika analiza
137
Statistika analiza
138

STATISTICA Vjezbe 2011

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

STATISTICA Vjezbe 2011

Uploaded by

Copyright:

Available Formats

Statistika analiza

1. OSNOVE DESKRIPTIVNE I INFERENCIJALNE STATISTIKE

Elektronski udbenik s uputama o koritenju programa STATISTICA dostupan je na

Pokretanjem programa STATISTICA verzija 7.0 pojavljuje se prazan radni list

U tablicu radnog lista Spreadsheet1 potrebno je unijeti podatke koji su predmet

Prikupljeni podaci koji e se analizirati u ovom poglavlju spremljeni su u Excel datoteci

U sljedeem koraku potrebno je specificirati toan raspon redaka i stupaca. Najee

Unutar datoteke Poduzeca.xls podaci su obuhvaeni s 8 stupaca (Columns: from 1 to 8) i

reklamu u tis. kn.

Statistike metode i tehnike u programu STATISTICA mogu se pokrenuti unutar

Zadatak 1.1. Za varijablu Prihod u mil. kn izraunajte: aritmetiku sredinu, medijan,

Klikom na Summary: Statistics dobiju se pokazatelji deskriptivne statistike koje je

Rezultate deskriptivne statistike upiite u odgovarajua polja. Objasnite znaenje

Zadatak 1.2. Prema varijabli Prihod u mil. kn formirajte distribuciju frekvencija.

Ponovite proceduru formiranja distribucije frekvencija tako da izraunate teorijske

Zadatak 1.3. Empirijske (opaene) frekvencije usporedite s oekivanim (teorijskim)

X <= Category Boundary

Kolmogorov-Smirnov test (K-S test) koristi se da bi se testirala hipoteza jeli funkcija

Osim pokazatelja deskriptivne statistike i grafikog prikaza histograma s normalnom

Pr {85, 204 < x < 105, 758} = 0,95

Normal Probability-Plot prikazuje raspored oekivanih standardiziranih vrijednosti prema

Rjeenje 1.6. Unutar glavnog izbornika Statistics pokrenite Probability Calculator

(b) P ( x > 80 ) = 0, 661861

Pr {............. < x < ...........} = 0 ,95

Trea po redu kumulativna relativna frekvencija pokazuje __________________________

X <= Category Boundary

(c) P ( x > 40 ) = .............

(d) P ( 40 < x 60 ) = .............

Moe se prihvatiti hipoteza __________ Moe se prihvatiti hipoteza __________

Moe se prihvatiti hipoteza ____________

Moe se prihvatiti hipoteza ____________

Najee je u primjeni analiza varijance s jednim promjenjivim faktorom (One-Way

Kod analize varijance polazi se od slijedeih pretpostavki:

Populacije iz kojih uzorci potjeu jesu normalno distribuirane

2.1. ANALIZA VARIJANCE S JEDNIM PROMJENJIVIM FAKTOROM

Jednadba analize varijance za k uzoraka sa n opaanja dana je izrazom3:

Zadatak 2.1.1. Moe li se prihvatiti nulta hipoteza da se promatrana poduzea znaajno ne

Nakon to kliknite OK unutar kartice Summary izaberite opciju Univariate results.

Popunite tabelu ANOVA dobivenim rezultatima pomou programa STATISTICA:

je funkcija distribucije vjerojatnosti, koja se u literaturi oznaava s F ( x ) i predstavlja vjerojatnost da sluajna

Moe li se prihvatiti pretpostavka da sve tri distribucije pripadaju istoj populaciji?

Zadatak 2.1.2. Moe li se prihvatiti nulta hipoteza da se promatrana poduzea znaajno ne

Rjeenje 2.1.2. Ponovite proceduru kao u zadatku 2.1.1.

Postavite odgovarajue hipoteze:

Popunite tabelu ANOVA:

< X trgov . < ................... = 0,95

< X proiz . < ................... = 0,95

< X usluge < ................... = 0,95

2.2. ANALIZA VARIJANCE S DVA PROMJENJIVA FAKTORA

Na vrijednost neke sluajne varijable moe djelovati vie od jednoga promjenjivog

U slijedeem prozoru unutar kartice Summary izaberite Univariate Results. Popunite

Grafiki prikaite interaktivno djelovanje dvaju faktora na prosjean prihod

Zadatak 2.2.2. Moe li se prihvatiti hipoteza da su faktor Djelatnost i faktor Kotacija na

Moe se zakljuiti _____________________________________________________________

Ulaganje u reklamu u tis.kn

Pr {............. < X trgov. ne < ..............} = 0,95

Engleski matematiar Karl Pearson razradio je raunski postupak za izraunavanje

Pretpostavimo slijedei primjer: za osam trgovinskih radnji ( n = 8 ) poznat je broj

Smjer i intenzitet povezanosti izmeu dviju varijabli ovisi o njihovoj kovarijaciji, to

Aritmetike sredine izraunate su prema formuli za jednostavnu aritmetiku sredinu: x =

Mjera kovarijacije naziva se kovarijancom i definira se formulom:

Da bi izmjerili intenzitet povezanosti izmeu varijabli potrebno je izvriti

Dobiveni rezultat naziva se koeficijentom linearne korelacije ( r ). Budui da kovarijanca

Moe se prihvatiti hipoteza Moe se prihvatiti hipoteza

Parcijalni koeficijent korelacije iznosi:, te pokazuje_________