Professional Documents
Culture Documents
Vremenski Nizovi - 2020 - DETALJNIJE - UPUTE
Vremenski Nizovi - 2020 - DETALJNIJE - UPUTE
Vremenski Nizovi - 2020 - DETALJNIJE - UPUTE
Vremenski niz
Vremenski niz je skup kronološki uređenih vrijednosti. Veličine 𝑌𝑡 za 𝑡 = 1,2, . . . , 𝑛 koje tvore niz
nazivaju se frekvencije. Razlikujemo dvije vrste vremenskih nizova s obzirom na vremensku definiciju.
1. Intervalni vremenski niz – veličina pojave mjeri se unutar određenog vremenskog intervala, npr.
broj noćenja tijekom cijele godine u razdoblju od 2000. do 2010. godine.
2. Trenutačni vremenski niz – mjerenje ili promatranje pojave vrši se u određenom trenutku, npr.
broj stanovnika grada Rijeke u razdoblju od 1970. do 2000. godine – stanje sredinom godine.
Dinamiku vremenskog niza možemo promatrati preko prognostičkih trend modela.
1. LINEARNI TREND
Ukoliko ravnomjerni rast nezavisne vremenske varijable 𝑋 prati i ravnomjerni rast (pad) varijable 𝑌 (što
se vidi iz dijagrama rasipanja), model koji će odgovarati promatranoj vezi je linearni trend. Cilj nam je
odrediti parametre a i b u linearnoj funkciji (jednadžbi linearnog trenda) tako da dobiveni pravac što
bolje aproksimira skup točaka u dijagramu rasipanja.
𝑌̂ = 𝑎𝑋 + 𝑏
1
Objašnjenje značenja parametara:
o 𝑎 = predstavlja prosječno povećanje (smanjenje) varijable 𝑌 u jedinici vremena, odnosno
kada se nezavisna varijabla 𝑋 poveća za jedan (jedinica mjerenja). Geometrijski gledano a
predstavlja koeficijent smjera pravca, pa će biti pozitivan ako pravac raste (varijable su
proporcionalne), a negativan ako pravac pada (varijable su obrnuto proporcionalne)
o 𝑏 = predstavlja očekivanu vrijednost (trend-vrijednost) varijable 𝑌 ako je 𝑋 = 0 (u ishodištu
vremenskog razdoblja).
2
∑𝑁 ̂𝑖 − 𝑌̅)2
𝑖=1(𝑦
𝑅 = 𝑁
∑𝑖=1(𝑦𝑖 − 𝑌̅)2
Primjerice ako uspoređujemo odnos između nezavisne varijable 𝑋 (kvocijent inteligencije) i varijable 𝑦
(školski uspjeh) i za koeficijent determinacije dobijemo 𝑅 2 = 0,2025, znači da je oko 20.25% školskog
uspjeha objašnjeno inteligencijom učenika.
Prosječnu periodičnu stopu promjene kao relativnog pokazatelja kretanja promatrane pojave
računamo pomoću relacije:
𝑎
𝑠= ∗ 100
𝑌̅
Kao što je već spomenuto, u jednadžbi linearnog trenda, nezavisna varijabla je uvijek vrijeme. Jedina je
razlika u tome što ne koristimo originalne vrijednosti za vremenske jedinice (najčešće je riječ o
godinama), već njihove vrijednosti tako da varijabla 𝑋 poprima vrijednosti 0,1,2,3,... počevši od prve
godine (mjeseca, dana) u promatranom vremenskom razdoblju. Na taj način izbjegavaju se veliki brojevi.
2
Zadatak 1
U razdoblju od 2004. do 2012.godine praćen je broj noćenja na otoku Rabu. Podatke preuzmite u tablici:
Rab.xls (podaci nisu empirijski)
Broj noćenja
Godina (000)
2004 12
2005 18
2006 21
2007 20
2008 23
2009 28
2010 31
2011 35
2012 37
3
Rješenje:
a) Prikažite zadani niz linijskim grafikonom: Označite ćelije A2:B10 i umetnite dijagram raspršenosti s
linijama (Insert Chart - > Scatter with straight lines and markers), te ga uredite kao na slici:
dodajte naslov, nazive osi, granice na x-osi, kao što smo ranije već radili.
23
25 21 20
18
20
15 12
10
5
0
2004 2005 2006 2007 2008 2009 2010 2011 2012
Godine
4
b) Odredite jednadžbu linearnog trenda s ishodištem na početku promatranog razdoblja.
Za dobivanje jednadžbe linearnog trenda najprije ćemo transformirati vrijednosti nezavisne varijable x
(vrijeme izraženo u godinama/mjesecima i slično) u brojčane vrijednosti 0,1,2, ... .
Umetnite novi stupac između A i B stupaca (desni klik na naziv stupca B i insert), te ga popunite kao na
slici ispod:
Označite ćelije B2:C10. Zatim umetnite opet graf Scatter with lines (Dijagram raspršenosti s linijama).
Pokraj dijagrama pomoću oznake + otvorite za opciju Trendline - više mogućnosti (more options), da
vam se otvori s desne strane traka za opcije Trenda (Trendline).
Zatim odaberite linearni trend, te u opcijama uključite: Display Equation on chart i Display R-squared
value on chart. Uredite graf kao na slici niže (dodajte naslov, nazive osi, granice na x-osi):
5
Kretanje broja noćenja na Rabu- linearni trend
40 37
35
35 y = 2,9833x + 13,067 31
R² = 0,9674 28
Broj noćenja (000)
30
23
25 21 20
18
20
15 12
10
5
0
0 1 2 3 4 5 6 7 8
Godina (2004 = 0)
6
c) Objasnite značenje parametara u jednadžbi trenda.
𝒃 = 13,067 – očekivana (trend) vrijednost u ishodišnoj (2004.) godini iznosi 13067 noćenja. Iz tablice
vidimo da je empirijska vrijednost za 2004. godinu 12000 noćenja, tj. vrijednost parametra b nam služi
kao kontrola trend modela – ne bi smjelo biti jako velike razlike između empirijske i trend-vrijednosti,
𝒂 = 2,983 – broj noćenja na otoku Rabu u promatranom se razdoblju svake godine u prosjeku
povećavao za 2 983.
2. Drugi je način pomoću funkcije u MS Excelu koja omogućava prognoziranje vrijednosti zavisne
varijable za traženu godinu (mjesec,dan...):
=TREND(raspon poznate varijable Y; raspon poznate varijable X; novi X)
Dakle, ako se kretanje broja noćenja na Rabu nastavi u skladu s linearnim trendom utvrđenim na temelju
podataka u razdoblju 2004.-2012.. godine, 2019. možemo očekivati 57817 noćenja. Analogno, za 2000.
predviđamo da je bilo 1133 noćenja.
7
Grafički prikaz:
Dvostrukim klikom na pravac linearnog trenda
otvorite i odaberite opcije za trendline.
60 y = 2,9833x + 13,067
Broj noćenja (000)
50
40 35 37
31
28
30 21 20 23
18
20 12
10
0
-5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Godine
8
f) Prognozirajte na temelju linearnog trenda broj noćenja u razdoblju od 2013. do 2017.godine.
Želimo li na temelju linearnog trenda prognozirati vrijednost promatrane varijable za određeni vremenski
interval koristit ćemo funkciju:
= TREND(raspon poznate varijable Y;raspon poznate varijable X;raspon nove varijable X)
Proširimo tablicu tako da u ćelije A11-A15 upišemo tražene godine (2013-2017), a u B11-B15 odgovarajuće
vrijednosti 9-13.
Označite blok ćelija C11-C15 i kok su sve označene upišite:
=TREND(C2:C10;B2:B10;B11:B15).
Zatim istovremeno pritisnite Control, Shift i Enter (ne samo Enter)!!!
Nakon formatiranja dobivenih ćelija na 3 decimalna mjesta dobivamo (desni klik, oblikuj ćelije):
Broj noćenja
Godina x_t (000)
2004 0 12
2005 1 18
2006 2 21
2007 3 20
2008 4 23
2009 5 28
2010 6 31
2011 7 35
2012 8 37
2013 9 39,917
2014 10 42,900
2015 11 45,883
2016 12 48,867
2017 13 51,850
g) Kada možemo očekivati 50000 noćenja ako se kretanje broja noćenja nastavi mijenjati po
utvrđenom trendu?
Jedan način je da preko funkcije TREND prognoziramo vrijednost za dovoljno širok vremenski
interval unutar kojeg ćemo dobiti traženu vrijednost. To smo u ovom primjeru napravili, pa iz tablice
u f) zadatku možemo očitati da se 50000 noćenja može očekivati 2017. godine.
9
Drugi način je da iz jednadžbe linearnog trenda izračunamo vrijednost varijable 𝑋, ako je vrijednost
varijable 𝑌=50 :
50 = 2,983 𝑋 + 13,067 → 𝑋 = 12,38.
Dobivenu vrijednost zaokružimo na prvi veći cijeli broj (13) i zaključujemo da 50000 noćenja na
otoku Rabu možemo očekivati 2017. godine (2004 + 13).
h) Procijenite reprezentativnost dobivenog trend modela.
Kao mjeru reprezentativnosti trend modela koristimo koeficijent determinacije, koji iznosi 𝑅 2 =
0,9674, što znači da 96,74% periodičnih promjena broja noćenja na otoku Rabu u razdoblju 2004.-
2012.. godine objašnjava linearni trend model. Ovaj koeficijent možemo očitati sa dijagrama nakon
što ste u opcijama uključili Display R-squared.
10
2. EKSPONENCIJALNI TREND
Eksponencijalni trend model često se koristi u statističkoj analizi. Primjenjuje se kada promjena
promatrane pojave nije linearna, nego je u funkciji vremena sve brža (ili sporija) – što je vidljivo iz
dijagrama rasipanja.
Standardni oblik jednadžbe eksponencijalnog trend modela glasi:
𝑌̂ = 𝑏 ∙ 𝑎 𝑋 , pri čemu je a, b > 0.
Značenje parametara:
o 𝑏 = predstavlja prognoziranu vrijednost (trend-vrijednost) varijable 𝑌 u ishodištu
promatranog vremenskog razdoblja (vrijednost varijable 𝑋=0),
o 𝑎 = predstavlja prosječni tempo promjene varijable 𝑌 u jedinici vremena, odnosno kada se
𝑋 poveća za 1 jedinicu očekuje se povećanje (smanjenje) varijable 𝑌 𝑎 puta. Ako je a > 1, s
povećanjem varijable 𝑋 povećava se i 𝑌; ako je a < 1, povećanje varijable 𝑋 uzrokuje
smanjenje varijable 𝑌.
o Parametar a jasnije se interpretira preko prosječne stope promjene:
𝑠 = (𝑎 − 1) ∙ 100
Koja pokazuje povećanje (ili smanjenje ako je s negativan) varijable 𝑌 izraženo u postotcima,
ako se varijabla 𝑋 poveća za jednu jedinicu. Npr. ako je a = 1,25, tada je s = (1,25-1) · 100 =
25 %. Što znači da se povećanjem varijable 𝑋 za jedan, varijabla 𝑌 poveća za 25%. Npr. ako
je a = 0,7, tada je s = (0,7-1) · 100 = -30 %. Što znači da se povećanjem varijable 𝑋 za jedan,
varijabla 𝑌 se smanji za 30%.
Kao i kod linearnog trenda, originalne vrijednosti za vremenska razdoblja transformiramo tako da
varijabla 𝑋 poprima vrijednosti 0, 1, 2, 3, ... počevši od prve godine (mjeseca, dana) u promatranom
vremenskom razdoblju.
11
Zadatak 2
Mjerena je zagađenost zraka sumporom u centru Zagreba u razdoblju od 2005.godine do 2012.
godine. Preuzime tablicu ZagađenostZgb.xls (podaci nisu empirijski)
a) Prikažite zadani niz linijskim grafikonom.
b) Odredite jednadžbu eksponencijalnog trenda s ishodištem na početku promatranog razdoblja.
c) Objasnite značenje parametara u dobivenoj jednadžbi trenda.
d) Ako se kretanje zagađenosti nastavi prema izračunatom trendu, odredite koliki stupanj
zagađenosti možemo očekivati u 2019. godini.
e) Prognozirajte na temelju eksponencijalnog trenda stupanj zagađenosti u razdoblju 2013. do
2017. godine.
f) Kada možemo očekivati zagađenost sumporom od 500 mg/m3 ako se njegovo kretanje nastavi
po utvrđenom trendu?
g) Procijenite reprezentativnost dobivenog trend modela.
Stupanj
zagađenosti zraka
Godina
sumporom
(mg/m3)
2005 3
2006 5
2007 8
2008 13
2009 20
2010 32
2011 50
2012 75
12
Rješenje:
a) Prikažite zadani niz linijskim grafikonom.
Označite ćelije A2:B9 i umetnite dijagram raspršenosti s linijama (Insert Chart - > Scatter chart with
lines), te ga uredite kao na slici (naslov, nazivi osi, granice na osima, dodajemo elemente na +,
mijenjamo ih dvostrukim klikom na njih, desno seotvaraju opcije za uređivanje):
70
60
50
50
40 32
30
20
20 13
8
10 3 5
0
2005 2006 2007 2008 2009 2010 2011 2012
Godine
Stupanj zagađenosti
Godina x_t zraka sumporom
(mg/m3)
2005 0 3
2006 1 5
2007 2 8
2008 3 13
2009 4 20
2010 5 32
2011 6 50
2012 7 75
13
Označite ćelije B2:C9. Zatim opet umetnite dijagram raspršenosti s linijama (Scatter chart with lines).
Pokraj dijagrama pomoću oznake + otvorite za opciju Trendline - više mogućnosti (more options), da vam se
otvori s desne strane traka za opcije Trenda (Trendline).
Zatim odaberite eksponencijalni trend, te u opcijama uključite: Display Equation on chart i Display R-squared
value on chart. Uredite graf kao na slici niže niže (dodajte naslov, nazive osi, granice na x-osi):
75
80
y = 3,1445e0,4599x
70 R² = 0,9992
60 50
50
40 32
30 20
20 13
5 8
10 3
0
0 1 2 3 4 5 6 7
Godine
Ovdje moramo napraviti još jedan korak kako bismo dobili vrijednost parametra a (a=e^{0,4599}):
=EXP(0,4559) -> 1,583916.
Dakle, jednadžba eksponencijalnog trenda s ishodištem u početku promatranog razdoblja glasi:
𝑌̂ = 3,1445 ∙ 1,5839𝑋
(𝑋 = 0, 2005. godina; jedinica za 𝑋 = 1 godina; jedinica za 𝑌 = 1 mg/m3 ).
14
d) Ako se kretanje zagađenosti nastavi prema izračunatom trendu, odredite koliki stupanj zagađenosti
možemo očekivati u 2019. godini.
U gornju jednadžbu umjesto 𝑋 uvrstimo 14 (2019 - 2005):
= 𝟑, 𝟏𝟒𝟒𝟓 ∙ 𝟏, 𝟓𝟖𝟑𝟗𝟏𝟒 = 𝟏𝟗𝟔𝟔, 𝟕𝟏
Nastavi li se trend zagađenja kao u promatranom razdoblju, 2019. godine stupanj zagađenosti
sumporom iznosit će 1966,71 mg/m3.
2000
y = 3,1445e0,4599x
1500 R² = 0,9992
1000
500
3 5 8 13 20 32 50 75
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Godine
15
Stupanj zagađenosti
Godina x_t zraka sumporom
(mg/m3)
2005 0 3
2006 1 5
2007 2 8
2008 3 13
2009 4 20
2010 5 32
2011 6 50
2012 7 75
2013 8 124,60
2014 9 197,37
2015 10 312,63
2016 11 495,20
2017 12 784,38
f) Kada možemo očekivati zagađenost sumporom od 500 mg/m3 ako se njegovo kretanje nastavi
po utvrđenom trendu?
Kao što se vidi iz gornje tablice, stupanj zagađenosti od 495,20 mg/m3 očekuje se 2016. Na temelju
tempa porasta zagađenosti zaključujemo da 500 mg/m3 sumpora po kubičnom metru u Zagrebu
možemo očekivati 2017. godine.
16
g) Procijenite reprezentativnost dobivenog trend modela.
Koeficijent determinacije iznosi 𝑅 2 = 0,9992, što znači da je 99,92 % periodičnih promjena zagađenosti
zraka sumporom u Zagrebu u razdoblju 2005.-2012. godine objašnjeno eksponencijalnim trendom. Tako
visoka vrijednost koeficijenta determinacije ukazuje na visoku reprezentativnost modela, a samim tim i
veliku preciznost prognoziranih vrijednosti.
Pored dva opisana, MS Excel nudi i drugačije trend modele u analizi vremenskih nizova (logaritamski, polinom
n-tog stupnja, dvostruko logaritamski,...) Osim tih modela koje nudi MS Excel, u praksi se koriste i hiperbolički,
logistički, Gompertzov, modificirani eksponencijalni model, itd. Međutim u većini slučajeva analize
vremenskih nizova bit će dostatna dva opisana trend modela, a dodatne informacije o preostalim modelima
možete pronaći u raznoj statističkoj literaturi.
17