Modeliranje Log-Povrata S&P 500 Indeksa

Sveučilište Josipa Jurja Strossmayera u Osijeku
Diplomski studij matematike

Financijska matematika i statistika
Barbara Rački
MODELIRANJE LOG-POVRATA S&P 500

INDEKSA
Kolegij: Analiza vremenskih nizova
Osijek, 2018.
Sadržaj
1 Uvod 2
2 IDENTIFIKACIJA I DIJAGNOSTIKA MODELA 3

2.1 Osnovna analiza podataka . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2 Analiza log-povrata . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.3 Identifikacija modela . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.4 Modeliranje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
3 PREDIKCIJA 11
4 VAR-Value at Risk 12
5 Zaključak 13
1 Uvod
U ovom radu koristiti ću podatke o burzovnom indeksu S&P 500 u periodu od 1.
siječnja 2015. do 1. siječnja 2018. godine. S&P 500 je burzovni indeks koji sadrži
dionice 500 korporacija uglavnom iz Sjedinjenih Američkih Država. Uveden je 1957.
godine, a održava ga i kreira američka tvrtka za financijske usluge i izvještavanje
Standard & Poor’s. Sve dionice koje su uključene u indeks su dionice velikih, javnih
kompanija a trguju se na svim većim američkim burzama kao npr. Njujorškoj burzi
i NASDAQ. Poslije Dow Jones-a, S&P 500 je najviše praćeni indeks velike tržišne
kapitalizacije u SAD. Smatra se da je on "zvijezda vodilja" američke ekonomije.
Često se obilježava simbolom GSPC ili SPX. Budući da se u ovom seminarskom radu
radi o financijskim podacima glavni cilj modeliranja je predvidjeti buduće kretanje
i na taj način pokušati kontrolirati rizik. Iako nisu česti, ekstremni slučajevi, poput
velikog pada dionica, izazivaju najveće gubitke i iz tog razloga u ovom seminaru
pokušati ću podatke modelirati GARCH procesom.
Podatke o vrijednostima burzovnog indeksa moguće je pronaći na sljedećem
linku: https://finance.yahoo.com/quote/%5EGSPC/history?period1=1420066800&
period2=1514761200&interval=1d&filter=history&frequency=1d
2
2 IDENTIFIKACIJA I DIJAGNOSTIKA MODELA
2.1 Osnovna analiza podataka
Prilikom modeliranja koristiti ćemo podatke u razdoblju od 1. siječnja 2015. godine
do 1. siječnja 2017.godine. Preostale podatke (1.1.2017. - 1.1.2018.) koristiti ćemo
u svrhu predviđanja. Za početka možemo promotriti numeričke karakteristike i
grafički prikaz podataka kroz vrijeme.
Minimum Donji kvartil Medijan Prosjek Gornji kvartil Maksimum

1829 2067 2124 2201 2365 2690
Tablica 1: Osnovne informacije o podacima
Uočavamo kako je raspon vrijednosti indeksa između 1829 i 2690. Medijan po-
dataka iznosi 2124 dok je prosječna vrijednost 2201.
Slika 1: Grafički prikaz vremenskog niza
Iz samog izgleda grafa vremenskog niza može se naslutiti da niz nije stacionaran.
Uočavamo blagi trend rasta. Potvrdu nestacionarnosti možemo tražiti i u grafičkom
prikazu autokorelacijske funkcije (korelogramu).
Slika 2: Autokorelacijska funkcija
Autokorelacijska funkcija sporo pada u 0 što potvrđuje sumnju da niz nije sta-
cionaran. Za konačnu potvrdu koristimo Augmented DickeyFuller Unit Root test
koji testira hipoteze
3
H0 : postoji jedinični korijen
H1 : ne postoji jedinični korijen
Postojanje jediničnog korijena povlači da je niz nestacionaran i ima stohastički trend.

Međutim, odbacivanjem H0 ne tvrdimo stacionarnost jer proces može biti nestaci-
onaran i ako ne postoji jedinični korijen npr. zbog determinističkog trenda. Dakle
na neki način ovaj test nas upućuje na to je li potrebno diferencirati niz podataka
ili ne. Provedbom testa dobijemo p-vrijednost 0.5616 > 0.05 te stoga zaključu-
jemo da je zaista potrebno provesti diferenciranje. Kako se radi o financijskom nizu
podataka prvo ću podatke logaritmirati pa onda diferencirati, odnosno promatram
log-povrate. Prije analize povrata možemo ponovo provesti adf.Test kako bi vidjeli
je li potrebno dodatno diferencirati niz. Provedbom adf.testa dobijemo p-vrijednost
0.01 što znači da niz nije potrebno ponovo diferencirati.
2.2 Analiza log-povrata

Na sljedećim slikama prikazna je funkcija autokorelacija za log- povrate i grafički
prikaz log-povrata.
Slika 3: Grafički prikaz Log-povrata
Slika 4: Autokorelacijska funkcija log-povrata
Na slici 4 vidimo da su gotovo sve korelacije statički beznačajne. Tipično svojstvo

log-povrata je da korelacija izgleda kao kod bijelog šuma. Također, promotrimo
li sliku 3 uočavamo da sve vrijednosti variraju oko 0. Osim toga možemo uočiti
područja klasteriranja. Odnosno uvjetna varijanca uvjetno na prošlost mijenja se u
4
vremenu. Još jedno svojstvo log-povrata je da se funkcije autokorelacije kvadriranih
i apsolutnih log-povrata mijenjaju, odnosno postoje korelacije na većini koraka što
znači da nema nezavisnosti. Ovo svojstvo jasno možemo vidjeti na sljedećoj slici.
Slika 5: Autokorelacijska funkcija kvadriranih i aps.log-povrata
Promotrimo dalje distribuciju log-povrata.
Slika 6: Distribucija log-povrata
Jedno od tipičnih svojstava log-povrata, što možemo vidjeti i sa slike, jesu "teški
repovi" i izražen šiljak tj. gustoća je leptokurtična.
Definicija 1. Kažemo da slučajna varijabla X ima teške repove("heavy tailed") s
repnim indeksom α > 0 ako je
P (|X| > x) = L(x) · x−α ,
gdje je L sporo varirajuća funkcija, tj. L je funkcija sa svojstvom
L(tx)
lim = 1, ∀x > 0.
t→∞ L(t)
P (|X| > x) možemo shvatiti kao vjerojatnost ekstremnih događaja pa su kod

distribucija s teškim repovima realizacije ekstremnih vrijednosti vjerojatnije što je
ključno za modeliranje, odnosno kontrolu rizika. U nastavku ću navesti razloge
zašto smatram da bi upravo GARCH procesi bili najprikladniji za modeliranje ovih
podataka.
5
2.3 Identifikacija modela
Sva prethodno navedena svojstva log-povrata treba na neki način reproducirati sta-
tističkim modelom. Jasno je da klasični modeli poput ARIMA modela ne mogu
to napraviti na zadovoljavajući način. Budući da smo na slici 3 uočili područja
visoke i područja niske volatilnosti za početak možemo testirati postoji li uvjetna
heteroskedastičnost na podacima. Za testiranje koristimo McLeod-Li test koji je iz-
veden iz Ljung-Box testa, odnosno radi se o Ljung-Box testu temeljenom na analizi
koreliranosti kvadriranih podataka za različite korake. Hipoteze su sljedeće:
H0 : Ne postoji uvjetna heteroskedastičnost

H1 : Postoji uvjetna heteroskedastičnost
Slika 7: McLeod-Li test
Budući da su sve p-vrijednosti manje od 0.05 zaključujemo da postoji uvjetna

heteroskedastičnost što nije svojstvo klasičnih modela te iz tog razloga promatrani
niz ima smisla modelirati nekim GARCH procesom.
Definicija 2. Proces {Xt , t ∈ Z} je generalizirani autoregresivni uvjetno heteroske-

dastični proces GARCH (p,g) ako zadovoljava
Xt = σt · t , σt2 = α0 + α(B)Xt2 + β(B)σt2 (1)
gdje je t ∼ IID(0, 1) i nezavisan je od Xt−h . B je operator pomaka unazad, a α i

β su polinomi stupnja p, odnosno q
p q
X X
i
α(B) = αi B β(B) = βj B j
i=1 j=1
pri čemu je α1 > 0.

Za β(Z) = 0 dobivamo
σt2 = α0 + α(B)Xt2
i taj proces zovemo ARCH(p) proces.
6
α0
Lako se pokaže da je proces ARCH(1) ∼ W N (0, 1−α 1
). Budući da smo vidjeli
da korelacija log povrata izgleda kao kod bijelog šuma ovo je dodatni razlog za-
što za modeliranje koristiti upravo ove procese. Prije smo primijetili i rekli da su
jedno od svojstava log-povrata teški repovi, sljedeći teorem nam kaže da stohastički
mehanizam generiranja ARCH procesa generira teške repove.
Teorem 1. Neka je {Xt } ∼ ARCH(1) t.d t ∼ N (0, 1). Tada Xt ima distribuciju s
teškim repovima s indeksom K, gdje je K rješenje jednadžbe
(2α1 )n 1
√ · Γ(1 + ) = 1, n≥0
π 2
Ovo je još jedan od razloga zašto pri modeliranju ne bi bilo dobro koristiti ARMA
procese. Kod ARMA procesa kada uzmemo šum Gaussovski tada je i proces Ga-
ussovski. U prethodnom poglavlju ukazali smo na još jedno karakteristično svojstvo
log-povrata, a to je da su im kvadrati i apsolutne vrijednosti visoko korelirane dok
sami log-povrati nisu. GARCH procesi imitiraju ovu činjenicu. Promotrimo prvo
ARCH(1) proces
Xt = σt2 t , σt2 = α0 + α1 Xt−1
2
(2)
Ako u drugu jednadžbu s desne i lijeve strane dodamo Xt2 dobijemo Xt2 − α0 −
α1 Xt−1 = Xt2 − σt2 . Označimo Xt2 − α0 − α1 Xt−1 sa ηt . Ovako definirani proces
ηt = Xt2 − σt2 je bijeli šum. Uvrštavanjem izraza σt2 = Xt2 − ηt u jednadžbu (2)
dobivamo da je
Xt2 = α0 + α1 Xt−1
2
+ ηt
odnosno kvadrirani proces Xt2 je AR(1) proces. Funkcija autokorelacija za AR(1)
proces je ϕ(h) = α1h i sporo opada u 0 kada h → ∞ . Na isti način ako izraz
σt2 = Xt2 − ηt uvrstimo u jednadžbu (1) dobijemo sljedeće
max(p,q) q
X X
Xt2 = α0 + 2
(αi + βi )Xt−i + ηt + βj ηt−j
i=1 j=1
Ovaj proces je ARMA(max(p,q),q). Dakle ako promatramo GARCH(1,1) kva-

drirani proces Xt2 je ARMA(1, 1). Funkcija autokorelacija ovog procesa ϕ(h) =
ϕ(1)α1h−1 , pri čemu ϕ(1) ne ovisi o h, također sporo opada u 0.
7
2.4 Modeliranje
Zaključili smo da ćemo log – povrate modelirati s ARCH i GARCH modelima. Kako
bi odabrali optimalni ARCH ili GARCH model za početak promatramo sljedećih
nekoliko informacijskih kriterija
1. AIC (Akaike informacijski kriterij)
2. BIC (Bayesian informacijski kriterij)
3. QIC (Hannan-Quin informacijski kriterij)
4. SIC (Schwarz informacijski kriterij).
Za svaki od kriterije želim imati što manju vrijednost. Iz tog razloga napravila
sam tablicu prikazanu na sljedećoj slici.
Slika 8: Odabir najboljeg modela na temelju informacijskih kriterija
Prema ovim informacijskim kriterijima kao najbolji pokazali su se modeli GARCH(1,1),

GARCH(1,2), GARCH(1,3), GARCH(2,1), GARCH(2,2). Ono što sam dalje ana-
lizirala jesu reziduali, odnosno normalnost i nužan uvjet da bi model bio valjan,
nekoreliranost reziduala. Za testiranje koristimo sljedeće testove:
Shapiro Wilk test:

H0 : Podaci dolaze iz normalne distribucije.
H1 : Podaci ne dolaze iz normalne distribucije.
Ljung-Box test:
H0 : Podaci su nekorelirani.
H1 :Podaci su korelirani.
8
P-vrijednosti za standardizirane reziduale dobijemo koristeći funkciju GArchFit.
Dobivene p-vrijednosti prikazane su na sjedećoj slici.
Slika 9: Analiza reziduala
Možemo uočiti da Ljung-Box test prolazi u svim slučajevima, dok su sve p-

vrijednosti, Shapiro-Wilk testa, manje od 0.05, odnosno podaci nisu normalno dis-
tribuirani. Također, uočila sam da u procjeni parametara za procese GARCH(2,1)
i GARCH(2,2) koeficijent α2 nije statistički značajan (p-vrijednost = 1.0 u oba slu-
čaja). Jednako tako u procjeni parametara GARCH(1,2) procesa p-vrijednost za
koeficijent β2 iznosi 0.18892, dok su kod GARCH(1,3) procesa statistički beznačajni
koeficijenti β1 , β2 i β3 . Iz tog razloga i zbog ranije spomenutog svojstava "teških
repova" dalje sam odlučila promatrati GARCH(1,1) model sa Studentovim inovaci-
jama. Prvo što možemo pogledati jesu informacijski kriteriji ovog procesa.
Slika 10: Informacijski kriteriji modela sa Studentovim inovacijama
P-vrijednosti Ljung-Box testa i Shapiro testa prikazane su na slici 11.
Slika 11: P-vrijednosti
Ljung -Box test prolazi na svim lagovima, dok, naravno Shapiro-test ne prolazi.
Osim toga možemo vidjeti i p-vrijednosti Jarque-Bera testa o normalnosti i Lm Arch
testa koji testira sljedeće hipoteze:
H0 : Ne postoji ARCH efekt

H1 : Postoji ARCH efekt
U ovom slučaju na temelju LM ARCh test-a možemo zaključiti da ARCH efekt

ne postoji, odnosno kvadrati reziduala nisu korelirani.
9
Pogledajmo grafički:
Slika 12: Standardizirani reziduali
Slika 13: ACF standardiziranih reziduala i kvadriranih standardiziranih reziduala
Na Slici 12 možemo uočiti teške repove, dok Slika 13 ukazuje na nezavisnost.

Na sljedećoj slici prikazane su procijene koeficijenata modela.
Slika 14: Procjene koeficijenata
Možemo uočiti da je parametar shape (koji opisuje oblik funkcije distribucije)

statistički značajan, a razlog tome je to što smo uvjetovali promjenu distribucije
reziduala na studentovu. Konačno naš model GARCH(1,1) model sa studentovim
inovacijama izgleda ovako:
Xt = σt2 t , σt2 = 5.14 · 10−4 + 0.2047Xt−1

2 2
+ 0.748σt−1 .
10
3 PREDIKCIJA
Osim predikcije za proces Garch(1,1) sa studentovom distribucijom reziduala pri-
kazat ću i predikciju GARCH(1,1) modela s normalnom distribucijom reziduala.Za
predikciju koristim podatke koji nisu korišteni pri modeliranju (2017.1.1-2018.1.1)
Slika 15: Predikcija GARCH(1,1) model sa studentovom distribucijom reziduala
Slika 16: Predikcija GARCH(1,1) model s normalnom distribucijom reziduala
Možemo uočiti kako se na slici 15 svi podaci nalaze unutar interval pouzdanosti
dok u slučaju Garch(1,1) modela s normalnom distribucijom uočavamo da interval
pouzdanosti nije pokupio sve podatke. Unatoč tome smatram da i s drugim modelom
možemo biti zadovoljni. Bez obzira što se reziduali nisu pokazali kao normalno
distribuirani, predikcija ovog modela je dobra.
11
4 VAR-Value at Risk
Kao što sam već spomenula kod modeliranja financijskih podataka cilj nam je na neki
način kontrolirati rizik. Jedna od najvažnijih mjera rizika je Value-at Risk (VaR).
VaR je granica takva da je mogući gubitak do trenutka T manji od te granice s
vjerojatnošću 1 − α. Matematički, ako s Xt označimo gubitak (dobitak) do trenutka
t, tada je
P (Xt < V aR(α, t)) = 1 − α.
Drugim riječima, VaR nije ništa drugo nego 1 − α kvantil funkcije distribucije od
Xt . Procijenjeni VaR na osnovu modela GARCH(1,1) uz razinu α = 0.01 za jedan
dan unaprijed iznosi −0.0147156. Dakle, procjena je da je postoji vjerojatnost 0.01
da vrijednost log-povrata jedan dan unaprijed padne ispod −0.0147156, odnosno
Xt+1 Xt+1
0.01 = P (log( ) ≤ −0.0147) = P ( ≤ 0.98539) = P (Xt+1 ≤ 2137.15)
Xt Xt
Na sljedećoj slici prikazan je pouzdani interval za VaR uz razinu 0.01.
Slika 17: Pouzdani interval za VaR
Ono što možemo vidjeti je da u nekim trenucima log-povrati dodiruju granice

intervala, za očekivati je bilo da će se to dogoditi u 1% slučajeva, no u stvarnosti se
dogodilo u 2.9% slučajeva.
12
5 Zaključak
U radu smo koristili podatke o vrijednosti S&P 500 indeksa u razdoblju 01.01.2015.g
do 01.01.2018.g. S obzirom na to da se radi o financijskim podacima i budući da se
pokazala potreba za diferenciranjem modelirali smo log povrate. U radu su objaš-
njeni razlozi zašto smo kao model odlučili koristiti GARCH modele. Na temelju
raznih informacijskih kriterija kao najbolji među modelima pokazao se GARCH(1,1)
model. Analizom reziduala uočili smo da bi možda bilo bolje probati napraviti mo-
del sa studentovim inovacijama. Nakon toga napravili smo predikciju GARCH(1,1)
s normalnim i studentovim inovacijama. Nešto bolji pokazao se model sa studento-
vim inovacijama. Općenito cilj modeliranja financijskih podataka je procjene rizika
te smo iz tog razloga za kraj procijenili VAR na osnovu modela GARCH(1,1) s
normalnim inovacijama.
13
Popis slika
1 Grafički prikaz vremenskog niza . . . . . . . . . . . . . . . . . . . . . 3
2 Autokorelacijska funkcija . . . . . . . . . . . . . . . . . . . . . . . . . 3
3 Grafički prikaz Log-povrata . . . . . . . . . . . . . . . . . . . . . . . 4
4 Autokorelacijska funkcija log-povrata . . . . . . . . . . . . . . . . . . 4
5 Autokorelacijska funkcija kvadriranih i aps.log-povrata . . . . . . . . 5
6 Distribucija log-povrata . . . . . . . . . . . . . . . . . . . . . . . . . 5
7 McLeod-Li test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
8 Odabir najboljeg modela na temelju informacijskih kriterija . . . . . 8
9 Analiza reziduala . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
10 Informacijski kriteriji modela sa Studentovim inovacijama . . . . . . . 9
11 P-vrijednosti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
12 Standardizirani reziduali . . . . . . . . . . . . . . . . . . . . . . . . . 10
13 ACF standardiziranih reziduala i kvadriranih standardiziranih rezi-
duala . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
14 Procjene koeficijenata . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
15 Predikcija GARCH(1,1) model sa studentovom distribucijom reziduala 11
16 Predikcija GARCH(1,1) model s normalnom distribucijom reziduala . 11
17 Pouzdani interval za VaR . . . . . . . . . . . . . . . . . . . . . . . . . 12
Popis tablica
1 Osnovne informacije o podacima . . . . . . . . . . . . . . . . . . . . . 3
Literatura
[1] Jonathan D.Cryer, Kung.Sik Chan Time Series Analysis With applications in
R , Springer, 2008.
[2] http://shishirshakya.blogspot.hr/
[3] https://www.mathos.unios.hr/index.php/nastava/
financijska-matematika-i-statistika/253

Modeliranje Log-Povrata S&P 500 Indeksa

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Modeliranje Log-Povrata S&P 500 Indeksa

Uploaded by

Copyright:

Available Formats

Sveučilište Josipa Jurja Strossmayera u Osijeku

Diplomski studij matematike

MODELIRANJE LOG-POVRATA S&P 500

Kolegij: Analiza vremenskih nizova

2 IDENTIFIKACIJA I DIJAGNOSTIKA MODELA 3

Minimum Donji kvartil Medijan Prosjek Gornji kvartil Maksimum

Tablica 1: Osnovne informacije o podacima

Slika 1: Grafički prikaz vremenskog niza

Slika 2: Autokorelacijska funkcija

Postojanje jediničnog korijena povlači da je niz nestacionaran i ima stohastički trend.

2.2 Analiza log-povrata

Slika 3: Grafički prikaz Log-povrata

Slika 4: Autokorelacijska funkcija log-povrata

Na slici 4 vidimo da su gotovo sve korelacije statički beznačajne. Tipično svojstvo

Slika 5: Autokorelacijska funkcija kvadriranih i aps.log-povrata

Promotrimo dalje distribuciju log-povrata.

Slika 6: Distribucija log-povrata

P (|X| > x) možemo shvatiti kao vjerojatnost ekstremnih događaja pa su kod

H0 : Ne postoji uvjetna heteroskedastičnost

Slika 7: McLeod-Li test

Budući da su sve p-vrijednosti manje od 0.05 zaključujemo da postoji uvjetna

Definicija 2. Proces {Xt , t ∈ Z} je generalizirani autoregresivni uvjetno heteroske-

Xt = σt · t , σt2 = α0 + α(B)Xt2 + β(B)σt2 (1)

gdje je t ∼ IID(0, 1) i nezavisan je od Xt−h . B je operator pomaka unazad, a α i

pri čemu je α1 > 0.

i taj proces zovemo ARCH(p) proces.

Ovaj proces je ARMA(max(p,q),q). Dakle ako promatramo GARCH(1,1) kva-

1. AIC (Akaike informacijski kriterij)

2. BIC (Bayesian informacijski kriterij)

3. QIC (Hannan-Quin informacijski kriterij)

4. SIC (Schwarz informacijski kriterij).

Slika 8: Odabir najboljeg modela na temelju informacijskih kriterija

Prema ovim informacijskim kriterijima kao najbolji pokazali su se modeli GARCH(1,1),

Shapiro Wilk test:

Slika 9: Analiza reziduala

Možemo uočiti da Ljung-Box test prolazi u svim slučajevima, dok su sve p-

Slika 10: Informacijski kriteriji modela sa Studentovim inovacijama

P-vrijednosti Ljung-Box testa i Shapiro testa prikazane su na slici 11.

Slika 11: P-vrijednosti

H0 : Ne postoji ARCH efekt

U ovom slučaju na temelju LM ARCh test-a možemo zaključiti da ARCH efekt

Slika 12: Standardizirani reziduali

Slika 13: ACF standardiziranih reziduala i kvadriranih standardiziranih reziduala

Na Slici 12 možemo uočiti teške repove, dok Slika 13 ukazuje na nezavisnost.

Slika 14: Procjene koeficijenata

Možemo uočiti da je parametar shape (koji opisuje oblik funkcije distribucije)

Xt = σt2 t , σt2 = 5.14 · 10−4 + 0.2047Xt−1

Slika 15: Predikcija GARCH(1,1) model sa studentovom distribucijom reziduala

Slika 16: Predikcija GARCH(1,1) model s normalnom distribucijom reziduala

Slika 17: Pouzdani interval za VaR

Ono što možemo vidjeti je da u nekim trenucima log-povrati dodiruju granice

You might also like

Xt = σt · t , σt2 = α0 + α(B)Xt2 + β(B)σt2 (1)

gdje je t ∼ IID(0, 1) i nezavisan je od Xt−h . B je operator pomaka unazad, a α i

Xt = σt2 t , σt2 = 5.14 · 10−4 + 0.2047Xt−1