Professional Documents
Culture Documents
Modeliranje Log-Povrata S&P 500 Indeksa
Modeliranje Log-Povrata S&P 500 Indeksa
Barbara Rački
Osijek, 2018.
Sadržaj
1 Uvod 2
3 PREDIKCIJA 11
4 VAR-Value at Risk 12
5 Zaključak 13
1 Uvod
U ovom radu koristiti ću podatke o burzovnom indeksu S&P 500 u periodu od 1.
siječnja 2015. do 1. siječnja 2018. godine. S&P 500 je burzovni indeks koji sadrži
dionice 500 korporacija uglavnom iz Sjedinjenih Američkih Država. Uveden je 1957.
godine, a održava ga i kreira američka tvrtka za financijske usluge i izvještavanje
Standard & Poor’s. Sve dionice koje su uključene u indeks su dionice velikih, javnih
kompanija a trguju se na svim većim američkim burzama kao npr. Njujorškoj burzi
i NASDAQ. Poslije Dow Jones-a, S&P 500 je najviše praćeni indeks velike tržišne
kapitalizacije u SAD. Smatra se da je on "zvijezda vodilja" američke ekonomije.
Često se obilježava simbolom GSPC ili SPX. Budući da se u ovom seminarskom radu
radi o financijskim podacima glavni cilj modeliranja je predvidjeti buduće kretanje
i na taj način pokušati kontrolirati rizik. Iako nisu česti, ekstremni slučajevi, poput
velikog pada dionica, izazivaju najveće gubitke i iz tog razloga u ovom seminaru
pokušati ću podatke modelirati GARCH procesom.
Podatke o vrijednostima burzovnog indeksa moguće je pronaći na sljedećem
linku: https://finance.yahoo.com/quote/%5EGSPC/history?period1=1420066800&
period2=1514761200&interval=1d&filter=history&frequency=1d
2
2 IDENTIFIKACIJA I DIJAGNOSTIKA MODELA
2.1 Osnovna analiza podataka
Prilikom modeliranja koristiti ćemo podatke u razdoblju od 1. siječnja 2015. godine
do 1. siječnja 2017.godine. Preostale podatke (1.1.2017. - 1.1.2018.) koristiti ćemo
u svrhu predviđanja. Za početka možemo promotriti numeričke karakteristike i
grafički prikaz podataka kroz vrijeme.
Uočavamo kako je raspon vrijednosti indeksa između 1829 i 2690. Medijan po-
dataka iznosi 2124 dok je prosječna vrijednost 2201.
Iz samog izgleda grafa vremenskog niza može se naslutiti da niz nije stacionaran.
Uočavamo blagi trend rasta. Potvrdu nestacionarnosti možemo tražiti i u grafičkom
prikazu autokorelacijske funkcije (korelogramu).
Autokorelacijska funkcija sporo pada u 0 što potvrđuje sumnju da niz nije sta-
cionaran. Za konačnu potvrdu koristimo Augmented DickeyFuller Unit Root test
koji testira hipoteze
3
H0 : postoji jedinični korijen
H1 : ne postoji jedinični korijen
4
vremenu. Još jedno svojstvo log-povrata je da se funkcije autokorelacije kvadriranih
i apsolutnih log-povrata mijenjaju, odnosno postoje korelacije na većini koraka što
znači da nema nezavisnosti. Ovo svojstvo jasno možemo vidjeti na sljedećoj slici.
Jedno od tipičnih svojstava log-povrata, što možemo vidjeti i sa slike, jesu "teški
repovi" i izražen šiljak tj. gustoća je leptokurtična.
Definicija 1. Kažemo da slučajna varijabla X ima teške repove("heavy tailed") s
repnim indeksom α > 0 ako je
P (|X| > x) = L(x) · x−α ,
gdje je L sporo varirajuća funkcija, tj. L je funkcija sa svojstvom
L(tx)
lim = 1, ∀x > 0.
t→∞ L(t)
5
2.3 Identifikacija modela
Sva prethodno navedena svojstva log-povrata treba na neki način reproducirati sta-
tističkim modelom. Jasno je da klasični modeli poput ARIMA modela ne mogu
to napraviti na zadovoljavajući način. Budući da smo na slici 3 uočili područja
visoke i područja niske volatilnosti za početak možemo testirati postoji li uvjetna
heteroskedastičnost na podacima. Za testiranje koristimo McLeod-Li test koji je iz-
veden iz Ljung-Box testa, odnosno radi se o Ljung-Box testu temeljenom na analizi
koreliranosti kvadriranih podataka za različite korake. Hipoteze su sljedeće:
σt2 = α0 + α(B)Xt2
6
α0
Lako se pokaže da je proces ARCH(1) ∼ W N (0, 1−α 1
). Budući da smo vidjeli
da korelacija log povrata izgleda kao kod bijelog šuma ovo je dodatni razlog za-
što za modeliranje koristiti upravo ove procese. Prije smo primijetili i rekli da su
jedno od svojstava log-povrata teški repovi, sljedeći teorem nam kaže da stohastički
mehanizam generiranja ARCH procesa generira teške repove.
Teorem 1. Neka je {Xt } ∼ ARCH(1) t.d t ∼ N (0, 1). Tada Xt ima distribuciju s
teškim repovima s indeksom K, gdje je K rješenje jednadžbe
(2α1 )n 1
√ · Γ(1 + ) = 1, n≥0
π 2
Ovo je još jedan od razloga zašto pri modeliranju ne bi bilo dobro koristiti ARMA
procese. Kod ARMA procesa kada uzmemo šum Gaussovski tada je i proces Ga-
ussovski. U prethodnom poglavlju ukazali smo na još jedno karakteristično svojstvo
log-povrata, a to je da su im kvadrati i apsolutne vrijednosti visoko korelirane dok
sami log-povrati nisu. GARCH procesi imitiraju ovu činjenicu. Promotrimo prvo
ARCH(1) proces
Xt = σt2 t , σt2 = α0 + α1 Xt−1
2
(2)
Ako u drugu jednadžbu s desne i lijeve strane dodamo Xt2 dobijemo Xt2 − α0 −
α1 Xt−1 = Xt2 − σt2 . Označimo Xt2 − α0 − α1 Xt−1 sa ηt . Ovako definirani proces
ηt = Xt2 − σt2 je bijeli šum. Uvrštavanjem izraza σt2 = Xt2 − ηt u jednadžbu (2)
dobivamo da je
Xt2 = α0 + α1 Xt−1
2
+ ηt
odnosno kvadrirani proces Xt2 je AR(1) proces. Funkcija autokorelacija za AR(1)
proces je ϕ(h) = α1h i sporo opada u 0 kada h → ∞ . Na isti način ako izraz
σt2 = Xt2 − ηt uvrstimo u jednadžbu (1) dobijemo sljedeće
max(p,q) q
X X
Xt2 = α0 + 2
(αi + βi )Xt−i + ηt + βj ηt−j
i=1 j=1
7
2.4 Modeliranje
Zaključili smo da ćemo log – povrate modelirati s ARCH i GARCH modelima. Kako
bi odabrali optimalni ARCH ili GARCH model za početak promatramo sljedećih
nekoliko informacijskih kriterija
Za svaki od kriterije želim imati što manju vrijednost. Iz tog razloga napravila
sam tablicu prikazanu na sljedećoj slici.
Ljung-Box test:
H0 : Podaci su nekorelirani.
H1 :Podaci su korelirani.
8
P-vrijednosti za standardizirane reziduale dobijemo koristeći funkciju GArchFit.
Dobivene p-vrijednosti prikazane su na sjedećoj slici.
Ljung -Box test prolazi na svim lagovima, dok, naravno Shapiro-test ne prolazi.
Osim toga možemo vidjeti i p-vrijednosti Jarque-Bera testa o normalnosti i Lm Arch
testa koji testira sljedeće hipoteze:
9
Pogledajmo grafički:
10
3 PREDIKCIJA
Osim predikcije za proces Garch(1,1) sa studentovom distribucijom reziduala pri-
kazat ću i predikciju GARCH(1,1) modela s normalnom distribucijom reziduala.Za
predikciju koristim podatke koji nisu korišteni pri modeliranju (2017.1.1-2018.1.1)
Možemo uočiti kako se na slici 15 svi podaci nalaze unutar interval pouzdanosti
dok u slučaju Garch(1,1) modela s normalnom distribucijom uočavamo da interval
pouzdanosti nije pokupio sve podatke. Unatoč tome smatram da i s drugim modelom
možemo biti zadovoljni. Bez obzira što se reziduali nisu pokazali kao normalno
distribuirani, predikcija ovog modela je dobra.
11
4 VAR-Value at Risk
Kao što sam već spomenula kod modeliranja financijskih podataka cilj nam je na neki
način kontrolirati rizik. Jedna od najvažnijih mjera rizika je Value-at Risk (VaR).
VaR je granica takva da je mogući gubitak do trenutka T manji od te granice s
vjerojatnošću 1 − α. Matematički, ako s Xt označimo gubitak (dobitak) do trenutka
t, tada je
P (Xt < V aR(α, t)) = 1 − α.
Drugim riječima, VaR nije ništa drugo nego 1 − α kvantil funkcije distribucije od
Xt . Procijenjeni VaR na osnovu modela GARCH(1,1) uz razinu α = 0.01 za jedan
dan unaprijed iznosi −0.0147156. Dakle, procjena je da je postoji vjerojatnost 0.01
da vrijednost log-povrata jedan dan unaprijed padne ispod −0.0147156, odnosno
Xt+1 Xt+1
0.01 = P (log( ) ≤ −0.0147) = P ( ≤ 0.98539) = P (Xt+1 ≤ 2137.15)
Xt Xt
Na sljedećoj slici prikazan je pouzdani interval za VaR uz razinu 0.01.
12
5 Zaključak
U radu smo koristili podatke o vrijednosti S&P 500 indeksa u razdoblju 01.01.2015.g
do 01.01.2018.g. S obzirom na to da se radi o financijskim podacima i budući da se
pokazala potreba za diferenciranjem modelirali smo log povrate. U radu su objaš-
njeni razlozi zašto smo kao model odlučili koristiti GARCH modele. Na temelju
raznih informacijskih kriterija kao najbolji među modelima pokazao se GARCH(1,1)
model. Analizom reziduala uočili smo da bi možda bilo bolje probati napraviti mo-
del sa studentovim inovacijama. Nakon toga napravili smo predikciju GARCH(1,1)
s normalnim i studentovim inovacijama. Nešto bolji pokazao se model sa studento-
vim inovacijama. Općenito cilj modeliranja financijskih podataka je procjene rizika
te smo iz tog razloga za kraj procijenili VAR na osnovu modela GARCH(1,1) s
normalnim inovacijama.
13
Popis slika
1 Grafički prikaz vremenskog niza . . . . . . . . . . . . . . . . . . . . . 3
2 Autokorelacijska funkcija . . . . . . . . . . . . . . . . . . . . . . . . . 3
3 Grafički prikaz Log-povrata . . . . . . . . . . . . . . . . . . . . . . . 4
4 Autokorelacijska funkcija log-povrata . . . . . . . . . . . . . . . . . . 4
5 Autokorelacijska funkcija kvadriranih i aps.log-povrata . . . . . . . . 5
6 Distribucija log-povrata . . . . . . . . . . . . . . . . . . . . . . . . . 5
7 McLeod-Li test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
8 Odabir najboljeg modela na temelju informacijskih kriterija . . . . . 8
9 Analiza reziduala . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
10 Informacijski kriteriji modela sa Studentovim inovacijama . . . . . . . 9
11 P-vrijednosti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
12 Standardizirani reziduali . . . . . . . . . . . . . . . . . . . . . . . . . 10
13 ACF standardiziranih reziduala i kvadriranih standardiziranih rezi-
duala . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
14 Procjene koeficijenata . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
15 Predikcija GARCH(1,1) model sa studentovom distribucijom reziduala 11
16 Predikcija GARCH(1,1) model s normalnom distribucijom reziduala . 11
17 Pouzdani interval za VaR . . . . . . . . . . . . . . . . . . . . . . . . . 12
Popis tablica
1 Osnovne informacije o podacima . . . . . . . . . . . . . . . . . . . . . 3
Literatura
[1] Jonathan D.Cryer, Kung.Sik Chan Time Series Analysis With applications in
R , Springer, 2008.
[2] http://shishirshakya.blogspot.hr/
[3] https://www.mathos.unios.hr/index.php/nastava/
financijska-matematika-i-statistika/253