Prognozowanie I Symulacje - Archiwum - Małgorzata Radziukiewicz - Analiza Szeregów Czasowych

You might also like

Download as ppt, pdf, or txt
Download as ppt, pdf, or txt
You are on page 1of 27

Analiza szeregów czasowych

dr Małgorzata Radziukiewicz
Szereg czasowy

 Szereg czasowy (chronologiczny)

zbiór wartości badanej cechy lub wartości


określonego zjawiska zaobserwowanych w
różnych momentach (przedziałach) czasu
uporządkowany chronologicznie
Przykłady szeregów czasowych

 Szeregi czasowe dotyczące zjawisk społeczno-


ekonomicznych
 - nakład książek i broszur w latach 1990-1997 (w mln egz.);
 - wartość produkcji w pewnym przedsiębiorstwie w latach 1993 – 2002 (w
mld zł.);
 - produkcja energii elektrycznej w latach (w mln kWh);
 - skup mleka w woj. poznańskim w latach 1989 -1995(w mln litrów);
 - liczba zawartych małżeństw w Polsce w latach 1989 – 1993 (w tys.) itp..
Szeregi czasowe

 Szeregi czasowe
Dłuośc linii kolejowych w Polsce w latach 1990-2004
dotyczące zjawisk społeczno-
ekonomicznych można 9

przedstawić w formie graficznej 8

– elementy szeregu 7

prezentowane są przez punkty

tys. km
6
płaszczyzny o współrzędnych 5
(t,y), które łączy się odcinkami 4
linii prostej
3 1990

1991

1992

1993

1994

1995

1996

1997

1998

1999

2000

2001

2002

2003

2004
lata
nakład książek i broszur w latach 1990-1997 (w mln egz.)

 W badanym 8-elementowym Nakład książek i broszur w latach 1990-1997


szeregu czasowym występuje
200
składowa systematyczna w postaci wartości rzeczywiste
180
trendu oraz wahania przypadkowe.
160

w mln egzemplarzy
140
 Ocena wzrokowa wykresu 120
wskazuje, ze do opisu przebiegu 100
zmiennej można wykorzystać 80
funkcję liniową 60
1990 1991 1992 1993 1994 1995 1996 1997
nakład książek i broszur w latach 1990-1997 (w mln egz.)

 Parametry modelu liniowego


oszacowano MNK. Obliczenia
związane z szacowaniem Nakład książek i broszur w latach 1990-1997
parametrów linii trendu, 200 wartości rzeczywiste
wyznaczeniem miar 180
wartości teoretyczne

„dobroci”dopasowania, prognozy 160


punktowej i prognozy

w mln egzemplarzy
140
przedziałowej, błędów prognoz
120
zawarte są w prezentacji pt.
100
”Szeregi czasowe”.
80
 Wartości rzeczywiste i teoretyczne
60
zmiennej przedstawia rysunek obok. 1990 1991 1992 1993 1994 1995 1996 1997
wartość produkcji w pewnym przedsiębiorstwie w latach 1993 – 2002 (w mld zł.)

 Ocena wzrokowa wykresu wskazuje, ze wartość produkcji w latach 1993-2002 (w mld zł)
w badanym szeregu czasowym
30
występuje składowa systematyczna w
26,4
postaci trendu rosnącego oraz wahania 25

przypadkowe. 20 21

mld zł
16,1 15,5
 Wzrost wartości zmiennej jest jednak 15

coraz szybszy. W takim przypadku 10 11


7,6
możemy zastosować funkcję o rosnącym 5 4,5 4,1 5
3,5
tempie wzrostu, np. funkcję wykładniczą. 0
 Wykładniczą funkcję trendu sprowadza 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002

się do postaci liniowej przez


logarytmowanie, a następnie szacuje się 60
jej parametry za pomocą MNK – zob. 50
produkcja prognoza 53,3
prezentację pt. ”Wykładniczy model
42,1
trendu”. 40
33,2
 Wykresy przedstawiają wartości 30
mld zł

rzeczywiste, teoretyczne i prognozy 26,2


20 20,7
zmiennej 16,4
12,9
10 10,2
6,4 8,1
3,1 4,0 5,0
0
zużycie energii elektrycznej w firmie latach 2005 - 2007(w mln kWh)

 Analiza wzrokowa wykresu


Kwartalne zużycie energii elektrycznej w latach 2005-2007
wartości zmiennej prognozowanej
wskazuje, że zużycie energii w 5,5
firmie cechuje się liniową tendencją 5
rozwojową oraz wahaniami 4,5

sezonowymi. 4
3,5
 Zadanie: 3
wyznaczyć prognozy zużycia 2,5
energii na następne dwa kwartały 2
2008 roku. 1 2 3 4 5 6 7 8 9 10 11 12

2005 2006 2007

rok 2005 2006 2007


kw. I II II IV I II II IV I II III IV
Y 2,8 3,7 3,0 4,6 3,0 4,2 3,5 5,0 3,5 4,7 4,0 5,3
Analiza szeregów czasowych

 Poziom zjawiska gospodarczego, które


odzwierciedla szereg czasowy, wykazuje
różnego rodzaju zmiany:
 zmiany określające pewien ogólny kierunek
(tendencję rozwojową) czyli tzw. trend; Produkcja energii elektrycznej w Polsce w latach 1991-1994 (w mln kWh)
 wahania cykliczne, czyli koniunkturalne
(wahania o kresie dłuższym niż rok, które z 15000
grubsza odpowiadają cyklom
14000
koniunkturalnym);
 wahania sezonowe powtarzające się 13000
periodycznie w pewnych określonych porach 12000
każdego roku lub miesiąca;
 wahania nieregularne (które trudno 11000
zanalizować i ująć w pewien określony 10000
schemat):
 wahania katastrofalne spowodowane 9000
przez zdarzenia historyczne (wojna, 8000
katastrofy żywiołowe, epidemie); 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46

 wahania przypadkowe będące miesiące


wynikiem działania wielkiej liczby
przyczyn ubocznych.
Analiza szeregów czasowych

 Rys.1. Składowe szeregu czasowego


Yt wahania cykliczne

wahania sezonowe

trend

wahania przypadkowe

czas
Analiza szeregów czasowych

 Każdą obserwację szeregu czasowego możemy więc rozłożyć na trzy


składniki lub czynniki:
- trend (T);
- sezonowość (S);
- składnik przypadkowy (U).

 Charakter powiązań między trendem, sezonowością i zmiennością losową w


szeregach:
 - powiązania addytywne:

yt = Tt + S t + U t (1)
 - i multiplikatywne:

yt = Tt  S t  U t ( 2)
 gdzie:
 yt - obserwacje szeregu czasowego
 Tt - trend i wahania cykliczne
 St - sezonowość
 Ut - zmienność o charakterze losowym (czynnik przypadkowy).
 Subskrypt t oznacza, że analizujemy zachowanie się zjawiska w czasie.
Analiza szeregów czasowych

 Analiza statystyczna może dotyczyć wszystkich składników szeregu czasowego.


 Zwykle dąży się do wyodrębnienia poszczególnych składników szeregu
czasowego i pomiaru ich wielkości – dlatego analizę szeregu czasowego określa
się jako jego „dekompozycję”.
 W celu „dekompozycji” szeregu stosuje się wiele różnych metod statystycznych.
 Wyznaczenie z szeregu trendu jest najprostsze.
 Zadanie wyznaczenia trendu – funkcji f(t) – jest nazywane wygładzaniem
(wyrównywaniem) szeregu czasowego.
 Możemy tego dokonać stosując jedną z dwóch metod:
 - metodę analityczną (modelowanie rozwoju zjawiska z uwzględnieniem analizy
regresji – określamy postać funkcji charakteryzującą tendencję rozwojową
szeregu i wyznaczamy jej parametry);
 - metodę mechaniczną.
Analiza szeregów czasowych

 Metoda analitycznego wyrównywania szeregów polega na założeniu, że jego


tendencję rozwojową (trend) da się przedstawić na wykresie za pomocą pewnej
linii matematycznej np. prostej, krzywej wykładniczej itp. o określonym wzorze
analitycznym.

 Metoda analitycznego wyrównania opiera się na dwóch rodzajach dowolnie


przyjętych założeń:
 krzywa, którą uważa się za najlepsze wyrównanie szeregu ma określony z góry
charakter analityczny;
 mogą istnieć różne kryteria, na podstawie których ocenia się "najlepsze dopasowanie
krzywej" do wykresu danego szeregu.

 Jeżeli oba założenia zostaną ustalone, poszukiwana krzywa jest określona


jednoznacznie i wyznaczenie jej analitycznego wzoru jest tylko sprawą
rachunkową.
 Po wyborze postaci funkcji trendu i oszacowaniu jej parametrów, dokonuje się
oceny jakości otrzymanego modelu.
 Model wykorzystujemy do sporządzania prognoz.
Analiza szeregów czasowych

 Przyszłą wartość zmiennej Y uzyskuje się przez ekstrapolację funkcji


trendu tj. przez podstawienie do modelu w miejsce zmiennej czasowej
numeru momentu lub okresu T, na który wyznaczamy prognozę:

YTP  f (T ) dla T  n
zużycie energii elektrycznej w firmie latach 2005 - 2007(w mln kWh)

 Rozważamy przypadek, gdy w


szeregu czasowym występują Kwartalne zużycie energii elektrycznej w latach 2005-2007
wahania sezonowe.
5,5
 Odpowiedni model musi więc
5
zawierać parametry i zmienne
4,5
charakteryzujące te wahania w
4
poszczególnych fazach tego cyklu. 3,5
 Dla uproszczenia rozważań i zapisu 3
rozpatrujemy zjawisko o rocznym 2,5
cyklu wahań z kwartałami jako 2
1 2 3 4 5 6 7 8 9 10 11 12
fazami tego cyklu.
2005 2006 2007
zużycie energii elektrycznej w firmie latach 2005 - 2007(w mln kWh)

Kwartalne zużycie energii elek trycznej w latach 2005-2007

5,5
5
4,5
4
3,5
3
2,5
2
1 2 3 4 5 6 7 8 9 10 11 12
2005 2006 2007

 Zakładając, że funkcja trendu jest liniowa a wahania okresowe


(kwartalne) nakładają się na tendencję rozwojową w sposób addytywny
sformułujemy model następująco:

Y t =  +   t   1 X t ,1   2 X t , 2   3 X t ,3   4 X t , 4  t (1)
 gdzie:
Xt,i (i=1,2,3,4; t=1,2,3…,n) są zmiennymi zero-jedynkowymi reprezentującymi poszczególne
fazy cyklu
zużycie energii elektrycznej w firmie latach 2005 - 2007(w mln kWh)

 Zmienne zero-jedynkowe:

1 dla obserwacji i  tego kw.


X t ,i  { ( 2)
0 dla obserwacji poz. kw.

 Parametry stojące przy zmiennych zero-jedynkowych (λi) charakteryzują


absolutną wielkość wahań okresowych w poszczególnych kwartałach.
 Założenia dotyczące składnika losowego εt są takie same jak w modelu
nie uwzględniającym wahań okresowych.
zużycie energii elektrycznej w firmie latach 2005 - 2007(w mln kWh)

 Kolumny macierzy X są liniowo


zależne
1 1 1 0 0 0
1 2 0 1 0 0
 
1 3 0 0 1 0
 
1 4 0 0 0 1
1 5 1 0 0 0
 
1 6 0 1 0 0
X   (3)
1 7 0 0 1 0
 
1 8 0 0 0 1
1 9 1 0 0 0
 
1 10 0 1 0 0
1 11 0 0 1 0
 

1 12 0 0 0 1

zużycie energii elektrycznej w firmie latach 2005 - 2007(w mln kWh)

 W modelu należy jedną spośród zmiennych przedstawić jako kombinację


pozostałych (oznacza to eliminację tej zmiennej).
 Zastąpimy zmienną Xt,1 przez kombinację liniową otrzymaną z
zależności:

X t ,i
1 (4) czyli

X t ,1  1  X t , 2  X t ,3  X t , 4 (5)
zużycie energii elektrycznej w firmie latach 2005 - 2007(w mln kWh)

 W wyniku podstawienia model (1) przyjmie następującą postać:

Y t =  +   t   1[1  X t , 2  X t ,3  X t , 4 ]   2 X t , 2   3 X t ,3   4 X t , 4   t ( 6)

Y t = ( +  1 )    t  ( 2   1 ) X t , 2  ( 3   1 ) X t ,3  ( 4   1 ) X t , 4  t (7 )
zużycie energii elektrycznej w firmie latach 2005 - 2007(w mln kWh)

 Model tendencji rozwojowej z liniową funkcją


trendu oraz wahaniami sezonowymi przyjmie
zatem postać:
Y t = ( +  1 )    t  ( 2   1 ) X t , 2  ( 3   1 ) X t ,3  ( 4   1 ) X t , 4  t (7 )

 gdzie : yt – poziom zjawiska w okresie t,


( +  1 ) - stała,
 - parametr przy zmiennej czasowej,
( i   1 ) - parametr przy zmiennej Xt,i
εt – składnik losowy dla okresu t
zużycie energii elektrycznej w firmie latach 2005 - 2007(w mln kWh)

 Przyjmując odnośnie do rozkładu εt takie same założenia jak w klasycznym


modelu regresji, uzyskujemy podstawę do szacowania parametrów funkcji trendu
za pomocą MNK.
 dane niezbędne do obliczeń:
X – macierz wartości zmiennych objaśniających (kolumny są liniowo niezależne)
Y- wektor zaobserwowanych wartości zmiennej Y

1 1 0 0 0  2,8 
1 2 1 0 0 3,7 
   
1 3 0 1 0  3,0 
   
1 4 0 0 1
 4,6
1 5 0 0 0  3,0 
   
1 6 1 0 0
X   4,2
Y  
1 7 0 1 0  3,5 
   
1 8 0 0 1
5,0 
1 9 0 0 0  3,5 
   
1 10 1 0 0 4,7 
1 11 0 1 0  4,0
   

1 12 0 0 1
  5,3 
zużycie energii elektrycznej w firmie latach 2005 - 2007(w mln kWh)
 wektor ocen parametrów modelu trendu z wahaniami sezonowymi

   1  2,569
    0,106 
   
~
a   2   1   0,994 (8)
   
 
 3 1  0,187 
 4   1  1,548 

 obliczamy ze wzoru:

a~  ( X T X ) 1 X T y (9)
zużycie energii elektrycznej w firmie latach 2005 - 2007(w mln kWh)

 Wybrane wyniki (obliczenia w Excel) wskazują, iż model jest dobrze dopasowany


do danych empirycznych (parametry strukturalne są statystycznie istotne,
współczynniki φ2 i V przyjmują wartości bardzo małe):

PODSUMOWANIE - WYJŚCIE

Statystyki regresji
Wielokrotność R 0,995918125
R kwadrat 0,991852912
Dopasowany R kwadrat 0,987197433
Błąd standardowy 0,093859064
Obserwacje 12

ANALIZA WARIANCJI
df SS MS
Regresja 4 7,5075 1,876875
Resztkowy 7 0,061666667 0,008809524
Razem 11 7,569166667

Współczynniki Błąd standardowy t Stat


Przecięcie 2,56875 0,068243081 37,6411788
t 0,10625 0,008296048 12,80730366
z2 0,99375 0,077083333 12,89189189
z3 0,1875 0,078411182 2,39124057
z4 1,547916667 0,080575651 19,21072495
zużycie energii elektrycznej w firmie latach 2005 - 2007(w mln kWh)
 Model zużycia energii elektrycznej w firmie jest postaci:

Yˆ t = 2,569  0,106 t  0,994 X t , 2  0,187 X t ,3  1,548 X t , 4 ( R 2  0,992)


( 0 , 068) ( 0 , 008) ( 0 , 077) ( 0 , 078) ( 0 , 080)

 interpretacja:
 2,569 – jest oceną wyrazu wolnego modelu (7) na który składa się wyraz wolny i odchylenie
okresowe dla I kwartału z modelu w postaci wyjściowej (5);
 0,106 – ocena współczynnika trendu, wyraża tendencję rozwojową zużycia energii
elektrycznej i jest interpretowany jako średni kwartalny wzrost zużycia energii w firmie (w mln
kWh) w latach 2005-2007;
 0,994- ocena parametru stojącego przy zmiennej X t,2 reprezentuje odchylenie sezonowe
zużycia energii dla II kwartału w porównaniu z I kwartałem. Oznacza, że z tytułu wahań
sezonowych zużycie energii w firmie w II kwartale każdego roku jest wyższe o 0,994 mln kWh
od zużycia w I kwartale;
 Podobnie (jak ocenę parametru stojącego przy zmiennej X t,2 ) interpretuje się oceny 0,187 i
1,548 parametrów przy Xt,3 oraz Xt,4 .
zużycie energii elektrycznej w firmie latach 2005 - 2007(w mln kWh)

 Prognoza zużycia energii w firmie:

 w I kwartale 2008 roku


Y13P = 2,569  0,106  13  0,994  0  0,187  0  1,548  0
Y13P  3,947

 w II kwartale 2008 roku


Y14P = 2,569  0,106  14  0,994  1  0,187  0  1,548  0
Y14P  5,047
zużycie energii elektrycznej w firmie latach 2005 - 2007(w mln kWh)

Kwartalne zużycie energii elektrycznej w firmie w latach 2005-2007


(w mln kWh) i prognoza na I i II kwartał 2008 roku

6,00
5,50
5,00
4,50
4,00
3,50
3,00
prognoza
2,50
zużycie energii
2,00
1 2 3 4 1 2 3 4 1 2 3 4 1 2
2005 2006 2007 2008

You might also like