Prognozowanie I Symulacje - Archiwum - Małgorzata Radziukiewicz - Analiza Szeregów Czasowych

Analiza szeregów czasowych
dr Małgorzata Radziukiewicz
Szereg czasowy
 Szereg czasowy (chronologiczny)
zbiór wartości badanej cechy lub wartości

określonego zjawiska zaobserwowanych w
różnych momentach (przedziałach) czasu
uporządkowany chronologicznie
Przykłady szeregów czasowych
 Szeregi czasowe dotyczące zjawisk społeczno-

ekonomicznych
 - nakład książek i broszur w latach 1990-1997 (w mln egz.);
 - wartość produkcji w pewnym przedsiębiorstwie w latach 1993 – 2002 (w
mld zł.);
 - produkcja energii elektrycznej w latach (w mln kWh);
 - skup mleka w woj. poznańskim w latach 1989 -1995(w mln litrów);
 - liczba zawartych małżeństw w Polsce w latach 1989 – 1993 (w tys.) itp..
Szeregi czasowe
 Szeregi czasowe
Dłuośc linii kolejowych w Polsce w latach 1990-2004
dotyczące zjawisk społeczno-
ekonomicznych można 9
przedstawić w formie graficznej 8
– elementy szeregu 7
prezentowane są przez punkty
tys. km
6
płaszczyzny o współrzędnych 5
(t,y), które łączy się odcinkami 4
linii prostej
3 1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
lata
nakład książek i broszur w latach 1990-1997 (w mln egz.)
 W badanym 8-elementowym Nakład książek i broszur w latach 1990-1997

szeregu czasowym występuje
200
składowa systematyczna w postaci wartości rzeczywiste
180
trendu oraz wahania przypadkowe.
160
w mln egzemplarzy
140
 Ocena wzrokowa wykresu 120
wskazuje, ze do opisu przebiegu 100
zmiennej można wykorzystać 80
funkcję liniową 60
1990 1991 1992 1993 1994 1995 1996 1997
nakład książek i broszur w latach 1990-1997 (w mln egz.)
 Parametry modelu liniowego

oszacowano MNK. Obliczenia
związane z szacowaniem Nakład książek i broszur w latach 1990-1997
parametrów linii trendu, 200 wartości rzeczywiste
wyznaczeniem miar 180
wartości teoretyczne
„dobroci”dopasowania, prognozy 160

punktowej i prognozy
w mln egzemplarzy
140
przedziałowej, błędów prognoz
120
zawarte są w prezentacji pt.
100
”Szeregi czasowe”.
80
 Wartości rzeczywiste i teoretyczne
60
zmiennej przedstawia rysunek obok. 1990 1991 1992 1993 1994 1995 1996 1997
wartość produkcji w pewnym przedsiębiorstwie w latach 1993 – 2002 (w mld zł.)
 Ocena wzrokowa wykresu wskazuje, ze wartość produkcji w latach 1993-2002 (w mld zł)
w badanym szeregu czasowym
30
występuje składowa systematyczna w
26,4
postaci trendu rosnącego oraz wahania 25
przypadkowe. 20 21
mld zł
16,1 15,5
 Wzrost wartości zmiennej jest jednak 15
coraz szybszy. W takim przypadku 10 11

7,6
możemy zastosować funkcję o rosnącym 5 4,5 4,1 5
3,5
tempie wzrostu, np. funkcję wykładniczą. 0
 Wykładniczą funkcję trendu sprowadza 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002
się do postaci liniowej przez

logarytmowanie, a następnie szacuje się 60
jej parametry za pomocą MNK – zob. 50
produkcja prognoza 53,3
prezentację pt. ”Wykładniczy model
42,1
trendu”. 40
33,2
 Wykresy przedstawiają wartości 30
mld zł
rzeczywiste, teoretyczne i prognozy 26,2

20 20,7
zmiennej 16,4
12,9
10 10,2
6,4 8,1
3,1 4,0 5,0
0
zużycie energii elektrycznej w firmie latach 2005 - 2007(w mln kWh)
 Analiza wzrokowa wykresu

Kwartalne zużycie energii elektrycznej w latach 2005-2007
wartości zmiennej prognozowanej
wskazuje, że zużycie energii w 5,5
firmie cechuje się liniową tendencją 5
rozwojową oraz wahaniami 4,5
sezonowymi. 4
3,5
 Zadanie: 3
wyznaczyć prognozy zużycia 2,5
energii na następne dwa kwartały 2
2008 roku. 1 2 3 4 5 6 7 8 9 10 11 12
2005 2006 2007
rok 2005 2006 2007

kw. I II II IV I II II IV I II III IV
Y 2,8 3,7 3,0 4,6 3,0 4,2 3,5 5,0 3,5 4,7 4,0 5,3
 Poziom zjawiska gospodarczego, które

odzwierciedla szereg czasowy, wykazuje
różnego rodzaju zmiany:
 zmiany określające pewien ogólny kierunek
(tendencję rozwojową) czyli tzw. trend; Produkcja energii elektrycznej w Polsce w latach 1991-1994 (w mln kWh)
 wahania cykliczne, czyli koniunkturalne
(wahania o kresie dłuższym niż rok, które z 15000
grubsza odpowiadają cyklom
14000
koniunkturalnym);
 wahania sezonowe powtarzające się 13000
periodycznie w pewnych określonych porach 12000
każdego roku lub miesiąca;
 wahania nieregularne (które trudno 11000
zanalizować i ująć w pewien określony 10000
schemat):
 wahania katastrofalne spowodowane 9000
przez zdarzenia historyczne (wojna, 8000
katastrofy żywiołowe, epidemie); 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46
 wahania przypadkowe będące miesiące

wynikiem działania wielkiej liczby
przyczyn ubocznych.
 Rys.1. Składowe szeregu czasowego

Yt wahania cykliczne
wahania sezonowe
trend
wahania przypadkowe
czas
 Każdą obserwację szeregu czasowego możemy więc rozłożyć na trzy

składniki lub czynniki:
- trend (T);
- sezonowość (S);
- składnik przypadkowy (U).
 Charakter powiązań między trendem, sezonowością i zmiennością losową w

szeregach:
 - powiązania addytywne:
yt = Tt + S t + U t (1)
 - i multiplikatywne:
yt = Tt  S t  U t ( 2)
 gdzie:
 yt - obserwacje szeregu czasowego
 Tt - trend i wahania cykliczne
 St - sezonowość
 Ut - zmienność o charakterze losowym (czynnik przypadkowy).
 Subskrypt t oznacza, że analizujemy zachowanie się zjawiska w czasie.
 Analiza statystyczna może dotyczyć wszystkich składników szeregu czasowego.

 Zwykle dąży się do wyodrębnienia poszczególnych składników szeregu
czasowego i pomiaru ich wielkości – dlatego analizę szeregu czasowego określa
się jako jego „dekompozycję”.
 W celu „dekompozycji” szeregu stosuje się wiele różnych metod statystycznych.
 Wyznaczenie z szeregu trendu jest najprostsze.
 Zadanie wyznaczenia trendu – funkcji f(t) – jest nazywane wygładzaniem
(wyrównywaniem) szeregu czasowego.
 Możemy tego dokonać stosując jedną z dwóch metod:
 - metodę analityczną (modelowanie rozwoju zjawiska z uwzględnieniem analizy
regresji – określamy postać funkcji charakteryzującą tendencję rozwojową
szeregu i wyznaczamy jej parametry);
 - metodę mechaniczną.
 Metoda analitycznego wyrównywania szeregów polega na założeniu, że jego

tendencję rozwojową (trend) da się przedstawić na wykresie za pomocą pewnej
linii matematycznej np. prostej, krzywej wykładniczej itp. o określonym wzorze
analitycznym.
 Metoda analitycznego wyrównania opiera się na dwóch rodzajach dowolnie

przyjętych założeń:
 krzywa, którą uważa się za najlepsze wyrównanie szeregu ma określony z góry
charakter analityczny;
 mogą istnieć różne kryteria, na podstawie których ocenia się "najlepsze dopasowanie
krzywej" do wykresu danego szeregu.
 Jeżeli oba założenia zostaną ustalone, poszukiwana krzywa jest określona

jednoznacznie i wyznaczenie jej analitycznego wzoru jest tylko sprawą
rachunkową.
 Po wyborze postaci funkcji trendu i oszacowaniu jej parametrów, dokonuje się
oceny jakości otrzymanego modelu.
 Model wykorzystujemy do sporządzania prognoz.
 Przyszłą wartość zmiennej Y uzyskuje się przez ekstrapolację funkcji

trendu tj. przez podstawienie do modelu w miejsce zmiennej czasowej
numeru momentu lub okresu T, na który wyznaczamy prognozę:
YTP  f (T ) dla T  n
 Rozważamy przypadek, gdy w

szeregu czasowym występują Kwartalne zużycie energii elektrycznej w latach 2005-2007
wahania sezonowe.
5,5
 Odpowiedni model musi więc
5
zawierać parametry i zmienne
4,5
charakteryzujące te wahania w
4
poszczególnych fazach tego cyklu. 3,5
 Dla uproszczenia rozważań i zapisu 3
rozpatrujemy zjawisko o rocznym 2,5
cyklu wahań z kwartałami jako 2
1 2 3 4 5 6 7 8 9 10 11 12
fazami tego cyklu.
2005 2006 2007
Kwartalne zużycie energii elek trycznej w latach 2005-2007
5,5
5
4,5
4
3,5
3
2,5
2
1 2 3 4 5 6 7 8 9 10 11 12
2005 2006 2007
 Zakładając, że funkcja trendu jest liniowa a wahania okresowe

(kwartalne) nakładają się na tendencję rozwojową w sposób addytywny
sformułujemy model następująco:
Y t =  +   t   1 X t ,1   2 X t , 2   3 X t ,3   4 X t , 4  t (1)
 gdzie:
Xt,i (i=1,2,3,4; t=1,2,3…,n) są zmiennymi zero-jedynkowymi reprezentującymi poszczególne
fazy cyklu
 Zmienne zero-jedynkowe:
1 dla obserwacji i  tego kw.

X t ,i  { ( 2)
0 dla obserwacji poz. kw.
 Parametry stojące przy zmiennych zero-jedynkowych (λi) charakteryzują

absolutną wielkość wahań okresowych w poszczególnych kwartałach.
 Założenia dotyczące składnika losowego εt są takie same jak w modelu
nie uwzględniającym wahań okresowych.
 Kolumny macierzy X są liniowo

zależne
1 1 1 0 0 0
1 2 0 1 0 0
 
1 3 0 0 1 0
 
1 4 0 0 0 1
1 5 1 0 0 0
 
1 6 0 1 0 0
X   (3)
1 7 0 0 1 0
 
1 8 0 0 0 1
1 9 1 0 0 0
 
1 10 0 1 0 0
1 11 0 0 1 0
 

1 12 0 0 0 1

 W modelu należy jedną spośród zmiennych przedstawić jako kombinację

pozostałych (oznacza to eliminację tej zmiennej).
 Zastąpimy zmienną Xt,1 przez kombinację liniową otrzymaną z
zależności:
X t ,i
1 (4) czyli
X t ,1  1  X t , 2  X t ,3  X t , 4 (5)
 W wyniku podstawienia model (1) przyjmie następującą postać:
Y t =  +   t   1[1  X t , 2  X t ,3  X t , 4 ]   2 X t , 2   3 X t ,3   4 X t , 4   t ( 6)
Y t = ( +  1 )    t  ( 2   1 ) X t , 2  ( 3   1 ) X t ,3  ( 4   1 ) X t , 4  t (7 )
 Model tendencji rozwojowej z liniową funkcją

trendu oraz wahaniami sezonowymi przyjmie
zatem postać:
Y t = ( +  1 )    t  ( 2   1 ) X t , 2  ( 3   1 ) X t ,3  ( 4   1 ) X t , 4  t (7 )
 gdzie : yt – poziom zjawiska w okresie t,

( +  1 ) - stała,
 - parametr przy zmiennej czasowej,
( i   1 ) - parametr przy zmiennej Xt,i
εt – składnik losowy dla okresu t
 Przyjmując odnośnie do rozkładu εt takie same założenia jak w klasycznym

modelu regresji, uzyskujemy podstawę do szacowania parametrów funkcji trendu
za pomocą MNK.
 dane niezbędne do obliczeń:
X – macierz wartości zmiennych objaśniających (kolumny są liniowo niezależne)
Y- wektor zaobserwowanych wartości zmiennej Y
1 1 0 0 0  2,8 
1 2 1 0 0 3,7 
   
1 3 0 1 0  3,0 
   
1 4 0 0 1
 4,6
1 5 0 0 0  3,0 
   
1 6 1 0 0
X   4,2
Y  
1 7 0 1 0  3,5 
   
1 8 0 0 1
5,0 
1 9 0 0 0  3,5 
   
1 10 1 0 0 4,7 
1 11 0 1 0  4,0
   

1 12 0 0 1
  5,3 
 wektor ocen parametrów modelu trendu z wahaniami sezonowymi
   1  2,569
    0,106 
   
~
a   2   1   0,994 (8)
   
 
 3 1  0,187 
 4   1  1,548 
 obliczamy ze wzoru:
a~  ( X T X ) 1 X T y (9)
 Wybrane wyniki (obliczenia w Excel) wskazują, iż model jest dobrze dopasowany

do danych empirycznych (parametry strukturalne są statystycznie istotne,
współczynniki φ2 i V przyjmują wartości bardzo małe):
PODSUMOWANIE - WYJŚCIE
Statystyki regresji
Wielokrotność R 0,995918125
R kwadrat 0,991852912
Dopasowany R kwadrat 0,987197433
Błąd standardowy 0,093859064
Obserwacje 12
ANALIZA WARIANCJI
df SS MS
Regresja 4 7,5075 1,876875
Resztkowy 7 0,061666667 0,008809524
Razem 11 7,569166667
Współczynniki Błąd standardowy t Stat

Przecięcie 2,56875 0,068243081 37,6411788
t 0,10625 0,008296048 12,80730366
z2 0,99375 0,077083333 12,89189189
z3 0,1875 0,078411182 2,39124057
z4 1,547916667 0,080575651 19,21072495
 Model zużycia energii elektrycznej w firmie jest postaci:
Yˆ t = 2,569  0,106 t  0,994 X t , 2  0,187 X t ,3  1,548 X t , 4 ( R 2  0,992)

( 0 , 068) ( 0 , 008) ( 0 , 077) ( 0 , 078) ( 0 , 080)
 interpretacja:
 2,569 – jest oceną wyrazu wolnego modelu (7) na który składa się wyraz wolny i odchylenie
okresowe dla I kwartału z modelu w postaci wyjściowej (5);
 0,106 – ocena współczynnika trendu, wyraża tendencję rozwojową zużycia energii
elektrycznej i jest interpretowany jako średni kwartalny wzrost zużycia energii w firmie (w mln
kWh) w latach 2005-2007;
 0,994- ocena parametru stojącego przy zmiennej X t,2 reprezentuje odchylenie sezonowe
zużycia energii dla II kwartału w porównaniu z I kwartałem. Oznacza, że z tytułu wahań
sezonowych zużycie energii w firmie w II kwartale każdego roku jest wyższe o 0,994 mln kWh
od zużycia w I kwartale;
 Podobnie (jak ocenę parametru stojącego przy zmiennej X t,2 ) interpretuje się oceny 0,187 i
1,548 parametrów przy Xt,3 oraz Xt,4 .
 Prognoza zużycia energii w firmie:
 w I kwartale 2008 roku

Y13P = 2,569  0,106  13  0,994  0  0,187  0  1,548  0
Y13P  3,947
 w II kwartale 2008 roku

Y14P = 2,569  0,106  14  0,994  1  0,187  0  1,548  0
Y14P  5,047
Kwartalne zużycie energii elektrycznej w firmie w latach 2005-2007

(w mln kWh) i prognoza na I i II kwartał 2008 roku
6,00
5,50
5,00
4,50
4,00
3,50
3,00
prognoza
2,50
zużycie energii
2,00
1 2 3 4 1 2 3 4 1 2 3 4 1 2
2005 2006 2007 2008

Prognozowanie I Symulacje - Archiwum - Małgorzata Radziukiewicz - Analiza Szeregów Czasowych

Uploaded by

Copyright:

Available Formats

You might also like

Prognozowanie I Symulacje - Archiwum - Małgorzata Radziukiewicz - Analiza Szeregów Czasowych

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Prognozowanie I Symulacje - Archiwum - Małgorzata Radziukiewicz - Analiza Szeregów Czasowych

Uploaded by

Copyright:

Available Formats

Analiza szeregów czasowych

 Szereg czasowy (chronologiczny)

zbiór wartości badanej cechy lub wartości

 Szeregi czasowe dotyczące zjawisk społeczno-

przedstawić w formie graficznej 8

prezentowane są przez punkty

 W badanym 8-elementowym Nakład książek i broszur w latach 1990-1997

 Parametry modelu liniowego

„dobroci”dopasowania, prognozy 160

coraz szybszy. W takim przypadku 10 11

się do postaci liniowej przez

rzeczywiste, teoretyczne i prognozy 26,2

 Analiza wzrokowa wykresu

2005 2006 2007

rok 2005 2006 2007

 Poziom zjawiska gospodarczego, które

 wahania przypadkowe będące miesiące

 Rys.1. Składowe szeregu czasowego

 Każdą obserwację szeregu czasowego możemy więc rozłożyć na trzy

 Charakter powiązań między trendem, sezonowością i zmiennością losową w

 Analiza statystyczna może dotyczyć wszystkich składników szeregu czasowego.

 Metoda analitycznego wyrównywania szeregów polega na założeniu, że jego

 Metoda analitycznego wyrównania opiera się na dwóch rodzajach dowolnie

 Jeżeli oba założenia zostaną ustalone, poszukiwana krzywa jest określona

 Przyszłą wartość zmiennej Y uzyskuje się przez ekstrapolację funkcji

 Rozważamy przypadek, gdy w

Kwartalne zużycie energii elek trycznej w latach 2005-2007

 Zakładając, że funkcja trendu jest liniowa a wahania okresowe

1 dla obserwacji i  tego kw.

 Parametry stojące przy zmiennych zero-jedynkowych (λi) charakteryzują

 Kolumny macierzy X są liniowo

 W modelu należy jedną spośród zmiennych przedstawić jako kombinację

 W wyniku podstawienia model (1) przyjmie następującą postać:

 Model tendencji rozwojowej z liniową funkcją

 gdzie : yt – poziom zjawiska w okresie t,

 Przyjmując odnośnie do rozkładu εt takie same założenia jak w klasycznym

 Wybrane wyniki (obliczenia w Excel) wskazują, iż model jest dobrze dopasowany

Współczynniki Błąd standardowy t Stat

Yˆ t = 2,569  0,106 t  0,994 X t , 2  0,187 X t ,3  1,548 X t , 4 ( R 2  0,992)

 Prognoza zużycia energii w firmie:

 w I kwartale 2008 roku

 w II kwartale 2008 roku

Kwartalne zużycie energii elektrycznej w firmie w latach 2005-2007

You might also like