I. Wyklad - Modelowanie Ekonometryczne

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 164

Modelowanie ekonometryczne

Metoda najmniejszych kwadratw

Marcin Topolewski, SGH

Model ekonometryczny
= 0 + 1 1 + 2 2 + + +

1 , 2 , ,
0 , 1 , 2 , ,

= 1, 2, ,

- zmienna objaniana (wartoci empiryczne)


- zmienne objaniajce (k)
- parametry strukturalne (k+1)
- skadnik losowy

1
1 11 21

1 12 22
[ 2]
=[

[1]
1 1 2

0
1
1
1
2
2
]
+[ ]
2

[1]
[+1]
[ ][1]

= +

Marcin Topolewski, SGH

Model ekonometryczny po oszacowaniu


= 0 + 1 1 + 2 2 + +

1 , 2 , ,
0 , 1 , 2 , ,

- wartoci teoretyczne zmiennej objanianej


- zmienne objaniajce (k)
- oszacowania parametrw strukturalnych (k+1)

1
1 11 21
1 12 22
2
=[

1 1 2
[ ][1]

0
1
1
2
]
2

[+1]
[ ][1]

Marcin Topolewski, SGH

Reszty
=

- reszta dla t-tej obserwacji,

1
2

=
=[ ]=

- wektor reszt modelu.

Metoda najmniejszych kwadratw MNK

Metoda najmniejszych kwadratw polega na wyznaczeniu takiego wektora oszacowa


) = = =1 2 osiga minimum.
wektora parametrw , przy ktrym funkcja (
) = .
(
Po rozwiniciu otrzymujemy
) = = (
) (
) = 2
+

.
(

Marcin Topolewski, SGH

) jest
Warunkiem koniecznym istnienia ekstremum funkcji (
)
(

= 0,

Zatem mamy
= 0,
2 + 2
= .

Estymator MNK:
= ( )1 .

Ponadto macierz drugich pochodnych czstkowych


)
2 (

2
) = osiga minimum.
jest dodatnio okrelona, a wic funkcja (

Marcin Topolewski, SGH

Klasyczna metoda najmniejszych kwadratw (KMNK) - zaoenia:


Z1 - nielosowe, nieskorelowane z ,
Z2 () = + 1 ,
Z3 () = ,
Z4 2 () = ( ) = 2 ;
2 < .
Dodatkowe zaoenie (wane dla prawidowej weryfikacji modelu)
Z5 ~(0; 2 ), = 1, 2, , .
Zaoenie 2. ma charakter algebraiczny i jest niezbdne, aby moliwe byo obliczenie estymatora
MNK.
Zaoenia od 3. do 5. dotycz waciwoci skadnika losowego i zapewniaj korzystne wasnoci
estymatora, oraz umoliwiaj dalsz weryfikacj statystyczn modelu.
Zaoenie 4. mwi o odpowiedniej postaci macierzy wariancji kowariancji skadnika losowego:
2 0 0
2

0 ],
2( )
0
=[
2 < .

0 2
0
co oznacza, e skadnik losowy nie podlega procesowi autokorelacji (jest niezaleny od swoich
poprzednich realizacji) i ma sta skoczon wariancj (jest homoskedastyczny jednorodny).
Marcin Topolewski, SGH

Twierdzenie Gaussa-Markowa
wyznaczony KMNK jest estymatorem:
Estymator
- liniowym,
) = ,
- nieobcionym (
- zgodnym,
- najefektywniejszym w klasie liniowych i nieobcionych estymatorw.

Interpretacja ocen parametrw


Dla oszacowanego modelu ekonometrycznego
= 0 + 1 1 + 2 2 + + .
Oszacowanie nieznanego parametru interpretujemy nastpujco:
wzrost zmiennej o jednostk, przy innych zmiennych pozostajcych na tych samych
poziomach, powoduje zmian zmiennej przecitnie o jednostek.
Marcin Topolewski, SGH

Przykad
Na podstawie obserwacji dokonanych w fabryce zapaek SMOK WAWELSKI w cigu pierwszych 6
miesicy 2000 roku uzyskano nastpujce dane:

1
2
3
4
5
6

8
5
5
9
10
11

1
8
7
9
11
10
9

2
6
8
9
7
6
5

gdzie: zysk w tys. z, 1 liczba podpisanych kontraktw, 2 cena siarki w tys. z za ton,
czas,
= 1, 2, , 6.

Marcin Topolewski, SGH

Graficznie obserwacje przedstawiaj si nastpujco


12

10

0
1

3
y

Marcin Topolewski, SGH

4
x1

x2

10

Zaleno i 1
12

10

0
0

10

12

x1

Marcin Topolewski, SGH

11

Zaleno i 2
10
9
8
7

6
5
4
3
2
1
0
0

10

12

x2

Marcin Topolewski, SGH

12

W celu zbadania zalenoci zysku od liczby podpisanych kontraktw i ceny siarki oszacowano
model ekonometryczny nastpujcej postaci
= 0 + 1 1 + 2 2 +
Do oszacowania modelu wykorzystano wektor obserwacji na zmiennej objanianej i macierz
obserwacji na zmiennych objaniajcych
8
5
= 5 ,
9
10
[11]
Otrzymano:
1 1 1
= [8 7 9
6 8 9

Marcin Topolewski, SGH

1 8 6
1 7 8
1 9 9
=
.
1 11 7
1 10 6
[1 9 5]
1 8 6
1 7 8
1
1 1
6
54
41
1 9 9
= [54 496 367],
11 10 9]
1 11 7
7
6 5
41 367 291
1 10 6
[1 9 5]

13

15,411
[1,066
0,827

1 1 1
= [8 7 9
6 8 9

= (

)1

1,066 0,827
0,104
0,019 ],
0,019
0,096

8
1
1 1 5
48
5
= [442],
11 10 9]
9
7
6 5
311
10
[11]

11,41
15,411 1,066 0,827 48
0,019 ] [442] [ 0,71 ],
[1,066 0,104
1,44
0,827 0,019
0,096 311

0 = 11,41
1 = 0,71
2 = 1,44

Marcin Topolewski, SGH

14

Zatem model po oszacowaniu ma posta


= 11,41 + 0,711 1,442
Interpretacja oszacowa parametrw:
Wzrost liczby podpisanych kontraktw o jednostk, przy niezmienionej cenie siarki, powoduje
wzrost zysku przecitnie o 710 zotych.
Wzrost ceny siarki o 1 tysic zotych za ton powoduje, ceteris paribus, spadek zysku rednio o
1440 zotych.

Marcin Topolewski, SGH

15

Klasyfikacja danych:
szereg czasowy (jeli przedstawiaj stan badanego zjawiska w kolejnych jednostkach czasu),
na przykad: dzienne kursy walutowe, miesiczna inflacja, dochd narodowy,
dane przekrojowe (jeli wyraaj stan zjawiska w ustalonym czasie, ale w odniesieniu do
rnych obiektw), na przykad: zysk w rnych filiach przedsibiorstwa, pace poszczeglnych
pracownikw w okrelonym przedsibiorstwie.
Dane panelowe informacje o tych samych obiektach w kolejnych jednostkach czasu.
Klasyfikacja zmiennych:
A - zmienne endogeniczne: biece i opnione (wyjaniane przez model),
B - zmienne egzogeniczne: biece i opnione (niewyjaniane przez model),
C zmienne objaniane (zalene),
D zmienne objaniajce (niezalene).

Marcin Topolewski, SGH

16

Przykad
Dla modelu
= 0 + 1 + 2 + 3 1 + 1
= 0 + 1 + 2 + 3 + 4 1 + 2
gdzie: stopa zmian dochodw nominalnych, stopa bezrobocia, inflacja, stopa
procentowa, stopa zmian cen surowcw importowanych, mamy:
- zmienne endogeniczne:
biece: , ,
opnione: 1 ,
- zmienne egzogeniczne:
biece: , , ,
opnione: 1 ,
- zmienne objaniane: , ,
- zmienne objaniajce: , , 1 , , , , 1 .

Marcin Topolewski, SGH

17

Klasyfikacja modeli ekonometrycznych:


KRYTERIUM 1. Liczba rwna w modelu.
modele jednorwnaniowe (na przykad = 0 + 1 + ),
= 0 + 1 + 2 + 1
modele wielorwnaniowe (na przykad
).
= 0 + 1 + 2 + 3 + 2
KRYTERIUM 2. Posta analityczna zalenoci funkcyjnych w modelu.
modele liniowe (na przykad = 0 + 1 + ),

modele nieliniowe (na przykad = 0 1 2 ).


KRYTERIUM 3. Rola czynnika czasu w rwnaniach modelu.
modele statyczne (na przykad = 0 + 1 + ),
modele dynamiczne (na przykad = 0 + 1 + 2 1 + ).
KRYTERIUM 4. Oglnopoznawcze cechy modelu.
modele przyczynowo-opisowe (na przykad = 0 + 1 + ),
modele symptomatyczne (na przykad = 0 + 1 1 + ).
KRYTERIUM 5. Charakter powiza midzy zmiennymi (modele wielorwnaniowe).
modele proste,
modele rekurencyjne,
modele rwnaniach wspzalenych.
Marcin Topolewski, SGH

18

Modele trendu (modele tendencji rozwojowej)


Modele, w ktrych zmienna czasowa jest jedyn zmienn objaniajc.
Trend liniowy
= 0 + 1 +
Trend wykadniczy
= 0 1
Trend potgowy
Trend logarytmiczny

= 0 1
= 0 + 1 +

Trend logistyczny

= 1+ +

Model autoregresyjny
Model autoregresyjny m tego rzdu
= 0 + 1 1 + 2 2 + + + .
Bieca warto zmiennej Y zaley od jej wartoci w poprzednich m okresach.
Na przykad dla m = 2 model autoregresyjny drugiego rzdu (itd.)
= 0 + 1 1 + 2 2 + .

Marcin Topolewski, SGH

19

Model autoregresyjny z rozkadem opnie (ADL(m,k))


Model, w ktrym wystpuj opnione wartoci zmiennej endogenicznej i egzogenicznej.
= 0 + 1 1 + 2 2 + + 0 + 1 1 + 2 2 + + + .
Na przykad model ADL(1,1) ma posta
= 0 + 1 1 + 0 + 1 1 + .
Model z nieskoczonym rozkadem opnie
= + 0 + 1 1 + 2 2 + + .
Model Koycka
Zakadamy, e parametry przy opnionej zmiennej malej geometrycznie i zwizane s
zalenoci
= 0 ,

gdzie

= 0, 1, 2, oraz 0 < < 1,

po transformacji Koycka otrzymujemy model autoregresyjny zwany modelem Koycka


= 0 + 0 + 1 + ,
gdzie
0 = (1 ) oraz = 1 .
Marcin Topolewski, SGH

20

Metoda najwikszej wiarygodnoci (Maximum Likelihood)


MNW jest powszechnie stosowan metod estymacji modeli nieliniowych, wielorwnaniowych
oraz modeli z jakociow zmienn objanian, ktre s tematem rozdziau 6. W niektrych
przypadkach mona j stosowa do estymacji modeli, w ktrych nie s spenione klasyczne
zaoenia dotyczce skadnika losowego. Estymator MNW jest w oglnym przypadku
estymatorem obcionym, a jego wasnoci w maej prbie nie s znane. Podstawowym
pojciem zwizanym z t metod jest wiarygodno i funkcja wiarygodnoci. Wiarygodnoci nelementowej prby dla populacji o rozkadzie cigym nazywamy warto wyraenia
( , ) = =1 ( , ),
gdzie:
funkcja gstoci rozkadu prawdopodobiestwa,
= [1 , 2 , ] prba statystyczna,
wektor parametrw.

Marcin Topolewski, SGH

21

Dla okrelonego wektora wynikw prby , wiarygodno jest funkcj wartoci parametrw i
jest nazywana funkcj wiarygodnoci. Do zastosowania MNW niezbdna jest znajomo rozkadu
skadnika losowego. Jeeli skadnik losowy ma rozkad normalny (Z5 MNK) funkcja wiarygodnoci
przyjmuje posta
(, , 2 ) = =1

1
2

exp

(
=0 )
22

a jej logarytm

= 2 (2 2 ) 22 =1( =0 )
= 2 (2 2 ) 22 ( ) ( ).

Marcin Topolewski, SGH

22

Metoda zmiennych instrumentalnych


W przypadku, gdy zmienne objaniajce s skorelowane ze skadnikiem losowym (a wic
niespenione jest zaoenie Z1 MNK), zastosowanie znajduje metoda zmiennych
instrumentalnych (Instrumental Variables). Polega ona na znalezieniu zmiennej zastpczej
(proxy), skorelowanej ze zmienn objaniajc, ktr ma zastpowa, ale nieskorelowanej ze
skadnikiem losowym modelu. Metoda ta daje estymatory zgodne, ale obcione. Niestety w
praktyce znalezienie odpowiedniej zmiennej zastpczej nie jest proste.
Uoglniona metoda momentw
Do estymacji modeli opartych na danych panelowych suy uoglniona metoda momentw,
UMM (lub GMM, ang. Generalised Method of Moments). Metoda ta wymaga sformuowania
zaoe na temat momentw rozkadu zawierajcych zaobserwowane dane oraz nieznane
parametry.

Marcin Topolewski, SGH

23

Weryfikacja modelu ekonometrycznego

Marcin Topolewski, SGH

24

JAKO DOPASOWANIA MODELU


Wspczynnik determinacji 2
=1( )2
=1( )2

2
=
=1
=1
=1( )2
=1( )2
2
2 0; 1
Interpretacja dla liniowego modelu z wyrazem wolnym oszacowanego MNK:
2 100% - procent zmiennoci zmiennej objanianej wyjaniany przez model.
Skorygowany wspczynnik determinacji 2

(1 2 )
2 = 2
( + 1)
2 2
Stosuje si do porwnania jakoci dopasowania modeli rnicych si liczb zmiennych
objaniajcych.
Niescentrowany wspczynnik determinacji - dla modelu bez wyrazu wolnego!

2
= 1

2 0; 1
Marcin Topolewski, SGH

25

Przykad (cig dalszy)


Na podstawie obserwacji dokonanych w fabryce zapaek SMOK WAWELSKI w cigu pierwszych 6
miesicy 2000 roku uzyskano nastpujce dane:

1
2
1
8
8
6
2
5
7
8
3
5
9
9
4
9
11
7
5
10
10
6
6
11
9
5
gdzie: zysk w tys. z, 1 liczba podpisanych kontraktw, 2 cena siarki w tys. z za ton,
czas, = 1, 2, ,6. W celu zbadania zalenoci zysku od liczby podpisanych kontraktw i ceny
siarki oszacowano model ekonometryczny nastpujcej postaci
= 0 + 1 1 + 2 2 + .
Model po oszacowaniu ma posta
= 11,41 + 0,711 1,442
Marcin Topolewski, SGH

26

Podstawiajc wartoci zmiennych objaniajcych do modelu otrzymano wartoci . Nastpnie


obliczono reszty dla kolejnych obserwacji
=
Otrzymano

1
2
3
4
5
6

8
5
5
9
10
11
= 8

8,49
4,90
4,88
9,19
9,91
10,64
= 8

-0,49
0,10
0,12
-0,19
0,09
0,36
= 0

2
0,24
0,01
0,01
0,03
0,01
0,13
2 = 0,43

(8,49 8)2 + (4,909 8)2 + + (10,64 8)2 31,57


(

)
=1
2
=
=
=
(8 8)2 + (5 8)2 + + (11 8)2
=1( )2
32
0,99
Poniewa mamy do czynienia z modelem liniowym z wyrazem wolnym oszacowanym MNK
moemy powiedzie, e ponad 99% zmiennoci zysku jest wyjaniane przez model (przez
Marcin Topolewski, SGH

27

zmienne: cena siarki i liczba podpisanych kontraktw). Jednoczenie 1% zmiennoci zysku


spowodowane jest czynnikami nieujtymi w modelu.

2
(1 2 ) = 0,99
(1 0,99) = 0,99 0,01 0,98
2 = 2
( + 1)
6 (2 + 1)
3
2 2 = 0,01
Poniewa skorygowany wspczynnik determinacji jest niewiele mniejszy od wspczynnika
determinacji z zaufaniem traktujemy wnioski wycignite na podstawie 2 .
Model 1: Estymacja KMNK, wykorzystane obserwacje 2000:01-2000:06 (N = 6)
Zmienna zalena (Y): Y
wspczynnik bd standardowy t-Studenta warto p
--------------------------------------------------------------const
11,4121
1,49398
7,639
0,0047
***
X1
0,712460
0,122633
5,810
0,0102
**
X2
1,43770
0,117822
12,20
0,0012
***
redn.aryt.zm.zalenej 8,000000
Suma kwadratw reszt
0,434505
Wsp. determ. R-kwadrat 0,986422
F(2, 3)
108,9706
Logarytm wiarygodnoci 0,637708
Kryt. bayes. Schwarza
6,650694
Autokorel.reszt - rho1 0,143108
Marcin Topolewski, SGH

Odch.stand.zm.zalenej
Bd standardowy reszt
Skorygowany R-kwadrat
Warto p dla testu F
Kryt. inform. Akaike'a
Kryt. Hannana-Quinna
Stat. Durbina-Watsona

2,529822
0,380572
0,977370
0,001582
7,275416
4,774604
1,350780
28

Kryterium informacyjne Akaike ()


Zwykle kryteria informacyjne definiowane s jako przecitna warto logarytmu funkcji
wiarygodnoci skorygowana o rnie zdefiniowan funkcj straty.
Dla modeli szacowanych MNK najbardziej popularne wyraa si wzorem

1
2
2
= ln +

=1

Kara nakadana przez kryterium na zbdne zmienne objaniajce jest silniejsza ni w


przypadku skorygowanego wspczynnika determinacji oraz alternatywnych kryteriw
informacyjnych Schwarza i Hannana Quinna.
Oglna posta kryterium AIC (gdzie ( ) oznacza warto funkcji wiarygodnoci)
= 2 ln ( ) + 2
Kryterium Schwarza BIC
= 2 ln ( ) + ln
Kryterium Hannana Quinna HQC
= 2 ln ( ) + 2 ln ln
Marcin Topolewski, SGH

29

DOKADNO OSZACOWANIA PARAMETRW

Macierz wariancji i kowariancji wektora ocen


) = 2 ( )1
2 (
Oszacowanie wariancji skadnika losowego

2
=
( + 1)

Oszacowanie macierzy wariancji i kowariancji estymatora


) = 2 ( )1 = [ ]
2 (

(+1)(+1)

redni bd szacunku parametru (dokadno oszacowania parametru)


=
Interpretacja:
Twierdzc, e warto nieznanego parametru wynosi mylimy si przecitnie o .

Marcin Topolewski, SGH

30

Przykad cd.
Oszacowanie wariancji skadnika losowego

0,43
2
=
=
= 0,145
( + 1) 6 (2 + 1)
Macierz wariacji kowariancji oszacowa parametrw
15,411 1,066
) = 2 ( )1 = 0,145 [1,066 0,104
2 (

0,827 0,019
2,232 0,154 0,120
0,003 ]
= [0,154 0,015
0,120 0,003
0,014
rednie bdy szacunku parametrw

0,827
0,019 ]
0,096

0 = 2,232 1,494
1 = 0,015 0,123
2 = 0,014 0,118
Twierdzc, e oszacowanie parametru przy zmiennej liczba kontraktw wynosi 0,71 mylimy si
przecitnie o 0,123. Szacujc parametr 2 na -1,44 popeniamy redni bd 0,118.

Marcin Topolewski, SGH

31

Model moemy teraz zapisa:


= 11,41 + 0,711 1,442
(1,494) (0,123) (0,118)
Model 1: Estymacja KMNK, wykorzystane obserwacje 2000:01-2000:06 (N = 6)
Zmienna zalena (Y): Y
wspczynnik bd standardowy t-Studenta warto p
--------------------------------------------------------------const
11,4121
1,49398
7,639
0,0047
***
X1
0,712460
0,122633
5,810
0,0102
**
X2
1,43770
0,117822
12,20
0,0012
***
redn.aryt.zm.zalenej 8,000000
Suma kwadratw reszt
0,434505
Wsp. determ. R-kwadrat 0,986422
F(2, 3)
108,9706
Logarytm wiarygodnoci 0,637708
Kryt. bayes. Schwarza
6,650694
Autokorel.reszt - rho1 0,143108

Marcin Topolewski, SGH

Odch.stand.zm.zalenej
Bd standardowy reszt
Skorygowany R-kwadrat
Warto p dla testu F
Kryt. inform. Akaike'a
Kryt. Hannana-Quinna
Stat. Durbina-Watsona

2,529822
0,380572
0,977370
0,001582
7,275416
4,774604
1,350780

32

redni wzgldny bd szacunku parametru (dokadno oszacowania parametru)

=
100%
| |
Interpretacja:
Szacujc nieznany parametr mylimy si przecitnie o .
Przykad cd.
Dla modelu
= 11,41 + 0,711 1,442
(1,494) (0,123) (0,118)
rednie wzgldne bdy szacunku parametrw wynosz
0
1,494
0 =
100% =
100% = 13,09%
|11,41|
|0 |
1
0,123

1 =
100% =
100% = 17,32%
|0,71|
|1 |
2
0,118

2 =
100% =
100% = 8,19%
|1,44|
|2 |
Szacujc parametr przy zmiennej liczba kontraktw mylimy si przecitnie o 17,32%.
Marcin Topolewski, SGH

33

WERYFIKACJA MODELU EKONOMETRYCZNEGO


Istotno pojedynczej zmiennej objaniajcej - test t-Studenta
0 : = 0, zmienna jest nieistotna statystycznie
1 : 0, zmienna jest istotna statystycznie
Jeli spenione jest zaoenie (Z5) skadnik losowy ma rozkad normalny to statystyka

= ~ t Studenta z n (k + 1) stopniami swobody

Wnioskowanie:
|| > odrzucamy 0
|| nie ma podstaw do odrzucenia 0
Gdzie = (;) jest odpowiedni wartoci krytyczn w rozkadzie t-Studenta.

Marcin Topolewski, SGH

34

Graficznie wnioskowanie mona przedstawi nastpujco


Rozkad t-Studenta
Brak podstaw do odrzucenia
H0
Odrzucenie H0

Odrzucenie H0

0.00

Empiryczny poziom istotnoci


W praktyce o odrzuceniu hipotezy zerowej wnioskuje si na podstawie empirycznego poziomu
istotnoci warto p (ang. p-value). Jest to prawdopodobiestwo odrzucenia prawdziwej
hipotezy zerowej (prawdopodobiestwo popenienia bdu pierwszego rodzaju) dla przy
otrzymanej wartoci statystyki testowej.
Technicznie warto p jest prawdopodobiestwem w rozkadzie statystyki testowej odcitym
przez warto obliczeniow statystyki (jedno lub dwustronnym zalenie od postaci hipotezy
zerowej).
Marcin Topolewski, SGH

35

Przykad cd.
Dla modelu
= 11,41 + 0,711 1,442
(1,494) (0,123) (0,118)
dla 6 obserwacji liczba stopni swobody wynosi 6 (2 + 1) = 3, zatem na poziomie istotnoci
= 0,05 warto krytyczna wynosi = (0,05;3) = 3,1824.
Wnioskowanie:
0 = 0 0 = 11,411,494 = 7,637
|0 | > odrzucamy 0 zmienna istotna statystycznie
1 = 1 1 = 0,710,123 = 5,772
|1 | > odrzucamy 0 zmienna istotna statystycznie
2 = 2 2 = 1,440,118 = 12,203
|2 | > odrzucamy 0 zmienna istotna statystycznie

Marcin Topolewski, SGH

36

Model 1: Estymacja KMNK, wykorzystane obserwacje 2000:01-2000:06 (N = 6)


Zmienna zalena (Y): Y
wspczynnik bd standardowy t-Studenta warto p
--------------------------------------------------------------const
11,4121
1,49398
7,639
0,0047
***
X1
0,712460
0,122633
5,810
0,0102
**
X2
1,43770
0,117822
12,20
0,0012
***
redn.aryt.zm.zalenej 8,000000
Suma kwadratw reszt
0,434505
Wsp. determ. R-kwadrat 0,986422
F(2, 3)
108,9706
Logarytm wiarygodnoci 0,637708
Kryt. bayes. Schwarza
6,650694
Autokorel.reszt - rho1 0,143108

Marcin Topolewski, SGH

Odch.stand.zm.zalenej
Bd standardowy reszt
Skorygowany R-kwadrat
Warto p dla testu F
Kryt. inform. Akaike'a
Kryt. Hannana-Quinna
Stat. Durbina-Watsona

2,529822
0,380572
0,977370
0,001582
7,275416
4,774604
1,350780

37

Istotno wszystkich zmiennych objaniajcych uoglniony test Walda


Rozwamy dwa modele ekonometryczne: podstawowy (P) i ucity (U):
= 0 + 1 1 + 2 2 + + +
(P)
= 0 +
(U)
Weryfikujemy:
0 : 1 = 2 = = 0 (wszystkie zmienne s nieistotne),
1 : co najmniej jeden z parametrw jest rny od zera.
Warto statystyki testowej
2
=
(1 2 )[ ( + 1)]
gdzie 2 jest wspczynnikiem determinacji modelu (P).
Wnioskowanie:
>

odrzucamy 0

nie ma podstaw do odrzucenia 0


jest wartoci krytyczn rozkadu F-Snedecora z 1 = oraz 2 = ( + 1) stopniami
swobody przy poziomie istotnoci .

Marcin Topolewski, SGH

38

Przykad cd.
Dla przedstawionego modelu mamy 2 = 0,99, zatem
0 : 1 = 2 = 3 = 0
1 : co najmniej jeden z parametrw jest rny od zera.
Wyznaczamy warto statystyki
2
0,992
0,495
=
=

108,97
(1 2 )[ ( + 1)] (1 0,99)[6 (2 + 1)] 0,0033
Liczba stopni swobody wynosi 1 = 2 oraz 2 = 6 (2 + 1), zatem na poziomie istotnoci =
0,05 warto krytyczna wynosi
= 9,55.
Poniewa > , hipotez zerow naley odrzuci, co oznacza, e co najmniej jedna zmienna w
badanym modelu jest istotna.

Marcin Topolewski, SGH

39

Test pominitej zmiennej


Test sprawdza czy specyfikacja zmiennych w modelu jest poprawna czyli, czy jedna lub wicej
ze zmiennych objaniajcych nie powinna zosta usunita. Po oszacowaniu parametrw modelu
bez wybranych zmiennych testuje si hipotez zerow, e wybrane zmienne s cznie nieistotne,
przeciwko hipotezie, e przynajmniej jedna z nich jest istotna.
Test dodanej zmiennej
Jak powyej, z tym, e testujemy czn nieistotno dodanych zmiennych.

Marcin Topolewski, SGH

40

Test specyfikacji modelu RESET (Regression Specification Error Test)


Test RESET wystpuje w dwch wersjach. W pierwszej z nich do wyjciowego rwnania docza
si kwadraty i ewentualnie wysze potgi oraz iloczyny wszystkich par zmiennych. Hipoteza
zerowa o poprawnoci funkcyjnej testu jest rwnowana hipotezie, e parametry przy wszystkich
dodanych zmiennych s rwne zero.
Poniewa dodanie tak znacznej liczby zmiennych powoduje utrat wielu stopni swobody,
bardziej popularna jest druga wersja testu RESET, w ktrej do wyjciowego rwnania doczane
s kolejne potgi wartoci teoretycznych zmiennej objanianej, wyliczonych na podstawie
wyjciowego rwnania.
Najczciej stosowany jest test RESET(2), w ktrym do wyjciowego modelu doczane s dwie
dodatkowe zmienne, bdce kwadratami i trzecimi potgami teoretycznych wartoci zmiennej
objanianej wyjciowego modelu.

Marcin Topolewski, SGH

41

RESET(2)
Szacujemy model
= 0 + 1 1 + 2 2 + + +
(P)
wykorzystujc wartoci teoretyczne 2 i 3 dla modelu (P) i szacujemy model
= 0 + 1 1 + 2 2 + + + +1 2 + +2 3 +
Hipotezy
0 : +1 = +2 = 0 (posta analityczna modelu jest prawidowa)
1 : co najmniej jeden z parametrw +1 , +2 jest rny od zera.
Statystyka

(R)

(2 2 )2
=
(1 2 )[ ( + 1 + 2)]
Wnioskowanie
>

odrzucamy 0

nie ma podstaw do odrzucenia 0

odczytujemy dla liczby stopni swobody 1 = 2 oraz 2 = ( + 1 + 2)

Marcin Topolewski, SGH

42

Przykad cd.
W przypadku testowanego modelu liczba stopni swobody jest zbyt niska, aby zastosowa test z
kwadratami i szecianami teoretycznych wartoci zmiennej zalenej, wobec czego zastosowano
oba warianty oddzielnie.

Test RESET na specyfikacj (tylko kwadrat zmiennej) Hipoteza zerowa: specyfikacja poprawna
Statystyka testu: F(1, 2) = 187,549
z wartoci p = P(F(1, 2) > 187,549) = 0,00528966
Test RESET na specyfikacj (tylko szecian zmiennej) Hipoteza zerowa: specyfikacja poprawna
Statystyka testu: F(1, 2) = 134,89
z wartoci p = P(F(1, 2) > 134,89) = 0,00733202
W obu przypadkach s podstawy do odrzucenia hipotezy zerowej, co oznacza, e specyfikacja
modelu nie jest poprawna.

Marcin Topolewski, SGH

43

Test DavidsonaMcKinnona.
Test sprawdza model pod ktem kompletnoci. Model traktowany jest jako kompletny, jeli
rwnanie konkurencyjne nie tumaczy badanego zjawiska lepiej. Szacowane s dwa modele o tej
samej postaci funkcyjnej i liczbie zmiennych objaniajcych, ale o rozcznych zbiorach
zmiennych:
= 0 + 1 1 + 2 2 + + + 1
= 0 + 1 1 + 2 2 + + + 2

(1)
(2)

Po oszacowaniu modelu (1) teoretyczne wartoci zmiennej Y dodawane s, jako zmienna


objaniajca do modelu (2); jeli zmienna ta okazuje si statystycznie nieistotna, model (2) jest
traktowany, jako kompletny.
Procedura ta jest nastpnie powtarzana po odwrceniu kolejnoci modeli.
Wynik testu jest jednoznaczny, jeli jeden z dwch konkurencyjnych modeli mona oceni, jako
kompletny, a drugi nie. Zdarza si jednak, e odrzucamy lub przyjmujemy oba modele; w tym
drugim przypadku oznacza to zazwyczaj, e nie dysponujemy wystarczajco dobrymi danymi, aby
zrnicowa oba modele.
Marcin Topolewski, SGH

44

Weryfikacja modelu ekonometrycznego c.d.

Marcin Topolewski, SGH

45

Rozkad normalny skadnika losowego test Jarque-Bery


Normalno skadnika losowego (spenienie zaoenia Z5 MNK) ma wane znaczenie dla dalszej
weryfikacji modelu, w szczeglnoci zaoenia Z4 i istotnoci zmiennych.
Badamy hipotezy:
0 : skadnik losowy ma rozkad normalny,
1 : skadnik losowy nie ma rozkadu normalnego.
Statystyka
1

= (6 1 + 24 (2 3)2 ) ~ 2 z dwoma stopniami swobody.


Weryfikacja:
> 2 odrzucamy 0 ,
2 nie ma podstaw do odrzucenia 0 .
Gdzie:
1

1 = =1 3 (miara asymetrii),

2 = =1

4
4

(miara kurtozy),

= =1 2 (obciony estymator odchylenia standardowego skadnika losowego).

Marcin Topolewski, SGH

46

Przykad cd.

1
2
3
4
5
6

-0,49
0,10
0,12
-0,19
0,09
0,36
= 0

2
0,24
0,01
0,01
0,03
0,01
0,13
2 = 0,43

3
-0,11
0,00
0,00
-0,01
0,00
0,05
3 = 0,07

= 0,05
2 = 5,991 = 0,2691 1 = 0,5924
1
1
= ( (0,5924)2 + (1,7815 3)2 ) = 0,7221
6
24
< 2 nie ma podstaw do odrzucenia 0

Marcin Topolewski, SGH

4
0,06
0,00
0,00
0,00
0,00
0,02
4 = 0,07
2 = 1,7815

47

Autokorelacja skadnika losowego test Durbina-Watsona (DW)


Wystpowanie autokorelacji skadnika losowego powoduje niespenienie Z4!
Test Durbina-Watsona bada wystpowanie autokorelacji I-go rzdu, czyli
= 1 + ,

|| < 1,

() = ,

2 () = 02 I,

02 < .

Brak autokorelacji
1 0 0
0 1 0
2( )
2
= 0 0 1

[0 0 0

0
0
0.

1]

Autokorelacja I-go rzdu


1

2
1

2
1
2
3 ,
2 () = 2 2

=
02 .

1

2
1

[1 2 3
1 ]
Estymator MNK pozostaje liniowy, nieobciony i zgodny ale nie jest najefektywniejszy.
Marcin Topolewski, SGH

48

Test Durbina-Watsona moemy stosowa, gdy w modelu:


- jest wyraz wolny
- ~
- nie wystpuje opniona zmienna objaniana, jako zmienna objaniajca.
Wwczas obliczamy statystyk
=2( 1 )2
= =
~(,)
=1 2
0; 4
Warto statystyki mona w przyblieniu obliczy, jako
2(1 )
gdzie jest oszacowaniem wspczynnika autokorelacji
=2 1
=
=2 2 =2 1 2

Marcin Topolewski, SGH

49

Wnioskowanie:
1) Gdy weryfikujemy hipotez o autokorelacji dodatniej ( < 2):
0 : = 0 - brak autokorelacji skadnika losowego
1 : > 0 - wystpuje autokorelacja dodatnia I-go rzdu

odrzucamy 0

< < brak decyzji


nie ma podstaw do odrzucenia 0

2) Gdy weryfikujemy hipotez o autokorelacji ujemnej ( > 2):


0 : = 0 - brak autokorelacji skadnika losowego
1 : < 0 - wystpuje autokorelacja ujemna I-go rzdu
4

odrzucamy 0

4 < < 4 brak decyzji


4

Marcin Topolewski, SGH

nie ma podstaw do odrzucenia 0

50

Odrzucamy
H0:
dodatnia
autokorelacja

Marcin Topolewski, SGH

dL

Brak
decyzji

Brak podstaw do odrzucenia


H0:
brak autokorelacji

dU

4-dU

Brak
decyzji

Odrzucamy
H0:
ujemna
autokorelacja

4-dL

51

Przykad cd.
= [ -0,49 0,10 0,12 -0,19 0,09 0,36 ],
6=2( 1 )2
=
6=1 2

n = 6, k = 2.

(0,1(0,49)) +(0,120,1)2 +(0,190,12)2 +(0,09(0,19)) +(0,360,09)2


(0,49)2 +0,12 +0,122 +(0,19)2 +0,092 +0,362

1,3508

Poniewa < 2 testujemy brak autokorelacji przeciwko wystpowaniu autokorelacji dodatniej:


0 : = 0 - brak autokorelacji skadnika losowego
1 : > 0 - wystpuje autokorelacja dodatnia I-go rzdu

=2

=3

=4

15

1,077

1,361

0,946

1,543

0,814

1,750

16

1,106

1,371

0,982

1,539

0,757

1,728

17

1,133

1,381

1,015

1,536

0,897

1,710

Dla = 0,05, = 6, = 2 -> najblisza warto krytyczna dla = 15: = 1,077, = 1,361
< 1,3508 < brak decyzji nie wiemy czy wystpuje autokorelacja, czy nie.
Marcin Topolewski, SGH

52

- nieobciony estymator :
2(1 ) 0,5 + 1, 0,5 1,3508 + 1 = 0,3246.
Model 1: Estymacja KMNK, wykorzystane obserwacje 2000:01-2000:06 (N = 6)
Zmienna zalena (Y): Y
wspczynnik bd standardowy t-Studenta warto p
--------------------------------------------------------------const
11,4121
1,49398
7,639
0,0047
***
X1
0,712460
0,122633
5,810
0,0102
**
X2
1,43770
0,117822
12,20
0,0012
***
redn.aryt.zm.zalenej 8,000000
Suma kwadratw reszt
0,434505
Wsp. determ. R-kwadrat 0,986422
F(2, 3)
108,9706
Logarytm wiarygodnoci 0,637708
Kryt. bayes. Schwarza
6,650694
Autokorel.reszt - rho1 0,143108

Marcin Topolewski, SGH

Odch.stand.zm.zalenej
Bd standardowy reszt
Skorygowany R-kwadrat
Warto p dla testu F
Kryt. inform. Akaike'a
Kryt. Hannana-Quinna
Stat. Durbina-Watsona

2,529822
0,380572
0,977370
0,001582
7,275416
4,774604
1,350780

53

Autokorelacja skadnika losowego test Breuscha Godfreya (LM)


Pozwala testowa wystpowanie autokorelacji rzdu 1, bez dodatkowych warunkw.
Szacujemy model podstawowy
= 0 + 1 1 + 2 2 + + +
(P)
W celu testowania autokorelacji skadnika losowego rzdu do wykorzystujemy reszty z modelu
podstawowego i szacujemy rwnanie regresji modelu pomocniczego
= 0 + 1 1 + 2 2 + + + +1 1 + + + +
(H)
Weryfikujemy hipotez
0 : 1 = = = 0 - brak autokorelacji skadnika losowego modelu podstawowego
1 : przynajmniej jeden parametr 0 - autokorelacja wystpuje
Obliczamy wspczynnik determinacji 2 modelu pomocniczego (H) i statystyk
= ( ) 2 ~ 2 ()
Wnioskowanie
> 2
-> odrzucamy 0
2 -> brak podstaw do odrzucenia 0

Marcin Topolewski, SGH

54

Heteroskedastyczno skadnika losowego


Heteroskedastyczno wariancja skadnika losowego nie jest staa.
Wystpowanie heteroskedastycznoci skadnika losowego powoduje niespenienie Z4!
Skadnik losowy homoskedastyczny

Skadnik losowy heteroskedastyczny

2
0
2( )
= 0

[0

12
0
2 () = 0

[0

0
2
0

0
0
2

0
0
0

2]

0
22
0

0
0
32

0
0
0

2 ]

2 <

Estymator MNK pozostaje liniowy, nieobciony i zgodny, ale nie jest najefektywniejszy.

Marcin Topolewski, SGH

55

Test White'a
Zastosowanie testu Whitea polega na oszacowaniu modelu pomocniczego, czyli regresji
kwadratw reszt z modelu podstawowego wzgldem zmiennych modelu podstawowego, oraz
ich kwadratw i iloczynw. Nastpnie na podstawie statystyki 2 ( 2 dla modelu
pomocniczego) weryfikujemy hipotez o cznej nieistotnoci wszystkich zmiennych modelu
pomocniczego rwnowan hipotezie o braku heteroskedastycznoci skadnika losowego w
modelu podstawowym.
Test Whitea dla dwch zmiennych objaniajcych
Model podstawowy
= 0 + 1 1 + 2 2 +

(P)

Model pomocniczy
2 = 0 + 1 1 + 2 2 + 3 12 + 4 22 + 5 1 2 +

(H)

Hipotezy
0 : 3 = 4 = 5 = 0 - jest homoskedastyczny ( 2 = )
1 : przynajmniej jeden parametr 0 - jest heteroskedastyczny ( 2 )
Weryfikacja
2 > 2 -> odrzucamy 0
2 2 -> brak podstaw do odrzucenia 0
Marcin Topolewski, SGH

56

Estymator HAC
Estymatorem odpornym na heteroskedastyczno skadnika losowego nieznanej postaci oraz
autokorelacj wyszych rzdw, ktrej mona si spodziewa w danych o wyszej czstotliwoci
(na przykad kwartalnej czy miesicznej) jest estymator asymptotycznej macierzy kowariancji
Neweya Westa. Wystpuje w nim parametr , nazywany pasmem przenoszenia (ang.
truncation lag), reprezentujcy rzd autokorelacji wykorzystany do oszacowania dynamiki reszt
MNK; autokorelacje rzdu wyszego ni uznawane s za nieistotne. W. K. Newey i K. D. West
zaproponowali nastpujcy wzr pozwalajcy ustali optymalny poziom pasma przenoszenia:

= [4 (100)

2
9

],

gdzie: jest wielkoci prby, a [] oznacza najwiksz liczb cakowit nie wiksz ni .
Wzr ten jest obecnie czci wikszoci pakietw ekonometrycznych. Pierwiastek kwadratowy
z elementu (, ) macierzy nazywany jest odpornym (na heteroskedastyczno i
autokorelacj) estymatorem bdu standardowego oszacowania parametru MNK Neweya
Westa (ang. HAC heteroskedasticity and autocorrelation consistent).

Marcin Topolewski, SGH

57

Wspliniowo zmiennych objaniajcych


dokadna wspliniowo wystpuje kombinacja liniowa zmiennych, co uniemoliwia
zastosowanie MNK (Z2)
przybliona (statystyczna) wspliniowoci - zmienne s silnie skorelowane, co powoduje, e
rednie bdy szacunku parametrw s due. Przez to po oszacowaniu modelu dostajemy
nieistotne zmienne przy wysokim wspczynniku determinacji.
Sposoby badania wspliniowoci:
macierz korelacji pomidzy zmiennymi (arbitralny),
wskanik uwarunkowania macierzy (CN), mierzcy wraliwo ocen parametrw na
niewielkie zmiany w danych i definiowany jako pierwiastek kwadratowy z ilorazu
najmniejszej i najwikszej wartoci wasnej macierzy . Im CN blisze jednoci tym lepiej
(nie wskazuje na konkretne zmienne).
czynnik inflacji wariancji
1
( ) =
1 2
gdzie 2 jest wspczynnikiem determinacji modelu, w ktrym -ta zmienna jest zmienn
objanian przez pozostae 1 zmiennych. CIWj pokazuje stopie podwyszenia (inflacji)
wartoci wariancji estymatora parametru j wywoany wspliniowoci zmiennych.
Dla = 1 wystpuje brak wspliniowoci, dla > 10 silna wspliniowo.
Marcin Topolewski, SGH

58

Usuwanie wspliniowoci
usuwanie zmiennych powodujcych wystpowanie zjawiska wspliniowoci,
zastpienie zmiennych powodujcych wspliniowo zmiennymi zastpczymi, nioscymi
podobn informacj merytoryczn, ale sabiej skorelowanymi z innymi zmiennymi modelu,
regresja grzbietowa.

Marcin Topolewski, SGH

59

Konstrukcja i weryfikacja modelu ekonometrycznego


- Dobr zmiennych objaniajcych
- Oszacowanie modelu MNK
- Badanie liniowoci modelu (test Reset)
- Badanie normalnoci rozkadu reszt (test Jarque-Bera)
- Badanie autokorelacji skadnika losowego (test DW)
- Badanie heteroskedastycznoci skadnika losowego (White'a)
- Badanie istotnoci zmiennych objaniajcych (test t-Studenta, test Walda)
- Ocena jakoci dopasowania modelu
- Weryfikacja merytoryczna, wasno koincydencji, interpretacja, prognozowanie

Marcin Topolewski, SGH

60

Predykcja ekonometryczna

Marcin Topolewski, SGH

61

Zasady predykcji:
Model powinien by wszechstronnie i pozytywnie zweryfikowany,
Relacje midzy zmiennymi winny by stabilne, w szczeglnoci:
wartoci parametrw,
posta analityczna modelu,
rozkad skadnika losowego (spenienie zaoe Z3 Z5),
Zasadna powinna by ekstrapolacja zmiennej objanianej i zmiennych objaniajcych poza
zakres obserwacji wykorzystanych do oszacowania modelu.
Predykcja nieobciona w przypadku w przypadku wielokrotnego wyznaczania prognozy w
takich samych warunkach bdy prognozy s wartociami losowymi o redniej rwnej zero. (Nie
popeniamy systematycznego bdu.)

Marcin Topolewski, SGH

62

Test Chowa test stabilnoci parametrw modelu


Szacujemy model
= 0 + 1 1 + 2 2 + + +
Obliczamy sum kwadratw reszt modelu (P)

(P)

= =1 2
Dzielimy okres obserwacji na dwa podokresy (podzia subiektywny lub wynikajcy z charakteru
danych lub badanego zjawiska). Szacujemy dwa modele (I) i (II) o postaci identycznej jak (P) ale
na dwch prbach odpowiadajcych podokresom.
Obliczamy
RSK(III) = RSK(I) + RSK(II),
RSK(IV) = RSK - RSK(III).
Obliczamy warto statystyki testowej
()/( + 1)
=
()/( 2( + 1))
Hipotezy
0 : parametry modelu (P) s stabilne - () = ( ) = (),
1 : parametry modelu (P) nie s stabilne.
Wnioskowanie
> - odrzucamy H 0 ,
gdzie F* jest wartoci krytyczn przy 1 = + 1 i 2 = 2( + 1) stopniach swobody.
Marcin Topolewski, SGH

63

Prognoza punktowa
Model po oszacowaniu

= 0 + 1 1 + 2 2 + + =
Warto zmiennych objaniajcych w okresie prognozy
= [1 1 2 ], > .
Prognoza warunkowa (zalena od przyjtych wartoci zmiennych objaniajcych)

=
Ocena ex ante prognozy punktowej
redni bd predykcji (prognozy) ex ante
2 () = 2 (1 + ( )1 ) = 1 + ( )1
= 2 +
Wzgldny redni bd prognozy ex ante

= 100%
| |

Marcin Topolewski, SGH

64

Prognoza przedziaowa
Jeeli skadnik losowy modelu ma rozkad normalny (spenione jest zaoenie 5.) to zmienna
losowa
| |
=

ma rozkad t-Studenta z ( + 1) stopniami swobody. Zatem


{|| < } = 1
| |
{
< } = 1

{ < < + } = 1
To znaczy, e z prawdopodobiestwem 1- prognozowana warto zmiennej objanianej mieci
si w przedziale
( ; + ).
1- jest miar wiarygodnoci prognozy.

Marcin Topolewski, SGH

65

Przykad c.d.
Na podstawie obserwacji dokonanych w fabryce zapaek SMOK WAWELSKI w cigu pierwszych 6
miesicy 2000 roku oszacowano model ekonometryczny nastpujcej postaci
= 11,41 + 0,711 1,442 , gdzie:
zysk w tys. z, 1 liczba podpisanych kontraktw, 2 cena siarki w tys. z za ton, czas,
= 1,2, , 6. Dane przedstawiaj si nastpujco:

1
2
3
4
5
6

Marcin Topolewski, SGH

8
5
5
9
10
11

1
8
7
9
11
10
9

2
6
8
9
7
6
5

66

Ponadto otrzymano

1
2
3
4
5
6

8,49
4,90
4,88
9,19
9,91
10,64

-0,49
0,10
0,12
-0,19
0,09
0,36

2
0,24
0,01
0,01
0,03
0,01
0,13
2 = 0,43

a) Wyznaczy prognoz punktow zysku dla kolejnego miesica przy zaoeniu, e w tym
miesicu podpisano 10 kontraktw, a cena siarki wyniosa 7 tys. z. Za ton.
b) Obliczy redni bd predykcji i wzgldny redni bd predykcji ex ante.
c) Wyznaczy prognoz przedziaow zysku przyjmujc poziom ufnoci 0,95.

Marcin Topolewski, SGH

67

a) Prognoza punktowa:
11,41
= [1 10 7] [ 0,71 ] = 8,473.
= [1 10 7],
=
1,44
Przewidywany zysk wyniesie 8 473 z.
b) Bd predykcji ex ante:

1 1 1 1
= [8 7 9 11
6 8 9 7

( )1

1 8 6
1 7 8
1 1
6
1 9 9
= [54
10 9]
1 11 7
6 5
41
1 10 6
[1 9 5]

15,41 1,07 0,83


0,1
0,02 ],
[1,07
0,83 0,02
0,09

Marcin Topolewski, SGH

54
41
496 367]
367 291

0,43

2 =
=
0,14.
( + 1)
3

68

redni bd predykcji ex ante wynosi


= 2 (1 + ( )1 )
15,41 1,07 0,83 1
0,1
0,02 ] [10]) 0,29.
= 0,14 (1 + [1 10 7] [1,07
0,83 0,02
0,09
7
Wzgldny redni bd predykcji ex ante wynosi

0,29
= 100% =
100% = 3,42%.
| |
|8,47|
c) Prognoza przedziaowa.
Z prawdopodobiestwem 1- prognozowana warto mieci si w przedziale
( ; + ).
Poziom ufnoci 1 = 0,95, zatem poziom istotnoci = 0,05.
Liczba stopni swobody ( + 1) = 6 (2 + 1) = 3. Warto krytyczna = (0,05;3) =
3,18.
Z prawdopodobiestwem 0,95 prognozowana warto zysku zawiera si w przedziale
(8,473 3,18 0,29 ; 8,473 + 3,18 0,29)
(7,548 ; 9,392)
Na 95% zysk wyniesie od 7 548 do 9 392 z.
Marcin Topolewski, SGH

69

Ocena ex post prognozy punktowej


redni bd predykcji ex post

1
= ( )

=1

Dla prognozy nieobcionej warto ME jest rwna 0.


redni absolutny bd predykcji ex post

1
| |

=1

Mwi o sile bdu prognozy.


redni absolutny bd procentowy ex post

1

= |
| 100%

=1

Informuje o redniej wielkoci bdw prognoz, wyraonej w procentach empirycznych wartoci


zmiennej prognozowanej.
Marcin Topolewski, SGH

70

Pierwiastek bdu redniokwadratowego

1
= ( )2

=1

Znaczna rozbieno pomidzy RMSE i MAE wiadczy o wystpieniu prognoz znacznie


odbiegajcych od wartoci rzeczywistych.
Wspczynnik Theila
2

=1( )
=
2

=1
2

Warto interpretuje si, jako przecitny wzgldny bd prognozy (moe by wyraony w %).
Ponadto 2 mona zapisa, jako sum trzech skadnikw, z ktrych kady dotyczy innego rda
powstawania bdw.

Marcin Topolewski, SGH

71

Wspczynnik rozbienoci

)2
1
(

=1

2 + 1 ( )2
1

=1
=1

< 0; 1 >. Dla prognozy w peni zgodnej z rzeczywistoci U = 0.

Marcin Topolewski, SGH

72

Przykad c.d.
W okresie od lipca do padziernika 2000 roku zaobserwowano nastpujce wartoci zmiennych:

1
2
7
8
10
7
8

10

10

13

10

13

11

Obliczy prognoz zysku dla tego okresu, a nastpnie omwi wasnoci prognostyczne modelu
= 11,41 + 0,711 1,442 .
Prognozowane wartoci zysku w badanym okresie (miesice nr 7, 8, 9, 10)
7 = [1 10 7],
11,41
= [1 10 7] [ 0,71 ] = 11,47 1 + 0,71 10 1,44 7 = 8,473.
7 = 7
1,44

Marcin Topolewski, SGH

73

8 = [1

10 6],

11,41
= [1 10 6] [ 0,71 ] = 11,47 1 + 0,71 10 1,44 6 = 9,911.
8 = 8
1,44
11,41
= [1 13 7] [ 0,71 ] = 11,47 1 + 0,71 13 1,44 7 = 10,610.
9 =
1,44

10
= = 10,623.
redni bd predykcji ex post (dla czterech okresw prognozy)
10

1
= ( )
4
=7

1
= [(8 8,473) + (9 9,911) + (10 10,610) + (13 10,623)]
4
1
= (0,473 0,911 0,610 + 2,377) = 0,096
4

Marcin Topolewski, SGH

74

redni absolutny bd predykcji ex post


10

1
1
|
|
= = (|8 8,473| + + |13 10,623|)
4
4
=7

1
= (0,473 + + 2,377) = 1,093
4
redni absolutny bd procentowy
10

1

1 8 8,473
13 10,623
= |
| 100% = (|
| + + |
|) 100%
4

4
8
13
=7

= 10,1%
Pierwiastek bdu redniokwadratowego
10

1
1
= ( )2 = [(8 8,473)2 + + (13 10,623)2 ]
4
4
=7

1
= (0,224 + + 5,650) = 1,330
4

Marcin Topolewski, SGH

75

Wspczynnik Thiela
2
10
(8 8,473)2 + + (13 10,623)2 0,224 + + 5,650
=7( )
=
=
=
2 + + 132
2
8
64 + + 169
10

=7
7,075
=
= 0,017
414
= 0,017 0,131 = 13,1%
2

Wspczynnik rozbienoci

)2
1 10
(

=7
4
2 + 1 10 ( )2
1 10

4 =7
4 =7
= 0,066

Marcin Topolewski, SGH

1 [(8 8,473)2 + + (13 10,623)2 ]


4
1 (82 + + 132 ) + 1 (8,4732 + + 10,6232 )
4
4

76

Dla 95% przedziau ufnoci, t(3, 0,025) = 3,182


Y
2000:05
2000:06
2000:07
2000:08
2000:09
2000:10

10,00
11,00
8,00
9,00
10,00
13,00

prognoza

bd ex ante

9,91
10,64
8,47
9,91
10,61
10,62

95% przedzia ufnoci

0,430
0,435
0,643
0,479

7,10
8,53
8,56
9,10

9,84
11,29
12,66
12,15

Miary dokadnoci prognoz ex post


redni bd predykcji
ME
Bd redniokwadratowy
MSE
Pierwiastek bdu redniokwadr. RMSE
redni bd absolutny
MAE
redni bd procentowy
MPE
redni absolutny bd procentowy MAPE
Wspczynnik Theila (w procentach) I

Marcin Topolewski, SGH

=
=
=
=
=
=
=

0,095847
1,7688
1,33
1,0927
-0,96133
10,104
13,073

77

redni bd predykcji jest bliski 0 prognoza nie jest obciona (nie popeniamy systematycznego
bdu przewidujc zbyt czsto wartoci mniejsze lub wiksze ni rzeczywiste).
Wartoci redniego absolutnego bdu predykcji i pierwiastka bdu redniokwadratowego maj
widocznie rne wartoci w okresie prognozy wystpiy bdy o duych wartociach (prognozy
znacznie odbiegajce od wartoci empirycznych prognozowanej zmiennej).
redni absolutny bd predykcji jest dosy wysoki (1,093) prognoza jest niezbyt dokadna.
Pierwiastek ze wspczynnika Thiela wynosi 0,131 przecitny wzgldny bd prognozy jest
zadowalajcy i wynosi 13,1%, co potwierdza wnioski wycignite na podstawie MAPE = 10,1%.

Marcin Topolewski, SGH

78

Stacjonarno i integracja

Marcin Topolewski, SGH

79

REGRESJA POZORNA
Przykad
120

12000

y (prawy)
x (lewy)

100

10000

80

8000

60

6000

40

4000

20

2000

-20

-2000
0

Marcin Topolewski, SGH

20

40

60

80

100

80

Przykad c.d.
Model 1: Estymacja KMNK z wykorzystaniem 100 obserwacji 1-100
Zmienna zalena: y
Zmienna Wspczynnik Bd stand. Statystyka t warto p
const
-1666,3
152,882
-10,8993
<0,00001 ***
x
100,195
2,61878
38,2600
<0,00001 ***
Srednia arytmetyczna zmiennej zalenej = 3393,58
Odchylenie standardowe zmiennej zalenej = 3046,46
Suma kwadratw reszt = 5,76527e+007
Bd standardowy reszt = 767,003
Wsp. determinacji R2 = 0,937253
Skorygowany R2 = 0,936613
Stopnie swobody = 98
Statystyka testu Durbina-Watsona = 0,105219
Autokorelacja reszt rzdu pierwszego = 0,938968

WNIOSEK
Statystyka = / dla modeli, w ktrych wystpuj szeregi niestacjonarne nie ma rozkadu tStudenta, a estymator MNK jest zwykle obciony. Modelowanie zmiennoci takich szeregw
wymaga zbadania stopnia integracji kadej zmiennej i ewentualne sprowadzenia
niestacjonarnego szeregu do szeregu stacjonarnego.
Marcin Topolewski, SGH

81

STACJONARNO
Definicja
Proces stochastyczny { } jest cile stacjonarny, jeli czne i warunkowe rozkady
prawdopodobiestwa procesu nie zmieniaj si przy przesuniciach w czasie. To znaczy czny
rozkad zmiennych 1 , 2 , , jest taki sam jak czny rozkad zmiennych
1+ , 2+ , , + , dla dowolnych indeksw , dowolnego i .
Definicja
Proces stochastyczny { } jest sabo stacjonarny, jeeli warto oczekiwana i wariancja procesu
s stae w czasie, a warto kowariancji dla dwch momentw obserwacji zaley tylko od odstpu
midzy nimi, a nie od samych momentw obserwacji. Czyli, gdy:
( ) = ,
( ) = 2 < ,
( , + ) = ( , + ) = .
Dalej przyjmujemy, e szereg czasowy { } jest realizacj procesu stochastycznego { } i mwimy
o stacjonarnoci szeregw czasowych.

Marcin Topolewski, SGH

82

SZEREGI ZINTEGROWANE
Definicja
Szereg niestacjonarny, ktry mona sprowadzi do szeregu stacjonarnego, obliczajc pierwsze
przyrosty razy nazywamy szeregiem zintegrowanym stopnia i oznaczamy ().
Warto zauway, e
dla ~ (0) i ~ (), szereg ( + ) ~ (),
dla ~ () szereg ( + ) ~ (), gdzie i s staymi.
Operator rnicowy
Pierwsze przyrosty szeregu mona zapisa za pomoc operatora rnicowego
= 1 .
W wyniku dwukrotnego obliczenia pierwszych przyrostw otrzymujemy

2 = = ( 1 ) = ( 1 ) (1 2 ) = 21 + 2 .
Oglnie, szereg krotnie rnicowany oznaczymy

.
Marcin Topolewski, SGH

83

BADANIE STACJONARNOCI
Jeeli zmienna ~ (1), to jest stacjonarna (ma sta redni i wariancj) i podlega jedynie
losowym odchyleniom. Moemy napisa, e
= 1 = ,
gdzie jest czystym skadnikiem losowym. Aby stwierdzi, czy jest zintegrowane
pierwszego stopnia naley zbada regresj
= 1 + ,
Jeli wspczynnik = 1, to szereg jest niestacjonarny. Jeli < 1 to szereg jest
stacjonarny. Jednak weryfikacja hipotezy = 1, za pomoc testu t-Studenta dla regresji dwch
zmiennych zintegrowanych nie przynosi dobrych rezultatw. Dlatego bada si rwnowan
regresj
= (1 + )1 + , gdzie
1 = 1 + ,
= 1 + .

Marcin Topolewski, SGH

(1 + ) = .

84

DF - test Dickeya-Fullera (test pierwiastka jednostkowego)


W tecie Dickeya-Fullera, dla regresji

= 1 + .
weryfikujemy hipotez
0 : = 0;
szereg jest niestacjonarny, przeciwko
1 : < 0 ;
szereg jest stacjonarny (czyli ~(0)).
Statystyka obliczeniowa

Statystyka DF nie ma rozkadu t-Studenta! Wartoci krytyczne odczytujemy dla okrelonej liczby
obserwacji z tablic dla testu Dickeya-Fullera (maj one wartoci ujemne, ale w tablicach znak moe by pominity!) i wnioskujemy:
<

Marcin Topolewski, SGH

odrzucamy 0 - szereg jest stacjonarny


nie ma podstaw do odrzucenia 0 - szereg jest niestacjonarny.
85

Jeeli szereg jest niestacjonarny, to w celu zbadania stopnia integracji w analogiczny sposb
badamy stacjonarno szeregu . Metod najmniejszych kwadratw szacujemy regresj

= 1 + .
i weryfikujemy hipotez
0 : = 0;
1 : < 0;

szereg jest niestacjonarny, przeciwko


szereg jest stacjonarny ~ (0), czyli ~ (1).

Jeeli i w tym przypadku nie moemy odrzuci 0 , to badamy stacjonarno kolejnych przyrostw
, itd. Postpujemy tak a do odrzucenia 0 lub do momentu w ktrym uznamy, e badanie
nastpnych przyrostw nie ma sensu. Zwykle szeregi ekonomiczne nie s zintegrowane w stopniu
wyszym ni 2, zatem zbytnie przeciganie procedury nie ma sensu.

Marcin Topolewski, SGH

86

ADF - rozszerzony test Dickeya-Fullera


Test DF nie uwzgldnia moliwoci wystpowania autokorelacji skadnika losowego. Dlatego jeli
podejrzewamy autokorelacj skadnika losowego stosujemy rozszerzony test Dickeya-Fullera
(ADF). Wwczas w analogiczny sposb jak w tecie DF badamy regresj

= 1 + + .
=1

Wartoci krytyczne dla testu ADF s inne ni dla DF i zale od liczby opnie!
W doborze liczby opnie mona kierowa si statystyk DW.

Marcin Topolewski, SGH

87

Test Dickeya-Fullera moe rwnie wystpowa w wersji zawierajcej wyraz wolny i trend.
Odpowiednie rwnania przedstawiaj si wwczas nastpujco:
- jeeli w rwnaniu wystpuje staa

= + 1 + .
- jeeli w rwnaniu wystpuje trend deterministyczny

= + + 1 + .
W tym przypadku odrzucenie hipotezy zerowej oznacza, e szereg jest trendostacjonarny
(testujemy brak stacjonarnoci przeciwko trendostacjonarnoci).
Wartoci krytyczne zale od postaci skadowej deterministycznej. Niestety nie ma
jednoznacznych kryteriw wyboru odpowiedniej postaci testu. Polecane jest stosowanie wersji
bardziej rozbudowanych, czyli ze sta lub trendem.

Marcin Topolewski, SGH

88

Operator opnie (operator przesunicia) dla pierwszych opnie


= 1 ,
dla drugich opnie zapiszemy jako
2 = = 1 = 2 ,
a oglnie dla opnienia
= .
Pomidzy operatorem rnicowym , a operatorem opnie zachodzi relacja

= 1 = = (1 ) ,
czyli

= (1 ).
atwo pokaza, e dla opnie wyszego rzdu zachodzi

= (1 ) .

Marcin Topolewski, SGH

89

Przykad cd.
Rozszerzony test Dickeya-Fullera dla rzdu opnienia 4, dla zmiennej x
liczebno prby 95
Hipoteza zerowa: wystpuje pierwiastek jednostkowy a = 1; proces I(1)
test z wyrazem wolnym (const)
model: (1 - L)y = b0 + (a-1)*y(-1) + ... + e
Autokorelacja reszt rzdu pierwszego: -0,041
estymowana warto (a-1) wynosi: 0,00193042
Statystyka testu: tau_c(1) = 0,20825
asymptotyczna warto p = 0,9732
Rozszerzony test Dickeya-Fullera dla rzdu opnienia 4, dla zmiennej y
liczebno prby 95
Hipoteza zerowa: wystpuje pierwiastek jednostkowy a = 1; proces I(1)
test z wyrazem wolnym (const)
model: (1 - L)y = b0 + (a-1)*y(-1) + ... + e
Autokorelacja reszt rzdu pierwszego: 0,001
estymowana warto (a-1) wynosi: 0,0538374
Statystyka testu: tau_c(1) = 5,87135
asymptotyczna warto p = 1

Szeregi i z powyszego przykadu s niestacjonarne.


Marcin Topolewski, SGH

90

Przykad cd.
W celu zbadania stopnia zintegrowania obliczmy pierwsze przyrosty = 1 :
12

10

d_x

-2

-4

-6

-8

-10
0

20

40

60

80

100

Rozszerzony test Dickeya-Fullera dla rzdu opnienia 4, dla zmiennej d_x


liczebno prby 94
Hipoteza zerowa: wystpuje pierwiastek jednostkowy a = 1; proces I(1)
test z wyrazem wolnym (const)
model: (1 - L)y = b0 + (a-1)*y(-1) + ... + e
Autokorelacja reszt rzdu pierwszego: -0,019
estymowana warto (a-1) wynosi: -3,29334
Statystyka testu: tau_c(1) = -7,76513
asymptotyczna warto p = 2,408e-012

Szereg jest stacjonarny.


Marcin Topolewski, SGH

91

Przykad cd.
Pierwsze przyrosty = 1 :
800

600

d_y

400

200

-200

-400
0

20

40

60

80

100

Rozszerzony test Dickeya-Fullera dla rzdu opnienia 4, dla zmiennej d_y


liczebno prby 94
Hipoteza zerowa: wystpuje pierwiastek jednostkowy a = 1; proces I(1)
test z wyrazem wolnym (const)
model: (1 - L)y = b0 + (a-1)*y(-1) + ... + e
Autokorelacja reszt rzdu pierwszego: -0,044
estymowana warto (a-1) wynosi: -0,679516
Statystyka testu: tau_c(1) = -2,38817
asymptotyczna warto p = 0,1451

Szereg jest niestacjonarny.


Marcin Topolewski, SGH

92

Dopiero obliczenie drugich przyrostw sprowadza szereg do szeregu stacjonarnego:

2 = = ( 1 ) = ( 1 ) (1 2 ) = 21 + 2 .
1000

800

600

d_d_y

400

200

-200

-400

-600

-800
0

20

40

60

80

100

Rozszerzony test Dickeya-Fullera dla rzdu opnienia 4, dla zmiennej d_d_y


liczebno prby 93
Hipoteza zerowa: wystpuje pierwiastek jednostkowy a = 1; proces I(1)
test z wyrazem wolnym (const)
model: (1 - L)y = b0 + (a-1)*y(-1) + ... + e
Autokorelacja reszt rzdu pierwszego: -0,098
estymowana warto (a-1) wynosi: -6,37248
Statystyka testu: tau_c(1) = -9,92285
asymptotyczna warto p = 5,866e-019

Szereg jest stacjonarny.


Marcin Topolewski, SGH

93

Zatem dla powyszego przykadu mamy:


~ (0), ~ (1),
~ (0), ~ (1), ~ (2).
SEZONOWO
Definicja
Szereg niestacjonarny jest sezonowo zintegrowany stopnia (, ), jeli mona go sprowadzi do
szeregu stacjonarnego obliczajc przyrosty sezonowe razy, a potem wyznaczajc pierwsze
przyrosty uzyskanego szeregu razy. Taki szereg oznaczamy (, ).
Zgodnie z wczeniejsz uwag moliwe jest istnienie szeregw (0,1). Nawet, jeli
niesezonowa skadowa szeregu jest zintegrowana stopnia 1, to moe si zdarzy, e obliczenie
samych przyrostw sezonowych usunie niestacjonarno (zwaszcza, gdy trend ma charakter
addytywny).
Sezonowy operator rnicowy
Obliczenie przyrostw sezonowych wymaga uycia sezonowego operatora rnicowego
= ,
gdzie parametr oznacza sezonowo danych, np. = 12 dla danych miesicznych, = 4 dla
kwartalnych.
Marcin Topolewski, SGH

94

Proces autoregresyjny rzdu , ()


Proces postaci
= + 1 1 + 2 2 + + +
gdzie jest czystym (speniajcym zaoenia Z3, Z4) skadnikiem losowym, bdziemy nazywa
procesem autoregresyjnym rzdu , w skrcie ().
Wykorzystujc operator opnie
= ,
proces AR(p) moemy zapisa jako
= + 1 + 2 2 + + + ,
a po przeniesieniu opnionych zmiennych na lew stron
1 2 2 = + ,
(1 1 2 2 ) = + .
Nastpnie stosujc tak zwany wielomian opnie
() = 1 1 2 2
zapisujemy () jako
() = + .
Marcin Topolewski, SGH

95

Proces redniej ruchomej rzdu , ()


Proces postaci
= + + 1 1 + +
gdzie jest czystym skadnikiem losowym, bdziemy nazywa procesem redniej ruchomej
rzdu , w skrcie ().
Analogicznie wykorzystujc operator opnie i definiujc wielomian opnie () jako
() = 1 + 1 + 2 2 + +
proces () moemy zapisa jako
= + () .

Marcin Topolewski, SGH

96

Proces autoregresji i redniej ruchomej, (, )


W wyniku poczenia procesw autoregresyjnego i redniej ruchomej otrzymujemy model
(, ) nastpujcej postaci
= + 1 1 + 2 2 + + + + 1 1 + + .
Wykorzystujc wielomiany opnie odpowiednio stopnia p i q model moemy zapisa jako
() = + () .
W celu ustalenia stopni opnie i mona oszacowa modele dla wszystkich moliwych
, = 0, 1, 2 i wybra (po weryfikacji statystycznej) najlepszy.
Zintegrowany proces autoregresji i redniej ruchomej, (, , )
W przypadku gdy zmienna nie jest stacjonarna, lecz zintegrowana stopnia , mwimy o
procesie (, , ). W celu zwizego zapisu tego procesu skorzystamy z zalenoci
czcej operator opnie z operatorem rnicowym

= (1 ) .
Zatem proces (, , ), w ktrym jest zintegrowane stopnia , zapiszemy jako
()(1 ) = + () .
Marcin Topolewski, SGH

97

Kointegracja

Marcin Topolewski, SGH

98

KOINTEGRACJA
Jeli istnieje dugookresowy zwizek miedzy niestacjonarnymi zmiennymi, a odchylenia od ich
dugookresowej cieki rwnowagi s stacjonarne, to zmienne te s skointegrowane.
Definicja
Szeregi czasowe i s skointegrowane, jeeli:
1) kady z szeregw jest zintegrowany stopnia ,
2) istnieje kombinacja liniowa tych zmiennych, np. 1 + 2 , ktra jest stacjonarna
Wektor [1 2 ] nazywamy wektorem kointegrujcym.
Testowanie kointegracji
Testowanie kointegracji opiera si na zaoeniu, e kointegracja powoduje stacjonarno bdu
rwnowagi. Dla zmiennych i pozostajcych w dugookresowej rwnowadze mamy
= 0 + 1 + ,
= 0 1 .
gdzie jest bdem rwnowagi. Jeeli odchylenia od cieki rwnowagi maj by tylko chwilowe,
to bd rwnowagi jest stacjonarny, czyli
~ (0),
a o zmiennych i (dokadnie o zmiennych [ 1 ]) mwimy, e s skointegrowane
wektorem kointegrujcym [1 0 1 ].
Marcin Topolewski, SGH

99

Dlatego w celu okrelenia czy zmienne s skointegrowane testuje si stacjonarno reszt


powyszego modelu. Po oszacowaniu parametrw regresji, co jest tosame z oszacowaniem
wektora kointegracji, dostajemy reszty
= 0 1 ,
i w celu zbadania ich stacjonarnoci stosujemy test pierwiastka jednostkowego do modelu

= 1 + ,
gdzie jest czystym skadnikiem losowym. Wartoci krytyczne odczytujemy w tablicach testu
kointegracji DF z parametrem m rwnym liczbie skadowych wektora kointegrujcego. Tablice te
s skorygowanymi tablicami DF.
W przypadku braku podstaw do odrzucenia 0 mwicej o niestacjonarnoci bdu rwnowagi
testujemy stacjonarno pierwszych rnic bdu rwnowagi e t i dalej ewentualnie wysze
stopnie integracji, a do odrzucenia 0 .
W przypadku wystpowania autokorelacji skadnika losowego wykorzystujemy test ADF
zastosowany do reszt

= 1 + + .
=1
Marcin Topolewski, SGH

100

Przykad c.d.
Zbadajmy kointegracj zmiennych = i . Jak pamitamy obie zmienne s zintegrowane
w stopniu pierwszym, czyli ~ (1), ~ (1).
W tym celu szacujemy model
= +
Model 1: Estymacja KMNK z wykorzystaniem 99 obserwacji 2-100
Zmienna zalena: d_y
Zmienna

Wspczynnik

Bd stand.

Statystyka t

warto p

2,12464

0,304707

6,9727

<0,00001 ***

Srednia arytmetyczna zmiennej zalenej = 105,56


Odchylenie standardowe zmiennej zalenej = 189,956
Suma kwadratw reszt = 3,10091e+006
Bd standardowy reszt = 177,882
Wsp. determinacji R2 = 0,331601
Skorygowany R2 = 0,331601
Statystyka F (1, 98) = 48,6189 (warto p < 0,00001)
Statystyka testu Durbina-Watsona = 2,79555
Autokorelacja reszt rzdu pierwszego = -0,399816
Logarytm wiarygodnoci = -652,903
Kryterium informacyjne Akaike'a = 1307,81
Kryterium bayesowskie Schwarza = 1310,4
Kryterium infor. Hannana-Quinna = 1308,86
Marcin Topolewski, SGH

101

Nastpnie badamy stacjonarno reszt modelu za pomoc testu DF (ADF)


Rozszerzony test Dickeya-Fullera dla rzdu opnienia 2, dla zmiennej uhat
liczebno prby 96
Hipoteza zerowa: wystpuje pierwiastek jednostkowy a = 1; proces I(1)
test z wyrazem wolnym (const)
model: (1 - L)y = b0 + (a-1)*y(-1) + ... + e
Autokorelacja reszt rzdu pierwszego: -0,017
estymowana warto (a-1) wynosi: -2,82032
Statystyka testu: tau_c(1) = -11,3746
asymptotyczna warto p = 1,149e-023

Przy bardzo niskim empirycznym poziomie istotnoci p = 1,149e-023 odrzucamy 0 o


niestacjonarnoci reszt , reszty s wic stacjonarne, ~ (0). Oznacza to, e znaleziony zosta
wektor kointegrujcy dla zmiennych i
[1 2,12464]
a relacja tych zmiennych
2,12464 =
pozostaje w dugookresowej rwnowadze ( jest szeregiem stacjonarnym).
Marcin Topolewski, SGH

102

Model korekty bdem


Przyjmijmy, e zmienne i s (1) i pozostaj w dugookresowej relacji rwnowagi
= .
Wwczas po oszacowaniu modelu
= + ,
za pomoc testu DF lub ADF badamy hipotez o stacjonarnoci reszt i jeli s one stacjonarne
przyjmujemy wektor kointegrujcy [1 ].
Krtkookresowy model z mechanizmem korekty bdem ma posta

= 1 + 2 1 + ,
lub

= 1 + 2 (1 1 ) + ,
gdzie zmienne , oraz 1 = (1 1 ) s stacjonarne.
Marcin Topolewski, SGH

103

Przykad c.d.
Dla badanych wczeniej zmiennych zt i xt model korekty bdem przyjmie posta

= 1 + 2 (1 2,124641 ) + ,
a po oszacowaniu otrzymujemy nastpujce wyniki
Model 2: Estymacja KMNK z wykorzystaniem 98 obserwacji 3-100
Zmienna zalena: d_d_y
Zmienna
d_x
uhat_1

Wspczynnik
32,0085
-1,3056

Bd stand.
Statystyka t
4,029
7,9445
0,0755998
-17,2698

warto p
<0,00001 ***
<0,00001 ***

Srednia arytmetyczna zmiennej zalenej = 0,788464


Odchylenie standardowe zmiennej zalenej = 302,333
Suma kwadratw reszt = 1,65177e+006
Bd standardowy reszt = 131,171
Wsp. determinacji R2 = 0,813704
Skorygowany R2 = 0,811763
Statystyka F (2, 96) = 209,654 (warto p < 0,00001)
Statystyka testu Durbina-Watsona = 2,42077
Autokorelacja reszt rzdu pierwszego = -0,215572
Logarytm wiarygodnoci = -615,943
Kryterium informacyjne Akaike'a = 1235,89
Kryterium bayesowskie Schwarza = 1241,06
Kryterium infor. Hannana-Quinna = 1237,98

Ostatecznie model korekty bdem dla badanych zmiennych zapiszemy jako


= 32,0085 1,3056(1 2,124641 ),
= 32,0085 1,30561 .
Marcin Topolewski, SGH

104

Integracyjna statystyka Durbina-Watsona


Jeeli potrzebna jest jedynie wstpna wskazwka, co do stacjonarnoci zmiennej , moemy
obliczy dla niej statystyk typu statystyki DW
( 1 )2
=
.
( )2
Jeeli statystyka przyjmuje wartoci bliskie zera, to jest to wskazwka, e zmienna moe nie
by stacjonarna. W przypadku wartoci IDW bliskich 2, mona w miar bezpiecznie zakada, e
zmienna jest stacjonarna.
W przypadku badania kointegracji analogiczna statystyka ma posta
( 1 )2
=
.
2
Jeli statystyka CIDW przyjmuje wartoci bliskie zera to moliwe, e zmienne nie s
skointegrowane. Istnieje prosta regua kciuka, ktra mwi, e jeeli CIDW > R2, gdzie R2 jest
wspczynnikiem determinacji dla regresji zmiennych ktre podejrzewamy o kointegracj, to
kointegracja moe wystpowa.
Marcin Topolewski, SGH

105

Model ze skoczonym rozkadem opnie (DL(p))


= + 0 + 1 1 + 2 2 + + + .
Bieca warto zmiennej zaley od biecej wartoci zmiennej oraz jej wartoci w
poprzednich okresach.
Na przykad dla = 2
= + 0 + 1 1 + 2 2 + .
Mnonik krtkookresowy
0 - zmiana wartoci zmiennej spowodowana jednostkow zmian w tym samym czasie.
Mnonik dugookresowy

= =0 = 0 + 1 + 2 + + - wpyw jednostkowych przyrostw wszystkich


zmiennych objaniajcych (opnionych i nieopnionej).
Wagi
=

udzia wpywu zmiennej opnionej o i okresw w cakowitym efekcie

oddziaywania zmiennej egzogenicznej na zmienn endogeniczn .


rednie opnienie
=0
=
.

Marcin Topolewski, SGH

106

Przykad
Ponisza tabela zawiera dane dotyczce miesicznych dochodw i wydatkw na konsumpcj.
Numer okresu
5
6
7
8
9
10

30
31
32

KONS(t)
1429,70
1506,80
1608,90
1629,80
1594,40
1752,70

DOCH(t)
1575,00
1725,00
1875,00
1800,00
1725,00
2100,00

2609,00 3000,00
2742,20 3150,00
2913,00 3375,00

DOCH(t-1)
1650,00
1575,00
1725,00
1875,00
1800,00
1725,00

DOCH(t-2)
1500,00
1650,00
1575,00
1725,00
1875,00
1800,00

2850,00
3000,00
3150,00

2700,00
2850,00
3000,00

Posta modelu przed oszacowaniem


= + 0 + 1 1 + 2 2 + .
Posta modelu po oszacowaniu
= 21,47 + 0,4999 + 0,251 + 0,1392 .

(0,08) (0,0001)
Marcin Topolewski, SGH

(0,0001)

(0,0001)
107

Posta modelu przed oszacowaniem


= + 0 + 1 1 + 2 2 + .
Posta modelu po oszacowaniu
= 21,47 + 0,4999 + 0,251 + 0,1392 .

(0,08) (0,0001)

(0,0001)

(0,0001)

Mnonik krtkookresowy to ocena parametru przy nieopnionej wartoci dochodu:


0 = 0,4999.
To znaczy, e wzrost dochodu w danym miesicu o zotwk powoduje wzrost wydatkw na
konsumpcj o ok. 50 groszy, w tym samym miesicu.
Mnonik dugookresowy jest rwny sumie wszystkich ocen parametrw przy biecej oraz
opnionych wartociach dochodu:
2

= = 0 + 1 + 2 = 0,4999 + 0,25 + 0,139 = 0,8889.


=0

To znaczy, e wzrost dochodu w danym miesicu o zotwk powoduje, wzrost wydatkw na


konsumpcj cznie o ok. 89 groszy.
Marcin Topolewski, SGH

108

Wagi
Zmiana dochodu o jedn zotwk w danym miesicu spowoduje zwikszenie wydatkw
konsumpcyjnych w tym samym miesicu o
0 =

0 0,4999
=
0,56 = 56%.

0,8889

Czyli, 56% cakowitego wzrostu konsumpcji nastpuje w tym samym miesicu, co wzrost
dochodu.
Zmiana dochodu o jedn zotwk w danym miesicu spowoduje zwikszenie wydatkw
konsumpcyjnych w nastpnym miesicu o
1 =

1
0,25
=
0,28 = 28%.

0,8889

Czyli po upywie miesica od wzrostu dochodu obserwujemy 56% + 28% = 84% cakowitego
wzrostu konsumpcji pod wpywem wzrostu dochodu.

Marcin Topolewski, SGH

109

Zmiana dochodu o jedn zotwk w danym miesicu spowoduje zwikszenie wydatkw


konsumpcyjnych za dwa miesice o
2
0,139
2 =
=
0,16 = 16%.

0,8889
Czyli po upywie dwch miesicy od wzrostu dochodu obserwujemy 56% + 28% + 16% =
100% cakowitego wzrostu konsumpcji pod wpywem wzrostu dochodu.
rednie opnienie
2=0 0 0,4999 + 1 0,25 + 2 0,139
=
=
0,594.

0,8889
Wzrost dochodu powoduje efekt wzrostu konsumpcji rednio po 0,594 miesica.

Marcin Topolewski, SGH

110

Model z nieskoczonym rozkadem opnie


= + 0 + 1 1 + 2 2 + + .
Model Koycka
Zakadamy, e parametry przy opnionej zmiennej malej geometrycznie i zwizane s
zalenoci
= 0 = 1 , gdzie
= 0,1,2, oraz 0 < < 1.
Po transformacji Koycka otrzymujemy model autoregresyjny zwany modelem Koycka
= 0 + 0 + 1 + ,
gdzie 0 = (1 ) oraz = 1 .
Mnonik krtkookresowy
0 - zmiana wartoci zmiennej spowodowana jednostkow zmian w tym samym czasie.
Mnonik dugookresowy
= 0 + 1 + 2 + = 0 + 0 + 0 2 + = 0

1
1

suma nieskoczonego szeregu geometrycznego o pierwszym wyrazie 0 i ilorazie ,


stopa zaniku opnie.
Marcin Topolewski, SGH

111

(Transformacja Koycka)

Model z nieskoczonym rozkadem opnie dla okresu


= + 0 + 1 1 + 2 2 + + .
Model z nieskoczonym rozkadem opnie dla okresu 1
1 = + 0 1 + 1 2 + 2 3 + + 1 .
Po pomnoeniu obustronnie przez modelu dla okresu 1 mamy
1 = + 0 1 + 1 2 + 2 3 + + 1 .
Odejmujc stronami od modelu dla okresu t i wykorzystujc zaleno = 0 ,
1 = + 0 + 1 1 + 2 2 + + 1 1 2 2 1 .
Po uporzdkowaniu
= (1 ) + 0 + 1 + 1 .
Przy przyjtych wczeniej oznaczeniach
= 0 + 0 + 1 + .

Marcin Topolewski, SGH

112

Przykad
Podjto prb estymacji modelu z transformacj Koycka. Zmienn objanian jest konsumpcja
lodw w rodzinie Kowalskich, za objaniajc - ich dochody.
Posta modelu przed transformacj
= + 0 + 1 1 + 2 2 + + , gdzie = 0 .
Posta modelu po transformacji
= 0 + 0 + 1 + .
Posta modelu po oszacowaniu
= 0,85 + 0,34 + 0,4611 .

Mnonik krtkookresowy 0 = 0,34.


1

Mnonik dugookresowy = 0 1 = 0,34 10,461 0,63.


Parametry modelu pierwotnego
0
0 = (1 ) => =
= 1,5775
(1 )
1 = 0 = 0,34 0,461 0,1568, 2 = 0 2 = 0,34 0,4612 0,0723, 3 = 0,0333
= 1,5775 + 0,34 + 0,15681 + 0,07232

+ 0,03332 +
Marcin Topolewski, SGH

113

Model autoregresyjny z rozkadem opnie (ADL(p,q))


Model, w ktrym wystpuj opnione wartoci zmiennej endogenicznej i egzogenicznej
= 0 + 1 1 + 2 2 + + + 0 + 1 1 + 2 2 + + +
Na przykad model ADL(2,2) ma posta
= 0 + 1 1 + 2 2 + 0 + 1 1 + 2 2 +
Mnonik dugookresowy
=

=0

1 =1

Mnonik
dugookresowy
pozwala
na
wyznaczenie
wektora
kointegrujcego
[1 ] dla zmiennych i (o ile reszty = s stacjonarne) i zapisanie modelu
korekty bdem w postaci

= 1 + 2 (1 1 ) +
Marcin Topolewski, SGH

114

Przykad
Model 3: Estymacja KMNK z wykorzystaniem 97 obserwacji 4-100
Zmienna zalena: d_y
Zmienna Wspczynnik
x
38,1028
x_1
-16,4272
x_2
-18,5855
d_y_1
-0,619288
d_y_2
-0,300069

Bd stand.
4,20266
5,33891
5,0306
0,0905466
0,0747605

Statystyka t warto p
9,0664
<0,00001
-3,0769
0,00276
-3,6945
0,00037
-6,8394
<0,00001
-4,0137
0,00012

***
***
***
***
***

Srednia arytmetyczna zmiennej zalenej = 104,766


Odchylenie standardowe zmiennej zalenej = 191,658
Suma kwadratw reszt = 1,16027e+006
Bd standardowy reszt = 112,301
Wsp. determinacji R2 = 0,747273
Skorygowany R2 = 0,736285

Dla tego modelu mnonik dugookresowy wynosi


0 + 1 + 2 38,1028 16,4272 18,5855

=
=
4,0095
1 1 2
1 + 0,619288 + 0,300069

Marcin Topolewski, SGH

115

Zatem relacja kointegrujca pomidzy zmiennymi i wyznaczona przy pomocy modelu


ADL(2,2) ma posta
= 4,0095
o ile oczywicie reszty s stacjonarne.
Rozszerzony test Dickeya-Fullera dla rzdu opnienia 1, dla zmiennej u
liczebno prby 97
Hipoteza zerowa: wystpuje pierwiastek jednostkowy a = 1; proces I(1)
test z wyrazem wolnym (const)
model: (1 - L)y = b0 + (a-1)*y(-1) + ... + e
Autokorelacja reszt rzdu pierwszego: 0,005
estymowana warto (a-1) wynosi: -1,52406
Statystyka testu: tau_c(1) = -9,49038
asymptotyczna warto p = 1,393e-017

Test ADF potwierdzi stacjonarno reszt, co pozwala przyj wektor kointegrujcy


[1 4,0095]. Tym samym krtkookresowa relacja pomidzy zmiennymi i moe by
zapisana przy wykorzystaniu modelu korekty bdem, gdzie bd okrelony jest poprzez
zastosowanie mnonika dugookresowego z modelu ADL(2,2):

= 1 + 2 (1 4,00951 ) +
Oszacowanie takiego modelu daje nastpujce wyniki:
Marcin Topolewski, SGH

116

Model 4: Estymacja KMNK z wykorzystaniem 98 obserwacji 3-100


Zmienna zalena: d_d_y
Zmienna
d_x
uhat_1

Wspczynnik
28,5728
-0,886145

Bd stand. Statystyka t warto p


6,17597
4,6264
0,00001
0,0989345
-8,9569
<0,00001

***
***

Srednia arytmetyczna zmiennej zalenej = 0,788464


Odchylenie standardowe zmiennej zalenej = 302,333
Suma kwadratw reszt = 3,69529e+006
Bd standardowy reszt = 196,195
Wsp. determinacji R2 = 0,583223
Skorygowany R2 = 0,578881
Statystyka F (2, 96) = 67,1695 (warto p < 0,00001)
Statystyka testu Durbina-Watsona = 1,77179
Autokorelacja reszt rzdu pierwszego = 0,103587
Logarytm wiarygodnoci = -655,399
Kryterium informacyjne Akaike'a = 1314,8
Kryterium bayesowskie Schwarza = 1319,97

Czyli

= 28,578 0,8861(1 4,00951 ),

= 28,578 0,88611
.
Marcin Topolewski, SGH

117

Modele nieliniowe

Marcin Topolewski, SGH

118

Nieliniowe modele ekonometryczne


Model cile liniowy to taki, ktry jest liniowy wzgldem zmiennych i parametrw, czyli:
ma pochodne czstkowe wzgldem parametrw niezalene od kadego parametru,
ma pochodne czstkowe wzgldem zmiennych niezalene od kadej zmiennej.
Podzia na modele liniowe/nieliniowe wzgldem parametrw jest w ekonometrii waniejszy od
podziau na modele liniowe/nieliniowe wzgldem zmiennych.
Model liniowy
Przykad modelu cile liniowego
= 0 + 1 1 + 2 2 + + + .
Korzyci zwizane z modelem liniowym:
jasna interpretacja parametrw,
atwo estymacji i weryfikacji,
czsto stanowi dobr aproksymacj zalenoci nieliniowych.

Marcin Topolewski, SGH

119

Modele nieliniowe wzgldem parametrw lub/i zmiennych


Przykady modeli nieliniowych:
(1) model wielomianowy (nieliniowy wzgldem zmiennych)
= 0 + 1 + 2 2 + + + .
(2) model logarytmiczny (nieliniowy wzgldem zmiennych)
= 0 + 1 1 + 2 2 + + + .
(3) model wykadniczy (nieliniowy wzgldem parametrw i zmiennych)
= 0 +1 1+22+++ .
(4) model potgowy (nieliniowy wzgldem parametrw i zmiennych)

= 0 11 22 .
(5) model logitowy (nieliniowy wzgldem parametrw i zmiennych)
=

1
1 + (+ + )

Marcin Topolewski, SGH

120

Linearyzacja i wnioskowanie
Modele nieliniowe wzgldem zmiennych linearyzuje si poprzez przedefiniowanie zmiennych
(uycie zmiennych pomocniczych). Na przykad dla modelu
= 0 + 1 + 2 2 + 3 +
wprowadzamy zmienne = 2 oraz = otrzymujc
= 0 + 1 + 2 + 3 + .
Modele nieliniowe wzgldem parametrw linearyzuje si zwykle przez logarytmowanie.
Na przykad model trendu wykadniczego
= ++ .
po zlogarytmowaniu ma posta
= ( + + ) = + + .
Po oszacowaniu otrzymujemy
= + ,

= + .
Jest to model trendu o staym okresowym tempie wzrostu, przy czym moemy powiedzie, e

okresowa stopa wzrostu wynosi w przyblieniu , poniewa 1 + .


Marcin Topolewski, SGH

121

Modele w logarytmach zmiennych


Funkcja logarytmiczna
= 0 + 1 +
model liniowo-logarytmiczny
Funkcja wykadnicza
= 0 1
= 0 +1
= 0 + 1 +
Funkcja potgowa

model logarytmiczno-liniowy

= 0 + 1

= 0 + 1
= 0 + 1 +

model logarytmiczno- logarytmiczny

Interpretacja dla maych wartoci 1


model liniowo-logarytmiczny

wzrost X o 1% powoduje wzrost Y przecitnie o 0,01 1

model logarytmiczno-liniowy

wzrost X o jednostk powoduje wzrost Y przecitnie o 1 100%

model logarytmiczno- logarytmiczny wzrost X o 1% powoduje wzrost Y przecitnie o 1 %


Marcin Topolewski, SGH

122

Funkcje produkcji (modelowanie produkcji )


Oglna posta funkcji produkcji
= (1 , 2 , , , )
warto (wielko) produkcji, 1 , 2 , , nakady czynnikw wytwrczych.
Zwykle nakady kapitau mierzone s wartoci majtku trwaego (symbol lub ), nakady
pracy mierzone liczb zatrudnionych, wartoci pac lub liczb roboczogodzin ( lub ).
Estymacja na podstawie danych przekrojowych lub szeregw czasowych.
Modelowanie procesw produkcji na poziomie mikro lub makro.
Gwne pojcia stosowane w analizie wasnoci funkcji produkcji:

Marcin Topolewski, SGH

123

Kracowa produkcyjno czynnika wytwrczego przyrost produkcji wywoany maym


przyrostem nakadw tego czynnika przy nie zmienionych nakadach drugiego czynnika.
Kracowa produkcyjno czynnika jest dodatnia, czyli

= > 0

oraz

>0

Kracowa produkcyjno czynnika maleje wraz ze wzrostem nakadw tego czynnika, czyli
2

= 2 < 0

oraz

2
2

<0

Kracowa produkcyjno czynnika ronie wraz ze wzrostem nakadw drugiego czynnika, czyli
2

= > 0

Marcin Topolewski, SGH

oraz

= > 0

124

Elastyczno
Elastyczno produkcji wzgldem czynnika produkcji to stosunek wzgldnego przyrostu produkcji
do wzgldnego przyrostu tego czynnika.
Elastyczno produkcji wzgldem kapitau
/



= =

Elastyczno produkcji wzgldem pracy


/

=
=

Elastyczno wyraa procentowy przyrost produkcji towarzyszcy 1-procentowemu przyrostowi


czynnika produkcji.
Marcin Topolewski, SGH

125

Kracowa stopa substytucji


Czynniki produkcji s wzajemnie zastpowalne. Miar stopnia ich substytucyjnoci jest kracowa
stopa substytucji.
Kracowa stopa substytucji zatrudnienia majtkiem - jaka warto majtku jest potrzebna do
zastpienia (substytucji) jednostki zatrudnienia, by utrzyma niezmieniony poziom produkcji:
=

Lub na odwrt, jaki przyrost zatrudnienia zastpi jednostk majtku (kracowa stopa substytucji
majtku zatrudnieniem).
1

= .

Linie obrazujce proporcje czynnikw produkcji, dla ktrych warto produkcji jest taka sama to
izokwanty produkcji.

Marcin Topolewski, SGH

126

Jednorodno
Funkcja produkcji jest funkcj jednorodn stopnia , jeli
(, ) = (, )
= 1 stae efekty skali, -krotny wzrost nakadw kadego czynnika produkcji wywouje
-krotny wzrost produkcji,
> 1 rosnce efekty skali - ... wicej ni -krotny wzrost produkcji,
< 1 malejce efekty skali - ... mniej ni -krotny wzrost produkcji,
Autonomiczne tempo zmian
Co dzieje si z produkcj dla rnych t przy niezmienionych nakadach czynnikw.
Zadanie
Rozwa wyej wymienione pojcia dla nastpujcych funkcji produkcji:
a) = 0,2 + 0,3,
2

b) = 1,5+0,5.
Marcin Topolewski, SGH

127

Dwuczynnikowa dynamiczna funkcja produkcji Cobba-Douglasa


Przed oszacowaniem:

= + + + +
= + + + +
Po oszacowaniu:
= + + +
= + + +
= =
=

Marcin Topolewski, SGH

128

Przykad
Dla oszacowanej funkcji produkcji
= 3 + 0,2 + 0,4 + 0,075
a) Sprawd i zinterpretuj podstawowe zaoenia dotyczce:
- kracowej produkcyjnoci w roku = 10 dla = 100 i = 50.
- elastycznoci produkcji wzgldem kadego czynnika,
- kracowej stopy substytucji gdy techniczne uzbrojenie pracy jest rwne 2,
- przychodw wzgldem skali produkcji,
- autonomicznego tempa wzrostu produkcji.
Funkcja produkcji Cobba-Douglasa ma posta
0,075
= 30,2 0,4

Marcin Topolewski, SGH

129

Kracowa produkcyjno
Jak zmienia si produkcja, jeli nakad jednego czynnika wzrasta o jednostk?
=
=

= 1 ,
= 1 .

Warunkiem na to, by > 0 oraz > 0 jest


> 0, > 0, > 0.
Wniosek:
Gdy zwiksza si nakad jednego czynnika (c.p.), produkcja ronie

Marcin Topolewski, SGH

130

Jaka jest dynamika zmian produkcji, przy wzrocie nakadw jednego czynnika i niezmienionych
nakadach drugiego czynnika?
=
=

2
2
2
2

= ( 1) 2 ,

= ( 1) 2 .

Warunkiem na to, by < 0 oraz < 0 jest


< 1, < 1.
Wniosek:
Wraz ze wzrostem nakadu tylko jednego czynnika wytwrczego produkcja ronie coraz wolniej

Marcin Topolewski, SGH

131

Jak zmienia si produkcyjno jednego czynnika, gdy nakady drugiego czynnika s coraz wiksze?
2

= = 1 1 ,
2

= = 1 1 .
Warunkiem na to, by > 0 oraz > 0 jest
> 0, > 0, > 0.
Wniosek:
Przy coraz wikszych nakadach jednego czynnika, takie same nakady drugiego czynnika
wywouj coraz wiksze przyrosty produkcji.

Marcin Topolewski, SGH

132

Przykad c.d.
0,075
= 30,2 0,4

Kracowa produkcyjno dla t = 10, K = 100 i L = 50

= = 3 0,2 0,8 0,4 0,075 = 3 0,2 1000,8 500,4 0,07510 0,15


Wzrost majtku o jednostk (c.p.) powoduje wzrost produkcji przecitnie o 0,15 jednostki.
=

= 3 0,4 0,2 0,6


0,075 = 3 0,4 1000,2 500,6 0,07510 0,61

Wzrost zatrudnienia o jednostk (c.p.) powoduje wzrost produkcji przecitnie o 0,61 jednostki.
Warunkiem na to, by > 0 oraz > 0 jest
> 0, > 0, > 0.
Warunkiem na to, by < 0 oraz < 0 jest
< 1, < 1.
Warunkiem na to, by > 0 oraz > 0 jest
> 0, > 0, > 0.
W powyszym przykadzie = 3, = 0,2, = 0,4, zatem wszystkie warunki s spenione.
Marcin Topolewski, SGH

133

Elastyczno
Jak zmienia si produkcja, jeli nakad jednego z czynnikw wzrasta o x%?
Funkcja C-D jest potgowa, zatem parametry oraz oznaczaj elastyczno wzgldem,
odpowiednio, i , czyli

1
=
=
=
=


/ =

=
= 1
=


Wniosek:
1-procentowy wzrost przy nie zmienionym powoduje -procentowy wzrost produkcji,
x-procentowy wzrost przy nie zmienionym powoduje x-procentowy wzrost produkcji.
Interpretacja jest analogiczna.

Marcin Topolewski, SGH

134

Przykad c.d.
Funkcja produkcji
0,075
= 30,2 0,4

Elastyczno produkcji wzgldem kapitau


/

0,8 0,4 0,075


=
=
= 3 0,2

= 0,2
0,075


30,2 0,4

1% wzrost kapitau przy staym zatrudnieniu powoduje wzrost produkcji przecitnie o 0,2%.
Elastyczno produkcji wzgldem pracy
/ =

0,075
=
= 3 0,4 0,2 0,6

0,2 0,4 0,075 = 0,4




3

1% wzrost pracy przy staym kapitale powoduje wzrost produkcji przecitnie o 0,4%.

Marcin Topolewski, SGH

135

Kracowa stopa substytucji


W ustalonym roku okrelon wielko produkcji mona uzyska przy rnych kombinacjach
nakadu i substytucj czynnikw obrazuj izokwanty tej funkcji produkcji
Kracowa stopa substytucji zatrudnienia przez majtek:

= =
=
.

Iloraz oznacza techniczne uzbrojenie pracy.


oznacza warto , ktra jest potrzebny do zastpienia jednostki , by utrzyma nie
zmieniony poziom , za 1/ wielko potrzebn do zastpienia jednostki .
Przykad c.d.
0,075
= 30,2 0,4

0,4
= =
=
2 = 4

0,2
Jednostkowy spadek zatrudnienia zostanie zrekompensowany przez wzrost majtku o 4
jednostki (kracowa stopa substytucji zatrudnienia majtkiem wynosi 4).
Marcin Topolewski, SGH

136

Jednorodno
W jakim stopniu wzrasta , jeli nakady obu czynnikw wzrastaj w jednakowym stopniu ?
(, ) = ( ) ( ) = + = + (, )
Jest to funkcja jednorodna stopnia + .
Wniosek:
+ = 1 stae efekty skali,
+ > 1 rosnce efekty skali,
+ < 1 malejce efekty skali
Przykad c.d.
0,075
= 30,2 0,4

= + = 0,4 + 0,2 = 0,6 < 1 - malejce efekty skali.

Marcin Topolewski, SGH

137

Autonomiczne tempo wzrostu


Czy zmienia si tylko wtedy, gdy zmienia si oraz ?
Dla staych i mamy:
+1 = , +1 = ,

+1 +1
+1 (+1) (+1)
=
=
= .

Parametr oznacza roczn stop wzrostu (spadku) (autonomicznego, niezalenego od wzrostu


i ), czyli jest miar postpu techniczno-organizacyjnego.
Wniosek:
> 0 > 1 autonomiczny wzrost ,
< 0 < 1 autonomiczny spadek ,
= 0 = 1 brak autonomicznych zmian .
Dla maych zachodzi 1 + .
Przykad c.d.
0,075
= 30,2 0,4

+1
= = 0,075 = 1,07788.

Z okresu na okres, ceteris paribus, produkcja wzrasta o okoo 7,5% (dokadnie 7,788%).
Marcin Topolewski, SGH

138

Przykad c.d
a) Oblicz o ile zmieni si produkcja, jeli i zostan zmniejszone o 7%.
= 1 0,07 = 0,93
= + = 0,930,4+0,2 = 0,9574
1 0,9574 = 0,0426
Produkcja zmniejszy si o 4,26%.
b) Oblicz, o ile naley zwikszy , aby przy spadku o jednostk, warto produkcji nie ulega
zmianie dla = 10, = 100 i = 50.
1

0,2 50
1
= =
=
=

0,4 100
4

Marcin Topolewski, SGH

139

Modele zmiennej jakociowej

Marcin Topolewski, SGH

140

Modele zmiennej jakociowej


Zmienne jakociowe to takie zmienne, ktrych wartoci maj posta niemierzalnych kategorii, na
przykad:
zatrudniony lub bezrobotny,
kobieta lub mczyzna,
wyksztacenie podstawowe lub rednie,
studia licencjackie lub studia magisterskie
Zmienna jakociowa jest zmienn dwumianow czyli moe wystpowa w dwch wariantach
(stanach, sytuacjach), ktre mona opisa przyporzdkowujc im wartoci 0 lub 1. Moemy
j zatem traktowa jako zmienn losow. Przyjmijmy, e prawdopodobiestwo zdarzenia, e
zmienna przyjmie warto 1 wynosi , jednoczenie prawdopodobiestwo zdarzenia, e
zmienna = 0 wynosi 1 .

Marcin Topolewski, SGH

141

Wwczas warto oczekiwana zmiennej wynosi


( ) = 1 + (1 ) 0 =
Rozpatrzmy zaleno zmiennej dan modelem ekonometrycznym
= ( , ) +
) = i ( ) = 0
Poniewa w modelu ekonometrycznym (
)
( ) = ( ,
czyli
).
= ( ,
Zatem jest prawdopodobiestwem, e dla obiektu o cechach okrelonych wektorem
zmiennych zmienna (cecha) przyjmie warto 1.

Marcin Topolewski, SGH

142

Liniowy model prawdopodobiestwa (LMP)


) ma posta liniow, otrzymujemy
Przyjmujc, e zaleno ( ,
= 0 + 1 1 + 2 2 + + +
= 0 + 1 1 + 2 2 + +

Podstawow wad LMP jest to, e otrzymane w prawdopodobiestwa mog wychodzi poza
przedzia <0 ; 1> . Ponadto zwykle wystpuje heteroskedastyczno skadnika losowego.

Marcin Topolewski, SGH

143

Przykad (Liniowy model prawdopodobiestwa LMP)


- posiadanie domu przez it rodzin (1 = tak, 0 = nie),
- dochd i-tej rodziny.
Model 1: Estymacja KMNK, wykorzystane obserwacje 1-50
Zmienna zalena (Y): Y
wspczynnik bd standardowy t-Studenta warto p
--------------------------------------------------------------const
0,216834
0,0967264
2,242
0,0296
**
X
0,00565217
0,000910369
6,209
1,20e-07 ***
redn.aryt.zm.zalenej 0,300000
Suma kwadratw reszt
5,823397
Wsp. determ. R-kwadrat 0,445391
F(1, 48)
38,54743
Logarytm wiarygodnoci 17,19344
Kryt. bayes. Schwarza
42,21093

Marcin Topolewski, SGH

Odch.stand.zm.zalenej
Bd standardowy reszt
Skorygowany R-kwadrat
Warto p dla testu F
Kryt. inform. Akaike'a
Kryt. Hannana-Quinna

0,462910
0,348311
0,433836
1,20e-07
38,38689
39,84311

144

Marcin Topolewski, SGH

145

Marcin Topolewski, SGH

146

Model logitowy
W przypadku modelu logitowego
(0 + 1 1 + 2 2 + + )
=
1 + (0 + 1 1 + 2 2 + + )
= 0 + 1 1 + 2 2 + +

=
1 +
1 =

1
1 +

=
1
Ostatecznie dostajemy model logitowy, liniowy wzgldem parametrw i zmiennych

= = 0 + 1 1 + 2 2 + +
1

wyraenie 1 jest nazywane logitem. Jednoczenie poniewa jest prawdopodobiestwem,

e zmienna przyjmie warto 1, logit jest logarytmem ilorazu szans przyjcia i nieprzyjcia
przez zmienn wartoci 1.
Marcin Topolewski, SGH

147

Waciw metod estymacji parametrw tego modelu jest metoda najwikszej wiarygodnoci
(MNW), ktra wykorzystuje zaoenie o postaci rozkadu logistycznego.
Ze wzgldu na nieliniowo w modelu logitowym nie mona stosowa zwykego wspczynnika
determinacji R2. Czsto podaje si warto pseudo-R2 McFaddena, ktry oblicza si wedug
wzoru:
2 = 1

gdzie jest logarytmem funkcji wiarygodnoci dla modelu penego, natomiast dla
modelu zredukowanego do wyrazu wolnego.
Pseudo-R-kwadrat moe suy do porwna pomidzy logitowymi modelami
niezagniedonymi dla tej samej zmiennej.

Marcin Topolewski, SGH

148

Tablica trafnoci
Jako prognozy ex post wygodnie jest przedstawi za pomoc tablicy trafnoci.
Prognozowane
Empiryczne

= 1

= 0

Razem

= 1

11

10

= 0

01

00

Razem

Udzia poprawnych trafie w liczbie obserwacji jest traktowany, jako miara jakoci dopasowania
modelu i nazywany zliczeniowym R2
11 + 00
=

Marcin Topolewski, SGH

149

Model 1: Estymacja Logit, wykorzystane obserwacje 1-50


Zmienna zalena (Y): Y
Bdy standardowe na bazie Hessian
wspczynnik
bd standardowy
z
warto p
--------------------------------------------------------------const
4,79156
1,24921
3,836
0,0001
***
X
0,0396580
0,0117456
3,376
0,0007
***
redn.aryt.zm.zalenej 0,300000
McFadden R-kwadrat
0,407392
Logarytm wiarygodnoci 18,10015
Kryt. bayes. Schwarza
44,02435

Odch.stand.zm.zalenej
Skorygowany R-kwadrat
Kryt. inform. Akaike'a
Kryt. Hannana-Quinna

0,462910
0,341911
40,20030
41,65652

Liczba przypadkw 'poprawnej predykcji' = 41 (82,0%)


f(beta'x) do rednich niezalenych zmiennych = 0,181
Test ilorazu wiarygodnoci: Chi-kwadrat(1) = 24,8861 [0,0000]
Przewidywane
0
1
Empiryczne 0 33
2
1
7
8
Marcin Topolewski, SGH

150

Marcin Topolewski, SGH

151

Marcin Topolewski, SGH

152

Efekty kracowe
Reakcja zmiennej na wzrost wartoci zmiennej nie jest staa, lecz zaley wartoci wszystkich
zmiennych objaniajcych 1 , 2 , , .

= (1 ) =

(0 + 1 1 + 2 2 + + )
(1 + (0 + 1 1 + 2 2 + + ))

W praktyce podaje si warto pochodnej czstkowej obliczon dla rednich wartoci


zmiennych objaniajcych. Jak atwo zauway, tak jak w modelu liniowym kierunek reakcji
zmiennej zaley od znaku wspczynnika .
Ponadto dla modelu logitowego

= = 0 + 1 1 + 2 2 + +
1

atwo zaobserwowa, e jeeli zmienna wzronie o jednostk, to 1 zmieni si o , czyli

iloraz szans

zmieni si razy.

Korzystajc z przyblionej relacji 1 + dla maych otrzymujemy interpretacj:

Wzrost zmiennej o jednostk powoduje zmian ilorazu szans o 100%.


Marcin Topolewski, SGH

153

Model 1: Estymacja Logit, wykorzystane obserwacje 1-50


Zmienna zalena (Y): Y
Bdy standardowe na bazie Hessian
wspczynnik bd standardowy
z
efekt kracowy
---------------------------------------------------------------const
4,79156
1,24921
3,836
X
0,0396580
0,0117456
3,376
0,00718633
redn.aryt.zm.zalenej 0,300000
McFadden R-kwadrat
0,407392
Logarytm wiarygodnoci 18,10015
Kryt. bayes. Schwarza
44,02435

Odch.stand.zm.zalenej
Skorygowany R-kwadrat
Kryt. inform. Akaike'a
Kryt. Hannana-Quinna

0,462910
0,341911
40,20030
41,65652

Liczba przypadkw 'poprawnej predykcji' = 41 (82,0%)


f(beta'x) do rednich niezalenych zmiennych = 0,181
Test ilorazu wiarygodnoci: Chi-kwadrat(1) = 24,8861 [0,0000]
Przewidywane
0
1
Empiryczne 0 33
2
1
7
8
Marcin Topolewski, SGH

154

Model probitowy
Utrzymujc zaoenie, o zalenoci liniowej cech i-tego obiektu
= 0 + 1 1 + 2 2 + +
w modelu probitowym przyjmuje si, e prawdopodobiestwa s wartociami dystrybuanty
standardowego rozkadu normalnego N(0,1) w punktach . Wartoci nazywa si probitami lub
normitami. Wartoci prawdopodobiestwa dane s, jako wartoci dystrybuanty
standardowego rozkadu normalnego N(0,1) w punktach

2
2 .

Parametry modelu probitowego szacuje si MNW.

Marcin Topolewski, SGH

155

Efekty kracowe
W modelu probitowym, tak jak w modelu logitowym, reakcja zmiennej na wzrost wartoci
zmiennej nie jest staa, lecz zaley wartoci wszystkich zmiennych objaniajcych
2

=
2

Analogicznie podaje si j dla rednich wartoci zmiennych objaniajcych.


Zwizki midzy parametrami modelu logitowego i probitowego.
Parametry modelu logitowego i probitowego zwizane s przyblion relacj:

gdzie = 1,6 1,8 co pozwala atwo przelicza wyniki estymacji parametrw jednego modelu
na drugi.
Marcin Topolewski, SGH

156

Model 1: Estymacja Probit, wykorzystane obserwacje 1-50


Zmienna zalena (Y): Y
Bdy standardowe na bazie Hessian
wspczynnik
bd standardowy
z
warto p
--------------------------------------------------------------const
2,78725
0,647303
4,306
1,66e-05 ***
X
0,0230812
0,00622350
3,709
0,0002
***
redn.aryt.zm.zalenej 0,300000
McFadden R-kwadrat
0,412028
Logarytm wiarygodnoci 17,95854
Kryt. bayes. Schwarza
43,74113

Odch.stand.zm.zalenej
Skorygowany R-kwadrat
Kryt. inform. Akaike'a
Kryt. Hannana-Quinna

0,462910
0,346548
39,91708
41,37330

Liczba przypadkw 'poprawnej predykcji' = 41 (82,0%)


f(beta'x) do rednich niezalenych zmiennych = 0,317
Test ilorazu wiarygodnoci: Chi-kwadrat(1) = 25,1694 [0,0000]
Przewidywane
0
1
Empiryczne 0 33
2
1
7
8
Marcin Topolewski, SGH

157

Marcin Topolewski, SGH

158

Marcin Topolewski, SGH

159

Model 1: Estymacja Probit, wykorzystane obserwacje 1-50


Zmienna zalena (Y): Y
Bdy standardowe na bazie Hessian
wspczynnik bd standardowy
z
efekt kracowy
---------------------------------------------------------------const
2,78725
0,647303
4,306
X
0,0230812
0,00622350
3,709
0,00732372
redn.aryt.zm.zalenej 0,300000
McFadden R-kwadrat
0,412028
Logarytm wiarygodnoci 17,95854
Kryt. bayes. Schwarza
43,74113

Odch.stand.zm.zalenej
Skorygowany R-kwadrat
Kryt. inform. Akaike'a
Kryt. Hannana-Quinna

0,462910
0,346548
39,91708
41,37330

Efekty kracowe
Dla rodzin o dochodach zblionych do rednich w prbie, wzrost redniego dochodu rodziny o
jeden tysic zwiksza prawdopodobiestwo posiadania wasnego domu przecitnie o 0,0073.
Zwizki midzy parametrami modelu logitowego i probitowego:
Logit
Probit
Logit/Probit ()
0,0396580
0,0230812
1,7181949
Marcin Topolewski, SGH

160

Model tobitowy (probit Tobina)


Jeeli zmienna objaniana jest zmienn cig, ale jej zakres jest ograniczony, nazywamy j
zmienn ograniczon. Takie zmienne to rodzaj zmiennych jakociowo-ilociowych.
Obserwowalne wartoci tej zmiennej s kategoriami ilociowymi, a wartoci
nieobserwowalnym przyporzdkowujemy jak warto (np. zero)
Ograniczenia w dostpie do danych:
prba ucita dane dla zmiennych objaniajcych dostpne tylko wwczas, gdy obserwuje si
zmienn objanian ma obserwacji znamy wartoci w przypadkach (model regresji ucitej):
1 , . . . ,
1 , . . . ,

Marcin Topolewski, SGH

161

prba cenzurowana dane dla zmiennych objaniajcych dostpne take wtedy, gdy nie
obserwuje si zmiennej objanianej to znaczy rwnie wtedy, gdy zmienna objaniana wynosi
zero. Zmienna jest wwczas zmienn cenzurowan
1 , . . . , , +1 , . . . ,
1 , . . . , , 0, . . . , 0
Model tobitowy (model regresji cenzurowanej):
= 0 + 1 1 + 2 2 + +

= {
0

dla > 0
dla 0

Warto oczekiwana ( | ) jest nieliniow funkcj zmiennych , zatem estymatory MNK nie
s estymatorami zgodnymi, a wic do oszacowania parametrw modelu tobitowego naley uy
MNW przyjmujc, e ~(0; 2 ).
Marcin Topolewski, SGH

162

Efekty kracowe
- dla > 0 (wpyw maej zmiany na , tylko dla dodatnich )
( | > 0, )
= {1 ( )[ + ( )]},

gdzie =

0 +
1 1 +
2 2 ++

( )

oraz ( ) = ( ).

( ) i ( ) s odpowiednio funkcj gstoci i dystrybuant rozkadu (0; 2 ).


- dla wszystkich (wpyw maej zmiany na , dla wszystkich )
( | )
= ( ).

Oznacz to, e zmiana wywoana ma zmian jest mniejsza ni .


Oceny MNK s bezporednimi oszacowaniami

( | )

. Badania wykazay, e aby otrzyma

przyblione oceny MNK (poza wyrazem wolnym), oceny MNW naley pomnoy przez udzia
niezerowych obserwacji w prbie.
Marcin Topolewski, SGH

163

Dzikuj za uwag

Marcin Topolewski, SGH

164

You might also like