Professional Documents
Culture Documents
03 Simple Regression Marginal
03 Simple Regression Marginal
Ekonometria Bayesowska
Wykład 3: Bayesowska analiza modelu regresji liniowej
z 1 zmienną objaśniającą
Andrzej Torój
Plan wykładu
1 Specyfikacja modelu
5 Praca domowa 1 z 2
Plan prezentacji
1 Specyfikacja modelu
5 Praca domowa 1 z 2
Specyfikacja
ε ∼ N 0, σ 2 i.i.d.
yi = βxi + εi ,
Specyfikacja
Rozkład gamma
Specyfikacja
Rozkład normalny-gamma
(za chwilę).
Plan prezentacji
1 Specyfikacja modelu
5 Praca domowa 1 z 2
Gęstość próbkowa
N N 2
(yi − βxi )2
P P
= yi − βxi +β̂xi − β̂xi =
i=1 i=1
PN h i2
= yi − β̂xi − β − β̂ xi =
i=1
N 2 2
+ β − β̂ xi2 − 2 yi − β̂xi
P
= yi − β̂xi β − β̂ xi =
i=1
N 2 N
2 P N
X
xi2 −2 β − β̂
P
= yi − β̂xi + β − β̂ xi yi − β̂xi =
i=1 i=1 i=1
| {z }
0
N
P 2
yi − β̂xi N
2 X
i=1
= (N − 1) + β − β̂ xi2
| {z } N −1 i=1
v̂
| {z }
ŝ 2
| {z }
ŜX
YN
f (y |β, h) = f (yi |β, h) =
i=1
N 2
h2 h 2
= N exp − 2 v̂ŝ + β − β̂ ŜX
(2π) 2
2
√1 (β−β )
f (β|h) = √ exp − 2h−1 u
2π h−1 u
v h 2
h 2 −1 e − 2 v s
f (h) = −2 v
2s 2
v
Γ( v2 )
f (β, h) =
2
v
(β−β ) −1 − h v s 2
= f (β|h) · f (h) = √ −1
√1
exp − 2h−1 u h 2−2 e v 2 =
2π h u 2s 2 v
Γ ( 2 )
v
−2 v −1 2
1 ( β−β ) v −1
1 2s 2 v v s2
= (2π) 2 u 2 v Γ 2 exp − −1
2h u
h 2 exp −
2 h
Gęstość a posteriori
f (β, h|y ) ∝
∝ f (y |β, h) · f (β, h) =
N 2
h2
h 2
= N exp − 2 v̂ŝ + β − β̂ ŜX ·
(2π) 2
2
v −1
" #
1 1 v −1
2s −2 v s2
2 v β−β
· (2π) 2 u 2 v
Γ 2
exp − −1
h 2 exp − 2 h =
2h u
2
v −1
" #
N+1 1 2s −2
h β − β̂ 2 Ŝ
2 v
β−β
= (2π) 2 u2 Γ exp − 2 h
X exp − 2
·
v 2 u
N v −1
·h 2 h 2 exp − 2h v̂ŝ 2 exp − h v s 2 =
2
" v −1#
N+1 1 2s −2
2 2
2
v
= (2π) 2 u 2 v
Γ 2 h
exp − 2 β − β̂ ŜX + β − β u −1 ·
v +N−1 h i
·h 2 h v̂ŝ 2 + v s 2
exp − 2 =
= ...
Gęstość a posteriori
2 2
β − β̂ ŜX + β − β u −1 =
= β 2 − 2β β̂ + β̂ 2 ŜX + β 2 − 2ββ + β 2 u −1 =
= β 2 ŜX + u −1 − 2β β̂ ŜX + βu −1 + β̂ 2 ŜX + β 2 u −1 =
β̂ 2 ŜX +β 2 u −1
β̂ Ŝ +βu −1
= ŜX + u −1 β 2 − 2β X −1 + =
ŜX +u ŜX +u −1
" 2 2 #
β̂ 2 ŜX +β 2 u −1
−1
−1
β̂ Ŝ +βu β̂ ŜX +βu β̂ ŜX +βu −1
= ŜX + u −1 β 2 − 2β X −1 + − +
ŜX +u ŜX +u −1 ŜX +u −1 ŜX +u −1
" 2 2 #
−1 −1 2 2 −1
β̂ Ŝ +βu β̂ ŜX +βu β̂ ŜX +β u
= ŜX + u −1 β − X −1 − −1 + −1 = ...
ŜX +u ŜX +u ŜX +u
Gęstość a posteriori
2
β̂ Ŝ +βu −1
β− X −1 β̂ Ŝ +βu −1 2
(β̂ 2 ŜX +β 2 u −1 )(ŜX +u −1 )
( X )
ŜX +u
... = −1 + ŜX + u −1 − −1 2 + −1 2 =
(ŜX +u −1
) (ŜX +u ) (ŜX +u )
2
β̂ Ŝ +βu −1
β− X −1
ŜX +u (β̂ 2 ŜX +β 2 u −1 )(ŜX +u −1 )−(β̂ ŜX +βu −1 )2
= + =
(ŜX +u −1 )−1 ŜX +u −1
2
β̂ Ŝ +βu −1
β− X −1
ŜX +u (β̂ 2 ŜX2 +β 2 u −1 ŜX +β̂ 2 ŜX u −1 +β 2 u −2 )−(β̂ 2 ŜX2 +2β̂ ŜX βu −1 +β 2 u −2 )
= + =
(ŜX +u −1 )−1 ŜX +u −1
2
β̂ Ŝ +βu −1
β− X −1
ŜX +u ŜX u −1 (β 2 −2β̂β+β̂ 2 )
= + =
(ŜX +u −1 )−1 ŜX +u −1
2
β̂ Ŝ +βu −1
β− X −1
ŜX +u (β−β̂ )2
= −1 + −1
(ŜX +u −1 ) u+ŜX
Gęstość a posteriori
Gęstość a posteriori
(β−β )2
v −1
f (β, h) ∝ exp − 2h−1 u · h 2 exp − 2h v s 2
2
β̂ ŜX +βu −1
β−
(β−β̂ )2
ŜX +u −1 v +N−1
f (β, h|y ) ∝ exp − h 2 exp − 2h v̂ŝ 2 + v s 2 +
−1 −1
2h−1 ŜX +u −1
( )
u+ŜX
Gęstość a posteriori
β̂ Ŝ +βu −1
β = ŜX +u−1 – średnia ważona oszacowania OLS i wartości
X
oczekiwanej a priori
−1
u = u −1 + ŜX – między u a odwrotną sumą kwadratów x
v = v + N – v powiększone o liczbę obserwacji
2
(β−β̂ )
v s 2 = v s 2 + v̂ŝ 2 + u+Ŝ −1 – informacja a priori plus suma
X
kwadratów reszt plus kara za rozbieżność a priori vs dane
(OLS)
Gęstość a posteriori
Plan prezentacji
1 Specyfikacja modelu
5 Praca domowa 1 z 2
Rozkład brzegowy
Rozkład brzegowy
Na poprzednich wykładach przedmiotem naszej estymacji
bayesowskiej był tylko jeden parametr – p i c. To rzadka
sytuacja w praktyce.
Gęstość a posteriori to na ogół łączna gęstość wielu
parametrów, w obecnym przypadku: β i h.
W analizie regresji interesuje nas głównie β i będziemy
potrzebowali gęstości a posteriori „tylko” dla tego parametru.
Dla rozkładów wielowymiarowych mówimy o rozkładzie
brzegowym ¯jako:
f (x1 ) = f (x1 , x2 , x3 , ...)dx2 dx3 ...
U nas:
´∞
f (β|y ) = f (β, h|y )dh
0
Andrzej Torój Instytut Ekonometrii – Zakład Ekonometrii Stosowanej
(3) Ekonometria Bayesowska 21 / 33
Specyfikacja Analiza z rozkładem N-G Rozkład brzegowy Przykład: prawo Okuna Praca domowa 1 z 2
Rozkład brzegowy
Rozkład brzegowy
Rozkład t
Rozkład brzegowy
2
− v +1
2
(β−β )
f (β|y ) ∝ ūv s 2
+1
Plan prezentacji
1 Specyfikacja modelu
5 Praca domowa 1 z 2
Prawo Okuna
Prawo Okuna
Prawo Okuna
https://pl.wikipedia.org/wiki/Prawo_Okuna
Prawo Okuna
Parametry a priori
#środek dostępnego przedziału oszacowań dla USA:
beta.prior <- -0.4
# 0,31 = odchylenie standardowe reszt odczytane graficznie z
wykresu dla USA →
# 0,1 = wariancja składnika losowego (kwadrat odchylenia
standardowego) →
# odwrotność wariancji składnika losowego:
sm2.prior <- 10
# przedział -0.5 do -0.3 ma obejmować obejmuje +/- 2
odchylenia standardowe od średniej a priori →
# 0,05 = odchylenie standardowe bety a priori →
# 0,0025 = wariancja bety a priori →
# ... = wariancji składnika losowego (=0,1) * u_prior,
czyli...
u.prior <- 0.025
#nasza próba liczy ok. 45 obserwacji, fikcyjną próbę dla USA
traktujemy jako liczącą 100 obserwacji (25 lat)
v.prior <- 100
Andrzej Torój Instytut Ekonometrii – Zakład Ekonometrii Stosowanej
(3) Ekonometria Bayesowska 28 / 33
Specyfikacja Analiza z rozkładem N-G Rozkład brzegowy Przykład: prawo Okuna Praca domowa 1 z 2
Prawo Okuna
Parametry a priori
#środek dostępnego przedziału oszacowań dla USA:
beta.prior <- -0.4
# 0,31 = odchylenie standardowe reszt odczytane graficznie z
wykresu dla USA →
# 0,1 = wariancja składnika losowego (kwadrat odchylenia
standardowego) →
# odwrotność wariancji składnika losowego:
sm2.prior <- 10
# przedział -0.5 do -0.3 ma obejmować obejmuje +/- 2
odchylenia standardowe od średniej a priori →
# 0,05 = odchylenie standardowe bety a priori →
# 0,0025 = wariancja bety a priori →
# ... = wariancji składnika losowego (=0,1) * u_prior,
czyli...
u.prior <- 0.025
#nasza próba liczy ok. 45 obserwacji, fikcyjną próbę dla USA
traktujemy jako liczącą 100 obserwacji (25 lat)
v.prior <- 100
Andrzej Torój Instytut Ekonometrii – Zakład Ekonometrii Stosowanej
(3) Ekonometria Bayesowska 28 / 33
Specyfikacja Analiza z rozkładem N-G Rozkład brzegowy Przykład: prawo Okuna Praca domowa 1 z 2
Prawo Okuna
Parametry a priori
#środek dostępnego przedziału oszacowań dla USA:
beta.prior <- -0.4
# 0,31 = odchylenie standardowe reszt odczytane graficznie z
wykresu dla USA →
# 0,1 = wariancja składnika losowego (kwadrat odchylenia
standardowego) →
# odwrotność wariancji składnika losowego:
sm2.prior <- 10
# przedział -0.5 do -0.3 ma obejmować obejmuje +/- 2
odchylenia standardowe od średniej a priori →
# 0,05 = odchylenie standardowe bety a priori →
# 0,0025 = wariancja bety a priori →
# ... = wariancji składnika losowego (=0,1) * u_prior,
czyli...
u.prior <- 0.025
#nasza próba liczy ok. 45 obserwacji, fikcyjną próbę dla USA
traktujemy jako liczącą 100 obserwacji (25 lat)
v.prior <- 100
Andrzej Torój Instytut Ekonometrii – Zakład Ekonometrii Stosowanej
(3) Ekonometria Bayesowska 28 / 33
Specyfikacja Analiza z rozkładem N-G Rozkład brzegowy Przykład: prawo Okuna Praca domowa 1 z 2
Prawo Okuna
Parametry a priori
#środek dostępnego przedziału oszacowań dla USA:
beta.prior <- -0.4
# 0,31 = odchylenie standardowe reszt odczytane graficznie z
wykresu dla USA →
# 0,1 = wariancja składnika losowego (kwadrat odchylenia
standardowego) →
# odwrotność wariancji składnika losowego:
sm2.prior <- 10
# przedział -0.5 do -0.3 ma obejmować obejmuje +/- 2
odchylenia standardowe od średniej a priori →
# 0,05 = odchylenie standardowe bety a priori →
# 0,0025 = wariancja bety a priori →
# ... = wariancji składnika losowego (=0,1) * u_prior,
czyli...
u.prior <- 0.025
#nasza próba liczy ok. 45 obserwacji, fikcyjną próbę dla USA
traktujemy jako liczącą 100 obserwacji (25 lat)
v.prior <- 100
Andrzej Torój Instytut Ekonometrii – Zakład Ekonometrii Stosowanej
(3) Ekonometria Bayesowska 28 / 33
Specyfikacja Analiza z rozkładem N-G Rozkład brzegowy Przykład: prawo Okuna Praca domowa 1 z 2
Prawo Okuna
Dane
Wczytujemy dane w formacie CSV, rozdzielane średnikiem:
dane <- read.csv("3_prawo_okuna.csv", header=TRUE,
sep=";", dec = ",")
Centrujemy dane w zerze (odjęcie średnich) i wybieramy podpróbę:
y <- dane$GDP - mean(dane$GDP, na.rm = TRUE)
u <- dane$U - mean(dane$U, na.rm = TRUE)
y <- y[21:length(y)]
u <- u[21:length(u)]
Klasyczna regresja u względem y bez stałej:
lm(u~y -1)
Z danych uzyskujemy statystyki: Sx.data (Ŝx ), beta.ols.data (β̂), v.data
(v̂ ) i N.data (N).
Andrzej Torój Instytut Ekonometrii – Zakład Ekonometrii Stosowanej
(3) Ekonometria Bayesowska 29 / 33
Specyfikacja Analiza z rozkładem N-G Rozkład brzegowy Przykład: prawo Okuna Praca domowa 1 z 2
Prawo Okuna
Prawo Okuna
Plan prezentacji
1 Specyfikacja modelu
5 Praca domowa 1 z 2
Praca domowa 1 z 2
Praca domowa 1 z 2
Przeprowadź bayesowską analizę wyspecyfikowanego przez siebie
modelu regresji liniowej. Skorzystaj z rozkładu normalnego-gamma i
rozwiązania analitycznego (kod R, ale bez użycia rstan).
1 Przedstaw zagadnienie (zmienna objaśniana i objaśniające, tło
/ teoria / literatura, źródło danych i zakres próby; od 30 do
500 obserwacji (N), od 2 do 0.1 · N zm. objaśniających„ dane
w csv / xlsx) – po W1
2 Przeprowadź elicytację parametrów a priori – po W3 / W4
czynników Bayesa – po W4 / W5
5 Zaprezentuj prognozę punktową i przedziałową dla wybranej
Andrzej Torój
obserwacji – wewnątrz próby lubInstytut
(3) Ekonometria Bayesowska
Ekonometrii – Zakład Ekonometrii Stosowanej
hipotetycznej
33 / 33
poza nią – po