2.3 - Các Mô Hình Hiệu Ứng Một Chiều

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 72

TRƯỜNG ĐẠI HỌC KINH TẾ - LUẬT

KHOA TOÁN KINH TẾ

PHÂN TÍCH DỮ LIỆU BẢNG


BÀI 2.3. CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU VỚI
DỮ LIỆU BẢNG

Võ Thị Lệ Uyển

Thành phố Hồ Chí Minh, Ngày 24 tháng 11 năm 2023

VTLU PT.DLB 1 / 73
NỘI DUNG

1 GIỚI THIỆU

2 CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU


Mô hình hồi quy gộp OLS
Mô hình hiệu ứng cố định
Mô hình hiệu ứng ngẫu nhiên

3 ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

VTLU PT.DLB 2 / 73
GIỚI THIỆU

Mô hình hồi quy tuyến tính với dữ liệu bảng

Định nghĩa
• Xét mô hình hồi quy tuyến tính có dạng:

yit = α + Xit′ β + uit i ∈ {1, . . . , N}, t ∈ {1, . . . , T } (1)

⇒ Giả định của mô hình (1) là tất cả các đơn vị phải biến thiên như
nhau (có phương sai đồng nhất), tại sao?
• Mô hình sai số một chiều có dạng:

uit = µi + εit
Trong đó,
µi – Hiệu ứng cụ thể của từng cá nhân không thể quan sát được;
εit – sai số ngẫu nhiên.

VTLU PT.DLB 3 / 73
GIỚI THIỆU

Mô hình hồi quy tuyến tính

Định nghĩa
• Các phương pháp ước lượng phổ biến cho mô hình hồi quy tuyến tính
với dữ liệu bảng là:

Ước lượng hiệu ứng cố định (FE).


⇒ Mô hình hiệu ứng cố định (FEM).

Ước lượng hiệu ứng ngẫu nhiên (RE).


⇒ Mô hình hiệu ứng ngẫu nhiên (REM).
• Các phần tiếp theo của bài giảng này chỉ xem xét 1 chiều, đó là chiều
ngang giữa các đối tượng (hay còn gọi là chiều dữ liệu chéo).

VTLU PT.DLB 4 / 73
GIỚI THIỆU

Hiệu ứng cố định so với ngẫu nhiên

Khác biệt giữa các mô hình hiệu ứng cố định và ngẫu nhiên nằm ở
vai trò của các biến giả.

Mô hình hiệu ứng cố định uớc lượng cho tham số của các biến giả
nhằm kiểm tra sự khác nhau giữa hệ số chặn của các đơn vị chéo
hoặc các đơn vị thời gian.

Mô hình hiệu ứng ngẫu nhiên ước lượng một thành phần phương
sai của số ngẫu nhiên trong mô hình.

Trong cả 2 mô hình, các tham số độ dốc là không đổi theo cả đối


tượng chéo hoặc thời gian.

VTLU PT.DLB 5 / 73
GIỚI THIỆU

Hiệu ứng cố định so với ngẫu nhiên

Mô hình hiệu ứng cố định có dạng:

yit = (α + ui ) + Xit′ β + vit

Mô hình hiệu ứng ngẫu nhiên có dạng:

yit = α + Xit′ β + (ui + vit )

trong đó:
ui là hiệu ứng cố định hoặc ngẫu nhiên của từng cá nhân (nhóm) hoặc
khoảng thời gian không được bao gồm trong hồi quy.
Các sai số là các biến ngẫu nhiên, độc lập, tuân theo phân phối chuẩn
và có phân phối giống hệt nhau, nghĩa là:
 
vit ∼ IID 0, σv2

VTLU PT.DLB 6 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hồi quy gộp OLS

Mô hình hồi quy gộp (Pooled OLS)


Nhận xét

Nếu không tồn tại các hiệu ứng riêng lẻ ui theo cả chiều chéo hoặc
chiều thời gian, hay (ui = 0) , thì các ước lượng bình phương nhỏ nhất
OLS dưới dạng sau:

yit = α + Xit′ β + εit (ui = 0)

Hoặc

yit = α + Xit′ β + εit (vt = 0)

là các ước lượng hiệu quả và nhất quán.

VTLU PT.DLB 7 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hồi quy gộp OLS

Mô hình hồi quy gộp (Pooled OLS)

Các giả định cơ bản của mô hình Pooled OLS gồm:


1 Tuyến tính: Dạng hàm biểu diễn biến phụ thuộc theo các biến độc
lập là dạng hàm tuyến tính.
2 Tính ngoại sinh: Giá trị kỳ vọng của các sai số ngẫu nhiên bằng 0,
nghĩa là sai số ngẫu nhiên không tương quan với bất kỳ biến độc lập
nào trong mô hình.
3 Các sai số ngẫu nhiên có cùng phương sai (tính đồng nhất) và
không tương quan với nhau (không có tự tương quan)
4 Các quan sát của biến độc lập không phải ngẫu nhiên mà được cố
định lặp đi lặp lại trong các mẫu, hay không có sai số do đo lường.
5 Ma trận của các biến giải thích có hạng đầy đủ, hay không có tương
quan tuyến tính hoàn hảo giữa các biến giải thích trong mô hình
(không có hiện tượng đa cộng tuyến hoàn hảo).

VTLU PT.DLB 8 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hồi quy gộp OLS

Mô hình hồi quy gộp (Pooled OLS)

Trong dữ liệu bảng, nếu các hiệu ứng cá nhân ui ̸= 0 (các đặc điểm
khác nhau của các cá nhân như trí thông minh và tính cách) không
được bao gồm trong mô hình hồi quy, giả định về tính ngoại sinh và
tính không đồng nhất sẽ bị vi phạm.

⇒ làm cho các ước lượng OLS bị chệch.

⇒ ước lượng OLS không còn là ước lượng tuyến tính không chệch
tốt nhất.

⇒ Để giải quyết các vấn đề này cần xây dựng các mô hình khác cho
dữ liệu bảng.

VTLU PT.DLB 9 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hiệu ứng cố định

Giới thiệu
Định nghĩa
Trong FEM, các đơn vị chéo có hệ số chặn khác nhau, như sau:
yit = αi + β1 x1it + . . . + βk xkit + uit

Lưu ý
Hệ số chặn được thêm vào chỉ số i, trở thành αi .
Các hệ số độ dốc, β1 , . . . , βk là hằng số cho tất cả các đơn vị.
Hệ số chặn riêng lẻ (αi ) được thêm vào mô hình để kiểm soát các
đặc điểm cụ thể và không thay đổi theo thời gian của từng cá nhân.
⇒ Hệ số chặn này được gọi là hiệu ứng cố định.

Hiệu ứng cố định nắm bắt sự không đồng nhất giữa các cá nhân.
VTLU PT.DLB 10 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hiệu ứng cố định

Phương pháp ước lượng

Có 2 phương pháp thường được sử dụng để ước lượng cho FEM, đó là:

1 Ước lượng biến giả bình phương nhỏ nhất.

⇒ Mô hình LSDV.

2 Ước lượng hiệu ứng cố định/ước lượng “Within”.

VTLU PT.DLB 11 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hiệu ứng cố định

Ước lượng LSDV


Ước lượng LSDV được xem là phương pháp ước lượng đơn giản và
hiệu quả cho hiệu ứng cố định.
Ước lượng LSDV sử dụng một tập hợp gồm m các biến giả, có dạng:
(
1 i =m
Dim =
0 trường hợp khác

Với m = 1, . . . , N.
Khi đó, FEM được biểu diễn dưới dạng:
N
X
yit = αi Dim + β1 x1it + . . . + βk xkit + uit
m=1

Số lượng biến giả bằng N.


⇒ Khi N lớn, việc sử dụng phương pháp LSDV để ước lượng cho
hiệu ứng cố định là không khả thi.
VTLU PT.DLB 12 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hiệu ứng cố định

Ước lượng "Within"

Xét hiệu ứng cố định đơn giản cho cá nhân riêng lẻ thứ i:
yit = αi + β1 x1it + . . . + βk xkit + uit t = 1, . . . , T . (2)

Tính trung bình của cá nhân thứ i theo thời gian và sử dụng giả định
về các tham số không đổi theo thời gian, ta có:

ȳi = αi + β1 x̄1i + . . . + βk x̄ki + ūi (3)

Trong đó,
1
PT 1
PT
ȳi = T t=1 yit , x̄1i = T t=1 x1it ,

1
PT 1
PT
x̄ki = T t=1 xkit , ūi = T t=1 ui

VTLU PT.DLB 13 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hiệu ứng cố định

Ước lượng "Within"

Lấy (2) trừ cho (3), ta có:

(yit − ȳi ) = (αi − αi ) +β1 (x1it − x̄1i ) + . . . + βk (xitk − x̄ki ) + (uit − ūi )
| {z }
=0

Ký hiệu:
• ỹit = (yit − ȳi ), x̃1it = (x1it − x̄1i ),
• x̃kit = (xkit − x̄ki ), ũit = (uit − ūi ).
Khi đó, ta có:
ỹit = β1 x̃1t + . . . + βk x̃kt + ũit

⇒ Trong ước lượng "Within", các hiệu ứng cố định không được
trình bày trực tiếp trong kết quả ước lượng như LSDV.

VTLU PT.DLB 14 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hiệu ứng cố định

Ước lượng "Within"

Để biết có hiệu ứng cố định khác nhau giữa các đơn vị chéo hay
không, ta tiến hành kiểm định giả thuyết:
(
H0 : α1 = α2 = . . . = αN
(4)
H1 : Ngược lại H0

Kiểm định (4) còn được gọi là kiểm định khả năng gộp.

Kiểm định này nhằm kiểm tra xem có sự khác biệt theo nghĩa thống
kê giữa các hệ số chặn của từng cá nhân cụ thể hay không.

VTLU PT.DLB 15 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hiệu ứng cố định

Ước lượng "Within"

Để kiểm định (4), ta tiến hành kiểm định Wald theo các bước sau:

1 Ước lượng mô hình không hạn chế (ước lượng mô hình LSDV)
2 Ước lượng mô hình hạn chế (mô hình hồi quy gộp OLS).
3 Tính tổng bình phương sai số của cả hai mô hình: RSSU và RSSR .
4 Tính giá trị kiểm định F theo công thức:

(RSSR − RSSU ) /(N − 1)


F=
RSSU /(NT − K )

5 Bác bỏ H0 khi và chỉ khi F > Fα,N−1,NT −K .

VTLU PT.DLB 16 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hiệu ứng cố định

Ước lượng "Within"

Các hệ số của ước lượng "Within" giống hệt với ước lượng của
LSDV. Tuy nhiên, ước lượng "Within" hiệu chỉnh tổng bình phương
của các sai số ngẫu nhiên.
Một số nhược điểm của ước lượng "Within":
1 Ước lượng "Within" bỏ qua tất cả các biến bất biến theo thời gian ,

Ví dụ: giới tính, quyền công dân và dân tộc.


2 Ước lượng "Within" tạo ra số liệu thống kê không chính xác . Do
không sử dụng các biến giả nên tổng bình phương của sai số ngẫu
nhiên trong ước lượng "Within" có số bậc tự do lớn hơn,
⇒ Trung bình của bình phương các sai số nhỏ hơn (MSE nhỏ hơn)
⇒ Sai số chuẩn của ước lượng (se) nhỏ hơn
⇒ Các kiểm định không còn chính xác.

VTLU PT.DLB 17 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hiệu ứng cố định

Ước lượng "Within"

3 R2 của ước lượng "Within" bị sai vì không bao gồm các hệ số chặn
ứng với các biến giả.
4
Kết quả của ước lượng "Within" không trình bày các hiệu ứng cố định
Do đó, nếu cần, ta phải tính toán theo công thức:

di∗ = ȳi• − x̄i• ′ β

⇒ Cần hiệu chỉnh cho sai số chuẩn (se) của các hệ số thu được từ ước
lượng "Within" theo công thức:
s r
within
dferror nT − k

se (βk ) = se(βk ) LSDV
= se(βk )
dferror nT − n − k

VTLU PT.DLB 18 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hiệu ứng cố định

Ước lượng "Within"

Nhận xét
Ước lượng "Within" thường hiệu quả hơn nếu đi kèm với các hiệu
chỉnh sai số chuẩn vững/ sai số phân cụm.

Trong ước lượng "Within", các hiệu ứng cụ thể của từng cá nhân
được cố định nên có khả năng xảy ra tương quan với các biến
giải thích trong mô hình.

VTLU PT.DLB 19 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hiệu ứng ngẫu nhiên

Giới thiệu
Xét mô hình:
yit = α + Xit′ β + uit , i ∈ {1, . . . , N}, t ∈ {1, . . . , T } (5)
Trong (5), uit là tổng của 2 thành phần sai số:
µi – thành phần ngẫu nhiên riêng lẻ của đơn vị chéo thứ i
εit – sai số ngẫu nhiên đặc trưng của đơn vị chéo i theo thời gian.
Hay:
uit = µi + εit
 
Với, µi ∼ N 0, σµ2 và εit ∼ N 0, σε2 .


Lưu ý
Các biến giải thích có thể bất biến thiên thời gian.
Các hiệu ứng riêng lẻ (dạng ngẫu nhiên) độc lập với nhau, nghĩa là:

E µi µj = 0 với mọi i ̸= j
VTLU PT.DLB 20 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hiệu ứng ngẫu nhiên

Các giả định của ước lượng RE

Giả định của ước lượng RE là các hiệu ứng riêng lẻ không tương
quan với các biến giải thích trong mô hình, hay Cov (Xit , µi ) = 0.

Trong REM, µi (sự không đồng nhất ngẫu nhiên riêng lẻ) là một
thành phần của toàn bộ sai số ngẫu nhiên.

Do đó, mô hình hiệu ứng ngẫu nhiên còn được gọi là mô hình thành
phần sai số ngẫu nhiên.

Hệ số chặn và tham số độ dốc là giống nhau giữa các cá nhân.

Sự khác biệt giữa các cá nhân (hoặc khoảng thời gian) nằm ở các sai
số ngẫu nhiên riêng lẻ của từng cá nhân, chứ không phải ở các hệ số
chặn.

VTLU PT.DLB 21 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hiệu ứng ngẫu nhiên

Ước lượng GLS (bình phương tối thiểu tổng quát)


RE được ước lượng với các phương pháp: GLS, FGLS hoặc EGLS.
Ta có:
1 Tổng sai số uit được biểu diễn dưới dạng :

uit = µi + εit
 
Với µi ∼ N 0, σµ2 và εit ∼ N 0, σε2 .


2 Với đối tượng chéo thứ i, các phần tử thuộc đường chéo chính của
ma trận phương sai-hiệp phương sai của uit là:
     
E uit2 = E µ2i + E ε2it + 2 cov (µi , εit )
= σµ2 + σε2

VTLU PT.DLB 22 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hiệu ứng ngẫu nhiên

Ước lượng GLS (bình phương tối thiểu tổng quát)

3 Các phần tử nằm ngoài đường chéo chính của ma trận hiệp phương
sai-hiệp phương sai của sai số ngẫu nhiên, có dạng:
 
cov (uit , uis ) = E (uit uis ) = E (µi + εit ) (µi + εis ) , với (t ̸= s)

⇒ Ta có:
 
cov (uit , uis ) = E µ2i + E (µi εit ) + E (µi εis ) + E (εit εis ) = σµ2
| {z } | {z 0
} | {z } | {z }
0 0
2
σµ

VTLU PT.DLB 23 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hiệu ứng ngẫu nhiên

Ước lượng GLS (bình phương tối thiểu tổng quát)


4 Với cá nhân thứ i, ma trận phương sai-hiệp phương sai của sai số
ngẫu nhiên có dạng:  
1 ρ ... ρ
.
 ρ 1 .. ρ 
 
E ui ui′ = Σui = σµ2 + σε2 

 .. .. . . .. 

 . . . . 
ρ ρ ... 1
Trong đó,
σµ2
ρ=
σµ2 + σε2

Lưu ý

Σu là ma trận chéo dạng khối có các phần tử trên đường chéo là Σui
và các Σui không có tương quan với nhau.
VTLU PT.DLB 24 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hiệu ứng ngẫu nhiên

Ước lượng GLS (bình phương tối thiểu tổng quát)

Sai số ngẫu nhiên của các đơn vị chéo, ký hiệu là µi , thể hiện sự
độc lập giữa các hiệu ứng ngẫu nhiên theo thời gian.

Tuy nhiên, các µi cũng có thể dẫn đến tương quan cân bằng giữa
các sai số hồi quy trong cùng một đơn vị chéo.

Thật vậy, xét mô hình tuyến tính sau:

y = βX + u (6)
′ = σ 2 I thì ước lượng OLS của (6) là:

Khi E uu
−1
βbOLS = X ′ X X ′y

VTLU PT.DLB 25 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hiệu ứng ngẫu nhiên

Ước lượng GLS (bình phương tối thiểu tổng quát)

GLS cho phép nới lỏng giả định trên ma trận phương sai-hiệp phương
sai của số hạng sai số, như sau:

E uu ′ = Σ với Σ không nhất thiết phải là ma trận chéo như OLS .




Nhưng Σ phải là một ma trận xác định dương .

Khi đó, mô hình (6) được biến đổi thành:

Cy = C βX + Cu, (7)
1
trong đó, C = Σ− 2 .

VTLU PT.DLB 26 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hiệu ứng ngẫu nhiên

Ước lượng GLS (bình phương tối thiểu tổng quát)

Ma trận phương sai-hiệp phương sai của sai số trong (7) có dạng:
  1 ′   
− 21
E CuC u = E Σ u Σ− 2 u ′ = E Σ−1 Σ = I
′ ′


Và, ước lượng của vectơ tham số β theo phương pháp GLS là:

 −1
βbGLS = X ′ Σ−1 X X ′ Σ−1 y

VTLU PT.DLB 27 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hiệu ứng ngẫu nhiên

Ước lượng GLS (bình phương tối thiểu tổng quát)

Nhận xét
Sử dụng ước lượng GLS, ta có:
 −1
βbRE = X ′ Σ−1 X X ′ Σ−1 y

   −1
Var βbRE = X ′ Σ−1 X

Tuy nhiên, Σ được tính như thế nào?

VTLU PT.DLB 28 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hiệu ứng ngẫu nhiên

Ước lượng GLS (bình phương tối thiểu tổng quát)

Ta có Σ = E uu ′ là ma trận đường chéo theo khối và:





0
 nếu i ̸= j
  2 2
cov uit , ujs = σµ+ σε  nếu i = jvà s = t
ρ σµ2 + σε2

nếu i = j và s ̸= t

2
σµ
trong đó, ρ = .
( µ ε)
σ 2 +σ 2

Tuy nhiên, ta lại không có σµ và σε .

VTLU PT.DLB 29 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hiệu ứng ngẫu nhiên

Ước lượng GLS

Phương pháp
Ước lượng GLS được thực hiện trên các biến độc lập xjit ∗ và biến phụ

thuộc yit∗ , với xjit


∗ và y ∗ được biến đổi từ x và y theo công thức sau:
it jit it


xjit = xjit − θi x̄ji
(8)
yit∗ = yit − θi ȳi

trong đó x̄ji và ȳi là trung bình của các đơn vị chéo.

VTLU PT.DLB 30 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hiệu ứng ngẫu nhiên

Ước lượng GLS (bình phương tối thiểu tổng quát)


Phương pháp
Tham số biến đổi θi trong (8) được ước lượng theo công thức:
s
bε2
σ
θbi = 1 − (9)
bµ2 + σ
Ti σ bε2

Trong (9), phương sai của sai số đặc trưng, σε2 , được theo công thức:
Pn PTi 2
2 i t ubit
σ
bε =
NT − N − K

Trong đó, ubit2 = (yit − ȳi + ȳ ) − α


bWithin − (xit − x̄i + x̄) βbWithin

bWithin và βbWithin là các hệ số thu được từ ước lượng "Within".


Với α
VTLU PT.DLB 31 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hiệu ứng ngẫu nhiên

Ước lượng GLS (bình phương tối thiểu tổng quát)


Phương pháp
Phương sai của sai số ngẫu nhiên riêng lẻ theo đối tượng chéo, ký
RSS Between b2
σ
bµ2 =
hiệu là σµ2 , được ước lượng theo công thức: σ − ε
N −K T
Trong đó,
n
T là trung bình điều hòa của Ti , tức là T = Pn  1

i Ti

RSS Between là tổng bình phương phần dư của ước lượng "Between":

n 
X 2
RSS Between = bBetween − x̄i βbBetween
ȳi − α
i

Với βbBetween và α
bBetween là các hệ số của ước lượng "Between".
VTLU PT.DLB 32 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hiệu ứng ngẫu nhiên

Ước lượng GLS (bình phương tối thiểu tổng quát)

Nhận xét
Phương pháp GLS cho kết quả ước lượng chính xác trong các
trường hợp như: mẫu nhỏ và bảng không cân bằng.
Ước lượng cho σε2 tìm được qua phần dư của ước lượng "Within".
Phương sai của sai số riêng lẻ theo đơn vị chéo:

2 RSS Between − (N − K )b
σε2
σ
bµ,SA =
NT − tr
n −1 ′ ′ o
Với tr = trace X ′ PX X ZZ X .
n o
1 ′

Trong đó, P = diag Ti eTi eTi và Z = diag eTi
Với eTi là một vectơ cột cấp Ti × 1 có tất cả phần tử đều bằng 1.

VTLU PT.DLB 33 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hiệu ứng ngẫu nhiên

Ước lượng FGLS

Ước lượng FGLS, được tiến hành theo các bước:


1 Bước 1: Ước lượng θ bằng σ bµ2 và σ
bε2 . Trong đó, σ
bµ2 có được từ ước
lượng "Between" (hồi quy trung bình nhóm) và σ bε2 có được từ RSS
của ước lượng "Within".
Khi đó, s s
bε2
σ bε2
σ
θb = 1 − 2
=1− 2

bµ + σbε2 Tσ
bbetween
bε2
σ RSSbetween
bµ2 = σ
Trong đó, σ 2
bbetween − T , với σ 2
bbetween = n−k−1 ,

− v̄i• )2
Pn PT
RSSwithin e ′ ewithin t=1 (vit
bε2
σ = = = i=1
nT − n − k nT − n − k nT − n − k

Trong đó vit là phần dư của ước lượng LSDV.

VTLU PT.DLB 34 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hiệu ứng ngẫu nhiên

Ước lượng FGLS

2 Bước 2: Biến đổi cho biến phụ thuộc, các biến giải thích và hệ số
chặn theo công thức sau:

yit∗ = yit − θbȳi•


x ∗ = xkit − θx̄
kit
b ki•

α = 1 − θb

3 Bước 3: Thực hiện ước lượng POLS với các biến đã được chuyển đổi
đó vừa thu được theo mô hình:

yit∗ = α∗ + xit∗ β ∗ + ε∗it .

VTLU PT.DLB 35 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hiệu ứng ngẫu nhiên

Xác định phương pháp ước lượng cho REM

Mô hình hiệu ứng ngẫu nhiên được ước lượng bằng:


1 Bình phương tối thiểu tổng quát (GLS) nếu biết trước cấu trúc hiệp
phương sai.
2 Bình phương tối thiểu tổng quát khả thi (FGLS) hoặc bình phương
tối thiểu tổng quát ước lượng (EGLS) nếu cấu trúc hiệp phương sai
của sai số ngẫu nhiên tổng hợp chưa xác định.
⇒ Vì Σ thường không biết trước nên FGLS / EGLS được sử dụng
thường xuyên hơn GLS.
⇒ So với mô hình hiệu ứng cố định, mô hình hiệu ứng ngẫu nhiên
tương đối khó ước lượng hơn.

VTLU PT.DLB 36 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hiệu ứng ngẫu nhiên

Kiểm định sự không đồng nhất trong REM

Định nghĩa
  
Phương sai của hiệu ứng ngẫu nhiên là σµ2 hay µ ∼ N 0, σµ2 .

⇒ Giả thuyết của bài toán kiểm định xem có hiện diện của sự không
đồng nhất hay không là:

(
H0 : σµ = 0 (Không có hiện diện của sự không đồng nhất)
H1 : σµ ̸= 0 (Có hiện diện của sự không đồng nhất)

VTLU PT.DLB 37 / 73
CÁC MÔ HÌNH HIỆU ỨNG MỘT CHIỀU Mô hình hiệu ứng ngẫu nhiên

Kiểm định sự không đồng nhất trong REM


Định nghĩa
Giá trị kiểm định nhân tử Lagrange được tính theo công thức:
 2 
s PN PT
NT  i=1 ubit
 P Pt=1

LM = N T
− 1
2(T − 1)  i=1 u
t=1 it
b 2 

Trong đó, phần dư ubit = yit − α


b0 − βb1 x1it − . . . − βbk xkit .
LM ∼ χ2 (1). Khi cỡ mẫu lớn ⇒ LM ∼ N (0, 1).

Nếu giả thuyết H0 bị bác bỏ ⇒ Có sự khác biệt ngẫu nhiên giữa các
đơn vị trong mẫu dữ liệu ⇒ mô hình hiệu ứng ngẫu nhiên là phù hợp.

Nếu giả thuyết H0 không bị bác bỏ ⇒ không có bằng chứng để kết


luận rằng có sự hiện diện của các hiệu ứng ngẫu nhiên.
VTLU PT.DLB 38 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Các lệnh cơ bản cho dữ liệu bảng với Stata

Khai báo dữ liệu bảng:


. xtset
Mô tả dữ liệu bảng:
. xtdescribe
Định dạng lại dữ liệu bảng:
. reshape

VTLU PT.DLB 39 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Khai báo dữ liệu

Ví dụ

. xtset teamid season


Panel variable: teamid (unbalanced)
Time variable: season, 1 to 10
Delta: 1 unit

VTLU PT.DLB 40 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Mô tả dữ liệu

Ví dụ

. xtdescribe
teamid: 1, 2, ..., 29 n = 29
season: 1, 2, ..., 10 T = 10
Delta(season) = 1 unit
Span(season) = 10 periods
(teamid*season uniquely identifies each observation)
Distribution of T_i: min 5% 25% 50% 75% 95% max
6 10 10 10 10 10 10
Freq. Percent Cum. Pattern

28 96.55 96.55 1111111111


1 3.45 100.00 ....111111

29 100.00 XXXXXXXXXX

VTLU PT.DLB 41 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Mô tả dữ liệu

Ví dụ

. xtsum lnrev wins season


Variable Mean Std. dev. Min Max Observations

lnreve~e overall 4.532293 .2359855 4.068955 5.234958 N = 286


between .2126766 4.253718 5.08638 n = 29
within .1084511 4.120964 4.831038 T-bar = 9.86207

wins overall 41.03497 12.43758 9 67 N = 286


between 7.043591 31.33333 57.3 n = 29
within 10.35637 8.534965 64.53497 T-bar = 9.86207

season overall 5.541958 2.872126 1 10 N = 286


between .3713907 5.5 7.5 n = 29
within 2.857738 1.041958 10.04196 T-bar = 9.86207

VTLU PT.DLB 42 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Các kỹ thuật phân tích dữ liệu bảng phổ biến

1 Hồi quy OLS gộp.

2 Mô hình hiệu ứng cố định & Mô hình khác biệt trong khác biệt.

3 Mô hình hiệu ứng ngẫu nhiên.

VTLU PT.DLB 43 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Ước lượng “between” và “Within”


Định nghĩa

VTLU PT.DLB 44 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Ước lượng OLS gộp (POLS)


Định nghĩa

VTLU PT.DLB 45 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Ước lượng OLS gộp (POLS)

• Ước lượng POLS được biểu diễn theo mô hình sau:

VTLU PT.DLB 46 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Ước lượng OLS gộp (POLS)


Trường hợp: ε độc lập

Ví dụ

VTLU PT.DLB 47 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Ước lượng OLS gộp (POLS)


Trường hợp: ε phụ thuộc

Ví dụ

Phân cụm theo đối tượng chéo i.


Có tương quan chuỗi.
VTLU PT.DLB 48 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Ước lượng mô hình POLS trên Stata

1 Ước lượng mô hình POLS theo mặc định của Stata.


. regress lnrev wins

Ví dụ

Source SS df MS Number of obs = 286


F(1, 284) = 41.19
Model 2.01031954 1 2.01031954 Prob > F = 0.0000
Residual 13.8610928 284 .048806665 R-squared = 0.1267
Adj R-squared = 0.1236
Total 15.8714124 285 .055689166 Root MSE = .22092

lnrevenue Coefficient Std. err. t P>|t| [95% conf. interval]

wins .0067526 .0010522 6.42 0.000 .0046816 .0088237


_cons 4.255198 .0451083 94.33 0.000 4.166409 4.343987

VTLU PT.DLB 49 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Ước lượng mô hình POLS trên Stata

2 Hiệu chỉnh phương sai sai số bằng phương pháp phân cụm.
. regress lnrev wins, cluster(teamid)

Ví dụ

Linear regression Number of obs = 286


F(1, 28) = 12.52
Prob > F = 0.0014
R-squared = 0.1267
Root MSE = .22092
(Std. err. adjusted for 29 clusters in teamid)

Robust
lnrevenue Coefficient std. err. t P>|t| [95% conf. interval]

wins .0067526 .0019087 3.54 0.001 .0028429 .0106624


_cons 4.255198 .0957227 44.45 0.000 4.059119 4.451277

VTLU PT.DLB 50 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Ước lượng mô hình POLS trên Stata

3 Bao gồm thêm xu thế tuyến tính trong mô hình.

. regress lnrev wins season, cluster(teamid)

Ví dụ

Linear regression Number of obs = 286


F(2, 28) = 22.38
Prob > F = 0.0000
R-squared = 0.1759
Root MSE = .21498
(Std. err. adjusted for 29 clusters in teamid)

Robust
lnrevenue Coefficient std. err. t P>|t| [95% conf. interval]

wins .0068132 .0018965 3.59 0.001 .0029284 .0106981


season .0182414 .0033079 5.51 0.000 .0114655 .0250172
_cons 4.151619 .0965789 42.99 0.000 3.953786 4.349452

VTLU PT.DLB 51 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Ước lượng mô hình POLS trên Stata


4 Thêm hiệu ứng thời gian: . regress lnrev wins i.season, cluster(teamid)

Linear regression Number of obs = 286


F(10, 28) = 7.05
Prob > F = 0.0000
R-squared = 0.1801
Root MSE = .21753
(Std. err. adjusted for 29 clusters in teamid)

Robust
lnrevenue Coefficient std. err. t P>|t| [95% conf. interval]

wins .006792 .0019233 3.53 0.001 .0028524 .0107317


season
2 -.0033126 .0197658 -0.17 0.868 -.043801 .0371757
3 .0407724 .0265828 1.53 0.136 -.0136801 .0952248
4 .0794258 .0283934 2.80 0.009 .0212646 .1375871
5 .085191 .0286332 2.98 0.006 .0265386 .1438435
6 .1182505 .0293684 4.03 0.000 .0580921 .178409
7 .1191222 .0294409 4.05 0.000 .0588153 .1794291
8 .144221 .0318642 4.53 0.000 .0789501 .2094919
9 .1353023 .0302836 4.47 0.000 .0732692 .1973355
10 .1528977 .0340485 4.49 0.000 .0831524 .2226429

VTLU
_cons 4.165584 .0961253 PT.DLB
43.33 0.000 3.968681 4.362488 52 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Ước lượng mô hình POLS trên Stata


5 So sánh các mô hình POLS

Variable olsdef olsclu olstclu olsclutime

wins 0.00675 0.00675 0.00681 0.00679


0.00105 0.00191 0.00190 0.00192
6.42 3.54 3.59 3.53
season 0.01824
0.00331
5.51
season
2 -0.00331
0.01977
-0.17
3 0.04077
0.02658
1.53
4 0.07943
0.02839
2.80
5 0.08519
VTLU PT.DLB 0.02863 53 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Ước lượng hiệu ứng cố định (FE)

Định nghĩa
Nếu Cov (xit , εit ) ̸= 0 với mọi t ⇒ ước lượng POLS bị chệch

yit = β1 xit + εit


yit = β1 xit + ui + eit Phân rã sai số ngẫu nhiên

yit − ȳi = β1 (xit − xi ) + (ui − ui ) + (eit − ei ) −→ hiệu ứng “Within”

⇔ ÿit = β1 ẍit + ëit

VTLU PT.DLB 54 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Ước lượng hiệu ứng cố định (FE)

VTLU PT.DLB 55 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Ước lượng FEM với Stata

Các bước ước lượng FEM trên Stata

Ví dụ
1 Khai báo cấu trúc dữ liệu panel.
. xtset teamid season

2 Ước lượng FEM theo mặc định với cú pháp:


. global xlistlong wins season playoff champ allstars lncitypop
. xtreg lnrev $xlistlong, fe

3 Hiệu chỉnh sai số vững bằng phương pháp cluster.


. xtreg lnrev $xlistlong, fe vce(robust)

4 Ước lượng LSDV:

. areg lnrev $xlistlong, absorb(teamid) vce(cluster teamid)

VTLU PT.DLB 56 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Ước lượng FEM với Stata


. xtreg lnrev $xlistlong, fe

Fixed-effects (within) regression Number of obs = 286


Group variable: teamid Number of groups = 29
R-squared: Obs per group:
Within = 0.5300 min = 6
Between = 0.1899 avg = 9.9
Overall = 0.0416 max = 10
F(6,251) = 47.18
corr(u_i, Xb) = -0.7310 Prob > F = 0.0000

lnrevenue Coefficient Std. err. t P>|t| [95% conf. interval]

wins .0027161 .0007319 3.71 0.000 .0012746 .0041575


season .0200251 .0016641 12.03 0.000 .0167478 .0233024
playoff .0361872 .0167051 2.17 0.031 .0032871 .0690872
champ .0052405 .0299981 0.17 0.861 -.0538395 .0643205
allstars .0355788 .0071108 5.00 0.000 .0215744 .0495832
lncitypop -.2020894 .0491055 -4.12 0.000 -.2988007 -.1053782
_cons 4.522155 .064912 69.67 0.000 4.394313 4.649996

sigma_u .32571403
sigma_e .07922356
rho .94414349 (fraction of variance due to u_i)

F test that all u_i=0: F(28, 251) = 40.13 Prob > F = 0.0000
VTLU PT.DLB 57 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Ước lượng FEM với Stata

Fixed-effects (within) regression Number of obs = 286


Group variable: teamid Number of groups = 29
R-squared: Obs per group:
Within = 0.5300 min = 6
Between = 0.1899 avg = 9.9
Overall = 0.0416 max = 10
F(6,28) = 42.24
corr(u_i, Xb) = -0.7310 Prob > F = 0.0000
(Std. err. adjusted for 29 clusters in teamid)

Robust
lnrevenue Coefficient std. err. t P>|t| [95% conf. interval]

wins .0027161 .0006931 3.92 0.001 .0012963 .0041358


season .0200251 .0028536 7.02 0.000 .0141797 .0258706
playoff .0361872 .0209415 1.73 0.095 -.0067095 .0790838
champ .0052405 .0167433 0.31 0.757 -.0290566 .0395376
allstars .0355788 .0067829 5.25 0.000 .0216848 .0494729
lncitypop -.2020894 .0632009 -3.20 0.003 -.3315505 -.0726283
_cons 4.522155 .0957222 47.24 0.000 4.326077 4.718233

sigma_u .32571403
sigma_e .07922356
rho .94414349 (fraction of variance due to u_i)

VTLU PT.DLB 58 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Ước lượng LSDV cho FEM với Stata

. areg lnrev $xlistlong, absorb(teamid) vce(cluster teamid)

Linear regression, absorbing indicators Number of obs = 286


Absorbed variable: teamid No. of categories = 29
F(6, 28) = 38.00
Prob > F = 0.0000
R-squared = 0.9007
Adj R-squared = 0.8873
Root MSE = 0.0792
(Std. err. adjusted for 29 clusters in teamid)

Robust
lnrevenue Coefficient std. err. t P>|t| [95% conf. interval]

wins .0027161 .0007307 3.72 0.001 .0012192 .0042129


season .0200251 .0030086 6.66 0.000 .0138623 .026188
playoff .0361872 .0220787 1.64 0.112 -.0090389 .0814132
champ .0052405 .0176525 0.30 0.769 -.030919 .0414001
allstars .0355788 .0071512 4.98 0.000 .0209303 .0502274
lncitypop -.2020894 .0666328 -3.03 0.005 -.3385806 -.0655983
_cons 4.522155 .1009202 44.81 0.000 4.315429 4.728881

VTLU PT.DLB 59 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Ước lượng LSDV cho FEM với Stata


. regress lnrev $xlistlong i.teamid, vce(cluster teamid)

Linear regression Number of obs = 286


F(5, 28) = .
Prob > F = .
R-squared = 0.9007
Root MSE = .07922
(Std. err. adjusted for 29 clusters in teamid)

Robust
lnrevenue Coefficient std. err. t P>|t| [95% conf. interval]

wins .0027161 .0007307 3.72 0.001 .0012192 .0042129


season .0200251 .0030086 6.66 0.000 .0138623 .026188
playoff .0361872 .0220787 1.64 0.112 -.0090389 .0814132
champ .0052405 .0176525 0.30 0.769 -.030919 .0414001
allstars .0355788 .0071512 4.98 0.000 .0209303 .0502274
lncitypop -.2020894 .0666328 -3.03 0.005 -.3385806 -.0655983

teamid
2 .2863951 .0266945 10.73 0.000 .2317138 .3410764
3 -.1292118 .0250533 -5.16 0.000 -.1805312 -.0778924
4 -.4281687 .049685 -8.62 0.000 -.5299438 -.3263936
5 -.5763522 .0707962 -8.14 0.000 -.7213717 -.4313326
6 -.5243262 .0576789 -9.09 0.000 -.642476 -.4061763
VTLU PT.DLB 60 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Ước lượng hiệu ứng ngẫu nhiên (RE)

yit = β0 + β1 xit + εit


εit = µi + eit
Cov (xit , µi ) = 0, t = 1, 2, . . . , T
s
σ2e
θ =1−
σe2 + T σµ2

Phân rã sai số ngẫu nhiên

yit − θyi = β0 (1 − θ) + β1 (xit − θxi ) + (εit − θεi )


• Dữ liệu được biến đổi theo phương pháp này gọi là "dữ liệu gần như
khử trung bình theo thời gian" (quasi time-demeaned data).
⇒ Ước lượng GLS là ước lượng POLS với dữ liệu đã được biến đổi.

VTLU PT.DLB 61 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Ước lượng hiệu ứng ngẫu nhiên (RE)

yit − θyi = β0 (1 − θ) + β1 (xit − θxi ) + (εit − θεi )

Nếu θ = 0, thì RE = POLS

Nếu θ = 1, thì RE = FE

⇒ β RE nằm giữa β POLS và β FE .

VTLU PT.DLB 62 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Ước lượng REM với Stata


. xtreg lnrev $xlistlong, re

Random-effects GLS regression Number of obs = 286


Group variable: teamid Number of groups = 29
R-squared: Obs per group:
Within = 0.4918 min = 6
Between = 0.3340 avg = 9.9
Overall = 0.2806 max = 10
Wald chi2(6) = 244.21
corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000

lnrevenue Coefficient Std. err. z P>|z| [95% conf. interval]

wins .0024285 .0007679 3.16 0.002 .0009234 .0039336


season .0187846 .0017418 10.78 0.000 .0153708 .0221985
playoff .0385326 .0176104 2.19 0.029 .0040168 .0730484
champ .0117708 .0315665 0.37 0.709 -.0500984 .0736401
allstars .0372402 .0074693 4.99 0.000 .0226007 .0518796
lncitypop .0195605 .0314514 0.62 0.534 -.0420831 .0812042
_cons 4.247665 .0559834 75.87 0.000 4.13794 4.357391

sigma_u .15829556
sigma_e .07922356
rho .79969356 (fraction of variance due to u_i)

VTLU PT.DLB 63 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Ước lượng REM với Stata


. xtreg lnrev $xlistlong, re vce(robust)

Random-effects GLS regression Number of obs = 286


Group variable: teamid Number of groups = 29
R-squared: Obs per group:
Within = 0.4918 min = 6
Between = 0.3340 avg = 9.9
Overall = 0.2806 max = 10
Wald chi2(6) = 177.67
corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000
(Std. err. adjusted for 29 clusters in teamid)

Robust
lnrevenue Coefficient std. err. z P>|z| [95% conf. interval]

wins .0024285 .0007802 3.11 0.002 .0008993 .0039576


season .0187846 .003266 5.75 0.000 .0123835 .0251858
playoff .0385326 .0199886 1.93 0.054 -.0006443 .0777095
champ .0117708 .0162957 0.72 0.470 -.0201681 .0437097
allstars .0372402 .0065823 5.66 0.000 .0243391 .0501413
lncitypop .0195605 .0871573 0.22 0.822 -.1512647 .1903857
_cons 4.247665 .1075938 39.48 0.000 4.036785 4.458545

sigma_u .15829556
sigma_e .07922356
rho .79969356 (fraction of variance due to u_i)
VTLU PT.DLB 64 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

So sánh FEM và REM

Mô hình hiệu ứng cố định Mô hình hiệu ứng ngẫu nhiên

Dạng hàm: yit = (α + ui ) + Xit′ β + vit yit = α + Xit′ β + (ui + vit )

Giả định Các hiệu ứng riêng lẻ


không tương quan với các Xj

Hệ số hệ số chặn Thay đổi theo nhóm Không đổi


và/hoặc thời gian

Phương sai của sai số Hằng số Phân phối ngẫu nhiên theo
nhóm và/hoặc theo thời gian

Hệ số độ dốc Không đổi Không đổi

Ước lượng LSDV, ước lượng hiệu ứng Within GLS, FGLS (EGLS)

Kiểm định giả thuyết Kiểm định F Kiểm định Breusch-Pagan LM

VTLU PT.DLB 65 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

So sánh ba phương pháp ước lượng


LSDV Ước lượng Within Ước lượng Between

Dạng hàm: yi = iαi + Xi β + εi yit − ȳi• = xit − x̄i• ȳi• = α + x̄i• + εi


+εit − ε̄i•
Bất biến theo t Có Không Không
Biến giả Có Không Không
Hệ số Được tính sẵn Cần tính toán N/A
của biến giả
Chuyển đổi Không Khác biệt mean(nhóm)
so với mean(nhóm)
Hệ số chặn Có Không Có

R2 Đúng Không chính xác


SSE Đúng Chính xác

SRMSE Đúng Không chính xác (nhỏ hơn)

Sai số chuẩn Đúng Không chính xác (nhỏ hơn)

DFerror nT − n − k ∗ nT − k(n lớn hơn ) n−k −1


Số quan sát nT nT n

VTLU PT.DLB 66 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Mô hình FEM và REM

Các hiệu ứng cố định trong FEM được xác định bằng kiểm định F.

Các hiệu ứng ngẫu nhiên trong REM được xác định với kiểm định
LM.

Kiểm định Hausman (Hausman, 1978) được sử dụng để lựa chọn giữa
mô hình hiệu ứng ngẫu nhiên và mô hình hiệu ứng cố định với giả
thuyết H0 : các hiệu ứng riêng lẻ không tương quan với các biến giải
thích.

Nếu không bác bỏ H0 thì một mô hình hiệu ứng ngẫu nhiên là mô
hình được chọn.

VTLU PT.DLB 67 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Kiểm định Hausman

Theo (Hausman, 1978), giả thuyết của kiểm định Hausman là:
H0 : các µi không tương quan với bất kỳ biến giải thích nào trong mô
hình.
H1 : các µi có tương quan với ít nhất một biến giải thích trong mô
hình.
⇒ Nếu giả thuyết H0 bị bác bỏ, LSDV và GLS là nhất quán, nhưng LSDV
không hiệu quả.
⇒ Ngược lại,nếu giả thuyết H0 bị bác bỏ, LSDV nhất quán nhưng GLS
không nhất quán và bị chệch (Greene, 2008: 208).

VTLU PT.DLB 68 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Kiểm định Hausman

Kiểm định Hausman nhằm xác định xem "khác biệt giữa hiệp phương
sai của một ước lượng hiệu quả so với một ước lượng không hiệu quả
có bằng không hay không" (Greene, 2008: 208).
Trị thống kê kiểm định được tính theo công thức:

LM = (bLSDV − bRE )′ W
c−1 (bLSDV − bRE ) ∼ χ2 (k)

Trong đó Wc = Var [bLSDV − bRE ] = Var (bLSDV ) − Var (bRE ) là khác


biệt trong ma trận hiệp phương sai ước lượng của LSDV (robust) và
GLS (mô hình hiệu quả).
Trị thống kê kiểm định này tuân theo phân phối chi-bình phương với
mức độ tự do k.

VTLU PT.DLB 69 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Kiểm định Chow về khả năng gộp


Kiểm định này nhằm kiểm tra xem hệ số độ dốc bên trong các đơn vị chéo
(hay theo thời gian) có giống nhau hay không (Baltagi 2001: 51-57).
1 Giả thuyết của kiểm định Chow này là:
H0 : hệ số độ dốc của tất cả k biến giải thích là như nhau với mọi đơn
vị chéo, hay H0 : βik = βk , ∀k.
H1 : Có ít nhất một hệ số độ dốc của tất cả k biến giải thích là khác
nhau trong các đơn vị chéo, hay H0 : βik = βk .
2 Giá trị kiểm định:
e ′ e − ei′ ei /(n − 1)(k + 1)
P 
F [(n − 1)(k + 1), n(T − k − 1)] = P ′
ei ei /n(T − k − 1)
Trong đó e ′ e là RSS của POLS và ei′ ei là RSS của POLS theo nhóm i.
3 Nếu giả thuyết H0 bị bác bỏ, dữ liệu bảng không thể gộp lại.
⇒ Mỗi cá nhân có hệ số độ dốc của các biến giải thích khác nhau.
⇒ Trong trường hợp này, mô hình hệ số ngẫu nhiên hoặc mô hình hồi
quy phân cấp sẽ phù hợp hơn.
VTLU PT.DLB 70 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Kiểm định Chow về khả năng gộp

Kiểm định Chow giả định rằng các thành phần phương sai của sai số
2
riêng lẻ tuân theo phân phối chuẩn, µ ∼ N 0, σ InT .
Nếu giả định này không đúng, kiểm định Chow có thể không kiểm
định đúng giả thuyết H0 (Baltagi, 2001: 53).
Kennedy (2008) lưu ý, "nếu có lý do để tin rằng các sai số ngẫu nhiên
trong các phương trình khác nhau có phương sai khác nhau hoặc có
mối tương quan đương thời giữa các sai số ngẫu nhiên của phương
trình, khi đó sử dụng ước lượng SURE thay cho ước lượng OLS".
Suy luận với OLS là không đáng tin cậy nếu ma trận hiệp phương sai
của sai số là không có dạng σ 2 I ".

VTLU PT.DLB 71 / 73
ƯỚC LƯỢNG CÁC MÔ HÌNH VỚI STATA

Kiểm định Hausman với Stata

. xtreg lnrev $xlistlong i.season, fe


. est store fixed

. xtreg lnrev $xlistlong i.season, re


. est store random

. est table random fixed, drop(i.year) b(%5.3f) se(%5.3f)

. hausman fixed random

VTLU PT.DLB 72 / 73

You might also like