Professional Documents
Culture Documents
Chương 5 Kiểm Định Giả Thiết
Chương 5 Kiểm Định Giả Thiết
Chương 5
KIỂM ĐỊNH GIẢ THIẾT
Nội dung
Đa cộng tuyến
Tự tương quan
Kỳ vọng của sai số ngẫu nhiên không tuân theo quy luật chuẩn
2
Kỳ vọng của sai số ngẫu nhiên khác không Giả thiết OLS về Kỳ vọng của sai số ngẫu nhiên
Đa cộng tuyến (Multicollinearity) Nguyên nhân
Phương sai sai số thay đổi (Heteroscedasticity) Hậu quả
Tự tương quan (Autocorrelation) Phát hiện
Sai số ngẫu nhiên không tuân theo quy luật chuẩn Cách khắc phục Notes
Y = β1 + β2 X2 + ... + βk Xk .
Giả thiết 3 của phương pháp OLS yêu cầu kỳ vọng có điều kiện của sai số
ngẫu nhiên trong mô hình bằng nhau và bằng 0:
E(u|X2 , ..., Xk ) = 0.
Kỳ vọng của sai số ngẫu nhiên khác không Giả thiết OLS về Kỳ vọng của sai số ngẫu nhiên
Đa cộng tuyến (Multicollinearity) Nguyên nhân
Phương sai sai số thay đổi (Heteroscedasticity) Hậu quả
Tự tương quan (Autocorrelation) Phát hiện
Sai số ngẫu nhiên không tuân theo quy luật chuẩn Cách khắc phục Notes
Điều kiện E(u) = 0 có thể dễ dàng được thoả mãn khi mô hình gốc có chứa hệ
số chặn. Dưới đây là một số nguyên nhân không thoả mãn điều kiện
cov(Xj , u) = 0:
Mô hình thiếu biến có tác động đến Y và biến này có tương quan tới ít
nhất một trong các biến độc lập sẵn có trong mô hình. Biến không được
đưa vào mô hình có thể do không có số liệu, hoặc do suy luận chủ quan
của người làm mô hình.
Dạng hàm sai
Tính tác động đồng thời của số liệu
Sai số đo lường của các biến độc lập
4
Kỳ vọng của sai số ngẫu nhiên khác không Giả thiết OLS về Kỳ vọng của sai số ngẫu nhiên
Đa cộng tuyến (Multicollinearity) Nguyên nhân
Phương sai sai số thay đổi (Heteroscedasticity) Hậu quả
Tự tương quan (Autocorrelation) Phát hiện
Sai số ngẫu nhiên không tuân theo quy luật chuẩn Cách khắc phục Notes
Kỳ vọng của sai số ngẫu nhiên khác không Giả thiết OLS về Kỳ vọng của sai số ngẫu nhiên
Đa cộng tuyến (Multicollinearity) Nguyên nhân
Phương sai sai số thay đổi (Heteroscedasticity) Hậu quả
Tự tương quan (Autocorrelation) Phát hiện
Sai số ngẫu nhiên không tuân theo quy luật chuẩn Cách khắc phục Notes
Phát hiện mô hình bị thiếu biến: Nếu biến bị thiếu có số liệu thì kiểm
định ý nghĩa thống kê của hệ số của biến bị thiếu khi thêm vào mô hình.
Mô hình có dạng hàm sai
Kiểm định chung về dạng hàm sai: Kiểm định Ramsey Reset dùng để
phát hiện dạng hàm sai do mô hình thiếu biến là hàm của các biến có sẵn
trong mô hình. Các bước kiểm định Ramsey-Reset:
- Bước 1: Hồi quy:
Y = β1 + β2 X2 + ... + βk Xk + u
- Bước 2: Hồi quy phụ:
Yi = β1 + β2 X2i + ... + βk Xki + α1 Ŷi2 + ... + αm Ŷim+1 + vi .
6
Kỳ vọng của sai số ngẫu nhiên khác không Giả thiết OLS về Kỳ vọng của sai số ngẫu nhiên
Đa cộng tuyến (Multicollinearity) Nguyên nhân
Phương sai sai số thay đổi (Heteroscedasticity) Hậu quả
Tự tương quan (Autocorrelation) Phát hiện
Sai số ngẫu nhiên không tuân theo quy luật chuẩn Cách khắc phục Notes
Nếu nguyên nhân là thiếu biến (quan sát được) được phát hiện từ kiểm
định t hoặc F thì chỉ đơn giản là thêm biến đó vào mô hình.
Nếu nguyên nhân là thiếu biến không quan sát được thì có thể khắc phục
bằng cách: sử dụng biến đại diện (proxy variable). Biến đại diện có tương
quan với biến bị thiếu và quan sát được.
Sử dụng phương pháp biến công cụ (instrumental variable) là biến có
tương quan cao với biến bị thiếu và không tương quan với sai số ngẫu
nhiên.
Kỳ vọng của sai số ngẫu nhiên khác không Đa cộng tuyến là gì?
Đa cộng tuyến (Multicollinearity) Nguyên nhân
Phương sai sai số thay đổi (Heteroscedasticity) Hậu quả của đa cộng tuyến
Tự tương quan (Autocorrelation) Cách phát hiện đa cộng tuyến cao
Sai số ngẫu nhiên không tuân theo quy luật chuẩn Khắc phục hiện tượng đa cộng tuyến Notes
Y = β1 + β2 X2 + ... + βk Xk + u.
Mô hình bị đa cộng tuyến hoàn hảo khi các biến độc lập có quan hệ tuyến
tính dưới dạng hàm số, tức là tồn tại αj , j = 2, 3, ..., k không đồng thời
bằng 0, sao cho
α1 + α2 X2 + α3 X3 + ... + αk Xk = 0.
Mô hình bị đa cộng tuyến không hoàn hảo nếu tồn tại λj , j = 2, ..., k
không đồng thời bằng 0, sao cho
α1 + α2 X2 + α3 X3 + ... + αk Xk + v = 0, trong đó v là sai số ngẫu nhiên.
Như vậy bản chất của đa cộng tuyến là do mối quan hệ tương quan giữa các
biến độc lập.
8
Kỳ vọng của sai số ngẫu nhiên khác không Đa cộng tuyến là gì?
Đa cộng tuyến (Multicollinearity) Nguyên nhân
Phương sai sai số thay đổi (Heteroscedasticity) Hậu quả của đa cộng tuyến
Tự tương quan (Autocorrelation) Cách phát hiện đa cộng tuyến cao
Sai số ngẫu nhiên không tuân theo quy luật chuẩn Khắc phục hiện tượng đa cộng tuyến Notes
Mô hình có dạng đa thức, gồm các biến độc lập X, X2 hay X3 thường có
quan hệ tuyến tính khá chặt đặc biệt khi X nhận giá trị trong khoảng nhỏ.
Kỳ vọng của sai số ngẫu nhiên khác không Đa cộng tuyến là gì?
Đa cộng tuyến (Multicollinearity) Nguyên nhân
Phương sai sai số thay đổi (Heteroscedasticity) Hậu quả của đa cộng tuyến
Tự tương quan (Autocorrelation) Cách phát hiện đa cộng tuyến cao
Sai số ngẫu nhiên không tuân theo quy luật chuẩn Khắc phục hiện tượng đa cộng tuyến Notes
- Nếu mô hình có đa cộng tuyến hoàn hảo thì không ước lượng được mô hình.
- Nếu mô hình có đa cộng tuyến cao thì mô hình vẫn ước lượng được và không
ảnh hưởng đến tính "tốt nhất" và tính vững của ước lượng, nhưng ước lượng
sẽ có hậu quả như sau:
σ2
Tồn tại R2j ≈ 1 nên var(β̂j ) = ≈ ∞,
(1 − Rj ) ni=1 x2ji
2
P
β̂j
dẫn đến se(β̂j ) rất lớn và t = rất nhỏ.
se(β̂j )
Khoảng tin cậy cho βj sẽ rộng, nghĩa là ước lượng trở nên kém chính xác.
Hệ số ước lượng βj dễ mất ý nghĩa thống kê.
Dấu của hệ số ước lượng của biến Xj có thể ngược với kỳ vọng.
R2 cao nhưng có hệ số không có ý nghĩa thống kê.
Giá trị của ước lượng của β̂j và se(β̂j ) rất nhạy cảm đối với việc tăng hoặc
bớt đi một quan sát hay loại bỏ biến có mức ý nghĩa thấp.
Tuy nhiên những dấu hiệu trên còn có thể do các nguyên nhân khác như mô
hình thừa biến hoặc dạng hàm sai gây ra. Do đó khi thấy các dấu hiệu trên, ta
cần xem xét liệu đa cộng tuyến cao có phải là nguyên nhân gây ra không.
10
Kỳ vọng của sai số ngẫu nhiên khác không Đa cộng tuyến là gì?
Đa cộng tuyến (Multicollinearity) Nguyên nhân
Phương sai sai số thay đổi (Heteroscedasticity) Hậu quả của đa cộng tuyến
Tự tương quan (Autocorrelation) Cách phát hiện đa cộng tuyến cao
Sai số ngẫu nhiên không tuân theo quy luật chuẩn Khắc phục hiện tượng đa cộng tuyến Notes
Cách 1: Kiểm tra kiểm định F có mâu thuẫn với kiểm định t?.
Cách 2: dùng hệ số tương quan cặp giữa các biến (pair-wise correlation).
Nếu trị tuyệt đối của hệ số tương quan giữa hai biến nào đó lớn hơn 0,8
thì có thể xem như mô hình có đa cộng tuyến cao. (Tuy nhiên không có
điều ngược lại: hệ số tương quan cặp giữa các biến là không cao không có
nghĩa là giữa các biến là không có đa cộng tuyến cao).
Cách 3: dùng hồi quy phụ (auxiliary regression). Với mỗi biến độc lập Xj
ta hồi quy theo các biến còn lại được hệ số xác định R2j . Nếu R2j > 0, 9 thì
có thể cho rằng mô hình có đa cộng tuyến cao. Hoặc thực hiện kiểm định
cho mô hình này.
Cách 4: dùng nhân tử phóng đại phương sai VIF (variance inflation
factor) (tương đương với cách 3)
1
VIF(Xj ) = .
1 − R2j
Nếu VIF(Xj ) > 10 thì có thể cho rằng mô hình có đa cộng tuyến cao.
11
Kỳ vọng của sai số ngẫu nhiên khác không Đa cộng tuyến là gì?
Đa cộng tuyến (Multicollinearity) Nguyên nhân
Phương sai sai số thay đổi (Heteroscedasticity) Hậu quả của đa cộng tuyến
Tự tương quan (Autocorrelation) Cách phát hiện đa cộng tuyến cao
Sai số ngẫu nhiên không tuân theo quy luật chuẩn Khắc phục hiện tượng đa cộng tuyến Notes
Nếu mục đích của phân tích hồi quy là dự báo thì trong một số trường
hợp ta không cần khắc phục đa cộng tuyến.
Nếu biến bị đa cộng tuyến Xj vẫn có ý nghĩa thống kê và không bị đổi
dấu, các hậu quả trên không xảy ra thì ta không bận tâm đến đa cộng
tuyến nữa.
Nếu mô hình với 3 biến độc lập X2 , X3 , X4 có X2 và X3 tương quan tuyến
tính chặt với nhau, X4 không có quan hệ tuyến tính chặt với X2 , X3 . Mặt
khác mối quan tâm chính trong phân tích hồi quy là đánh giá tác động
của X4 lên biến phụ thuộc thì việc có đa cộng tuyến cao cũng không làm
ảnh hưởng đến chất lượng phân tích của mô hình.
Nếu đa cộng tuyến gây ra hậu quả nghiêm trọng, ta có thể sử dụng các
biện pháp sau:
- Bỏ bớt biến gây ra đa cộng tuyến cao
- Gia tăng kích thước mẫu.
- Tổng hợp các biến bị đa cộng tuyến thành một biến duy nhất rồi đưa
vào mô hình.
12
Kỳ vọng của sai số ngẫu nhiên khác không Phương sai sai số thay đổi là gì?
Đa cộng tuyến (Multicollinearity) Nguyên nhân
Phương sai sai số thay đổi (Heteroscedasticity) Hậu quả của phương sai sai số thay đổi
Tự tương quan (Autocorrelation) Phát hiện phương sai sai số thay đổi
Sai số ngẫu nhiên không tuân theo quy luật chuẩn Khắc phục hiện tượng phương sai sai số thay đổi Notes
Xét mô hình hồi quy:
Y = β1 + β2 X2 + ... + βk Xk + u.
Giả thiết 4 của phương pháp OLS: phương sai sai số trong mô hình hồi quy
phải bằng nhau tại mọi quan sát. Khi giả thiết này không thỏa mãn thì mô
hình có hiện tượng phương sai sai số thay đổi, tức là:
var(u|X2i , X3i , ..., Xki ) = σ2i , i = 1, 2, ..., n;
nghĩa là tại các bộ giá trị (X2i , X3i , ..., Xki ) khác nhau thì phương sai của sai số
ngẫu nhiên ui nhận các giá trị khác nhau, kí hiệu là σ2i .
13
Kỳ vọng của sai số ngẫu nhiên khác không Phương sai sai số thay đổi là gì?
Đa cộng tuyến (Multicollinearity) Nguyên nhân
Phương sai sai số thay đổi (Heteroscedasticity) Hậu quả của phương sai sai số thay đổi
Tự tương quan (Autocorrelation) Phát hiện phương sai sai số thay đổi
Sai số ngẫu nhiên không tuân theo quy luật chuẩn Khắc phục hiện tượng phương sai sai số thay đổi Notes
Do hành vi của con người trong các hoạt động ngày càng hoàn thiện
Do cải tiến trong kỹ thuật xử lý số liệu làm cho sai số tính toán có xu
hướng giảm xuống, kéo theo phương sai giảm theo thời gian.
14
Kỳ vọng của sai số ngẫu nhiên khác không Phương sai sai số thay đổi là gì?
Đa cộng tuyến (Multicollinearity) Nguyên nhân
Phương sai sai số thay đổi (Heteroscedasticity) Hậu quả của phương sai sai số thay đổi
Tự tương quan (Autocorrelation) Phát hiện phương sai sai số thay đổi
Sai số ngẫu nhiên không tuân theo quy luật chuẩn Khắc phục hiện tượng phương sai sai số thay đổi Notes
Các ước lượng vẫn ước lượng tuyến tính không chệch tức là E(β̂j ) = βj
nhưng không tốt nhất, vì các ước lượng này không hiệu quả.
Ước lượng của các phương sai của các hệ số sẽ bị chệch do đó khoảng tin
cậy và kiểm định giả thuyết về các hệ số không còn giá trị sử dụng.
15
Kỳ vọng của sai số ngẫu nhiên khác không Phương sai sai số thay đổi là gì?
Đa cộng tuyến (Multicollinearity) Nguyên nhân
Phương sai sai số thay đổi (Heteroscedasticity) Hậu quả của phương sai sai số thay đổi
Tự tương quan (Autocorrelation) Phát hiện phương sai sai số thay đổi
Sai số ngẫu nhiên không tuân theo quy luật chuẩn Khắc phục hiện tượng phương sai sai số thay đổi Notes
Cách 1: Phương pháp định tính: dựa vào bản chất của vấn đề nghiên cứu.
Cách 2: Sử dụng đồ thị phần dư: Dùng đồ thị của ei , |ei |, e2i theo Ŷi hoặc
theo từng biến giải thích.
16
Kỳ vọng của sai số ngẫu nhiên khác không Phương sai sai số thay đổi là gì?
Đa cộng tuyến (Multicollinearity) Nguyên nhân
Phương sai sai số thay đổi (Heteroscedasticity) Hậu quả của phương sai sai số thay đổi
Tự tương quan (Autocorrelation) Phát hiện phương sai sai số thay đổi
Sai số ngẫu nhiên không tuân theo quy luật chuẩn Khắc phục hiện tượng phương sai sai số thay đổi Notes
Cách 3: Kiểm định Park: Giả thiết σ2i = σ2 Xαji → lne2i = α1 + α2 lnXji + vi .
Cách 4: Kiểm định Glejer: Các hồi quy phụ:
σ2i = σ2 X2ji → |ei | = α1 + α2 Xji + vi
√
σ2i = σ2 Xi → |ei | = α1 + α2 Xji + vi
Cách 5: Kiểm định Breusch-Pagan-Godfrey (BPG test) dựa trên ý tưởng
nếu σ2 có tương quan với ít nhất một trong các biến Xj thì mô hình có
PSSS TĐ, hồi quy phụ
e2i = α1 + α2 X2i + ... + αk Xki + vi .
Cách 6: (Giả sử mô hình gốc có hai biến độc lập X2 , X3 ) Kiểm định
White dựa trên ý tưởng nếu sigma2 có tương quan phi tuyến với các biến
độc lập thì mô hình có PSSS TĐ, hồi quy phụ:
e2i = α1 + α2 X2i + α3 X3i + α4 X22i + α5 X23i + α6 X2i X3i + vi .
Cách 7: Kiểm định Koenker-Bassett (KB-test) dựa trên ý tưởng
σ2i = σ2 (EY)2 , vì thế hồi quy phụ:
e2i = α1 + α2 Ŷi2 + vi .
17
Kỳ vọng của sai số ngẫu nhiên khác không Phương sai sai số thay đổi là gì?
Đa cộng tuyến (Multicollinearity) Nguyên nhân
Phương sai sai số thay đổi (Heteroscedasticity) Hậu quả của phương sai sai số thay đổi
Tự tương quan (Autocorrelation) Phát hiện phương sai sai số thay đổi
Sai số ngẫu nhiên không tuân theo quy luật chuẩn Khắc phục hiện tượng phương sai sai số thay đổi Notes
Nếu phương sai sai số thay đổi có thể do mô hình thiếu biến hoặc dạng
hàm sai thì trước khi khắc phụ PSSS TĐ cần xem xét vấn đề thiếu biến
hoặc dạng hàm sai như mục trước đây đã đề cập.
Khi mô hình không có vấn đề gì về thiếu biến hoặc dạng hàm sai thì ta
xem xét các giải pháp về vấn đề PSSS TĐ sau đây:
Cách 1: Vẫn sử dụng UL OLS vì ước lượng chỉ mất hiệu quả nhưng không
mất tính vững, nhưng ta sẽ làm cho kiểm định hệ số đáng tin cậy hơn
bằng cách ước lượng sai số chuẩn của các hệ số hồi quy với ma trận White.
Cách 2: Dùng Phương pháp bình phương bé nhất tổng quát
(GLS-Generalized least squares)
+ Nếu biết σ2i , khắc phục dựa vào ý tưởng sau:
Yi = β1 + β2 Xi + ui ⇔ Yσii = β1 σ1i + β2 Xσii + uσii .
+ Nếu chưa biết σ2i
Giả thiết σ2i = σ2 Xi :
Y
√ u
Yi = β1 + β2 Xi + ui ⇔ √ i
Xi
= β1 √1X + β2 Xi + √i .
Xi
i
Giả thiết σ2i = σ2 X2i :
Yi ui
Yi = β1 + β2 Xi + ui ⇔ Xi
= β1 X1i + β2 + Xi
.
Giả thiết σ2i = σ2 (EY)2 :
Yi
Yi = β1 + β2 Xi + ui ⇔ Ŷi
= β1 Ŷ1 + β2 X
Ŷ
i
+ ui
Ŷi
.
i i
18
Kỳ vọng của sai số ngẫu nhiên khác không Tự tương quan là gì?
Đa cộng tuyến (Multicollinearity) Nguyên nhân của tự tương quan
Phương sai sai số thay đổi (Heteroscedasticity) Hậu quả
Tự tương quan (Autocorrelation) Phát hiện tự tương quan
Sai số ngẫu nhiên không tuân theo quy luật chuẩn Khắc phục hiện tượng tự tương quan Notes
Tự tương quan là sự tương quan giữa các sai số ngẫu nhiên được sắp xếp theo
thứ tự thời gian (trong số liệu chuỗi thời gian) hoặc không gian (trong số liệu
chéo). Tức là
cov(ui , uj ) , 0.
Tự tương quan thường xảy ra với số liệu theo thời gian nên mô hình hồi quy
được viết dưới dạng:
Yt = β1 + β2 X2t + ... + βk Xkt + ut .
Hiện tượng tự tương quan giữa các sai số ngẫu nhiên có thể sinh ra theo các
lược đồ tự hồi quy bậc khác nhau:
Lược đồ tự hồi quy bậc 1 - AR1:
ut = ρut−1 + εt , εt thỏa mãn tất cả các giả thiết của OLS.
Trong đó |ρ| < 1 gọi là hệ số tự tương quan.
Lược đồ tự hồi quy bậc p - ARp:
ut = ρ1 ut−1 +ρ2 ut−2 +...+ρp ut−p +εt , εt thỏa mãn tất cả các giả thiết của OLS.
ρj : hệ số tương quan có độ trễ j, j=1,2,...,p.
19
Kỳ vọng của sai số ngẫu nhiên khác không Tự tương quan là gì?
Đa cộng tuyến (Multicollinearity) Nguyên nhân của tự tương quan
Phương sai sai số thay đổi (Heteroscedasticity) Hậu quả
Tự tương quan (Autocorrelation) Phát hiện tự tương quan
Sai số ngẫu nhiên không tuân theo quy luật chuẩn Khắc phục hiện tượng tự tương quan Notes
Do bản chất của các hiện tượng kinh tế: các hiện tượng kinh tế có tính
chất quán tính (tính ì), hoặc tính chất mạng nhện (cobweb), hoặc do tính
trễ.
Do xử lý số liệu
20
Kỳ vọng của sai số ngẫu nhiên khác không Tự tương quan là gì?
Đa cộng tuyến (Multicollinearity) Nguyên nhân của tự tương quan
Phương sai sai số thay đổi (Heteroscedasticity) Hậu quả
Tự tương quan (Autocorrelation) Phát hiện tự tương quan
Sai số ngẫu nhiên không tuân theo quy luật chuẩn Khắc phục hiện tượng tự tương quan Notes
Các ước lượng OLS vẫn là ước lượng tuyến tính không chệch nhưng
không tốt nhất tức là ước lượng là không hiệu quả.
Ước lượng của phương sai sai số ngẫu nhiên σ̂2 bị chệch so với giá trị thực
σ2 .
Phương sai của các hệ số ước lượng OLS thấp hơn giá trị thực đó phóng
đại tỉ số t là cho kiểm định t và F không đáng tin cậy, khoảng tin cậy kém
chính xác.
Hệ số xác định R2 của mẫu là ước lượng chệch cho R2 của tổng thể.
Các dự báo không còn chính xác.
21
Kỳ vọng của sai số ngẫu nhiên khác không Tự tương quan là gì?
Đa cộng tuyến (Multicollinearity) Nguyên nhân của tự tương quan
Phương sai sai số thay đổi (Heteroscedasticity) Hậu quả
Tự tương quan (Autocorrelation) Phát hiện tự tương quan
Sai số ngẫu nhiên không tuân theo quy luật chuẩn Khắc phục hiện tượng tự tương quan Notes
Quan sát đồ thị phần dư, ví dụ: đồ thị e theo trễ bậc 1 của chính nó, hoặc
đồ thị e theo thời gian,...
Kiểm định Durbin-Watson
Bước 1. Hồi quy Y theo X2 , ..., Xk thu được et .
Bước 2. Tính Pn
(e −e )2
d = t=2Pn t et−12
t=1 t
Bước 3. Tra bảng DW với mức ý nghĩa α số quan sát n và số biến độc lập
k′ = k − 1 ta được dL và dU
Xây dựng thang kiểm định Durbin-Watson
Điều kiện sử dụng kiểm định Durbin-Watson:
Hàm hồi quy phải có hệ số chặn;
Các biến độc lập không là trễ của biến phụ thuộc;
Mẫu không được mất quan sát.
Kiểm định Breusch-Godfrey (kiểm định tự tương quan bậc p)
Bước 1. Hồi quy mô hình
Yt = β1 + β2 X2t + ... + βk Xkt + ut , thu được et .
Bước 2. Hồi quy mô hình
et = α1 + α2 X2t + ... + αk Xkt + λ1 et−1 + λ2 et−2 + ... + λp et−p + εt ,
Bước 3. Kiểm định
H0 : không có tự tương quan theo bất cứ bậc nào nhỏ hơn hoặc bằng p,
H1 : mô hình có tự tương quan bậc 22
nào đó nhỏ hơn hoặc bằng p.
Kỳ vọng của sai số ngẫu nhiên khác không Tự tương quan là gì?
Đa cộng tuyến (Multicollinearity) Nguyên nhân của tự tương quan
Phương sai sai số thay đổi (Heteroscedasticity) Hậu quả
Tự tương quan (Autocorrelation) Phát hiện tự tương quan
Sai số ngẫu nhiên không tuân theo quy luật chuẩn Khắc phục hiện tượng tự tương quan Notes
Trường hợp 1: Nếu biết cấu trúc của tự tương quan
Xét PRF:
Yt = β1 + β2 X2t + ut ,
trong đó ut thỏa mãn các giả thiết, ngoại trừ ut bị tự tương quan theo
lược đồ AR(1):
ut = ρut−1 + vt với ρ ∈ (−1; 1).
Ta có Yt = β1 + β2 Xt + ut ;
ρYt−1 = ρβ1 + β2 ρXt−1 + ρut−1 ;
suy ra (Yt − ρYt−1 ) = β1 (1 − ρ) + β2 (Xt − ρXt−1 ) + (ut − ρut−1 ).
Đặt:
Yt∗ = Yt − ρYt−1 , X∗t = Xt − ρXt−1 , vt = ut − ρut−1 ,
β∗1 = β1 (1 − ρ), β∗2 = β2 .
Sau đó ước lượng
Mô hình sai phân tổng quát/Tựa sai phân (Generalized/Quasi Difference):
Yt∗ = β∗1 + β∗2 Xt + vt
. 23
Kỳ vọng của sai số ngẫu nhiên khác không Tự tương quan là gì?
Đa cộng tuyến (Multicollinearity) Nguyên nhân của tự tương quan
Phương sai sai số thay đổi (Heteroscedasticity) Hậu quả
Tự tương quan (Autocorrelation) Phát hiện tự tương quan
Sai số ngẫu nhiên không tuân theo quy luật chuẩn Khắc phục hiện tượng tự tương quan Notes
Trường hợp 2: Nếu chưa biết cấu trúc của tự tương quan
Cách 1. Vẫn dùng OLS nhưng hiệu chỉnh sai số chuẩn của β̂j để kiểm định
đáng tin cậy hơn bằng cách dùng ma trận hiệp phương sai sai số của
Newey -West.
Cách 2. Ước lượng ρ dựa trên thống kê d (Durbin-Watson) (với mẫu lớn)
P n
et et−1
d ≈ 2(1 − ρ̂) ⇒ ρ̂ ≈ 1 − d
2
= t=2
Pn 2
t=1 et
Cách 3. Ước lượng ρ theo Theil-Nagar (với mẫu nhỏ)
n2 (1−d/2(+k2 ))
ρ= n2 −k2
.
Cách 4. Ước lượng ρ theo Durbin-Watson hai bước:
Bước 1: Ước lượng: Yt = β1 (1 − ρ) + β2 X2t + ρYt + vt . Sau đó lấy ρ̂ là hệ số
của Yt−1 là ước lượng cho ρ.
Chú ý trên EViews gõ: Y = c(1) + c(2) ∗ X − c(2) ∗ c(3) ∗ X(−1) + c(3) ∗ Y(−1).
Bước 2: Với ρ̂ ước lượng Mô hình sai phân tổng quát bằng PP OLS.
Cách 5. Ước lượng ρ theo thủ tục lặp Cochrane-Orcutt
(1) (1) (1)
Bước 1: Ước lượng Yt = β1 + β2 X2t + ut → β̂1 , β̂2 , et ;
(1) (1)
Bước 2: Ước lượng = et ρ̂et−1
+ vt → ρ̂(1) ;
Bước 3: Dùng ρ̂(1) ở bước 2 để ước lượng Mô hình sai phân tổng
(2) (1) (2) (1)
quát;→ β̂1 = β̂1 /(1 − ρ(1) ); β̂1 = β̂1 , et (2) và quay lại Bước 2.
Quá trình trình lặp cho đến khi ρ̂ ở hai bước kế tiếp nhau chênh lệch không
đáng kể β̂1 và β̂2 ở bước cuối cùng là ước lượng cho β1 và β2 .
24
Kỳ vọng của sai số ngẫu nhiên khác không
Đa cộng tuyến (Multicollinearity) Hậu quả
Phương sai sai số thay đổi (Heteroscedasticity) Cách phát hiện
Tự tương quan (Autocorrelation) Khắc phục
Sai số ngẫu nhiên không tuân theo quy luật chuẩn Notes
Xét mô hình
Y = β1 + β2 X2 + ... + βk Xk + u.
Nếu giả thiết u có phân phối chuẩn bị vi phạm thì:
Các ước lượng vẫn là ước lượng tuyến tính không chệch tốt nhất và vững.
Các thống kê t sẽ không tuân theo quy luật Student, thống kê F sẽ không
tuân theo quy luật Fisher.
Nếu kích thước mẫu nhỏ thì các suy diễn thống kê không đáng tin cậy.
Nếu kích thước mẫu lớn thì các suy diễn thống kê vẫn có giá trị.
25
Quan sát đồ thị phần dư: Xem xét đồ thị tần suất (historgram plot của
phần dư).
26
Kỳ vọng của sai số ngẫu nhiên khác không
Đa cộng tuyến (Multicollinearity) Hậu quả
Phương sai sai số thay đổi (Heteroscedasticity) Cách phát hiện
Tự tương quan (Autocorrelation) Khắc phục
Sai số ngẫu nhiên không tuân theo quy luật chuẩn Notes
Một số cách khắc phục nếu mô hình có sai số không tuân theo quy luật chuẩn:
Gia tăng kích thước mẫu.
Lấy logarit biến phụ thuộc.
27