Download as pdf or txt
Download as pdf or txt
You are on page 1of 47

CHƯƠNG 1, 2

HỒI QUY TUYẾN TÍNH

Kinh tế lượng là gì?

Kinh tế lượng là sự kết hợp giữa số liệu thưc tế, lý


thuyết kinh tế và thống kê toán nhằm

Ước lượng các mối i. Đối chiếu lý thuyết kinh tế Dự báo các hành vi
quan hệ kinh tế với thực tế của các biến số kinh tế
ii. Kiểm định các giả thiết liên
quan đến hành vi kinh tế

Nguồn: Ramu Ramanathan, Nhập môn kinh tế lượng với các ứng dụng (ấn bản thứ năm), Nhà xuất bản Harcourt College, 2002.
(Bản dịch của chương trình Giảng dạy Kinh tế Fulbright, Việt Nam)

1
Phương pháp luận của kinh tế lượng
Lý thuyết kinh tế, kinh nghiệm,
các nghiên cứu khác

Thiết lập mô hình KTL


Thu thập, xử lý số liệu
Ước lượng các tham số

Kiểm định giả thiết

Không Mô hình ước


lượng có tốt
không?

Sử dụng mô hình: phân tích, dự báo,


đề ra chính sách

Hình 1.1: Phương pháp luận nghiên cứu của kinh tế lượng
Nguồn: Ramu Ramanathan, Nhập môn kinh tế lượng với các ứng dụng (ấn bản thứ năm), Nhà xuất bản Harcourt College, 2002

Phương pháp luận của kinh tế lượng


Số liệu cho kinh tế lượng: 3 loại chính

1. Dữ liệu chuỗi thời gian (Time series data): là số


liệu của một biến số kinh tế tại nhiều thời điểm

Vd: số liệu về chỉ số giá tiêu dùng (CPI) qua các năm

Năm 2018 2019 2020 2021 2022

CPI
101,54 103,72 103,97 109,28 108,77

by Tuan Anh (UEH)

2
Phương pháp luận của kinh tế lượng
Số liệu cho kinh tế lượng: 3 loại chính
2. Dữ liệu chéo (Cross data) : Số liệu của nhiều
biến số kinh tế tại cùng một thời điểm
Vd: số liệu về các chỉ số giá năm 2022

Năm 2022

Chỉ số giá tiêu dùng 108,77

Chỉ số giá vàng 105,83

Chỉ số giá USD 110,19


by Tuan Anh (UEH)

Phương pháp luận của kinh tế lượng


Số liệu cho kinh tế lượng: 3 loại chính
3. Dữ liệu hỗn hợp/ bảng (Panel data): là sự kết hợp
của dữ liệu chéo và dữ liệu chuỗi thời gian
Vd: số liệu về các chỉ số giá qua các năm

Năm 2018 2019 2020 2021 2022

Chỉ số giá tiêu dùng 101,54 103,72 103,97 109,28 108,77

Chỉ số giá vàng 105,83 118,70 126,88 112,14 110,49

Chí số giá USD 103,19 101,95 102,32 100,21 100,83


by Tuan Anh (UEH)

3
Phân tích hồi quy
Ước lượng giá trị trung bình của
biến phụ thuộc với giá trị đã biết của
biến độc lập

Phân tích Kiểm định giả thiết về bản chất quan


hồi quy hệ phụ thuộc

Dự đoán giá trị trung bình của biến


phụ thuộc

Mô hình hồi quy đơn biến


• PRF dạng xác định
E(Y/Xi) = f(Xi)= β1 + β2Xi
• PRF dạng ngẫu nhiên
Yi = E(Y/Xi) + Ui = β1 + β2Xi + Ui
• SRF dạng xác định
Yˆi  ˆ 1  ˆ 2 X i
• SRF dạng ngẫu nhiên
Y i  Yˆi  e i  ˆ 1  ˆ 2 X i  e i

4
Mô hình hồi qui tuyến tính đa biến
Ý nghĩa hệ số hồi quy riêng: cho biết ảnh hưởng của từng biến
độc lập lên giá trị trung bình của biến phụ thuộc khi các biến còn
lại được giữ không đổi.
 Mô hình hồi quy tổng thể ngẫu nhiên:

PRF : Yi   1   2 X 2 i   3 X 3 i  U i
Ui: sai số ngẫu nhiên của tổng thể
 Mô hình hồi quy mẫu:
SRF : Yi  ˆ1  ˆ2 X 2i  ˆ3 X 3i  ei
Hay: Yˆ  ˆ  ˆ X  ˆ X
i 1 2 2i 3 3i

Mô hình hồi quy k biến


Mô hình hồi quy tổng thể
E (Y / X 2 ,... X k )   1   2 X 2 i  ...   k X ki
Mô hình hồi quy mẫu ngẫu nhiên:
Yˆi  ˆ1  ˆ2 X 2 i  ...  ˆk X ki  ei
sai số của mẫu ứng với quan sát thứ i

ei  Yi Yˆi  Yi  ˆ1  ˆ2 X2i  ˆ3 X3i ... ˆk X ki

5
Các giả thiết của phương pháp OLS
1. Y và các Xi quan hệ tuyến tính
2. Giá trị trung bình của Ui bằng 0
E(Ui /X2i, X3i) = 0
3. Phương sai của các Ui là không đổi
Var(Ui) = σ2
4. Không có hiện tượng tự tương quan giữa các Ui
Cov(Ui, Uj) = 0; i≠j
5. Không có hiện tượng tự tương quan giữa các Ui và Xi
Cov(Ui, Xj) = 0;
6. Ui có phân phối chuẩn: Ui ̴ N(0, σ2)
7. Không có hiện tượng cộng tuyến giữa Xi và Xj

Mô hình hồi qui tuyến tính đơn


Hàm hồi quy tuyến tính được hiểu là hồi quy tuyến tính
đối với tham số

Vd: các hàm hồi quy Vd: các hàm không phải
tuyến tính hồi quy tuyến tính
 1  1
Yi  1   2    U i ln Yi      2 ln X i  U i
 Xi   1 
ln Yi  1   2 ln X i  U i Yi  1   22 X i  U i

6
Độ phù hợp của mô hình – Tóm tắt
3. Hệ số xác định R2:

 Hệ số xác định hiệu chỉnh

n 1
R 2  1  (1  R 2 )
nk

Độ phù hợp của mô hình OLS

 Tính chất hệ số xác định R2:


• 0≤ R2≤1
• Cho biết % sự biến động của Y được giải thích bởi các biến số X
trong mô hình.
• R2 = 1: mô hình phù hợp hoàn toàn với mẫu nghiên cứu
• R2 = 0: X và Y không có mối quan hệ
• Nhược điểm: R2 tăng khi số biến X đưa vào mô hình tăng, dù biến
đưa vào không có ý nghĩa.
→ Sử dụng R2 điều chỉnh (adjusted R2 -R2) để quyết định đưa thêm
biến vào mô hình.

7
Độ phù hợp của mô hình OLS

 Tính chất hệ số tương quan r:


• -1≤ r ≤1
• Có tính chất đối xứng: rXY = rYX
• Nếu X, Y độc lập theo quan điểm thống kê thì hệ số tương quan
giữa chúng bằng 0.
• r đo sự kết hợp tuyến tính hay phụ thuộc tuyến tính, không có ý
nghĩa để mô tả quan hệ phi tuyến.
• Có thể chứng minh được: r   R2
• r cùng dấu với ˆ
2

Kiểm định giả thuyết ước lượng OLS

8
Kiểm định giả thuyết ước lượng OLS

Kiểm định mô hình hồi quy

Giả thiết H0
Trong thống kê, giả thiết phát biểu cần được kiểm định
được gọi là giả thuyết không ( ký hiệu : H0). Giả thuyết
đối (ký hiệu: H1)

Bác bỏ H0 Chấp nhận H0


H0 sai Đúng Sai lầm loại II

H0 đúng Sai lầm loại I Đúng

Thường đặt giả thuyết H0 sao cho sai lầm loại I là


nghiêm trọng (nguy hiểm) hơn sai lầm loại II

9
Kiểm định mô hình hồi quy

Các giả thuyết cần kiểm định gồm


 Các giả thuyết về hệ số hồi quy (i)
 Các giả thuyết về sự phù hợp của mô hình (R2)
 Các giả thuyết về phương sai của Ui (2 = Var (Ui ))

Các loại giả thuyết


§ Giả thuyết 2 phía , giả thuyết phía trái và giả thuyết phía phải

Các cách kiểm định cơ bản :


o Phương pháp khoảng tin cậy
o Phương pháp giá trị tới hạn
o Phương pháp p-value (dùng phần mềm)

Độ phù hợp của mô hình


 Kiểm định giả thiết

1. Kiểm định giả thiết về hệ số hồi quy


Kiểm định giả thiết H0:  i   i*

B1.Tính ˆi  i*


ti 
SE(ˆi )
B2. Nguyên tắc quyết định
Nếu |ti | > t(n-k,/2) : bác bỏ H0
Nếu |ti | ≤ t(n-k,/2) : chấp nhận H0

10
Độ phù hợp của mô hình
 Kiểm định giả thiết

2. Kiểm định sự phù hợp của mô hình: kiểm định giả thiết
đồng thời bằng không:
H0: 2 = 3 =…= k = 0;
(H1: ít nhất 1 trong k tham số khác 0)
R 2 (n  k )
B1. Tính F 
(1  R 2 )( k  1)
B2. Nguyên tắc quyết định:
Nếu F > F(k-1, n-k): Bác bỏ H0: Mô hình phù hợp
Nếu F ≤ F(k-1, n-k): Chấp nhận H0: Mô hình không phù hợp

Độ phù hợp của mô hình – Tóm tắt


1. Khoảng tin cậy của hệ số hồi quy j:

11
Kiểm định giả thuyết ước lượng OLS
1. Kiểm định giả thuyết về hệ số hồi quy

Loại GT H0 H1 Miền bác bỏ


Hai phía βi = βi* βi ≠ βi* |t|> t(/2 , (n-k))
Phía phải βi ≤ βi* βi > βi* t > t(, (n-k))
Phía trái βi ≥ βi* βi < βi* t < -t(, (n-k))

ˆ i   i*
ti 
SE ( ˆ i )

Độ phù hợp của mô hình – Tóm tắt


4. Kiểm định sự phù hợp của mô hình hồi quy:

12
Độ phù hợp của mô hình – Tóm tắt
5. Khoảng tin cậy của phương sai s:

Độ phù hợp của mô hình – Tóm tắt


6. Kiểm định tin cậy của phương sai s:

13
Dự báo
* Ước lượng điểm
Yˆ0  ˆ1  ˆ 2 X 20  ...  ˆ k X k0
* Dự báo giá trị trung bình của Y
∈( −e ; +e )

Với:  0  SE (Yˆ0 ) t ( n  k , / 2 )
( )= 2 − 

Kết quả của ví dụ trên chạy bằng Eviews như sau :

14
Dự báo
* Dự báo giá trị cá biệt của Y

Y 0  ( Yˆ0   0' ; Yˆ 0   0' )


Với:
= ( ) ( , / )

CHƯƠNG 3

DẠNG HÀM

15
Hệ số biên tế (Cận biên)

• Giả sử có hàm Y = f(X)


• Giá trị biên tế MXY = ∆Y/∆X
∆Y = MXY * ∆X
Ý nghĩa của biên tế: Cho biết lượng thay đổi theo giá
trị tuyệt đối của biến phụ thuộc Y khi biến độc lập X
thay đổi 1 đơn vị
Khi ∆X → 0, MXY ≈ f’(X)

Hệ số co giãn
Y
• Hệ số co giãn của Y theo X là E YX  Y
X
X
• Lượng thay đổi tương đối của Y Y X
100  E YX (100 )
Y X
• Ý nghĩa của hệ số co giãn: cho biết sự thay đổi tương đối (%) của Y khi X
thay đổi 1%

• Hệ số co giãn không phụ thuộc đơn vị đo

16
Tóm tắt một số hàm hồi quy 2 biến thông dụng
Biên tế Ý nghĩa của hệ số
Hàm Phương trình Hệ số co giãn
(hệ số góc) góc

Tuyến tính Y  1   2 X β2 β2(X/Y)


X tăng 1 đv, Y thay
đổi β2 đv

Tuyến tính ln Y  1   2 ln X β2(Y/X) β2


X tăng 1 %, Y thay
log kép đổi β2%

X tăng 1 đv, Y thay


Log – Lin ln Y  1   2 X β2Y β2X
đổi 100β2 %

X tăng 1%, Y thay


Lin - Log Y = β1 + β2 ln X β2(1/X) β2(1/Y)
đổi (β2/100) đơn vị

Ng-đảo Y = β1 + β2 (1/X) - β2(1/X2) - β2(1/XY)


33

CHƯƠNG 4

HỒI QUY VỚI BIẾN GIẢ

17
Sử dụng biến giả trong mô hình hồi quy

Một chỉ tiêu chất lượng có n thuộc tính khác nhau thì dùng
n-1 biến giả

Sử dụng biến giả trong mô hình hồi quy


Vd 4.4: Khảo sát lương của giáo viên theo số năm giảng dạy

Mô hình: Yi = 1 + 3Xi
Trong đó
• Y : lương giáo viên
• X : số năm giảng dạy
và xem xét yếu tố giới tính có tác động đến thu nhập không
• G : giới tính với G = 1: nam; G = 0: nữ

18
 Vd 4.4:
TH3: Lương khởi điểm và tốc độ tăng lương khác nhau
(Tác động đến cả hệ số chặn và hệ số góc)

Hàm PRF: Y= (1 + 2G) + (3 + 4G)X+ U

 Y= 1 + 2G + 3X + 4(GX)+ U

Hàm SRF ứng với nữ (G = 0) : Yˆ  ˆ 1  ˆ 3 X


Hàm SRF ứng với nam (G = 1) :
Yˆ  ˆ1  ˆ2  ˆ3 X  ˆ4 X  (ˆ1  ˆ2 )  (ˆ3  ˆ4 ) X

CHƯƠNG 5

ĐA CỘNG TUYẾN

19
Các giả thiết của mô hình
1. Y và các Xi quan hệ tuyến tính
2. Giá trị trung bình của Ui bằng 0
E(Ui /X2i, X3i) = 0
3. Phương sai của các Ui là không đổi
Var(Ui) = σ2
4. Không có hiện tượng tự tương quan giữa các Ui
Cov(Ui, Uj) = 0; i≠j
5. Không có hiện tượng tự tương quan giữa các Ui và Xi
Cov(Ui, Xj) = 0;
6. Ui có phân phối chuẩn: Ui ̴ N(0, σ2)
7. Không có hiện tượng cộng tuyến giữa Xi và Xj

Đa cộng tuyến trong kinh tế lượng

 Khái niệm:

Trong mô hình hồi quy bội


Yˆi  ˆ1  ˆ 2 X 2 i  ˆ3 X 3i  ...  ˆk X ki
Có sự phụ thuộc tuyến tính cao giữa các biến giải thích

20
Đa cộng tuyến trong kinh tế lượng
 Phân loại:

1. Đa cộng tuyến hoàn hảo


Tồn tại 2, 3,… k không đồng thời bằng 0 sao cho
2X2 + 3X3 + …+ kXk = 0

2. Đa cộng tuyến không hoàn hảo


2X2 + 3X3 + …+ kXk + vi= 0
với vi là sai số ngẫu nhiên.

Đa cộng tuyến trong kinh tế lượng


 Nguyên nhân:

i. Chọn các biến độc lập có quan hệ nhân quả hay có tương
quan cao vì cùng phụ thuộc vào một điều kiện khác.
ii. Số quan sát nhỏ hơn số biến độc lập.
iii. Cách thu thập mẫu: mẫu không đặc trưng cho tổng thể
iv. Chọn biến Xi có độ biến thiên nhỏ.

21
Hậu quả của đa cộng tuyến
Nếu có cộng tuyến gần hoàn hảo
1. Phương sai và hiệp phương sai của các ước lượng OLS lớn.
2. Khoảng tin cậy rộng hơn.
3. Tỉ số t "không có ý nghĩa"
4. R2 cao nhưng tỉ số t ít có ý nghĩa
5. Các ước lượng OLS và sai số chuẩn của chúng trở nên rất nhạy
với những thay đổi nhỏ trong dữ liệu.
6. Dấu của các ước lượng của các hệ số hồi qui có thể sai
7. Thêm vào hay bớt đi các biến cộng tuyến với các biến khác, mô
hình sẽ thay đổi về dấu hoặc thay đổi về độ lớn của các ước
lượng.

Cách phát hiện đa cộng tuyến

1. Hệ số R2 lớn nhưng tỷ số t nhỏ


2. Tương quan cặp giữa các biến giải thích cao
3. Sử dụng mô hình hồi qui phụ
4. Sử dụng yếu tố phóng đại phương sai (VIF)

22
Cách phát hiện đa cộng tuyến
1. R2 lớn nhưng tỷ số t nhỏ
2. Tương quan cặp giữa các biến giải thích cao

rXZ 
 (X i  X )( Z i  Z )
 (X i  X )2 (Z i  Z )2
Trong đó X, Z là 2 biến giải thích trong mô hình
(rxz > 0,8)

Cách phát hiện đa cộng tuyến


3. Sử dụng mô hình hồi quy phụ
Hồi qui một biến giải thích X theo các biến còn lại

Xˆ 2i  ˆ1  ˆ3 X 3i  ...  ˆk X mi


Tính R2 và F cho mỗi mô hình
R 2 (n  m )
F 
( 1  R 2 )( m  1 )
Lập giả thiết H0: R2 = 0 ~ H0: không có đa cộng tuyến
Nếu F > F(m-1,n-m): bác bỏ H0 hay có đa cộng tuyến
Nếu F < F(m-1,n-m): chấp nhận H0 hay không có đa cộng tuyến

23
Cách phát hiện đa cộng tuyến
4. Sử dụng nhân tử phóng đại phương sai (VIF)
Đối với hàm hồi quy 2 biến giải thích 1
VIF 
(1  r232 )
Đối với trường hợp tổng quát, có (k-1) biến giải thích
1
VIF 
(1  R 2j )
 R2j: là giá trị R2 trong hàm hồi quy của Xj theo (k-2) biến giải thích
còn lại.
 Thông thường khi VIF > 10, (> 2,5 theo Allison) thì biến này
được coi là có cộng tuyến cao

Cách khắc phục đa cộng tuyến

1. Loại trừ một biến giải thích ra khỏi mô hình


• Bước 1: Xem cặp biến giải thích nào có quan hệ chặt
chẽ. Giả sử X2, X3…Xk là các biến độc lập, Y là biến
phụ thuộc và X2, X3 có tương quan chặt chẽ với nhau.
• Bước 2: Tính R2 đối với các hàm hồi quy: có mặt cả 2
biến; không có mặt một trong 2 biến
• Bước 3: Loại biến mà giá trị R2 tính được khi không có
mặt biến đó là lớn hơn.

24
CHƯƠNG 6

PHƯƠNG SAI THAY ĐỔI

Các giả thiết của mô hình


1. Y và các Xi quan hệ tuyến tính
2. Giá trị trung bình của Ui bằng 0
E(Ui /X2i, X3i) = 0
3. Phương sai của các Ui là không đổi
Var(Ui) = σ2
4. Không có hiện tượng tự tương quan giữa các Ui
Cov(Ui, Uj) = 0; i≠j
5. Không có hiện tượng tự tương quan giữa các Ui và Xi
Cov(Ui, Xj) = 0;
6. Ui có phân phối chuẩn: Ui ̴ N(0, σ2)
7. Không có hiện tượng cộng tuyến giữa Xi và Xj

25
Phương sai thay đổi trong kinh tế lượng

• Mô hình ban đầu: Yi = 1 + 2Xi + Ui


• Giả thiết 3: Phương sai các yếu tố ngẫu nhiên là không đổi:
Var(Ui) = σ2
• Nếu giả thiết 3 được thỏa mãn => Phương sai sai số không đổi
(homoscocedasticity).
• Nếu giả thiết 3 không được thỏa mãn => Phương sai sai số thay
đổi (heterscocedasticity).

Nguyên nhân của phương sai thay đổi


1. Mô hình học tập kinh nghiệm (sai số giảm)
2. Do bản chất của các quan hệ kinh tế
3. Kỹ thuật thu thập và xử lý số liệu
4. Trong mẫu có các outlier (giá trị rất nhỏ hoặc rất lớn so với
các giá trị quan sát khác)
5. Mô hình hồi quy không đúng (dạng hàm sai, thiếu biến
quan trọng)
6. Hiện tượng phương sai thay đổi thường gặp khi thu thập
số liệu chéo (theo không gian)

26
Hậu quả của phương sai thay đổi
1. Ước lượng OLS vẫn tuyến tính, không chệch nhưng
không hiệu quả (vì phương sai không nhỏ nhất)
2. Ước lượng phương sai sẽ bị chệch.
3. Các kiểm định dựa trên phân phối t và F sẽ không còn
đáng tin cậy.
4. Kết quả dự báo không còn hiệu quả nữa (khoảng tin
cậy rộng) khi sử dụng các ước lượng OLS có phương
sai không nhỏ nhất.

Phương pháp phát hiện phương sai thay đổi


 Phương pháp định tính
1. Dựa vào bản chất vấn đề nghiên cứu
2. Xem xét đồ thị của phần dư
 Phương pháp định lượng
1. Kiểm định Park
2. Kiểm định Glejser
3. Kiểm định Breusch – Pagan – Godfrey
4. Kiểm định White
5. Goldfeld - Quandt

27
 Phương pháp định lượng
1. Kiểm định Park (trường hợp riêng của kiểm định Harvey)

• Park cho rằng i2 là một hàm số nào đó của biến giải thích X
• i2 = 1 + 2ln|Xi |+ vi trong đó vi là phần sai số ngẫu nhiên.
• Vì i2 chưa biết, Park đề nghị sử dụng lnei2 thay cho i2 và
ước lượng mô hình hồi qui sau
lnei2 = 1 + 2 ln|Xi|+ vi (*)
ei2 được thu thập từ mô hình hồi qui gốc

 Phương pháp định lượng


1. Kiểm định Park

 Các bước của kiểm định Park:


1. Ước lượng hàm hồi qui gốc Yi = 1 + 2Xi + Ui
2. Từ hàm hồi qui, tính Yˆi , phần dư ei và lnei2
3. Ước lượng hàm hồi qui (*) lnei2 = 1 + 2 ln|Xi|+ vi, sử dụng biến giải
thích của hàm hồi qui ban đầu. Nếu có nhiều biến giải thích, ước
lượng hồi qui cho từng biến giải thích đó. Hay, ước lượng mô hình
hồi quy với biến giải thích là Yˆi
4. Kiểm định giả thuyết H0: β2 = 0, nghĩa là phương sai của sai số
không đổi. Nếu giả thuyết H0 bị bác bỏ, mô hình gốc có phương sai
của sai số thay đổi.
5. Nếu giả thuyết H0 được chấp nhận, 1 trong mô hình (*) có thể được
xem là giá trị chung của phương sai của sai số không đổi, s2.

28
 Phương pháp định lượng
2. Kiểm định Glejser

• Tương tự như kiểm định Park: Sau khi thu thập được phần dư từ
mô hình hồi qui gốc, Glejser đề nghị chạy hồi qui |ei| theo biến X
nào mà có quan hệ chặt chẽ với i2.
• Glejser đề xuất một số dạng hàm hồi qui sau:
1
ei = B1 + B 2 + vi
X i

ei = B1 + B 2 X i + vi ei = B1 + B 2 X + vi
i
1
ei = B1 + B 2 + vi 2
Xi ei = B1 + B 2 X i + vi
• Nếu giả thuyết H0: B2 = 0 bị bác bỏ thì có thể có hiện tượng
phương sai sai số thay đổi.

 Phương pháp định lượng


2. Kiểm định Glejser

• Tương tự như kiểm định Park: Sau khi thu thập được phần dư từ
mô hình hồi qui gốc, Glejser đề nghị chạy hồi qui |ei| theo biến X
nào mà có quan hệ chặt chẽ với i2.
• Glejser đề xuất một số dạng hàm hồi qui sau:
1
ei  1  2 Xi  vi ei  1  2  vi
Xi
ei  1  2 Xi  vi 1
ei  1   2  vi
Xi
• Nếu giả thuyết H0: B2 = 0 bị bác bỏ thì có thể có hiện tượng
phương sai sai số thay đổi.

29
 Phương pháp định lượng
2. Kiểm định Glejser

 Các bước của kiểm định Glejser:


1. Ước lượng hàm hồi qui gốc Yi = 1 + 2Xi + Ui , thu thập phần dư ei
2. Ước lượng hàm hồi qui

3. Kiểm định giả thuyết H0: β2 = 0, nghĩa là phương sai của sai số
không đổi.
• Nếu giả thuyết H0 bị bác bỏ, mô hình gốc có phương sai của sai số
thay đổi.
• Nếu giả thuyết H0 được chấp nhận, 1 trong mô hình (*) có thể được
xem là giá trị chung của phương sai của sai số không đổi, s2.

 Phương pháp định lượng


3. Kiểm định Breusch – Pagan – Godfrey
• Xét mô hình hồi qui sau:
Yi = 1 + 2X2i + + 3X3i + … + kXki + Ui
Giả sử ei2 có quan hệ dương với biến Xi theo cách sau:
ei2 = 1 + 2X2i + 3X3i +…+ mXmi trong đó m ≤ k.

30
 Phương pháp định lượng
3. Kiểm định Breusch – Pagan – Godfrey
 Các bước thực hiện kiểm định Breusch – Pagan – Godfrey:
1. Ước lượng hàm hồi qui gốc, thu thập phần dư ei:
Yi = 1 + 2X2i + 3X3i + … + kXki + Ui
2. Ước lượng hàm hồi quy:
ei2 = 1 + 2X2i + 3X3i +…+ mXmi (*)
3. Kiểm định giả thuyết:
H0: α2 = α3 =…= αm= 0
• Nếu H0 bị bác bỏ, mô hình gốc có phương sai của sai số thay đổi.
• Nếu H0 được chấp nhận  i2  α1 (phương sai không đổi).

 Phương pháp định lượng


4. Kiểm định White

• Xét mô hình hồi qui sau:


Yi = 1 + 2X2i + 3X3i + Ui
Bước 1 : Ước lượng mô hình hồi quy tuyến tính và từ đó thu
được các phần dư ei
Bước 2 : Ước lượng mô hình hồi quy phụ sau
ei2 = 1 + 2X2i + 3X3i + 4X2i2 + 5X3i2 + v2i (2.1)
hay
ei2 = 1 + 2X2i + 3X3i + 4X2i2 + 5X3i2 + 6X2iX3i + V2i (2.2)

= + + + + + + (2)

31
 Phương pháp định lượng
4. Kiểm định White

Bước 3: Đặt giả thuyết H0: 2 = 3 = 4 = 5 = 6 = 0


Tương đương H0: phương sai của sai số không đổi.
Bước 4: Tính toán trị thống kê nR2 , trong đó n là cỡ mẫu và R2
là hệ số xác định của mô hình hồi quy phụ (2)
Bước 5: Tra bảng phân phối 2, mức ý nghĩa  và bậc tự do là k
(k là số tham số trong mô hình hồi quy phụ (2)).
Bước 6: Quy tắc quyết định
• nR2 < 2(k): chấp nhận H0
• nR2 > 2(k): bác bỏ H0, hay có hiện tượng phương sai sai số
thay đổi.

 Phương pháp định lượng


5. Kiểm định Goldfeld - Quandt
• Xét mô hình hồi qui sau:
Yi = 1 + 2Xi + ui
Giả sử i2 có quan hệ dương với biến X theo cách sau:
ei2 = 2Xi2 trong đó 2 là hằng số.
 Các bước thực hiện kiểm định Goldfeld - Quandt như sau:
1. Sắp xếp các quan sát theo thứ tự tăng dần về giá trị của biến X.
2. Bỏ qua quan sát ở giữa theo cách sau:
Đối với mô hình 2 biến:
c = 4 nếu cỡ mẫu khoảng n = 30;
c = 10 nếu cỡ mẫu khoảng n = 60.
và chia số quan sát còn lại thành 2 nhóm, trong đó mỗi nhóm có
(n – c)/2 quan sát.

32
 Phương pháp định lượng
5. Kiểm định Goldfeld - Quandt

3. Sử dụng phương pháp OLS để ước lượng tham số


của các hàm hồi qui đối với (n – c)/2 quan sát đầu
và cuối; tính RSS1 và RSS2 tương ứng.
Bậc tự do tương ứng là n  c  k (k là các tham số
2
được ước lượng kể cả hệ số chặn).

 Phương pháp định lượng


5. Kiểm định Goldfeld - Quandt

4. Tính tỷ số
RSS 2 / df
λ=
RSS1 / df

 tuân theo phân phối F với bậc tự do ở tử số và mẫu số là


n  c  2k
2
• Nếu  > F ở mức ý nghĩa α thì bác bỏ giả thuyết
H0, nghĩa là phương sai của sai số thay đổi.

33
CHƯƠNG 7

TỰ TƯƠNG QUAN

Các giả thiết của mô hình


1. Y và các Xi quan hệ tuyến tính
2. Giá trị trung bình của Ui bằng 0
E(Ui /X2i, X3i) = 0
3. Phương sai của các Ui là không đổi
Var(Ui) = σ2
4. Không có hiện tượng tự tương quan giữa các Ui
Cov(Ui, Uj) = 0; i≠j
5. Không có hiện tượng tự tương quan giữa các Ui và Xi
Cov(Ui, Xj) = 0;
6. Ui có phân phối chuẩn: Ui ̴ N(0, σ2)
7. Không có hiện tượng cộng tuyến giữa Xi và Xj

34
Nguyên nhân tự tương quan
Nguyên nhân khách quan:
• Quán tính: các chuỗi thời gian mang tính chu kỳ, VD:
các chuỗi số liệu thời gian về GDP, chỉ số giá, sản lượng,
tỷ lệ thất nghiệp…
• Hiện tượng mạng nhện: phản ứng của cung của nông
sản đối với giá thường có một khoảng trễ về thời gian:
QSt = 1 + 2Pt-1 + ut
• Độ trễ: tiêu dùng ở thời kỳ hiện tại phụ thuộc vào thu
nhập và chi tiêu tiêu dùng ở thời kỳ trước đó: Ct = 1 +
2It + 3Ct-1 + ut

Nguyên nhân tự tương quan


Nguyên nhân chủ quan
• Hiệu chỉnh số liệu: do việc “làm trơn” số liệu  loại bỏ
những quan sát “gai góc”.
• Sai lệch do lập mô hình: bỏ sót biến, dạng hàm sai.
• Phép nội suy và ngoại suy số liệu

35
Hậu quả của tự tương quan
Áp dụng OLS thì sẽ có các hậu quả:
1. Các ước lượng không chệch nhưng không hiệu quả (vì
phương sai không nhỏ nhất)
2. Phương sai của các ước lượng là các ước lượng chệch,
vì vậy các kiểm định t và F không còn hiệu quả.
3. sˆ là ước lượng chệch của σ2
2

4. R2 của mẫu là ước lượng chệch của R2 tổng thể


5. Các dự báo về Y không chính xác

Cách phát hiện tự tương quan


2. Dùng kiểm định d của Durbin – Watson
Thống kê d của Durbin – Watson

d
 (e  e
i i 1 )2
e 2


i
ei ei 1
Khi n đủ lớn thì d  2(1-) với
e 2
i

do -1 ≤  ≤ 1, nên 0<= d <=4:


 = -1 => d = 4: tự tương quan hoàn hảo âm
 = 0 => d = 2: không có tự tương quan
 = 1 => d = 0: tự tương quan hoàn hảo dương

36
Cách phát hiện tự tương quan
2. Dùng kiểm định d của Durbin – Watson

Bảng thống kê Durbin cho giá trị tới hạn dU và dL dựa vào 3
tham số:
• α: mức ý nghĩa
• k’: số biến độc lập của mô hình
• n: số quan sát
Có tự Không có Không
tương Không tự tương quyết Có tự
quan quyết định quan bậc định tương
dương được nhất được quan âm

0 dL dU 2 4-dU 4-dL 4

Cách phát hiện tự tương quan


2. Dùng kiểm định d của Durbin – Watson

Các bước thực hiện kiểm định d của Durbin – Watson:


1. Chạy mô hình OLS và thu thập phần sai số et.
2. Tính d theo công thức trên.
3. Với cỡ mẫu n và số biến giải thích k’, tìm giá trị tra bảng
dL và dU.
4. Dựa vào các quy tắc kiểm định trên để ra kết luận.

37
3. Dùng kiểm định Breusch – Godfrey (BG)

Xét mô hình:
Yt = 1 + 2Xt + ut (7.1)
ut = 1ut-1 + 2ut-2 + … + put-p + vt
Kiểm định giả thiết
H0: 1 = 2 = … =  = 0, có nghĩa là không tồn
tại tự tương quan ở bất kỳ bậc nào trong số từ
bậc 1 đến bậc p.

3. Dùng kiểm định Breusch – Godfrey (BG)

Bước 1: Ước lượng (7.1) bằng OLS, tìm phần dư et


Bước 2: Dùng OLS để ước lượng mô hình
et = 1 + 2Xt + 1et-1 + 2et-2 + … + pet-p + εt
từ đây thu được R2.
Bước 3: với n đủ lớn, (n-p)R2 có phân phối xấp xỉ χ2(p)
với p là bậc tương quan.
- Nếu (n-p)R2 > χ2(p): Bác bỏ H0, nghĩa là có tự tương
quan ít nhất ở một bậc nào đó.
- Nếu (n-p)R2 ≤ χ2(p): Chấp nhận H0, nghĩa là không
có tự tương quan.

38
CHƯƠNG 8

SAI LẦM TRONG VIỆC LỰA CHỌN


MÔ HÌNH

Các giả thiết của mô hình


1. Y và các Xi quan hệ tuyến tính
2. Giá trị trung bình của Ui bằng 0
E(Ui /X2i, X3i) = 0
3. Phương sai của các Ui là không đổi
Var(Ui) = σ2
4. Không có hiện tượng tự tương quan giữa các Ui
Cov(Ui, Uj) = 0; i≠j
5. Không có hiện tượng tự tương quan giữa các Ui và Xi
Cov(Ui, Xj) = 0;
6. Ui có phân phối chuẩn: Ui ̴ N(0, σ2)
7. Không có hiện tượng cộng tuyến giữa Xi và Xj

39
2. Các sai lầm khi chọn mô hình- Hậu quả
1. Bỏ sót biến thích hợp
i. Các tham số ước lượng sẽ bị chệch và không vững.
ii. Khoảng tin cậy và các kiểm định không chính xác.
iii. Dự báo dựa trên mô hình sai sẽ không đáng tin cậy.
2. Đưa vào mô hình những biến không phù hợp
Các ước lượng không hiệu quả, khoảng tin cậy rộng.
3. Lựa chọn mô hình không chính xác
i. Ước lượng chệch các hệ số hồi quy, dấu của hệ số hồi quy có
thể sai.
ii. Có ít hệ số hồi quy ước lượng được có ý nghĩa thống kê
iii. R2 không cao
iv. Phần dư các quan sát lớn và biểu thị sự biến thiên có tính hệ
thống.

4. Kiểm định việc chọn mô hình

a. Kiểm định thừa biến (kiểm định Wald)


Xét hai mô hình:
(U ) : Y  1   2 X 2  ...   m 1 X m 1   m X m   k X k  U

( R ) : Y  1   2 X 2  ...   m 1 X m 1  V

(U): mô hình không bị ràng buộc


(R): mô hình bị ràng buộc
Điều kiện ràng buộc: các hệ số hồi quy của các
biến Xm , Xk đồng thời bằng 0

40
a. Kiểm định Wald
Xây dựng giả thiết để kiểm định đk ràng buộc

H0: βm =… βk = 0
H1: có ít nhất một βj khác 0
B1: Hồi quy mô hình (U) có k tham số, tính RSSU có n-k
bậc tự do
B2: Hồi quy mô hình (R) có m tham số, tính RSSR có n-m
bậc tự do
B3: Tính F

( RSS R  RSS U ) / k  m ) ( R 2 U  R 2 R ) /( k  m )
F  
RSS U /( n  k ) (1  R 2 U ) /( n  k )

a. Kiểm định Wald

B4: Tra bảng F với mức ý nghĩa α có giá trị Fα (k-m, n-k)
Quy tắc quyết định
•Nếu F ≥ Fα (k-m, n-k): bác bỏ H0, tức mô hình (U) không
thừa biến
•Nếu F < Fα (k-m, n-k): chấp nhận H0
Nếu dùng kết quả p-value thì quy tắc quyết định như sau:
• Nếu p ≤  : Bác bỏ H0
• Nếu p > : Chấp nhận H0

41
b. Kiểm định bỏ sót biến giải thích (kiểm định Ramsey - Reset)

Bước 1: Dùng OLS để ước lượng mô hình


Yi = 1 + 2X2i + ui
Từ đó tính ˆ và R2old
Y
Bước 2: dùng iOLS để ước lượng mô hình

Yi  1  2 X 2i  3Yˆ 2  4Yˆ 3  ...  vi


Tính R2new
Kiểm định giả thiết H0: 3 = 4 =… = k = 0

b. Kiểm định bỏ sót biến giải thích (kiểm định Ramsey - Reset)

Bước 3: Tính
2
( R new  Rold
2
) m
F 
(1  R new
2
) (n  k )

n: số quan sát
k: số tham số trong mô hình mới
m: số biến đưa thêm vào

42
b. Kiểm định bỏ sót biến giải thích (kiểm định Ramsey - Reset)

Bước 4: Quy tắc quyết định


•Nếu F > F(m,n-k): Bác bỏ H0, tức các hệ số 3,4,…k
không đồng thời bằng 0, mô hình cũ đã bỏ sót biến
•Nếu F < F(m,n-k): Chấp nhận H0

Nếu dùng kết quả p-value thì quy tắc quyết định như sau:

• Nếu p ≤  : Bác bỏ H0
• Nếu p > : Chấp nhận H0

c. Kiểm định giả thiết phân phối chuẩn của ui


Kiểm định Jacque - Bera (JB)
• Cho cặp giả thuyết: H0: u tuân theo phân phối chuẩn.
H1: u không tuân theo phân phối chuẩn.
• Bước 1. Ước lượng mô hình hồi quy gốc, thu được các phần dư ei
• Bước 2. Tính giá trị quan sát của thống kê kiểm định:
 S 2 ( K  3) 2 
JB  n   
 6 24 
S là skewness của dữ liệu, và K là kurtosis của dữ liệu:
• Bước 3. Kết luận:
• Nếu JB > 2
(2) thì bác bỏ giả thuyết H0.
• Ngược lại, nếu JB ≤ 2 (2) thì chưa có cơ sở bác bỏ giả thuyết H0.
•Đồng thời, ta cũng có thể sử dụng p-value để kết luận.
• Nếu p-value < : bác bỏ giả thuyết H0.
• Nếu p-value ≥ : chấp nhận giả thuyết H0.

43
Tiêu chuẩn lựa chọn mô hình

• R2,
• R2 điều chỉnh,
• Giá trị của hàm hợp lý log-likelihood (L),
• Tiêu chuẩn thông tin Akaike (AIC),
• Tiêu chuẩn thông tin Schwarz (SC)

44
Tiêu chuẩn R2
• R2 đo lường % biến động của Y được giải thích bởi các Xi
trong mô hình.
• R2 càng gần 1, mô hình càng phù hợp.
• Lưu ý:
• R2 chỉ đo lường sự phù hợp trong mẫu
• Khi so sánh R2 giữa các mô hình khác nhau, các biến
phụ thuộc phải giống nhau.
• R2 không giảm khi tăng thêm biến độc lập.

Tiêu chuẩn R2 điều chỉnh (R2)


RSS /( n  k ) n 1
R 2  1  1  (1  R 2 )
TSS /( n  1) nk
• R2  R2.R2 chỉ tăng khi giá trị tuyệt đối của giá trị t
của biến được thêm vào mô hình lớn hơn 1.
• R2 là tiêu chuẩn tốt hơn R2.
• Các biến phụ thuộc cũng phải giống nhau.

45
Giá trị của hàm hợp lý log-likelihood (L)

n n 1
L   ln s 2  ln( 2 )   U i2
2 2 2

• Giá trị L càng lớn chứng tỏ mô hình càng phù hợp

Tiêu chuẩn thông tin Akaike (AIC)

 RSS  2 k / n
AIC   .e
 n 
hay
 2k   RSS 
ln AIC     ln  
 n  n 
• Trong đó k là số biến được ước lượng (gồm cả hệ số tự
do) và n là cỡ mẫu.
• Giá trị AIC càng nhỏ chứng tỏ mô hình càng phù hợp.

46
Tiêu chuẩn thông tin Schwarz (SC)
 RSS  k / n
SC   .n
 n 
hay
k  RSS 
ln SC  ln n   
n  n 
• SC khắt khe hơn AIC.
• SC càng nhỏ, mô hình càng tốt.

47

You might also like