Chuong 03

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 12

Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 01.01.

2019

PHÂN TÍCH HỒI QUY BỘI:


VẤN ĐỀ ƯỚC LƯỢNG
Phân tích hồi quy bội: • Hồi quy đơn (hồi quy 2 biến)

Vấn đề ước lượng


• y = β0+β1x1+u
• β0: hệ số chặn
• β1: hệ số góc
• Hồi quy bội 3 biến
Chương 3 • y = β0+β1x1+β2x2+u 3.3
• Hồi quy bội 4 biến
• y = β0+β1x1+β2x2+β3x3+u
• β0: hệ số chặn
Wooldridge: Introductory Econometrics:
• β1, β2, β3: hệ số góc
A Modern Approach, 5e
• y: biến phụ thuộc
• x1, x2, x3: biến độc lập
• u: sai số ngẫu nhiên, nhiễu
• β0, β1, β2, β3: hệ số hồi quy
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 2

Phân tích hồi quy bội: Phân tích hồi quy bội:
Vấn đề ước lượng Vấn đề ước lượng
3.1 Sự cần thiết nghiên cứu hồi quy bội
Sự cần thiết của hồi quy bội
Định nghĩa mô hình hồi quy bội (k+1 biến)
Đưa thêm nhiều biến giải thích vào mô hình
“Giải thích biến theo các biến “
Thực hiện phân tích trong điều kiện giữ các yếu tố khác không đổi,
Hệ số chặn Các hệ số góc trừ các yếu tố trong
Cho phép sử dụng dạng hàm đa dạng hơn

3.6 Ví dụ: Phương trình tiền lương


Cho phép đo lường tác động của trình độ học vấn lên lương trong điều kiện kinh nghiệm là không đổi

Biến phụ thuộc


Sai số ngẫu nhiên, Tất cả các yếu tố khác
Biến được giải thích, Biến độc lập,
Biến phản ứng,… Nhiễu,
Biến giải thích, 3.1
Phần chưa quan sát được,…
Biến kiểm soát,…
Tiền lương (USD/giờ) Số năm đi học Kinh nghiệm lao động

3.8
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/phamtricao/ 1
Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 01.01.2019

Phân tích hồi quy bội: Phân tích hồi quy bội:
Vấn đề ước lượng Vấn đề ước lượng
Ví dụ: Điểm kiểm tra trung bình và chi phí trên mỗi sinh viên Ví dụ: Thu nhập và chi tiêu của hộ gia đình
3.4
3.2

Các yếu tố khác Các yếu tố khác

Điểm trung bình của Chi phí trên mỗi sinh Thu nhập trung bình Chi tiêu của hộ Thu nhập của hộ Thu nhập của hộ bình phương
bài thi chuẩn hóa viên của trường của gia đình các sinh
viên trong trường
Mô hình có hai biến giải thích: thu nhập và thu nhập bình phương
Chi phí trên mỗi sinh viên có thể tương quan với thu nhập trung bình của Chi tiêu được giải thích bằng hàm bậc hai của thu nhập
các gia đình do vấn đề tài chính Cần cẩn thận khi diễn giải ý nghĩa của các hệ số hồi quy:
Nếu bỏ biến thu nhập trung bình của gia đình ra khỏi hàm hồi quy có thể
dẫn tới ước lượng tác động của chi phí trên mỗi sinh viên đến điểm trung Mức chi tiêu tăng thêm bao Phụ thuộc vào
mức chi tiêu cụ
bình bị chệch. nhiêu đơn vị nếu thu nhập
tăng thêm một đơn vị? thể đang xét
Trong hồi quy đơn, tác động của biến chi phí trên mỗi sinh viên đến điểm số
có thể đã bao gồm luôn tác động của biến thu nhập trung bình của gia đình
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội: Phân tích hồi quy bội:
Vấn đề ước lượng Vấn đề ước lượng
3.2 Cách thực hiện và diễn giải của phương pháp OLS
Ví dụ: tiền lương của CEO, doanh thu và thâm niên của CEO
Ước lượng OLS của mô hình hồi quy bội:
3.7
Mẫu ngẫu nhiên

Log của thu nhập CEO Log của doanh thu Hàm bậc hai của số năm thâm niên làm CEO

Mô hình giả định rằng hệ số co giãn của tiền lương CEO theo doanh Phần dư
thu của doanh nghiệp là hằng số. 3.11’
Mô hình giả định rằng mối quan hệ giữa tiền lương CEO và thâm niên
Cực tiểu tổng bình phương phần dư
làm CEO có dạng hàm bậc hai
Ý nghĩa của sự “tuyến tính“ trong hồi quy 3.12’
Mô hình phải tuyến tính theo tham số (không phải theo biến số)
Việc tìm giá trị cực tiểu sẽ được thực hiện bởi phần mềm

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/phamtricao/ 2
Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 01.01.2019

Phân tích hồi quy bội: Phân tích hồi quy bội:
Vấn đề ước lượng Vấn đề ước lượng
Diễn giải ý nghĩa của mô hình hồi quy bội Ví dụ 3.1: Các yếu tố tác động đến điểm GPA

Cho biết lượng thay đổi của biến phụ thuộc khi biến độc 3.15
lập thứ j thay đổi một đơn vị, trong điều kiện các biến độc
lập khác và sai số không đổi
Điểm GPA trung bình của Điểm GPA trung bình khi Kết quả bài kiểm tra thành tích
sinh viên ở đại học học phổ thông trung học

Mô hình hồi quy bội cho phép giữ nguyên giá trị của các biến giải Diễn giải
thích khác không đổi, ngay cả khi trong thực tế có thể các biến giải Trong điều kiện ACT không đổi, nếu GPA trung học tăng thêm 1 điểm thì GPA
thích này là có tương quan với nhau. đại học tăng thêm 0,453 điểm
Cách diễn giải này được gọi là “Các yếu tố khác không đổi“ Hoặc: Nếu chúng ta so sánh hai sinh viên có cùng ACT nhưng điểm hsGAP của
Chúng ta vẫn cần giả định rằng các yếu tố không quan sát được u sẽ sinh viên A cao hơn 1 điểm so với sinh viên B, thì chúng ta dự đoán rằng sinh
không thay đổi khi biến giải thích thay đổi. viên A sẽ có colGPA cao hơn 0,453 điểm so với sinh viên B
Trong điều kiện điểm hsGPA như nhau, nếu ACT tăng thêm 10 điểm thì
colGAP tăng thêm 0,0094*10 = 0,094 điểm
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

PHÂN TÍCH HỒI QUY BỘI:


Phân tích hồi quy bội: VẤN ĐỀ ƯỚC LƯỢNG
Vấn đề ước lượng • Tập tin gpa1.wf1
Call:
lm(formula = colGPA ~ hsGPA + ACT + skipped + age)
Cách diễn giải tác động riêng phần trong hồi quy bội:
Residuals:
Hệ số hồi quy của biến giải thích trong mô hình hồi quy bội có Min 1Q Median 3Q Max
-0.86321 -0.23315 -0.03006 0.24839 0.80606
thể được ước lượng và có thể tính toán được bằng hai bước sau:
1) Hồi quy biến giải thích này theo tất cả các biến giải thích còn lại Coefficients:
Estimate Std. Error t value Pr(>|t|)
2) Hồi quy theo phần dư của hàm hồi quy ở bước 1 (Intercept) 0.90206 0.65037 1.387 0.16771
hsGPA 0.43379 0.09709 4.468 1.65e-05 ***
Tại sao cách này có thể thực hiện được? ACT 0.01449 0.01058 1.370 0.17309
skipped -0.08066 0.02617 -3.082 0.00249 **
Phần dư của hàm hồi quy ở bước 1 đó chính là phần còn lại của biến age 0.01990 0.02284 0.872 0.38498
---
giải thích và phần còn lại này không tương quan với các biến giải Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
thích khác trong mô hình
Residual standard error: 0.3298 on 136 degrees of freedom
Hệ số góc trong hàm hồi quy ở bước 2 chính là tác động đã tách biệt Multiple R-squared: 0.2379, Adjusted R-squared: 0.2154
F-statistic: 10.61 on 4 and 136 DF, p-value: 1.635e-07
của riêng biến giải thích đó đến biến phụ thuộc
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 12

https://sites.google.com/a/ueh.edu.vn/phamtricao/ 3
Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 01.01.2019

PHÂN TÍCH HỒI QUY BỘI: PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG VẤN ĐỀ ƯỚC LƯỢNG
Call: Call:
lm(formula = hsGPA ~ ACT + skipped + age) lm(formula = colGPA ~ vmu)

Coefficients: Residuals:
Estimate Std. Error t value Pr(>|t|) Min 1Q Median 3Q Max
(Intercept) 3.793037 0.471721 8.041 3.74e-13 *** -0.83002 -0.28206 -0.03992 0.26128 0.86387
ACT 0.038582 0.008705 4.432 1.90e-05 ***
skipped -0.043514 0.022730 -1.914 0.05765 . Coefficients:
age -0.061095 0.019407 -3.148 0.00202 ** Estimate Std. Error t value Pr(>|t|)
--- (Intercept) 3.05674 0.02965 103.079 < 2e-16 ***
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 vmu 0.43379 0.10367 4.184 5.04e-05 ***
---
Residual standard error: 0.2902 on 137 degrees of freedom Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Multiple R-squared: 0.1948, Adjusted R-squared: 0.1772
F-statistic: 11.05 on 3 and 137 DF, p-value: 1.522e-06 Residual standard error: 0.3521 on 139 degrees of freedom
Multiple R-squared: 0.1119, Adjusted R-squared: 0.1055
F-statistic: 17.51 on 1 and 139 DF, p-value: 5.041e-05
HSGPA = β0 + β1 ACT + β2 SKIPPED + β3 AGE + v
ketqua2<-lm(hsGPA~ACT+skipped+age)
vmu<-resid(ketqua2)
13 14

Phân tích hồi quy bội: Phân tích hồi quy bội:
Vấn đề ước lượng Vấn đề ước lượng
Tính chất của ước lượng OLS với một mẫu dữ liệu bất kỳ Mức độ phù hợp của hàm SRF so với mẫu khảo sát
Giá trị ước lượng (Fitted values) và phần dư Sự phân rã của tổng mức biến động

3.20 3.21 3.27 Lưu ý rằng R2 luôn tăng khi thêm


biến độc lập vào hàm hồi quy
Giá trị ước lượng/Giá trị dự đoán Phần dư
R bình phương (R2)

3.28
Tính chất đại số của hồi quy OLS
Các biểu diễn khác của R bình phương R2 bằng bình phương của hệ số
tương quan giữa giá trị thực tế và
giá trị ước lượng của biến phụ thuộc

= ( r(y,y^)2 ) 3.29
Tổng phần dư bằng 0 Tương quan giữa biến độc Trung bình mẫu của biến phụ
lập xj và phần dư bằng 0 thuộc và các biến độc lập nằm
trên đường hồi quy Tính chất: 0  R2  1
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/phamtricao/ 4
Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 01.01.2019

Phân tích hồi quy bội: Phân tích hồi quy bội:
Vấn đề ước lượng Vấn đề ước lượng
Ví dụ 3.5: Hàm hồi quy giải thích cho biến số lần bị bắt giữ Ví dụ 3.5: Hàm hồi quy giải thích cho biến số lần bị bắt giữ (tt)
Tỷ lệ số lần bắt Nếu thêm một biến giải thích khác avgsen vào mô hình:
Số lần bị bắt giữ giữ có dẫn đến bị Số tháng bị giam Số quý làm việc
trong năm 1986 buộc tội trước đó trong năm 1986 trong năm 1986
(không phải %)

Mức phạt trung bình của các lần phạm tội trước

R2 chỉ tăng nhẹ

Diễn giải: Diễn giải:


Tỷ lệ số lần bị bắt giữ trước đó tăng 0,5 lần thì dẫn đến số lần bị bắt giữ Mức phạt trung bình của các lần phạm tội trước có làm tăng số lần bị bắt giữ (?)
giảm đi 0,15*0,5 = 0,075 lần (trên 1 người) hay 7,5 lần (trên 100 người) Vai trò của biến giải thích mới thêm vào khá hạn chế khi R2 tăng rất ít
Số tháng bị giam tăng 12 tháng thì dẫn đến số lần bị bắt giữ của người đó
Lưu ý chung về R2
giảm 0,034*12 = 0,408 lần
Số quý làm việc trong năm tăng 1 dẫn đến số lần bị bắt giữ của người đó Ngay cả khi R2 khá nhỏ (như trong ví dụ), hàm hồi quy vẫn có thể dùng để phân
giảm 0,104 lần (trên 1 người) hay 10,4 lần (trên 100 người) tích tác động nhân quả riêng phần theo dạng “giữ các yếu tố khác cố định“
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

PHÂN TÍCH HỒI QUY BỘI:


Phân tích hồi quy bội: VẤN ĐỀ ƯỚC LƯỢNG
Vấn đề ước lượng Khaùi nieäm ña coäng tuyeán
Xeùt moâ hình hoài quy boäi:
3.3 Giá trị kỳ vọng của ước lượng OLS
Các giả thiết của mô hình hồi quy bội:
y = β0 + β1x1 + β2x2 + u
y y
Giả thiết MLR.1 (Tuyến tính theo tham số)
Trong tổng thể, mối liên hệ giữa
biến phụ thuộc y và các biến độc
lập là tuyến tính theo tham số x1 x2 x1 x2
3.31

Giả thiết MLR.2 (Mẫu ngẫu nhiên) Khoâng coù ÑCT ÑCT thaáp
Mẫu dữ liệu được chọn
ngẫu nhiên từ tổng thể
y y x2
3.32 x1
x1 x2 x1 x2
Vì vậy, mỗi quan sát đều tuân theo hàm hồi quy tổng thể
ÑCT vöøa ÑCT cao ÑCT hoaøn haûo
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 20

https://sites.google.com/a/ueh.edu.vn/phamtricao/ 5
Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 01.01.2019

PHÂN TÍCH HỒI QUY BỘI: PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG VẤN ĐỀ ƯỚC LƯỢNG
Cách tiếp cận đại số của vấn đề đa cộng tuyến: Xét mô hình hồi quy bội với hai biến độc lập x1, x2:
 Nếu tồn tại các số thực 1, …, k không đồng thời bằng y = β0+β1x1+ β2x2+u
0 và “số thực” c sao cho: * Nếu có đa cộng tuyến hoàn hảo, tồn tại ít nhất một i  0
1x1 + 2x2 + … + kxk = c
thì ta nói giữa các biến xi (i =1,…, k) xảy ra hiện tượng đa cộng (i= 1, 2) và c sao cho:
tuyến hoàn hảo. Ta nói các biến xi (i =1,…, k) có quan hệ tuyến 1x1+2x2 = c
tính chính xác. c
 Nếu tồn tại các số thực 1, ..., k không đồng thời bằng Giả sử 2 ≠ 0  x   1 x   x  c'
0 và “số thực” c sao cho:
2 2 1  1
2
0 + 1x1 + 2x2 + … + k1xk1 + v = c * Nếu có đa cộng tuyến không hoàn hảo, tồn tại ít nhất một i  0
với v là sai số ngẫu nhiên (i= 1, 2) và c sao cho:
thì ta nói giữa các biến xi (i =1,…, k) xảy ra hiện tượng đa cộng
tuyến không hoàn hảo. Ta nói các biến xi (i =1,…, k) có quan hệ 1x1+2x2+v = c (v là sai số ngẫu nhiên)

tuyến tính không chính xác. Giả sử 2 ≠ 0  x  1 x  1 v  c   x  v ' c '
2 2 1 2 2 1
21 22

PHÂN TÍCH HỒI QUY BỘI: PHÂN TÍCH HỒI QUY BỘI:
VẤN ĐỀ ƯỚC LƯỢNG VẤN ĐỀ ƯỚC LƯỢNG
Xét mô hình hồi quy bội với hai biến độc lập x1, x2: Ví dụ:
y = β0+β1x1+ β2x2+u
Ta có dữ liệu giả định của các biến sau:
Xét hệ số tương quan r = r(x1,x2), ta có: 0  |r|  1
x1 x2 x2* v
• r = 0: x1, x2 không có đa cộng tuyến 10 50 52 2
• r ≠ 0: x1, x2 có đa cộng tuyến 15 75 75 0
18 90 97 7
– |r| càng gần 1 thì mức độ ĐCT càng cao 24 120 129 9
– |r| càng gần 0 thì mức độ ĐCT càng thấp 30 150 152 2
– |r|=1: ĐCT hoàn hảo
x1, x2 có đa cộng tuyến hoàn hảo?
Lưu ý:
Chỉ đúng cho mô hình có 2 biến độc lập. x1, x2* có đa cộng tuyến hoàn hảo?
23 24

https://sites.google.com/a/ueh.edu.vn/phamtricao/ 6
Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 01.01.2019

PHÂN TÍCH HỒI QUY BỘI:


VẤN ĐỀ ƯỚC LƯỢNG
Phân tích hồi quy bội:
Vấn đề ước lượng
Ví dụ (tt):
Ta có x2 = 5x1 nên x1 và x2 có đa cộng tuyến hoàn hảo. Các giả thiết của mô hình hồi quy bội: (tt)
Ta thấy hệ số tương quan r(x1,x2) = 1. Giả thiết MLR.3 (Không có cộng tuyến hoàn hảo)

Ta có x2*= 5x1+v, nên x1 và x2* có đa cộng tuyến không hoàn hảo. Trong mẫu (và vì vậy trong tổng thể), không có biến độc lập nào là hằng
số và không có phụ thuộc tuyến tính chính xác giữa các biến độc lập
Ta thấy r(x1,x2*) = 0,9959 nên x1 và x2* có đa cộng tuyến cao, gần
hoàn hảo. Lưu ý về giả thiết MLR.3
Giả thiết này chỉ loại trừ trường hợp cộng tuyến/tương quan hoàn
hảo giữa các biến độc lập; các tương quan không hoàn hảo vẫn có
thể xảy ra
Nếu một biến độc lập là tổ hợp tuyến tính chính xác của các biến
độc lập khác thì biến độc lập đó là không cần thiết và sẽ bị loại bỏ ra
khỏi hàm hồi quy
Biến hằng số cũng bị loại bỏ (vì cộng tuyến hoàn hảo với hệ số chặn)
25 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội: Phân tích hồi quy bội:
Vấn đề ước lượng Vấn đề ước lượng
Ví dụ về cộng tuyến hoàn hảo: trường hợp mẫu nhỏ
Các giả thiết của mô hình hồi quy bội: (tt)
Giả thiết MLR.4 (Trung bình có điều kiện bằng 0)
Trong mẫu nhỏ, biến avginc có thể vô tình là bội số của biến expend; khi đó
không thể tách bạch tác động riêng phần cho từng biến vì biến động của chúng là Giá trị của các biến giải thích không chứa
như nhau bất kỳ thông tin nào về giá trị trung bình
3.36 của các yếu tố không quan sát được
Ví dụ về cộng tuyến hoàn hảo: mối liên hệ giữa các biến độc lập
Trong mô hình hồi quy bội, giả thiết trung bình có điều kiện bằng 0
có nhiều khả năng được thỏa mãn hơn vì có ít yếu tố được gộp vào
Có mối liên hệ tuyến tính chính xác giữa shareA và shareB và hệ số chặn:
sai số ngẫu nhiên hơn so với hồi quy đơn.
shareA + shareB = 1 (hệ số chặn của mô hình) Ví dụ: Điểm kiểm tra trung bình
Cách 1: shareA hoặc shareB sẽ bị loại ra khỏi
mô hình
Cách 2: không khuyến khích làm Nếu avginc không được đưa vào mô hình, biến này sẽ nằm trong sai số; khi
đó, khó có thể khẳng định rằng biến expend không có tương quan với sai số.
voteA = 1shareA + 2shareB + u
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/phamtricao/ 7
Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 01.01.2019

Phân tích hồi quy bội: Phân tích hồi quy bội:
Vấn đề ước lượng Vấn đề ước lượng
Thảo luận về giả thiết trung bình có điều kiện bằng 0 Việc thêm biến không liên quan vào mô hình hồi quy
Các biến giải thích có tương quan với sai số được gọi là biến nội sinh; Sự
3.38
nội sinh là trường hợp vi phạm giả thiết MLR.4
Các biến giải thích không tương quan với sai số được gọi là biến ngoại Không có vấn đề gì vì = 0 trong tổng thể
sinh; MLR.4 được thỏa mãn nếu tất cả các biến giải thích là ngoại sinh
Sự ngoại sinh là giả thiết quan trọng cho việc diễn giải quan hệ nhân quả Tuy nhiên, việc thêm biến không liên quan có thể làm tăng phương sai mẫu.
của hồi quy bội, và cho tính không chệch của ước lượng OLS
Bỏ sót biến có liên quan: trường hợp đơn giản
Định lý 3.1 (Tính không chệch của OLS)
3.40
3.37
Mô hình đúng (chứa x1 và x2)
Tính không chệch là tính chất về trung bình của các mẫu; còn khi xét một
Mô hình ước lượng (x2 bị bỏ sót)
mẫu cụ thể, ước lượng tính được từ mẫu đó có thể khác xa giá trị đúng.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội: Phân tích hồi quy bội:
Vấn đề ước lượng Vấn đề ước lượng
Chệch do bỏ sót biến Ví dụ: Bỏ sót biến năng lực khi hồi quy tiền lương
Giả sử x1 và x2 có tương quan và mối quan
hệ giữa chúng là tuyến tính
3.42
Cả hai đều có thể mang dấu dương

Suất sinh lợi giáo dục sẽ bị ước lượng cao hơn thực tế do .t . . Kết quả hồi
quy cho thấy rằng người càng có nhiều năm đi học thì tiền lương sẽ rất cao, nhưng kết
Đây là hệ số chặn ước Đây là hệ số góc của Phần sai số
quả này có thể đúng một phần, nhưng cũng có thể là do người có trình độ học vấn càng
lượng được khi y chỉ x1 khi y chỉ hồi quy
hồi quy theo x1
cao thì nhìn chung năng lực cũng càng cao.
theo x1
Khi nào bỏ sót biến không gây ra sự chệch cho ước lượng?
Kết luận: Tất cả các hệ số ước lượng được đều bị chệch Khi biến bỏ sót không liên quan hoặc không tương quan với các biến
giải thích trong mô hình.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/phamtricao/ 8
Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 01.01.2019

Phân tích hồi quy bội: Phân tích hồi quy bội:
Vấn đề ước lượng Vấn đề ước lượng
3.4 Phương sai của ước lượng OLS
Tính chệch do bỏ sót biến: trường hợp tổng quát hơn
Các giả thiết của mô hình hồi quy bội: (tt)
Mô hình đúng (gồm x1, x2 và x3)
Giả thiết MLR.5 (Phương sai thuần nhất)
3.49 Giá trị của các biến giải thích không hàm
chứa bất kỳ thông tin nào về phương sai
Mô hình ước lượng (x3 bị bỏ sót)
của các yếu tố chưa quan sát được.

Không thể xác định rõ được chiều hướng của phần chệch Ví dụ: phương trình tiền lương Giả thiết này có thể sẽ khó kiểm
Phân tích như trường hợp đơn giản nếu một biến độc lập không chứng trong nhiều trường hợp
tương quan với các biến độc lập khác
Ví dụ: Bỏ sót biến ability trong phương trình hồi quy tiền lương Tất cả các biến giải thích được ký
Cách ký hiệu ngắn gọn hiệu chung dưới dạng vector

Nếu exper gần như không tương quan với educ và abil, thì chiều hướng của với
phần chệch do bỏ sót biến có thể được phân tích như trong trường hợp đơn
giản chỉ có hai biến đã xét trước đó.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội: Phân tích hồi quy bội:
Vấn đề ước lượng Vấn đề ước lượng
Định lý 3.2 (Phương sai mẫu của các hệ số góc ước lượng OLS) Các thành phần của phương sai ước lượng OLS (vấn đề đa cộng tuyến):
1) Phương sai của sai số
Dưới các giả thiết từ MLR.1 đến MLR.5:
Phương sai sai số càng lớn sẽ càng làm tăng phương sai ước lượng vì có nhiều
Phương sai của sai số “nhiễu“ hơn trong phương trình
Phương sai sai số lớn sẽ làm cho việc ước lượng kém chính xác
Phương sai sai số không giảm khi kích thước mẫu tăng lên
2) Tổng biến động trong mẫu của biến giải thích
Tổng biến động trong mẫu R2 có được khi hồi quy biến độc lập xj theo tất cả Tổng biến động trong mẫu của biến giải thích càng nhiều thì ước lượng thu được
của biến giải thích xj: các biến độc lập khác (hồi quy có hệ số chặn)
càng chính xác (more precise)
Tổng biến động trong mẫu sẽ tự động tăng khi kích thước mẫu tăng
Vì vậy, tăng kích thước mẫu sẽ làm tăng sự chính xác (precision) của ước lượng
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/phamtricao/ 9
Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 01.01.2019

Phân tích hồi quy bội: Phân tích hồi quy bội:
Vấn đề ước lượng Vấn đề ước lượng
3) Mối quan hệ tuyến tính giữa các biến độc lập Một ví dụ về đa cộng tuyến
Các chi phí cho
Hồi quy theo tất cả các biến độc lập khác (có hệ số chặn) Điểm trung bình bài thi Chi phí cho nguyên vật liệu Các chi phí khác
chuẩn hóa của trường giáo viên dạy học

R2 của phương trình này càng cao thì xj càng được


giải thích nhiều hơn bởi các biến độc lập khác

Phương sai mẫu của sẽ càng lớn khi càng được giải thích nhiều
bởi các biến độc lập khác Các loại chi phí sẽ có tương quan mạnh với nhau bởi vì một trường học có nguồn lực lớn sẽ
chi tiêu lớn cho tất cả các khoản chi.
Vấn đề các biến độc lập gần như phụ thuộc tuyến tính nhau được gọi
Rất khó để ước lượng tác động riêng phần của từng loại chi phí bởi vì tất cả các khoản chi
là vấn đề đa cộng tuyến (nghĩa là . với một vài nào đó) thường cùng cao hoặc cùng thấp. Để ước lượng tác động một cách chính xác (precise),
chúng ta cần thêm các quan sát mà các khoản chi phí này khác nhau một cách đáng kể.

Kết quả là, phương sai mẫu của các hệ số hồi quy ước lượng được sẽ lớn.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

PHÂN TÍCH HỒI QUY BỘI:


Phân tích hồi quy bội: VẤN ĐỀ ƯỚC LƯỢNG
Vấn đề ước lượng • Tập tin gpa1.wf1
Call:
lm(formula = colGPA ~ hsGPA + ACT + skipped + age)
Thảo luận về vấn đề đa cộng tuyến Coefficients:
Trong các ví dụ trên, có thể sẽ tốt hơn nếu gom tất cả các khoản chi phí vào Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.90206 0.65037 1.387 0.16771
thành một yếu tố vì không thể tách biệt tác động của từng khoản chi hsGPA 0.43379 0.09709 4.468 1.65e-05 ***
ACT 0.01449 0.01058 1.370 0.17309
Trong một số trường hợp, việc loại bỏ một số biến độc lập có thể làm giảm skipped -0.08066 0.02617 -3.082 0.00249 **
đa cộng tuyến (nhưng cách làm này có thể dẫn tới sự chệch do bỏ sót biến) age 0.01990 0.02284 0.872 0.38498
---
Chỉ có phương sai mẫu của biến bị đa cộng tuyến bị “phóng đại“, ước lượng Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
của các biến giải thích khác có thể không bị ảnh hưởng.
Residual standard error: 0.3298 on 136 degrees of freedom
Lưu ý rằng đa cộng tuyến không vi phạm giả thiết MLR.3 Multiple R-squared: 0.2379, Adjusted R-squared: 0.2154

Đa cộng tuyến có thể được phát hiện thông qua “nhân tử phóng đại phương > library(car)
> vif(ketqua1)
sai“ Kinh nghiệm: nhân tử phóng đại
hsGPA ACT skipped age
phương sai không nên lớn hơn 10
1.242002 1.165185 1.045578 1.084732
VIF > 10: có đa cộng tuyến cao ; VIF < 10: có đa cộng tuyến thấp
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.
VIF < 10 : các biến độc lập có đa cộng tuyến thấp 40

https://sites.google.com/a/ueh.edu.vn/phamtricao/ 10
Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 01.01.2019

PHÂN TÍCH HỒI QUY BỘI:


VẤN ĐỀ ƯỚC LƯỢNG
Phân tích hồi quy bội:
• Cách phát hiện đa cộng tuyến:
Vấn đề ước lượng
• Dấu của hệ số hồi quy bị sai
• Hệ số xác định R2 cao nhưng tỷ số |t| thấp Phương sai trong mô hình bị định dạng sai
• Hệ số tương quan cặp giữa các biến độc lập cao
Việc thêm hay không thêm một biến độc lập nào đó vào mô hình có
• Kiểm định sử dụng hồi quy phụ
thể được xem xét dựa trên sự đánh đổi giữa tính chệch và tính
• Nhân tử phóng đại phương sai VIF hiệu quả của ước lượng
Mô hình đúng của tổng thể

• Cách khắc phục đa cộng tuyến:


• Sử dụng thông tin tiên nghiệm 3.52 Mô hình ước lượng 1
• Thu thập thêm số liệu hoặc lấy thêm mẫu mới
• Kết hợp số liệu chéo và số liệu chuỗi thời gian 3.53 p
Mô hình ước lượng 2
• Bỏ bớt biến độc lập
• Dùng sai phân cấp 1 Sự chệch do bỏ sót biến ở mô hình bị định dạng sai (mô hình 2) được
• Thay đổi dạng hàm của biến bù đắp bằng phương sai nhỏ của ước lượng thu được
41 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội: Phân tích hồi quy bội:
Vấn đề ước lượng Vấn đề ước lượng
Phương sai trong mô hình bị định dạng sai (tt.) Ước lượng phương sai của sai số

3.54 Xét điều kiện theo x1 và x2 , 3.56


phương sai trong mô hình 2
luôn nhỏ hơn trong mô hình 1
3.55
Ước lượng không chệch của phương sai sai số có thể tính được dựa trên việc xem xét bậc tự
do của mô hình (df). Bậc tự do có được bằng cách lấy số quan sát trừ cho số tham số.
Trường hợp 1: Kết luận: Không thêm biến không liên quan vào mô hình Có n sai số bình phương nhưng các thành phần này không hoàn toàn độc lập mà liên quan với
nhau thông qua k+1 phương trình xác định bởi điều kiện bậc nhất của bài toán tìm cực tiểu.

df = n-(k+1) = số quan sát – số tham số cần ước lượng >0 3.57


Sự đánh đổi giữa tính chệch và tính hiệu quả
Trường hợp 2: Lưu ý: tính chệch không biến mất ngay cả khi xét mẫu lớn
Định lý 3.3 (Ước lượng không chệch của phương sai sai số)

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/phamtricao/ 11
Chương 3 - Nhập môn Kinh tế lượng * Jeffrey M. Wooldridge 01.01.2019

Phân tích hồi quy bội: Phân tích hồi quy bội:
Vấn đề ước lượng Vấn đề ước lượng
Ước lượng phương sai mẫu của các ước lượng OLS 3.5 Tính hiệu quả của OLS: Định lý Gauss-Markov
Dưới các giả thiết MLR.1 - MLR.5, ước lượng OLS là không chệch
Độ lệch chuẩn
đúng của ước
Tuy nhiên, dưới các giả thiết này, cũng có nhiều ước lượng khác là
lượng của
không chệch
Thay cho phương sai chưa biết Ước lượng không chệch nào có phương sai nhỏ nhất?

Độ lệch chuẩn ước Để trả lời câu hỏi này, chúng ta thường xét trong lớp các ước lượng
lượng của ước lượng
của 3.58 tuyến tính, nghĩa là ước lượng là tuyến tính theo biến phụ thuộc.

Mặc dù có thể có dạng hàm bất kỳ theo giá trị mẫu


Lưu ý rằng các công thức này chỉ đúng dưới các giả thiết từ MLR.1 của tất cả các biến giải thích; ước lượng OLS luôn
3.60
đến MLR.5 (cụ thể là phải có giả thiết phương sai thuần nhất) có thể đưa về dạng này

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội:


Môøi gheù thaêm trang web:
Vấn đề ước lượng 48

Định lý 3.4 (Định lý Gauss-Markov)


https://sites.google.com/a/ueh.edu.vn/phamtricao/
Dưới các giả thiết MLR.1 - MLR.5, ước lượng OLS là ước lượng tuyến https://sites.google.com/site/phamtricao/
tính không chệch tốt nhất (BLUE) của các hệ số hồi quy.
“Tốt nhất“ nghĩa là “có phương sai nhỏ nhất“ :

với mọi sao cho.

OLS chỉ có thể là ước lượng tốt nhất nếu MLR.1 – MLR.5 thỏa
mãn; nếu các giả thiết này vi phạm, ví dụ phương sai thay đổi, sẽ
có ước lượng khác tốt hơn.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/phamtricao/ 12

You might also like