Download as pdf or txt
Download as pdf or txt
You are on page 1of 25

Chương 6 - Nhập môn Kinh tế lượng * 03.08.

2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội:


Một số vấn đề mở rộng

Chương 6

Wooldridge: Introductory Econometrics:


A Modern Approach, 5e

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

PHÂN TÍCH HỒI QUY BỘI:


MỘT SỐ VẤN ĐỀ MỞ RỘNG
6.1 Vấn đề đơn vị tính trong hồi quy OLS

• bwght : cân nặng của trẻ sơ sinh, đơn vị tính là ounce


cigs : số điếu thuốc mà người mẹ hút hàng ngày trong thời gian mang thai
faminc : thu nhập của gia đình, đơn vị nghìn đôla

Đơn vị đo mới:
• bwghtlbs = bwght/16 ; bwghtlbs là cân nặng của em bé với đơn vị pound
1 pound tương ứng 16 ounce
• packs = cigs/20 ; packs là số gói thuốc người mẹ hút trong một ngày
1 packs có 20 cigs

• fincdol = 1000 faminc ; fincdol là thu nhập của gia đình (usd)
faminc là thu nhập của gia đình (ngàn usd)

Tập tin bwght.RData

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 1
Chương 6 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.1 Vấn đề đơn vị tính trong hồi quy OLS

> hoiquy1 <- lm(bwght ~ cigs + faminc, data = bwght)

> summary(hoiquy1)

Call:
lm(formula = bwght ~ cigs + faminc, data = bwght)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 116.97413 1.04898 111.512 < 2e-16 ***
cigs -0.46341 0.09158 -5.060 4.75e-07 ***
faminc 0.09276 0.02919 3.178 0.00151 **
---
Multiple R-squared: 0.0298, Adjusted R-squared: 0.02
84
> nobs(hoiquy1)
[1] 1388
3

PHÂN TÍCH HỒI QUY BỘI:


MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.1 Vấn đề đơn vị tính trong hồi quy OLS

> hoiquy2 <- lm(bwghtlbs ~ packs + fincdol, data = bwght)
> summary(hoiquy2)

Call:
lm(formula = bwghtlbs ~ packs + fincdol, data = bwght)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 7.311e+00 6.556e-02 111.512 < 2e-16 ***
packs -5.793e-01 1.145e-01 -5.060 4.75e-07 ***
fincdol 5.798e-06 1.824e-06 3.178 0.00151 **
---
Multiple R-squared: 0.0298, Adjusted R-squared: 0.0284
> nobs(hoiquy2)
[1] 1388

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 2
Chương 6 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.1 Vấn đề đơn vị tính trong hồi quy OLS

> hoiquy3 <- lm(bwght ~ cigs + log(faminc), data = bwght)


> summary(hoiquy3)

Call:
lm(formula = bwght ~ cigs + log(faminc), data = bwght)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 113.99070 1.94392 58.640 < 2e-16 ***
cigs -0.46723 0.09144 -5.110 3.68e-07 ***
log(faminc) 1.85072 0.59489 3.111 0.0019 **
---
Multiple R-squared: 0.02951, Adjusted R-squared: 0.02811
> nobs(hoiquy3)
[1] 1388

PHÂN TÍCH HỒI QUY BỘI:


MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.1 Vấn đề đơn vị tính trong hồi quy OLS

> hoiquy4 <- lm(bwght ~ cigs + log(fincdol), data = bwght)


> summary(hoiquy4)

Call:
lm(formula = bwght ~ cigs + log(fincdol), data = bwght)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 101.20641 5.99489 16.882 < 2e-16 ***
cigs -0.46723 0.09144 -5.110 3.68e-07 ***
log(fincdol) 1.85072 0.59489 3.111 0.0019 **
---
Multiple R-squared: 0.02951, Adjusted R-squared: 0.02811
> nobs(hoiquy4)
[1] 1388

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 3
Chương 6 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.1 Vấn đề đơn vị tính trong hồi quy OLS

> hoiquy7 <- lm(bwght ~ packs + log(faminc), data = bwght)


> summary(hoiquy7)

Call:
lm(formula = bwght ~ packs + log(faminc), data = bwght)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 113.9907 1.9439 58.640 < 2e-16 ***
packs -9.3446 1.8288 -5.110 3.68e-07 ***
log(faminc) 1.8507 0.5949 3.111 0.0019 **
---
Residual standard error: 20.07 on 1385 degrees of freedom
Multiple R-squared: 0.02951, Adjusted R-squared: 0.02811
F-statistic: 21.06 on 2 and 1385 DF, p-value: 9.796e-10

> nobs(hoiquy7)
[1] 1388

PHÂN TÍCH HỒI QUY BỘI:


MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.1 Vấn đề đơn vị tính trong hồi quy OLS

> hoiquy8 <- lm(bwghtlbs ~ packs + log(fincdol), data = bwght)


> summary(hoiquy8)

Call:
lm(formula = bwghtlbs ~ packs + log(fincdol), data = bwght)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.32540 0.37468 16.882 < 2e-16 ***
packs -0.58403 0.11430 -5.110 3.68e-07 ***
log(fincdol) 0.11567 0.03718 3.111 0.0019 **
---
Residual standard error: 1.254 on 1385 degrees of freedom
Multiple R-squared: 0.02951, Adjusted R-squared: 0.02811
F-statistic: 21.06 on 2 and 1385 DF, p-value: 9.796e-10

> nobs(hoiquy8)
[1] 1388

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 4
Chương 6 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.1 Vấn đề đơn vị tính trong hồi quy OLS

> hoiquy5 <- lm(log(bwght) ~ packs + log(faminc), data = bwght)


> summary(hoiquy5)

Call:
lm(formula = log(bwght) ~ packs + log(faminc), data = bwght)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4.718594 0.018244 258.631 < 2e-16 ***
packs -0.081632 0.017164 -4.756 2.18e-06 ***
log(faminc) 0.016266 0.005583 2.913 0.00363 **
---
Multiple R-squared: 0.02576, Adjusted R-squared: 0.02435
> nobs(hoiquy5)
[1] 1388

PHÂN TÍCH HỒI QUY BỘI:


MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.1 Vấn đề đơn vị tính trong hồi quy OLS

> hoiquy6 <- lm(log(bwghtlbs) ~ packs + log(fincdol), data = bwght)


> summary(hoiquy6)

Call:
lm(formula = log(bwghtlbs) ~ packs + log(fincdol), data = bwght)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.833646 0.056265 32.590 < 2e-16 ***
packs -0.081632 0.017164 -4.756 2.18e-06 ***
log(fincdol) 0.016266 0.005583 2.913 0.00363 **
---
Multiple R-squared: 0.02576, Adjusted R-squared: 0.02435
> nobs(hoiquy6)
[1] 1388

10

10

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 5
Chương 6 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.1 Vấn đề đơn vị tính trong hồi quy OLS

Công thức
Hàm hồi quy mẫu theo đơn vị đo cũ

ŷ  ˆ0  ˆ1 x1  ˆ2 x2


Hàm hồi quy mẫu theo đơn vị đo mới

ŷ *  ˆ0*  ˆ1* x1*  ˆ2* x2*


Với y*  k0 y ; x1*  k1 x1 ; x2*  k2 x2
k0 ˆ ˆ * k0 ˆ
ˆ0*  k0 ˆ0 ; ˆ1*  1 ;  2   2
k1 k2 11

11

PHÂN TÍCH HỒI QUY BỘI:


MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.1 Vấn đề đơn vị tính trong hồi quy OLS

Nhận xét
* Biến gốc
Khi thay đổi đơn vị đo của biến phụ thuộc và các biến độc lập, ta thấy:
Không bị thay đổi: Cột t-Statistic, cột Prob, R-squared, F-statistic,
Prob(F-statistic)
Bị thay đổi: Cột Coefficient, cột Std. Error, S.E. of regression, Sum
squared resid

Các mục còn lại tự nghiên cứu tiếp.

* Biến có lấy log


• Log chỉ biến phụ thuộc
• Log chỉ biến độc lập
• Log cả biến phụ thuộc và biến độc lập

Tự rút ra nhận xét.


12

12

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 6
Chương 6 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


MỘT SỐ VẤN ĐỀ MỞ RỘNG
• Bàn thêm về dạng hàm logarit

Bài tập:

y: chi tiêu của gia đình (triệu đ)


x1: thu nhập của vợ (USD)
x2: số năm đi học của vợ (năm)
x3: thu nhập của chồng (triệu đ)

Các hệ số hồi quy (ở từng mô hình) sẽ thay đổi như thế nào nếu đơn vị của
các biến là:

y*: chi tiêu của gia đình (trăm ngàn đ)


x1* : thu nhập của vợ (trăm USD)
x2*: số năm đi học của vợ (tháng)
x3*: thu nhập của chồng (USD) ; 1 USD = 20 ngàn đ

13

13

PHÂN TÍCH HỒI QUY BỘI:


MỘT SỐ VẤN ĐỀ MỞ RỘNG
• Bàn thêm về dạng hàm logarit (bài tập tt)

Xét mô hình 1:
y   0  1 x1   2 x2   3 log( x3 )  u

Xét mô hình 2:
log( y )   0  1 x1   2 x2   3 x3  u

Xét mô hình 3:
log( y )   0  1 log( x1 )   2 x2   3 x3  u

14

14

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 7
Chương 6 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội:


Một số vấn đề mở rộng
6.2 Bàn thêm về dạng hàm hồi quy
Bàn thêm về dạng hàm logarit
Thuận lợi khi giải thích bằng tỷ lệ phần trăm/ hệ số co giãn
Hệ số góc của các biến lấy log là bất biến đối với thay đổi tỷ lệ
Lấy log thường loại bỏ / giảm nhẹ vấn đề các giá trị bất thường
Lấy log thường giúp bảo đảm tính chuẩn và phương sai không đổi

Các biến sử dụng đơn vị đo lường như năm thì không nên lấy log
Các biến sử dụng đơn vị đo lường tỷ lệ phần trăm cũng không nên lấy log
Log không được sử dụng nếu biến có giá trị 0 hoặc âm
Có khó khăn khi lấy toán tử ngược của log trong dự đoán
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

15

PHÂN TÍCH HỒI QUY BỘI:


MỘT SỐ VẤN ĐỀ MỞ RỘNG
Sự khác nhau giữa điểm phần trăm (percentage point) và
phần trăm (percent)

Điểm phần trăm là đơn vị đo khác biệt số học của hai trị
số phần trăm.
Ví dụ 1: Tỷ lệ sản xuất CN năm 2000 là 40%, năm 2001 là
44%.
Tỷ lệ sản xuất CN năm 2001 tăng so với 2000 là 4 điểm phần
44  40
trăm, nhưng là tăng  0,1  1 0 % .
40
Ví dụ 2: Năm 1980 có 50% dân số hút thuốc, năm 1990 có
40%.
Từ 1980 đến 1990, tỷ lệ hút thuốc giảm 10 điểm phần trăm,
50  40
nhưng là giảm  0, 2  20%
50
16

16

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 8
Chương 6 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


MỘT SỐ VẤN ĐỀ MỞ RỘNG
• Bàn thêm về dạng hàm logarit : Khi nào có thể xem 2.43 như 6.9 ?

%y  (100. 2 ) x2 2.43

giả sử β2^ >0

Cố định x1 , khi x2 tăng 1 đơn vị thì y tăng 100*β2^ (%)


Cách khác:
Cố định x1 , ta có:

Suy ra: 6.8

thì
6.9

Cố định x1 , khi x2 tăng 1 đơn vị thì y tăng 100*[exp(β2^)-1] (%)


17

17

Phân tích hồi quy bội:


Một số vấn đề mở rộng
Sử dụng dạng hàm bậc 2
Ví dụ: Phương trình lương Dạng hàm lõm

6.12

Số năm kinh nghiệm tăng lên 1 năm (từ 0


lên 1) thì lương tăng là 0,298 $,
Tác động biên Số năm kinh nghiệm tăng lên 1 năm (từ 1
lên 2) thì lương tăng là 0,298-2(0,0061)(1)
= 0,286 $ ...

6.10 6.11

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

18

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 9
Chương 6 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội:


Một số vấn đề mở rộng
Cực đại của lương tương ứng với số năm kinh nghiệm

6.13

Liệu điều này có nghĩa là số năm kinh nghiệm


nhiều hơn 24,4 năm trở nên tiêu cực?

Không nhất thiết là như vậy. Điều đó phụ thuộc


Không vào có bao nhiêu quan sát trong mẫu nằm bên
hợp lý phải điểm cực đại.

Trong ví dụ trên, có khoảng 28% các quan sát


nằm bên phải. Có thể có một vấn đề lỗi chỉ định
mô hình (ví dụ biến bị bỏ sót, dạng hàm sai...).

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

19

Phân tích hồi quy bội: Một số


vấn đề mở rộng Nitơ oxit trong không khí, khoảng cách từ
trung tâm việc làm, tỷ lệ sinh viên/giáo viên

Ví dụ 6.2: Ảnh hưởng của ô nhiễm tới giá nhà đất

Điều này có nghĩa rằng, ở một số ít các phòng,


nhiều phòng có liên quan với giá thấp hơn?

 log( price)
 0,545  2(0,062)rooms
rooms

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

20

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 10
Chương 6 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội:


Một số vấn đề mở rộng
Tính toán điểm cực tiểu
-54.5+12.4*5

Điểm cực tiểu:

Diện tích này có thể bỏ qua


vì nó liên quan đến chỉ có
1% các quan sát.

Gia tăng số phòng từ 5 lên 6 thì giá tăng:

= -54,5+12,4*5 = +7,5%
Không
Gia tăng số phòng từ 6 lên 7 thì giá tăng:
hợp lý
= -54,5+12,4*6 = +19,9%

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

21

Phân tích hồi quy bội:


Một số vấn đề mở rộng
Khả năng khác

6.15

6.16

Đa thức bậc cao hơn

cost = (β1 + 2β2 quantity + 3β3 quantity2).quantity


© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

22

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 11
Chương 6 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội:


Một số vấn đề mở rộng
Mô hình với các số hạng tương tác

price   0  1sqrft   2bdrms Số hạng tương tác

  3 sqrft.bdrms   4bthrms  u
price
  2   3 sqrft
Tác động của số phòng ngủ
phụ thuộc vào diện tích
bdrms
6.17

Việc giải thích các tham số khá phức tạp khi có tác động tương tác

Tác động của số phòng ngủ, nhưng ứng với diện tích là 0

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

23

Phân tích hồi quy bội:


Một số vấn đề mở rộng
Xác định lại tham số của tác động tương tác Trung bình tổng thể; có thể được
thay thế bởi trung bình mẫu

Tác động của x2 nếu tất cả các biến cố định tại giá trị trung bình

Lợi ích của việc xác định lại các tham số


Dễ dàng giải thích tất cả các tham số
Sai số chuẩn được tính cho các tác động riêng phần tại giá trị trung bình.
Nếu cần thiết, giá trị μ1 và μ2 có thể được thay thế bằng một giá trị khác
cần quan tâm
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

24

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 12
Chương 6 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội:


Một số vấn đề mở rộng
6.3 Bàn thêm về độ phù hợp và vấn đề lựa chọn biến độc lập
Nhận xét chung về R2
Một R2 cao không ngụ ý rằng có một quan hệ nhân quả
Một R2 thấp không loại trừ tính hiệu quả của các tác động riêng phần
R2 hiệu chỉnh (Adjusted R-squared):
R2 thông thường được định nghĩa là gì?

là 1 ước lượng của

6.20
R2 tổng thể

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

25

Phân tích hồi quy bội:


Một số vấn đề mở rộng
R2 hiệu chỉnh (tt) Bậc tự do đúng của tử số và mẫu số là

Một ước lượng tốt hơn có xét đến bậc tự do sẽ là

6.21

R2 hiệu chỉnh có tính đến hệ quả của việc thêm các biến độc lập mới
R2 hiệu chỉnh tăng nếu và chỉ nếu thống kê t (F) của một (một số ) biến độc lập
mới được thêm vào có trị tuyệt đối lớn hơn 1
Mối liên hệ giữa R2 và R2 hiệu chỉnh
6.22
R2 hiệu chỉnh có thể lấy giá trị âm
Ví dụ:
R 2  0,1, n  51, k  10  R 2  0,125  0
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

26

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 13
Chương 6 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


MỘT SỐ VẤN ĐỀ MỞ RỘNG
Tóm lại:
 SSR là hàm giảm theo số biến độc lập trong mô hình
SST không phụ thuộc vào số biến độc lập trong mô hình
 R2 là hàm tăng theo số biến độc lập trong mô hình
R 2 không là hàm tăng theo số biến độc lập trong mô hình
 Nếu số tham số (k+1) > 1 thì R 2  R 2  1
Nếu số tham số càng lớn thì R 2 càng nhỏ hơn R2
Ta cần xem xét có nên đánh đổi giữa việc thêm biến độc lập vào mô
hình để R2 tăng và những bất lợi có thể có khi thêm biến độc lập.

27

27

Phân tích hồi quy bội:


Một số vấn đề mở rộng
Sử dụng R2 hiệu chỉnh để chọn lựa giữa các mô hình không lồng nhau
Các mô hình được gọi là không lồng nhau nếu cái này không phải là trường
hợp đặc biệt của cái kia
6.23

6.24

Việc so sánh R2 của hai mô hình sẽ là không công bằng với mô hình đầu
tiên bởi vì mô hình đầu tiên chứa ít tham số hơn
Trong ví dụ trên, ngay cả sau khi đã điều chỉnh cho sự khác biệt về bậc tự
do (dùng R2 hiệu chỉnh), mô hình bậc hai vẫn được ưa thích hơn

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

28

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 14
Chương 6 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội:


Một số vấn đề mở rộng
So sánh các mô hình với biến phụ thuộc có dạng khác nhau
R2 hoặc R2 hiệu chỉnh không được sử dụng để so sánh các mô hình
mà chúng có dạng hàm của biến phụ thuộc khác nhau
Ví dụ 6.4: Mức đãi ngộ đối với CEO và hiệu quả doanh nghiệp

6.25
log(salary) biến
thiên ít hơn so
với salary (xem
TSS)

6.26

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

29

PHÂN TÍCH HỒI QUY BỘI:


MỘT SỐ VẤN ĐỀ MỞ RỘNG
Lựa chọn giữa các mô hình:
Có các tiêu chuẩn lựa chọn mô hình trong R như sau:
• Các tiêu chuẩn sau càng lớn càng tốt
– R2 hiệu chỉnh
• Các tiêu chuẩn sau càng nhỏ càng tốt
– Akaike information criterion (AIC)
– Bayesian information criterion (BIC)
– Cp của Mallows (Cp)
• Điều kiện sử dụng các tiêu chuẩn này:
– Cùng dạng hàm của biến phụ thuộc
– Cùng cỡ mẫu

30

30

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 15
Chương 6 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


MỘT SỐ VẤN ĐỀ MỞ RỘNG
• Lựa chọn giữa các mô hình:
• Tiêu chuẩn AIC và BIC
> load("E:/# Slide Viet 2019-01/Chuong 6/bwght.RData")
> bwght_data <- na.omit(data)
> names(bwght_data)
[1] "faminc" "cigtax" "cigprice" "bwght" "fatheduc" "motheduc" "parity"
"male" "white"
[10] "cigs" "lbwght" "bwghtlbs" "packs" "lfaminc"
> bwght_data1 <- bwght[, -c(11:14)]
> names(bwght_data1)
[1] "faminc" "cigtax" "cigprice" "bwght" "fatheduc" "motheduc" "parity"
"male" "white"
[10] "cigs"
> attach(bwght_data1)
The following object is masked _by_ .GlobalEnv:

bwght
> rest_model <- lm(bwght ~faminc+cigtax, data=bwght_data1)
> AIC(rest_model)
[1] 10529.48
> BIC(rest_model)
[1] 10549.81

31

31

PHÂN TÍCH HỒI QUY BỘI:


MỘT SỐ VẤN ĐỀ MỞ RỘNG
• Lựa chọn giữa các mô hình:
• Tiêu chuẩn Cp (cách 1)

> install.packages("olsrr")
> library(olsrr)

Attaching package: ‘olsrr’

The following object is masked from ‘package:datasets’:

rivers

> full_modelfull <- lm(bwght ~ faminc+cigtax+cigprice+fatheduc,


data=bwght_data1)
> rest_model <-lm(bwght ~faminc+cigtax, data=bwght_data1)
> ols_mallows_cp(rest_model, full_modelfull)
[1] 4.079621

rest_model là mô hình lồng trong mô hình full_modelfull


32

32

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 16
Chương 6 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


MỘT SỐ VẤN ĐỀ MỞ RỘNG
• Lựa chọn giữa các mô hình:
• Tiêu chuẩn Cp (cách 1)
• > full_model1 <- lm(bwght ~ ., data = bwght_data1)
> rest_model <- lm(bwght ~ faminc+cigtax, data = bwght_data1)
> ols_mallows_cp(rest_model, full_model1)
[1] 54.61653

Minh họa
Tuyến tính Tuyến Hồi quy qua Dạng hàm Chọn mô hình
tính-log gốc tọa độ bậc 2
AIC 0,5 0,51 0,63 0,72 Tuyến tính
BIC 0,47 0,46 0,56 0,78 Tuyến tính-log
Cp 2,1 1,9 1,7 1,2 Dạng hàm bậc 2
R2 hiệu 0,73 0,68 0,72 0,85 Dạng hàm bậc 2
chỉnh

33

33

Phân tích hồi quy bội:


Một số vấn đề mở rộng
Kiểm soát việc có quá nhiều yếu tố trong phân tích hồi quy
Trong một số trường hợp, một số biến không nên kiểm soát trong mô hình

Trong hồi quy của tử vong do giao thông (fatalities) theo thuế bia của bang
(tax) (và các yếu tố khác như miles – tổng số dặm đã lái xe , percmale – phần
trăm nam giới trong dân số,...) không nên kiểm soát trực tiếp (đưa biến vào mô
hình) lượng bia tiêu thụ trên đầu người (beercons) giữa các địa phương
fatalities = 0+ 1 tax+ 2 miles+ 3 percmale +…
Trong hồi quy của chi phí y tế gia đình theo việc sử dụng thuốc trừ sâu của
nông dân không nên kiểm soát số lần đi khám bác sĩ

Chi phí sức khỏe bao gồm số lần khám bệnh, và chúng ta chỉ muốn đo lường toàn
bộ tác động của việc sử dụng thuốc trừ sâu lên chi phí y tế gia đình

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

34

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 17
Chương 6 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội:


Một số vấn đề mở rộng
Kiểm soát việc có quá nhiều yếu tố trong phân tích hồi quy
Các hồi quy khác nhau có thể phục vụ các mục đích khác nhau

Trong hồi quy giá nhà - log(price) theo các đặc điểm của ngôi nhà như
log(lotsize), log(sqrft), bdrms ... chúng ta cần thêm biến định giá – log(assess)
của giá nhà nếu mục đích của hồi quy là nghiên cứu sự hợp lý của của việc định
giá; nếu không thì ta sẽ không thêm biến định giá vào

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

35

Phân tích hồi quy bội:


Một số vấn đề mở rộng
Thêm biến độc lập để giảm phương sai của nhiễu

Việc thêm biến độc lập có thể làm trầm trọng thêm vấn đề đa cộng tuyến

Mặt khác, việc thêm biến độc lập làm giảm phương sai của nhiễu

Các biến không tương quan với biến độc lập đã có nên được thêm vào bởi vì chúng

làm giảm phương sai nhiễu mà không làm tăng tính đa cộng tuyến

Tuy nhiên, các biến không tương quan như vậy rất khó tìm thấy

Ví dụ: lượng bia tiêu thụ của mỗi cá nhân và giá bia

Việc bao gồm các đặc điểm cá nhân trong hồi quy lượng bia tiêu thụ theo giá bia

dẫn đến ước lượng hệ số co giãn của lượng cầu bia theo giá bia “chính xác” hơn

Giả định hợp lý là đặc điểm cá nhân (tuổi, số năm đi học,…) không tương quan với giá bia

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

36

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 18
Chương 6 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.4 Phân tích về dự đoán và sai số dự đoán
Dự đoán điểm cho giá trị trung bình và giá trị cá biệt (cụ thể)

6.27

Giả sử c1, c2,…, ck là giá trị cụ thể của x1, x2,…, xk


Dự đoán (ước lượng) điểm của giá trị trung bình E(y/x1=c1,…,xk=ck)
hay giá trị cá biệt y0 là:

y0 ^ = 6.29

37

37

PHÂN TÍCH HỒI QUY BỘI:


MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.4 Phân tích về dự đoán và sai số dự đoán
• VD 6.5: Khoảng tin cậy dự đoán điểm trung bình GPA đại học

6.32

Dự đoán trung bình GPA đại học khi sat= 1200, hsperc= 30, hsize= 5?
Dự đoán điểm:
0^= y0^= 1.493 + 0.00149*1200 - 0.01386*30 - 0.06088*5 + 0.00546*52 = 2.70

hsperc: phân vị trung học, từ trên xuống (xếp hạng của sv tại trường trung học)
hsize: quy mô lớp tốt nghiệp 38

38

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 19
Chương 6 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.4 Phân tích về dự đoán và sai số dự đoán
Dự đoán khoảng cho giá trị trung bình

Thay vào hồi quy trên

Ta được: 6.30

Tức là ta chạy hồi quy y theo hệ số chặn, (x1-c1), (x2-c2),…, (xk-ck) 6.31

Giá trị dự đoán và sai số chuẩn của 0^ dễ dàng tìm được thông qua hệ
số chặn của hàm hồi quy (6.31)
Khoảng tin cậy dự đoán 1- của giá trị trung bình là:
0^  t/2(n-k-1)*se(0^)
39

39

PHÂN TÍCH HỒI QUY BỘI:


MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.4 Phân tích về dự đoán và sai số dự đoán
Đặt sat0= sat-1200, hsperc0= hsperc-30, hsize0= hsize-5, hsizesq0= hsize2-25

Khoảng tin cậy dự đoán 95% cho điểm trung bình GPA đại học là:
2.70  1.96*0.02 hay (2.66 ; 2.74)

40

40

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 20
Chương 6 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.4 Phân tích về dự đoán và sai số dự đoán
Tập tin gpa2.wf1

> hoiquy <- lm(colgpa ~ sat + hsperc + hsize + I(hsize^2), data = gpa2)
> summary(hoiquy)
Call:
lm(formula = colgpa ~ sat + hsperc + hsize + I(hsize^2), data = gpa2)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.493e+00 7.534e-02 19.812 < 2e-16 ***
sat 1.492e-03 6.521e-05 22.886 < 2e-16 ***
hsperc -1.386e-02 5.610e-04 -24.698 < 2e-16 ***
hsize -6.088e-02 1.650e-02 -3.690 0.000228 ***
I(hsize^2) 5.460e-03 2.270e-03 2.406 0.016191 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.5599 on 4132 degrees of freedom


Multiple R-squared: 0.2781, Adjusted R-squared: 0.2774
> nobs(hoiquy)
[1] 4137

41

41

PHÂN TÍCH HỒI QUY BỘI:


MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.4 Phân tích về dự đoán và sai số dự đoán
Tập tin gpa2.wf1
> # hoi quy du bao
> hoiquy1 <- lm(colgpa ~ I(sat-1200) + I(hsperc-30) + I(hsize-5)
+ I(hsize^2-25), data = gpa2)
> summary(hoiquy1)
Call:
lm(formula = colgpa ~ I(sat - 1200) + I(hsperc - 30)
+ I(hsize - 5) + I(hsize^2 - 25), data = gpa2)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.700e+00 1.988e-02 135.833 < 2e-16 ***
I(sat - 1200) 1.492e-03 6.521e-05 22.886 < 2e-16 ***
I(hsperc - 30) -1.386e-02 5.610e-04 -24.698 < 2e-16 ***
I(hsize - 5) -6.088e-02 1.650e-02 -3.690 0.000228 ***
I(hsize^2 - 25) 5.460e-03 2.270e-03 2.406 0.016191 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.5599 on 4132 degrees of freedom


Multiple R-squared: 0.2781, Adjusted R-squared: 0.2774
> nobs(hoiquy1)
[1] 4137

42

42

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 21
Chương 6 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.4 Phân tích về dự đoán và sai số dự đoán

Khoảng tin cậy dự đoán của giá trị cá biệt y0

6.33

Sai số dự đoán là:

6.34

Phương sai của sai số dự đoán:

6.35

Sai số chuẩn:
6.36

Khoảng tin cậy dự đoán 1- của dự đoán giá trị cá biệt y0 là:
y0^  t/2(n-k-1)*se(e0^) 6.37
43

43

PHÂN TÍCH HỒI QUY BỘI:


MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.4 Phân tích về dự đoán và sai số dự đoán
• VD 6.5 Khoảng tin cậy dự đoán điểm cá biệt GPA đại học

Ta có: ;

= 0.5604

Khoảng tin cậy dự đoán 95% của điểm GPA từng học sinh cụ thể :
2.70  1.96*0.5604 hay (1.6016 đến 3.7984)

44

44

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 22
Chương 6 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


MỘT SỐ VẤN ĐỀ MỞ RỘNG
• 6.4 Phân tích về dự đoán và sai số dự đoán
Tập tin gpa2.wf1

> # du bao diem


> cvalues <- data.frame(sat=1200, hsperc=30, hsize=5)
> predict(hoiquy,cvalues)
1
2.700075

> # du bao khoang cho gia tri trung binh


> predict(hoiquy,cvalues, interval = "confidence", level = 0.95)
fit lwr upr
1 2.700075 2.661104 2.739047

> # du bao khoang cho gia tri ca biet


> predict(hoiquy,cvalues, interval = "prediction", level = 0.95)
fit lwr upr
1 2.700075 1.601749 3.798402

45

45

Phân tích hồi quy bội:


Một số vấn đề mở rộng
Dự đoán y khi biến phụ thuộc là log(y)
6.38

* yˆ

 exp(log( y )). exp(ˆ 2 / 2) 6.40 Cần điều kiện u có phân phối chuẩn N(0,2)

* Dưới giả định là độc lập với : u không có phân phối chuẩn

 1 n 
yˆ  exp(log( y )).   exp(uˆi )  6.42-6.43
 n i 1 
Dự đoán của y
Không cần điều kiện u có phân phối chuẩn

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

46

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 23
Chương 6 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội:


Một số vấn đề mở rộng
So sánh R2 của mô hình có log và không có log ở biến phụ thuộc

VD 6.7 và 6.8

6.47

Log(mktval)

6.45

Đây là các R2 cho dự đoán của biến salary không


có log (mặc dù hồi quy thứ hai nguyên gốc là
log(salary). Bây giờ có thể so sánh trực tiếp hai R2.

R2~ = r(y, y^)2, với y^ tính theo công thức (6.40) hoặc (6.42-6.43)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

47

PHÂN TÍCH HỒI QUY BỘI:


MỘT SỐ VẤN ĐỀ MỞ RỘNG
Chọn lựa dạng hàm y hoặc lny theo BoxCox
Y = a+bX
lnY = a+bX
Cỡ mẫu là n
1) Tính trung bình hình học
Y G  n Y1  ...  Yn

2) Tính Y * Y
Y
3) Chạy hồi quy Y* = a+bX  SSRY
Chạy hồi quy lnY* = c+dX  SSRlnY
n
4) Tính BoxCox  .ln(SSRlớn/SSRnhỏ)
2
5) H0: 2 mô hình tốt như nhau ; H1: H0 sai
Quy tắc bác bỏ:
BoxCox  2 (1) : bác bỏ H0
Mô hình nào có SSR nhỏ hơn sẽ tốt hơn
48

48

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 24
Chương 6 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Môøi gheù thaêm trang web:


49

 https://sites.google.com/a/ueh.edu.vn/phamtricao/
 https://sites.google.com/site/phamtricao/

49

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 25

You might also like