Chuong 09

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 23

Chương 9 - Nhập môn Kinh tế lượng * 03.08.

2021
Jeffrey M. Wooldridge

MỘT SỐ VẤN ĐỀ MỞ RỘNG


VỀ DẠNG HÀM VÀ DỮ LIỆU

Chương 9

Wooldridge: Introductory Econometrics:


A Modern Approach, 5e

© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội:


Vấn đề dạng hàm và dữ liệu
9.1 Vấn đề xác định sai dạng hàm
Chúng ta có thể kiểm định xem liệu mô hình đang xét có thiếu bình phương hay bậc cao hơn
của một biến độc lập hay không bằng cách thêm các số hạng này vào mô hình và kiểm định
xem thành phần thêm vào có ý nghĩa thống kê không.
Ngoài ra, có thể sử dụng kiểm định chung về sai dạng hàm như RESET của Ramsey.

Kiểm định sai dạng hàm (RESET)


Ý tưởng của RESET là thêm bình phương và bậc cao hơn của giá trị ước lượng của biến phụ
thuộc vào hàm hồi quy (giống với kiểm định White rút gọn)

y   0  1 x1  ...   k xk  u 9.2

y   0  1 x1  ...   k xk  1 yˆ 2   2 yˆ 3  saiso 9.3

Kiểm định xem có nên loại bỏ thành phần này hay không. Nếu ta không thể loại bỏ chúng, nghĩa là mô
hình đã thiếu bậc cao của biến độc lập và biến tương tác, hay nói cách khác, mô hình sai dạng hàm.

H0: 1=0, 2=0  H0: mô hình (9.2) có dạng hàm đúng


© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 1
Chương 9 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội:


Vấn đề dạng hàm và dữ liệu
Ví dụ 9.2: Hàm hồi quy giá nhà

9.4
Bằng chứng cho thấy
có sai dạng hàm

Dạng hàm có log:

9.5

Ít bằng chứng cho thấy


có sai dạng hàm

Thảo luận
Chúng ta có thể thêm vào các bậc cao hơn của ŷ , hàm ý là thêm vào mô hình các
biến tương tác phức tạp và bậc cao hơn của các biến độc lập.
RESET cung cấp ít thông tin về nguyên nhân sai dạng hàm.
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

PHÂN TÍCH HỒI QUY BỘI:


VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Ví dụ 9.2: Hàm hồi quy giá nhà
• Tập tin hprice1.wf1

> summary(hoiquy1)

Call:
lm(formula = price ~ lotsize + sqrft + bdrms, data = hprice1)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -2.177e+01 2.948e+01 -0.739 0.46221
lotsize 2.068e-03 6.421e-04 3.220 0.00182 **
sqrft 1.228e-01 1.324e-02 9.275 1.66e-14 ***
bdrms 1.385e+01 9.010e+00 1.537 0.12795
---
Residual standard error: 59.83 on 84 degrees of freedom
Multiple R-squared: 0.6724, Adjusted R-squared: 0.6607

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 2
Chương 9 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Ví dụ 9.2: Hàm hồi quy giá nhà
> library(lmtest)
> resettest(hoiquy1)
RESET test

data: hoiquy1
RESET = 4.6682, df1 = 2, df2 = 82, p-value = 0.01202

> resettest(hoiquy1 , power=2:3, type="fitted")


RESET test

data: hoiquy1
RESET = 4.6682, df1 = 2, df2 = 82, p-value = 0.01202

> resettest(hoiquy1 , power=2:5, type="fitted")


RESET test

data: hoiquy1
RESET = 3.2259, df1 = 4, df2 = 80, p-value = 0.01656

H0: Mô hình (9.4) có dạng hàm đúng . Với = 3%


p-value = 0.0120 (0.01656) < 0.03 =: bác bỏ H0
5

PHÂN TÍCH HỒI QUY BỘI:


VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU

Ví dụ 9.2: Hàm hồi quy giá nhà

• Dạng hàm có log:


> summary(hoiquy2)

Call:
lm(formula = log(price) ~ log(lotsize) + log(sqrft) + bdrms,
data = hprice1)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -1.29704 0.65128 -1.992 0.0497 *
log(lotsize) 0.16797 0.03828 4.388 3.31e-05 ***
log(sqrft) 0.70023 0.09287 7.540 5.01e-11 ***
bdrms 0.03696 0.02753 1.342 0.1831
---
Residual standard error: 0.1846 on 84 degrees of freedom
Multiple R-squared: 0.643, Adjusted R-squared: 0.6302

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 3
Chương 9 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Ví dụ 9.2: Hàm hồi quy giá nhà

> library(lmtest)
> resettest(hoiquy2)

RESET test

data: hoiquy2
RESET = 2.565, df1 = 2, df2 = 82, p-value = 0.08308

H0: Mô hình (9.5) có dạng hàm đúng . Với = 6%


p-value = 0.0831 > 0.06 = : chấp nhận H0

PHÂN TÍCH HỒI QUY BỘI:


VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
• Ví dụ 9.1: Mô hình kinh tế về vấn đề tội phạm
• Tập tin crime1.wf1
> summary(hoiquy1)
Call:
lm(formula = narr86 ~ pcnv + avgsen + tottime + ptime86 + qemp86
+ inc86 + black + hispan, data = crime1)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.5686855 0.0360461 15.777 < 2e-16 ***
pcnv -0.1332344 0.0403502 -3.302 0.000973 ***
avgsen -0.0113177 0.0122401 -0.925 0.355233
tottime 0.0120224 0.0094352 1.274 0.202698
ptime86 -0.0408417 0.0088120 -4.635 3.74e-06 ***
qemp86 -0.0505398 0.0144397 -3.500 0.000473 ***
inc86 -0.0014887 0.0003406 -4.370 1.29e-05 ***
black 0.3265035 0.0454156 7.189 8.38e-13 ***
hispan 0.1939144 0.0397113 4.883 1.10e-06 ***
---
Residual standard error: 0.8286 on 2716 degrees of freedom
Multiple R-squared: 0.07232, Adjusted R-squared: 0.06959

Biến QEMP86 là 1 biến rời rạc chỉ nhận 5 giá trị.


8

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 4
Chương 9 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
• Ví dụ 9.1: Mô hình kinh tế về vấn đề tội phạm

> resettest(hoiquy1)
RESET test

data: hoiquy1
RESET = 6.2607, df1 = 2, df2 = 2714, p-value = 0.001938

H0: Mô hình có dạng hàm đúng


H1: Mô hình có dạng hàm sai
p-value = 0,001938 < 0,05 : bác bỏ H0
Vậy mô hình có dạng hàm sai

PHÂN TÍCH HỒI QUY BỘI:


VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
• Ví dụ 9.1: Mô hình kinh tế về vấn đề tội phạm

> summary(hoiquy2)
Call:
lm(formula = narr86 ~ pcnv + avgsen + tottime + ptime86 + qemp86 + inc86
+ black + hispan + I(pcnv^2) + I(ptime86^2) + I(inc86^2), data = crime1)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.046e-01 3.684e-02 13.699 < 2e-16 ***
pcnv 5.525e-01 1.542e-01 3.582 0.000347 ***
avgsen -1.702e-02 1.205e-02 -1.412 0.158028
tottime 1.195e-02 9.282e-03 1.288 0.197924
ptime86 2.874e-01 4.426e-02 6.494 9.88e-11 ***
qemp86 -1.409e-02 1.736e-02 -0.812 0.416970
inc86 -3.415e-03 8.037e-04 -4.249 2.22e-05 ***
black 2.923e-01 4.483e-02 6.520 8.35e-11 ***
hispan 1.636e-01 3.945e-02 4.147 3.47e-05 ***
I(pcnv^2) -7.302e-01 1.561e-01 -4.677 3.05e-06 ***
I(ptime86^2) -2.961e-02 3.863e-03 -7.664 2.50e-14 ***
I(inc86^2) 7.186e-06 2.556e-06 2.811 0.004969 **
---
Residual standard error: 0.8151 on 2713 degrees of freedom
Multiple R-squared: 0.1035, Adjusted R-squared: 0.09982

10

10

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 5
Chương 9 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
• Ví dụ 9.1: Mô hình kinh tế về vấn đề tội phạm
> # Kiem dinh F
> library(car)
> linearHypothesis(hoiquy2, c("I(pcnv^2)=0", "I(ptime86^2)=0",
"I(inc86^2)=0"))
Linear hypothesis test

Hypothesis:
I(pcnv^2) = 0
I(ptime86^2) = 0
I(inc86^2) = 0

Model 1: restricted model


Model 2: narr86 ~ pcnv + avgsen + tottime + ptime86 + qemp86 + inc86
+ black + hispan + I(pcnv^2) + I(ptime86^2) + I(inc86^2)

Res.Df RSS Df Sum of Sq F Pr(>F)


1 2716 1865.0
2 2713 1802.4 3 62.589 31.404 < 2.2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

p-value < 2,2*10-16 < 0,05 : bác bỏ H0


Vậy nên chọn mô hình 2. 11

11

Phân tích hồi quy bội:


Vấn đề dạng hàm và dữ liệu
Kiểm định đối với mô hình không lồng nhau, x hay log(x)
Dạng hàm nào sẽ
phù hợp hơn?
Mô hình 1: 9.6

Mô hình 2: 9.7
Xây dựng một mô hình hỗn hợp và mỗi mô hình ban đầu là trường hợp đặc biệt
của mô hình hỗn hợp và kiểm định:

y   0   1 x1   2 x2   3 log( x1 )   4 log( x2 )  u 9.8

H0: 1=0, 2=0 cho mô hình 9.7

H0: 3=0, 4=0 cho mô hình 9.6


Thảo luận
Luôn có thể thực hiện; tuy nhiên, không có mô hình chiếm ưu thế rõ ràng.
Không thể sử dụng nếu các mô hình có biến phụ thuộc có dạng hàm khác nhau.
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

12

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 6
Chương 9 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Ví dụ 9.2: Hàm hồi quy giá nhà

• Tập tin hprice1.wf1

> summary(hoiquy)

Call:
lm(formula = price ~ lotsize + sqrft + log(lotsize) + log(sqrft),
data = hprice1)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.404e+03 9.707e+02 1.446 0.151905
lotsize -4.931e-04 1.020e-03 -0.483 0.630273
sqrft 2.475e-01 6.369e-02 3.886 0.000204 ***
log(lotsize) 6.022e+01 2.004e+01 3.004 0.003518 **
log(sqrft) -2.826e+02 1.405e+02 -2.011 0.047556 *
---
Residual standard error: 56.31 on 83 degrees of freedom
Multiple R-squared: 0.7133, Adjusted R-squared: 0.6995

13

13

PHÂN TÍCH HỒI QUY BỘI:


VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Ví dụ 9.2: Hàm hồi quy giá nhà
> # Kiem dinh F
> library(car)
> linearHypothesis(hoiquy, c("lotsize=0", "sqrft=0"))

Linear hypothesis test

Hypothesis:
lotsize = 0
sqrft = 0

Model 1: restricted model


Model 2: price ~ lotsize + sqrft + log(lotsize) + log(sqrft)

Res.Df RSS Df Sum of Sq F Pr(>F)


1 85 312570
2 83 263156 2 49415 7.7927 0.0007916 ***

p-value = 0.0008 < 0.05: bác bỏ H0: 1=0, 2=0


Mô hình (9.7) không chiếm ưu thế hơn (9.6)

14

14

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 7
Chương 9 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Ví dụ 9.2: Hàm hồi quy giá nhà
> # Kiem dinh F
> library(car)
> linearHypothesis(hoiquy, c("log(lotsize)=0", "log(sqrft)=0"))

Linear hypothesis test

Hypothesis:
log(lotsize) = 0
log(sqrft) = 0

Model 1: restricted model


Model 2: price ~ lotsize + sqrft + log(lotsize) + log(sqrft)

Res.Df RSS Df Sum of Sq F Pr(>F)


1 85 309186
2 83 263156 2 46030 7.2591 0.001244 **

p-value = 0.0012 < 0.05: bác bỏ H0: 3=0, 4=0


Mô hình (9.6) không chiếm ưu thế hơn (9.7)

15

15

PHÂN TÍCH HỒI QUY BỘI:


VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Ví dụ 9.2: Hàm hồi quy giá nhà

> # dung encomptest


> hoiquy1 <- lm(price ~ lotsize + sqrft, data = hprice1)
> hoiquy2 <- lm(price ~ log(lotsize) + log(sqrft), data = hprice1)
> library(lmtest)
> encomptest(hoiquy1, hoiquy2, data = hprice1)
Encompassing test

Model 1: price ~ lotsize + sqrft


Model 2: price ~ log(lotsize) + log(sqrft)
Model E: price ~ lotsize + sqrft + log(lotsize) + log(sqrft)
Res.Df Df F Pr(>F)
M1 vs. ME 83 -2 7.2591 0.0012437 **
M2 vs. ME 83 -2 7.7927 0.0007916 ***

16

16

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 8
Chương 9 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
• Cách làm này chỉ cho ra kết quả tốt khi 1 giả thiết bị bác bỏ và 1 giả
thiết được chấp nhận.
• Có thể dùng kiểm định Davidson-MacKinnon, trang 350.

17

17

Phân tích hồi quy bội:


Vấn đề dạng hàm và dữ liệu
9.2 Sử dụng biến đại diện cho các biến giải thích không quan sát được

Ví dụ 9.3: Bỏ sót biến năng lực trong mô hình tiền lương


Thay bằng biến đại diện
9.9
Thông thường, ước lượng của suất sinh lợi giáo dục và kinh nghiệm thường bị chệch bởi vì mô hình
có thể bỏ sót biến năng lực không quan sát được.
Ý tưởng: tìm một biến đại diện cho năng lực, có thể kiểm soát và thể hiện được năng lực khác nhau
giữa các cá nhân, khi đó hệ số hồi quy của các biến khác không còn chệch. Một trong những biến
đại diện cho năng lực là chỉ số IQ hoặc kết quả của các bài kiểm tra tương tự.

Cách sử dụng biến đại diện trong mô hình:

9.10
Biến bỏ sót, chẳng hạn: năng lực
9.11
Hồi quy biến bỏ sót theo biến đại diện của nó (x3 đại diện cho x3*)
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

18

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 9
Chương 9 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội:


Vấn đề dạng hàm và dữ liệu
Giả thiết đối với biến đại diện
Biến đại diện “chỉ là đại diện“ cho biến bị bỏ sót, nó không thuộc vào hàm hồi
quy tổng thể, nghĩa là, nó không tương quan với nhiễu.

Nếu nhiễu và biến đại diện có tương quan, biến đại


diện cần có mặt trong mô hình hồi quy tổng thể

Biến đại diện phải đại diện “tốt“ cho biến bị bỏ sót, nghĩa là các biến khác thêm
vào không giúp gì trong dự đoán biến bị bỏ sót.
9.13
Nếu điều này không thỏa,
thì x1 và x2 cần được thêm
vào mô hình hồi quy của
biến bị bỏ sót.

© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

19

Phân tích hồi quy bội:


Vấn đề dạng hàm và dữ liệu
Khi thỏa các giả định trên, biến đại diện được sử dụng như sau:

Trong mô hình hồi quy này, sai số ngẫu nhiên e= u+β3v3 không tương quan với tất cả biến giải
thích. Khi đó, hệ số hồi quy sẽ được ước lượng đúng bằng OLS. Hệ số của biến x1 và x2 sẽ xác
định đúng. Hệ số của biến đại diện trong nhiều trường hợp cũng được quan tâm (nó là bội số
của hệ số đứng trước biến bị bỏ sót).

Thảo luận về giả thiết biến đại diện trong hàm tiền lương
Giả thiết 1: Chỉ số IQ phải hoàn toàn không tác động trực tiếp đến tiền lương; quan trọng
là một cá nhân chứng minh năng lực trong công việc như thế nào.

Giả thiết 2: Hầu hết sự biến động của biến năng lực có thể được giải thích bởi sự thay đổi
trong chỉ số IQ, chỉ có một số ít được giải thích bởi học vấn và kinh nghiệm.

© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

20

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 10
Chương 9 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội:


Vấn đề dạng hàm và dữ liệu
Ví dụ 9.3: IQ là biến đại diện cho năng lực abil

Giống với kỳ vọng, suất sinh lợi giáo


dục giảm nếu IQ được đưa vào mô
hình để làm đại diện cho biến năng lực
không quan sát được.

Hệ số hồi quy đứng trước biến IQ cho


biết sự khác nhau trong năng lực giữa
các cá nhân có ý nghĩa quan trọng đến
tiền lương (ví dụ, mức chênh lệnh 15
điểm IQ dẫn đến mức chênh lên 5,4
điểm phần trăm trong tiền lương).

Ngay cả khi chỉ số IQ không hoàn toàn


giải thích sự thay đổi do năng lực, việc
thêm nó vào mô hình ít nhất làm giảm
tính chệch của suất sinh lợi giáo dục.

Tương tác giữa năng lực và học vấn


Có thể có đa cộng tuyến cao giữa IQ và educ không có ý nghĩa.
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

21

PHÂN TÍCH HỒI QUY BỘI:


VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Ví dụ 9.3: IQ là biến đại diện cho năng lực abil
• Tập tin wage2.wf1

> summary(hoiquy1)

Call:
lm(formula = log(wage) ~ educ + exper + tenure + married + south
+ urban + black, data = wage2)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.395497 0.113225 47.653 < 2e-16 ***
educ 0.065431 0.006250 10.468 < 2e-16 ***
exper 0.014043 0.003185 4.409 1.16e-05 ***
tenure 0.011747 0.002453 4.789 1.95e-06 ***
married 0.199417 0.039050 5.107 3.98e-07 ***
south -0.090904 0.026249 -3.463 0.000558 ***
urban 0.183912 0.026958 6.822 1.62e-11 ***
black -0.188350 0.037667 -5.000 6.84e-07 ***
---
Residual standard error: 0.3655 on 927 degrees of freedom
Multiple R-squared: 0.2526, Adjusted R-squared: 0.2469

22

22

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 11
Chương 9 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Ví dụ 9.3: IQ là biến đại diện cho năng lực abil
> summary(hoiquy2)

Call:
lm(formula = log(wage) ~ educ + exper + tenure + married + south
+ urban + black + IQ, data = wage2)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.1764391 0.1280006 40.441 < 2e-16 ***
educ 0.0544106 0.0069285 7.853 1.12e-14 ***
exper 0.0141459 0.0031651 4.469 8.82e-06 ***
tenure 0.0113951 0.0024394 4.671 3.44e-06 ***
married 0.1997644 0.0388025 5.148 3.21e-07 ***
south -0.0801695 0.0262529 -3.054 0.002325 **
urban 0.1819463 0.0267929 6.791 1.99e-11 ***
black -0.1431253 0.0394925 -3.624 0.000306 ***
IQ 0.0035591 0.0009918 3.589 0.000350 ***
---
Residual standard error: 0.3632 on 926 degrees of freedom
Multiple R-squared: 0.2628, Adjusted R-squared: 0.2564

23

23

PHÂN TÍCH HỒI QUY BỘI:


VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Ví dụ 9.3: IQ là biến đại diện cho năng lực abil
> summary(hoiquy3)

Call:
lm(formula = log(wage) ~ educ + exper + tenure + married + south
+ urban + black + IQ + educ:IQ, data = wage2)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.6482478 0.5462963 10.339 < 2e-16 ***
educ 0.0184560 0.0410608 0.449 0.653192
exper 0.0139072 0.0031768 4.378 1.34e-05 ***
tenure 0.0113929 0.0024397 4.670 3.46e-06 ***
married 0.2008658 0.0388267 5.173 2.82e-07 ***
south -0.0802354 0.0262560 -3.056 0.002308 **
urban 0.1835758 0.0268586 6.835 1.49e-11 ***
black -0.1466989 0.0397013 -3.695 0.000233 ***
IQ -0.0009418 0.0051625 -0.182 0.855290
educ:IQ 0.0003399 0.0003826 0.888 0.374564
---
Residual standard error: 0.3632 on 925 degrees of freedom
Multiple R-squared: 0.2634, Adjusted R-squared: 0.2563

Chọn hoiquy2
24

24

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 12
Chương 9 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội:


Vấn đề dạng hàm và dữ liệu
Sử dụng biến trễ của biến phụ thuộc làm biến đại diện
Trong nhiều trường hợp, yếu tố không quan sát được bị bỏ sót có thể được đại diện
bởi giá trị của biến phụ thuộc ở các thời điểm trước.

Ví dụ 9.4: Tỷ lệ tội phạm trong thành phố

9.16

Việc đưa thêm tỷ lệ tội phạm thời điểm trước vào mô hình ít nhất kiểm soát được phần nào các
yếu tố bị bỏ sót có tác động đến tỷ lệ tội phạm trong năm đang xét.
So sánh hai thành phố có cùng tỷ lệ tội phạm vào năm trước; nghĩa là, chúng ta đã tránh trường
hợp so sánh hai thành phố có sự khác biệt rất lớn trong các yếu tố tác động đến tỷ lệ tội phạm
không quan sát được.
Kỳ vọng dấu của β3>0.
Nếu 2 thành phố có cùng tỷ lệ tội phạm trước đây (crime-1) và tỷ lệ thất nghiệp hiện tại (unem), β2
đo lường tác động của expend lên crime.

© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

25

PHÂN TÍCH HỒI QUY BỘI:


VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
• Tập tin crime2.wf1
• Ví dụ 9.4: Tỷ lệ tội phạm trong thành phố

> # Tao ra cac bien tuong ung voi nam 82 va 87


> crmrte87 <- subset(crmrte, d87==1)
> crmrte82 <- subset(crmrte, d87==0)
> unem87 <- subset(unem, d87==1)
> unem82 <- subset(unem, d87==0)
> lawexpc87 <- subset(lawexpc, d87==1)
> lawexpc82 <- subset(lawexpc, d87==0)

26

26

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 13
Chương 9 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
• Tập tin crime2.wf1
• Ví dụ 9.4: Tỷ lệ tội phạm trong thành phố

> summary(hoiquy1)

Call:
lm(formula = log(crmrte87) ~ unem87 + log(lawexpc87), data = crime2)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.34290 1.25053 2.673 0.0106 *
unem87 -0.02900 0.03234 -0.897 0.3748
log(lawexpc87) 0.20337 0.17265 1.178 0.2453
---
Residual standard error: 0.3231 on 43 degrees of freedom
Multiple R-squared: 0.05712, Adjusted R-squared: 0.01326

Dấu của UNEM87 và LOG(LAWEXPC87) trái với kỳ vọng.

27

27

PHÂN TÍCH HỒI QUY BỘI:


VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
• Ví dụ 9.4: Tỷ lệ tội phạm trong thành phố
> summary(hoiquy2)

Call:
lm(formula = log(crmrte87) ~ unem87 + log(lawexpc87) + log(crmrte82),
data = crime2)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.076450 0.821143 0.093 0.926
unem87 0.008621 0.019517 0.442 0.661
log(lawexpc87) -0.139576 0.108641 -1.285 0.206
log(crmrte82) 1.193923 0.132099 9.038 2.1e-11 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.1905 on 42 degrees of freedom


Multiple R-squared: 0.6798, Adjusted R-squared: 0.657

Dấu của UNEM87 và LOG(LAWEXPC87) đúng với kỳ vọng.

28

28

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 14
Chương 9 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội:


Vấn đề dạng hàm và dữ liệu
9.3 Mô hình với hệ số góc ngẫu nhiên (= Mô hình có hệ số ngẫu nhiên) (tự đọc)

Mô hình có hệ số chặn ngẫu nhiên


và hệ số góc ngẫu nhiên
9.18
Hệ số chặn Thành phần Hệ số góc Thành phần
trung bình ngẫu nhiên trung bình ngẫu nhiên
Sai số

Thành phần ngẫu nhiên của


một cá nhân độc lập với biến
Giả thiết: giải thích

WLS hay OLS với sai số chuẩn cải


thiện sẽ giúp ước lượng vững hệ số
chặn trung bình và hệ số góc trung
bình của tổng thể.
9.20
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

29

Phân tích hồi quy bội:


Vấn đề dạng hàm và dữ liệu
Khi chúng ta sử dụng 1 thước đo không chính xác cho 1 biến kinh tế trong 1 mô hình
hồi quy, thì có nghĩa là mô hình của chúng ta hàm chứa vấn đề sai số đo lường.
9.4 Tính chất của OLS khi có sai số trong đo lường

Sai số đo lường ở biến phụ thuộc


Giá trị sai = Giá trị đúng + Sai số đo lường
9.24

Hàm hồi quy tổng thể

Mô hình được ước lượng


9.25

Hậu quả của sai số đo lường ở biến phụ thuộc


Ước lượng kém hiệu quả hơn do phương sai sai số cao hơn.
Tuy nhiên, ước lượng OLS vẫn không chệch và vững (với giả thiết sai số đo lường e0
không tương quan với các biến giải thích xj). Ngoài ra, các thống kê t, F, LM vẫn hợp lệ.

© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

30

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 15
Chương 9 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
• Ví dụ 9.5: Hàm tiết kiệm với sai số đo lường
• sav* = β0 + β1inc + β2size + β3educ + β4age + u
• sav*: tiết kiệm thật sự, sav: tiết kiệm báo cáo
• e0 = sav-sav*
• Khá hợp lý nếu giả thiết sai số đo lường không tương quan với inc,
size, educ, age.
• Chúng ta có thể không bao giờ biết được sai số đo lường có
tương quan với inc, educ hay không, trừ khi chúng ta thu thập
được dữ liệu về sav*.

• Ví dụ 9.6: Sai số đo lường trong tỷ lệ phế phẩm


• log(scrap*)= β0 + β1grant + u
• scrap*: tỷ lệ phế phẩm thực tế, scrap: tỷ lệ phế phẩm công ty báo cáo
• e0 = log(scrap) - log(scrap*)
31

31

Phân tích hồi quy bội:


Vấn đề dạng hàm và dữ liệu
Sai số đo lường ở 1 biến giải thích

Giá trị sai = Giá trị đúng + Sai số đo lường


9.28
Hàm hồi quy tổng thể
9.27
Mô hình được ước lượng
9.30
Sai số không
Giả thiết sai số trong đo lường cổ điển: 9.31 tương quan với
giá trị đúng

Giá trị sai x1 có


9.32 tương quan với sai
số của mô hình

© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

32

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 16
Chương 9 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội:


Vấn đề dạng hàm và dữ liệu
Hậu quả của sai số đo lường trong biến giải thích
Dưới giả thiết sai số trong đo lường cổ điển (CEV), OLS cho ước lượng chệch và
không vững vì biến đo sai x1 bị nội sinh.
Có thể biểu diễn tính không vững của ước lượng như sau:
Nhân tử này (liên quan đến phương sai
của nhiễu trong hàm hồi quy giá trị đúng
9.33 của x1 theo các biến giải thích khác) luôn
nhận giá trị từ 0 đến nhỏ hơn 1.

Tác động của biến đo sai bị chệch suy giảm, nghĩa là độ lớn tác động của biến đo
sai luôn gần với giá trị 0 hơn so với tác động của biến đúng. Ví dụ nếu β1 >0 thì β1^
sẽ có xu hướng ước lượng thấp hơn β1.

Ngoài ra, tác động của các biến giải thích khác cũng bị chệch.
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

33

PHÂN TÍCH HỒI QUY BỘI:


VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
• Ví dụ 9.7: Phương trình GPA với sai số đo lường
• colGPA = β0 + β1faminc* + β2hsGPA + β3SAT + u
• faminc*: thu nhập thực tế hàng năm của hộ gia đình
• faminc: thu nhập hàng năm của hộ gia đình do sinh viên kê khai
• e1 = faminc - faminc*
• Nếu dùng faminc thay cho faminc* sẽ làm chệch ước lượng OLS của
β1 về phía 0. Một hậu quả của sự chệch dưới là kiểm định giả thiết
H0: β1 = 0 ; H1: β1 > 0 sẽ thường cho kết quả chấp nhận H0 (do |t|
nhỏ).

34

34

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 17
Chương 9 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội:


Vấn đề dạng hàm và dữ liệu
9.5 Dữ liệu bị khuyết, mẫu phi ngẫu nhiên, các quan sát bất thường (tự đọc)

Dữ liệu bị khuyết do chọn mẫu

Dữ liệu khuyết là trường hợp đặc biệt của vấn đề chọn mẫu (mẫu phi ngẫu nhiên) khi
quan sát bị thiếu thông tin không thể sử dụng được.

Nếu mẫu được chọn dựa trên các biến độc lập thì hàm hồi quy không gặp bất kỳ
vấn đề nào vì hàm hồi quy xét điều kiện dựa trên các biến dộc lập.

Nói chung, việc chọn mẫu sẽ không có vấn đề gì trong trường hợp nó không liên quan
tới sai số của mô hình (= chọn mẫu ngoại sinh).

Việc chọn mẫu sẽ có vấn đề nếu nó dựa trên biến phụ thuộc hoặc sai số (= chọn
mẫu nội sinh).

© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

35

Phân tích hồi quy bội:


Vấn đề dạng hàm và dữ liệu
Ví dụ về chọn mẫu ngoại sinh

9.37
Nếu mẫu phi ngẫu nhiên được chọn theo nhóm thu nhập, nhóm tuổi, quy mô gia đình, thì hàm hồi
quy không có bất kỳ vấn đề gì bởi vì nó nghiên cứu tiết kiệm cho một tập con của tổng thể được
xác định bởi thu nhập, tuổi và quy mô gia đình.

Ví dụ về chọn mẫu nội sinh

9.38

Nếu mẫu phi ngẫu nhiên là do các cá nhân từ chối tham gia cuộc khảo sát vì giá trị tài sản của họ
(wealth) quá cao hoặc thấp, kết quả ước lượng sẽ bị chệch vì những cá nhân này có sự khác biệt
một cách hệ thống với những cá nhân không từ chối tham gia mẫu khảo sát.

© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

36

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 18
Chương 9 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội:


Vấn đề dạng hàm và dữ liệu
Quan sát bất thường và quan sát có ảnh hưởng lớn
Quan sát có giá trị cách xa hay bất thường là vấn đề đặc trưng của OLS vì phương
pháp này dựa trên bình phương phần dư.

Nếu quan sát bất thường do sai sót khi nhập liệu, ta chỉ cần bỏ đi các quan sát đó.

Nếu quan sát bất thường nảy sinh do quá trình thu thập dữ liệu, việc quyết định giữ
lại hay bỏ đi những quan sát này không phải dễ dàng.

Ví dụ 9.8: Cường độ R&D và quy mô doanh nghiệp

9.40

© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

37

Phân tích hồi quy bội:


Vấn đề dạng hàm và dữ liệu
Ví dụ 9.8: Cường độ R&D và quy mô doanh nghiệp (tiếp tục)

Giá trị bất thường này không phải là lỗi


nhập liệu: Một trong các công ty trong dữ Kết quả ước lượng khi không có quan sát
liệu có quy mô lớn hơn các công ty khác bất thường thì có ý nghĩa hơn.

© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

38

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 19
Chương 9 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Ví dụ 9.8: Cường độ R&D và quy mô doanh nghiệp

• Tập tin rdchem.wf1

> # hoi quy OLS


> ols <- lm(rdintens ~ sales + profmarg, data = rdchem)
> summary(ols)

Call:
lm(formula = rdintens ~ sales + profmarg, data = rdchem)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.625e+00 5.855e-01 4.484 0.000106 ***
sales 5.338e-05 4.407e-05 1.211 0.235638
profmarg 4.462e-02 4.618e-02 0.966 0.341966
---
Residual standard error: 1.862 on 29 degrees of freedom
Multiple R-squared: 0.07612, Adjusted R-squared: 0.0124
> nobs(ols)
[1] 32

39

39

PHÂN TÍCH HỒI QUY BỘI:


VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Ví dụ 9.8: Cường độ R&D và quy mô doanh nghiệp
> # hoi quy OLS bo gia tri bat thuong
> ols_bo <- lm(rdintens ~ sales + profmarg, data = rdchem,
sales != 39709)
> summary(ols_bo)

Call:
lm(formula = rdintens ~ sales + profmarg, data = rdchem,
subset = sales != 39709)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.2968508 0.5918045 3.881 0.000577 ***
sales 0.0001856 0.0000842 2.204 0.035883 *
profmarg 0.0478411 0.0444831 1.075 0.291336
---
Residual standard error: 1.792 on 28 degrees of freedom
Multiple R-squared: 0.1728, Adjusted R-squared: 0.1137
> nobs(ols_bo)
[1] 31

40

40

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 20
Chương 9 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội:


Vấn đề dạng hàm và dữ liệu
9.6 Phương pháp độ lệch tuyệt đối nhỏ nhất (LAD)
Phương pháp độ lệch tuyệt đối nhỏ nhất tìm cách cực tiểu hóa tổng trị tuyệt đối của các
phần dư (thay vì tổng bình phương phần dư, OLS)

9.45

Ít nhạy cảm hơn với các giá trị bất thường vì không bình phương phần dư.

Phương pháp độ lệch tuyệt đối nhỏ nhất ước lượng các tham số của trung vị có điều
kiện (thay vì trung bình có điều kiện như OLS)

Các ước lượng độ lệch tuyệt đối nhỏ nhất là trường hợp đặc biệt của hồi quy phân vị
(ước lượng các tham số của phân vị có điều kiện).

© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

41

PHÂN TÍCH HỒI QUY BỘI:


VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
• Nhược điểm của LAD:
• Không thể viết thành các công thức đối với các ước lượng LAD.
• LAD cần nhiều tính toán hơn so với OLS.
• Các suy diễn thống kê liên quan tới các ước lượng LAD chỉ đúng khi cỡ
mẫu lớn.
• LAD luôn luôn ước lượng không vững các tham số xuất hiện trong hàm
hồi quy trung bình có điều kiện E(y/x1,…xk).
• Để LAD ước lượng vững trung bình có điều kiện E(y/x1,…xk) thì cần
thêm 2 giả thiết (ngoài các giả thiết đã biết):
– Phân phối của u|x1,…, xk đối xứng qua giá trị 0.
– u độc lập với (x1,…, xk).

42

42

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 21
Chương 9 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
Ví dụ 9.8: Cường độ R&D và quy mô doanh nghiệp
> # hoi quy LAD
> library(quantreg)
> lad <- rq(rdintens ~ sales + profmarg, tau = 0.5, data = rdchem)
> summary(lad)

Call: rq(formula = rdintens ~ sales + profmarg, tau = 0.5, data = rdchem)

tau: [1] 0.5 (Median)

Coefficients:
coefficients lower bd upper bd
(Intercept) 1.62309 1.34386 2.66171
sales 0.00002 -0.00011 0.00055
profmarg 0.11790 -0.00002 0.13495

43

43

PHÂN TÍCH HỒI QUY BỘI:


VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU
• Kiểm tra giả thiết MLR4:
Xem Chương 15, mục 15.5

44

44

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 22
Chương 9 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Môøi gheù thaêm trang web:


45

 https://sites.google.com/a/ueh.edu.vn/phamtricao/
 https://sites.google.com/site/phamtricao/

45

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 23

You might also like