Download as pdf or txt
Download as pdf or txt
You are on page 1of 28

Chương 7 - Nhập môn Kinh tế lượng * 03.08.

2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội với biến


định tính

Chương 7

Wooldridge: Introductory Econometrics:


A Modern Approach, 5e

© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội:


Biến định tính
7.1 Mô tả thông tin định tính
Ví dụ: giới tính, chủng tộc, công nghiệp, khu vực, đánh giá cấp độ, ...
Một cách để kết hợp thông tin định tính là sử dụng biến giả
Chúng có thể xuất hiện như là biến phụ thuộc hay biến độc lập

7.2 Trường hợp đơn giản: Có một biến độc lập là biến giả

7.1

= mức lương thu được/mất đi nếu Biến giả:


người này là nữ chứ không phải là =1 nếu là nữ
nam (các yếu tố khác giữ cố định) =0 nếu là nam

Câu hỏi: Tại sao chọn số 0 và 1 ???


© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 1
Chương 7 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


BIẾN ĐỊNH TÍNH

Phân tích hồi quy bội:


Biến định tính
Đồ thị minh họa

Cách giải thích khác của hệ số:

7.2

nghĩa là, sự khác biệt về mức lương trung


bình giữa nam và nữ có cùng một trình độ
giáo dục (nữ so với nam).
female=0 : nhóm cơ sở (tham chiếu)

Cùng hệ số góc, khác tung độ gốc

© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 2
Chương 7 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội:


Biến định tính
Mô hình này không thể ước lượng được (đa cộng tuyến
Bẫy biến giả hoàn hảo do Male + female = 1 (hệ số chặn))

Khi sử dụng biến giả, một thuộc tính luôn luôn phải được loại bỏ:

Nhóm cơ sở là nam

Nhóm cơ sở là nữ

Nhược điểm:
Ngoài ra, có thể bỏ qua tung độ gốc:
1) Khó khăn hơn để kiểm định sự
khác biệt giữa các tham số
2) Công thức R2 chỉ có ý nghĩa
nếu hồi quy có tung độ gốc
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội:


Biến định tính
VD 7.1: Ước lượng phương trình tiền lương với sự khác biệt về hệ số chặn

7.4

Cố định các biến giáo dục, kinh


nghiệm, và thâm niên chức vụ, tiền
lương trung bình của nữ ít hơn nam
là 1,81 USD/giờ

Điều đó có nghĩa rằng có sự phân biệt đối xử với nữ giới?

Không hẳn vậy. Bởi vì yếu tố giới tính nữ có thể tương quan với các đặc điểm
lao động khác chưa được kiểm soát.

H0: female = 0 ; H1: female ≠ 0 Xét xem yếu tố giới tính có ảnh hưởng đến lương không
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 3
Chương 7 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội:


Biến định tính
So sánh trung bình của các tổng thể con được mô tả bằng biến giả

7.5

Trong điều kiện không kiểm soát các yếu tố


khác, tiền lương trung bình của nữ ít hơn nam
là 2,51 USD/giờ; nghĩa là, sự khác biệt giữa mức
lương trung bình của nam và nữ là 2,51
USD/giờ.
Thảo luận
Có thể dễ dàng kiểm định sự chênh lệch trung bình giữa hai tổng thể con có ý nghĩa thống kê hay

không (|t|= 9.65).

Sự khác biệt về mức lương giữa nam và nữ sẽ lớn hơn nếu không kiểm soát các yếu tố khác; nghĩa

là một phần của sự khác biệt là do sự khác nhau trong giáo dục, kinh nghiệm và thâm niên chức vụ

giữa nam và nữ. Số 1.81 trong (7.4) nhỏ hơn 2.51 trong (7.5).
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội:


Biến định tính
Ví dụ 7.3: Ảnh hưởng của trợ cấp đào tạo lên số giờ đào tạo

Giờ đào tạo mỗi nhân viên Biến giả biểu thị công ty có nhận trợ cấp đào tạo nghề hay không

7.7

Đây là một ví dụ về đánh giá chương trình

nhóm tác động (= có nhận trợ cấp) so với nhóm đối chứng (= không có nhận
trợ cấp). Nhóm đối chứng còn gọi là nhóm kiểm soát.

Liệu có phải tác động của chương trình đến biến phụ thuộc là quan hệ nhân quả?

© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 4
Chương 7 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội:


Biến định tính
Sử dụng biến độc lập là biến giả trong phương trình log(y)

VD 7.4: Hàm hồi quy giá nhà

7.8

Biến giả biểu thị ngôi


nhà kiểu colonial
colonial = 1 nếu ngôi
nhà có phong cách
thuộc địa

Nhà có phong cách thuộc địa


có giá cao hơn nhà có phong
cách khác là 5,4 (%)

© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội:


Biến định tính
7.3 Sử dụng biến giả cho trường hợp biến định tính có nhiều lựa chọn
1) Xác định thành phần trong mỗi nhóm bằng một biến giả Câu hỏi: Nên dùng
bao nhiêu biến giả?
2) Bỏ ra một nhóm (nhóm này sẽ trở thành nhóm cơ sở)

VD 7.6: Phương trình log tiền lương theo giờ

7.11

Giữ những yếu tố khác cố định, tiền lương


trung bình của nữ đã kết hôn ít hơn nam
độc thân (= nhóm cơ sở) là 19,8%

Giữ những yếu tố khác cố định, tiền lương trung bình của nam đã kết hôn nhiều hơn nam độc thân là 21,3%
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

10

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 5
Chương 7 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


BIẾN ĐỊNH TÍNH
Dùng bao nhiêu biến giả là đủ?
A) Biến định tính có nhiều thuộc tính
1) Giới tính (nữ, nam), dùng 2-1 = 1 biến giả
nu (nu=1: nữ)
Nhóm cơ sở là: nam
2) Giới tính (nữ, nam, hifi), dùng 3-1 = 2 biến giả
nu (nu=1: nữ)
nam (nam=1: nam)
Nhóm cơ sở là: hifi
11

11

PHÂN TÍCH HỒI QUY BỘI:


BIẾN ĐỊNH TÍNH
B) Tương tác giữa các biến giả
1) Các biến giả có 2 thuộc tính
Giới tính (nữ, nam)
Tình trạng hôn nhân (có gia đình, độc thân)
Kết hợp giới tính và tình trạng hôn nhân: 2*2 = 4 trường hợp,

dùng 4-1 = 3 biến giả

nu*cogd: nữ và có gia đình


nu*docthan: nữ và độc thân
nam*cogd: nam và có gia đình
Nhóm cơ sở là: nam*docthan
12

12

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 6
Chương 7 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


BIẾN ĐỊNH TÍNH
B) Tương tác giữa các biến giả
2) Các biến giả có 2, 3 thuộc tính
Giới tính (nữ, nam)
Chủng tộc (da trắng, da vàng, da đen)
Kết hợp Giới tính và Chủng tộc: 2*3 = 6 trường hợp,

dùng 6-1 = 5 biến giả

Nu*datrang: nữ và da trắng
Nu*davang: nữ và da vàng
Nu*daden: nữ và da đen
Nam*datrang: nam và da trắng
Nam*davang : nam và da vàng
Nhóm cơ sở là: nam*daden
13

13

Phân tích hồi quy bội:


Biến định tính
Sử dụng biến giả cho trường hợp biến thứ bậc

Ví dụ: Xếp hạng tín dụng của thành phố và lãi suất trái phiếu đô thị

Lãi suất trái phiếu đô thị Xếp hạng tín dụng từ 0-4 (0=tệ, 4=rất tốt)

Mô tả này có lẽ không phù hợp nếu như xếp hạng tín dụng chỉ chứa thông tin thứ bậc.
Một cách tốt hơn để đưa thông tin thứ bậc này vào hồi quy là sử dụng nhiều biến giả:

7.12

Các biến giả được đặt tương ứng với các mức xếp hạng tín dụng. Nghĩa là, CR1 = 1 nếu CR = 1
và CR1 = 0 cho các trường hợp khác.
Tất cả các tác động được so sánh với mức xếp hạng tệ nhất (= nhóm cơ sở).

© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

14

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 7
Chương 7 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI: BIẾN


ĐỊNH TÍNH
Lưu ý:
• log(wage) = 0 + 0female + 1married + 2female.married +…+u 7.14
• H0: 2=0 ; H1: 2≠0
• Kiểm tra xem tác động của giới tính lên tiền lương có phụ thuộc vào
tình trạng hôn nhân không.
• Kiểm tra xem tác động của tình trạng hôn nhân lên tiền lương có phụ
thuộc vào giới tính không.

15

15

Phân tích hồi quy bội:


Biến định tính
7.4 Thành phần tương tác có biến giả Thành phần tương tác
Cho phép hệ số góc khác nhau giữa các nhóm

7.17

= hệ số chặn của nam = hệ số góc của nam

= hệ số chặn của nữ = hệ số góc của nữ

Giả thuyết quan tâm

H1: H0 sai
Tác động của học vấn là như nhau giữa nam Tiền lương là như nhau giữa nam và nữ, có cùng mức học
và nữ. Mức chênh lệch tiền lương giữa nữ và vấn. Hay yếu tố giới tính không ảnh hưởng đến tiền lương
nam là như nhau ở mọi mức học vấn.
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

16

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 8
Chương 7 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội:


Biến định tính
Đồ thị minh họa

Việc sử dụng vừa biến giả vừa biến


tương tác cho phép hai phương trình
tiền lương hoàn toàn khác nhau giữa
nam và nữ

Khác hệ số góc,
khác tung độ gốc

© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

17

PHÂN TÍCH HỒI QUY BỘI: BIẾN


ĐỊNH TÍNH
• Tập tin wage1.wf1

> # Khac tung do goc


> hoiquy1 <- lm(wage ~ female + educ, data = wage1)
> summary(hoiquy1)

Call:
lm(formula = wage ~ female + educ, data = wage1)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.62282 0.67253 0.926 0.355
female -2.27336 0.27904 -8.147 2.76e-15 ***
educ 0.50645 0.05039 10.051 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 3.186 on 523 degrees of freedom


Multiple R-squared: 0.2588, Adjusted R-squared: 0.256
F-statistic: 91.32 on 2 and 523 DF, p-value: < 2.2e-16

18

18

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 9
Chương 7 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI: BIẾN


ĐỊNH TÍNH
• Tập tin wage1.wf1
• wage =  0 +  1educ + 0female.educ + u
• H0: 0 = 0 ; H1: 0 ≠ 0 khác hệ số góc

Xét xem yếu tố giới tính có ảnh hưởng đến lương không
> # Khac he so goc
> hoiquy2 <- lm(wage ~ educ + female:educ, data = wage1)
> summary(hoiquy2)

Call:
lm(formula = wage ~ educ + female:educ, data = wage1)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.28526 0.65041 -0.439 0.661
educ 0.57548 0.05039 11.421 < 2e-16 ***
educ:female -0.17764 0.02183 -8.138 2.95e-15 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 3.186 on 523 degrees of freedom


Multiple R-squared: 0.2586, Adjusted R-squared: 0.2558
F-statistic: 91.23 on 2 and 523 DF, p-value: < 2.2e-16 19

19

PHÂN TÍCH HỒI QUY BỘI: BIẾN


ĐỊNH TÍNH
• Tập tin wage1.wf1

> # Khac tung do goc va he so goc


> hoiquy3 <- lm(wage ~ female + educ + female:educ, data = wage1)
> summary(hoiquy3)

Call:
lm(formula = wage ~ female + educ + female:educ, data = wage1)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.20050 0.84356 0.238 0.812
female -1.19852 1.32504 -0.905 0.366
educ 0.53948 0.06422 8.400 4.24e-16 ***
female:educ -0.08600 0.10364 -0.830 0.407
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 3.186 on 522 degrees of freedom


Multiple R-squared: 0.2598, Adjusted R-squared: 0.2555
F-statistic: 61.07 on 3 and 522 DF, p-value: < 2.2e-16

20

20

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 10
Chương 7 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI: BIẾN


ĐỊNH TÍNH
Cách thay đổi hệ số góc và tung độ gốc
1) Mô hình hồi quy:
y   0  1 x  u

Biến giả biểu thị nơi sống: urban = 1 : thành thị


 Thay đổi tung độ gốc:
y   0  1 x   0urban  u
H 0 :  0  0 ; H1 :  0  0 (Yếu tố nơi sống không ảnh hưởng lên y)

 Thay đổi hệ số góc:


y   0  1 x   0urban.x  u
H 0 :  0  0 ; H1 :  0  0 (Yếu tố nơi sống không ảnh hưởng lên y)

 Thay đổi tung độ gốc và hệ số góc:


y   0  1 x   0urban  1urban.x  u
H 0 :  0  0, 1  0 ; H1 : H 0 sai (Yếu tố nơi sống không ảnh hưởng lên y)
21

21

PHÂN TÍCH HỒI QUY BỘI: BIẾN


ĐỊNH TÍNH
Cách thay đổi hệ số góc và tung độ gốc
2) Mô hình hồi quy:
y   0  1 x1   2 x2  u

Biến giả biểu thị nơi sống: urban = 1 : thành thị


 Thay đổi tung độ gốc:
y   0  1 x1   2 x2   0urban  u
H 0 :  0  0 ; H1 :  0  0 (Yếu tố nơi sống không ảnh hưởng lên y)

 Thay đổi hệ số góc:


y   0  1 x1   2 x2   0urban.x1  1urban.x2  u
H 0 :  0  0, 1  0 ; H1 : H 0 sai (Yếu tố nơi sống không ảnh hưởng lên y)

 Thay đổi tung độ gốc và hệ số góc:


y   0  1 x1   2 x2   0urban  1urban.x1   2urban.x2  u
H 0 :  0  0, 1  0,  2  0 ; H1 : H 0 sai (Yếu tố nơi sống không ảnh hưởng lên y)
22

22

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 11
Chương 7 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội:


Biến định tính
Ước lượng phương trình lương với thành phần tương tác
VD 7.10: phương trình log tiền lương theo giờ

7.18

Liệu điều này có hàm ý rằng khi có cùng trình độ học vấn, số
Không có bằng chứng thống kê năm kinh nghiệm, và thâm niên chức vụ, thì không có bằng
chống lại giả thuyết rằng tác động chứng thống kê cho thấy tiền lương của nữ sẽ thấp hơn nam
học vấn là như nhau cho nam và nữ (|t|= 1.35)? Không: đây chỉ là tác động khi educ= 0.
(thống kê |t|= 0.43) Để trả lời câu hỏi này, người ta phải quy tâm thành phần
tương tác, ví dụ xét educ = 12,5 (= mức học vấn trung bình).
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

23

PHÂN TÍCH HỒI QUY BỘI:


BIẾN ĐỊNH TÍNH
• Tập tin wage1.wf1
> hoiquya <- lm(log(wage) ~ female + educ + female:educ
+ exper + I(exper^2) + tenure + I(tenure^2), data = wage1)
> summary(hoiquya)
Call:
lm(formula = log(wage) ~ female + educ + female:educ + exper +
I(exper^2) + tenure + I(tenure^2), data = wage1)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.3888060 0.1186871 3.276 0.00112 **
female -0.2267886 0.1675394 -1.354 0.17644
educ 0.0823692 0.0084699 9.725 < 2e-16 ***
exper 0.0293366 0.0049842 5.886 7.11e-09 ***
I(exper^2) -0.0005804 0.0001075 -5.398 1.03e-07 ***
tenure 0.0318967 0.0068640 4.647 4.28e-06 ***
I(tenure^2) -0.0005900 0.0002352 -2.509 0.01242 *
female:educ -0.0055645 0.0130618 -0.426 0.67028
---
Residual standard error: 0.4001 on 518 degrees of freedom
Multiple R-squared: 0.441, Adjusted R-squared: 0.4334
24

24

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 12
Chương 7 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


BIẾN ĐỊNH TÍNH
> library(car)
> # Kiem dinh F
> linearHypothesis(hoiquya, c("female=0", "female:educ=0"))
Linear hypothesis test

Hypothesis:
female = 0
female:educ = 0

Model 1: restricted model


Model 2: log(wage) ~ female + educ + female:educ
+ exper + I(exper^2) + tenure + I(tenure^2)

Res.Df RSS Df Sum of Sq F Pr(>F)


1 520 93.911
2 518 82.922 2 10.99 34.325 1.002e-14 ***

p-value = 1,002*10-14 < 0,05 : bác bỏ H0

25

25

PHÂN TÍCH HỒI QUY BỘI:


BIẾN ĐỊNH TÍNH
> hoiquyb <- lm(log(wage) ~ female + educ + female:I(educ-12.5)
+ exper + I(exper^2) + tenure + I(tenure^2), data = wage1)
> summary(hoiquyb)

Call:
lm(formula = log(wage) ~ female + educ + female:I(educ - 12.5) +
exper + I(exper^2) + tenure + I(tenure^2), data = wage1)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.3888060 0.1186871 3.276 0.00112 **
female -0.2963450 0.0358358 -8.270 1.14e-15 ***
educ 0.0823692 0.0084699 9.725 < 2e-16 ***
exper 0.0293366 0.0049842 5.886 7.11e-09 ***
I(exper^2) -0.0005804 0.0001075 -5.398 1.03e-07 ***
tenure 0.0318967 0.0068640 4.647 4.28e-06 ***
I(tenure^2) -0.0005900 0.0002352 -2.509 0.01242 *
female:I(educ - 12.5) -0.0055645 0.0130618 -0.426 0.67028
---
Residual standard error: 0.4001 on 518 degrees of freedom
Multiple R-squared: 0.441, Adjusted R-squared: 0.4334
26

26

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 13
Chương 7 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội:


Biến định tính
Kiểm định sự khác nhau trong hàm hồi quy giữa các nhóm (phương pháp biến giả)

Mô hình chưa gán ràng buộc (chứa toàn bộ các thành phần tương tác)
Xếp hạng của sinh viên
Điểm trung bình đánh giá (GPA) điểm thi SAT tại trường trung học

7.20

Tổng số giờ học


chính khóa

Mô hình đã gán ràng buộc (R) (hàm hồi quy giống nhau cho cả 2 nhóm)

© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

27

Phân tích hồi quy bội:


Biến định tính
Giả thuyết không
Tất cả tác động của thành phần tương
H0: Hàm hồi quy giống nhau cho cả 2 nhóm tác là bằng 0, nghĩa là, các hệ số hồi quy
giống nhau cho cả nam và nữ. Không có
7.21 sự chênh lệch về hệ số chặn và hệ số góc
trong hồi quy của nữ và nam.
Ước lượng mô hình chưa gán ràng buộc (UR)

7.22

Kiểm định riêng lẻ từng hệ


số của từng thành phần
tương tác, giả thuyết cho
rằng tác động của thành
phần tương tác bằng 0
không thể bị bác bỏ

© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

28

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 14
Chương 7 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


BIẾN ĐỊNH TÍNH
• Tập tin gpa3.wf1

> # mo hinh UR
> hoiquy1 <- lm(cumgpa ~ female + sat + female:sat + hsperc + female:hsperc
+ tothrs + female:tothrs, data = gpa3, subset=(spring==1))
> summary(hoiquy1)

Call:
lm(formula = cumgpa ~ female + sat + female:sat + hsperc + female:hsperc +
tothrs + female:tothrs, data = gpa3, subset = (spring ==
1))

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.4808117 0.2073336 7.142 5.17e-12 ***
female -0.3534862 0.4105293 -0.861 0.38979
sat 0.0010516 0.0001811 5.807 1.40e-08 ***
hsperc -0.0084516 0.0013704 -6.167 1.88e-09 ***
tothrs 0.0023441 0.0008624 2.718 0.00688 **
female:sat 0.0007506 0.0003852 1.949 0.05211 .
female:hsperc -0.0005498 0.0031617 -0.174 0.86206
female:tothrs -0.0001158 0.0016277 -0.071 0.94331
---
Residual standard error: 0.4678 on 358 degrees of freedom
Multiple R-squared: 0.4059, Adjusted R-squared: 0.3943
29

29

PHÂN TÍCH HỒI QUY BỘI:


BIẾN ĐỊNH TÍNH
• Tập tin gpa3.wf1

> nobs(hoiquy1)
[1] 366
> anova(hoiquy1)
Analysis of Variance Table

Response: cumgpa
Df Sum Sq Mean Sq F value Pr(>F)
female 1 13.143 13.1429 60.0495 9.648e-14 ***
sat 1 24.558 24.5582 112.2057 < 2.2e-16 ***
hsperc 1 12.321 12.3205 56.2923 4.988e-13 ***
tothrs 1 2.510 2.5104 11.4701 0.0007858 ***
female:sat 1 1.000 0.9999 4.5687 0.0332376 *
female:hsperc 1 0.006 0.0061 0.0279 0.8674503
female:tothrs 1 0.001 0.0011 0.0051 0.9433072
Residuals 358 78.355 0.2189

30

30

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 15
Chương 7 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


BIẾN ĐỊNH TÍNH
• Tập tin gpa3.wf1

> # mo hinh R
> hoiquy2 <- lm(cumgpa ~ sat + hsperc + tothrs,
data = gpa3, subset=(spring==1))
> summary(hoiquy2)

Call:
lm(formula = cumgpa ~ sat + hsperc + tothrs,
data = gpa3, subset = (spring == 1))

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.4908498 0.1836782 8.117 7.57e-15 ***
sat 0.0011850 0.0001648 7.191 3.71e-12 ***
hsperc -0.0099569 0.0012446 -8.000 1.70e-14 ***
tothrs 0.0023429 0.0007554 3.102 0.00208 **
---
Residual standard error: 0.486 on 362 degrees of freedom
Multiple R-squared: 0.3516, Adjusted R-squared: 0.3463

31

31

PHÂN TÍCH HỒI QUY BỘI:


BIẾN ĐỊNH TÍNH
> nobs(hoiquy2)
[1] 366
> anova(hoiquy2)
Analysis of Variance Table

Response: cumgpa
Df Sum Sq Mean Sq F value Pr(>F)
sat 1 26.616 26.6158 112.6692 < 2.2e-16 ***
hsperc 1 17.490 17.4904 74.0398 2.364e-16 ***
tothrs 1 2.272 2.2725 9.6197 0.002076 **
Residuals 362 85.515 0.2362

32

32

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 16
Chương 7 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội:


Biến định tính
Kiểm định đồng thời với thống kê F (phương pháp biến giả)

H0: Hàm hồi quy giống nhau cho cả 2 nhóm ; H1: H0 sai
Với mức ý nghĩa 5%:
F = 8,18 > 2,37 = F0,05(4,358) : bác bỏ H0
Vậy có sự khác biệt trong hàm hồi quy giữa nhóm nam và nữ

Tóm lại (phương pháp biến giả):


Kiểm tra xem có sự khác biệt trong hàm hồi quy của nhóm nam và nữ không
y = 0 + 0 male + 1x1 + 1 male.x1 + 2x2 + 2 male.x2 + u
H0: 0=0 ; 1=0 ; 2=0 (Không có sự khác biệt trong hàm hồi quy giữa các nhóm)
H1: H0 sai

© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

33

PHÂN TÍCH HỒI QUY BỘI:


BIẾN ĐỊNH TÍNH
> library(car)
> linearHypothesis(hoiquy1, matchCoefs(hoiquy1, "female"))
Linear hypothesis test

Hypothesis:
female = 0
female:sat = 0
female:hsperc = 0
female:tothrs = 0

Model 1: restricted model


Model 2: cumgpa ~ female + sat + female:sat + hsperc + femal
e:hsperc +
tothrs + female:tothrs

Res.Df RSS Df Sum of Sq F Pr(>F)


1 362 85.515
2 358 78.355 4 7.1606 8.1791 2.545e-06 ***

H0: Hàm hồi quy giống nhau cho cả 2 nhóm ; H1: H0 sai

p-value = 2,545*10-6 < 0,05 : bác bỏ H0


34

34

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 17
Chương 7 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội:


Biến định tính
Kiểm định sự khác nhau trong hàm hồi quy giữa các nhóm (kiểm định Chow)

Cách khác để tính thống kê F trong trường hợp đã cho

Chạy hồi quy mô hình đã gán ràng buộc (R) riêng biệt cho nam và nữ ; tính SSR cho mô
hình chưa gán ràng buộc bằng cách lấy tổng SSR của hai hàm hồi quy này.

Chạy hồi quy cho mô hình đã gán ràng buộc (R) và tính SSR cho mô hình này

Kiểm định theo cách làm này được gọi là kiểm định Chow

Quan trọng: Kiểm định Chow giả định rằng phương sai của nhiễu là như nhau giữa các
nhóm Nữ Nam
n1= 90 n2= 276
SSR1= 19,603 SSR2= 58,752
Toàn bộ mẫu
n= n1+n2 = 366
SSRp= 85,515
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

35

PHÂN TÍCH HỒI QUY BỘI:


BIẾN ĐỊNH TÍNH
cumgpa = 0 + 1 sat + 2 hsperc + 3 tothrs + u (số tham số = 4)
> # mo hinh nu
> hoiquy3 <- lm(cumgpa ~ sat + hsperc + tothrs, data = gpa3,
subset=(spring==1 & female==1))
> summary(hoiquy3)

Call:
lm(formula = cumgpa ~ sat + hsperc + tothrs,
data = gpa3, subset = (spring ==
1 & female == 1))

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.1273255 0.3615951 3.118 0.00248 **
sat 0.0018022 0.0003469 5.195 1.36e-06 ***
hsperc -0.0090013 0.0029078 -3.096 0.00265 **
tothrs 0.0022283 0.0014088 1.582 0.11739
---
Residual standard error: 0.4774 on 86 degrees of freedom
Multiple R-squared: 0.4014, Adjusted R-squared: 0.3805
36

36

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 18
Chương 7 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


BIẾN ĐỊNH TÍNH
> nobs(hoiquy3)
[1] 90
> anova(hoiquy3)
Analysis of Variance Table

Response: cumgpa
Df Sum Sq Mean Sq F value Pr(>F)
sat 1 10.1724 10.1724 44.6275 2.247e-09 ***
hsperc 1 2.4040 2.4040 10.5464 0.001661 **
tothrs 1 0.5703 0.5703 2.5018 0.117387
Residuals 86 19.6028 0.2279

37

37

PHÂN TÍCH HỒI QUY BỘI:


BIẾN ĐỊNH TÍNH
> # mo hinh nam
> hoiquy4 <- lm(cumgpa ~ sat + hsperc + tothrs,
data = gpa3, subset=(spring==1 & female==0))
> summary(hoiquy4)

Call:
lm(formula = cumgpa ~ sat + hsperc + tothrs,
data = gpa3, subset = (spring == 1 & female == 0))

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.4808117 0.2059706 7.189 6.29e-12 ***
sat 0.0010516 0.0001799 5.846 1.44e-08 ***
hsperc -0.0084516 0.0013613 -6.208 1.99e-09 ***
tothrs 0.0023441 0.0008567 2.736 0.00662 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.4648 on 272 degrees of freedom


Multiple R-squared: 0.3169, Adjusted R-squared: 0.3093

38

38

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 19
Chương 7 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


BIẾN ĐỊNH TÍNH
> nobs(hoiquy4)
[1] 276
> anova(hoiquy4)
Analysis of Variance Table

Response: cumgpa
Df Sum Sq Mean Sq F value Pr(>F)
sat 1 15.493 15.4925 71.7250 1.568e-15 ***
hsperc 1 10.140 10.1401 46.9449 4.871e-11 ***
tothrs 1 1.617 1.6172 7.4869 0.006624 **
Residuals 272 58.752 0.2160

39

39

PHÂN TÍCH HỒI QUY BỘI:


BIẾN ĐỊNH TÍNH
> # mo hinh toan bo
> hoiquy5 <- lm(cumgpa ~ sat + hsperc + tothrs,
data = gpa3, subset=(spring==1))
> summary(hoiquy5)

Call:
lm(formula = cumgpa ~ sat + hsperc + tothrs,
data = gpa3, subset = (spring == 1))

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.4908498 0.1836782 8.117 7.57e-15 ***
sat 0.0011850 0.0001648 7.191 3.71e-12 ***
hsperc -0.0099569 0.0012446 -8.000 1.70e-14 ***
tothrs 0.0023429 0.0007554 3.102 0.00208 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.486 on 362 degrees of freedom


Multiple R-squared: 0.3516, Adjusted R-squared: 0.3463

40

40

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 20
Chương 7 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


BIẾN ĐỊNH TÍNH
> nobs(hoiquy5)
[1] 366
> anova(hoiquy5)
Analysis of Variance Table

Response: cumgpa
Df Sum Sq Mean Sq F value Pr(>F)
sat 1 26.616 26.6158 112.6692 < 2.2e-16 ***
hsperc 1 17.490 17.4904 74.0398 2.364e-16 ***
tothrs 1 2.272 2.2725 9.6197 0.002076 **
Residuals 362 85.515 0.2362

41

41

PHÂN TÍCH HỒI QUY BỘI:


BIẾN ĐỊNH TÍNH
H0: Hàm hồi quy giống nhau cho cả 2 nhóm ; H1: H0 sai
Công thức F của kiểm định Chow:

[ SSR p  ( SSR1  SSR2 )] / sts


F 7.24
( SSR1  SSR2 ) / ( n  2.sts )

sts = k+1: số tham số trong mô hình hồi quy

F > F(sts, n-2.sts) : bác bỏ H0


Ví dụ về cumGPA:

[85,515  (19,603  58,752)] / 4


F  8,18
(19,603  58,752) / (366  2* 4)
Với = 5% : F = 8,18 > 2,37 = F0,05(4, 358) : bác bỏ H0
42

42

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 21
Chương 7 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


BIẾN ĐỊNH TÍNH
# mo hinh nu
hoiquy_nu <- lm(cumgpa ~ sat + hsperc + tothrs, data = gpa3,
subset=(spring==1 & female==1))
SSR_nu <-sum(summary(hoiquy_nu)$resid^2)
SSR_nu
# mo hinh nam
hoiquy_nam <- lm(cumgpa ~ sat + hsperc + tothrs, data = gpa3,
subset=(spring==1 & female==0))
SSR_nam <-sum(summary(hoiquy_nam)$resid^2)
SSR_nam
# mo hinh chung
hoiquy_chung <- lm(cumgpa ~ sat + hsperc + tothrs, data = gpa3,
subset=(spring==1))
SSR_chung <-sum(summary(hoiquy_chung)$resid^2)
SSR_chung

43

43

PHÂN TÍCH HỒI QUY BỘI:


BIẾN ĐỊNH TÍNH
# tinh bac tu do
df_tu <- summary(hoiquy_nu)$df[1]
df_mau <- (nobs(hoiquy_chung)-2*df_tu)
# tinh tu so va mau so cua Fc
tuso <- (SSR_chung - SSR_nu - SSR_nam)/df_tu
mauso <- (SSR_nu + SSR_nam)/df_mau
# thong ke Fc
Fc <- tuso/mauso
Fc
# p-value cua Fc
p_value <- 1-pf(Fc, df_tu, df_mau)
p_value
# tinh F_0.05(df_tu,df_mau)
F_0.05 <- qf(0.95, df_tu, df_mau)
F_0.05

44

44

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 22
Chương 7 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


BIẾN ĐỊNH TÍNH
> SSR_nu
[1] 19.60279
> SSR_nam
[1] 58.75172
> SSR_chung
[1] 85.51507
> df_tu
[1] 4
> df_mau
[1] 358
> tuso
[1] 1.79014
> mauso
[1] 0.2188673
> Fc
[1] 8.179112
> p_value
[1] 2.544637e-06
> F_0.05
[1] 2.396882 45

45

Phân tích hồi quy bội:


Biến định tính
7.5 Biến phụ thuộc nhị phân: mô hình xác suất tuyến tính (tự đọc)
Hồi quy tuyến tính khi biến phụ thuộc nhị phân

7.26 Nếu biến phụ thuộc chỉ có 2


giá trị 1 và 0

= P(y=1/x)
Mô hình xác suất
tuyến tính (LPM)

7.27
Trong mô hình xác suất tuyến tính, các
hệ số cho biết tác động của biến độc lập
7.28 lên xác suất y=1
Hay:
© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

46

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 23
Chương 7 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội:


Biến định tính
Ví dụ: Việc tham gia lực lượng lao động của phụ nữ đã kết hôn

=1 có việc làm, =0 ngược lại Thu nhập của người chồng (nghìn USD mỗi năm)

7.29

Nếu số con dưới sáu tuổi tăng


thêm 1, xác suất người phụ nữ
có việc làm giảm 26,2%

Có vẻ không có ý nghĩa, |t|= 0,98 (nhưng xem slide kế tiếp)

© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

47

Phân tích hồi quy bội:


Biến định tính
Ví dụ: Tham gia lực lượng lao động của phụ nữ đã kết hôn (tt)

Đồ thị với nwifeinc=50, exper=5,


age=30, kidslt6=1, kidsge6=0

Học vấn cao nhất trong mẫu là


educ = 17. Khi đó, xác suất có
việc làm dự đoán của phụ nữ đã kết
hôn là 50%.

17
Xác suất dự đoán âm nhưng không
sao vì không có người phụ nữ nào
trong mẫu có educ <5.

© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

48

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 24
Chương 7 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội:


Biến định tính
Nhược điểm của mô hình xác suất tuyến tính
Xác suất dự đoán có thể lớn hơn 1 hoặc nhỏ hơn 0

Tác động biên lên xác suất là hằng số đôi khi không đúng về mặt logic

Mô hình xác suất tuyến tính thì luôn có phương sai thay đổi

Phương sai của biến


7.30 ngẫu nhiên Bernoulli
Cần tính sai số chuẩn cải thiện cho trường hợp phương sai thay đổi này (Chương 8)

Ưu điểm của mô hình xác suất tuyến tính


Dễ dàng ước lượng và giải thích

Tác động ước lượng và dự đoán thường khá tốt trong thực tế

 Xem mô hình Logit và Probit ở Chương 17


© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

49

Phân tích hồi quy bội:


Biến định tính
7.6 Bàn thêm về phân tích chính sách và đánh giá chương trình

Ví dụ: Tác động tài trợ đào tạo nghề đến năng suất lao động của công nhân

Tỷ lệ sản phẩm lỗi =1 nếu công ty có nhận tài trợ đào tạo, =0 ngược lại

7.33

Không có tác động rõ ràng


của tài trợ lên năng suất,
|t|=0,12

Nhóm tác động: được nhận tài trợ, nhóm đối chứng: các công ty không nhận được tài trợ
Tài trợ được đưa ra trên cơ sở: đến trước phục vụ trước. Điều này không giống như tài trợ
một cách ngẫu nhiên. Có thể là những doanh nghiệp với năng suất thấp sẽ xin nhận tài trợ
đầu tiên vì họ nhận thấy cơ hội cải thiện năng suất.

© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

50

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 25
Chương 7 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội:


Biến định tính
Nội sinh do vấn đề “tự lựa chọn” (self-selection) tham gia vào chương trình
Trong ví dụ trên và các ví dụ tương tự, việc tham gia vào chương trình có thể liên quan đến các

đặc điểm khác mà các đặc điểm này cũng ảnh hưởng đến biến phụ thuộc

Lý do là các đối tượng tự lựa chọn việc tham gia vào chương trình phụ thuộc vào đặc điểm và

triển vọng cá nhân của họ. Sự tham gia này không được xác định ngẫu nhiên.

Đánh giá thực nghiệm

Trong các thí nghiệm, việc tham gia vào nhóm tác động là ngẫu nhiên

Trong trường hợp này, tác động nhân quả có thể được suy ra bằng cách sử dụng hồi quy đơn

7.34
Biến giả biểu thị có hay không có tham gia thì
không liên quan đến các yếu tố khác ảnh hưởng
đến biến phụ thuộc
partic =1: có tham gia

© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

51

Phân tích hồi quy bội:


Biến định tính
Ví dụ khác về biến độc lập là biến giả bị nội sinh
H0: 1 = 0
Có phải khách hàng da màu bị phân biệt đối xử? H1: 1 < 0

Biến giả biểu thị vốn vay có Biến giả chủng tộc
được phê duyệt không Sự giàu có Xếp hạng tín dụng

Điều cần thiết là kiểm soát các đặc điểm quan trọng khác có thể tác động đến
việc phê duyệt vốn vay (ví dụ nghề nghiệp, thất nghiệp)

Việc bỏ qua đặc điểm quan trọng mà có tương quan với biến giả da màu sẽ tạo
ra bằng chứng thống kê giả cho sự phân biệt đối xử

© 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

52

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 26
Chương 7 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


BIẾN ĐỊNH TÍNH
7.7 Diễn giải kết quả hồi quy với biến phụ thuộc rời rạc

7.35

Cố định tuổi, nếu số năm đi học tăng 1 năm thì số con trung bình của phụ nữ
giảm 0,09 con.
Hay: Xét 1 nhóm 100 phụ nữ (cùng tuổi), nếu mỗi người có số năm đi học tăng 1
thì tổng số con trung bình của nhóm này sẽ giảm 9 người.

Cố định số năm đi học, nếu tuổi tăng 1 năm thì số con trung bình của phụ nữ
tăng 0,175 con.
Hay: Xét 1 nhóm 1000 phụ nữ (cùng số năm đi học), nếu mỗi người có số tuổi
tăng 1 thì tổng số con trung bình của nhóm này sẽ tăng 175 người.
53

53

PHÂN TÍCH HỒI QUY BỘI:


BIẾN ĐỊNH TÍNH
7.7 Diễn giải kết quả hồi quy với biến phụ thuộc rời rạc

7.37

electric= 1: phụ nữ sống trong ngôi nhà có điện

Cố định tuổi và mức học vấn. Phụ nữ sống trong nhà có điện có số con
trung bình ít hơn phụ nữ sống trong ngôi nhà không có điện là 0,362 người.
Hay: Cùng tuổi và mức học vấn. Xét nhóm 1000 phụ nữ sống trong nhà có
điện so với nhóm 1000 phụ nữ sống trong nhà không có điện. Số con trung
bình của nhóm 1 ít hơn nhóm 2 là 362 người.

Cùng tuổi, nếu mức học vấn tăng 1 năm thì số con trung bình của người phụ
nữ giảm 0,079 người.
54

54

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 27
Chương 7 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Môøi gheù thaêm trang web:


55

 https://sites.google.com/a/ueh.edu.vn/phamtricao/
 https://sites.google.com/site/phamtricao/

55

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 28

You might also like