Bai Tap 4 Va Thuc Hanh R - Bai Tap 4 Va Thuc Hanh R Môn Kinh Tế Lượng

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 7

22:44 30/04/2024 Bai tap 4 va thuc hanh R - Bai tap 4 va thuc hanh R môn kinh tế lượng

HƯỚNG DẪN THỰC HÀNH

Sử dụng dữ liệu của tập tin wage1.csv với các biến:


 wage: tiền lương theo giờ (USD/giờ);
 educ: số năm đi học;
 exper: số năm kinh nghiệm;
 female: biến giả, =1 nếu là nữ và =0 nếu là nam;

Xét mô hình hồi quy sau:


log(wage) = 0 + 1educ + 2exper + 3female + 4educfemale + u
Kết quả hồi quy từ phần mềm R như sau:

> hq1 <- lm(log(wage) ~ educ + exper + female + educ:female, data=wage)


> summary(hq1)

Call:
lm(formula = log(wage) ~ educ + exper + female + educ:female,
data = wage)

Residuals:
Min 1Q Median 3Q Max
-1.89635 -0.26323 -0.03843 0.26973 1.28348

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.461499 0.126747 3.641 0.000299 ***
educ 0.092779 0.008978 10.334 < 2e-16 ***
exper 0.009430 0.001452 6.496 1.93e-10 ***
female -0.295884 0.178793 -1.655 0.098548 .
educ:female -0.003815 0.013975 -0.273 0.784962
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: ????? on 521 degrees of freedom


Multiple R-squared: ????? , Adjusted R-squared: ?????
F-statistic: 70.95 on 4 and 521 DF, p-value: < 2.2e-16

1) Viết hàm hồi quy mẫu và cho biết ý nghĩa của hệ số hồi quy đứng trước biến exper
trong hàm hồi quy mẫu?

2) Tính R2 và Ŕ ?
2

3) Bảng kết quả sau đây dùng để làm gì? Nêu kết luận.
> confint(hq1,level=0.95)
2.5 % 97.5 %
(Intercept) 0.212501746 0.71049710
educ 0.075142275 0.11041628

about:blank 1/7
22:44 30/04/2024 Bai tap 4 va thuc hanh R - Bai tap 4 va thuc hanh R môn kinh tế lượng

exper 0.006578124 0.01228234


female -0.647127437 0.05535971
educ:female -0.031269356 0.02363905

4) Dựa vào hàm hồi quy tổng thể, hãy tìm biểu thức tác động của số năm đi học đến tiền
lương theo giờ? Tác động này có như nhau đối với nam và nữ hay không, xét với mức
ý nghĩa 9%?

5) Cho bảng phân tích phương sai:


> anova(hq1)
Analysis of Variance Table

Response: log(wage)
Df Sum Sq Mean Sq F value Pr(>F)
educ 1 27.561 27.5606 149.5394 < 2.2e-16 ***
exper 1 9.424 9.4244 51.1353 2.934e-12 ***
female 1 15.309 15.3089 83.0634 < 2.2e-16 ***
educ:female 1 0.014 0.0137 0.0745 0.785
Residuals 521 96.022 0.1843
--- (n-(k+1)) (SSR) (xích ma mũ bình phuong)
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Dựa vào bảng này, hãy tính sai số chuẩn hồi quy σ^ ?

6) Bảng kết quả sau đây dùng để làm gì? Nêu cặp giả thuyết H0 và H1? Kết luận với mức ý
nghĩa 2%?
> linearHypothesis(hq1,c("female=0","educ:female=0"))
Linear hypothesis test

Hypothesis:
female = 0
educ:female = 0

Model 1: restricted model


Model 2: log(wage) ~ educ + exper + female + educ:female

Res.Df RSS Df Sum of Sq F Pr(>F)


1 523 111.345
2 521 96.022 2 15.323 41.569 < 2.2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

7) Bảng kết quả sau đây dùng để làm gì? Nêu cặp giả thuyết H0 và H1? Kết luận với mức ý
nghĩa 4%?
> library(lmtest)
> bptest(hq1, ~ fitted(hq1) + I(fitted(hq1)^2))

studentized Breusch-Pagan test

data: hq1

about:blank 2/7
22:44 30/04/2024 Bai tap 4 va thuc hanh R - Bai tap 4 va thuc hanh R môn kinh tế lượng

BP = 7.7447, df = 2, p-value = 0.02081

8) Bảng kết quả sau đây dùng để làm gì? Nêu cặp giả thuyết H0 và H1? Kết luận với mức ý
nghĩa 3%?
> resettest(hq1)

RESET test

data: hq1
RESET = 10.997, df1 = 2, df2 = 519, p-value = 2.1e-05

about:blank 3/7
22:44 30/04/2024 Bai tap 4 va thuc hanh R - Bai tap 4 va thuc hanh R môn kinh tế lượng

HƯỚNG DẪN

1) Hàm hồi quy mẫu:


^
log (wage)=0,4615+0,0928
⁡ educ+ 0,0094 exper−0,2959 female−0,0038 educ × female
^β =0,0094 : trong điều kiện các yếu tố khác không đổi, khi số năm kinh nghiệm tăng
2
1 năm thì tiền lương theo giờ tăng 100x0,0094 = 0,94%.
2) (Xem lại bài thực hành số 2)
Ta có:
R2 / k
F 2
(1  R ) / ( n  ( k  1))
R2 / 4
 70,95 
(1  R 2 ) / 521
2
Suy ra: R  0,3526
n1 526  1
R 2 1 (1 R 2 ). 1 (1 0,3526).  0,3476
Từ đó: n  ( k 1) 521

3) (Xem lại bài thực hành số 1)


Bảng này cho biết khoảng tin cậy 95% của các hệ số hồi quy.
Dựa vào bảng này ta có:
β 0 ∈(0,2125; 0,7105)
β 1 ∈(0,0751 ; 0,1104)

4) Lấy đạo hàm hai vế để tìm tác động biên.


∂ log(⁡wage)
=β 1 +β 4 female
∂ educ
Kiểm định H0: 4 = 0 và H1: 4 ≠ 0
C1: t = - 0,273
Mức ý nghĩa  = 9%   = 0,045
n−(k+1)
Vì bậc tự do df = n – (k + 1) = 521 lớn nên t α / 2 ≈ z α2 =z 0,045=1,695
Vì |t| = 0,273 < z α2 = 1,695 nên ta chấp nhận H0.
Vậy tác động này như nhau đối với nam và nữ.
C2: p-value = 0,784962 >  = 9% nên ta chấp nhận H0.
Vậy tác động này như nhau đối với nam và nữ.
SSR
ˆ 2 
5) Suy ra từ công thức n  ( k  1) .
SSR 96,022
ˆ 2   
n  ( k 1) 521
Ta có:  ˆ  
6) C1: sài kiểm định F
C2:(Xem lại bài thực hành số 1)
Bảng này dùng để kiểm định xem giới tính có tác động đến tiền lương hay không (tiền
lương có như nhau đối với nam và nữ hay không)
H 0:  3 =  4 = 0

about:blank 4/7
22:44 30/04/2024 Bai tap 4 va thuc hanh R - Bai tap 4 va thuc hanh R môn kinh tế lượng

H1: H0 sai.
Vì p-value < 2.2e-16 <  = 2% nên ta bác bỏ H0.
Vậy giới tính có tác động đến tiền lương (tiền lương không như nhau đối với nam và
nữ).
7) Bảng này dùng để kiểm định xem sai số u có phương sai thay đổi hay không. (Chương
8)
H0: Sai số u có phương sai không đổi.
H1: Sai số u có phương sai thay đổi.

8) Bảng này dùng để kiểm định xem mô hình có bị sai dạng hàm (bỏ sót biến) hay không.
(Chương 9)
H0: Mô hình không có bỏ sót biến (không có sai dạng hàm).
H1: Mô hình có bỏ sót biến (có sai dạng hàm).
(nhìn vào p-value để kết luận)

about:blank 5/7
22:44 30/04/2024 Bai tap 4 va thuc hanh R - Bai tap 4 va thuc hanh R môn kinh tế lượng

HƯỚNG DẪN THỰC HÀNH

 Kiểm định phương sai thay đổi:


Cách 1: Dùng kiểm định Breusch-Pagan:
> #Tải gói lệnh lmtest về cài đặt vào máy.
> install.packages("lmtest")
> library(lmtest)

> #Thực hiện kiểm định Breusch-Pagan:


> bptest(hq1)

studentized Breusch-Pagan test

data: hq1
BP = 7.3247, df = 4, p-value = 0.1197
Giả thuyết H0: Sai số u có phương sai không đổi.
Hướng dẫn: nhìn p-value để kết luận.

Cách 2: Dùng kiểm định White:


> bptest(hq1, ~ fitted(hq1) + I(fitted(hq1)^2))

studentized Breusch-Pagan test

data: hq1
BP = 1.0882, df = 2, p-value = 0.5804
Hướng dẫn: nhìn p-value để kết luận.

 Tìm sai số chuẩn cải thiện và kiểm định t với sai số chuẩn cải thiện:
> library(lmtest)
> library(car)
> coeftest(hq1, vcov=hccm)

t test of coefficients:

Estimate Std. Error t value Pr(>|t|)


(Intercept) 6.75880371 0.55129854 12.2598 < 2.2e-16 ***
log(area) 0.52883925 0.08386017 6.3062 9.627e-10 ***
rooms 0.05933127 0.02216327 2.6770 0.0078161 **
baths 0.11909588 0.03570178 3.3359 0.0009517 ***
age -0.00376299 0.00072172 -5.2139 3.349e-07 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Hướng dẫn: Cột Std.Error cho biết các sai số chuẩn cải thiện, cột t value cho biết các giá trị
t khi tính bằng sai số chuẩn cải thiện.

 Kiểm định F với sai số chuẩn cải thiện:


> library(lmtest)
> library(car)
> linearHypothesis(hq1, c("log(area)=0","rooms=0"), vcoc=hccm)

about:blank 6/7
22:44 30/04/2024 Bai tap 4 va thuc hanh R - Bai tap 4 va thuc hanh R môn kinh tế lượng

Linear hypothesis test

Hypothesis:
log(area) = 0
rooms = 0

Model 1: restricted model


Model 2: log(price) ~ log(area) + rooms + baths + age

Res.Df RSS Df Sum of Sq F Pr(>F)


1 318 31.663
2 316 25.595 2 6.0678 37.457 2.521e-15 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Hướng dẫn: nhìn p-value để kết luận.

 Kiểm định bỏ sót biến (sai dạng hàm): Kiểm định Reset
> library(lmtest)
> resettest(hq1)

RESET test

data: hq1
RESET = 6.4577, df1 = 2, df2 = 314, p-value = 0.001785
Giả thuyết H0: Mô hình không có bỏ sót biến (không có sai dạng hàm).
Hướng dẫn: nhìn p-value để kết luận.

2 

about:blank 7/7

You might also like