Hồi Quy Số Tiền Bỏ Ra Mua Bình Nước Giữ Nhiệt Theo Độ Tuổi

You might also like

Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 21

CÂU 1:

Hồi quy số tiền bỏ ra mua bình nước giữ nhiệt theo độ tuổi.
> hqtuoi <- lm(gia ~ tuoi, data = thermos)
> summary(hqtuoi)

Call:
lm(formula = gia ~ tuoi, data = thermos)

Residuals:
Min 1Q Median 3Q Max
-3.5754 -0.7811 -0.0754 0.7189 3.1303

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -10.6048 3.4072 -3.113 0.00225 **
tuoi 0.7943 0.1682 4.722 5.57e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.391 on 141 degrees of freedom


Multiple R-squared: 0.1366, Adjusted R-squared: 0.1304
F-statistic: 22.3 on 1 and 141 DF, p-value: 5.569e-06

Khi độ tuổi tăng thêm 1 tuổi thì số tiền bỏ ra mua bình tăng 0.7943 trăm ngàn đồng.

Hồi quy số tiền bỏ ra mua bình nước theo thu nhập.

> hqthunhap <- lm(gia ~ thunhap, data = thermos)


> summary(hqthunhap)

Call:
lm(formula = gia ~ thunhap, data = thermos)

Residuals:
Min 1Q Median 3Q Max
-5.2753 0.0152 0.0676 0.2771 0.8257

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.08960 0.12196 25.33 <2e-16 ***
thunhap 0.94761 0.04244 22.33 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.7031 on 141 degrees of freedom


Multiple R-squared: 0.7795, Adjusted R-squared: 0.778
F-statistic: 498.6 on 1 and 141 DF, p-value: < 2.2e-16

Nếu thu nhập tăng thêm 1 triệu đồng mộ t tháng thì số tiền bỏ ra mua bình giữ nhiệt
tăng lên 0.94761 trăm ngàn đồng.
Hồi quy số tiền bỏ ra mua bình giữ nhiệt theo dung tích bình
> hqdungtich <- lm(gia ~ dungtich, data = thermos)
> summary(hqdungtich)

Call:
lm(formula = gia ~ dungtich, data = thermos)

Residuals:
Min 1Q Median 3Q Max
-3.4120 -0.6687 -0.2836 0.6522 4.5880

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4.7700 0.3820 12.487 <2e-16 ***
dungtich 1.2839 0.6578 1.952 0.0529 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.478 on 141 degrees of freedom


Multiple R-squared: 0.02631, Adjusted R-squared: 0.0194
F-statistic: 3.81 on 1 and 141 DF, p-value: 0.05294

Khi dung tích bình tăng thêm 1 lít thì số tiền bỏ ra mua bình tăng 1.2839 trăm ngàn
đồng.

Hồi quy số tiền bỏ ra mua bình theo thời gian giữ nhiệt của bình

> hqtggiunhiet <- lm(gia ~ tggiunhiet, data = thermos)


> summary(hqtggiunhiet)

Call:
lm(formula = gia ~ tggiunhiet, data = thermos)

Residuals:
Min 1Q Median 3Q Max
-3.4475 -0.5202 -0.4353 0.5586 4.5647

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.37470 0.25608 20.988 <2e-16 ***
tggiunhiet 0.01213 0.02687 0.451 0.652
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.496 on 141 degrees of freedom


Multiple R-squared: 0.001442, Adjusted R-squared: -0.00564
F-statistic: 0.2036 on 1 and 141 DF, p-value: 0.6525

Khi thời gian giữ nhiệt của bình tăng thêm 1 giờ thì số tiền bỏ ra mua bình tăng 0.01213
trăm ngàn đồng.
Hồi quy số tiền bỏ ra mua bình giữ nhiệt theo số giờ trung bình ở ngoài
đường mộ t ngày của sinh viên.
> hqsogiongoaidg <- lm(gia ~ sogiongoaiduong, data = thermos)
> summary(hqsogiongoaidg)

Call:
lm(formula = gia ~ sogiongoaiduong, data = thermos)

Residuals:
Min 1Q Median 3Q Max
-3.5501 -0.6683 -0.1955 0.6272 4.6863

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.07735 0.30025 16.910 <2e-16 ***
sogiongoaiduong 0.05910 0.04057 1.457 0.147
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.486 on 141 degrees of freedom


Multiple R-squared: 0.01483, Adjusted R-squared: 0.007842
F-statistic: 2.122 on 1 and 141 DF, p-value: 0.1474

Khi số giờ trung bình ở ngoài đường mộ t ngày tăng thêm 1 giờ thì số tiền bỏ ra mua bình
tăng 0.0591 trăm ngàn đồng.

Hồi quy số tiền bỏ ra mua bình theo thời gian bảo hành

> hqtgbaohanh <- lm(gia ~ tgbaohanh, data = thermos)


> summary(hqtgbaohanh)

Call:
lm(formula = gia ~ tgbaohanh, data = thermos)

Residuals:
Min 1Q Median 3Q Max
-3.4598 -0.5793 -0.3801 0.5801 4.6000

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.34025 0.25122 21.257 <2e-16 ***
tgbaohanh 0.01992 0.03209 0.621 0.536
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.495 on 141 degrees of freedom


Multiple R-squared: 0.002726, Adjusted R-squared: -0.004347
F-statistic: 0.3855 on 1 and 141 DF, p-value: 0.5357

Khi thời gian bảo hành của bình tăng thêm 1 tháng thì số tiền bỏ ra mua bình tăng
0.01992 trăm ngàn đồng.
Hồi quy theo biến có R2 lớn nhất
Chọn biến định lượng thunhap
Hồi quy số tiền bỏ ra mua bình giữ nhiệt (trăm ngàn đồng) theo thu nhập mộ t tháng
(triệu đồng)
- Mô hình hồi quy tuyến tính

> hqthunhap <- lm(gia ~ thunhap, data = thermos)


> summary(hqthunhap)

Call:
lm(formula = gia ~ thunhap, data = thermos)

Residuals:
Min 1Q Median 3Q Max
-5.2753 0.0152 0.0676 0.2771 0.8257

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.08960 0.12196 25.33 <2e-16 ***
thunhap 0.94761 0.04244 22.33 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.7031 on 141 degrees of freedom


Multiple R-squared: 0.7795, Adjusted R-squared: 0.778
F-statistic: 498.6 on 1 and 141 DF, p-value: < 2.2e-16

Nếu thu nhập tăng thêm 1 triệu đồng mộ t tháng thì số tiền bỏ ra mua bình giữ nhiệt
tăng 0.94761 trăm ngàn đồng.

- Mô hình hồi quy Lin – Log


> hqthunhapln_log <- lm(gia ~ log(thunhap), data = thermos)
> summary(hqthunhapln_log)

Call:
lm(formula = gia ~ log(thunhap), data = thermos)

Residuals:
Min 1Q Median 3Q Max
-4.1799 -0.3367 0.1417 0.2769 1.9913

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.8583 0.0962 40.11 <2e-16 ***
log(thunhap) 2.1329 0.0988 21.59 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.7217 on 141 degrees of freedom


Multiple R-squared: 0.7677, Adjusted R-squared: 0.7661
F-statistic: 466 on 1 and 141 DF, p-value: < 2.2e-16
Nếu thu nhập mộ t tháng tăng 1% thì số tiền bỏ ra mua bình giữ nhiệt tăng
2.1329
= 0.021329 trăm ngàn đồng.
100

- Mô hình hồi quy qua gốc tọa độ

> hqthunhapgtd <- lm(gia ~ 0 + thunhap, data = thermos)


> summary(hqthunhapgtd)

Call:
lm(formula = gia ~ 0 + thunhap, data = thermos)

Residuals:
Min 1Q Median 3Q Max
-7.8371 0.3314 1.2210 1.8430 2.5829

Coefficients:
Estimate Std. Error t value Pr(>|t|)
thunhap 1.88952 0.04803 39.34 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.651 on 142 degrees of freedom


Multiple R-squared: 0.9159, Adjusted R-squared: 0.9154
F-statistic: 1547 on 1 and 142 DF, p-value: < 2.2e-16

Nếu thu nhập mộ t tháng tăng thêm 1 triệu đồng thì số tiền bỏ ra mua bình giữ
nhiệt của sinh viên tăng 1.8895 trăm ngàn đồng.

-Mô hình hồi quy theo hàm bậ c 2

> hqbac2 <- lm(gia ~ thunhap + I(thunhap^2), data = thermos)


> summary(hqbac2)

Call:
lm(formula = gia ~ thunhap + I(thunhap^2), data = thermos)

Residuals:
Min 1Q Median 3Q Max
-4.9649 -0.0667 0.0195 0.4202 0.9645

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.63922 0.20036 13.172 < 2e-16 ***
thunhap 1.31407 0.13748 9.558 < 2e-16 ***
I(thunhap^2) -0.05719 0.02046 -2.796 0.00591 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.6867 on 140 degrees of freedom


Multiple R-squared: 0.7912, Adjusted R-squared: 0.7882
F-statistic: 265.2 on 2 and 140 DF, p-value: < 2.2e-16
∂ gia
= 1.31407 – 2 x (0.05719)thunhap
∂ thunhap

Khi thu nhập tăng lên từ 1 triệu đồng/tháng lên 2 triệu đồng/tháng thì số tiền bỏ ra mua
bình nước giữ nhiệt tăng 1.31407 – 2 x (0.05719)(1) = 1.19969 trăm ngàn đồng.

b) BẢNG SO SÁNH

Tiêu chí Tuyến tính Lin-log Qua góc Bậc 2


tọa độ
AIC 309.0568 316.5236 552.1605 303.2888
BIC 317.9453 325.4121 558.0862 315.1402
Cp Mallow -10.2565 -3.3555 575.6796 -15.0634
R2 hiệu chỉnh 0.7780 0.7661 0.9154 0.7882

Hàm bậc 2 có mô hình tốt trong 4 mô hình này (vì có AIC, BIC, Cp Mallow nhỏ và R2 hiệu
chỉnh lớn).
- Mô hình hồi quy Log – Lin

> hqthunhaplog_ln <- lm(log(gia) ~ thunhap, data = thermos)


> summary(hqthunhaplog_ln)
Call:
lm(formula = log(gia) ~ thunhap, data = thermos)

Residuals:
Min 1Q Median 3Q Max
-0.99885 -0.00258 0.03621 0.04893 0.18461

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.23403 0.02924 42.20 <2e-16 ***
thunhap 0.16960 0.01017 16.67 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.1686 on 141 degrees of freedom


Multiple R-squared: 0.6633, Adjusted R-squared: 0.661
F-statistic: 277.8 on 1 and 141 DF, p-value: < 2.2e-16

Nếu thu nhập mộ t tháng tăng thêm 1 triệu đồng thì số tiền bỏ ra mua bình giữ
nhiệt tăng 0.1696x100 = 16.96%.
- Mô hình hồi quy tuyến tính log

> hqthunhaplog_log <- lm(log(gia) ~ log(thunhap), data = thermos)


> summary(hqthunhaplog_log)

Call:
lm(formula = log(gia) ~ log(thunhap), data = thermos)

Residuals:
Min 1Q Median 3Q Max
-0.83897 -0.02449 0.02314 0.06485 0.16109

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.34508 0.01823 73.80 <2e-16 ***
log(thunhap) 0.41671 0.01872 22.26 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.1367 on 141 degrees of freedom


Multiple R-squared: 0.7785, Adjusted R-squared: 0.7769
F-statistic: 495.6 on 1 and 141 DF, p-value: < 2.2e-16

Nếu thu nhập mộ t tháng tăng 1% thì số tiền bỏ ra mua bình giữ nhiệt của sinh
viên tăng 0.41671%.

d) Trong hai mô hình log-lin và truyến tính log thì nên chọn mô hình tuyến tính
log vì R2 lớn hơn.
CÂU 2:

3 biến định lượng tác độ ng nhiều nhất lên y là: tuoi, thunhap, dungtich
2 biến định tính tác độ ng nhiều nhất lên y là: L.L, nang
Chạy hồi quy gia theo (β1)tuoi, (β2)thunhap, (β3)dungtich, (δ1)L.L,
(δ2)nang

> # chay hoi quy theo 3 bien dinh luong 2 bien dinh tinh
> hoiquycau2 <- lm(gia ~ tuoi + thunhap + dungtich + L.L + nang, data =
thermos)
> summary(hoiquycau2)

Call:
lm(formula = gia ~ tuoi + thunhap + dungtich + L.L + nang, data = thermos)

Residuals:
Min 1Q Median 3Q Max
-5.2687 -0.0328 0.0727 0.3335 0.9241

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4.54110 1.93401 2.348 0.0203 *
tuoi -0.07158 0.09706 -0.737 0.4621
thunhap 0.97099 0.05109 19.007 <2e-16 ***
dungtich 0.03040 0.32476 0.094 0.9255
L.L -0.11036 0.13801 -0.800 0.4253
nang 0.05505 0.36665 0.150 0.8809
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.7101 on 137 degrees of freedom
Multiple R-squared: 0.7815, Adjusted R-squared: 0.7735
F-statistic: 98 on 5 and 137 DF, p-value: < 2.2e-16

Thực hiện các kiểm định


2.1.1:
 H0: β1 = 0; H1: β1 ≠ 0 ,α = 0.05
-Phương pháp giá trị tới hạn:
|t| = 0.737 < t(0.025)(137)=1.960 => Chấp nhận H0
-Phương pháp p-value:
p_value(2 phía) = 0.4621 > 0.05 => Chấp nhận H0
2.1.2
 H0: β1 = 0; H1: β1 < 0 ,α = 0.05
-Phương pháp giá trị tới hạn:
t = -0.737 > - t0.05(137)= -1.645 => Chấp nhận H0
-Phương pháp p-value:
0.4621
p_value(1 phía) = > 0.05 => Chấp nhận H0
2

2.1.3,4

 H0 : 2=0,1 ; H1: 2 ≠ 0,1 , α = 0.05


-Phương pháp giá trị tới hạn:
|t| = 0.1225995 < t(0.025)(137)=1.960 => Chấp nhận H0
-Phương pháp p-value:
p_value(2 phía) = 0.9026039> 0.05 => Chấp nhận H0
 H0 : 2=0,1 ; H1: 2 > 0,1 , α = 0.05
-Phương pháp giá trị tới hạn:
t = -0.1225995 < t(0.05)(137)= 1.645 => Chấp nhận H0
-Phương pháp p-value:
0.9026039
p_value(1 phía) = = 0.4513 > 0.05 => Chấp nhận H0
2

2.1.5
Kiểm định F

> linearHypothesis(hoiquycau2, c("nang=0.1"))


Linear hypothesis test

Hypothesis:
nang = 0.1

Model 1: restricted model


Model 2: gia ~ tuoi + thunhap + dungtich + L.L + nang

Res.Df RSS Df Sum of Sq F Pr(>F)


1 138 69.088
2 137 69.080 1 0.007579 0.015 0.9026

 H0 : 2 = 0,1 ; H1: 2 ≠ 0,1 , α = 0.05


F = 0.015 < F(0.05)(1,137)= 3.84 => chấp nhận H0
p_value = 0.9026 > 0.05 => chấp nhận H0
2.2
(dùng kiểm định Wald)

> linearHypothesis(hoiquycau2, c("tuoi=0", "thunhap=3","L.L=1"))


Linear hypothesis test

Hypothesis:
tuoi = 0
thunhap = 3
L.L = 1

Model 1: restricted model


Model 2: gia ~ tuoi + thunhap + dungtich + L.L + nang

Res.Df RSS Df Sum of Sq F Pr(>F)


1 140 1310.93
2 137 69.08 3 1241.8 820.95 < 2.2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

H0: β1 = 0, β2 = 3, 1 = 1; H1: H0 sai, α = 0.05


F = 820.95 > F(0.05)(3,137) = 2.60 => Bác bỏ H0
p-value = 0.0000 < 0.05 => Bác bỏ H0
2.3
Kiểm định tất cả các hệ số góc của mô hình đều bằng 0
H0: β1 = 0, β2 = 0, β3 = 0, 1 = 0, 2 = 0
H1: H0 là sai
α = 0.05

>
linearHypothesis(hoiquycau2,c("tuoi=0","thunhap=0","dungtich=0","L.L=0","na
ng=0"))

Linear hypothesis test

Hypothesis:
tuoi = 0
thunhap = 0
dungtich = 0
L.L = 0
nang = 0

Model 1: restricted model


Model 2: gia ~ tuoi + thunhap + dungtich + L.L + nang

Res.Df RSS Df Sum of Sq F Pr(>F)


1 142 316.16
2 137 69.08 5 247.08 98.004 < 2.2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

F = 98.004 > F(0.05)(5,137) = 2.21 => Bác bỏ H0


p-value = 0,0000 < 0.05 => Bác bỏ H0
Vậy tất cả các biến độ c lập có ý nghĩa thống kê đồng thời, tại mức ý nghĩa 5%.
2.4
Xác định khoảng tin cậy 95% cho β3

> hoiquycau2 <- lm(gia ~ tuoi + thunhap + dungtich + L.L + nang, data =
thermos)
> summary(hoiquycau2)

Call:
lm(formula = gia ~ tuoi + thunhap + dungtich + L.L + nang, data = thermos)

Residuals:
Min 1Q Median 3Q Max
-5.2687 -0.0328 0.0727 0.3335 0.9241

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4.54110 1.93401 2.348 0.0203 *
tuoi -0.07158 0.09706 -0.737 0.4621
thunhap 0.97099 0.05109 19.007 <2e-16 ***
dungtich 0.03040 0.32476 0.094 0.9255
L.L -0.11036 0.13801 -0.800 0.4253
nang 0.05505 0.36665 0.150 0.8809
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.7101 on 137 degrees of freedom


Multiple R-squared: 0.7815, Adjusted R-squared: 0.7735
F-statistic: 98 on 5 and 137 DF, p-value: < 2.2e-16

> #Khoang tin cay 95%


> confint(hoiquycau2, level = 0.95)

2.5 % 97.5 %

(Intercept) 0.7167208 8.3654811


tuoi -0.2635127 0.1203531
thunhap 0.8699679 1.0720041
dungtich -0.6117793 0.6725865
L.L -0.3832540 0.1625407
nang -0.6699707 0.7800692

α = 0.05
^ ^
Khỏang tin cậy 95% của β3: β 3= β 3 ± t 0.05 ( 137 ) . se ( β 3 ) ≈ 0.03040± 1.960*0.32476
2

hoặc (-0.6117 ; 0.6725)


2.5
Giá trị trung bình của các biến tuoi, thunhap, dungtich

> mean(tuoi)
[1] 20.24476
> mean(thunhap)
[1] 2.517832
> mean(dungtich)
[1] 0.5495105

Dự đoán giá trị trung bình của gia khi các biến tuoi = 20, thunhap = 2.5, dungtich = 0.55,
L.L = 1, nang = 0, với độ tin cậy 94%.

> #Du bao khoang cho gia tri trung binh

> cvalues <- data.frame(tuoi=20,thunhap=2.5,dungtich=0.55,L.L=1,nang=0)


> predict(hoiquycau2,cvalues,interval ="confidence", level = 0.94)
fit lwr upr
5.443335 5.301231 5.585439

Khoảng tin cậy dự đoán 94% cho số tiền trung bình bỏ ra mua bình nước giữ nhiệt là
(5.301231 : 5.585439)

2.6
Xác định đa cộ ng tuyến giữa các biến độ c lập

> vif(hoiquycau2)
tuoi thunhap dungtich L.L nang
1.278594 1.420538 1.055402 1.088239 1.036581

VIF < 10 : các biến độ c lập có đa cộ ng tuyến thấp
2.7 Kiểm định xem phần dư có phân phối chuẩn hay không

> phandu = resid(hoiquycau2)


> jarqueberaTest(phandu)

Title:
Jarque - Bera Normalality Test

Test Results:
STATISTIC:
X-squared: 3946.2898
P VALUE:
Asymptotic p Value: < 2.2e-16

H0: Phần dư có phân phối chuẩn


H1: Phần dư không có phân phối chuẩn
p-value = 0.0000 < 0.05 => Bác bỏ H0
Vậy phần dư không có phân phối chuẩn, với mức ý nghĩa 5%.

2.8
Ý nghĩa của β1
Giữ các yếu tố khác không đổi, khi độ tuổi của sinh viên tăng thêm 1 tuổi thì số tiền bỏ
ra mua bình nước giữ nhiệt giảm 0.0715 trăm ngàn đồng.
Ý nghĩa của 1
Giữ các yếu tố khác không đổi, số tiền sinh viên bỏ ra mua bình nước giữ nhiệt hiệu
Lock&Lock thấp hơn số tiền bỏ ra mua bình nước của các hãng khác là 0.11036 trăm
nghìn đồng.
CÂU 3
Chạy hồi quy gia theo tuoi(1), thunhap(2), dungtich(3), L.L(1), nang(2), tuoi*L.L(3),
thunhap*nang(4)

> hoiquycau3 <- lm(gia ~ tuoi + thunhap + dungtich + L.L + nang + tuoi:L.L

+ thunhap:nang,data = thermos)
> summary(hoiquycau3)

Call:
lm(formula = gia ~ tuoi + thunhap + dungtich + L.L + nang + tuoi:L.L +
thunhap:nang, data = thermos)

Residuals:
Min 1Q Median 3Q Max
-5.2658 -0.0047 0.0859 0.2316 0.8967

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 7.14289 4.21743 1.694 0.0926 .
tuoi -0.20022 0.20894 -0.958 0.3396
thunhap 0.96252 0.05403 17.815 <2e-16 ***
dungtich 0.04881 0.33767 0.145 0.8853
L.L -3.42274 4.66918 -0.733 0.4648
nang -0.11297 0.87364 -0.129 0.8973
tuoi:L.L 0.16432 0.23140 0.710 0.4789
thunhap:nang 0.05034 0.22890 0.220 0.8263
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.7139 on 135 degrees of freedom


Multiple R-squared: 0.7824, Adjusted R-squared: 0.7711
F-statistic: 69.33 on 7 and 135 DF, p-value: < 2.2e-16

3.1

> linearHypothesis(hoiquycau3, c("L.L=0","nang=0","tuoi:L.L=0",


"thunhap:nang"))
Linear hypothesis test

Hypothesis:
L.L = 0
nang = 0
tuoi:L.L = 0
thunhap:nang = 0

Model 1: restricted model


Model 2: gia ~ tuoi + thunhap + dungtich + L.L + nang + tuoi:L.L +
thunhap:nang

Res.Df RSS Df Sum of Sq F Pr(>F)


1 139 69.416
2 135 68.805 4 0.61119 0.2998 0.8777

H0 : 1=0, 2= 0, 3= 0, 4= 0; H1: H0 là sai, α = 0.05


F = 0.2998 < F(0.05)(4,135) = 2.37 => Chấp nhận H0
p-value = 0.8777 > 0.05 => Chấp nhận H0

3.2
Ý nghĩa:
Vậy những yếu tố về nhãn hiệu và trọng lượng của bình (nặng hay nhẹ) đều không ảnh
hưởng đến số tiền bỏ ra mua bình giữ nhiệt của sinh viên.

CÂU 4
4.1
Dùng kiểm định Breusch-Pagan để kiểm định phương sai thay đổi
Phương pháp LM

> bptest(hoiquycau3)

studentized Breusch-Pagan test

data: hoiquycau3
BP = 6.7789, df = 7, p-value = 0.4523

H0: phương sai không đổi


H1: phương sai thay đổi
p-value = 0.4523 > 0.05 => Chấp nhận H0
Vậy phương sai không đổi
Dùng kiểm định White để kiểm định phương sai thay đổi
Phương pháp LM

> #White day du

> bptest(hoiquycau3, ~ I(tuoi^2) + I(thunhap^2) + I(dungtich^2) + I(L.L^2) + I(nang^2) +


I((tuoi*L.L)^2) + I((thunhap*nang)^2)+(tuoi*thunhap) + (tuoi*dungtich) + (tuoi*L.L) +
(tuoi*nang) + (tuoi*(tuoi*L.L)) + (tuoi*(thunhap*nang))+(thunhap*dungtich) + (thunhap*L.L) +
(thunhap*nang) + (thunhap*(tuoi*L.L)) + (thunhap*(thunhap*nang))+(dungtich*L.L) +
(dungtich*nang) + (dungtich*(tuoi*L.L)) + (dungtich*(thunhap*nang))+(L.L*nang) +
(L.L*(tuoi*L.L)) + (L.L*(thunhap*nang))+(nang*(tuoi*L.L)) + (nang*(thunhap*nang))+
(tuoi*L.L)*(thunhap*nang),data=thermos)

studentized Breusch-Pagan test

data: hoiquycau3
BP = 31.385, df = 20, p-value = 0.05031

H0: phương sai không đổi


H1: phương sai thay đổi
p-value = 0.05031 > 0.05 => Chấp nhận H0
Vậy phương sai không đổi

Câu 5
Thực hiện kiểm định RESET với y^2, y^3.

> resettest(hoiquycau3)

RESET test

data: hoiquycau3
RESET = 9.4146, df1 = 2, df2 = 133, p-value = 0.00015

H0: Mô hình có dạng hàm đúng


H1: Mô hình có dạng hàm sai
p-value = 0.00015 < 0.05 => Bác bỏ H0
Vậy mô hình có dạng hàm sai.

Thực hiện kiểm định RESET với y^2, y^3, y^4

> resettest(hoiquycau3, power = 2:4, type = "fitted")

RESET test

data: hoiquycau3
RESET = 6.2465, df1 = 3, df2 = 132, p-value = 0.0005347

H0: Mô hình có


H1: Mô hình có dạng hàm sai
p-value = 0.0005347 < 0.05 => Bác bỏ H0
Vậy mô hình có dạng hàm sai.
CÂU 6
Chạy mô hình có tất cả các biến khảo sát.

> full_model = lm(gia ~ ., data = thermos)


> summary(full_model)

Call:
lm(formula = gia ~ ., data = thermos)

Residuals:
Min 1Q Median 3Q Max
-4.6983 -0.1410 0.0750 0.3289 1.0026

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.974592 2.214486 1.795 0.0754 .
tuoi -0.035253 0.109982 -0.321 0.7492
nam -0.073392 0.156994 -0.467 0.6411
thunhap 0.947779 0.055688 17.020 <2e-16 ***
sogiongoaiduong 0.019852 0.023101 0.859 0.3920
dungtich -0.118063 0.399846 -0.295 0.7683
tggiunhiet 0.002187 0.015124 0.145 0.8853
tgbaohanh 0.001204 0.018064 0.067 0.9470
hopkim -0.140546 0.255630 -0.550 0.5835
inox -0.235726 0.246255 -0.957 0.3405
inox201 0.038426 0.232581 0.165 0.8691
inox304 -0.154154 0.166062 -0.928 0.3553
tren2nam 0.173990 0.173064 1.005 0.3169
codaytreo -0.014792 0.172199 -0.086 0.9317
zebra -0.182701 0.359480 -0.508 0.6123
helmich 0.017952 0.361952 0.050 0.9605
L.L -0.198409 0.302316 -0.656 0.5130
chai -0.065315 0.291548 -0.224 0.8231
caothon 0.143304 0.228737 0.627 0.5323
sang 0.109150 0.136336 0.801 0.4251
nang 0.148434 0.411426 0.361 0.7189
comltra 0.172214 0.147669 1.166 0.2460
kmit -0.276842 0.207408 -1.335 0.1847
kmnhieu -0.265787 0.228208 -1.165 0.2466
cohoatiet 0.194051 0.149558 1.297 0.1971
CHSec 0.293230 0.332132 0.883 0.3792
HQ 0.075041 0.176661 0.425 0.6718
TL 0.124351 0.235453 0.528 0.5985
sieuthi -0.324292 0.431566 -0.751 0.4540
cuahang -0.129160 0.440678 -0.293 0.7700
muanang 0.137394 0.176572 0.778 0.4381
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.7358 on 112 degrees of freedom


Multiple R-squared: 0.8082, Adjusted R-squared: 0.7568
F-statistic: 15.73 on 30 and 112 DF, p-value: < 2.2e-16
Dùng Cp để lựa chọn bỏ biến

> cpbien <- regsubsets(gia ~ ., nbest = 30, data = thermos)


> plot(cpbien,scale="Cp")

Dựa trên tiêu chí Cp của Mallows, các biến được giữ lại là thunhap, sogiongoaiduong,
inox, tren2nam, helmich, L.L, chai, caothon, comltra, cohoatiet, sieuthi.

You might also like