Download as pdf or txt
Download as pdf or txt
You are on page 1of 5

TUẦN 7

3.1 Với topic “Các yếu tố ảnh hưởng đến trọng lượng của trẻ sơ sinh” bạn hãy
xác định:
a) Dependent variable and set nickname for the dependent variable (0.25đ)
- Biến phụ thuộc: Trọng lượng của trẻ sơ sinh
- Nickname: PB
b) At least 04 independent variables and set nicknames for them (1đ)
4 biến ĐL + nickname
(Mỗi biến 0,25)
- 04 biến độc lập kèm nickname:
+ Số ngày trong thai kỳ (TG)
+ Lượng thuốc lá tiêu thụ của người mẹ trong thai kỳ (TL)
+ Lượng rượu tiêu thụ của người mẹ trong thai kỳ (RU)
+ Lượng tăng cân của người mẹ trong thai kỳ (TC)
+ …
c) Write model multi regression, function multi regression in total for the
topic
- Mô hình hồi quy đa biến: Y = f (TG, TL, RU, TC) + ε (0.25đ)
- Hàm hồi quy đa biến trên tổng thể: (0.25đ)
f (TG, TL, RU, TC) = β1 + β2𝑇𝐺 + β3𝑇𝐿 + β4𝑅𝑈 + β5𝑇𝐶
d) What is error (ε) in the topic? Give some variables to show for ε
(ε) là sai số ngẫu nhiên, phản ánh sự phụ thuộc của (PB) vào các biến khác. (0.25đ)
(ε) có thể là: (0.25đ)
+ Lượng bia tiêu thụ của người mẹ trong thai kỳ
+ Cân nặng của người mẹ trước thai kỳ
+ …
e) Write function multi regression in sample (0.25đ)
Hàm hồi quy tuyến tính đa biến trên mẫu:
𝑌 = β1 + β2 * 𝑇𝐺 + β3 * 𝑇𝐿 + β4 * 𝑅𝑈 + β5 * 𝑇𝐶

3.2 Với file “Ch1-3.xlsx”, sheet “Baitap3.1” với mô hình hồi quy đa biến
Price = f (Total_area, Duration, No_of_bedroom, No_of_bathroom ,Travel_time,
Distance, Popu_density ) + ε
a) Hãy tìm hàm hồi quy mẫu. Giải thích ý nghĩa các hệ số đứng trước các biến
giải thích
- Từ kết quả trên Stata, ta có:
Hàm hồi quy mẫu: (0.5đ)
𝑌 = - 878.5516 + 26.14256*Ta + 31.20864*Du + 173.6698*Nbed + 589.975*Nbath
- 7.080617*Tt - 44.71645*Dis + 0.0030008*Pd

- Giải thích ý nghĩa: (1.75đ)


Ý nghĩa 7 hệ số
(Mỗi hệ số 0,25)

+) 26.14256 cho biết khi Total_area tăng 1 đơn vị (m2) thì Price tăng trung bình
26.14256 đơn vị (triệu đồng) trong điều kiện 6 biến giải thích được xét còn lại trong
mô hình hồi quy không đổi
+) 31.20864 cho biết khi Duration tăng 1 đơn vị (năm) thì Price tăng trung bình
31.20864 đơn vị (triệu đồng) trong điều kiện 6 biến giải thích được xét còn lại trong
mô hình hồi quy không đổi
+) 173.6698 cho biết khi No_of_bedroom tăng 1 đơn vị thì Price tăng trung bình
173.6698 đơn vị (triệu đồng) trong điều kiện 6 biến giải thích được xét còn lại trong
mô hình hồi quy không đổi
+) 589.975 cho biết khi No_of_bathroom tăng 1 đơn vị thì Price tăng trung bình
589.975 đơn vị (triệu đồng) trong điều kiện 6 biến giải thích được xét còn lại trong
mô hình hồi quy không đổi
+) - 7.080617 cho biết khi Travel_time tăng 1 đơn vị (phút) thì Price tăng trung bình
- 7.080617 đơn vị (triệu đồng) trong điều kiện 6 biến giải thích được xét còn lại trong
mô hình hồi quy không đổi
+) - 44.71645 cho biết khi Distance tăng 1 đơn vị (km) thì Price tăng trung bình
- 44.71645 đơn vị (triệu đồng) trong điều kiện 6 biến giải thích được xét còn lại trong
mô hình hồi quy không đổi
+) 0.0030008 cho biết khi Popu_density tăng 1 đơn vị thì Price tăng trung bình
0.0030008 đơn vị (triệu đồng) trong điều kiện 6 biến giải thích được xét còn lại trong
mô hình hồi quy không đổi

b) Tìm R-square, giải thích ý nghĩa ?


- Từ kết quả trên Stata, ta có: R-squared = 0.4792 (0.25đ)
- Ý nghĩa: R-squared = 0.4792 cho biết 100% sự biến động của Price (Y) được giải
thích qua 47.92% sự biến động của Total_area, Duration, No_of_bedroom,
No_of_bathroom, Travel_time, Distance, Popu_density và 52.08% sự biến động
của các nguyên nhân khác (0.25đ)

3.3 Với file “Ch1-3.xlsx”, sheet “Baitap3.1” với mô hình hồi quy đa biến
Price = f (Total_area, Duration, No_of_bedroom, No_of_bathroom,Travel_time,
Distance, Popu_density) + ε
a) Tìm Adjust R-squared và cho biết ý nghĩa của nó

- Từ kết quả trên Stata, ta có: Adjust R-squared = 0.4735 (0.25đ)


- Ý nghĩa: Trong hồi quy đa biến hệ số Adjust R-squared được sử dụng để đo lường sự
phù hợp của mô hình. Khi thêm biến vào mô hình, nếu biến này có ý nghĩa thì Adjust
R-squared tăng, ngược lại Adjust R-squared không tăng (0.25đ)

b) Để chọn lựa được mô hình phù hợp bạn sẽ bỏ đi các biến không có ý nghĩa,
Tìm mô hình phù hợp nhất (giả thiết mô hình phù hợp nhất là mô hình có Adjust
R-squared lớn nhất) (1đ)
- Adjust R-squared lớn nhất = 0,4742
→ Mô hình phù hợp nhất: PB = - 907,7551 + 25,98084*Ta + 33,08768*Du +
593,8964*Nbath - 50,38943*Dis + 169,8839*Nbed
c) Sự khác biệt giữa R-squared và Adjust R-squared là gì trong hồi quy đa biến
(1đ)
Trong hồi quy đa biến hệ số Adjusted R-squared được sử dụng để đo lường sự phù hợp
của mô hình, còn R-squared được dùng để giải thích % sự thay đổi của Y theo các biến
giải thích khi đã chọn lựa được mô hình phù hợp (kiểm định sự phù hợp)

3.4 Với file “Ch1-3.xlsx”, sheet “Baitap3.1” với mô hình hồi quy đa biến
Price = f(Total_area, Duration, No_of_bedroom, No_of_bathroom
,Travel_time, Distance, Popu_density ) + ε
a) Ước lượng các tham số với độ tin cậy 95% (2đ)
Ước lượng các t.số
(Mỗi ts 0,25)
Y = β1 + β2*Ta + β3*Du + β4*Nbed + β5*Nbath + β6*Tt + β7*Dis + β8*Pd

β1 ∈ (-1804,567; 47,4639)
β2 ∈ (22,0948; 30,19032)
β3 ∈ (4,909835; 57,50744)
β4 ∈ (-82,31116; 429,6507)
β5 ∈ (327,3078; 852,6422)
β6 ∈ (-22,66258; 8,501348)
β7 ∈ (-72,14376; -17,28914)
β8 ∈ (-0,009015; 0,0150166)

b) Kiểm định tính có ý nghĩa của các tham số đứng trước các biến giải thích
với mức ý nghĩa 5%. Có bao nhiêu cách để kiểm định tính có ý nghĩa của
các tham số này ? Trình bày ngắn gọn. (0.25đ)
- Với mức ý nghĩa 5% (hay độ tin cậy 95%):
+ Tham số β2 có ý nghĩa vì p-value = 0.00 < α = 0.05
+ Tham số β3 có ý nghĩa vì p-value = 0.02 < α = 0.05
+ Tham số β4 không có ý nghĩa vì p-value = 0.183 > α = 0.05
+ Tham số β5 có ý nghĩa vì p-value = 0.00 < α = 0.05
+ Tham số β6 không có ý nghĩa vì p-value = 0.373 > α = 0.05
+ Tham số β7 có ý nghĩa vì p-value = 0.001 < α = 0.05
+ Tham số β8 không ý nghĩa vì p-value = 0.624 > α = 0.05
- Có 03 cách kiểm định tham số:
+ Cách 1: Sử dụng p-value:
● Với giá trị p-value < α → Tham số cần kiểm định có nghĩa.
● Với giá trị p-value > α → Tham số cần kiểm định không có nghĩa.
+ Cách 2: Ước lượng khoảng tin cậy của tham số:
● Nếu giá trị 0 thuộc khoảng tin cậy → Tham số cần kiểm định không có ý nghĩa
● Nếu giá trị 0 nằm ngoài khoảng tin cậy → Tham số cần kiểm định có ý nghĩa
+ Cách 3: Sử dụng T-stat (có 3 hình thức kiểm định):
𝑛−𝑘 𝑛−𝑘
● Kiểm định 2 bên, nếu giá trị kiểm định 𝑇0 thuộc khoảng (- 𝑡α/2 ; 𝑡α/2 ) thì tham
số có nghĩa và ngược lại.
𝑛−𝑘
● Kiểm định bên trái, nếu giá trị kiểm định 𝑇0 nhỏ hơn - 𝑡α/2 thì tham số có nghĩa
và ngược lại.
𝑛−𝑘
● Kiểm định bên phải, nếu giá trị kiểm định 𝑇0 lớn hơn 𝑡α/2 thì tham số có nghĩa
và ngược lại

You might also like