Professional Documents
Culture Documents
2023. 4. Mô hình hồi quy đa biến
2023. 4. Mô hình hồi quy đa biến
2023. 4. Mô hình hồi quy đa biến
Môn học
KINH TẾ LƯỢNG
Giảng viên
HOÀNG SƠN TÙNG
CHƯƠNG 4
MÔ HÌNH
HỒI QUY ĐA BIẾN
1
13/10/2023
Đặt vấn đề
• Xét phương trình tiền lương:
𝑤𝑎𝑔𝑒 = 𝛽0 + 𝛽1 𝑒𝑑𝑢𝑐 + 𝜀
• Tham số ε bao gồm tất cả các yếu tố khác ngoài trình độ kiến thức được
đào tạo như sự thông minh, tuổi
• Mô hình trên chỉ thể hiện được sự phụ thuộc của lương vào thời gian
đào tạo mà không thể hiện được các yếu tố ảnh hưởng khác nên sẽ gây
ra các biến động khó giải thích được trong tham số ε
=> Cần bổ sung thêm các biến độc lập và mô hình hồi quy để giải thích
thêm các yếu tố tác động lên biến phụ thuộc
• Mô hình với một biến phụ thuốc vào nhiều biến độc lập được gọi là mô
hình hồi quy bội hay mô hình hồi quy đa biến
2
13/10/2023
3
13/10/2023
𝛽𝑘
𝒀𝒊 = 𝑿′𝒊 𝜷 + 𝜺𝒊 4.1
4
13/10/2023
Đặt
𝑌1 𝛽0
𝑌= 𝑌2 𝛽= 𝛽1
… …
𝑌𝑛 𝛽𝑘
1 𝑋11 𝑋21 … 𝑋𝑘1
1 𝑋12 𝑋22 … 𝑋𝑘2 𝜀0
𝑋= … … … … … 𝜀= 𝜀1
…
𝜀𝑛
1 𝑋1𝑛 𝑋2𝑛 … 𝑋𝑘𝑛
Thì dạng ma trận của phương trình 4.2 là
𝒀 = 𝑿𝜷 + 𝜺
5
13/10/2023
Ngoài ra, mô hình hồi quy tuyến tính đa biến còn có 2 giả thiết bổ sung
9. Không nhận dạng sai mô hình (không sai dạng hàm, không thiếu biến
quan trọng và thừa biến không quan trọng)
10.Không có hiện tượng đa cộng tuyến hoàn hảo trong mô hình
6
13/10/2023
⇔ (𝑌𝑖 − 𝑌𝑖 ) = (𝑌𝑖 − 𝛽መ0 − 𝛽መ1 𝑋1𝑖 − ⋯ − 𝛽መ𝑘 𝑋𝑘𝑖 )2 = 𝜑(𝛽መ𝑗 ) ⟶ 𝑚𝑖𝑛
2
𝑖=1 𝑖=1
Khi đó, các hệ số hồi qui 𝛽መ0 , 𝛽መ1 , … , 𝛽መ𝑘 là nghiệm của hệ phương trình
𝜑𝛽′ = 0
ቐ 𝑗
𝑗 = 0, 1, 2 … 𝑘
7
13/10/2023
2
𝑇 𝑋1𝑖 𝑋1𝑖 𝑋1𝑖 𝑋2𝑖 ⋯ 𝑋1𝑖 𝑋𝑘𝑖
𝑋 𝑌=
⋮ ⋮ ⋮ ⋮ ⋮
2
𝑋𝑘𝑖 𝑋𝑘𝑖 𝑋1𝑖 𝑋𝑘𝑖 𝑋2𝑖 ⋯ 𝑋𝑘𝑖
8
13/10/2023
2
σ 𝑋1𝑖 𝑌𝑖 σ 𝑋2𝑖 − σ 𝑋1𝑖 𝑋2𝑖 σ 𝑋2𝑖 𝑌𝑖 4.4
𝛽መ1 = 2 2
σ 𝑋1𝑖 σ 𝑋2𝑖 − (σ 𝑋1𝑖 𝑋2𝑖 )2
9
13/10/2023
2
σ 𝑋2𝑖
𝑣𝑎𝑟 𝛽መ1 = 2 σ 2 ∗ 𝜎2
σ 𝑋1𝑖 𝑋2𝑖 − (σ 𝑋1𝑖 𝑋2𝑖 )2 4.5
2
σ 𝑋1𝑖
𝑣𝑎𝑟 𝛽መ2 = 2 σ 2 ∗ 𝜎2
σ 𝑋1𝑖 𝑋2𝑖 − (σ 𝑋1𝑖 𝑋2𝑖 )2
10
13/10/2023
Hệ số xác định
Ta có:
𝑌𝑖 = 𝑌𝑖 + 𝑒𝑖
𝑛
⇔ 𝑌𝑖 − 𝑌ത =𝑛 𝑌𝑖 − 𝑌ത + 𝑒𝑖 𝑛
2
ത = 𝑌𝑖 − 𝑌ത
⇒ (𝑌𝑖 − 𝑌) 2
+ 𝑒𝑖2
𝑖=1 𝑖=1 𝑖=1
11
13/10/2023
Hệ số xác định
TSS = ESS + RSS
Đặt
𝐸𝑆𝑆 𝑅𝑆𝑆
𝑅2 = =1− (0 ≤ 𝑅 2 ≤ 1)
𝑇𝑆𝑆 𝑇𝑆𝑆
Nhận xét:
• Khi thêm biến vào mô hình thì k tăng
• TSS không phụ thuộc k nên không đổi
• ESS phụ thuộc k nên tăng => RSS giảm => 𝑅 2 tăng
=> Do đó, không thể dùng 𝑅 2 để xem xét việc có nên đưa thêm biến vào
mô hình hay không
12
13/10/2023
Sử dụng 𝑹
ഥ 𝟐 để quyết định đưa thêm biến vào mô hình
𝑌𝑖 = 𝛽መ0 + 𝛽መ1 𝑋1𝑖 𝑌𝑖 = 𝛽መ0 + 𝛽መ1 𝑋1𝑖 + 𝛽መ2 𝑋2𝑖
𝑅12 𝑅22
𝑅ത12 𝑅ത22
• Nếu 𝑅ത12 > 𝑅ത22 thì chọn mô hình Nguyên tắc so sánh:
(1), tức là không cần đưa thêm • Cùng cỡ mẫu
biến 𝑋2 vào mô hình • Cùng các biến độc lập
• Ngược lại, ta chọn mô hình (2) • Biến phụ thuộc phải ở dạng
giống nhau
• Biến độc lập có thể ở bất cứ
dạng nào
13
13/10/2023
𝛽መ𝑖 − 𝛽𝑖
⇒ ~𝑇(𝑛 − 𝑘)
𝑠𝑒 𝛽መ𝑖
𝑛−𝑘−1 𝑛−𝑘−1
𝑃 𝛽መ𝑖 − 𝑡𝛼ൗ 𝑠𝑒 𝛽መ𝑖 ≤ 𝛽𝑖 ≤ 𝛽መ𝑖 + 𝑡𝛼ൗ 𝑠𝑒 𝛽መ𝑖 = 1−𝛼
2 2
14
13/10/2023
15
13/10/2023
(𝑹𝑺𝑺𝑹 − 𝑹𝑺𝑺𝑼 )
൘(𝒎 + 𝟏) (𝑹𝟐 − 𝑹𝟐 )(𝒏 − 𝒌 − 𝟏)
𝑼 𝑹
𝑭𝒘 = =
𝑹𝑺𝑺𝑼 (𝒎 + 𝟏)(𝟏 − 𝑹𝟐𝑼 )
ൗ(𝒏 − 𝒌 − 𝟏)
Nếu 𝐹𝑤 > 𝐹𝛼 𝑚 + 1, 𝑛 − 𝑘 − 1 thì bác bỏ 𝐻0
𝑹𝟐ൗ 𝑹𝟐 (𝒏 − 𝒌 − 𝟏)
𝑭𝒄 = 𝒌 =
(𝟏 − 𝑹𝟐 )ൗ (𝟏 − 𝑹𝟐 )𝒌
𝒏−𝒌−𝟏
Nếu 𝐹𝑐 > 𝐹𝛼 𝑘, 𝑛 − 𝑘 − 1 thì bác bỏ 𝐻0
16
13/10/2023
17
13/10/2023
PHỤ LỤC
BẢNG KẾT XUẤT DỮ LIỆU
18
13/10/2023
19
13/10/2023
ANOVA
df SS
Regression 2 41.86719168
Residual 9 14.79947499
Total 11 56.66666667
Standard
t Stat P-value Lower 95% Upper 95%
Coefficients Error
Intercept 129.0616 88.3033 1.4616 0.1746 -67.6903 325.8136
SQFT 0.1548 0.0319 4.8465 0.0007 0.0836 0.2260
BATHS -12.1928 43.2500 -0.2819 0.7838 -108.5598 84.1743
BEDRMS -21.5875 27.0293 -0.7987 0.4430 -81.8126 38.6376
Hết chương 4
20