Professional Documents
Culture Documents
KTL Hoi Quy Boi
KTL Hoi Quy Boi
KTL Hoi Quy Boi
4 Dự báo
Y = β1 + β2 X2 + β3 X3 + u,
E(Y|X) = β1 + β2 X + β3 X3 .
X21 , X31 ⇒ Y1
X22 , X32 ⇒ Y2
...
X2n , X3n ⇒ Yn
Yi = β
b1 + β
b2 X2i + β
b3 X3i + ei ,
trong đó β
b1 , β
b2 , β
b3 là ước lượng cho β1 , β2 , β3 và ei là sai số. Chúng ta
cần xác định hàm hồi quy mẫu như sau
Y
bi = βb1 + β b2 X2i + β
b3 X3i
n
X
Min RSS = (Yi − β
b1 − β b3 X3i )2
b2 X2i − β
i=1
Nguyên lý cực trị (Ferma’s rule) cho ta hệ phương trình sau đây
b = XT X
−1 RSS
XT Y σ2 =
β and b
n−3
Hệ số tương quan
Cov(X, Y)
r(X, Y) := .
se(X)se(Y)
r(X, Y) > 0: giữa X và Y có quan hệ đồng biến.
r(X, Y) < 0: giữa X và Y có quan hệ nghịch biến.
r(X, Y) = ±1: X và Y có quan hệ tuyến tính chặt chẽ.
r(X, Y) ≈ 0: X và Y có quan hệ tuyến tính không chặt chẽ.
Pn
i=1 ei = 0.
(i)
(ii) Đường thẳng hồi quy luôn đi qua điểm (X2 , X3 , Y).
(iii) Trung bình mẫu và trung bình các giá trị hồi quy bằng nhau
Y = Y.
b
(iv) β
b1 , β
b2 , và β
b3 là ước lượng tuyến tính, không chệch, và hiệu quả
của β1 , β2 , và β3 .
E β b1 = β1 , E β b2 = β2 , E β b3 = β3 .
q
Se(β
bi ) = Var(β
bi )
b2 − β
Var(β b3 ) =Var(β b3 ) − 2Cov(β
b2 ) + Var(β b2 , β
b3 ).
Định lý
βbi − βi
t= ∼ T(n − 3)
se β bi
Trong đó
r
se aβ1 + bβ2 = Var aβ
b b b1 + bβb2 ,
Var aβ b2 = a2 Varβ
b1 +bβ b1 + b2 Varβ
b2 +2abCov βb1 , β
b2 .
bi − a
β
t= ∼ T(n − 3)
se βbi
(n−3)
Bên trái βi ⩾ a βi < a t < −tα
(n−3)
Bên phải βi ⩽ a βi > a t > tα
βb2 − β
b3
t= ∼ T(n − 3)
se βb2 − βb3
Trong đó, k là số biến trong mô hình (bao gồm cả biến phụ thuộc).
⋆ Khi dùng R2 để so sánh các mô hình với nhau cần thỏa các điều
kiện sau:
Có cùng cỡ mẫu n.
Cùng số biến độc lập. (Nếu các mô hình không cùng số biến độc
lập, dùng R2 để xác định).
Biến phụ thuộc xuất hiện trong hàm hồi quy có cùng dạng, các
biến độc lập các thể ở các dạng khác nhau.
2
0 ⩽ R ⩽ R2 ⩽ 1
2 2
• R có thể là số âm. R dùng để cân nhắc đưa thêm biến giải thích vào
2
mô hình. Chúng ta chỉ đưa thêm biến mới vào mô hình khi R tăng.
Với mức ý nghĩa α, chúng ta kiểm tra giả thiết và đối thuyết sau
n − k R2
F := . .
k − 1 1 − R2
(U) : Y = β1 + β2 X2 + ... + βk Xk .
(R) : Y = β1 + β2 X2 + ... + βm Xm .
Giả thiết H0 : βm+1 = ... = βk = 0. (các biến tương ứng không ảnh
hưởng đến biến phụ thuộc = không nên đưa những biến này vào MH).
Đối thiết H1 : ∃ βm+1 , ..., βk khác không.
Trị thống kê :
R2U − R2R /(k − m)
FW := .
1 − R2U /(n − k)
Nếu FW > F(α, k − m, n − k) thì ta sẽ bác bỏ H0 với mức ý nghĩa α.
Ví dụ
Ta cần kiểm định các biến X2 ; X4 có cần thiết trong mô hình say hay
không?
Y
b = βb1 + βb2 X2 + βb3 X3 + βb4 X4 + βb5 X5 + βb6 X6
Giả thiết: (
H0 : βb2 = βb4 = 0
H1 : ∃βb2 hoặc βb4 khác 0.
Ta dùng kiểm định Wald: c(2) = c(4) = 0.
q
b 2 T T −1 T
σ X0 (X X) X0 = X0 cov(β)X0 ⇒ se(Y0 ) = Var(Y
Var(Y0 ) = b b b b 0 ).
q
Var(Y0 − Yb0) = bσ 2 + Var(Y
b 0 ) ⇒ se(Y0 − Y
b 0 ) = Var(Y0 − Y
b0)
Cho bảng số liệu về sản lượng (Y), phân hóa học (X2 ), thuốc trừ sâu
(X3 ) đơn vị tính trên một đơn vị diện tích ha.
Y 40 44 46 48 52 58 60 68 74 80
X2 6 10 12 14 16 18 22 24 26 32
X3 4 4 5 7 9 12 14 20 21 24
Với mức ý nghĩa 5%, hãy trả lời các câu hỏi sau:
Cho bảng số liệu về chi tiêu (Y), thu nhập từ lương (X2 ), thu nhập
ngoài lương (X3 ) đơn vị tính triệu đồng.
Y 9 9 11 12 12.5 13 16 17 14 13.5
X2 10 12 13 14 15 16 16 17 18 20
X3 2 0 3 4 4 6 8 9 5 3
Với mức ý nghĩa 5%, hãy trả lời các câu hỏi sau:
Cho bảng số liệu về lượng hàng bán được (Y) (tấn/tháng), thu nhập
của người tiêu dùng (X2 ) (triệu đồng/tháng), giá bán mặt hàng này
(X3 ) (ngàn đồng/kg).
Y 4 4 6 7 6 8 7 9 8 9
X2 2 2 4 4 5 6 5 6 5 7
X3 6 7 7 6 7 5 4 8 7 7
Với mức ý nghĩa 5%, hãy trả lời các câu hỏi sau: