Download as pdf or txt
Download as pdf or txt
You are on page 1of 9

Chương 4: SỰ VI PHẠM GIẢ THIẾT CỦA MÔ HÌNH

I. THEORY
a) Hiện tượng đa cộng tuyến là gì ? Có các loại đa cộng tuyến nào ?
Khi các biến (X2,…, Xk) không độc lập tuyến tính thì có nghĩa là giữa các biến có sự phụ thuộc tuyến
tính. Trong kinh tế lượng gọi hiện tượng này là đa cộng tuyến.
Hay:
Hiện tượng đa cộng tuyến là hiện tượng 1 biến giải thích sẽ phụ thuộc các biến giải thích còn lại, hoặc
ít nhất 2 biến giải thích sẽ phụ thuộc các biến giải thích còn lại.
Phân loại đa cộng tuyến:
- Đa cộng tuyến hoàn hảo (phần được giải thích gần như trung lắp nhau): Tồn tại ít nhất một λi ≠ 0 sao
𝜆 𝜆
cho ∑𝑘𝑖=1 𝜆𝑖 𝑋𝑖 = 0 <=> 𝑋𝑖 = − 𝜆1 𝑋𝑖 −. . … − − 𝜆𝑘 𝑋𝑘
𝑖 𝑖

- Đa cộng tuyến không hoàn hảo (chỉ phụ thuộc 1 phần): Tồn tại sai số ngẫu nhiên (𝜀𝑖 ) sao cho
∑𝑘𝑖=1 𝜆𝑖 𝑋𝑖 + 𝜀𝑖 = 0
 Có nhiều đa cộng tuyến không hoàn hảo hơn, nên gọi tắt là ĐCT (hiểu là không hoàn hảo).
b) Hiện tượng phương sai thay đổi là gì ?
Phương sai của các SSNN khác nhau: Var(𝜀/𝑋 = 𝑋𝑘 ) = 𝜎𝑘2
c) Hiện tượng tự tương quan là gì ?
Tự tương quan là hiện tượng tương quan giữa các phần dư (sai số) với nhau.
Khi các sai số có quan hệ phụ thuộc lẫn nhau thì người ta thường nói đó là hiện tượng tự tương quan.
d) Nếu giá trị trung bình của sai số E(ε) ≠ 0, có vấn đề gì xảy không ?
Giá trị trung bình của SSNN E(ε) ≠ 0 nghĩa là khi H1 bị vi phạm, việc ước lượng, kiểm định tham số (hệ số)
vẫn cực kỳ chính xác nhưng hàm hồi quy sẽ không còn nằm giữ bộ dữ liệu như lúc E(ε) = 0
II. PRATICE
4.1 Mở file “Baitap4.1.dta” tìm hiểu về mối liên hệ giữa Wage (Tiền lương) phụ thuộc vào:
Educ: Số năm đi học
Age: Tuổi
Exper: Số năm kinh nghiệm
a) Thực hiện TẤT CẢ các phương pháp đã học hãy cho biết có hay không hiện tượng đa cộng tuyến?
Nếu có thì xảy ra trên phương pháp nào? Khắc phục nếu xảy ra.
Phát hiện cộng đa tuyến_Phương pháp 1: Dựa vào hệ quả

- Hệ số đứng trước biến Age là -1,9133 < 0 mâu thuẫn với lý thuyết kinh tế vì thâm niên làm việc (tuổi càng
cao) càng có xu hướng lương cao.
- P-value ứng với biến Age là 0,821 > alpha => chấp nhận H0 => biến Age không có ý nghĩa (1)
- Kiểm địnhh F: 0,0005 < alpha => mô hình có ý nghĩa (2)
Kết luận: (1) và (2) mâu thuẫn nhau hay mô hình có hiện tượng cộng đa tuyến ở phương pháp 1.

Phát hiện cộng đa tuyến_Phương pháp 2: Dựa vào hệ số tương quan

- Hệ số tương quan tuyến tính giữa các cặp biến giải thích thấp (<0,7 xem như là không có sự phụ thuộc vào
nhau giữa các biến giải thích)
- Hay ta thấy không có hệ số tương quan nào giữa 2 biến giải thích trong mô hình này lớn hơn 0,8 nên có kết
kết luận không có sự phục thuộc vào nhau giữa các biến giải thích.
Kết luận: Không có hiện tượng đa cộng tuyến xảy ra ở phương pháp 2.
Phát hiện cộng đa tuyến_Phương pháp 3: Dùng mô hình hồi quy phụ
𝐻0 : 𝑅𝑗2 = 0 𝐻0 𝑥ả𝑦 𝑟𝑎 𝑡ℎì 𝑘ℎô𝑛𝑔 𝑐ó Đ𝐶𝑇
{ <=> {
𝐻1 : 𝑅𝑗2 ≠0 𝐻1 𝑥ả𝑦 𝑟𝑎 𝑡ℎì 𝑐ó Đ𝐶𝑇

- TH1: Xây dựng mô hình hồi quy phụ của biến educ theo biến age và exper

Ta có R22 = 0,0758 khá nhỏ


Ta kiểm định cặp giả thuyết trên qua kiểm định có p_value = 0,1632 > 0,05 => chấp nhận H0, mô hình này
không có ý nghĩa

- TH2: Xây dựng mô hình hồi quy phụ của biến age theo biến educ và exper

Ta có R12 = 0,1612 khá nhỏ


Ta kiểm định cặp giả thuyết trên qua kiểm định có p_value = 0,0175 < 0,05 => bác bỏ H0
=> có hiện tượng ĐCT xảy ra.

- TH3: Xây dựng mô hình hồi quy phụ của biến exper theo biến age và educ
Ta có R32= 0,2095 khá nhỏ
Ta kiểm định cặp giả thuyết trên qua kiểm định có p_value = 0,0045 < 0,05 => bác bỏ H0
=> có hiện tượng ĐCT xảy ra.
Kết luận: Ở phương pháp 3, ta thấy vừa có vừa không có DDCT xảy ra. Việc ta cần hiều là biết cách để
phát hiện ra đa cộng tuyến, và các nhà nghiên cứu thường dùng VIF (pp4) hay Corr (pp2), các phương
pháp còn lại thì ít dùng vì nhập nhằng

Phát hiện cộng đa tuyến_Phương pháp 4: Nhân tử phóng đại phương sai
1
Dùng phương pháp nhân tử phóng đại phương sai: 𝑉𝐼𝐹𝑗 = 1−𝑅2
𝑗

1 1
𝑉𝐼𝐹2 = = = 1,0820 < 10 => 𝑘ℎô𝑛𝑔 𝑐ó Đ𝐶𝑇
1 − 𝑅22 1 − 0,0758
1 1
𝑉𝐼𝐹1 = 2 = 1 − 0,1612 = 1,1921 < 10 => 𝑘ℎô𝑛𝑔 𝑐ó Đ𝐶𝑇
1 − 𝑅1
1 1
𝑉𝐼𝐹3 = 2 = 1 − 0,2095 = 1,2650 < 10 => 𝑘ℎô𝑛𝑔 𝑐ó Đ𝐶𝑇
1 − 𝑅3
Kết luận: Không có hiện tượng ĐCT xảy ra ở phương pháp 4.
Kết luận: có hiện tượng ĐCT chỉ xảy ra ở phương pháp 1
Khắc phục bằng cách: ta loại trừ 1 biến giải thích (biến Age) ra khỏi mô hình.
Vì: mô hình khi có tất cả các biến: Adj R-squared = 0,277

Mô hình khi không có biến Age: Adj R-squared = 0,2919 > 0,277 => Loại biến Age là phù hợp.
Các trường hợp của exper và educ thì làm tương tự nhưng đều cho ra kết quả Adj R-squared < 0,277 => không
nên loại exper, educ ra khỏi mô hình.

b) Thực hiện TẤT CẢ các phương pháp đã học hãy cho biết có hay không hiện tượng phương sai thay
đổi ? Nếu có thì xảy ra trên phương pháp nào ? Khắc phục nếu xảy ra.

Phát hiện phương sai thay đổi_Phương pháp 1: Phương pháp đồ thị
reg wage age educ exper
predict wage_hat
gen resid = wage-wage_hat
twoway (scatter resid age)
gen resid2 = resid*resid
twoway (scatter resid2 age)

Có hiện tượng phương sai thay đổi


Kết luận: Có hiện tượng phương sai thay đổi ở phương pháp 1.
Phát hiện phương sai thay đổi_Phương pháp 2: Kiểm định White

Với mức ý nghĩa 5%, ta có p_value = 0,0014 < 0,05 => chấp nhận H1, có hiện tượng phương sai thay đổi.

Kết luận: có hiện tượng phương sai thay đổi xảy ra ở cả PP1 và PP2.
Khắc phục bằng cách: chia trọng số, trọng số là số được tạo ra từ nguyên nhân gây ra phương sai thay
đổi.

Case 1: 𝜎𝑖2 biết trước

=> Ta thấy R2 tăng từ 0,3222 lên 0,6062


Case 2: 𝜎𝑖2 chưa biết
Giải thiết 1: 𝐸(𝜀𝑖2 ) = 𝜎 2 𝑋2𝑖
2
ta đang giả định phương sai thay đổi theo biến X2 (Age)

=> Ta thấy R2 tăng từ 0,3222 lên 0,3333

Giải thiết 2: 𝐸(𝜀𝑖2 ) = 𝜎 2 𝑋2𝑖

=> Ta thấy R2 tăng từ 0,3222 lên 0,3275


Giải thiết 3: 𝐸(𝜀𝑖2 ) = 𝜎 2 (𝐸(𝑌𝑖 ))2 ta giả định phương sai thay đổi theo biến phụ thuộc (Wage)

=> giống lại y chang ban đầu

b) Người ta tìm được một mô hình có kết quả như sau:


. reg wage ln_age educ educ2 exper

Source SS df MS Number of obs = 49


F(4, 44) = 7.05
Model 7877328.16 4 1969332.04 Prob > F = 0.0002
Residual 12294783.8 44 279426.904 R-squared = 0.3905
Adj R-squared = 0.3351
Total 20172112 48 420252.332 Root MSE = 528.61

wage Coefficient Std. err. t P>|t| [95% conf. interval]

ln_age 31.83766 342.199 0.09 0.926 -657.819 721.4944


educ -228.6184 170.006 -1.34 0.186 -571.243 114.0062
educ2 27.48793 12.34117 2.23 0.031 2.615943 52.35992
exper 43.54635 13.77332 3.16 0.003 15.78804 71.30465
_cons 1523.326 1296.496 1.17 0.246 -1089.59 4136.242

Trong đó
- ln_age là log(age); educ2 = educ * educ
Ta có: wage = 1523,3 + 31,8ln_age – 228,6educ + 27,5educ2 + 43,5exper
i) Hãy giải thích ý nghĩa các hệ số đứng trước các biến giải thích ln_age, exper ?
31,8 có nghĩa là khi ln_age tăng 1% trong trường hợp các yếu tố khác không đổi thì tiền lương tăng 0,318 đơn
vị và ngược lại.
43,5 có nghĩa là khi số năm kinh nghiệm của một người tăng 1 năm thì tiền lương tăng thêm trung bình 43,5
đơn vị trong trường hợp các yếu tố khác không đổi.

ii) Kiểm định tính có ý nghĩa của mô hình với mức ý nghĩa 5%.
Cặp giả thuyết cần kiểm định:
H0: R2 = 0
H1: R2 ≠ 0
Ta có p-value = 0,0002 < 0,05 => Chấp nhận H1
Vậy mô hình thật sự phù hợp, với mức ý nghãi 5%.

iii) Trong điều kiện giống nhau về ln_age và exper (ln_age; exper không đổi) thì hãy cho biết wage đạt
cực đại khi educ là bao nhiêu? (lấy đạo hàm theo educ là tìm được)
wage = 1523,3 + 31,8ln_age – 228,6educ + 27,5educ2 + 43,5exper
Lấy đạo hàm theo educ, ta được: wage’educ = -228,6 + 55educ
Để wage đặt cực đại  wage’educ = 0  educ = 4,156

You might also like