Professional Documents
Culture Documents
BT_Chương 4_Sự vi phạm giả thuyết (1)
BT_Chương 4_Sự vi phạm giả thuyết (1)
I. THEORY
a) Hiện tượng đa cộng tuyến là gì ? Có các loại đa cộng tuyến nào ?
Khi các biến (X2,…, Xk) không độc lập tuyến tính thì có nghĩa là giữa các biến có sự phụ thuộc tuyến
tính. Trong kinh tế lượng gọi hiện tượng này là đa cộng tuyến.
Hay:
Hiện tượng đa cộng tuyến là hiện tượng 1 biến giải thích sẽ phụ thuộc các biến giải thích còn lại, hoặc
ít nhất 2 biến giải thích sẽ phụ thuộc các biến giải thích còn lại.
Phân loại đa cộng tuyến:
- Đa cộng tuyến hoàn hảo (phần được giải thích gần như trung lắp nhau): Tồn tại ít nhất một λi ≠ 0 sao
𝜆 𝜆
cho ∑𝑘𝑖=1 𝜆𝑖 𝑋𝑖 = 0 <=> 𝑋𝑖 = − 𝜆1 𝑋𝑖 −. . … − − 𝜆𝑘 𝑋𝑘
𝑖 𝑖
- Đa cộng tuyến không hoàn hảo (chỉ phụ thuộc 1 phần): Tồn tại sai số ngẫu nhiên (𝜀𝑖 ) sao cho
∑𝑘𝑖=1 𝜆𝑖 𝑋𝑖 + 𝜀𝑖 = 0
Có nhiều đa cộng tuyến không hoàn hảo hơn, nên gọi tắt là ĐCT (hiểu là không hoàn hảo).
b) Hiện tượng phương sai thay đổi là gì ?
Phương sai của các SSNN khác nhau: Var(𝜀/𝑋 = 𝑋𝑘 ) = 𝜎𝑘2
c) Hiện tượng tự tương quan là gì ?
Tự tương quan là hiện tượng tương quan giữa các phần dư (sai số) với nhau.
Khi các sai số có quan hệ phụ thuộc lẫn nhau thì người ta thường nói đó là hiện tượng tự tương quan.
d) Nếu giá trị trung bình của sai số E(ε) ≠ 0, có vấn đề gì xảy không ?
Giá trị trung bình của SSNN E(ε) ≠ 0 nghĩa là khi H1 bị vi phạm, việc ước lượng, kiểm định tham số (hệ số)
vẫn cực kỳ chính xác nhưng hàm hồi quy sẽ không còn nằm giữ bộ dữ liệu như lúc E(ε) = 0
II. PRATICE
4.1 Mở file “Baitap4.1.dta” tìm hiểu về mối liên hệ giữa Wage (Tiền lương) phụ thuộc vào:
Educ: Số năm đi học
Age: Tuổi
Exper: Số năm kinh nghiệm
a) Thực hiện TẤT CẢ các phương pháp đã học hãy cho biết có hay không hiện tượng đa cộng tuyến?
Nếu có thì xảy ra trên phương pháp nào? Khắc phục nếu xảy ra.
Phát hiện cộng đa tuyến_Phương pháp 1: Dựa vào hệ quả
- Hệ số đứng trước biến Age là -1,9133 < 0 mâu thuẫn với lý thuyết kinh tế vì thâm niên làm việc (tuổi càng
cao) càng có xu hướng lương cao.
- P-value ứng với biến Age là 0,821 > alpha => chấp nhận H0 => biến Age không có ý nghĩa (1)
- Kiểm địnhh F: 0,0005 < alpha => mô hình có ý nghĩa (2)
Kết luận: (1) và (2) mâu thuẫn nhau hay mô hình có hiện tượng cộng đa tuyến ở phương pháp 1.
- Hệ số tương quan tuyến tính giữa các cặp biến giải thích thấp (<0,7 xem như là không có sự phụ thuộc vào
nhau giữa các biến giải thích)
- Hay ta thấy không có hệ số tương quan nào giữa 2 biến giải thích trong mô hình này lớn hơn 0,8 nên có kết
kết luận không có sự phục thuộc vào nhau giữa các biến giải thích.
Kết luận: Không có hiện tượng đa cộng tuyến xảy ra ở phương pháp 2.
Phát hiện cộng đa tuyến_Phương pháp 3: Dùng mô hình hồi quy phụ
𝐻0 : 𝑅𝑗2 = 0 𝐻0 𝑥ả𝑦 𝑟𝑎 𝑡ℎì 𝑘ℎô𝑛𝑔 𝑐ó Đ𝐶𝑇
{ <=> {
𝐻1 : 𝑅𝑗2 ≠0 𝐻1 𝑥ả𝑦 𝑟𝑎 𝑡ℎì 𝑐ó Đ𝐶𝑇
- TH1: Xây dựng mô hình hồi quy phụ của biến educ theo biến age và exper
- TH2: Xây dựng mô hình hồi quy phụ của biến age theo biến educ và exper
- TH3: Xây dựng mô hình hồi quy phụ của biến exper theo biến age và educ
Ta có R32= 0,2095 khá nhỏ
Ta kiểm định cặp giả thuyết trên qua kiểm định có p_value = 0,0045 < 0,05 => bác bỏ H0
=> có hiện tượng ĐCT xảy ra.
Kết luận: Ở phương pháp 3, ta thấy vừa có vừa không có DDCT xảy ra. Việc ta cần hiều là biết cách để
phát hiện ra đa cộng tuyến, và các nhà nghiên cứu thường dùng VIF (pp4) hay Corr (pp2), các phương
pháp còn lại thì ít dùng vì nhập nhằng
Phát hiện cộng đa tuyến_Phương pháp 4: Nhân tử phóng đại phương sai
1
Dùng phương pháp nhân tử phóng đại phương sai: 𝑉𝐼𝐹𝑗 = 1−𝑅2
𝑗
1 1
𝑉𝐼𝐹2 = = = 1,0820 < 10 => 𝑘ℎô𝑛𝑔 𝑐ó Đ𝐶𝑇
1 − 𝑅22 1 − 0,0758
1 1
𝑉𝐼𝐹1 = 2 = 1 − 0,1612 = 1,1921 < 10 => 𝑘ℎô𝑛𝑔 𝑐ó Đ𝐶𝑇
1 − 𝑅1
1 1
𝑉𝐼𝐹3 = 2 = 1 − 0,2095 = 1,2650 < 10 => 𝑘ℎô𝑛𝑔 𝑐ó Đ𝐶𝑇
1 − 𝑅3
Kết luận: Không có hiện tượng ĐCT xảy ra ở phương pháp 4.
Kết luận: có hiện tượng ĐCT chỉ xảy ra ở phương pháp 1
Khắc phục bằng cách: ta loại trừ 1 biến giải thích (biến Age) ra khỏi mô hình.
Vì: mô hình khi có tất cả các biến: Adj R-squared = 0,277
Mô hình khi không có biến Age: Adj R-squared = 0,2919 > 0,277 => Loại biến Age là phù hợp.
Các trường hợp của exper và educ thì làm tương tự nhưng đều cho ra kết quả Adj R-squared < 0,277 => không
nên loại exper, educ ra khỏi mô hình.
b) Thực hiện TẤT CẢ các phương pháp đã học hãy cho biết có hay không hiện tượng phương sai thay
đổi ? Nếu có thì xảy ra trên phương pháp nào ? Khắc phục nếu xảy ra.
Phát hiện phương sai thay đổi_Phương pháp 1: Phương pháp đồ thị
reg wage age educ exper
predict wage_hat
gen resid = wage-wage_hat
twoway (scatter resid age)
gen resid2 = resid*resid
twoway (scatter resid2 age)
Với mức ý nghĩa 5%, ta có p_value = 0,0014 < 0,05 => chấp nhận H1, có hiện tượng phương sai thay đổi.
Kết luận: có hiện tượng phương sai thay đổi xảy ra ở cả PP1 và PP2.
Khắc phục bằng cách: chia trọng số, trọng số là số được tạo ra từ nguyên nhân gây ra phương sai thay
đổi.
Trong đó
- ln_age là log(age); educ2 = educ * educ
Ta có: wage = 1523,3 + 31,8ln_age – 228,6educ + 27,5educ2 + 43,5exper
i) Hãy giải thích ý nghĩa các hệ số đứng trước các biến giải thích ln_age, exper ?
31,8 có nghĩa là khi ln_age tăng 1% trong trường hợp các yếu tố khác không đổi thì tiền lương tăng 0,318 đơn
vị và ngược lại.
43,5 có nghĩa là khi số năm kinh nghiệm của một người tăng 1 năm thì tiền lương tăng thêm trung bình 43,5
đơn vị trong trường hợp các yếu tố khác không đổi.
ii) Kiểm định tính có ý nghĩa của mô hình với mức ý nghĩa 5%.
Cặp giả thuyết cần kiểm định:
H0: R2 = 0
H1: R2 ≠ 0
Ta có p-value = 0,0002 < 0,05 => Chấp nhận H1
Vậy mô hình thật sự phù hợp, với mức ý nghãi 5%.
iii) Trong điều kiện giống nhau về ln_age và exper (ln_age; exper không đổi) thì hãy cho biết wage đạt
cực đại khi educ là bao nhiêu? (lấy đạo hàm theo educ là tìm được)
wage = 1523,3 + 31,8ln_age – 228,6educ + 27,5educ2 + 43,5exper
Lấy đạo hàm theo educ, ta được: wage’educ = -228,6 + 55educ
Để wage đặt cực đại wage’educ = 0 educ = 4,156