Professional Documents
Culture Documents
Logit - Probit
Logit - Probit
Logit - Probit
KINH TẾ LƯỢNG
CÁC MÔ HÌNH NHỊ NGUYÊN
Võ Thị Lệ Uyển
VTLU KTL 2 / 42
SƠ LƯỢC VỀ MÔ HÌNH RA QUYẾT ĐỊNH
Giới thiệu
VTLU KTL 3 / 42
SƠ LƯỢC VỀ MÔ HÌNH RA QUYẾT ĐỊNH
Giới thiệu
VTLU KTL 3 / 42
SƠ LƯỢC VỀ MÔ HÌNH RA QUYẾT ĐỊNH
Giới thiệu
VTLU KTL 3 / 42
SƠ LƯỢC VỀ MÔ HÌNH RA QUYẾT ĐỊNH
Giới thiệu
VTLU KTL 3 / 42
SƠ LƯỢC VỀ MÔ HÌNH RA QUYẾT ĐỊNH
Giới thiệu
VTLU KTL 4 / 42
SƠ LƯỢC VỀ MÔ HÌNH RA QUYẾT ĐỊNH
Giới thiệu
VTLU KTL 4 / 42
SƠ LƯỢC VỀ MÔ HÌNH RA QUYẾT ĐỊNH
Giới thiệu
VTLU KTL 4 / 42
MÔ HÌNH XÁC SUẤT TUYẾN TÍNH
Xét trường hợp biến phụ thuộc nhận bằng 1 (nếu có tính chất nghiên
cứu), bằng 0 (nếu không có tính chất nghiên cứu)
Y = β1 + β2 X2 + · · · + βk Xk + ui ,
VTLU KTL 5 / 42
MÔ HÌNH XÁC SUẤT TUYẾN TÍNH
Xét trường hợp biến phụ thuộc nhận bằng 1 (nếu có tính chất nghiên
cứu), bằng 0 (nếu không có tính chất nghiên cứu)
Y = β1 + β2 X2 + · · · + βk Xk + ui ,
⇒ Mô hình được ước lượng bằng phương pháp Least Square, giá trị
ước lượng thu được của Y , Yb , là xác suất.
VTLU KTL 5 / 42
MÔ HÌNH XÁC SUẤT TUYẾN TÍNH
Ví dụ về mô hình LPM I
Ví dụ
Xét bộ dữ liệu gồm 100 quan sát về bệnh tim bẩm sinh gồm:
VTLU KTL 6 / 42
MÔ HÌNH XÁC SUẤT TUYẾN TÍNH
Ví dụ về mô hình LPM II
VTLU KTL 7 / 42
MÔ HÌNH XÁC SUẤT TUYẾN TÍNH
VTLU KTL 8 / 42
MÔ HÌNH XÁC SUẤT TUYẾN TÍNH
Ví dụ về mô hình LPM IV
Kết quả dự báo bằng mô hình hồi quy tuyến tính
VTLU KTL 9 / 42
MÔ HÌNH XÁC SUẤT TUYẾN TÍNH
Không mô tả hết sự biến động của các biến động của biến độc
lập.
VTLU KTL 10 / 42
MÔ HÌNH XÁC SUẤT TUYẾN TÍNH
Không mô tả hết sự biến động của các biến động của biến độc
lập.
Không đảm bảo các giá trị ước lượng ra xác suất nằm trong
đoạn [0;1]
VTLU KTL 10 / 42
MÔ HÌNH XÁC SUẤT TUYẾN TÍNH
Không mô tả hết sự biến động của các biến động của biến độc
lập.
Không đảm bảo các giá trị ước lượng ra xác suất nằm trong
đoạn [0;1]
Không đảm bảo phân phối chuẩn của phần dư.
VTLU KTL 10 / 42
MÔ HÌNH XÁC SUẤT TUYẾN TÍNH
Không mô tả hết sự biến động của các biến động của biến độc
lập.
Không đảm bảo các giá trị ước lượng ra xác suất nằm trong
đoạn [0;1]
Không đảm bảo phân phối chuẩn của phần dư.
Nhiễu có phương sai sai số thay đổi.
VTLU KTL 10 / 42
MÔ HÌNH XÁC SUẤT TUYẾN TÍNH
Không mô tả hết sự biến động của các biến động của biến độc
lập.
Không đảm bảo các giá trị ước lượng ra xác suất nằm trong
đoạn [0;1]
Không đảm bảo phân phối chuẩn của phần dư.
Nhiễu có phương sai sai số thay đổi.
⇒ Mô hình LPM không phải là sự lựa chọn ưa thích để mô hình hóa
các biến phụ thuộc nhị phân.
VTLU KTL 10 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH LOGIT
Mô hình Logit
Trong trường hợp biến phụ thuộc là biến định tính, chỉ có hai
biểu hiện – tương ứng nhận hai giá trị 0 và 1.
Phương pháp này xác định
VTLU KTL 11 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH LOGIT
Mô hình Logit
Tuyến tính hóa ta có
pi
ln = β1 + β2 xi
1 − pi
Với
pi
được gọi là tỉ lệ cược có giá trị thuộc 0 đến +∞
1 − pi
pi
Suy ra: ln 1−p i
có giá trị thuộc(−∞; +∞).
Đặt
pi
Li = ln + ϵi = β1 + β2 xi + ϵi
1 − pi
VTLU KTL 12 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH LOGIT
Mô hình Logit
Nhận xét:
p biến thiên từ 0 đến 1, L biến thiên từ −∞ đến +∞.
VTLU KTL 13 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH LOGIT
Mô hình Logit
Nhận xét:
p biến thiên từ 0 đến 1, L biến thiên từ −∞ đến +∞.
L là hàm tuyến tính của x, nhưng xác suất không là hàm tuyến
tính của x.
VTLU KTL 13 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH LOGIT
Mô hình Logit
Nhận xét:
p biến thiên từ 0 đến 1, L biến thiên từ −∞ đến +∞.
L là hàm tuyến tính của x, nhưng xác suất không là hàm tuyến
tính của x.
pi
Tỉ lệ cược 1−p i
phản ánh cơ hội, khả năng y = 1.
• Nghĩa là, nếu xác suất của một sự kiện là 0.5 thì tỷ lệ cược là
1:1, trong khi nếu xác suất là 0.1 thì tỷ lệ cược là 1:9.
• Khi pi → 0 thì tỉ lệ cược cũng dần đến 0. Khi pi → 1 thì tỉ lệ
cược sẽ dần đến +∞.
• Khi pi tăng thì Odds tăng và ngược lại.
pi
Do 1−p i
phản ánh cơ hội, khả năng y = 1, nên β2 cho biết mức
thay đổi của L (ln cơ hội y = 1) khi x tăng 1 đơn vị.
VTLU KTL 13 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH LOGIT
Mô hình Logit
Nhận xét:
p biến thiên từ 0 đến 1, L biến thiên từ −∞ đến +∞.
L là hàm tuyến tính của x, nhưng xác suất không là hàm tuyến
tính của x.
pi
Tỉ lệ cược 1−p i
phản ánh cơ hội, khả năng y = 1.
• Nghĩa là, nếu xác suất của một sự kiện là 0.5 thì tỷ lệ cược là
1:1, trong khi nếu xác suất là 0.1 thì tỷ lệ cược là 1:9.
• Khi pi → 0 thì tỉ lệ cược cũng dần đến 0. Khi pi → 1 thì tỉ lệ
cược sẽ dần đến +∞.
• Khi pi tăng thì Odds tăng và ngược lại.
pi
Do 1−p i
phản ánh cơ hội, khả năng y = 1, nên β2 cho biết mức
thay đổi của L (ln cơ hội y = 1) khi x tăng 1 đơn vị.
Giá trị β1 cho biết ln của khả năng y = 1 khi x = 0.
VTLU KTL 13 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH LOGIT
Ví dụ
VTLU KTL 14 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH LOGIT
pi
Ý nghĩa các ước lượng của mô hình: ln 1−pi
= β1 + β2 xi + ϵi
Hệ số ước lượng là 0.1109,
Với khoảng tin cậy 95% là (0.0637, 0.1580).
⇒ Điều này có nghĩa là khi tuổi tăng lên 1 năm thì tỷ lệ mắc bệnh
CHD cũng tăng lên với thừa số là e 0.1109 = 1.117 lần.
VTLU KTL 15 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH LOGIT
Ví dụ
VTLU KTL 16 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH LOGIT
pi
Ý nghĩa các ước lượng của mô hình: 1−pi
= β1 + β2 xi + ϵi
Tỷ lệ cược là 1.117,
Với khoảng tin cậy 95% là (1.07, 1.17).
⇒ Điều này có nghĩa là khi tuổi tăng lên 1 năm thì tỷ lệ mắc bệnh
CHD cũng tăng lên với thừa số là 1.117 lần.
VTLU KTL 17 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH LOGIT
VTLU KTL 18 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH LOGIT
VTLU KTL 19 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH LOGIT
⇒ Tỉ lệ odds là:
oddsfemale 0.25
Odds ratio = = = 0.15(= e −1.90 )
oddsmale 1.67
Ý nghĩa: Odds của Nữ bằng 0.15 lần Odds của Nam, hay sinh
viên nam có tỷ lệ bỏ học cao hơn sinh viên nữ.
VTLU KTL 20 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH LOGIT
VTLU KTL 21 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH LOGIT
VTLU KTL 22 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH LOGIT
VTLU KTL 24 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH LOGIT
VTLU KTL 25 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH LOGIT
VTLU KTL 26 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH LOGIT
VTLU KTL 27 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH LOGIT
VTLU KTL 28 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH LOGIT
⇒ Với mỗi tuổi tăng thêm, khả năng bị bệnh cao hơn 0.029.
VTLU KTL 29 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH LOGIT
VTLU KTL 30 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH PROBIT
Giới thiệu I
Hàm phân phối chuẩn tắc có thể được sử dụng như một
hàm liên quan đến xác suất với biến phụ thuộc là
P(Y = 1):
Z x
′ 1 u2
P(Y = 1) = Φ(X β), với Φ(x) = √ e − 2 du
2π −∞
Suy ra:
P(Y = 0) = 1 − Φ(x).
VTLU KTL 31 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH PROBIT
Giới thiệu II
Nhận xét
• Hạn chế chính của mô hình này là không có khả năng giải thích các
hệ số trong hồi quy.
• Tuy nhiên, dấu của các hệ số ước lượng vẫn có ý nghĩa: nếu hệ số
dương, thì sự gia tăng của một biến độc lập dẫn đến sự gia
tăng xác suất P(Y = 1) và ngược lại.
VTLU KTL 32 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH PROBIT
VTLU KTL 33 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH PROBIT
Mô hình Probit
VTLU KTL 34 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH PROBIT
Ví dụ
Ví dụ
VTLU KTL 37 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH PROBIT
VTLU KTL 38 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH PROBIT
VTLU KTL 39 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH PROBIT
VTLU KTL 40 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH PROBIT
VTLU KTL 41 / 42
MÔ HÌNH NHỊ NGUYÊN MÔ HÌNH PROBIT
VTLU KTL 42 / 42