Download as pdf or txt
Download as pdf or txt
You are on page 1of 59

TBP

Chương 5

BIẾN ĐỊNH TÍNH

TBP 5/26/2023
TBP
5.1. Khái niệm biến định tính

Các biến độc lập Xi trong các mô hình đã


nghiên cứu thông thường là những biến định
lượng, giá trị quan sát là những con số
Ví dụ: Thu nhập, chi tiêu, chi phí, doanh thu .v.v..

Tuy nhiên có những trường hợp các biến độc


lập này là những biến định tính.
Ví dụ : tốt – xấu, cao – thấp, nhanh – chậm…
TBP 5/26/2023
TBP
5.1. Khái niệm biến định tính

Biến định tính thường biểu thị có hay không có


một tính chất hoặc là các mức độ khác nhau của
một tiêu thức thuộc tính nào đó
Ví dụ : giới tính (nam hay nữ), tôn giáo, dân tộc, nơi
sinh, hình thức sở hữu, ngành nghề kinh doanh .v.v…

Để lượng hoá các biến định tính, trong phân tích


hồi quy người ta dùng biến giả (dummy variables)
TBP 5/26/2023
TBP
5.2. Mô hình có chứa biến độc lập là
biến định tính
❖ Ví dụ:
- Giữa hai ngôi nhà có cùng các đặc trưng, một
có hồ bơi trong khi ngôi nhà còn lại không có.

- Giữa hai nhân viên của một công ty có cùng


tuổi, học vấn, kinh nghiệm, một người là nam
và người kia là nữ…

TBP 5/26/2023
TBP
5.2. Mô hình có chứa biến độc lập là
biến định tính
Ví dụ:

Giả sử muốn nghiên cứu tiền lương của các


nhân viên tại một doanh nghiệp có bị ảnh
hưởng bởi vấn đề giới tính hay không?

TBP 5/26/2023
TBP
 Đặt:

- Y: biến phụ thuộc biểu thị lương của nhân viên và


là biến định lượng
- Z: biến độc lập, biểu thị cho giới tính, là biến định
tính:
Z = 0 nữ Z = 1 nam
 Mô hình hồi quy có dạng:

Yi = β1+ β2Zi + Ui

TBP 5/26/2023
TBP
Lương (triệu/năm) Giới tính
115 Nam
95 Nữ
120 Nam
105 Nữ
125 Nam
110 Nữ
132 Nam
116 Nữ
125 Nữ
140 Nam TBP 5/26/2023
TBP

TBP 5/26/2023
TBP

• Nếu đặt Gi= 1 là nữ, nam:0 thì có được


không?

• Mô hình thay đổi như thế nào?

TBP 5/26/2023
TBP

TBP 5/26/2023
TBP
5.2. Mô hình có chứa biến độc lập là
biến định tính

❖ Tóm lại:
• Biến giả này là biến nhị nguyên chỉ nhận
giá trị 1 với nam nhân viên và 0 với nữ
nhân viên.

• Chúng ta sẽ thiết lập và ước lượng một mô


hình sử dụng biến giả như một biến giải
thích. Dạng đơn giản nhất của mô hình
như sau:
TBP 5/26/2023
TBP
5.2. Mô hình có chứa biến độc lập là
biến định tính
Mô hình hồi quy có dạng:
Yi = β1+ β2Zi + Ui

Tạm thời bỏ qua sai số Ui

Đối với nam: Z = 1 nam  Y = 1 +  2


Đối với nữ: Z = 0 nữ  Y = 1

TBP 5/26/2023
TBP
5.2. Mô hình có chứa biến độc lập là
biến định tính
Vậy làm thế nào để xem xét doanh nghiệp
này có sự khác biệt tiền lương giữa nhân
viên nam và nữ hay không?

TBP 5/26/2023
5.2. Mô hình có chứa biến độc lập là TBP

biến định tính


❖ Tổng quát: giả sử có biến định tính Z có hai phạm trù
và có tác động đến BPT.

❖Gọi D là biến giả thể hiện biến định tính Z (nhận giá
trị 1;0)
𝑌 = 𝛽1 + 𝛽2 𝐷+𝛽3 𝑋3 +….+ 𝛽𝑘 𝑋𝑘 +u

TBP 5/26/2023
5.2. Mô hình có chứa biến độc lập là TBP

biến định tính


Lấy lại ví dụ trên khảo sát lương của nhân viên theo số
thâm niên và giới tính.
• Đặt Yi : là tiền lương hàng tháng của nhân viên thứ i.
• Gọi Xi : là kinh nghiệm của nhân viên thứ i
• Với Zi =1 : nhân viên nam
• Với Zi =0 : nhân viên nữ
Nếu bỏ qua yếu tố giới tính, chỉ xét mối quan hệ giữa
tiền lương hàng tháng và kinh nghiệm, một mô hình hồi
quy đơn cho quan hệ này là:

TBP 5/26/2023
5.2. Mô hình có chứa biến độc lập là TBP

biến định tính

Lúc này, câu hỏi đặt ra là :"Giữa hai nhân viên


có cùng kinh nghiệm, có sự khác biệt trong tiền
lương tháng do giới tính không?"

Khi đó, nếu tính đến biến giả , mô hình sẽ trở


thành

TBP 5/26/2023
TBP
1. Viết hàm HQM. Đọc ý nghĩa y X Z
HSHQ
2. Mô hình có phù hợp không? 115 11 1
3. Có khác biệt tiền lương giữa các 95 9 0
giới tính không?
120 10 1
4. Kinh nghiệm có thật sự tác động
đến tiền lương không? 105 12 0
5. Viết hàm HQM cho nhân viên có
giới tính nữ. 125 13 1
110 12 0
132 14 1
116 14 0
125 15 0
140 15 1
TBP 5/26/2023
TBP

TBP 5/26/2023
5.2. Mô hình có chứa biến độc lập là TBP

biến định tính


o Mô hình với 1 biến liên tục (x) và một
biến giả (d) : y =  +  d +  x + u
0 0 1

o Có thể diễn giải tung độ gốc như sau:


o →Nếu d = 0, thì
o Nếu d=1, thì
o → Trường hợp d = 0

TBP 5/26/2023
TBP
5.3. Mô hình với biến giả là biến tương tác

Biến tương tác là biến độc lập và là tích của


hai biến độc lập khác. Các biến độc lập này
có thể là biến liên tục hoặc biến giả.

Yt = 1 + 2Xt + 3Zt + 4XtZt + et

TBP 5/26/2023
TBP
5.3. Mô hình với biến giả là biến tương tác

• Tương tác giữa biến giả d và biến liên


tục x :
y = 0 + 1d + 1x + 2d*x + u

• Nếu d = 0, thì
• Nếu d = 1, thì
TBP 5/26/2023
TBP
Example of 0 > 0 and 1 < 0

y
y = 0 + 1x
d=0

d=1
y = (  0 + 0 ) + (  1 + 1 ) x

x
TBP 5/26/2023
TBP
Ví dụ: các yếu tố ảnh hưởng đến tiền lương
𝑤𝑎𝑔𝑒 = 𝛽1 + 𝛽2 𝑢𝑟𝑏𝑎𝑛+ 𝛽3 edu+ 𝛽4 𝑢𝑟𝑏𝑎𝑛. 𝑒𝑑𝑢+u
𝑤𝑎𝑔𝑒 = (𝛽1 + 𝛽2 )+ (𝛽3 + 𝛽4 )𝑒𝑑𝑢 +u
𝑤𝑎𝑔𝑒 = 𝛽1 + 𝛽3 𝑒𝑑𝑢 +u

TBP 5/26/2023
TBP

TBP 5/26/2023
5.4. Kiểm định sự khác biệt giữa hàm hồi quy
TBP

của hai nhóm


Khi hồi quy một mẫu số liệu, có khả năng xảy ra những
thay đổi về cấu trúc trong mối quan hệ giữa biến phụ
thuộc và biến độc lập => giá trị tham số hồi quy có thể
bị biến động. Nguyên nhân:

TBP 5/26/2023
5.4. Kiểm định sự khác biệt giữa hàm hồi quy
TBP

của hai nhóm

Khi tổng thể bao gồm hai nhóm mang đặc tính
khác nhau như nam/ nữ; thành thị/ nông thôn;…
=> các hệ số hồi quy của hai nhóm có bằng nhau
không. Nếu các hệ số là bằng nhau, ta nói rằng
các hệ số là ổn định.

=> Có 2 phương pháp kiểm định tính ổn định

TBP 5/26/2023
5.4.1. Kiểm định Chow TBP

Các bước kiểm định Chow:


n = n1 + n2
Giả thuyết:
Ho: Cấu trúc mô hình không đổi
H1: Cấu trúc mô hình thay đổi
Bước 1:

Bước 2:

Bước 3:

TBP 5/26/2023
TBP
• Nếu hệ số hồi quy tương ứng của các mô hình khác
nhau thì thực hiện tiếp các bước:
Bước 4: Tính

Bước 5: Tính

Bước 6: tra bảng


Bước 7: so sánh:
• Nếu F<Fα;(k, n-2k): Chấp nhận giả thiết Ho
• Nếu F>Fα;(k, n-2k): Bác bỏ giả thiết Ho

TBP 5/26/2023
TBP

TBP 5/26/2023
TBP
Hạn chế của kiểm định Chow

TBP 5/26/2023
TBP
5.4. Kiểm định sự khác biệt giữa hàm hồi quy
của hai nhóm
5.4.2. Kiểm định dựa trên việc sử dụng biến giả
Giả thuyết:

▪ Ước lượng hồi qui với dạng hàm như sau:


Yi = β1 + β2Xi + β3Di + β4DiXi + ui
Trong đó:
• D = 1 nếu số liệu được lấy từ thời kỳ 1 (bộ
số liệu 1, n1 quan sát)
• D = 0 nếu số liệu được lấy từ thời kỳ 2 (bộ
số liệu 2, n2 quan sát) TBP 5/26/2023
TBP
▪ Sau khi ước lượng ta thu được tổng bình
phương các phần dư, ký hiệu là RSSU.
▪ Ước lượng mô hình không sử dụng biến giả,
mô hình là Yi = β1 + β2Xi + ui và thu được giá
trị RSSR.
▪ Trị thống kê kiểm định:

▪ tra bảng
▪ So sánh:
• Nếu F<Fα;(k, n-2k): Chấp nhận giả thiết Ho
• Nếu F>Fα;(k, n-2k): Bác bỏ giả thiết Ho TBP 5/26/2023
TBP
Khi nghiên cứu SAVINGS là lượng tiết kiệm của người dân Mỹ trong
một thời đoạn cho trước và biến độc lập thu nhập INCOME. Người ta
thấy rằng có hai thời đoạn trong suốt khoảng thời gian 1970-1995, có
thể gây ra những thay đổi trong mô hình hành vi tiết kiệm. Bởi vì sự
liên tục tăng mạnh về giá dầu lửa trên thế giới hồi năm 1979 cho đến hết
năm 1981, từ 13,5 đôla/thùng lên 36đôla/thùng đã gây nên cuộc khủng
hoảng năng lượng trầm trọng trên thế giới. Tác động của những biến
động mạnh mẽ về giá dầu lửa thế giới cùng sự tăng vọt về lãi suất cho
vay thực tế ở Mỹ và trên khắp thế giới đã là một nhân tố quan trọng gây
ra cuộc khủng kinh tế thế giới nói chung và cuộc khủng hoảng nợ 1982
nói riêng. Vậy hành vi tiết kiệm có thể có sự khác biệt giữa hai thời kỳ
là 1970-1981 và thời kỳ 1982-1995.
TBP 5/26/2023
TBP

TBP 5/26/2023
TBP

TBP 5/26/2023
TBP

TBP 5/26/2023
TBP
5.5. Biến định tính có nhiều phạm trù

Số lựa chọn có thể có của một biến định tính


có thể nhiều hơn hai.

Có 2 cách:
• Dùng biến giả có nhiều giá trị, số giá trị
bằng với số lựa chọn
• Dùng nhiều biến giả, mỗi biến có giá trị 0 và
1
Để không rơi vào bẫy biến giả:

TBP 5/26/2023
5.5. Biến định Lương TBP
(triệu/năm) Trình độ
tính có nhiều
115 Cao đẳng
phạm trù
95 Cao đẳng
120 Đại học
Ví dụ: Khảo sát mức 105 Cao đẳng
lương của nhân viên
125 Đại học
có trình độ cao đẳng,
đại học, thạc sỹ, 110 Cao đẳng
132 Thạc sỹ
Có bao nhiêu biến
giả đưa vào mô 116 Cao đẳng
hình? 125 Đại học
140 Thạc sỹ
TBP 5/26/2023
TBP
Như vậy trình độ của một nhân viên
được xác định bằng việc kết hợp hai
biến nói trên:
Z1 = 0, Z2 = 0 → cao đẳng
Z1 = 1 , Z2 =0 → đại học
Z1 = 0 , Z2 =1 → thạc sỹ
Lúc này mô hình hồi quy có dạng:
Yi = β1+β2Z1i + β3Z2i +Ui
TBP 5/26/2023
TBP

E (Y / Z1 = 0, Z 2 = 0) = 1

E (Y / Z1 = 1, Z 2 = 0) = 1 +  2

E (Y / Z1 = 0, Z 2 = 1) = 1 + 3

TBP 5/26/2023
TBP
Y X Z Z1 Z2
115 11 1 0 0
95 9 0 0 0
Ví dụ: khảo sát lương của
120 10 1 1 0
nhân viên theo số thâm
niên và TĐHV 105 12 0 0 0
125 13 1 1 0
Khi đó mô hình hồi quy có dạng: 110 12 0 0 0
Y = β1+β2Z1 + β3Z2 + β4X +Ui 132 14 1 0 1
116 14 0 0 0
125 15 0 1 0
140 15 1 0
TBP
1
5/26/2023
TBP

TBP 5/26/2023
TBP

Ví dụ: Khảo sát về mức lương của nhân viên trên,


bên cạnh yếu tố về số năm đi làm, giới tính, mức
lương còn chịu ảnh hưởng bởi trình độ học vấn của
người nhân viên. Có ba cấp bậc học vị được xét tới
là cao đẳng, đại học, thạc sĩ.
Ta xét mô hình đơn giản sau:

Y = 1 +  2 X +  3 Z +  4 Z1 +  4 Z 2 + U
TBP 5/26/2023
1. Viết hàm HQM. Đọc ý nghĩa HSHQ TBP
2. Mô hình có phù hợp không?
3. Có khác biệt tiền lương giữa các giới tính không?
4. Kinh nghiệm có thật sự tác động đến tiền lương không?
5. Có sự khác biệt tiền lương giữa trình độ cao đẳng với đại học?
6. Có sự khác biệt tiền lương giữa trình độ cao đẳng với thạc sĩ?
7. Có nên thêm biến X vào trong mô hình ban đầu gồm có Y và Z
8. Trong hai mô hình: Y, X, Z và Y, X. Nên chọn mô hình nào?
9. Với MYN 10%, mô hình nào tốt nhất:
- Y, Z
- Y, X
- Y, x, Z
- Y, X, Z, Z1, Z2
10. Tính hệ số tương quan của 2 đại lượng Y và X
11. Với MYN 10%, bạn gợi ý nhân viên công ty nên làm gì để cải
thiện tiền lương.

TBP 5/26/2023
TBP
Về nhà
Tìm hiểu (đọc bài NC) xem xuất khẩu
có tác động tới GDP không? (phải có
căn cứ)
Việt Nam gia nhập WTO, thì xuất khẩu
tác động đến GDP có khác biệt giữa
trước và sau khi gia nhập không? (đánh
giá chặng đường 5 năm, 10 năm)

TBP 5/26/2023
TBP
Bài tập
XK , GDP (n2: 2007-2019, n1: 2006-1990)
(1990-2019)
Xem xét mối quan hệ giữa học vấn và mức
lương giữa lao động thành thị và lao động
nông thôn có khác nhau hay không. (thành thị
=1; nông thôn = 0)
n=935
Wage= b1 +b2urban + b3Edu + b4 Urban*edu+e

TBP 5/26/2023
Mở rộng TBP

Sử dụng biến giả trong phân tích mùa


Ví dụ: Nghiên cứu về lượng điện năng tiêu thụ
theo nhiệt độ bằng cách sử dụng mô hình hồi quy:
Y: là lượng điện năng tiêu thụ, X : là nhiệt độ
Chúng ta sử dụng biến giả bằng cách quy ước:
D1 = 1 : mùa đông, D1 = 0: các mùa khác
D2 = 1: mùa xuân, D2 = 0: các mùa khác
D3 = 1 : mùa hạ, D3 = 0 : các mùa khác
Khi đó hàm hồi quy có thể viết dưới dạng:

Y =  0 +  1 D1 +  2 D2 +  3 D3 +  0 X + U
TBP 5/26/2023
TBP
Tuy nhiên, mô hình trên vẫn chưa đủ sức thuyết
phục vì nhiệt độ và mùa có thể có quan hệ chặt
chẽ với nhau, và ảnh hưởng của nhiệt độ đối với
lượng điện năng tiêu thụ giữa các mùa khác nhau
có thể cũng khác nhau.
Chính vì thế chúng ta cần đưa vào mô hình yếu tố
tương tác:
Y =  0 + 1 D1 +  2 D2 +  3 D3 + ( 0 + 1 D1 +  2 D2 +  3 D3 ) X + U
Trong đó 1 ,  2 ,  3 biểu thị sự khác biệt ảnh hưởng của
nhiệt độ giữa các mùa với lượng điện tiêu thụ. TBP 5/26/2023
TBP

Hàm hồi quy ước lượng điện năng tiêu thụ theo
nhiệt độ ứng với từng mùa:

ˆ 0 + ˆ 0 X
Yˆ = 
Mùa thu:

Mùa đông: Yˆ = ˆ 0 + ˆ1 + ˆ0 X + ˆ1 X

Mùa xuân: Yˆ = ˆ 0 + ˆ 2 + ˆ0 X + ˆ 2 X


Mùa hạ: Yˆ = ˆ 0 + ˆ 3 + ˆ0 X + ˆ3 X
TBP 5/26/2023
Hồi quy tuyến tính từng khúc TBP

Khảo sát mức chi trả hoa hồng theo doanh thu của một
doanh nghiệp dành cho các đại lý bán hàng. Mức hoa
hồng chi trả tùy theo doanh thu đạt được.
• Nếu mức doanh thu vượt ngưỡng X*, mức hoa hồng
sẽ thay đổi, giả sử tăng tuyến tính theo doanh thu.
• Sử dụng hàm hồi quy tuyến tính từng khúc để mô tả
cho tốc độ tăng hoa hồng theo doanh thu ứng với
ngưỡng X*, nghĩa là độ dốc của đường hồi quy thay
đổi tại ngưỡng X*
TBP 5/26/2023
TBP

Sử dụng biến giả


D = 1 nếu X > X* D =0 , nếu X ≤X*
Hàm hồi quy tuyến tính từng khúc có dạng:
Y =  + 1 X +  2 ( X − X ) D + U
*

Trung bình hoa hồng khi doanh thu < X* :


 + 1 X
Trung bình hoa hồng khi doanh thu ≥X* :
 + 1 X +  2 ( X − X )
*

5/26/202
TBP
3
TBP

✓ Trong trường hợp có hai ngưỡng doanh thu: X*

và X**, chúng ta sử dụng hai biến giả D1 và D2

✓ D1 = 1 nếu X> X*, D1 = 0: trường hợp khác

✓ D2 = 1, nếu X > X**, D2 = 0, trường hợp khác

✓ Hàm hồi quy tuyến tính từng khúc có dạng:


Y =  + 1 X +  2 ( X − X ) D1 +  3 ( X − X ) D2 + U
* **

TBP 5/26/2023
TBP
Ý nghĩa hệ số hồi quy của biến giả
Khảo sát lương của giáo viên (Y) theo trình độ (D=0: cử nhân,

D=1: thạc sĩ) và theo số năm giảng dạy (X)

Mô hình Log – Lin


𝑙𝑛𝑌𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 + 𝛽3 𝐷𝑖 + 𝑈𝑖

TBP 5/26/2023
TBP
Ý nghĩa hệ số hồi quy của biến giả
Mô hình Lin – Log
Giả sử nhu cầu khảo sát lượng cầu của hai loại trà Artiso và

trà Hoa Cúc theo giá. D=0 trà artiso, D=1 trà hoa cúc
𝑌𝑖 = 𝛽1 + 𝛽2 𝑙𝑛𝑋𝑖 + 𝛽3 𝐷𝑖 + 𝑈𝑖

TBP 5/26/2023
TBP
Bài tập
XK , GDP (n2: 2007-2019, n1: 2006-
1990)
Xem xét mối quan hệ giữa học vấn và
mức lương giữa lao động thành thị và lao
động nông thôn có khác nhau hay không.
(dùng file dữ liệu wage2.wf1 trong tài liệu
KTL để thực hành cho phần lý thuyết 6.)
Thực hành bài số 8 trong file Số liệu và
bài tập ứng dụng stata. Căn cứ kết quả,
hãy gợi ý chính sách.
Y c x z z*x

TBP 5/26/2023
TBP
Ví dụ minh hoạ
Bảng dưới đây là số liệu giả thiết về mức lương giáo sư
đại học (Y), số năm kinh nghiệm giảng dạy (X) và giới
tính (Di=1:nam; Di=0:nữ)
Yi Xi Di Yi Xi Di
23,0 11 1 25,0 15 0
19,5 9 0 28,0 15 1
24,0 10 1 29,5 16 1
21,0 12 0 26,0 16 0
25,0 13 1 27,5 17 0
22,0 12 0 31,5 18 1
26,5 14 1 29,0 18 0
23,1 14 0
TBP 5/26/2023
TBP

Ví dụ minh hoạ
1) Tìm hàm hồi quy Yˆi = ˆ1 + ˆ2 X i + ˆ3 Di
2) Giới tính có ảnh hưởng đến mức lương của giáo
sư đại học hay không ?
3) Dự báo mức lương của một giáo sư nam có số năm
kinh nghiệm giảng dạy là 17 năm với độ tin cậy
95%
4) Dự báo mức lương của một giáo sư nữ có số năm
kinh nghiệm giảng dạy là 19 năm với độ tin cậy
95%

TBP 5/26/2023
TBP

7. Viết HHQM với đơn vị kg/tháng, USD/kg


8. Tính to(PI)?
TBP 5/26/2023
TBP

TBP 5/26/2023

You might also like