Download as pdf or txt
Download as pdf or txt
You are on page 1of 85

9/20/2021

Bản chất của Kinh tế lượng và


Bản chất của Kinh Tế Lượng Dữ liệu Kinh tế
và Dữ liệu kinh tế Kinh tế lượng là gì?
Kinh tế lượng = sử dụng các công cụ thống kê để phân tích
dữ liệu Kinh tế.
Chương 1 Các nhà Kinh tế lượng thường phân tích dữ liệu phi thực
nghiệm
Các mục tiêu đặc trưng của phân tích kinh tế lượng
Wooldridge: Nhập môn Kinh tế lượng : Ước lượng các mối quan hệ giữa các biến kinh tế.
Cách tiếp cận hiện đại, 5e
Kiểm định các lý thuyết và các giả thuyết kinh tế.
Dự báo các biến số kinh tế.
GV: Hoàng Thị Diễm Hương Đánh giá hiệu quả thực thi chính sách của chính phủ và các
quyết định của người làm kinh doanh.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

1 2

Bản chất của Kinh tế lượng và Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế Dữ liệu Kinh tế
Các bước trong việc phân tích kinh tế lượng Các mô hình kinh tế
Xác định vấn đề nghiên cứu. Có thể là các mô hình vi mô hoặc vĩ mô.
Xác định mô hình kinh tế. Thường sử dụng hành vi tối ưu, mô hình cân bằng,…
Chuyển thành mô hình kinh tế lượng. Thiết lập mối quan hệ giữa các biến số kinh tế.
Thu thập dữ liệu liên quan. Ví dụ: các hàm cầu, phương trình giá,…
Ước lượng mô hình.
Diễn giải kết quả.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

3 4

1
9/20/2021

Bản chất của Kinh tế lượng và Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế Dữ liệu Kinh tế
Mô hình kinh tế về tội phạm (Becker (1968)) Mô hình kinh tế lượng về hoạt động phạm tội
Thiết lập phương trình đối với hoạt động phạm tội dựa trên Dạng hàm phải được định rõ.
nguyên tắc tối đa hoá lợi ích Các biến có thể phải xấp xỉ bởi các đại lượng khác.
Đo lường Tiền lương
Số giờ tiêu tốn cho Các yếu tố tác
hoạt động cho việc Thu nhập Số lần bị bắt
hoạt động phạm tội động đến hoạt
Tuổi phạm tội làm hợp khác giữ trước đây
pháp động phạm tội
„Tiền lương“ của Tiền lương nhưng không
hoạt động phạm cho việc Thu nhập Khả năng Khả năng Mức án dự quan sát được
tội làm hợp kết án nếu kiến nếu bị
pháp khác bị bắt bắt
bị bắt Ví dụ: Tính cách,
Dạng hàm của mối liên hệ không được nêu rõ. số tiền thu được
từ hoạt động
Phương trình có thể được thừa nhận mà không dựa trên mô hình Số lần bị kết án Độ dài bản án trung Tuổi phạm tội, nền
bình nếu bị kết tội
kinh tế. tảng gia đình…
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

5 6

Bản chất của Kinh tế lượng và Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế Dữ liệu Kinh tế
Mô hình đào tạo nghề và năng suất người lao động Mô hình kinh tế lượng về đào tạo nghề và năng suất người
lao động Các yếu tố tác động
Việc đào tạo nghề tác động đến năng suất người lao động đến tiền lương
như thế nào? nhưng không quan
sát được
Lý thuyết kinh tế chính thức không thực sự cần thiết để xây Tiền lương Số năm đi Số năm kinh Số tuần tham Ví dụ: Năng lực bẩm
dựng phương trình. theo giờ học chính nghiệm gia vào đào sinh, chất lượng giáo
thức tạo nghề dục, nền tảng gia đình…
Lương theo giờ Phần lớn nội dung kinh tế lượng xử lý vấn đề định dạng sai
số u
Số năm đi học
Số tuần tham gia vào Các mô hình kinh tế lượng có thể được dùng để kiểm định giả
chính thức
Số năm kinh nghiệm đào tạo nghề thuyết
Còn có nhiều yếu tố khác có thể liên quan đến phương trình Ví dụ, tham số 3 cho biết tác động của đào tạo lên tiền lương.
nhưng trên đây là các yếu tố quan trọng nhất. Tác động này lớn ra sao? Tác động này có khác 0 hay không?
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

7 8

2
9/20/2021

Bản chất của Kinh tế lượng và Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế Dữ liệu Kinh tế
Phân tích kinh tế lượng đòi hỏi cần có dữ liệu Dữ liệu chéo
Các loại dữ liệu kinh tế Mẫu gồm các cá nhân, các hộ gia đình, các doanh nghiệp,
Dữ liệu chéo (Cross-sectional data) các tỉnh thành, các quốc gia, hay các đơn vị quan tâm
khác tại một thời điểm hoặc trong một khoảng thời
Dữ liệu chuỗi thời gian (Time series data)
gian đã cho.
Dữ liệu chéo gộp (Pooled cross-sectional data)
Các quan sát chéo có thể ít nhiều độc lập với nhau. Ví
Dữ liệu bảng/dữ liệu dọc (Panel data/longitudinal data) dụ: lấy mẫu ngẫu nhiên từ một tổng thể .
Phương pháp kinh tế lượng phụ thuộc vào bản chất Đôi khi việc lấy mẫu ngẫu nhiên bị vi phạm, ví dụ: các
của dữ liệu được sử dụng đơn vị từ chối trả lời trong các cuộc khảo sát, hay nếu
Sử dụng các phương pháp không thích hợp có thể dẫn việc lấy mẫu được phân theo cụm.
đến kết quả sai lầm Dữ liệu chéo thường gặp trong kinh tế vi mô ứng dụng.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

9 10

Bản chất của Kinh tế lượng và Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế Dữ liệu Kinh tế
Dữ liệu chéo về tiền lương và các biến về đặc điểm cá Dữ liệu chéo về tốc độ tăng trưởng và các đặc điểm
nhân của quốc gia

Biến chỉ báo


(1=đúng,
0=sai)

Tỷ lệ tăng của GDP thực Phần trăm của chi tiêu Tỷ lệ người lớn hoàn
Số quan sát Tiền lương theo giờ bình quân đầu người chính phủ trên GDP thành trung học cơ sở
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

11 12

3
9/20/2021

Bản chất của Kinh tế lượng và Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế Dữ liệu Kinh tế
Dữ liệu chuỗi thời gian Dữ liệu thời gian về tiền lương tối thiểu và các biến liên
Các quan sát của một hay nhiều biến theo thời gian. quan
Ví dụ, giá chứng khoán, cung tiền, chỉ số giá tiêu dùng, tổng sản
phẩm trong nước, doanh số bán xe hơi,…
Các quan sát chuỗi thời gian thường gặp vấn đề tương quan
chuỗi.
Thứ tự của các quan sát cũng truyền tải những thông tin quan
trọng.
Tần số dữ liệu: hàng ngày, hàng tuần, hàng tháng, hàng quý,
hàng năm,…
Tiền lương tối thiểu Tỷ lệ bảo hộ Tỷ lệ thất nghiệp Tổng sản phẩm
Đặc điểm tiêu biểu của chuỗi thời gian: xu thế và thời vụ.
trung bình trong một trung bình quốc gia
Các ứng dụng thường gặp : Kinh tế vĩ mô và tài chính ứng dụng. năm cho trước
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

13 14

Bản chất của Kinh tế lượng và Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế Dữ liệu Kinh tế
Dữ liệu chéo gộp Dữ liệu chéo gộp về giá nhà Thuế tài sản
Hai hay nhiều bộ dữ liệu chéo được kết hợp thành một tập dữ liệu Kích thước của
ngôi nhà tính
Các dữ liệu chéo được rút ra độc lập với nhau
bằng feet vuông
Dữ liệu chéo gộp thường được dùng để đánh giá các thay đổi
Số phòng tắm
chính sách
Ví dụ: Trước thay đổi
• Đánh giá tác động của thay đổi thuế tài sản lên giá nhà Sau thay đổi
• Mẫu ngẫu nhiên về giá nhà trong năm 1993
• Mẫu ngẫu nhiên khác của giá nhà trong năm 1995
• So sánh trước/sau (1993: trước thay đổi, 1995: sau thay đổi)
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

15 16

4
9/20/2021

Bản chất của Kinh tế lượng và Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế Dữ liệu Kinh tế
Dữ liệu bảng (hay dữ liệu dọc)
Dữ liệu bảng (hay dữ liệu dọc)
Ví dụ :
Cùng các đơn vị chéo được quan sát theo thời gian.
• Thống kê tội phạm trong thành phố; mỗi thành phố
Dữ liệu bảng có chiều thời gian và chiều dữ liệu chéo.
được quan sát trong hai năm.
Dữ liệu bảng có thể được dùng để kiểm soát những yếu
• Các đặc điểm không quan sát được nhưng không
tố không quan sát được nhưng không đổi theo thời gian.
thay đổi theo thời gian của thành phố có thể được
Dữ liệu bảng có thể được dùng để lập mô hình các trường kiểm soát trong mô hình.
hợp có biến trễ của biến phụ thuộc
• Tác động của cảnh sát đến tỷ lệ tội phạm có thể có
tính trễ theo thời gian.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

17 18

Bản chất của Kinh tế lượng và Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế Dữ liệu Kinh tế
Dữ liệu bảng hai năm về thống kê tội phạm trong Quan hệ nhân quả và khái niệm về „phân tích trong điều kiện
thành phố các yếu tố khác không đổi“
Mỗi thành
phố có hai Định nghĩa về tác động nhân quả của x đến y:
quan sát Cách thức biến y thay đổi khi biến x thay đổi trong điều
theo thời kiện các yếu tố khác không đổi“
gian
Số cảnh Đa số các câu hỏi kinh tế là câu hỏi phân tích trong điều kiện các
sát trong yếu tố khác không đổi.
năm 1986
Điều quan trọng là xác định tác động nhân quả nào mà người ta
Số cảnh
quan tâm.
sát trong
năm 1990 Cần thiết phải mô tả cách thiết kế một thí nghiệm để có thể suy
diễn được về quan hệ nhân quả mà câu hỏi nghiên cứu đặt ra.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

19 20

5
9/20/2021

Bản chất của Kinh tế lượng và Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế Dữ liệu Kinh tế
Tác động nhân quả của phân bón lên năng suất cây trồng Đo lường suất sinh lợi giáo dục
„Sản lượng đậu nành sẽ tăng lên bao nhiêu nếu tăng lượng phân „Nếu một người được chọn từ tổng thể và số năm đi học của
bón cho đất?“ người này tăng thêm một, tiền lương của họ sẽ tăng bao nhiêu?“
Giả thiết ngầm: tất cả các yếu tố khác tác động đến năng suất Giả thiết ngầm: tất cả các yếu tố khác tác động tiền lương như
cây trồng như chất lượng đất, lượng mưa, sự hiện diện của ký kinh nghiệm, nền tảng gia đình, sự thông minh,... được giữ cố
sinh trùng,... được giữ cố định. định.
Cách thí nghiệm: Cách thí nghiệm:
Chọn các thửa đất có diện tích một mẫu; gán ngẫu nhiên số lượng Chọn một nhóm người; gán ngẫu nhiên số năm học khác nhau
phân bón khác nhau cho các thửa khác nhau; so sánh sản lượng. cho họ (không khả thi!); so sánh kết quả tiền lương.
Cách thí nghiệm này áp dụng được khi lượng phân bón sử dụng Vấn đề khi không thể gán ngẫu nhiên: số năm đi học của một
không liên quan đến các yếu tố khác tác động đến năng suất cây người có liên hệ với các yếu tố khác mà tác động tiền lương (Ví
trồng. dụ: sự thông minh).
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

21 22

Bản chất của Kinh tế lượng và Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế Dữ liệu Kinh tế
Tác động của việc thực thi pháp luật đến mức tội phạm của Tác động của lương tối thiểu đến thất nghiệp
thành phố „Số người thất nghiệp sẽ tăng bao nhiêu nếu tiền lương tối thiểu
„Nếu chọn ngẫu nhiên một thành phố và tăng thêm 10 cảnh sát được tăng lên một lượng nào đó (các yếu tố khác không đổi)?“
cho thành phố này, tỉ lệ phạm tội của nó sẽ giảm khoảng bao Cách thí nghiệm:
nhiêu?“
Chính phủ chọn ngẫu nhiên lương tối thiểu mỗi năm và quan sát
Nói cách khác: „Nếu hai thành phố giống nhau ở mọi khía cạnh,
kết quả thất nghiệp.
ngoại trừ thành phố A có nhiều hơn 10 cảnh sát, tỉ lệ phạm tội
Thí nghiệm sẽ có hiệu lực vì mức lương tối thiểu không liên hệ với
của hai thành phố sẽ khác biệt nhau khoảng bao nhiêu?“
các yếu tố khác tác động đến sự thất nghiệp.
Cách thí nghiệm:
Thực tế, mức lương tối thiểu sẽ phụ thuộc vào các yếu tố kinh tế
Gán ngẫu nhiên số cảnh sát cho một số lớn các thành phố.
và chính trị, mà những yếu tố này cũng tác động đến thất nghiệp.
Thực tế, số cảnh sát sẽ được quyết định bởi tỷ lệ tội phạm (có sự
đồng thời trong vấn đề xác định tỷ lệ tội phạm và số cảnh sát).
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

23 24

6
9/20/2021

Bản chất của Kinh tế lượng và Bản chất của Kinh tế lượng và
Dữ liệu Kinh tế Dữ liệu Kinh tế
Khái niệm hồi quy Câu hỏi: Giữa 0 và j thì cái nào quan trọng hơn?
Hồi quy nghiên cứu sự tác động của một hay nhiều biến giải thích y u
 j 
(biến hồi quy, biến độc lập) đến một biến phụ thuộc. x j x j
Nếu biết được giá trị của biến độc lập thì sẽ ước lượng được giá Khi u không tương quan với các biến xj thì j có thể được xem là
trị trung bình của biến phụ thuộc. giá trị biên của y theo xj.
y   0  1 x1  ...   k xk  u Hồi quy tổng thể:
0 (hệ số chặn – intercept): cho biết giá trị trung bình của y khi Hàm hồi quy tổng thể được xây dựng dựa trên dữ liệu tổng thể.
tất cả các biến giải thích bằng 0. Cho biết chính xác mối quan hệ giữa biến giải thích và biến phụ
j (hệ số góc của biến xj, 𝑗 = 1, 𝑘): cho biết lượng thay đổi trung thuộc.
bình của y khi xj thay đổi 1 đơn vị, trong điều kiện các yếu tố ( PRF ) : y   0  1 x1  ...   k xk  u
khác không đổi.
Hay: ( PRF ) : E ( y | x1 ,..., xk )  0  1 x1  ...   k xk
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

25 26

Bản chất của Kinh tế lượng và


Dữ liệu Kinh tế
Hồi quy mẫu:
Hàm hồi quy mẫu được xây dựng dựa trên dữ liệu mẫu.
Dùng để ước lượng cho hồi quy tổng thể.

( SRF ) : y  ˆ0  ˆ1 x1  ...  ˆk xk  uˆ


Hay: ( SRF ) : yˆ  ˆ0  ˆ1 x1  ...  ˆk xk
Tính Kiểm tra
Số liệu mẫu Hồi quy mẫu Hồi quy tổng thể

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

27

7
1/12/2022

L/O/G/O

Chương 2
MÔ HÌNH HỒI QUY ĐƠN
Wooldridge: Kinh tế lượng nhập môn:
Cách tiếp cận hiện đại, 5e

GV: Hoàng Thị Diễm Hương

Nội dung
1. Giới thiệu mô hình hồi quy tuyến tính đơn
2. Phương pháp bình phương nhỏ nhất (OLS)
3. Các tính chất của ước lượng OLS
4. Mức độ phù hợp của mô hình
5. Các giả thiết cho mô hình hồi quy tuyến tính
6. Vấn đề về đơn vị tính của biến và một số dạng hàm hồi
quy phi tuyến

www.themegallery.com

1
1/12/2022

1. Mô hình hồi quy tuyến tính đơn


• Định nghĩa về mô hình hồi quy tuyến tính đơn
„Giải thích biến y theo biến x“
Hệ số chặn Hệ số góc

Biến phụ thuộc, Biến độc lập, Thành phần sai số


biến được giải thích, Biến giải thích, Nhiễu
biến phản ứng,… Biến hồi quy,… Các yếu tố không quan sát được,…

• Mô hình gồm 1 biến phụ thuộc và 1 biến độc lập.


www.themegallery.com

1. Mô hình hồi quy tuyến tính đơn


• Cách diễn giải mô hình hồi quy tuyến tính đơn
„Nghiên cứu sự thay đổi của y tương ứng với sự thay đổi trong x“

với điều kiện

1 cho biết Biến phụ thuộc thay đổi Việc giải thích chỉ đúng khi tất cả các yếu
bao nhiêu nếu biến độc lập tăng tố khác giữ nguyên khi biến độc lập tăng
lên 1 đơn vị 1 đơn vị
• Mô hình hồi quy tuyến tính đơn hiếm khi áp dụng trong thực tế nhưng cần
thiết thảo luận về mô hình này vì lý do sư phạm.

www.themegallery.com

2
1/12/2022

1. Mô hình hồi quy tuyến tính đơn


• Ví dụ: Sản lượng đậu nành và phân bón
Lượng mưa, chất lượng đất,
Sự hiện diện của vật ký sinh,…
Đo lường tác động của phân bón lên sản lượng,
trong điều kiện các yếu tố khác không đổi

• Ví dụ: Phương trình tiền lương đơn giản


Kinh nghiệm tham gia lực lượng lao động,
Thâm niên làm việc,
đạo đức công việc, sự thông minh …
Đo sự thay đổi trong tiền lương theo
giờ khi thêm một năm đi học, giữ các
yếu tố khác cố định

www.themegallery.com

1. Mô hình hồi quy tuyến tính đơn


• Hàm hồi quy tổng thể (PRF)
( PRF ) : y   0  1 x  u
 E ( y | x)  E (  0  1 x  u | x)   0  1 x  E (u | x)   0  1 x
 Điều này có nghĩa là:
giá trị trung bình của Hàm hồi quy tổng thể
biến phụ thuộc (biến y)
có thể được biểu diễn
thành một hàm tuyến
tính của biến giải thích
(biến x) Đối với những cá thể có x = x2
thì giá trị trung bình của y là
(0 + 1x2)
www.themegallery.com

3
1/12/2022

2. Phương pháp bình phương nhỏ nhất


• Để ước lượng mô hình hồi quy, ta cần có dữ liệu
• Một mẫu ngẫu nhiên gồm n quan sát được rút từ tổng thể
Quan sát thứ nhất Quan sát thứ i
Quan sát thứ hai
Quan sát thứ ba
Quan sát thứ n

Giá trị của biến Giá trị của biến Đường hồi quy
giải thích tại phụ thuộc tại mẫu
quan sát thứ i quan sát thứ i

www.themegallery.com

2. Phương pháp bình phương nhỏ nhất


• Hàm hồi quy tổng thể:
( PRF ) : y   0  1 x  u
• Hàm hồi quy mẫu:
( SRF ) : y  ˆ0  ˆ1 x  uˆ
Xét tại quan sát thứ i, phần dư của hàm hồi quy mẫu là:
uˆi  yi  ˆ0  ˆ1 xi , i  1, n
• Ước lượng bình phương nhỏ nhất (Ordinary Least Squares Estimates): Ta
chọn 𝛽 và 𝛽 sao cho tổng bình phương các phần dư là nhỏ nhất:
n n
L   uˆ   ( yi  ˆ0  ˆ1 xi ) 2  min
2
i
i 1 i 1
Ta tìm 𝛽 và 𝛽 như thế nào để cực tiểu hóa hàm L?

www.themegallery.com

4
1/12/2022

2. Phương pháp bình phương nhỏ nhất


• Lần lượt cho các đạo hàm riêng bằng 0, ta tìm được giá trị của 𝜷𝟎 và 𝜷𝟏 để
hàm L đạt được cực tiểu: n

L n (y  y )( xi  x )
 2. ( yi  ˆ0  ˆ1 xi )  0
i

ˆ  ˆ1  i 1
 0 n

 (x  x )
i 1 2
i
L n
 2. xi ( yi  ˆ0  ˆ1 xi )  0 i 1
ˆ
1 i 1 ˆ0  y  ˆ1 x
• Ví dụ: Xây dựng hàm hồi quy mẫu: (Đơn vị: triệu đồng/năm)
X (Thu nhập) 100 80 98 95 75 79 78 69 81 88
90 75 78 88 62 69 65 55 60 70
1076 4309
 ˆ1   0,9881; ˆ0   12,0937
www.themegallery.com
1089 363
9

2. Phương pháp bình phương nhỏ nhất


• Ví dụ: Tiền lương CEO và lợi nhuận trên vốn chủ sở hữu
salary   0  1 roe  u
Tiền lương (tính theo ngàn USD) Lợi nhuận trên vốn chủ sở hữu (Return on equity)
của doanh nghiệp mà CEO đang làm việc (%)
• Hồi quy ước lượng được
  963,191  18,501 roe
salary
Nếu lợi nhuận trên vốn chủ sở hữu tăng 1% thì
Hệ số chặn
tiền lương được dự đoán thay đổi khoảng 18501$
• Diễn giải ý nghĩa của hệ số 𝜷𝟏 ?

www.themegallery.com

10

5
1/12/2022

2. Phương pháp bình phương nhỏ nhất

Hàm hồi quy ước lượng


(phụ thuộc vào mẫu)

Hàm hồi quy tổng thể


(chưa biết)

www.themegallery.com

11

3. Các tính chất đại số của ước lượng OLS


n
• Tổng các phần dư OLS bằng 0:  uˆ
i 1
i 0
n
• Hiệp phương sai mẫu giữa biến giải thích và phần dư OLS bằng 0:
L n n
 x uˆ i i 0
 2. ( yi  ˆ0  ˆ1 xi )   uˆi  0
i 1
Do:
ˆ
 0 i 1 i 1

L n n
 2. xi ( yi   0  1 xi )   xi uˆi  0
ˆ ˆ
ˆ
1 i 1 i 1
• Điểm trung bình mẫu (𝒙, 𝒚) luôn nằm trên đường hồi quy mẫu: y  ˆ0  ˆ1 x

www.themegallery.com

12

6
1/12/2022

4. Mức độ phù hợp của mô hình


• Mục tiêu: cần xem xét mức độ giải thích của biến độc lập đối với sự biến động
của biến phụ thuộc.
• Tổng bình phương
n
toàn phần: đại diện cho tổng biến động của biến phụ thuộc.
SST   ( yi  y ) 2
i 1
• Tổng bình phương hồi quy: đại diện cho tổng biến động đã được giải thích bởi
hàm hồi quy. n
SSE   ( yˆ i  y ) 2
i 1
• Tổng bình phương phần dư: đại diện cho tổng biến động chưa được giải thích
bởi hàm hồi quy.
n n
SSR   ( yi  yˆi )   uˆi2
2

i 1 i 1
• Ta luôn có: SST = SSE + SSR
www.themegallery.com

13

4. Mức độ phù hợp của mô hình


• SSR càng nhỏ càng tốt.

SSR SSE
 Hệ số xác định: R2  1  
SST SST
 Đặc điểm:
• 0  R2  1
• R2 = 0: Mô hình hoàn toàn không phù hợp với mẫu nghiên cứu.
• R2 = 1: Mô hình hoàn toàn phù hợp với mẫu nghiên cứu.
• R2 cho biết phần biến động của biến phụ thuộc y đã được giải thích bởi các biến
độc lập trong mô hình, còn (1-R2) cho biết phần biến động của y chưa được giải
thích, gây ra bởi sai số.
• Cảnh báo: R2 cao không nhất thiết hàm ý về mối quan hệ nhân quả trong hồi
quy.
www.themegallery.com

14

7
1/12/2022

4. Mức độ phù hợp của mô hình


 Ví dụ: Tiền lương của CEO và lợi nhuận trên vốn chủ sở hữu
  963.191  18.501 roe
salary
Hàm hồi quy giải thích chỉ 1,3% tổng
n  209; R 2  0.0132 biến động của tiền lương CEO

 Cách biểu diễn khác của R2:


2
 n 
  ( yi  y )( yˆ i  yˆ ) 
R 2  n  i 1   ry2, yˆ
 2 
n
2
  ( yi  y )   ( yˆ i  yˆ ) 
 i 1  i 1 
www.themegallery.com

15

5. Các giả thiết cho mô hình hồi quy tuyến tính


 Giả thiết SLR .1: Tuyến tính theo các tham số
y   0  1 x  u
 Giả thiết SLR.2: Mẫu ngẫu nhiên
 Giả thiết SLR.3: Sự biến động trong mẫu của biến giải thích
Các giá trị cụ thể của biến x trong mẫu (tức là các giá trị xi) không được nhận cùng
một giá trị.
 Giả thiết SLR.4: Trung bình có điều kiện bằng 0: E (u | x )  0
Giá trị của biến giải thích không được chứa thông tin về trung bình của các yếu tố
không quan sát được.
 Giả thiết SLR.5: Phương sai thuần nhất: Var(ui | xi )  const  
2

Giá trị của biến giải thích không được chứa thông tin về sự biến động của các yếu
tố không quan sát được.
www.themegallery.com

16

8
1/12/2022

5. Các giả thiết cho mô hình hồi quy tuyến tính


• Minh họa hình học cho giả thiết phương sai không đổi

Sự biến động của các yếu tố


không quan sát được không
phụ thuộc vào giá trị của
biến giải thích

www.themegallery.com

17

5. Các giả thiết cho mô hình hồi quy tuyến tính


• Một ví dụ về phương sai thay đổi: Tiền lương và học vấn

Phương sai của các yếu tố


không quan sát được (các yếu tố
có tác động đến tiền lương) tăng
lên theo các giá trị của học vấn

www.themegallery.com

18

9
1/12/2022

5. Các giả thiết cho mô hình hồi quy tuyến tính


 Định lý 2.1: Tính không chệch của OLS
Nếu các giả thiết từ SLR.1 đến SLR.4 được thỏa mãn thì:
E ( ˆ0 )   0 ; E ( ˆ1 )  1
• 𝛽 và 𝛽 là ước lượng không chệch của 𝛽 và 𝛽 .
• Với một mẫu cho trước, các hệ số hồi quy mẫu (𝛽 và 𝛽 ) có thể lớn hơn hoặc nhỏ
hơn các hệ số hồi quy tổng thể 𝛽 và 𝛽 . Tuy nhiên, khi xét trung bình, trung bình
của các hệ số hồi quy mẫu sẽ bằng với giá trị của hệ số hồi quy tổng thể.
 Định lý 2.2: Phương sai mẫu của các ước lượng OLS
n n
Dưới các giả thiết từ SLR.1 đến SLR.5 thì: 2 2
 . xi x 2
 2
 2
 2 i
Var( ˆ1 )  n
 Var( ˆ0 )  n
i 1
 . i 1
SSTx n SSTx
(x  x)
i 1
i
2
n. ( xi  x ) 2
i 1
www.themegallery.com

19

5. Các giả thiết cho mô hình hồi quy tuyến tính


 Ước lượng phương sai của sai số
Vì 𝜎 = 𝑉𝑎𝑟(𝑢 |𝑥 ) chưa biết nên một ước lượng của 2 là:
n

 uˆ 2
i
SSR
ˆ 2  i 1

n2 n2
 Định lý 2.3: Ước lượng không chệch của 2
Nếu các giả thiết từ SLR.1 đến SLR.5 được thỏa mãn thì 𝜎 là ước lượng không
chệch của 2, tức là:
E (ˆ 2 )   2
𝜎 = 𝜎 được gọi là sai số chuẩn hồi quy (SER) hoặc sai số chuẩn của ước
lượng.
www.themegallery.com

20

10
1/12/2022

5. Các giả thiết cho mô hình hồi quy tuyến tính


Theo định lý 2.2, công thức tính phương sai mẫu của các ước lượng OLS là:
n n
 . x
2 2
x 2
 2
 2 i
 2 i
Var( ˆ1 )  n
 Var( ˆ0 )  n
i 1
 . i 1
SSTx n SSTx
(x  x)
i 1
i
2
n. ( xi  x ) 2
i 1

Nếu 𝜎 được thay vào các công thức trên thì ta thu được các phương sai ước lượng:
n n
ˆ . x
2 2
x 2
ˆ 2
ˆ 2 i
ˆ 2 i
V
ar( ˆ1 )  n
 V
ar( ˆ0 )  n
i 1
 . i 1
SSTx n SSTx
(x  x)
i 1
i
2
n. ( xi  x ) 2
i 1
www.themegallery.com

21

5. Các giả thiết cho mô hình hồi quy tuyến tính


Độ lệch chuẩn mẫu của ước lượng OLS: n

  x 2
i
sd ( ˆ1 )  Var( ˆ1 )  sd ( ˆ0 )  Var( ˆ0 )  . i 1
SSTx n SSTx
Nếu thay sai số chuẩn hồi quy 𝜎 vào các công thức trên thì ta thu được các sai số
chuẩn của ước lượng OLS:
n

ˆ ˆ x 2

se( ˆ1 )  V
i
ar( ˆ1 )  se( ˆ0 )  V
ar( ˆ0 )  . i 1
SSTx n SSTx

www.themegallery.com

22

11
1/12/2022

6. Vấn đề về đơn vị tính của biến và một số dạng


hàm hồi quy phi tuyến
 Ảnh hưởng của việc thay đổi đơn vị tính đến các thống kê OLS:
Ví dụ: Tiền lương của CEO và lợi nhuận trên vốn chủ sở hữu
salary   0  1 roe  u
Tiền lương (tính theo ngàn USD) Lợi nhuận trên vốn chủ sở hữu (Return on equity)
của doanh nghiệp mà CEO đang làm việc (%)
Hàm hồi quy ước lượng được:
  963,191  18,501 roe
salary
Nếu ta gọi tiền lương tính theo đơn vị USD là salardol, không cần chạy lại hồi quy,
ta suy ra hàm hồi quy mới sẽ là:
  963191  18501 roe
salardol
Các hệ số đã được nhân lên 1000
www.themegallery.com

23

6. Vấn đề về đơn vị tính của biến và một số dạng


hàm hồi quy phi tuyến
 Một số dạng hàm hồi quy phi tuyến:
Ý nghĩa của hệ số  1?
 Mô hình log – log:
ln y   0  1 ln x  u
Ý nghĩa của 1: Khi x thay đổi 1% thì y thay đổi  1%.
 Mô hình log – lin:
ln y   0  1 x  u
Ý nghĩa của 1: Khi x thay đổi 1 đơn vị thì y thay đổi ( 1100)%.
 Mô hình lin – log:
y   0  1 ln x  u
Ý nghĩa của 1: Khi x thay đổi 1% thì y thay đổi ( 1/100) đơn vị.

www.themegallery.com

24

12
1/12/2022

L/O/G/O

Chương 3
MÔ HÌNH HỒI QUY BỘI – VẤN ĐỀ ƯỚC LƯỢNG
Wooldridge: Kinh tế lượng nhập môn:
Cách tiếp cận hiện đại, 5e

GV: Hoàng Thị Diễm Hương

Nội dung
1. Giới thiệu mô hình hồi quy tuyến tính bội
2. Phương pháp bình phương nhỏ nhất (OLS)
3. Các tính chất đại số của ước lượng OLS
4. Mức độ phù hợp của mô hình
5. Các giả thiết cho mô hình hồi quy tuyến tính
6. Một số vấn đề cần lưu ý của hồi quy bội

www.themegallery.com

1
1/12/2022

1. Mô hình hồi quy tuyến tính bội


• Định nghĩa về mô hình hồi quy tuyến tính bội
„Giải thích biến y theo các biến x1, x2,..., xk“
Hệ số chặn Các hệ số góc

Biến phụ thuộc, Biến độc lập, Thành phần sai số


biến được giải thích, Biến giải thích, Nhiễu
biến phản ứng,… Biến hồi quy,… Các yếu tố không quan sát được,…

• Mô hình gồm 1 biến phụ thuộc và k biến độc lập.


www.themegallery.com

1. Mô hình hồi quy tuyến tính bội


• Sự cần thiết của mô hình hồi quy bội
– Đưa thêm nhiều biến giải thích vào mô hình.
– Thực hiện phân tích trong điều kiện giữ các yếu tố khác không đổi.
– Cho phép sử dụng dạng hàm đa dạng hơn.

• Ví dụ: Phương trình tiền lương


Cho phép đo lường tác động của trình độ học vấn trong điều kiện kinh nghiệm
không đổi

Tất cả các yếu tố khác

Tiền lương theo giờ Số năm đi học Kinh nghiệm lao động
www.themegallery.com

2
1/12/2022

1. Mô hình hồi quy tuyến tính bội


• Ví dụ: Điểm kiểm tra trung bình và chi phí trên mỗi sinh viên
Các yếu tố khác

Điểm trung bình của Chi phí trên mỗi sinh Thu nhập trung bình của gia đình
bài thi chuẩn hóa viên của trường các sinh viên trong trường
– Chi phí trên mỗi sinh viên có thể tương quan với Thu nhập trung bình của các
gia đình do vấn đề tài chính.
– Nếu bỏ biến Thu nhập trung bình của gia đình ra khỏi hàm hồi quy có thể dẫn
tới ước lượng tác động của Chi phí trên mỗi sinh viên đến Điểm trung bình bị
chệch.
– Trong hồi quy đơn, tác động của biến Chi phí trên mỗi sinh viên đến Điểm
trung bình có thể đã bao gồm luôn tác động của biến Thu nhập trung bình của
gia đình.
www.themegallery.com

1. Mô hình hồi quy tuyến tính bội


• Ví dụ: Thu nhập và chi tiêu của hộ gia đình
Các yếu tố khác

Chi tiêu của hộ Thu nhập của hộ Thu nhập của hộ bình phương
– Mô hình có hai biến giải thích: Thu nhập và Thu nhập bình phương
– Chi tiêu được giải thích bằng hàm bậc hai của thu nhập.
– Cần cẩn thận khi diễn giải ý nghĩa của các hệ số hồi quy:
Mức chi tiêu tăng thêm Phụ thuộc vào
bao nhiêu nếu thu nhập mức thu nhập
tăng thêm 1 đơn vị? cụ thể đang xét

www.themegallery.com

3
1/12/2022

2. Phương pháp bình phương nhỏ nhất


• Mẫu ngẫu nhiên:
( xi1 ,..., xik ), i  1, n
• Hàm hồi quy tổng thể:
( PRF ) : y   0  1 x1  ...   k xk  u
• Hàm hồi quy mẫu:
( SRF ) : y  ˆ0  ˆ1 x1  ...  ˆk xk  uˆ
Xét tại quan sát thứ i, phần dư của hàm hồi quy mẫu là:
uˆi  yi  ˆ0  ˆ1 xi1  ...  ˆk xik , i  1, n
• Phương pháp bình phương nhỏ nhất (Ordinary Least Squares Estimates): Ta
chọn 𝛽 , 𝛽 , … , 𝛽 sao cho tổng các phần dư càng nhỏ càng tốt:
n n
L   uˆ   ( yi  ˆ0  ˆ1 xi1  ...  ˆk xik ) 2  min
2
i
i 1 i 1
www.themegallery.com

2. Phương pháp bình phương nhỏ nhất


• Diễn giải ý nghĩa của mô hình hồi quy bội
Cho biết lượng thay đổi của biến phụ thuộc khi biến giải
thích thứ j thay đổi một đơn vị, trong điều kiện các biến
giải thích khác và sai số không đổi
– Mô hình hồi quy bội cho phép giữ nguyên giá trị của các biến giải thích khác
không đổi, ngay cả khi trong thực tế có thể các biến giải thích này là có tương
quan với nhau (cách diễn giải này được gọi là „Ceteris paribus“).
– Chúng ta vẫn cần giả định rằng các yếu tố không quan sát được sẽ không
thay đổi khi biến giải thích thay đổi.

www.themegallery.com

4
1/12/2022

2. Phương pháp bình phương nhỏ nhất


• Ví dụ: Các yếu tố tác động đến điểm GPA

Điểm GPA trung bình Điểm GPA trung bình khi Kết quả bài kiểm tra
của sinh viên ở đại học học phổ thông trung học
• Diễn giải:
– Trong điều kiện ACT không đổi, mỗi điểm GPA trung học tăng thêm sẽ có thể
làm tăng 0,453 điểm trong điểm GPA đại học.
– Hoặc: Nếu chúng ta so sánh hai sinh viên có cùng ACT nhưng điểm hsGPA
của sinh viên A cao hơn 1 điểm so với sinh viên B, thì chúng ta dự đoán rằng
sinh viên A sẽ có colGPA cao hơn 0,453 điểm so với sinh viên B.
– Trong điều kiện điểm hsGPA như nhau, mỗi 100 điểm ACT cao hơn sẽ liên
hệ với điểm colGAP cao hơn gần 1 điểm.
www.themegallery.com

2. Phương pháp bình phương nhỏ nhất


• Cách diễn giải tác động riêng phần trong hồi quy bội:
Hệ số hồi quy của biến giải thích trong mô hình hồi quy bội có thể được
ước lượng bằng hai bước sau:
 Bước 1: Hồi quy biến giải thích này theo tất cả các biến giải thích còn lại.
 Bước 2: Hồi quy y theo phần dư của hàm hồi quy ở bước 1.
Tại sao cách này có thể thực hiện được?
 Phần dư của hàm hồi quy ở bước 1 đó chính là phần còn lại của biến giải
thích và phần còn lại này không tương quan với các biến giải thích khác trong
mô hình.
 Hệ số góc trong hàm hồi quy ở bước 2 chính là tác động đã tách biệt của
riêng biến giải thích đó đến biến phụ thuộc.

www.themegallery.com

10

5
1/12/2022

3. Các tính chất đại số của ước lượng OLS


n
• Tổng các phần dư OLS bằng 0:  uˆ
i 1
i 0

• Hiệp phương sai mẫu giữa các biến giải thích và phần dư OLS bằng 0:
n

 x uˆ
i 1
ij i  0, j  1, k
• Điểm trung bình mẫu (𝒙𝟏 , … , 𝒙𝒌 , 𝒚) luôn nằm trên đường hồi quy mẫu.

www.themegallery.com

11

4. Mức độ phù hợp của mô hình


• Mục tiêu: cần xem xét mức độ giải thích của biến độc lập đối với sự biến động
của biến phụ thuộc.
• Tổng bình phương
n
toàn phần: đại diện cho tổng biến động của biến giải thích.
SST   ( yi  y ) 2
i 1
• Tổng bình phương hồi quy: đại diện cho tổng biến động đã được giải thích bởi
hàm hồi quy. n
SSE   ( yˆ i  y ) 2
i 1
• Tổng bình phương phần dư: đại diện cho tổng biến động chưa được giải thích
bởi hàm hồi quy.
n n
SSR   ( yi  yˆi )   uˆi22

i 1 i 1
• Ta luôn có: SST = SSE + SSR
www.themegallery.com

12

6
1/12/2022

4. Mức độ phù hợp của mô hình


• SSR càng nhỏ càng tốt.

SSR SSE
 Hệ số xác định: R2  1  
SST SST
 Đặc điểm:
• 0  R2  1
• R2 = 0: Mô hình hoàn toàn không phù hợp với mẫu nghiên cứu.
• R2 = 1: Mô hình hoàn toàn phù hợp với mẫu nghiên cứu.
• R2 cho biết phần biến động của biến phụ thuộc y đã được giải thích bởi hàm hồi
quy.
• Lưu ý: R2 chỉ tăng lên nếu thêm biến giải thích vào hàm hồi quy.
• Lưu ý: Ngay cả khi R2 nhỏ thì hàm hồi quy vẫn có thể cung cấp các ước lượng
tốt cho các tác động ceteris paribus.
www.themegallery.com

13

4. Mức độ phù hợp của mô hình


 Cách biểu diễn khác của R2 :
2
 n 
 i ( y  y )( ˆ
y i  ˆ
y ) 
R  n
2  i 1   ry2, yˆ
 2 
n
2
  ( yi  y )   ( yˆ i  yˆ ) 
 i 1  i 1 
n 1
 Hệ số xác định hiệu chỉnh : R 2  1  (1  R 2 ).
n  ( k  1)
 Đặc điểm của hệ số xác định hiệu chỉnh:
• 𝑅  R2  1
• 𝑅 có thể âm, nếu âm thì coi như bằng 0.
• Lưu ý: 𝑅 có thể được dùng để quyết định xem một biến giải thích (hoặc một tập
các biến giải thích) có thuộc vào mô hình hồi quy hay không. Nếu thêm biến mà
𝑅 tăng thì việc thêm biến là cần thiết và giúp cải thiện mô hình về mặt thống kê.
www.themegallery.com

14

7
1/12/2022

5. Các giả thiết cho mô hình hồi quy tuyến tính


 Giả thiết MLR .1: Tuyến tính theo các tham số
y   0  1 x1  ...   k xk  u
 Giả thiết MLR.2: Mẫu ngẫu nhiên
 Giả thiết MLR.3: Không có cộng tuyến hoàn hảo
Trong mẫu (và vì vậy trong tổng thể), không có biến độc lập nào là hằng số và
không có phụ thuộc tuyến tính giữa các biến độc lập.
Lưu ý về giả thiết MLR.3:
– Giả thiết này chỉ loại trừ trường hợp cộng tuyến/tương quan hoàn hảo giữa
các biến giải thích; các tương quan không hoàn hảo vẫn có thể xảy ra.
– Nếu một biến giải thích là tổ hợp tuyến tính của các biến độc lập khác thì biến
giải thích đó là không cần thiết và sẽ bị loại bỏ ra khỏi hàm hồi quy.
– Biến hằng số cũng bị loại bỏ (vì cộng tuyến hoàn hảo với hệ số chặn).
www.themegallery.com

15

5. Các giả thiết cho mô hình hồi quy tuyến tính


 Giả thiết MLR.4: Trung bình có điều kiện bằng 0
E (u | x1 ,..., xk )  0
Giá trị của biến giải thích không được chứa thông tin về trung bình của các yếu tố
không quan sát được.
Trong một mô hình hồi quy bội, giả thiết này sẽ hầu như thỏa khi càng có ít yếu tố
trong thành phần sai số.
Thảo luận về giả thiết trung bình có điều kiện bằng 0:
– Các biến giải thích có tương quan với sai số được gọi là biến nội sinh; sự nội
sinh là trường hợp vi phạm giả thiết MLR.4.
– Các biến giải thích không tương quan với sai số được gọi là biến ngoại sinh;
MLR.4 được thỏa mãn nếu tất cả các biến giải thích là ngoại sinh.
– Sự ngoại sinh là giả thiết quan trọng cho việc diễn giải quan hệ nhân quả của hồi
quy bội và cho tính không chệch của ước lượng OLS.
www.themegallery.com

16

8
1/12/2022

5. Các giả thiết cho mô hình hồi quy tuyến tính


 Giả thiết MLR.5: Phương sai thuần nhất
Var(ui | xi1 ,..., xik )  const   2
Giá trị của biến giải thích không được chứa thông tin về phương sai của các yếu tố
không quan sát được.
 Định lý 3.1: Tính không chệch của OLS
Nếu các giả thiết từ MLR.1 đến MLR.4 được thỏa mãn thì:
E ( ˆ j )   j ; j  0, k
• 𝛽 là ước lượng không chệch của 𝛽 .
• Với một mẫu cho trước, các hệ số hồi quy mẫu 𝛽 có thể lớn hơn hoặc nhỏ hơn
các hệ số hồi quy tổng thể 𝛽 . Tuy nhiên, khi xét trung bình, trung bình của các hệ
số hồi quy mẫu sẽ bằng với giá trị của hệ số hồi quy tổng thể.

www.themegallery.com

17

5. Các giả thiết cho mô hình hồi quy tuyến tính


 Định lý 3.2: Phương sai mẫu của các ước lượng OLS
Nếu các giả thiết từ MLR.1 đến MLR.5 được thỏa mãn thì:
2 n
Var( ˆ j )  ; j  1, k SST j   ( xij  x j ) 2
SST j (1  R 2j ) i 1
Trong đó 𝑅 là R2
có được khi hồi quy (có hệ số chặn) biến xj theo tất cả các biến độc
lập còn lại và SSTj là tổng biến động mẫu của biến xj.
 Ước lượng phương sai của sai số:
Vì 𝜎 = 𝑉𝑎𝑟(𝑢 |𝑥 ) chưa biết nên một ước lượng của 2 là:
n

 uˆ 2
i
SSR
Thành phần n–(k+1) được gọi là
bậc tự do (df) của OLS với n
ˆ 2  i 1
 quan sát và k biến độc lập
n  (k  1) n  (k  1)
www.themegallery.com

18

9
1/12/2022

5. Các giả thiết cho mô hình hồi quy tuyến tính


 Định lý 3.3: Ước lượng không chệch của 2
Nếu các giả thiết từ SLR.1 đến SLR.5 được thỏa mãn thì 𝜎 là ước lượng không
chệch của 2, tức là:
E (ˆ 2 )   2
𝜎 = 𝜎 được gọi là sai số chuẩn hồi quy (SER) hoặc sai số chuẩn của ước
lượng.
 Theo định lý 3.2, phương sai của các ước lượng OLS là:
2
Var( ˆ j )  ; j  1, k
SST j (1  R 2j )
Nếu thay 𝜎 vào chỗ 2 thì ta thu được các phương sai ước lượng:
ˆ 2
V
ar( ˆ j )  ; j  1, k
SST j (1  R 2j )
www.themegallery.com

19

5. Các giả thiết cho mô hình hồi quy tuyến tính



 Độ lệch chuẩn mẫu của ước lượng OLS: sd ( ˆ j )  Var( ˆ j ) 
SST j (1  R 2j )
Nếu thay 𝜎 vào công thức độ lệch chuẩn trên thì ta thu được sai số chuẩn của
ước lượng OLS:
ˆ
se( ˆ j )  V
ar( ˆ j ) 
SST j (1  R 2j )
Các sai số chuẩn này đo lường mức độ chính xác của các hệ số hồi quy ước lượng
được.

www.themegallery.com

20

10
1/12/2022

5. Các giả thiết cho mô hình hồi quy tuyến tính


 Các thành phần trong phương sai của ước lượng OLS:
2
Var( ˆ j )  ; j  1, k
SST j (1  R 2j )
 𝑽𝒂𝒓 𝜷𝒋 càng lớn thì ước lượng càng thiếu chính xác.
 Phương sai 2 của sai số u:
• 2 càng lớn thì 𝑉𝑎𝑟 𝛽 càng lớn.
• 2 không giảm khi kích thước mẫu tăng lên.
 Tổng biến động trong mẫu của biến giải thích (SSTj):
• Tổng biến động trong mẫu của biến giải thích càng nhiều (SSTj càng lớn) thì
𝑉𝑎𝑟 𝛽 càng nhỏ.
• SSTj sẽ tăng khi kích thước mẫu tăng.

www.themegallery.com

21

5. Các giả thiết cho mô hình hồi quy tuyến tính


 Các thành phần trong phương sai của ước lượng OLS:
2
Var( ˆ j )  ; j  1, k
SST j (1  R 2j )
 Quan hệ tuyến tính giữa các biến độc lập (𝑹𝟐𝒋 ):
• 𝑅 càng cao thì 𝑉𝑎𝑟 𝛽 càng lớn.
• 𝑅 càng cao (𝑅 → 1) khi càng có nhiều biến giải thích được thêm vào mô
hình và các biến có tương quan với nhau.
 Định lý 3.4: Định lý Gauss – Markov (Tính hiệu quả của OLS)
Nếu các giả thiết từ MLR.1 đến MLR.5 được thỏa mãn thì các ước lượng OLS 𝛽
là ước lượng tuyến tính không chệch tốt nhất (BLUEs) của 𝛽 .
Var( ˆ j )  Var(  j )
Với 𝛽 là một ước lượng tuyến tính không chệch bất kỳ.
www.themegallery.com

22

11
1/12/2022

6. Một số vấn đề cần lưu ý của hồi quy bội


 Vấn đề bỏ sót biến (định dạng thiếu mô hình):
 Biến bỏ sót là biến có tác động đến biến phụ thuộc nhưng chưa được đưa
vào mô hình.
 Hậu quả của việc bỏ sót biến:
• Nếu biến bỏ sót có tương quan với biến độc lập thì ước lượng OLS bị chệch.
• Nếu biến bỏ sót không tương quan với biến độc lập thì ước lượng OLS không
bị chệch.
 Ví dụ: Bỏ sót biến năng lực khi hồi quy tiền lương

Cả hai đều có thể


mang dấu dương

Mức chệch của 1


www.themegallery.com

23

6. Một số vấn đề cần lưu ý của hồi quy bội


 Thêm biến không liên quan (định dạng thừa mô hình):
 Một (hoặc nhiều) biến độc lập được đưa vào mô hình mặc dù nó không có
tác động đến y.
 Hậu quả của việc thêm biến không liên quan:
• Không ảnh hưởng đến tính chệch của các ước lượng OLS.
• Có thể làm tăng phương sai của các ước lượng OLS (làm tăng 𝑉𝑎𝑟(𝛽 )).
Do:
2
Var( ˆ j )  ; j  1, k
SST j (1  R 2j )
Càng thêm nhiều biến thì 𝑅 càng tăng

www.themegallery.com

24

12
1/12/2022

6. Một số vấn đề cần lưu ý của hồi quy bội


 Hiện tượng đa cộng tuyến:
 Vấn đề các biến giải thích gần như phụ thuộc tuyến tính nhau được gọi là
hiện tượng đa cộng tuyến.
 Ví dụ: Tác động của các loại chi phí khác nhau ở trường học đến kết quả
học tập của SV
Điểm trung bình bài thi Chi phí cho Các chi phí cho nguyên Các chi phí khác
chuẩn hóa của trường giáo viên vật liệu dạy học

Các loại chi phí sẽ có tương quan mạnh với nhau bởi vì một trường học có nguồn lực
lớn sẽ chi tiêu lớn cho tất cả các khoản chi.
Rất khó để ước lượng tác động riêng phần của từng loại chi tiêu bởi vì tất cả các
khoản chi thường cùng cao hoặc cùng thấp.
Kết quả là, phương sai mẫu của các hệ số hồi quy ước lượng được sẽ lớn.
www.themegallery.com

25

6. Một số vấn đề cần lưu ý của hồi quy bội


 Hiện tượng đa cộng tuyến:
 Thảo luận thêm về đa cộng tuyến:
• Trong một số trường hợp, việc loại bỏ một số biến độc lập có thể làm giảm đa
cộng tuyến (nhưng cách làm này có thể dẫn tới sự chệch do bỏ sót biến).
• Chỉ có phương sai mẫu của biến bị đa cộng tuyến bị phóng đại, ước lượng
tham số của các biến giải thích khác có thể không bị ảnh hưởng.
• Lưu ý rằng đa cộng tuyến không vi phạm giả thiết MLR.3.
• Đa cộng tuyến có thể được phát hiện thông qua „nhân tử phóng đại
phương sai“ (VIF):
1
VIFj  ; j  1, k
1  R 2j
VIF càng cao thì đa cộng tuyến càng mạnh. VIF không nên lớn hơn 10.
www.themegallery.com

26

13
2/9/2022

Chương 4

MÔ HÌNH HỒI QUY BỘI –


VẤN ĐỀ SUY DIỄN THỐNG KÊ
Wooldridge: Kinh tế lượng nhập môn:
Cách tiếp cận hiện đại, 5e

GV: Hoàng Thị Diễm Hương

Nội dung
1. Giả thiết về phân phối chuẩn của sai số tổng thể
2. Kiểm định giả thuyết đơn về tham số tổng thể
3. Khoảng tin cậy
4. Kiểm định giả thuyết về tổ hợp tuyến tính của các tham số
5. Kiểm định giả thuyết bội về hệ số hồi quy tổng thể

1
2/9/2022

Nhắc lại và bổ túc về phân phối xác suất


 Nhắc lại về phân phối chuẩn:
 Định nghĩa:
Biến ngẫu nhiên liên tục X nhận giá trị trong khoảng (-; +) đgl là có phân phối
0.45
chuẩn nếu hàm mật độ xác 2
suất của nó có dạng: 0.4
(x - μ)
1 -
2σ 2
0.35

f(x) = .e 0.3

σ 2π 0.25
0.2
Ký hiệu: X ~ N(; 2). 0.15
0.1
 Tính chất: 0.05

• E(X) = ; Mod(X) = ; Var(X) = 2 -2 -1


0
0 1 2 3 4 5 6

2
• Nếu các biến ngẫu nhiên X1,…, Xn độc lập (với n tùy ý) và X1~N(1;1 );
X2~N(2;22);…; Xn~N(n;n2) thì:
n n n

X i=1
i = X1 +X 2 +...+X n ~ N(  μ , σ
i=1
i
i=1
2
i )

Nhắc lại và bổ túc về phân phối xác suất


 Nhắc lại về phân phối chuẩn:
 Tính chất:
• Định lý giới hạn trung tâm: Nếu X1,…, Xn độc lập, có cùng quy luật phân phối
xác suất và E(Xi) = ; Var(Xi) = 2 thì với n đủ lớn (n > 30), ta có xấp xỉ:
n

X
i=1
i ~ N( nμ; nσ 2 )

• Nếu X ~ N(; 2) và k là hằng số thì : kX ~ N(k; k22)


 Bổ túc về các phân phối xác suất khác: n
 Phân phối Chi-bình phương: Nếu Zi ~ N(0;1) (i = 1, n) thì: Z
i=1
2
i ~ χ 2 (n)
Z
 Phân phối Student (phân phối t): Nếu Z ~ N(0;1) và X ~ 2(m) thì: ~ tm
X/m
X1 /m
 Phân phối Fisher: Nếu X1 ~ 2(m) và X2 ~ 2(n) thì: ~ F(m, n)
X 2 /n
4

2
2/9/2022

1. Giả thiết về phân phối chuẩn của sai số tổng thể


 Giả thiết MLR.6: Phân phối chuẩn
Sai số tổng thể u độc lập với các biến giải thích x1, x2,..., xk và có phân phối chuẩn
với trung bình bằng 0 và phương sai 2:
ui  N (0; 2 ); i  1, n
 yi | xi1 , xi 2 ,..., xik  N (  0  1 x1  ...   k xk ; 2 ); i  1, n

Giả định rằng các yếu tố không quan sát được


đều có phân phối chuẩn quanh hàm hồi quy
tổng thể.
Hình dạng và phương sai của các phân phối
chuẩn này không phụ thuộc vào bất kỳ biến
giải thích nào.

1. Giả thiết về phân phối chuẩn của sai số tổng thể


 Thảo luận về giả thiết phân phối chuẩn:
 Vì sao có thể giả định sai số có phân phối chuẩn?
Vì phần sai số được xem là tổng của „nhiều“ yếu tố không quan sát được. Theo
định lý giới hạn trung tâm, tổng này sẽ tuân theo phân phối chuẩn.
 Tuy nhiên giả định về phân phối chuẩn của các sai số có thể gặp một số vấn đề:
• Có bao nhiêu yếu tố? Số lượng các yếu tố đó có đủ nhiều hay không?
• Các yếu tố này có thể có phân phối rất khác nhau.
• Mức độ độc lập của các yếu tố này?
 Phân phối chuẩn của sai số là một vấn đề thuộc về thực nghiệm.
 Trong nhiều trường hợp, giả thiết phân phối chuẩn có thể không được đảm bảo.
Ví dụ:
• Tiền lương (không âm, thường phải lớn hơn lương tối thiểu).
• Số lần bị bắt giữ (chỉ nhận một vài giá trị nguyên không âm).
• Việc làm (có hoặc không có việc làm).

3
2/9/2022

1. Giả thiết về phân phối chuẩn của sai số tổng thể


 Thảo luận về giả thiết phân phối chuẩn:
 Trong một vài trường hợp, phân phối chuẩn có thể đạt được thông qua việc biến
đổi dạng biến phụ thuộc (chẳng hạn như dùng log(wage) thay cho wage).
 Dưới giả thiết về phân phối chuẩn thì OLS là ước lượng không chệch tốt nhất (kể
cả các ước lượng phi tuyến).
 Quan trọng: Với mục đích là suy diễn thống kê, giả thiết về phân phối chuẩn có
thể được thay thế bằng cỡ mẫu lớn.
 Định lý 4.1: Các phân phối chuẩn trong mẫu
Dưới các giả thiết từ MLR.1 đến MLR.6 thì: Các ước lượng đều có phân phối
 
ˆ j  N  j ;Var( ˆ j ) ; j  1, k hàm
chuẩn quanh các tham số đúng của
hồi quy tổng thể, với phương sai
ˆ j   j được tính theo công thức ở chương 3
Vì vậy:  
 N 0;1 ; j  1, k Các ước lượng chuẩn hóa đều tuân theo
sd ( ˆ j ) phân phối chuẩn tắc

2. Kiểm định giả thuyết đơn về tham số tổng thể


2.1. Kiểm định giả thuyết đơn về một tham số tổng thể:
• Xét mô hình hồi quy bội: y   0  1 x1  ...   k xk  u
• Nếu j = 0 thì biến xj không có tác động đến y  Để xét xem xj có tác động đến y
hay không thì ta cần kiểm định giả thuyết H0: j = 0
• Để xây dựng các kiểm định giả thuyết, ta cần kết quả sau:
Định lý 4.2: Phân phối t cho các ước lượng chuẩn hóa
Dưới các giả thiết từ MLR.1 đến MLR.6 thì:
ˆ j   j Nếu khi chuẩn hóa các ước lượng 𝛽 sử dụng
~ tn ( k 1) ; j  1, k các sai số chuẩn (thay vì độ lệch chuẩn) thì phân
se( ˆ j ) phối chuẩn được thay thế bằng phân phối t
Trong đó (k+1) là số tham số trong mô hình trên và bậc tự do là df = n-(k+1).
• Lưu ý: Phân phối t sẽ rất gần với phân phối chuẩn tắc N(0; 1) khi bậc tự do df lớn.

4
2/9/2022

2. Kiểm định giả thuyết đơn về tham số tổng thể


2.1. Kiểm định giả thuyết đơn về một tham số tổng thể:
• Kiểm định giả thuyết: H0: j = 0
• Để kiểm định giả thuyết H0 thì:
ˆ j
– Bước 1: Tính thống kê t: t ˆ 
j
se( ˆ j )
– Bước 2:
Nếu H1:  j ≠ 0 Nếu H1:  j < 0 Nếu H1:  j > 0
 Với mức ý nghĩa  cho  Với mức ý nghĩa  cho  Với mức ý nghĩa  cho
trước, ta tra bảng tìm trước, ta tra bảng tìm trước, ta tra bảng tìm
giá trị tới hạn t/2. giá trị tới hạn t. giá trị tới hạn t.
 Bác bỏ H0 khi |t| > t/2.  Bác bỏ H0 khi t < -t.  Bác bỏ H0 khi t > t.

2. Kiểm định giả thuyết đơn về tham số tổng thể


2.1. Kiểm định giả thuyết đơn về một tham số tổng thể:
• Ví dụ: Phương trình tiền lương
– Kiểm định rằng liệu sau khi kiểm soát biến học vấn và thâm niên, những công
nhân nhiều kinh nghiệm làm việc hơn có nhận được tiền lương cao hơn không?

Sai số chuẩn
Kiểm định H0: exper = 0 Kinh nghiệm được kỳ vọng hoặc có tác động dương đến
H1: exper > 0 tiền lương theo giờ, hoặc không có tác động gì.
Thống kê t
Bậc tự do
Các giá trị tới hạn tương ứng với mức ý nghĩa 5% và 1%
(đây là các mức ý nghĩa thông thường). Giả thuyết H0 bị
bác bỏ vì giá trị của thống kê t lớn hơn các giá trị tới hạn.
10

5
2/9/2022

2. Kiểm định giả thuyết đơn về tham số tổng thể


2.1. Kiểm định giả thuyết đơn về một tham số tổng thể:
• Ví dụ: Phương trình tiền lương
– Kiểm định rằng liệu sau khi kiểm soát biến học vấn và thâm niên, những công
nhân nhiều kinh nghiệm làm việc hơn có nhận được tiền lương cao hơn không?

Sai số chuẩn
Kiểm định H0: exper = 0
H1: exper > 0
Thống kê t
Bậc tự do
„Tác động của kinh nghiệm lên tiền lương theo giờ là lớn hơn
0 có ý nghĩa thống kê tại mức ý nghĩa 5% (và ngay cả tại
mức 1%).“
11

2. Kiểm định giả thuyết đơn về tham số tổng thể


2.2. Một số hướng dẫn về ý nghĩa kinh tế và ý nghĩa thống kê
– Nếu một hệ số hồi quy khác 0 trong một kiểm định hai phía, biến độc lập tương
ứng với hệ số hồi quy đó được gọi là „có ý nghĩa thống kê“.
– Nếu một biến độc lập có ý nghĩa thống kê, thì hãy thảo luận về độ lớn của hệ số
để đánh giá ý nghĩa kinh tế hoặc ý nghĩa thực tiễn của biến.
– Một biến có ý nghĩa thống kê không nhất thiết phải có ý nghĩa kinh tế hoặc ý
nghĩa thực tiễn!
– Nếu một biến có ý nghĩa thống kê và ý nghĩa kinh tế nhưng bị „sai“ dấu thì mô
hình hồi quy có thể bị định dạng sai.
– Nếu một biến không có ý nghĩa thống kê ở mức ý nghĩa thông thường (10%, 5%,
1%), người ta có thể nghĩ đến việc bỏ biến đó ra khỏi hàm hồi quy.
– Nếu quy mô mẫu nhỏ thì các tác động có thể bị ước lượng „kém chính xác“
(imprecise), vì vậy bằng chứng của việc biến không ý nghĩa thống kê không còn
mạnh nữa.

12

6
2/9/2022

2. Kiểm định giả thuyết đơn về tham số tổng thể


2.3. Kiểm định giả thuyết tổng quát về một tham số tổng thể:
• Giả thuyết không: H0: j = aj
• Để kiểm định giả thuyết H0 thì:
ˆ j  a j
– Bước 1: Tính thống kê t: t
se( ˆ j )
– Bước 2:
Nếu H1:  j ≠ aj Nếu H1:  j < aj Nếu H1:  j > aj
 Với mức ý nghĩa  cho  Với mức ý nghĩa  cho  Với mức ý nghĩa  cho
trước, ta tra bảng tìm trước, ta tra bảng tìm trước, ta tra bảng tìm
giá trị tới hạn t/2. giá trị tới hạn t. giá trị tới hạn t.
 Bác bỏ H0 khi |t| > t/2.  Bác bỏ H0 khi t < -t.  Bác bỏ H0 khi t > t.

13

2. Kiểm định giả thuyết đơn về tham số tổng thể


2.3. Kiểm định giả thuyết tổng quát về một tham số tổng thể:
• Ví dụ: Vấn đề tội phạm trong trường học và số sinh viên theo học
– Một giả thuyết được quan tâm là liệu số lượng phạm tội có tăng 1% khi số sinh
viên theo học tăng 1%?

Giá trị ước lượng là khác 1


nhưng sự khác nhau có ý
nghĩa thống kê hay không?

Giả thuyết H0 bị bác


bỏ ở mức ý nghĩa 5%

14

7
2/9/2022

2. Kiểm định giả thuyết đơn về tham số tổng thể


2.4. Tính toán p-value cho các kiểm định t
– Nếu mức ý nghĩa càng nhỏ, sẽ có một điểm giá trị mà tại đó giả thuyết không (H0)
không thể bị bác bỏ. Lý do là vì, bằng cách hạ thấp mức ý nghĩa, người ta muốn
tránh sai lầm khi bác bỏ một giả thuyết H0 đúng.
– Mức ý nghĩa nhỏ nhất mà tại đó giả thuyết H0 bị bác bỏ, được gọi là p-value của
kiểm định giả thuyết.
– Một giá trị p-value nhỏ là bằng chứng để chống lại giả thuyết H0 vì người ta sẽ bác
bỏ giả thuyết H0 thậm chí ở mức ý nghĩa rất nhỏ.
– Một giá trị p-value lớn là bằng chứng để ủng hộ giả thuyết không.
– p-value giúp dễ dàng kết luận hơn là các giá trị thống kê ở những mức ý nghĩa cho
trước.

15

2. Kiểm định giả thuyết đơn về tham số tổng thể


2.4. Tính toán p-value cho các kiểm định t
• Minh họa cách tìm p-value (cho kiểm định hai phía)
p-value là mức ý nghĩa mà tại đó không có
sự khác biệt giữa bác bỏ và không bác bỏ
Các giá trị tới hạn giả thuyết H0.
tương ứng với Trong trường hợp kiểm định hai phía, p-
mức ý nghĩa 5% value chính là xác suất để một biến ngẫu
nhiên (có phân phối t) có giá trị tuyệt đối
lớn hơn giá trị tuyệt đối của thống kê t thu
được, tức là:
P(| T | 1.85)  2  0.0359  0.0718
Từ đây, giả thuyết H0 bị bác bỏ khi và chỉ
khi p-value tương ứng nhỏ hơn mức ý
nghĩa cho trước.
Giá trị của Ví dụ, với mức ý nghĩa cho trước 5% thì giá
thống kê t trị của thống kê t không nằm trong miền
bác bỏ.
16

8
2/9/2022

3. Khoảng tin cậy


• Khoảng tin cậy của hệ số hồi quy tổng thể:
Với độ tin cậy (1-) cho trước, khoảng tin cậy của hệ số hồi quy tổng thể j có dạng:

 j  ˆ j  t /2 .se( ˆ j ); ˆ j  t / 2 .se( ˆ j ) 
• Lý giải cho khoảng tin cậy:
– Các biên của khoảng là ngẫu nhiên.
– 100(1-)% được gọi là độ tin cậy.
– Trong các mẫu có lặp, khoảng tin cậy được tìm theo công thức ở trên sẽ có thể
chứa được hệ số của hàm hồi quy tổng thể trong 100(1-)% các trường hợp.
• Liên hệ giữa khoảng tin cậy và việc kiểm định giả thuyết H0:  j = aj
Nếu aj không thuộc khoảng tin cậy thì ta bác bỏ giả thuyết H0, chấp nhận giả
thuyết H1:  j ≠ aj

17

3. Khoảng tin cậy


• Ví dụ: Mô hình về chi phí R&D của doanh nghiệp
Chi phí R&D Doanh thu hàng năm Phần trăm lợi nhuận trên doanh thu

log( rd )  4.38  1.084log( sales)  0.0217 profmarg
(0.47) (0.060) (0.0128)
n  32; R 2  0.918; df  32  2  1  29  t0.025 (29)  2.045
1.084  2.045  0.060 0.0217  2.045  0.0128
 (0.961; 1.21)  (0.0045; 0.0479)
Tác động của doanh thu lên chi phí R&D Tác động của lợi nhuận lên chi phí R&D
được ước lượng tương đối chính xác vì được ước lượng không chính xác vì
khoảng tin cậy hẹp. Hơn thế, tác động khoảng tin cậy rất rộng. Hơn thế, tác
này khác 0 có ý nghĩa thống kê vì 0 nằm động này không có ý nghĩa thống kê vì
ngoài khoảng tin cậy. 0 nằm trong khoảng tin cậy.

18

9
2/9/2022

4. Kiểm định giả thuyết về tổ hợp tuyến tính của các tham số
• Ví dụ: Suất sinh lợi giáo dục khi học cao đẳng (2 năm) và đại học (4 năm)
Số năm đi học khi Số năm đi học khi
học hệ 2 năm học hệ 4 năm

Kiểm định H0: 1 - 2 = 0, với giả thuyết đối H1: 1 - 2 < 0.


Một thống kê kiểm định có thể dùng là :

Không có sẵn trong kết quả hồi quy thông thường

19

4. Kiểm định giả thuyết về tổ hợp tuyến tính của các tham số
• Ví dụ: Suất sinh lợi giáo dục khi học cao đẳng (2 năm) và đại học (4 năm)
Số năm đi học khi Số năm đi học khi
học hệ 2 năm học hệ 4 năm

Kiểm định H0: 1 - 2 = 0, với giả thuyết đối H1: 1 - 2 < 0.


Cách làm khác: Ta đặt 1 = 1 - 2 và kiểm định H0: 1 = 0, với H1: 1 < 0

Biến độc lập mới (= tổng số năm đi học ở cả hai hệ)

20

10
2/9/2022

5. Kiểm định giả thuyết bội về hệ số hồi quy tổng thể


5.1. Kiểm định ràng buộc loại trừ:
Cho mô hình hồi quy (mô hình chưa gán ràng buộc):
y   0  1 x1  ...   q xq   q 1 xq 1  ...   k xk  u
Giả sử ta cần kiểm định:
H0: 1 = 2 = ... = q = 0  Mô hình đã gán ràng buộc:
H1: Tồn tại j ≠ 0 (j = 1, 2,..., q) y   0   q 1 xq 1  ...   k xk u
• Các bước kiểm định:
– Bước 1: Hồi quy mô hình chưa gán ràng buộc và tính được SSRUR.
– Bước 2: Hồi quy mô hình đã gán ràng buộc và tính được SSRR.
– Bước 3: Tính:
( SSRR  SSRUR ) / q 2
( RUR  RR2 ) / q
F  ~ F ( q, (n  ( k  1)))
SSRUR / (n  (k  1)) (1  RUR
2
) / (n  ( k  1))
– Bước 4: Có mức ý nghĩa , ta tra bảng tìm F (q, (n-(k+1))). Bác bỏ H0 khi F > F
(hoặc p-value < ).
21

5. Kiểm định giả thuyết bội về hệ số hồi quy tổng thể


5.1. Kiểm định ràng buộc loại trừ:
• Ví dụ: Tiền lương của các cầu thủ bóng chày ở giải nhà nghề
Tiền lương của các cầu thủ Số năm thi đấu Số trận tham gia thi đấu
bóng chày ở giải nhà nghề chuyên nghiệp trung bình mỗi năm

Điểm đánh bóng Số lần đánh bóng ghi điểm Số lần đánh bóng
trung bình trực tiếp trung bình mỗi năm ghi điểm mỗi năm
và giả thuyết đối H1: H0 không đúng

Kiểm định liệu các đại lượng đo lường hiệu quả thi đấu của cầu thủ không tác động
đến tiền lương/hoặc có thể bị loại bỏ khỏi phương trình hồi quy

22

11
2/9/2022

5. Kiểm định giả thuyết bội về hệ số hồi quy tổng thể


5.1. Kiểm định ràng buộc loại trừ:
• Ví dụ: Tiền lương của các cầu thủ bóng chày ở giải nhà nghề
– Ước lượng mô hình chưa gán ràng buộc:

Không có biến nào


trong số các biến này
có ý nghĩa thống kê khi
kiểm định riêng lẻ

– Ước lượng mô hình đã gán ràng buộc:

23

5. Kiểm định giả thuyết bội về hệ số hồi quy tổng thể


5.1. Kiểm định ràng buộc loại trừ:
• Ví dụ: Tiền lương của các cầu thủ bóng chày ở giải nhà nghề
– Thống kê kiểm định: Số các ràng buộc
( SSRR  SSRUR ) / q
F ~ F ( q,( n  ( k  1)))
SSRUR / ( n  ( k  1))
Một biến ngẫu nhiên có phân phối F chỉ có thể nhận giá trị dương.
Điều này tương ứng với việc tổng bình phương phần dư chỉ có
thể tăng thêm khi đi từ H1 đến H0.
Chọn giá trị tới hạn sao cho giả thuyết không (H0) sẽ
bị bác bỏ, ví dụ, trong 5% số trường hợp mặc dù nó
đúng.
Số các ràng buộc cần kiểm định

Bậc tự do của mô hình chưa gán ràng buộc


24

12
2/9/2022

5. Kiểm định giả thuyết bội về hệ số hồi quy tổng thể


5.1. Kiểm định ràng buộc loại trừ:
• Ví dụ: Tiền lương của các cầu thủ bóng chày ở giải nhà nghề
Bằng chứng bác bỏ giả thuyết không là rất
mạnh (thậm chí ở mức ý nghĩa rất nhỏ).

• Thảo luận:
– Ba biến được kiểm định là „có ý nghĩa đồng thời“.
– Chúng không có ý nghĩa khi kiểm định riêng lẻ từng biến.
– Lý do có thể là đã có đa cộng tuyến giữa chúng.

25

5. Kiểm định giả thuyết bội về hệ số hồi quy tổng thể


5.2. Kiểm định ý nghĩa toàn cục của mô hình:
Cho mô hình hồi quy: y   0  1 x1  ...   k xk  u
Xét giả thuyết: (Trường hợp đặc biệt của kiểm định ràng buộc loại trừ)
H0: 1 = 2 = ... = k = 0 Giả thuyết không phát biểu rằng các biến giải thích hoàn
H : Tồn tại  ≠ 0 (j = 1, 2,..., k) toàn không có tác dụng giải thích cho biến phụ thuộc
1 j
Khi đó, ta có giả thuyết tương đương: H0: R2 = 0
H1: R2 > 0
• Các bước kiểm định:
R2 / k
– Bước 1: Tính thống kê: F  ~ F (k , (n  (k  1)))
(1  R ) / ( n  (k  1))
2

– Bước 2: Có mức ý nghĩa , ta tra bảng tìm F(k, (n-(k+1))). Bác bỏ H0 khi F > F
(hoặc p-value < ).
• Kiểm định ý nghĩa toàn cục của mô hình hồi quy được trình bày trong hầu hết
các phần mềm hồi quy. Giả thuyết H0 thường bị bác bỏ.

26

13
2/9/2022

5. Kiểm định giả thuyết bội về hệ số hồi quy tổng thể


5.3. Kiểm định ràng buộc tuyến tính tổng quát:
Ví dụ: Kiểm định sự hợp lý của việc định giá nhà
Giá dự kiến (giá được định ra Kích thước lô đất
Giá nhà thực tế trước khi căn nhà được bán) (tính bằng feet)

Diện tích bình phương Số phòng ngủ


Hơn nữa, các yếu tố khác nhất
thiết không có tác động đến giá
Nếu căn nhà được định giá hợp lý, thì 1% thực tế một khi đã kiểm soát giá
sự thay đổi trong giá dự kiến sẽ tương ứng dự kiến.
với 1% thay đổi trong giá thực tế.

27

5. Kiểm định giả thuyết bội về hệ số hồi quy tổng thể


5.3. Kiểm định ràng buộc tuyến tính tổng quát:
Ví dụ: Kiểm định sự hợp lý của việc định giá nhà
– Mô hình chưa gán ràng buộc:

– Mô hình đã gán ràng buộc:


Mô hình đã gán ràng buộc thực chất là mô hình
hồi quy [y-x1] theo một hằng số
– Thống kê kiểm định:

 H0 không thể bị bác bỏ.

28

14
1/20/2022

LOGO

Chương 5 LOGO

PHÂN TÍCH HỒI QUY BỘI


– TÍNH TIỆM CẬN CỦA
ƯỚC LƯỢNG OLS

Wooldridge: Nhập môn Kinh tế lượng:


Cách tiếp cận hiện đại, 5e

GV: Hoàng Thị Diễm Hương

Nội dung

1. Tính vững
2. Tính tiệm cận chuẩn và vấn đề suy diễn với mẫu lớn

1
1/20/2022

1. Tính vững
 Các tính chất của OLS đúng cho mẫu/cỡ mẫu bất kỳ
 Tính không chệch dưới giả thiết MLR.1 – MLR.4.
 Công thức phương sai dưới giả thiết MLR.1 – MLR.5.
 Định lý Gauss-Markov dưới giả thiết MLR.1 – MLR.5.
 Phân phối mẫu chính xác và các kiểm định dưới giả thiết MLR.1 – MLR.6.
 Các tính chất của OLS đúng với mẫu lớn
 Tính vững dưới giả thiết MLR.1 – MLR.4.
 Tính tiệm cận chuẩn và các kiểm định dưới giả thiết MLR.1 – MLR.5.

1. Tính vững

 Tính vững:
 Một ước lượng n được gọi là vững cho một tham số  của tổng thể nếu:
P (|  n   |  )  1;   0, n  
 Ký hiệu:
p lim  n   Ước lượng hội tụ theo xác suất tới giá trị đúng của tổng thể
n

 Giải thích:
 Tính vững có ý nghĩa là xác suất để ước lượng bất kỳ gần với giá trị thực của
tổng thể có thể được thực hiện cao một cách tùy ý bằng cách gia tăng cỡ mẫu.
 Tính vững là một yêu cầu tối thiểu đối với ước lượng hợp lý.

2
1/20/2022

1. Tính vững
 Định lý 5.1: Tính vững của OLS
Dưới các giả thiết từ MLR.1 đến MLR.4 thì ước lượng OLS 𝛽 là ước lượng vững
của j, với mọi j = 0, 1,..., k.
p lim ˆ j   j
n 
Trường hợp đặc biệt của mô hình hồi quy đơn: y   0  1 x  u
Cov( x, u )
p lim ˆ1  1   1 khi Cov( x, u )  0
n  Var( x )
Ta thấy rằng ước lượng trên là vững khi biến giải thích ngoại sinh (không tương
quan với sai số).
 Giả thiết MLR.4‘: Trung bình bằng 0 và tương quan bằng 0
 E (u )  0 Tất cả các biến giải thích phải không tương quan với thành phần
 sai số. Giả thiết này yếu hơn giả thiết MLR.4, nhưng đủ để ước
Cov( x j , u )  0 lượng OLS vững.
5

1. Tính vững

 Thảo luận thêm về các giả thiết MLR.4 và MLR.4‘


 Giả thiết MLR.4 (E(u|x1, x2,…,xk) = 0) có thể được mô tả là: một hàm bất kỳ của
các biến giải thích đều không tương quan với u.
 Giả thiết MLR.4‘ (E(u) = 0 và Cov(xj,u) = 0) chỉ đòi hỏi mỗi biến xj không tương
quan với u.
 Vậy tại sao ta lại sử dụng giả thiết MLR.4 cho mô hình hồi quy bội (mà không
dùng MLR.4‘)?
• Vì ước lượng OLS bị chệch (nhưng vẫn vững) dưới giả thiết MLR.4‘ nếu
E(u|x1, x2,…,xk) phụ thuộc vào bất kỳ xj nào.
• Vì có khả năng một số hàm phi tuyến của xj có tương quan với sai số u.

3
1/20/2022

1. Tính vững

 Tính không vững (chệch tiệm cận) do biến bị bỏ sót


Mô hình đúng
Lỗi chỉ định mô hình

Chệch

Không có sự chệch tiệm cận do bỏ sót biến nếu biến bỏ sót


không tương quan với biến đang có

2. Tính tiệm cận chuẩn và vấn đề suy diễn với mẫu lớn

 Định lý 5.2: Tính tiệm cận chuẩn của OLS


Dưới các giả thiết từ MLR.1 đến MLR.5 thì:
(i)  2 
 
a
n ˆ j   j ~ N  0; 2  ; j  1, k
 a
 ij 
1 n 2
Trong đó: a  p lim   rˆij  ;
2
j j  1, k
 n i 1 
𝑟̂ là các phần dư từ hồi quy biến xj theo các biến độc lập khác.
(ii) 𝜎 là ước lượng vững của 2,
(iii) ˆ   a ˆ   a
j j
 N  0;1 ; j  1, k ; j j
 N  0;1 ; j  1, k
sd ( ˆ j ) se( ˆ j )

4
1/20/2022

2. Tính tiệm cận chuẩn và vấn đề suy diễn với mẫu lớn
 Thảo luận về tính tiệm cận chuẩn
 Trong thực hành, giả thiết về phân phối chuẩn MLR.6 thì thường có vấn đề.
 Nếu giả thiết MLR.6 không đúng, kết quả của kiểm định t hoặc F có thể sai.
 Khi không có giả thiết MLR.6, dựa vào định lý 5.2, ước lượng OLS sẽ có phân
phối tiệm cận chuẩn nếu cỡ mẫu lớn. Từ đó, các kiểm định t và F vẫn tiến hành
được khi cỡ mẫu lớn.
 Hệ quả thực hành:
 Với mẫu lớn, phân phối t tiến tới phân phối chuẩn tắc N(0;1).
 Kiểm định t và F vẫn còn hiệu lực nếu cỡ mẫu đủ lớn mà không cần giả thiết
MLR.6.
 Ước lượng khoảng tin cậy vẫn còn hiệu lực nếu cỡ mẫu đủ lớn.
 Quan trọng: Các giả thiết MLR.1 – MLR.5 vẫn cần thiết, đặc biệt là giả thiết về
phương sai thuần nhất.
9

2. Tính tiệm cận chuẩn và vấn đề suy diễn với mẫu lớn
 Các kiểm định khác với mẫu lớn: Thống kê nhân tử Lagrange
Cho mô hình hồi quy (mô hình chưa gán ràng buộc):
y   0  1 x1  ...   q xq   q 1 xq 1  ...   k xk  u
Giả sử ta cần kiểm định:
H0: 1 = 2 = ... = q = 0  Mô hình đã gán ràng buộc:
H1: Tồn tại j ≠ 0 (j = 1, 2,..., q) y   0   q 1 xq 1  ...   k xk  u
Các bước kiểm định:
– Bước 1: Hồi quy mô hình đã gán ràng buộc chỉ gồm các biến độc lập còn lại và
thu được phần dư 𝑢.
– Bước 2: Hồi quy 𝑢 theo tất cả các biến độc lập và thu được 𝑅 .
– Bước 3: Tính 𝐿𝑀 = 𝑛𝑅 .
– Bước 4: Có mức ý nghĩa , ta tra bảng tìm giá trị tới hạn 𝑐 = 𝜒 (𝑞). Bác bỏ H0
khi 𝐿𝑀 > 𝜒 𝑞 (hoặc p-value < ).
10

5
1/21/2022

LOGO

Chương 6
PHÂN TÍCH HỒI QUY BỘI –
MỘT SỐ VẤN ĐỀ MỞ RỘNG

Wooldridge: Nhập môn Kinh tế lượng:


Cách tiếp cận hiện đại, 5e

GV: Hoàng Thị Diễm Hương

Nội dung

1. Vấn đề đơn vị tính trong hồi quy OLS


2. Thảo luận thêm về dạng hàm hồi quy
3. Thảo luận thêm về hệ số xác định và vấn đề lựa chọn biến độc
lập
4. Phân tích về dự đoán và sai số dự đoán

1
1/21/2022

1. Vấn đề về đơn vị tính trong hồi quy OLS

 Ví dụ: mối liên hệ giữa cân nặng của em bé mới sinh với việc hút thuốc và thu
nhập gia đình
  ˆ  ˆ cigs  ˆ faminc
bwght 0 1 2

Cân nặng của trẻ sơ sinh, Số điếu thuốc người Thu nhập của
tính bằng ounce mẹ hút hàng ngày gia đình
 Nếu ta muốn đo lường cân nặng em bé bằng đơn vị pound thay vì ounce (1
ounce  1/16 pound) thì hàm hồi quy trở thành:
  ( ˆ / 16)  ( ˆ / 16)cigs  ( ˆ / 16) faminc
bwghtlbs 0 1 2
 Việc thay đổi đơn vị tính không ảnh hưởng đến R2, thống kê t, thống kê F.
 Hàm hồi quy sẽ thay đổi thế nào nếu ta đổi đơn vị tính của biến cigs thành „số gói
thuốc người mẹ hút hàng ngày“ (1 gói có 20 điếu)?

2. Thảo luận thêm về dạng hàm hồi quy

 Dạng hàm logarit


 Lợi ích của việc lấy log:
• Thuận tiện cho việc giải thích tỷ lệ phần trăm/hệ số co giãn.
• Hệ số góc của các biến lấy log là bất biến (không đổi) khi thay đổi đơn vị tính.
• Lấy log thường loại bỏ / giảm nhẹ vấn đề về các giá trị bất thường.
• Lấy log thường giúp bảo đảm tính chuẩn và phương sai không đổi.
 Một số lưu ý khi dùng biến dạng log:
• Các biến sử dụng đơn vị đo lường như năm thì không nên lấy log.
• Các biến sử dụng đơn vị đo lường tỷ lệ phần trăm cũng không nên lấy log.
• Log không được sử dụng nếu biến có giá trị 0 hoặc âm.
• Có khó khăn khi lấy toán tử ngược của log trong xây dựng dự đoán.

2
1/21/2022

2. Thảo luận thêm về dạng hàm hồi quy

 Mô hình có dạng đa thức bậc hai


 Ví dụ: phương trình tiền lương

 Tác động biên:


Có 0 năm kinh nghiệm thì lương tăng
là 0,298$, có 1 năm kinh nghiệm thì
tăng là 0,298 – 2.(0,0061).(1) = 0,29$
...

2. Thảo luận thêm về dạng hàm hồi quy

 Mô hình với thành phần tương tác


 Ví dụ:
Số hạng tương tác

Tác động của số phòng ngủ phụ thuộc


vào diện tích
 Giải thích ý nghĩa các tham số khi có tác động tương tác:
2 = tác động của số phòng ngủ đến giá nhà, khi diện tích bằng 0.
 Xác định lại tham số của tác động tương tác Trung bình tổng thể; có thể được
thay thế bởi trung bình mẫu

Tác động của x2 nếu tất cả các biến cố định tại giá trị trung bình
6

3
1/21/2022

2. Thảo luận thêm về dạng hàm hồi quy

 Mô hình với thành phần tương tác


 Lợi ích của việc xác định lại các tham số:
• Dễ dàng giải thích các tham số.
• Sai số chuẩn cho các tác động riêng phần tại giá trị trung bình có sẵn.
• Nếu cần thiết, tương tác có thể được tập trung tại các giá trị quan tâm khác.

3. Thảo luận thêm về hệ số xác định và vấn đề lựa chọn biến


độc lập
 Nhận xét chung về R2:
 Một R2 cao không ngụ ý rằng có một quan hệ nhân quả.
 Một R2 thấp không ngăn cản ước lượng chính xác các tác động riêng phần.
 Sử dụng 𝑹𝟐 để lựa chọn giữa các mô hình không lồng nhau:
 Các mô hình được gọi là không lồng nhau nếu cái này không phải là trường hợp
đặc biệt của cái kia.

 Việc so sánh R2 của hai mô hình sẽ là không công bằng với mô hình đầu tiên bởi
vì mô hình đầu tiên chứa ít tham số hơn.
 Trong ví dụ trên, ngay cả sau khi xét 𝑅 , mô hình bậc hai vẫn được ưa thích hơn.
 Quan trọng: R2 hoặc 𝑅 không được sử dụng để so sánh các mô hình mà chúng
có dạng hàm của biến phụ thuộc khác nhau.

4
1/21/2022

3. Thảo luận thêm về hệ số xác định và vấn đề lựa chọn biến


độc lập
 Kiểm soát việc có quá nhiều yếu tố trong phân tích hồi quy:
 Trong một số trường hợp, các biến xác định không nên được giữ cố định.
• Trong hồi quy số lượng tử vong do giao thông theo thuế bia của bang (và các
yếu tố khác) không nên kiểm soát trực tiếp việc tiêu thụ bia.
• Trong hồi quy chi phí y tế gia đình theo việc sử dụng thuốc trừ sâu của nông
dân không nên kiểm soát việc đi khám bác sĩ.
 Các hồi quy khác nhau có thể phục vụ các mục đích khác nhau.
• Trong hồi quy giá nhà theo các đặc điểm của ngôi nhà, thì chỉ nên bao gồm
việc định giá giá nhà nếu mục đích của hồi quy là nghiên cứu giá trị của chúng;
nếu không thì ta sẽ không bao gồm chúng.
 Thêm biến độc lập để giảm phương sai của nhiễu:
 Các biến không tương quan với biến độc lập đã có nên được thêm vào bởi vì
chúng làm giảm phương sai nhiễu mà không làm tăng tính đa cộng tuyến.
 Tuy nhiên, các biến không có tương quan như vậy rất khó tìm.
9

4. Phân tích về dự đoán và sai số dự đoán


 Dự đoán giá trị trung bình:
 Xét mô hình hồi quy:
y   0  1 x1  ...   k xk  u
 Giả sử ta cần dự đoán giá trị trung bình của y khi x1=c1,..., xk=ck như sau:
0  E ( y | x1  c1 ,..., xk  ck )   0  1c1  ...   k ck
 Ước lượng điểm của 0 là:
ˆ0  ˆ0  ˆ1c1  ...  ˆk ck
 Khoảng tin cậy của 0 là:

 0  ˆ0  t( n/2( k 1)) .se(ˆ0 ); ˆ0  t( n/2( k 1)) .se(ˆ0 ) 

10

5
1/21/2022

4. Phân tích về dự đoán và sai số dự đoán


 Dự đoán giá trị trung bình:
 Ví dụ:
Điểm GPA đại học Điểm bài thi Vị trí tính theo bách phân vị Quy mô lớp
của sinh viên SAT kết hợp của kết quả tốt nghiệp PTTH tốt nghiệp
colgpa  1, 493  0,00149 sat  0, 01386 hsperc  0,06088hsize  0, 00546hsize 2
(0, 075) (0, 00007) (0,00056) (0, 01650) (0, 00227)
n  4.137; R 2  0, 278; R 2  0, 277; ˆ  0,560
 Khoảng tin cậy 95% cho giá trị dự đoán cho trung bình điểm GPA đại học sẽ thế nào,
nếu sat = 1200, hsperc = 30 và hsize = 5 (tức là 500hs)?
 Ta tạo ra các biến độc lập mới: sat0 = sat-1200; hsperc0 = hsperc-30; hsize0 = hsize-5;
hsizesq0 = hsize2-25; và hồi quy colgpa theo các biến độc lập mới:
colgpa  2, 700  0, 00149 sat 0  0, 01386 hsperc 0  0, 06088hsize 0  0, 00546 hsizesq 0
(0, 020) (0, 00007) (0, 00056) (0, 01650) (0, 00227)
n  4.137; R 2  0, 278; R 2  0, 277; ˆ  0,560   0   2,7  1,96.(0,02); 2,7  1,96.(0,02) 
11

4. Phân tích về dự đoán và sai số dự đoán


 Dự đoán giá trị cá biệt:
 Xét mô hình hồi quy: y   0  1 x1  ...   k xk  u
 Giả sử ta cần dự đoán giá trị cụ thể của y (ký hiệu là y0) khi x1 = c1,..., xk = ck như
sau:
y0   0  1c1  ...   k ck  u0
 Dự đoán tốt nhất (ước lượng điểm) cho y0 là: yˆ 0  ˆ0  ˆ1c1  ...  ˆk ck
 Sai số dự đoán là: eˆ0  y0  yˆ 0  (  0  1c1  ...   k ck )  u0  yˆ 0
 Ta có: E (eˆ0 )  0; Var (eˆ0 )  Var ( yˆ 0 )  Var (u0 )  Var ( yˆ 0 )  
2

 se(eˆ )  Var ( yˆ )  ˆ 2  [ se( yˆ )]2  ˆ 2


0 0 0

 Khoảng tin cậy của y0 là: y0   yˆ 0  t( n/2( k 1)) .se(eˆ0 ); yˆ 0  t( n/2( k 1)) .se(eˆ0 ) 

12

6
1/21/2022

4. Phân tích về dự đoán và sai số dự đoán


 Dự đoán giá trị cá biệt:
 Ví dụ:
Điểm GPA đại học Điểm bài thi Vị trí tính theo bách phân vị Quy mô lớp
của sinh viên SAT kết hợp của kết quả tốt nghiệp PTTH tốt nghiệp
colgpa  1, 493  0,00149 sat  0, 01386 hsperc  0,06088hsize  0, 00546hsize 2
(0, 075) (0, 00007) (0,00056) (0, 01650) (0, 00227)
n  4.137; R  0, 278; R  0, 277; ˆ  0,560
2 2

 Khoảng tin cậy 95% cho giá trị dự đoán điểm GPA đại học của một học sinh cụ
thể sẽ thế nào, nếu sat = 1200, hsperc = 30 và hsize = 5 (tức là 500hs)?
 Ta tính toán tương tự như trong ví dụ trước và thu được: se( yˆ 0 )  0,020; ˆ  0,560
 se(eˆ0 )  [ se( yˆ 0 )]2  ˆ 2  0,0202  0,5602  0,560
 y0   2, 7  1,96.(0,56); 2,7  1,96.(0,56)   (1,602; 3,798)

13

4. Phân tích về dự đoán và sai số dự đoán

 Dự đoán y khi biến phụ thuộc là log(y)


log( y )   0  1x1  ...   k xk  u
 y  e 0  1x1 ...  k xk u  e  0  1x1 ...  k xk  eu
Vì u độc lập với x1, x2,..., xk nên:
 0  1x1 ...  k xk
 E ( y | x )  E (e  eu )  e 0  1x1 ...  k xk E (eu )
ˆ ˆ ˆ  1 n uˆi 
 yˆ  e 0  1x1 ...  k xk  e 
Dự đoán của y  n i 1 

14

7
1/25/2022

Chương 7
HỒI QUY BỘI VỚI BIẾN ĐỊNH TÍNH:
SỬ DỤNG BIẾN GIẢ TRONG HỒI QUY

Wooldridge: Nhập môn Kinh tế lượng:


Cách tiếp cận hiện đại, 5e

GV: Hoàng Thị Diễm Hương

L/O/G/O

Nội dung

1. Biến định tính và trường hợp mô hình có một biến giả


2. Sử dụng biến giả trong trường hợp biến định tính có
nhiều lựa chọn
3. Tương tác với biến giả
4. Biến phụ thuộc nhị phân: mô hình xác suất tuyến tính
5. Bàn thêm về phân tích chính sách và đánh giá chương
trình

1
1/25/2022

1. Biến định tính và trường hợp mô hình có một biến giả


 Biến định tính:
 Ví dụ: giới tính, chủng tộc, ngành nghề, khu vực, đánh giá cấp độ,....
 Một cách để kết hợp các yếu tố định tính trong mô hình hồi quy đó là sử dụng
biến giả.
 Biến giả có thể xuất hiện như là biến phụ thuộc hay biến độc lập.
 Trường hợp mô hình có một biến giả độc lập :
 Xét trường hợp đơn giản: mô hình hồi quy chỉ có 1 biến giải thích định tính với
hai lựa chọn.
 Khi đó ta chỉ cần thêm 1 biến giả vào mô hình:
wage   0   0 female  1educ  u Hệ số chặn của nhóm nữ

Mức chênh lệch tiền lương Biến giả: wage   0   0  1educ  u


theo giờ giữa nữ và nam = 1 nếu là nữ
(các yếu tố khác không đổi) = 0 nếu là nam wage   0  1educ  u
3

1. Biến định tính và trường hợp mô hình có một biến giả


 Bẫy biến giả: Mô hình này không thể ước lượng được vì có đa cộng tuyến
hoàn hảo (male + female = 1)
wage   0   0 male   0 female  1educ  u
 Khi sử dụng biến giả, một thuộc tính luôn luôn phải được loại bỏ. Nhóm thuộc
tính tương ứng với biến giả = 0 được gọi là nhóm cơ sở hay nhóm tham chiếu.
wage   0   0 female  1educ  u Nhóm cơ sở là nhóm nam
 Nếu muốn thêm các biến giả cho từng nhóm vào mô hình thì có thể loại bỏ hệ số
chặn để tránh đa cộng tuyến.
wage   0 male   0 female  1educ  u
 Nhược điểm của việc loại bỏ hệ số chặn:
• Việc kiểm định sự khác biệt về hệ số chặn giữa hai nhóm khó khăn hơn.
• Công thức R2 chỉ có ý nghĩa nếu hồi quy có tung độ gốc.

2
1/25/2022

1. Biến định tính và trường hợp mô hình có một biến giả


 Ví dụ: hồi quy phương trình tiền lương
  1,57  1,81 female  0,572educ  0,025exper  0,141tenure
wage
(0,72) (0, 26) (0, 049) (0,012) (0,021)
Cố định các biến học vấn, kinh nghiệm, và thâm niên
n  526; R 2  0,364 làm việc, nữ kiếm được ít hơn nam là 1,81 $/giờ
 Khác biệt về tiền lương giữa hai nhóm là có ý nghĩa thống kê.
 Điều đó có nghĩa rằng phụ nữ bị phân biệt đối xử?
• Không nhất thiết. Bởi vì phụ nữ có thể có mối tương quan với các đặc tính
phong phú khác mà chưa được kiểm soát.

1. Biến định tính và trường hợp mô hình có một biến giả


 Sử dụng biến giả trong phương trình log(y)
 Ví dụ:
 price)  1,35  0,168log(lotsize)  0,707 log( sqrft )  0,027bdrms  0,054colonial
log(
(0,65) (0, 038) (0,093) (0,029) (0,045)
n  88; R 2  0,649 Biến giả biểu thị cho ngôi nhà
mang phong cách thời thuộc địa
 price) % price
 log(  Giá bán của những ngôi nhà có phong cách
   5, 4% thuộc địa cao hơn giá bán của những ngôi
colonial colonial nhà khác là 5,4%

3
1/25/2022

2. Sử dụng biến giả trong trường hợp biến định tính có


nhiều lựa chọn
 Sử dụng biến giả cho nhiều lựa chọn:
 Chọn 1 lựa chọn (1 nhóm) để làm nhóm cơ sở.
 Mỗi lựa chọn còn lại tương ứng với 1 biến giả.
 Kết quả hồi quy sẽ cho biết sự khác biệt giữa mỗi nhóm còn lại với nhóm cơ sở.
 Ví dụ:
 wage)  0,321  0, 213marrmale  0,198marrfem  0,110 singfem  0, 079educ
log(
(0,100) (0, 055) (0,058) (0,056) (0,007)
 0, 027exper  0,00054exper 2  0, 029tenure  0,00053tenure 2
(0, 005) (0, 00011) (0, 007) (0,00023)
n  526; R 2  0, 461 Giữ những yếu tố khác cố định, nữ có chồng kiếm được
ít hơn nam độc thân (= nhóm cơ sở) là 19,8%

2. Sử dụng biến giả trong trường hợp biến định tính có


nhiều lựa chọn
 Kết hợp thông tin thứ bậc bằng cách sử dụng biến giả
 Ví dụ: Xếp hạng tín dụng của thành phố và lãi suất trái phiếu đô thị
Xếp hạng tín dụng từ 0-4
Lãi suất trái phiếu đô thị
(0=tệ, 4=rất tốt)

Mô tả này có lẽ không phù hợp vì xếp hạng tín dụng chỉ chứa thông tin thứ bậc.
Một cách tốt hơn để kết hợp thông tin này là định nghĩa các biến giả:

Các biến giả biểu thị xếp hạng cụ thể áp dụng, ví dụ CR1 = 1 nếu
CR = 1 và CR1 = 0 nếu ngược lại. Tất cả các tác động được đo
lường so với xếp hạng tệ nhất (= nhóm cơ sở).

4
1/25/2022

3. Tương tác với biến giả


 Tương tác giữa các biến giả: Số hạng tương tác
 Ví dụ:
log( wage)   0   0 female  1married   2 female.married  1educ  u
Khi female = 0 và married = 0 (tương ứng nhóm nam độc thân):
log( wage)   0  1educ  u
Khi female = 1 và married = 0 (tương ứng nhóm nữ độc thân):
log( wage)   0   0  1educ  u
Khi female = 0 và married = 1 (tương ứng nhóm nam có gia đình):
log( wage)   0  1  1educ  u
Khi female = 1 và married = 1 (tương ứng nhóm nữ có gia đình):
log( wage)   0   0  1   2  1educ  u
 Khó kiểm định sự chênh lệch tiền lương giữa một nhóm bất kỳ với nhóm cơ sở
(chẳng hạn chênh lệch giữa nhóm nữ có gia đình với nhóm nam độc thân).
9

3. Tương tác với biến giả


 Tương tác giữa biến giả với biến định lượng: Số hạng tương tác
 Ví dụ:
log( wage)   0   0 female  1educ  1 female.educ  u
Khi female = 0 (tương ứng nhóm nam):
log( wage)   0  1educ  u
Khi female = 1 (tương ứng nhóm nữ):
log( wage)   0   0  1educ  1educ  u  (  0   0 )  ( 1  1 )educ  u
Khác biệt cả hệ số chặn lẫn hệ số góc

 Các giả thuyết quan tâm:


• Tác động của học vấn đến tiền lương là như nhau cho nam và nữ: H0: 1 = 0
• Lương hoàn toàn như nhau cho nam và nữ: H0: 0 = 1 = 0

10

5
1/25/2022

3. Tương tác với biến giả


 Kiểm định sự khác nhau trong hàm hồi quy giữa các nhóm:
 Mô hình chưa gán ràng buộc (chứa toàn bộ các tương tác):
Xếp hạng của SV tại trường Tổng số
Điểm GPA đại học Điểm thi SAT
trung học theo bách phân vị giờ học
cumgpa   0   0 female  1sat  1 female.sat   2 hsperc
  2 female.hsperc  3tothrs   3 female.tothrs  u
 Mô hình đã gán ràng buộc (hồi quy giống nhau cho cả hai nhóm):
cumgpa   0  1sat   2 hsperc   3tothrs  u
 Kiểm định giả thuyết: H0: 0 = 1 = 2 = 3 = 0
H1: Tồn tại j ≠ 0
( SSRUR  SSRR ) / q
 Dùng kiểm định F cho ràng buộc loại trừ: F 
SSRUR / ( n  (k  1))

11

3. Tương tác với biến giả


 Kiểm định sự khác nhau trong hàm hồi quy giữa các nhóm:
 Cách khác để tính thống kê F:
• Chạy hồi quy riêng biệt cho nam và nữ; SSRUR bằng tổng SSR của hai hồi
quy này (tức là SSRUR = SSR1 + SSR2).
• Chạy hồi quy cho mô hình đã gán ràng buộc và được SSR (ký hiệu là SSRP).
• Nếu kiểm định tính theo cách này thì được gọi là kiểm định Chow.
( SSRP  ( SSR1  SSR2 )) / (k  1)
F Thống kê Chow
( SSR1  SSR2 ) / (n  2( k  1))
• Quan trọng: Kiểm định này cần giả thiết phương sai của nhiễu giữa các nhóm
là hằng số.

12

6
1/25/2022

4. Biến phụ thuộc nhị phân: Mô hình xác suất tuyến tính
 Hồi quy tuyến tính khi biến phụ thuộc nhị phân:
 Xét mô hình hồi quy tuyến tính bội với y là biến nhị phân:
y   0  1 x1  ...   k xk  u
 E ( y | x )   0  1 x1  ...   k xk
 Vì y là biến nhị phân nên:
E ( y | x)  1.P ( y  1| x )  0.P ( y  0 | x)  P ( y  1| x )
 Do đó:
P ( y  1| x)   0  1 x1  ...   k xk
 Mô hình này được gọi là mô hình xác suất tuyến tính (LPM).
 Trong mô hình xác suất tuyến tính, các hệ số j mô tả tác động của các biến
độc lập lên xác suất xảy ra y = 1.

13

4. Biến phụ thuộc nhị phân: Mô hình xác suất tuyến tính
 Hồi quy tuyến tính khi biến phụ thuộc nhị phân:
 Ví dụ: Việc tham gia lực lượng lao động của phụ nữ đã lập gia đình
Sự tham gia lực lượng lao động trong Thu nhập của gia đình (không bao gồm thu
năm 1975 của phụ nữ đã kết hôn nhập của người vợ) (tính bằng ngàn USD/năm)
  0,586  0, 0034nwifeinc  0,038educ  0, 039exper  0, 00060exper 2
inlf
(0,154) (0, 0014) (0,007) (0,006) (0,00018)
 0, 016age  0, 262kidslt 6  0,013kidsge6
(0,002) (0,034) (0,013) Số con dưới Số con từ 6
6 tuổi đến 18 tuổi
n  753; R 2  0, 264.
Nếu số trẻ em dưới 6 tuổi tăng thêm 1 thì xác suất
người phụ nữ có làm việc giảm 26,2%

14

7
1/25/2022

4. Biến phụ thuộc nhị phân: Mô hình xác suất tuyến tính
 Nhược điểm của mô hình xác suất tuyến tính:
 Xác suất dự đoán có thể lớn hơn 1 hoặc nhỏ hơn 0.
 Tác động xác suất cận biên đôi khi không thể có tính logic.
 Mô hình xác suất tuyến tính thì nhất thiết có phương sai thay đổi.
Var ( y | x)  P ( y  1| x).(1  P ( y  1| x))
 Sai số chuẩn khi có phương sai thay đổi cần được sửa lại cho đúng.
 Ưu điểm của mô hình xác suất tuyến tính:
 Dễ dàng ước lượng và giải thích.
 Tác động của các biến thường được ước lượng và dự đoán khá tốt trong thực tế.

15

5. Bàn thêm về phân tích chính sách và đánh giá chương


trình
 Một trường hợp đặc biệt của phân tích chính sách là đánh giá chương trình,
trong đó ta muốn biết tác động của các chương trình kinh tế hoặc xã hội đến
các cá nhân, doanh nghiệp, hộ gia đình, thành phố,....
 Trong trường hợp đơn giản nhất, có 2 nhóm đối tượng:
 Nhóm kiểm soát là nhóm không tham gia vào chương trình.
 Nhóm thí nghiệm (hay nhóm xử lý) có tham gia vào chương trình.
 Ví dụ: Tác động của các khoản tài trợ đào tạo nghề đến năng suất của người
lao động:
Tỷ lệ sản phẩm lỗi (%) =1 nếu công ty có nhận tài trợ đào tạo, =0 nếu ngược lại
 scrap )  4.99  0.052 grant  0.455log( sales )  0.639log(employ )
log(
(4.66) (0.431) (0.373) (0.365)
n  50; R 2  0.072. Không có tác động rõ ràng của tài trợ lên năng suất

16

8
1/25/2022

5. Bàn thêm về phân tích chính sách và đánh giá chương


trình
 Ví dụ: Tác động của các khoản tài trợ đào tạo nghề đến năng suất của người lao
động:
Tỷ lệ sản phẩm lỗi (%) =1 nếu công ty có nhận tài trợ đào tạo, =0 nếu ngược lại
 scrap )  4,99  0,052 grant  0, 455log( sales)  0,639log(employ )
log(
(4,66) (0, 431) (0,373) (0,365)
n  50; R 2  0,072. Không có tác động rõ ràng của tài trợ lên năng suất
 Nhóm xử lý: nhóm được nhận tài trợ. Nhóm kiểm soát: nhóm không nhận được tài trợ.
 Tài trợ được đưa ra trên cơ sở: đến trước thì được nhận trước. Điều này không giống
với việc phân bổ tiền tài trợ một cách ngẫu nhiên. Có thể các doanh nghiệp với người lao
động có năng suất thấp đã nhận ra cơ hội cải tiến năng suất và họ nộp hồ sơ trước.
 Chúng ta cần thận trọng khi đánh giá chương trình vì trong hầu hết các trường hợp của
khoa học xã hội thì nhóm kiểm soát và nhóm xử lý không được chọn một cách ngẫu
nhiên.

17

5. Bàn thêm về phân tích chính sách và đánh giá chương


trình
 Ví dụ về một biến giả độc lập nội sinh:
 Ngay cả trong trường hợp phân tích chính sách không liên quan đến việc lựa
chọn các cá thể vào trong nhóm kiểm soát và nhóm xử lý, ta vẫn cần thận trọng
khi đưa các yếu tố có thể có tương quan một cách hệ thống với biến giả độc lập
nào đó đang được quan tâm.
 Có phải người da màu bị phân biệt đối xử khi xét duyệt các khoản vay không?
Biến giả biểu thị vốn vay Biến giả Xếp hạng
có được phê duyệt không chủng tộc tín dụng

 Điều quan trọng là kiểm soát các đặc điểm khác có thể quan trọng đối với việc
tiếp cận vốn vay (ví dụ: nghề nghiệp, thất nghiệp,...).
 Việc bỏ qua các đặc điểm quan trọng khác có tương quan với biến giả chủng tộc
sẽ tạo ra chứng cứ giả cho sự phân biệt đối xử.

18

9
1/25/2022

5. Bàn thêm về phân tích chính sách và đánh giá chương


trình
 Vấn đề tự lựa chọn (self-selection):
 Một vấn đề có thể nảy sinh khi phân tích chính sách và đánh giá chương trình đó
là các cá nhân (hoặc các doanh nghiệp, các thành phố) tự lựa chọn có tham gia
vào các hoạt động hay chương trình nào đó hay không.
 Thuật ngữ tự lựa chọn (self-selection): các cá nhân tự lựa chọn có tham gia một
hoạt động hoặc một chương trình nào đó hay không, tùy theo các đặc điểm cá
nhân và mong đợi của họ. Sự tham gia này không được xác định ngẫu nhiên.
 Thuật ngữ này được dùng khi biến nhị phân biểu thị sự tham gia có thể có tương
quan một cách hệ thống với các yếu tố không quan sát được.

Biến giả biểu thị sự tham gia nếu có tương quan với các yếu tố khác trong u thì
sẽ làm cho 1 bị ước lượng chệch (đây là trường hợp biến giải thích bị nội sinh).

19

10
1/26/2022

Chương 8
PHƯƠNG SAI THAY ĐỔI
Wooldridge: Nhập môn Kinh tế lượng:
Cách tiếp cận hiện đại, 5e
GV: Hoàng Thị Diễm Hương

L/O/G/O
www.themegallery.com

Nội dung

1. Hậu quả của phương sai thay đổi đối với OLS
2. Kiểm định phương sai thay đổi
3. Xử lý khi có phương sai thay đổi
4. Xem lại mô hình xác suất tuyến tính

1
1/26/2022

1. Hậu quả của phương sai thay đổi đối với OLS
 Khi giả thiết MLR.5 không thỏa mãn thì sẽ dẫn đến hiện tượng phương sai
thay đổi
 Xét mô hình hồi quy: yi   0  1 xi1  ...   k xik  ui
 Nếu 𝑉𝑎𝑟(𝑢 |𝑥 ,..., 𝑥 ) = 𝜎 = 𝑐𝑜𝑛𝑠𝑡 thì ta gọi đây là phương sai thuần nhất.
 Nếu 𝑉𝑎𝑟(𝑢 |𝑥 ,..., 𝑥 ) = 𝜎 thì ta gọi đây là phương sai thay đổi.
 Hậu quả của phương sai thay đổi
 Ước lượng OLS không còn là ước lượng hiệu quả (do vậy không còn là BLUE
nữa), có thể có những ước lượng tuyến tính khác hiệu quả hơn. Tuy nhiên, OLS
vẫn không chệch và vững.
 Các công thức tính 𝑉𝑎𝑟(𝛽 ) không còn đúng nữa.
 Các suy diễn thống kê (khoảng tin cậy, kiểm định t, kiểm định F và kiểm định
Nhân tử Lagrange) không còn hiệu lực.
 Tuy nhiên, lý giải về R2 không thay đổi.

2. Kiểm định phương sai thay đổi


 Kiểm định Breusch-Pagan:
 Xét mô hình hồi quy: yi   0  1 xi1  ...   k xik  ui
 Ta cần kiểm định giả thuyết: H0: 𝑉𝑎𝑟(𝑢 |𝑥 ,..., 𝑥 ) = 𝜎 = 𝑐𝑜𝑛𝑠𝑡
 Ý tưởng kiểm định:
• 𝑉𝑎𝑟 𝑢 𝑥 , … , 𝑥 = 𝐸 𝑢 𝑥 ,…,𝑥 − 𝐸 𝑢 𝑥 ,…,𝑥 = 𝐸 𝑢 𝑥 ,…,𝑥
• Nếu H0 đúng thì 𝐸 𝑢 𝑥 , … , 𝑥 = 𝜎 , nghĩa là trung bình của 𝑢 không phụ
thuộc vào các biến x1,..., xk.
 Từ đó, để kiểm định, ta thực hiện hồi quy sau: uˆi   0  1 xi1  ...   k xik  vi
2

 Kiểm định giả thuyết: H0: 1 = ... = k = 0


(Đây là kiểm định ý nghĩa toàn cục  Dùng kiểm định F hoặc kiểm định LM).

2
1/26/2022

2. Kiểm định phương sai thay đổi


 Kiểm định Breusch-Pagan:
 Ví dụ: phương trình định giá nhà

Có phương
sai thay đổi

Trong dạng logarit, giả thuyết phương sai không đổi không thể bị bác bỏ

2. Kiểm định phương sai thay đổi


 Kiểm định White:
 Kiểm định White mở rộng phương trình hồi quy của kiểm định Breusch-Pagan
bằng cách sử dụng bình phương của các biến giải thích và tương tác của các
biến giải thích.
 Ví dụ: Xét mô hình hồi quy: yi   0  1 xi1   2 xi 2   3 xi 3  ui
 Ta cần kiểm định giả thuyết: H0: 𝑉𝑎𝑟(𝑢 |𝑥 , 𝑥 , 𝑥 ) = 𝜎 = 𝑐𝑜𝑛𝑠𝑡
 Hồi quy: uˆi2   0  1 xi1   2 xi 2   3 xi 3   4 xi21   5 xi22   6 xi23
  7 xi1 xi 2   8 xi1 xi 3   9 xi 2 xi 3  vi
 Kiểm định giả thuyết: H0: 1 = ... = 9 = 0
(Đây là kiểm định ý nghĩa toàn cục  Dùng kiểm định F hoặc kiểm định LM).

3
1/26/2022

2. Kiểm định phương sai thay đổi


 Kiểm định White:
 Bất lợi của kiểm định White:
Việc bao gồm tất cả các bình phương và các tương tác dẫn đến một số lượng
lớn các tham số cần được ước lượng (ví dụ: k=6 dẫn đến 27 tham số cần được
ước lượng).
 Dạng thay thế của kiểm định White:
uˆi2   0  1 yˆi   2 yˆi2  vi
Hồi quy này gián tiếp kiểm định sự phụ thuộc của các 𝑢 theo các biến giải thích,
các bình phương và các tương tác; bởi vì 𝑦 và 𝑦 ngầm chứa tất cả các số hạng
này.
Kiểm định giả thuyết: H0: 1 = 2 = 0
 Ví dụ: Phương sai thay đổi trong phương trình (log) giá nhà

3. Xử lý khi có phương sai thay đổi


 Sử dụng suy diễn cải thiện sau khi ước lượng OLS:
2
 Khi không có phương sai thay đổi: Var( ˆ j )  ; j  1, k
SST j (1  R 2j )
 Công thức cho sai số chuẩn OLS và các thống kê liên quan được phát triển
nhằm cải thiện phương sai thay đổi khi không biết dạng.
 Tất cả các công thức chỉ có hiệu lực khi mẫu lớn.
 Công thức cải thiện cho sai số chuẩn OLS khi có phương sai thay đổi:
n


 rˆ uˆ 2 2
ij i
Var ( ˆ j )  i 1
; j  1, k
SSR 2j
 Khi sử dụng các công thức này thì kiểm định t là tiệm cận hợp lý.
 Kiểm định F cũng không còn đúng nữa khi có phương sai thay đổi, nhưng phiên
bản cải thiện của kiểm định này có sẵn trong hầu hết các phần mềm.
8

4
1/26/2022

3. Xử lý khi có phương sai thay đổi


 Sử dụng suy diễn cải thiện sau khi ước lượng OLS:
 Ví dụ: Phương trình tiền lương theo giờ

Các sai số chuẩn cải thiện phương sai thay đổi có thể lớn hơn hoặc nhỏ hơn các
sai số chuẩn thông thường. Trong thực hành, khác biệt giữa chúng thường là nhỏ.

Thống kê F thường không khác biệt mấy.


Nếu có phương sai thay đổi mạnh thì khác biệt có thể trở
nên lớn hơn. Do vậy, để an toàn thì lời khuyên là luôn luôn
tính các sai số chuẩn cải thiện.

3. Xử lý khi có phương sai thay đổi


 Ước lượng bình phương nhỏ nhất có trọng số:
 Phương sai thay đổi theo dạng nhân với một hằng số:
Var (ui | xi )   2 h( xi )   2 hi
Trong đó 2 là một hằng số, h(x) là một hàm nào đó (đã biết) theo các biến
giải thích, h(x) > 0 do phương sai phải dương.
• Xét mô hình hồi quy: yi   0  1 xi1  ...   k xik  ui
y  1   x   x   u 
 i  0    1  i1   ...   k  ik    i 
hi  h   h   h   h 
 i  i  i  i
 y*   0 xi*0  1 xi*1  ...   k xik*  ui* Mô hình biến đổi không có hệ số chặn
• Mô hình biến đổi không còn phương sai thay đổi nữa.
ui Var (ui | xi )  2 hi
Var (u | xi )  Var (
*
i | xi )   2
hi hi hi
10

5
1/26/2022

3. Xử lý khi có phương sai thay đổi


 Ước lượng bình phương nhỏ nhất có trọng số:
 Phương sai thay đổi theo dạng nhân với một hằng số:
• OLS trong mô hình biến đổi được gọi là bình phương nhỏ nhất có trọng số
(WLS). 2
n n  y  1   x   x 
min   uˆ 
* 2
 min   i   0    1  i1   ...   k  ik  
i
 hi  h   h   h 
i 1 i 1
  i  i  i 
n
( yi   0  1 xi1  ...   k xik ) 2 Các quan sát với phương
 min  sai lớn hơn sẽ nhận một
i 1 hi trọng số nhỏ hơn.
 Tại sao WLS lại hiệu quả hơn OLS ban đầu?
• Vì các quan sát có phương sai lớn thì ít thông tin hơn so với các quan sát có
phương sai nhỏ và do đó ít quan trọng hơn.
 WLS là một trường hợp đặc biệt của bình phương nhỏ nhất tổng quát (GLS).

11

3. Xử lý khi có phương sai thay đổi


 Ước lượng bình phương nhỏ nhất có trọng số:
 Một trường hợp đặc biệt quan trọng của phương sai thay đổi:
• Nếu các quan sát được ghi nhận là trung bình theo thành phố/quận/tiểu bang/
quốc gia/công ty thì chúng nên được lấy trọng số theo quy mô của đơn vị.
Mức đóng góp trung bình vào kế Thu nhập trung bình Phần trăm công ty dùng Sai số u có
hoạch lương hưu của công ty i và tuổi ở công ty i đóng góp vào kế hoạch phương sai
thay đổi

Phương sai của sai số nếu


các sai số ở cấp độ nhân viên
có phương sai không đổi
Nếu các sai số có phương sai không đổi ở cấp độ nhân viên thì ta nên dùng WLS với trọng số
bằng quy mô mi của công ty. Nếu giả định về phương sai không đổi ở cấp nhân viên không
chính xác thì ta có thể tính toán các sai số chuẩn cải thiện sau WLS (tức là, cho mô hình biến
đổi).

12

6
1/26/2022

3. Xử lý khi có phương sai thay đổi


 Ước lượng bình phương nhỏ nhất có trọng số:
 Hàm phương sai thay đổi cần phải được ước lượng: GLS khả thi
• Trong hầu hết các trường hợp, dạng chính xác của phương sai thay đổi
thường không rõ ràng. Do đó ta cần ước lượng hàm h. Việc dùng ℎ𝑖 trong
biến đổi GLS cho ta được ước lượng FGLS (GLS khả thi).
 Quy trình FGLS xử lý phương sai thay đổi:
• Bước 1: Thực hiện hồi quy yi theo xi1,…, xik và thu được phần dư 𝑢𝑖 .
  x ... k xik
• Bước 2: Chọn dạng hi: Giả sử hi có dạng: hi  e 0 1 i 1
 ui2   2 .e 0 1xi1 ... k xik .vi Hàm mũ được sử dụng
 log(u )     x  ...   x  e
2
i 0 1 i1 k ik i
để đảm bảo hi dương
Khi đó, ta hồi quy log(𝑢𝑖2 )
theo xi1,…, xik và thu được giá trị ước lượng 𝑔𝑖 .
1 1
• Bước 3: Tính các trọng số: ˆ  exp( gˆ )
hi i
• Bước 4: Thực hiện ước lượng lại phương trình ban đầu bằng WLS với các
trọng số vừa tạo.
13

3. Xử lý khi có phương sai thay đổi


 Ước lượng hàm phương sai thay đổi: FGLS
 Ước lượng FGLS là vững và tiệm cận hiệu quả hơn OLS.  Với cỡ mẫu lớn,
FGLS một lựa chọn hấp dẫn thay cho OLS khi có phương sai thay đổi.
 Điều gì xảy ra nếu giả định sai hàm phương sai thay đổi?
• Nếu hàm phương sai thay đổi bị xác định sai, WLS vẫn vững với các giả thiết
MLR.1 – MLR.4, nhưng các sai số chuẩn WLS và các kiểm định thống kê sẽ
không còn hiệu lực nữa, ngay cả với mẫu lớn.  Cần tính toán các sai số
chuẩn cải thiện.
• Nếu OLS và WLS cho kết quả ước lượng rất khác biệt thì điều này thường
hàm ý rằng một số giả thiết khác (ví dụ MLR.4) là sai.
• Nếu hàm phương sai thay đổi bị xác định sai, WLS sẽ không đảm bảo hiệu
quả hơn OLS. Tuy nhiên, nếu có phương sai thay đổi mạnh thì vẫn nên dùng
dạng sai của phương sai thay đổi và áp dụng WLS hơn là bỏ qua nó và dùng
OLS.

14

7
1/26/2022

4. Xem lại mô hình xác suất tuyến tính


 WLS trong mô hình xác suất tuyến tính:
 Xét mô hình hồi quy: P ( y  1| x )   0  1 x1  ...   k xk
 Ta có: Var ( y | x)  P ( y  1| x).(1  P ( y  1| x ))
 Suy ra: hˆi  yˆ i (1  yˆ i )
 Thảo luận:
 WLS không tiến hành được nếu 𝑦 < 0 hoặc 𝑦 > 1 vì ℎ sẽ bị âm.
 Cách đơn giản nhất để giải quyết phương sai thay đổi trong mô hình xác suất
tuyến tính là tiếp tục sử dụng OLS, nhưng tính toán sai số chuẩn cải thiện trong
các kiểm định thống kê.

15

8
2/9/2022

Chương 9
MỘT SỐ VẤN ĐỀ MỞ RỘNG VỀ DẠNG HÀM
VÀ DỮ LIỆU
Wooldridge: Nhập môn Kinh tế lượng:
Cách tiếp cận hiện đại, 5e
GV: Hoàng Thị Diễm Hương

L/O/G/O

Nội dung

1. Vấn đề xác định sai dạng hàm


2. Sử dụng biến đại diện cho các biến giải thích không
quan sát được
3. Mô hình với hệ số góc ngẫu nhiên
4. Các tính chất của OLS khi có sai số trong đo lường
5. Dữ liệu bị khuyết, mẫu phi ngẫu nhiên và các quan
sát bất thường
6. Phương pháp độ lệch tuyệt đối nhỏ nhất

1
2/9/2022

1. Vấn đề xác định sai dạng hàm


 Kiểm định sai dạng hàm:
 Chúng ta đã có một công cụ mạnh để phát hiện dạng hàm bị xác định
sai: kiểm định F cho các ràng buộc loại trừ. Kiểm định này phù hợp để
xem liệu mô hình đang xét có thiếu bình phương hay bậc cao hơn của
một biến độc lập hay không, bằng cách thêm các số hạng này vào mô
hình và kiểm định xem thành phần thêm vào có ý nghĩa không.
 Ngoài ra ta có thể sử dụng kiểm định RESET (regression specification
error test) của Ramsey (1969).
 Ý tưởng của RESET là thêm bình phương và bậc cao hơn của giá trị ước
lượng của biến phụ thuộc vào hàm hồi quy (giống với kiểm định White
rút gọn)
yi   0  1 xi1  ...   k xik  1 yˆ 2   2 yˆ 3  ui Kiểm định H0: 1 = 2 = 0
Nếu ta không thể loại bỏ chúng, nghĩa là mô hình đã thiếu dạng bậc cao của
biến độc lập và biến tương tác, hay nói cách khác, mô hình sai dạng hàm.

1. Vấn đề xác định sai dạng hàm


 Kiểm định sai dạng hàm:
 Ví dụ: Hàm hồi quy giá nhà

Bằng chứng cho thấy


có sai dạng hàm

Ít bằng chứng cho thấy


có sai dạng hàm
 Thảo luận:
• Ta cũng có thể thêm vào các thành phần bậc cao hơn, tức là các
dạng tương tác phức tạp và dạng bậc cao của các biến giải thích.
• Tuy nhiên, RESET cung cấp ít hướng dẫn về việc dạng hàm bị sai thế
nào.

2
2/9/2022

1. Vấn đề xác định sai dạng hàm


 Kiểm định đối với mô hình không lồng nhau:
 Ví dụ:
• Xét mô hình 1: y   0  1 x1   2 x2  u
• Mô hình 2: y   0  1 log( x1 )   2 log( x2 )  u
• Xây dựng mô hình hỗn hợp sao cho mỗi mô hình là một trường hợp
đặc biệt của mô hình hỗn hợp:
y   0  1 x1   2 x2   3 log( x1 )   4 log( x2 )  u
 Thảo luận:
• Cách làm này luôn có thể thực hiện được, tuy nhiên có thể không có
mô hình nào chiếm ưu thế rõ ràng: cả hai đều có thể bị bác bỏ, hoặc
không mô hình nào bị bác bỏ.
• Không thể dùng nếu các mô hình khác nhau về dạng của biến phụ
thuộc.

2. Sử dụng biến đại diện cho các biến giải thích


không quan sát được
 Ví dụ: Bỏ sót biến năng lực trong mô hình tiền lương
log( wage)   0  1educ   2exper   3abil  u Thay bằng biến đại diện
 Thông thường, ước lượng suất sinh lợi của giáo dục và kinh nghiệm sẽ
bị chệch vì mô hình đã bỏ sót biến năng lực không quan sát được.
 Ý tưởng: tìm một biến đại diện cho năng lực sao cho có thể kiểm soát
và thể hiện được năng lực khác nhau giữa các cá nhân, khi đó hệ số
hồi quy của các biến khác không còn bị chệch. Một trong các biến đại
diện cho năng lực là chỉ số IQ hoặc kết quả của các kiểm tra tương tự.
 Cách sử dụng biến đại diện trong mô hình:
y   0  1 x1   2 x2   3 x3*  u Biến bỏ sót, chẳng hạn: năng lực
x3*   0   3 x3  v3 Hồi quy biến bỏ sót theo biến đại diện của nó
 y  (  0  3 0 )  1 x1   2 x2  3 3 x3  u  3v3

3
2/9/2022

2. Sử dụng biến đại diện cho các biến giải thích


không quan sát được
 Các giả thiết cần thiết cho biến đại diện để có được ước lượng tốt:
 Sai số u không tương quan với x1, x2, x3* và x3 (Biến đại diện „chỉ là
đại diện“ cho biến bị bỏ sót, nó không thuộc vào hàm hồi quy tổng thể,
nghĩa là nó không tương quan với nhiễu).

 Sai số v3 không tương quan với x1, x2 và x3 (Biến đại diện phải đại diện
„tốt“ cho biến bị bỏ sót, nghĩa là các biến khác thêm vào không giúp gì
trong dự đoán biến bị bỏ sót).

2. Sử dụng biến đại diện cho các biến giải thích


không quan sát được
 Các giả thiết cần thiết cho biến đại diện để có được ước lượng tốt:
 Dưới các giả thiết này, phương pháp biến đại diện sẽ tiến hành được:
y  (  0   3 0 )  1 x1   2 x2   3 3 x3  u  3v3
Trong mô hình này, thành phần sai số không tương quan với tất cả các
biến giải thích. Do đó, tất cả các hệ số sẽ được ước lượng đúng bằng OLS.
Vì vậy, các hệ số của biến x1 và x2 sẽ được xác định đúng. Hệ số của biến
đại diện cũng có thể được quan tâm (nó là bội số của hệ số đứng trước
biến bị bỏ sót).
 Thảo luận về giả thiết cho biến đại diện trong hàm tiền lương:
 Giả thiết 1: Có thể được thỏa mãn vì Chỉ số IQ không là yếu tố ảnh
hưởng trực tiếp đến tiền lương; quan trọng là một cá nhân chứng minh
năng lực trong công việc như thế nào.
 Giả thiết 2: Hầu hết sự thay đổi trong năng lực có thể được giải thích
bởi sự thay đổi trong chỉ số IQ, chỉ có một số ít được giải thích bởi giáo
dục và kinh nghiệm.
8

4
2/9/2022

2. Sử dụng biến đại diện cho các biến giải thích


không quan sát được
 Sử dụng biến trễ của biến phụ thuộc làm biến đại diện:
 Trong nhiều trường hợp, các yếu tố không quan sát được bị bỏ sót có
thể được đại diện bởi giá trị của biến phụ thuộc ở các thời điểm trước
đó.
 Ví dụ: Tỷ lệ tội phạm trong thành phố
crime   0  1unem   2expend   3crime1  u
• Việc đưa thêm tỷ lệ tội phạm thời điểm trước vào mô hình ít nhất
kiểm soát được phần nào các yếu tố bị bỏ sót có vai trò quyết định
đến tỷ lệ tội phạm trong năm đang xét.
• So sánh hai thành phố có cùng tỷ lệ tội phạm vào năm ngoái; nghĩa
là, chúng ta đã tránh trường hợp so sánh hai thành phố có sự khác
biệt rất lớn trong các yếu tố tội phạm không quan sát được.

3. Mô hình với hệ số góc ngẫu nhiên


 Xét mô hình hồi quy: yi  (  ci )  (   di ) xi Mô hình có hệ số chặn và
hệ số góc đều ngẫu nhiên

Hệ số chặn Thành phần Hệ số góc Thành phần


trung bình ngẫu nhiên trung bình ngẫu nhiên
 yi     xi  (ci  d i xi ) Sai số
 Để thu được ước lượng không chệch của  và  thì ta cần giả thiết:
E (ci | xi )  E (di | xi )  0 Thành phần ngẫu nhiên của một cá nhân
độc lập với biến giải thích
 Var (ui | xi )  Var (ci  di xi | xi )   c2   d2 xi2
Dùng WLS hoặc OLS với sai số chuẩn cải thiện
sẽ giúp ước lượng vững hệ số chặn trung bình
và hệ số góc trung bình của tổng thể.

10

5
2/9/2022

4. Các tính chất của OLS khi có sai số trong đo


lường
 Sai số đo lường ở biến phụ thuộc:
y  y *  e0 Giá trị sai = Giá trị đúng + Sai số đo lường
y *   0  1 x1  ...   k xk  u Hàm hồi quy tổng thể
 y   0  1 x1  ...   k xk  (u  e0 ) Mô hình được ước lượng
 Hậu quả của sai số đo lường ở biến phụ thuộc:
• Ước lượng kém hiệu quả hơn do phương sai sai số cao hơn.
• Ước lượng OLS vẫn vững và không chệch (miễn là sai số đo lường
không tương quan với các biến giải thích).

11

4. Các tính chất của OLS khi có sai số trong đo


lường
 Sai số đo lường ở biến giải thích:
x1  x1*  e1 Giá trị sai = Giá trị đúng + Sai số đo lường
y   0  1 x1*  ...   k xk  u Hàm hồi quy tổng thể
 y   0  1 x1  ...   k xk  (u  1e1 ) Mô hình được ước lượng
 Giả thiết sai số trong đo lường cổ điển: Cov ( x1 , e0 )  0
*

 Cov( x1 , e1 )  Cov( x1* , e1 )  Cov (e1 , e1 )  Cov( x1* , e1 )  Var (e1 )   e21
 Cov( x1 , u  1e1 )  Cov ( x1 , u )  1Cov( x1 , e1 )   1 e21
Giá trị sai x1 có tương quan với sai số của mô hình

12

6
2/9/2022

4. Các tính chất của OLS khi có sai số trong đo


lường
 Sai số đo lường ở biến giải thích:
 Hậu quả của sai số đo lường ở biến giải thích:
• Dưới giả thiết sai số trong đo lường cổ điển, OLS cho ước lượng
chệch và không vững vì biến đo sai bị nội sinh.
• Có thể biểu diễn tính không vững của ước lượng như sau:
Nhân tử này (liên quan đến phương sai
  r2* 
của sai số nhiễu trong hàm hồi quy giá
p lim ˆ1  1  2 1 2 
n    r*   e1  trị đúng x1 theo các biến giải thích khác)
 1  luôn nhận giá trị từ 0 đến nhỏ hơn 1.
• Tác động của biến bị đo lường sai bị chệch suy giảm, nghĩa là độ lớn
của tác động có xu hướng giảm về 0.
• Tác động của các biến giải thích khác cũng bị chệch.

13

5. Dữ liệu bị khuyết, mẫu phi ngẫu nhiên và các


quan sát bất thường
 Dữ liệu bị khuyết và mẫu phi ngẫu nhiên
 Dữ liệu bị khuyết do chọn mẫu:
• Dữ liệu khuyết là trường hợp đặc biệt của chọn mẫu (= mẫu phi
ngẫu nhiên) với quan sát bị thiếu thông tin không thể sử dụng được.
• Nếu mẫu được chọn dựa trên các biến độc lập thì hàm hồi quy
không gặp vấn đề gì vì hàm hồi quy xét điều kiện dựa trên các biến
giải thích.
• Nhìn chung, việc chọn mẫu sẽ không có vấn đề gì nếu nó không
tương quan với sai số của mô hình (= chọn mẫu ngoại sinh).
• Việc chọn mẫu sẽ có vấn đề, nếu nó dựa trên biến phụ thuộc hoặc
thành phần sai số (= chọn mẫu nội sinh).

14

7
2/9/2022

5. Dữ liệu bị khuyết, mẫu phi ngẫu nhiên và các


quan sát bất thường
 Dữ liệu bị khuyết và mẫu phi ngẫu nhiên
 Dữ liệu bị khuyết do chọn mẫu:
• Ví dụ về chọn mẫu ngoại sinh:
saving   0  1income   2 age   3 size  u
Nếu mẫu được chọn là phi ngẫu nhiên theo nhóm tuổi, nhóm thu nhập, quy mô
gia đình, hàm hồi quy không gặp vấn đề gì bởi vì nó nghiên cứu tiết kiệm cho một
tập con của tổng thể được xác định bởi thu nhập, tuổi và quy mô gia đình. Phân
phối của tập con không thay đổi.
• Ví dụ về chọn mẫu nội sinh:
wealth   0  1educ   2 exper   3age  u
Nếu mẫu được chọn là phi ngẫu nhiên do các cá nhân từ chối tham gia cuộc
khảo sát vì giá trị tài sản của họ quá cao hoặc quá thấp, kết quả ước lượng sẽ bị
chệch vì những cá nhân này có thể sẽ khác biệt một cách hệ thống với những cá
nhân không từ chối tham gia mẫu khảo sát.
15

5. Dữ liệu bị khuyết, mẫu phi ngẫu nhiên và các


quan sát bất thường
 Quan sát bất thường và quan sát có ảnh hưởng lớn:
 Quan sát có giá trị cách xa hay bất thường là vấn đề đặc trưng của
OLS vì phương pháp này dựa trên bình phương phần dư.
 Nếu quan sát bất thường do sai sót khi nhập liệu, ta chỉ cần bỏ đi các
quan sát bị ảnh hưởng.
 Nếu quan sát bất thường nảy sinh do quá trình thu thập dữ liệu, việc
quyết định giữ lại hay bỏ đi những quan sát này không phải dễ dàng.

16

8
2/9/2022

6. Phương pháp độ lệch tuyệt đối nhỏ nhất (LAD)


 Phương pháp độ lệch tuyệt đối nhỏ nhất tìm cách tối thiểu hóa tổng giá
trị tuyệt đối của các phần dư (thay vì tổng bình phương phần dư, OLS).
n n
Min  | uˆi |  Min  | yi   0  1 xi1  ...   k xik |
i 1 i 1
 Ít nhạy cảm hơn với các giá trị bất thường vì không bình phương phần
dư.
 Phương pháp độ lệch tuyệt đối ước lượng các tham số dựa trên trung vị
có điều kiện (thay vì trung bình có điều kiện như OLS).
 Ước lượng độ lệch tuyệt đối nhỏ nhất là trường hợp đặc biệt của hồi quy
phân vị (ước lượng các tham số dựa trên phân vị có điều kiện).

17

You might also like