Chuong 04

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 37

Chương 4 - Nhập môn Kinh tế lượng * 03.08.

2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội:


Vấn đề suy diễn thống kê

Chương 4

Wooldridge: Introductory Econometrics:


A Modern Approach, 5e

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội


Vấn đề suy diễn
Suy diễn thống kê trong mô hình hồi quy
Kiểm định giả thuyết về tham số tổng thể
Xây dựng khoảng tin cậy (đối xứng)

4.1 Phân phối mẫu của ước lượng OLS

Ước lượng OLS là các biến ngẫu nhiên

Chúng ta đã biết về kỳ vọng và phương sai của các ước lượng này

Tuy nhiên, chúng ta cần biết về phân phối của chúng để kiểm định giả
thuyết thống kê

Để suy luận về phân phối, chúng ta cần thêm giả thiết

Giả thiết về phân phối của sai số: sai số có phân phối chuẩn
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 1
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội


Vấn đề suy diễn
Giả thiết MLR.6 (Phân phối chuẩn của sai số)
và độc lập với các biến

Nếu có MLR.6 thì sẽ có MLR.4 và MLR.5

Giả sử rằng phần sai số của hồi quy tổng


thể có phân phối chuẩn.

Dạng phân phối và phương sai không


phụ thuộc vào bất kỳ biến độc lập nào.

Suy ra:

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
• Định lý giới hạn trung tâm (CLT)

• Có x1,..., xk là các biến ngẫu nhiên


Xét biến ngẫu nhiên tổng x = x1+…+xk

Nếu các điều kiện sau thỏa:


• Các xi là độc lập
• Các xi có cùng phân phối xác suất
• Các xi có cùng kỳ vọng và phương sai (hữu hạn)
• k lớn (thường k  30)
thì x sẽ có phân phối xấp xỉ chuẩn

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 2
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội


Vấn đề suy diễn
Thảo luận về giả thiết phân phối chuẩn
Phần sai số được xem là tổng của “nhiều“ yếu tố không quan sát được
Tổng của các yếu tố độc lập có phân phối xấp xỉ chuẩn (Định lý giới hạn
trung tâm - Central Limit Theorem - CLT)
Các vấn đề nảy sinh:
• Có bao nhiêu yếu tố không quan sát được? Có đủ lớn không?
• Có thể phân phối của từng yếu tố này sẽ không đồng nhất với nhau
• Các yếu tố này độc lập với nhau ở mức nào?
Phân phối của sai số là một vấn đề thuộc về thực nghiệm
Ít nhất là phân phối của sai số “xấp xỉ “ với phân phối chuẩn
Trong nhiều trường hợp, tính chuẩn này có thể không được đảm bảo
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

Phân tích hồi quy bội


Vấn đề suy diễn
Thảo luận về giả thiết phân phối chuẩn (tt)
Ví dụ về trường hợp mà giả thiết về tính chuẩn không thể thỏa mãn:
• Tiền lương (không âm, thường phải lớn hơn tiền lương tối thiểu)
• Số lần bắt giữ (chỉ nhận một vài giá trị nguyên không âm)
• Thất nghiệp (xét trường hợp biến giả, chỉ nhận giá trị 0 và 1)
Trong một vài trường hợp, phân phối chuẩn có thể đạt được thông qua việc
biến đổi dạng biến phụ thuộc (chẳng hạn như dùng log(wage) thay cho wage)
Dưới giả thiết về phân phối chuẩn, OLS là ước lượng không chệch tốt nhất (kể
cả ước lượng phi tuyến)
Quan trong: Với mục đích là suy diễn thống kê, giả thiết về phân phối chuẩn
có thể thay thế bằng cỡ mẫu lớn (xem Chương 5)

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 3
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI:


VẤN ĐỀ ƯỚC LƯỢNG

Giả thiết MLR1-6:


Phương sai nhỏ nhất trong lớp:
Tuyến tính Phi tuyến
Không chệch Không chệch
Tuyến tính Phi tuyến
Chệch Chệch

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
Kiểm định phần dư có phân phối chuẩn (giả thiết MLR6)
Tập tin gpa1.wf1
> hoiquy1 <- lm(colGPA ~ hsGPA+ACT+skipped+age, data=gpa1)
> summary(hoiquy1)
Call:
lm(formula = colGPA ~ hsGPA + ACT + skipped + age, data = gpa1)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.90206 0.65037 1.387 0.16771
hsGPA 0.43379 0.09709 4.468 1.65e-05 ***
ACT 0.01449 0.01058 1.370 0.17309
skipped -0.08066 0.02617 -3.082 0.00249 **
age 0.01990 0.02284 0.872 0.38498
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.3298 on 136 degrees of freedom


Multiple R-squared: 0.2379, Adjusted R-squared: 0.2154
F-statistic: 10.61 on 4 and 136 DF, p-value: 1.635e-07
> # Lay phan du
> phandu1=resid(hoiquy1)
8

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 4
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
Kiểm định phần dư có phân phối chuẩn (giả thiết MLR6)
> # install.packages("fBasics")

> library(fBasics)
Loading required package: timeDate
Loading required package: timeSeries
> jarqueberaTest(phandu1)

Title:
Jarque - Bera Normalality Test

Test Results:
STATISTIC:
X-squared: 1.5592
P VALUE:
Asymptotic p Value: 0.4586
H0: phần dư có phân phối chuẩn
H1: phần dư không có phân phối chuẩn
p-value = 0,4586 > 0,05 : chấp nhận H0
Vậy phần dư có phân phối chuẩn 9

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
Kiểm định phần dư có phân phối chuẩn (giả thiết MLR6)

> shapiro.test(phandu1)
Shapiro-Wilk normality test
data: phandu1
W = 0.9893, p-value = 0.3537

> require(nortest)
Loading required package: nortest
> # Kiem dinh Anderson-Darling
> ad.test(phandu1)
Anderson-Darling normality test
data: phandu1
A = 0.60863, p-value = 0.1116

> # Kiem dinh Kolmogorov-Smirnov


> lillie.test(phandu1)
Lilliefors (Kolmogorov-Smirnov) normality test
data: phandu1
D = 0.071506, p-value = 0.07439
10

10

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 5
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
Kiểm định phần dư có phân phối chuẩn (giả thiết MLR6)
> # Chay hoi quy
> hoiquy2 <- lm(log(wage) ~ educ+exper+age+married,
data=wage2)
> # Lay phan du
> phandu2=resid(hoiquy2)
> # kiem dinh Jarque-Bera
> library(fBasics)
> jarqueberaTest(phandu2)

Title:
Jarque - Bera Normalality Test

Test Results:
STATISTIC:
X-squared: 43.649
P VALUE:
Asymptotic p Value: 3.325e-10

H0: phần dư có phân phối chuẩn


H1: phần dư không có phân phối chuẩn
p-value = 3,325 10-10 < 0,05 : bác bỏ H0
Vậy phần dư không có phân phối chuẩn 11

11

Phân tích hồi quy bội


Vấn đề suy diễn
Một số thuật ngữ

“các giả thiết Gauss-Markov“ Các giả thiết của “mô hình hồi quy tuyến tính cổ
điển (CLM - classical linear model )“

Định lý 4.1 (Phân phối chuẩn trong mẫu)

Dưới các giả thiết MLR.1 – MLR.6:

4.1

Các ước lượng OLS có phân phối mẫu với Ước lượng chuẩn hóa tuân theo phân phối
phương sai như đã thiết lập trong chương trước chuẩn tắc

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

12

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 6
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội


Vấn đề suy diễn
4.2 Kiểm định giả thuyết về từng tham số tổng thể
Định lý 4.2 (phân phối t cho các ước lượng chuẩn hóa)

Dưới các giả thiết MLR.1 – MLR.6:

Nếu việc chuẩn hóa được thực hiện bằng dùng độ lệch
chuẩn ước lượng (nghĩa là dùng sai số chuẩn), phân
phối chuẩn tắc sẽ được thay thế bằng phân phối t
4.3

Lưu ý: Phân phối t sẽ rất gần với phân phối chuẩn tắc khi bậc tự do n-k-1 lớn.

Giả thuyết không (trường hợp giả thuyết tổng quát sẽ đề cập sau)
Tham số tổng thể bằng 0, nghĩa là sau khi kiểm soát
các biến độc lập khác, xj không tác động đến y
4.4

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

13

Phân tích hồi quy bội


Vấn đề suy diễn
Thống kê t (hay tỷ số t)
Thống kê t sẽ được sử dụng để kiểm định giả thuyết không
ˆ  0 đã đề cập ở trên. Hệ số ước lượng càng xa giá trị 0 thì giả
thuyết không càng ít khả năng đúng. Nhưng khi nào thì
t ˆ  j 4.5
được gọi là “xa“ giá trị 0?
j
se( ˆ ) j
Điều này phụ thuộc vào sự biến thiên của hệ số ước lượng được,
nghĩa là phụ thuộc vào độ lệch chuẩn của hệ số. Thống kê đo
lường xem liệu khoảng cách từ hệ số ước lượng đến giá trị 0 bằng
bao nhiêu lần độ lệch chuẩn.

Phân phối của thống kê t nếu giả thuyết không là đúng

Mục tiêu: xác định một quy tắc bác bỏ sao cho nếu H0 là đúng thì
khả năng H0 bị bác bỏ là rất nhỏ (= mức ý nghĩa, ví dụ 5%)

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

14

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 7
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội :


Vấn đề suy diễn
Kiểm định với giả thuyết đối một phía (lớn hơn 0 – phía phải)

Kiểm định H 0 :  j  0 với giả thuyết đối H1 :  j  0 . 4.6


t0,05(28)= 1,701

Bác bỏ giả thuyết không và ủng hộ giả thuyết đối


một phía này nếu hệ số hồi quy ước lượng được là
quá lớn (cụ thể là lớn hơn giá trị tới hạn t(n-k-1)).

Xây dựng giá trị tới hạn sao cho, nếu giả thuyết
không là đúng thì khả năng giả thuyết không bị
bác bỏ, chẳng hạn, là 5% trong tổng số các trường
hợp.

Trong ví dụ đã cho, đây là giá trị của phân phối t


với 28 bậc tự do mà 5% số các trường hợp sẽ lớn
hơn giá trị này.
Bác bỏ H0 nếu thống kê t lớn hơn 1,701
t  t (n  k  1) : bac bo H 0 4.7
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

15

Phân tích hồi quy bội


Vấn đề suy diễn
Ví dụ 4.1: Phương trình tiền lương
Kiểm định rằng liệu sau khi kiểm soát biến học vấn và thâm niên chức vụ, những công

nhân nhiều kinh nghiệm làm việc hơn có nhận được tiền lương cao hơn hay không

Sai số chuẩn

Kiểm định với giả thuyết đối .

Người ta có thể kỳ vọng một tác động dương của kinh nghiệm đến tiền lương (USD/giờ)
hoặc không tác động gì cả.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

16

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 8
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội


Vấn đề suy diễn
Ví dụ 4.1: Phương trình tiền lương (tt)
Thống kê t

Bậc tự do;
Ở đây, sự xấp xỉ phân
phối chuẩn tắc có thể
được áp dụng

t0,05 (522)  1,645 Giá trị tới hạn ứng với mức ý nghĩa 5% và 1% - phân phối t xấp
xỉ chuẩn tắc (Đây là những mức ý nghĩa thường gặp).

t0,01 (522)  2,326 Giả thuyết không sẽ bị bác bỏ vì thống kê t lớn hơn giá trị tới
hạn t(n-k-1). texper= 2,41 > t0,05(522)= 1,645 : bác bỏ H0

“Tác động của kinh nghiệm đến tiền lương theo giờ lớn hơn 0 có
ý nghĩa thống kê ở mức 5% (thậm chí có ý nghĩa ở mức 1%).“

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

17

Phân tích hồi quy bội


Vấn đề suy diễn
Kiểm định với giả thuyết đối một phía (nhỏ hơn 0 – phía trái)

t0,05(18)= 1,734 Kiểm định H 0 :  j  0 với giả thuyết đối H1 :  j  0 4.8


Bác bỏ giả thuyết không với giả thuyết đối một
phía này nếu hệ số ước lượng được là “quá nhỏ“
(nghĩa là, nhỏ hơn so với giá trị tới hạn -t(n-k-1)).

Xây dựng giá trị tới hạn sao cho nếu giả thuyết
không là đúng thì giả thuyết này sẽ bị bác bỏ,
chẳng hạn, trong 5% tổng số các trường hợp.

Trong ví dụ đã cho, đây là điểm giá trị mà tại đó


phân phối t với 18 bậc tự do sẽ có 5% các trường
hợp nhỏ hơn giá trị này.

Bác bỏ H0 nếu thống kê t nhỏ hơn -1,734

t  t ( n  k  1) : bac bo H 0 4.9


© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

18

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 9
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội


Vấn đề suy diễn
Ví dụ 4.2: Kết quả học tập của sinh viên và quy mô trường học
Kiểm định rằng liệu quy mô trường học nhỏ hơn có dẫn đến kết quả học tập
của sinh viên sẽ tốt hơn hay không

Phần trăm sinh viên vượt Thu nhập trung bình Tỷ lệ giáo viên trên Lượng sinh viên theo học
qua bài kiểm tra môn Toán hàng năm của giáo viên 1000 sinh viên (= quy mô trường học)

Kiểm định với giả thuyết đối


.
Trường học càng lớn càng làm giảm kết quả học tập sinh viên hoặc quy mô trường học
không hề có tác động đến kết quả học tập?

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

19

Phân tích hồi quy bội


Vấn đề suy diễn
Ví dụ 4.2: Kết quả học tập của sinh viên và quy mô trường học (tt)
Thống kê t

Bậc tự do;
Trường hợp này có thể áp
dụng xấp xỉ phân phối
chuẩn tắc

t0,05 (404)  1, 645 Giá trị tới hạn với mức ý nghĩa 5% và 15%.

Giả thuyết không không bị bác bỏ vì thống kê t không nhỏ hơn


Bảng z: t0,15 (404)  1, 04 giá trị tới hạn. tenroll= -0,91 > -t0,05(404)= -1,645 : chấp nhận H0

Chúng ta không thể bác bỏ giả thuyết về việc quy mô trường học không có tác động
đến kết quả học tập của sinh viên (thâm chí là ở mức ý nghĩa 15%).

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

20

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 10
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội


Vấn đề suy diễn
Ví dụ 4.2: Kết quả học tập của sinh viên và quy mô trường học (tt)
Một dạng hàm có log:

R2 cao hơn một chút

Kiểm định

với giả thuyết đối .


© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

21

Phân tích hồi quy bội


Vấn đề suy diễn
Ví dụ 4.2: Kết quả học tập của sinh viên và quy mô trường học (tt)

Thống kê t

t0,05 (404)  1, 645 Giá trị tới hạn ở mức ý nghĩa 5%, bác bỏ giả thuyết không

Giả thuyết cho rằng quy mô trường học không có tác động đến kết quả học tập của
sinh viên đã bị bác bỏ, và ủng hộ giả thuyết đối cho rằng sự tác động là ngược chiều
tlog(enroll)= -1,87 < -t0,05(404)= -1,645 : bác bỏ H0

Độ lớn của tác động ra sao? Nếu số sinh viên tăng lên 10 (%) thì số sinh viên vượt qua bài
kiểm tra sẽ giảm một lượng là 0,0129*10 = 0,129 (%)
Ví dụ:

(tác động rất nhỏ)

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

22

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 11
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội


Vấn đề suy diễn
Kiểm định với giả thuyết đối hai phía

t0,025(25)= 2,06 Kiểm định H 0 :  j  0 với H 0 :  j  0 . 4.10


Bác bỏ giả thuyết không với giả thiết đối hai phía
nếu giá trị tuyệt đối của hệ số ước lượng quá lớn.

Xây dựng giá trị tới hạn sao cho nếu giả thuyết
không là đúng, thì nó có thể bị bác bỏ, ví dụ, 5%
trong tổng số các trường hợp.

Trong ví dụ đã cho, những điểm ứng với 5% các


trường hợp này nằm ở hai phía đuôi của hàm
phân phối.

Bác bỏ H0 nếu giá trị tuyệt đối của thống kê lớn hơn
2,06

| t | t / 2 ( n  k  1) : bac bo H 0 4.11
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

23

Phân tích hồi quy bội


Vấn đề suy diễn
Ví dụ 4.3: Các yếu tố tác động đến điểm GPA Số buổi cúp học

Dùng phân phối chuẩn tắc để tìm giá trị tới hạn

Tác động của hsGPA và số buổi cúp học


| thsGPA | 4, 38  t0,005 (137)  2,576 : bac bo H 0 khác 0 có ý nghĩa ở mức ý nghĩa 1%.

Tác động của ACT khác 0 không có ý


| t ACT | 1,36  t0,05 (137)  1, 645 : chap nhan H 0 nghĩa thống kê, thậm chí ở mức ý nghĩa
10%.
| t skipped | 3,19  t0,005 (137)  2,576 : bac bo H 0

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

24

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 12
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội


Vấn đề suy diễn
Biến độc lập “có ý nghĩa thống kê“ trong hồi quy
Nếu một hệ số hồi quy khác 0 trong một kiểm định hai phía, biến độc lập
tương ứng với hệ số hồi quy đó được gọi là “có ý nghĩa thống kê“
Nếu số bậc tự do đủ lớn sao cho có thể áp dụng xấp xỉ phân phối chuẩn thì quy
tắc sau đây có thể áp dụng:

“có ý nghĩa thống kê ở mức 10% “

“có ý nghĩa thống kê ở mức 5%“

“có ý nghĩa thống kê ở mức 1%“

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

25

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
Biến độc lập có ý nghĩa thống kê, mức ý nghĩa 5%
> hoiquy1 <- lm(colGPA ~ hsGPA+ACT+skipped+age, data=gpa1)
> summary(hoiquy1)
Call:
lm(formula = colGPA ~ hsGPA + ACT + skipped + age, data = gpa1)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.90206 0.65037 1.387 0.16771
hsGPA 0.43379 0.09709 4.468 1.65e-05 ***
ACT 0.01449 0.01058 1.370 0.17309
skipped -0.08066 0.02617 -3.082 0.00249 **
age 0.01990 0.02284 0.872 0.38498
---
Residual standard error: 0.3298 on 136 degrees of freedom
Multiple R-squared: 0.2379, Adjusted R-squared: 0.2154
F-statistic: 10.61 on 4 and 136 DF, p-value: 1.635e-07
* H0:  1 = 0 ; H1:  1 ≠ 0
p-value(2p) = 1,6510-5 < = 0,05 : bác bỏ H0
Hoặc |t|= 4,468 > t/2(136) = 1,96 : bác bỏ H0
Biến hsGPA có ý nghĩa thống kê
* H0:  4 = 0 ; H1:  4 ≠ 0
p-value(2p) = 0,38498 > = 0,05 : chấp nhận H0
Hoặc |t|= 0,872 < t/2(136) = 1,96 : chấp nhận H0
Biến age không có ý nghĩa thống kê 26

26

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 13
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội


Vấn đề suy diễn
Một số hướng dẫn về ý nghĩa kinh tế và ý nghĩa thống kê
Nếu một biến độc lập có ý nghĩa thống kê, thì hãy thảo luận về độ lớn của
hệ số để đánh giá ý nghĩa kinh tế hoặc ý nghĩa thực tiễn của biến
Một biến có ý nghĩa thống kê không nhất thiết phải có ý nghĩa kinh tế hoặc
ý nghĩa thực tiễn!
Nếu một biến có ý nghĩa thống kê và ý nghĩa kinh tế nhưng bị “sai“ dấu,
mô hình hồi quy có thể bị định dạng sai
Nếu một biến không có ý nghĩa thống kê ở mức ý nghĩa thông thường
(10%, 5%, 1%), người ta có thể nghĩ đến việc bỏ biến đó ra khỏi hàm hồi
quy (cẩn thận bởi vấn đề chệch do bỏ sót biến có liên quan)
Nếu quy mô mẫu nhỏ, thì sự tác động có thể bị ước lượng “kém chính xác“
(imprecise) vì vậy bằng chứng để bỏ biến sẽ yếu hơn
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

27

Phân tích hồi quy bội


Vấn đề suy diễn
Kiểm định các giả thuyết tổng quát về hệ số hồi quy
Giả thuyết không
Giá trị cần kiểm định của các hệ số hồi quy

4.12
Thống kê t

4.13

Việc kiểm định được thực hiện giống hệt như trước, ngoại trừ việc
lấy giá trị ước lượng trừ cho giá trị cần kiểm định khi tính toán các
thống kê kiểm định
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

28

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 14
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội


Vấn đề suy diễn
Ví dụ 4.4: Vấn đề tội phạm trong trường học và số sinh viên theo học
Một giả thuyết được quan tâm là liệu số lượng phạm tội có tăng 1% khi số sinh
viên theo học tăng 1%

Giá trị ước lượng là khác 1


nhưng sự khác nhau có ý
nghĩa thống kê hay không?

Giả thuyết bị bác bỏ ở


mức ý nghĩa 5%
1, 27  1
| t |  2, 45  t0,025 (95)  1,987 : bac bo H 0
0,11

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

29

Phân tích hồi quy bội


Vấn đề suy diễn
Tính toán p-value cho các kiểm định t
Nếu mức ý nghĩa càng nhỏ, sẽ có một điểm giá trị mà tại đó giả thuyết không không
thể bị bác bỏ
Lý do là, bằng cách hạ thấp mức ý nghĩa, người ta muốn tránh sai lầm bác bỏ một
giả thuyết H0 đúng
Mức ý nghĩa nhỏ nhất mà tại đó giả thuyết H0 bị bác bỏ, được gọi là p-value của kiểm
định giả thuyết
Một giá trị p-value nhỏ là bằng chứng để chống lại giả thuyết H0 vì người ta sẽ bác
bỏ giả thuyết H0 thậm chí ở mức ý nghĩa rất nhỏ
Một giá trị p-value lớn là bằng chứng để ủng hộ giả thuyết không
p-value giúp dễ dàng kết luận hơn so với các giá trị thống kê ở những mức ý nghĩa
cho trước
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

30

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 15
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội


Vấn đề suy diễn
Cách tính p-value (trường hợp kiểm định hai phía)

p-value = P(|T|>|t|) 4.15

Những giá trị này là Trong trường hợp kiểm định hai phía, p-value
giá trị tới hạn cho
mức ý nghĩa 5% là xác suất sao cho các biến ngẫu nhiên có
phân phối t sẽ nhận giá trị tuyệt đối lớn hơn
giá trị thực tế, nghĩa là:

Khi đó, giả thuyết không sẽ bị bác bỏ nếu


p-value tương ứng nhỏ hơn mức ý nghĩa.

Giá trị thống kê kiểm định Ví dụ, với mức ý nghĩa 5%, thống kê t sẽ
không nằm trong miền bác bỏ.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

31

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
Tóm tắt kiểm định t
Mô hình y   0  1 x1  ...   k xk  u
Phía phải Phía trái Hai phía
H0: βj = aj H0: βj = aj H0: βj = aj
H1: βj > aj H0: βj < aj H0: βj ≠ aj
ˆ j  a j
t
se( ˆ j )
  t(n-k-1)   t(n-k-1)   t/2(n-k-1)
t > t(n-k-1) t < -t(n-k-1) |t| > t/2(n-k-1) Quy tắc bác bỏ H0
= 5%, n= 27, k+1= 7  t(n-k-1) = t0,05(20) = 1,725 Tra bảng thống kê
t/2(n-k-1) = t0,025(20) = 2,086
= 5%, n= 207, k+1= 7  t0,05() = 1,645
t0,025() = 1,960
p-value(1p) = P(T>|t|) p-value(2p) = P(|T|>|t|) Tính p-value
p-value(1p) <  (0,05) p-value(2p) <  (0,05) Quy tắc bác bỏ H0
p-value(1p) = p-value(2p)/2
32

32

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 16
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
Trong EXCEL: Phaân phoái Student t
 Caùc phaân vò t/2, t ñöôïc xaùc ñònh theo coâng thöùc:
=TINV(xaùc suaát, baäc töï do).
Thí duï vôùi coâng thöùc =TINV(0.05,6) ta ñöôïc t0,025(6) = 2.4469

 Ñeå tính p–value cho kieåm ñònh hai phía vaø moät phía ta
söû duïng coâng thöùc sau:
=TDIST(|t|, baäc töï do, ñuoâi)
vôùi ñuoâi=1: moät phía, ñuoâi=2: hai phía.

Vôùi thí duï n= 6, t= 2.4469 thì trong EXCEL ta goõ coâng thöùc sau:
=TDIST(2.4469,6,2) keát quaû ta ñöôïc p–value(2p) = 0.05
=TDIST(2.4469,6,1) ta ñöôïc p–value(1p) = 0.025
33

33

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
load("H:/BAI GIANG KTL 2021/ /Chuong 04/gpa1.RData")
gpa1 <- data
hq <- lm(colGPA ~ hsGPA + ACT + skipped + age, data=gpa1)
summary(hq)
# Kiem dinh t
t_test <- function(reg, coefnum, val){
coefnum <- coefnum+1 # he so chan o vi tri so 1
co <- coef(summary(reg))
tstat <- (co[coefnum,1]-val)/co[coefnum,2]
p_value <- 2 * pt(abs(tstat), reg$df.residual, lower.tail = FALSE)
result1 <- c(t_stat = round(tstat, digits=4))
result2 = c(p_value_2p = round(p_value, digits=4))
result3 = c(p_value_1p = round(p_value/2, digits=4))
return(list(result1, result2,result3))
}

# y = b0 + b1*x1 + b2*x2 + b3*x3 + b4*x4


# H0: b1 = 0.8 ; H1: b1 <> 0.8
# Chay ham Kiem dinh t truoc
t_test(hq,1,0.8) # nhap so 1 cho b1
34

34

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 17
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
> t_test(hq,1,0.8) # nhap so 1 cho b1
[[1]]
t_stat
-3.7719

[[2]]
p_value_2p
2e-04

[[3]]
p_value_1p
1e-04

# Gia tri toi han cua Kiem dinh t


t_critical <- function(alpha, df){
result1 <- c(t_alpha = round(abs(qt(alpha, df)),digits=4))
result2 <- c(t_alpha_chia2 = round(abs(qt(alpha/2, df)),digits=4))
return(list(result1, result2))
}
# Muc y nghia alpha = 0,05, bac tu do df cua hoi quy
# Chay ham gia tri toi han truoc
df <- hq$df.residual
t_critical(0.05,df)
35

35

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
> t_critical(0.05,df)
[[1]]
t_alpha
1.6561
[[2]]
t_alpha_chia2
1.9776
> summary(hq)

Call:
lm(formula = colGPA ~ hsGPA + ACT + skipped + age, data = gpa1)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.90206 0.65037 1.387 0.16771
hsGPA 0.43379 0.09709 4.468 1.65e-05 ***
ACT 0.01449 0.01058 1.370 0.17309
skipped -0.08066 0.02617 -3.082 0.00249 **
age 0.01990 0.02284 0.872 0.38498
---
Residual standard error: 0.3298 on 136 degrees of freedom
Multiple R-squared: 0.2379, Adjusted R-squared: 0.2154
F-statistic: 10.61 on 4 and 136 DF, p-value: 1.635e-07

36

36

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 18
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
1) H 0 : 1  0,8 ; H1 : 1  0,8 với mức ý nghĩa 5%
Phương pháp giá trị tới hạn:
Ta có |t| = 3,7719 > t0,025(136) = 1,9776 : bác bỏ H0
Phương pháp p-value:
Ta có p-value(2p) = 210-4 < 0,05 : bác bỏ H0
2) H 0 : 1  0,8 ; H1 : 1  0,8 với mức ý nghĩa 5%
Phương pháp giá trị tới hạn:
Ta có t = -3,7719 < -t0,05(136) = -1,6561 : bác bỏ H0
Phương pháp p-value:
Ta có p-value(1p) = 110-4 < 0,05 : bác bỏ H0
37

37

Phân tích hồi quy bội


Vấn đề suy diễn
Giá trị tới hạn
4.3 Khoảng tin cậy (đối xứng) của kiểm định
Định lý 4.2 giúp rút ra kết quả hàm ý rằng hai phía


P ˆ j  t / 2 ( n  k  1).se( ˆ j )   j  ˆ j  t / 2 (n  k  1).se( ˆ j )  1   
Giới hạn dưới của Giới hạn trên của Độ tin cậy
khoảng tin cậy khoảng tin cậy

 j  ˆ j  t /2 (n  k  1).se( ˆ j )
Diễn giải ý nghĩa của khoảng tin cậy (1- = 0,95)
Các giới hạn trên và dưới của khoảng tin cậy là ngẫu nhiên
Trong trường hợp lặp lại việc lấy mẫu, khoảng tin cậy như trên sẽ chứa hệ số
hồi quy tổng thể trong 95% các trường hợp.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

38

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 19
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội


Vấn đề suy diễn
Các khoảng tin cậy ứng với các mức ý nghĩa thông thường


P ˆ j  t0,005 ( n  k  1).se( ˆ j )   j  ˆ j  t0,005 (n  k  1).se( ˆ j )  0, 99 
P  ˆ  t (n  k  1).se( ˆ )   0, 95
4.16
j 0,025 ( n  k  1).se( ˆ j )   j  ˆ j  t0,025 j

P  ˆ  t
j 0,05 ( n  k  1).se( ˆ j )   j  ˆ j  t0,05 ( n  k  1).se( ˆ )   0,90
j

Quy tắc kinh nghiệm t0,005 ()  2,576; t0,025 ()  1,96; t0,05 ()  1, 645

Liên hệ giữa khoảng tin cậy và việc kiểm định giả thuyết 2 phía

Nếu aj không thuộc khoảng tin cậy  bác bỏ H0: βj = aj ; ủng hộ H1: βj ≠ aj

Nếu aj thuộc khoảng tin cậy  chấp nhận H0: βj = aj

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

39

Phân tích hồi quy bội


Vấn đề suy diễn
Ví dụ 4.8: Mô hình hồi quy về chi phí R&D của doanh nghiệp
Doanh thu
Chi tiêu cho R&D hàng năm Phần trăm lợi nhuận trên doanh thu

n  32; R 2  0,918; df  32  2  1  29; t0,025 (29)  2, 045


  ˆ  t (df ).se( ˆ )
1 1  /2   ˆ  t (df ).se( ˆ )
1 2 2  /2 2
= =

Tác động của doanh thu đến chi phí R&D ước lượng được có Tác động ước lượng được của profmarg có
khoảng tin cậy 95% khá hẹp. Ngoài ra, tác động này khác 0 khoảng tin cậy 95% rất rộng. Thậm chí tác
có ý nghĩa thống kê vì số 0 nằm ngoài khoảng tin cậy. động này không có ý nghĩa thống kê vì số 0
nằm trong khoảng tin cậy.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

40

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 20
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
• Tập tin rdchem.wf1
> hoiquy1<-lm(log(rd) ~ log(sales)+profmarg, data=rdchem)
> summary(hoiquy1)
Call:
lm(formula = log(rd) ~ log(sales) + profmarg, data = rdchem)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -4.37827 0.46802 -9.355 2.93e-10 ***
log(sales) 1.08422 0.06020 18.012 < 2e-16 ***
profmarg 0.02166 0.01278 1.694 0.101
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.5136 on 29 degrees of freedom


> # Khoang tin cay 95%
> confint(hoiquy1,level = 0.95)
2.5 % 97.5 %
(Intercept) -5.335478450 -3.4210681
log(sales) 0.961107256 1.2073325
profmarg -0.004487722 0.0477991

Khoảng tin cậy 95% của β1: 1.08422  2.045*0.0602


Hay (0.9611 ; 1.2073) 41

41

Phân tích hồi quy bội


Vấn đề suy diễn
4.4 Kiểm định giả thuyết về tổ hợp tuyến tính của các tham số
Ví dụ: Suất sinh lợi giáo dục khi học cao đẳng (2 năm) và đại học
(4 năm) Số năm đi học khi Số năm đi học khi
học hệ 2 năm học hệ 4 năm

4.17

Kiểm định với giả thuyết đối


. 4.18 4.19
Một thống kê kiểm định có thể dùng là :
Chênh lệch giữa các ước lượng được chuẩn hóa bằng cách chia cho
độ lệch chuẩn của khoảng chênh lệch này. Giả thuyết H0 sẽ bị bác bỏ
4.20 nếu giá trị thống kê t mang giá trị âm quá lớn để tin rằng sự khác
nhau thực sự trong tổng thể giữa hai ước lượng là bằng 0.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

42

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 21
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội


Vấn đề suy diễn
Không thể tính toán với các kết quả hồi quy bình thường 4.23

Cách làm khác Không có sẵn trong kết quả hồi quy thông thường

Tính và kiểm định với . 4.24

4.25

Thêm đại lượng này vào hàm Biến độc lập mới (= tổng số năm đi học ở cả
hồi quy ban đầu hai hệ)

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

43

Phân tích hồi quy bội


Vấn đề suy diễn
Tổng số năm đi học = jc+univ
Kết quả ước lượng

4.27

Giả thuyết bị bác bỏ tại mức ý nghĩa


10%, nhưng không bị bác bỏ tại 5%

t= -1,48 < -t0,1()= - 1,282 hay p-value(1p)= 0,07 < 0,1 : bác bỏ H0
t= -1,48 > -t0,05()= - 1,645 hay p-value(1p)= 0,07 > 0,05 : chấp nhận H0
Cách làm này luôn áp dụng được với các giả thuyết tuyến tính đơn

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

44

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 22
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
• Tập tin twoyear.wf1
> hoiquy1<-lm(lwage ~ jc + univ + exper, data = twoyear)
> summary(hoiquy1)

Call:
lm(formula = lwage ~ jc + univ + exper, data = twoyear)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.4723256 0.0210602 69.910 <2e-16 ***
jc 0.0666967 0.0068288 9.767 <2e-16 ***
univ 0.0768762 0.0023087 33.298 <2e-16 ***
exper 0.0049442 0.0001575 31.397 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.4301 on 6759 degrees of freedom


Multiple R-squared: 0.2224, Adjusted R-squared: 0.2221
F-statistic: 644.5 on 3 and 6759 DF, p-value: < 2.2e-16

45

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
Ma trận hiệp phương sai của hệ số hồi quy
> vcov(hoiquy1)
(Intercept) jc univ exper
(Intercept) 4.435337e-04 -1.741432e-05 -1.573472e-05 -3.104756e-06
jc -1.741432e-05 4.663243e-05 1.927929e-06 -1.718296e-08
univ -1.573472e-05 1.927929e-06 5.330230e-06 3.933491e-08
exper -3.104756e-06 -1.718296e-08 3.933491e-08 2.479792e-08

var( ˆ1 )  4, 66.10 5 ; var( ˆ2 )  5,33.106 ;cov( ˆ1 , ˆ2 )  1,93.106

46

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 23
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
> hoiquy2<-lm(lwage ~ jc + I(jc + univ) + exper, data = twoyear)
> summary(hoiquy2)
Call:
lm(formula = lwage ~ jc + I(jc + univ) + exper, data = twoyear)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.4723256 0.0210602 69.910 <2e-16 ***
jc -0.0101795 0.0069359 -1.468 0.142
I(jc + univ) 0.0768762 0.0023087 33.298 <2e-16 ***
exper 0.0049442 0.0001575 31.397 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.4301 on 6759 degrees of freedom


Multiple R-squared: 0.2224, Adjusted R-squared: 0.2221

• H0:  1=0 ; H1:  1≠0


• p-value(2p) = 0,142  p-value(1p) = 0,071
47

47

Phân tích hồi quy bội


Vấn đề suy diễn
4.5 Kiểm định nhiều ràng buộc tuyến tính: Kiểm định F
Kiểm định các ràng buộc loại trừ
Tiền lương của các
cầu thủ bóng chày Số năm thi đấu Số trận tham gia thi
ở giải nhà nghề chuyên nghiệp đấu trung bình mỗi
năm

4.28

Điểm đánh Số lần đánh bóng Số lần đánh bóng ghi


bóng trung bình ghi điểm trực tiếp điểm mỗi năm
trung bình mỗi năm

4.29 với H1: H0 là sai 4.30


Kiểm định việc các đại lượng đo lường hiệu quả thi đấu của cầu thủ không tác động
đến tiền lương/ hoặc có thể loại bỏ khỏi phương trình hồi quy.
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

48

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 24
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội


Vấn đề suy diễn
Ước lượng mô hình chưa gán ràng buộc (UR)

4.31

Không có biến nào trong số các biến này có ý nghĩa thống kê khi kiểm
định đơn lẻ. tbavg = 0,89 ; thrunsyr = 0,89 ; trbisyr = 1,50

Gợi ý: Mức độ phù hợp của mô hình sẽ ra sao nếu các biến trên bị loại bỏ ra khỏi mô hình?

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

49

Phân tích hồi quy bội


Vấn đề suy diễn
Ước lượng mô hình đã gán ràng buộc (R)

4.33

RSS sẽ tăng lên, nhưng liệu sự gia tăng này có ý nghĩa thống kê hay không?

Thống kê kiểm định Số các ràng buộc Sự tăng lên tương đối của tổng bình
phương phần dư khi đi từ H1 đến H0
4.37 tuân theo một phân phối F (nếu H0
là đúng )

df = n-(k+1), với (k+1) : số tham số của mô hình UR


© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

50

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 25
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội


Vấn đề suy diễn
Quy tắc bác bỏ (Hình 4.7)
( Rur2  Rr2 ) / q
F 4.41
(1  Rur2 ) / df ur
dfur : bậc tự do của mô hình UR
Một biến ngẫu nhiên có phân phối F chỉ
có thể nhận giá trị dương. Điều này tương
ứng với việc tổng bình phương phần dư chỉ
có thể tăng thêm khi đi từ H1 đến H0.

Chọn giá trị tới hạn sao cho giả thuyết không sẽ
bị bác bỏ, ví dụ, trong 5% số trường hợp mặc dù
nó đúng.

Với mức ý nghĩa 5% ; q = 3 ; dfur = n-k-1 = 60 :


F0,05(3,60) = 2,76
F > F(q,n-k-1): bác bỏ H0 4.40 Nếu F > F0,05(3,60) : bác bỏ H0
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

51

Phân tích hồi quy bội


Vấn đề suy diễn
Số các ràng buộc cần kiểm định
Kiểm định vấn đề trong ví dụ

(0,6278  0,5971) / 3
F  9,55
(1  0,6278) / 347
Bậc tự do của mô hình
F ~ F3,347 ; = 1% F0,01(3,347)= 3,78 chưa gán ràng buộc (UR)

Bằng chứng bác bỏ giả thuyết


không là rất mạnh (thậm chí ở
p-value = P(F-statistic > 9,55) = 4,47410-6 mức ý nghĩa rất nhỏ).

Thảo luận
F= 9,55 > F0,01(3,347)= 3,78
Ba biến được kiểm định là “có ý nghĩa đồng thời“
hay
Chúng không có ý nghĩa khi kiểm định riêng lẻ từng biến p-value= 4,47410-6 < 0,01:
Có thể đã có đa cộng tuyến giữa chúng bác bỏ H0

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

52

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 26
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
• Tập tin mlb1.wf1
> hoiquy1<-lm(log(salary) ~ years + gamesyr + bavg +
hrunsyr + rbisyr, data = mlb1)
> summary(hoiquy1)
Call:
lm(formula = log(salary) ~ years + gamesyr + bavg + hrunsyr
+ rbisyr, data = mlb1)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.119e+01 2.888e-01 38.752 < 2e-16 ***
years 6.886e-02 1.211e-02 5.684 2.79e-08 ***
gamesyr 1.255e-02 2.647e-03 4.742 3.09e-06 ***
bavg 9.786e-04 1.104e-03 0.887 0.376
hrunsyr 1.443e-02 1.606e-02 0.899 0.369
rbisyr 1.077e-02 7.175e-03 1.500 0.134
---
Residual standard error: 0.7266 on 347 degrees of freedom
Multiple R-squared: 0.6278, Adjusted R-squared: 0.6224
> nobs(hoiquy1)
[1] 353
R2 = 0.6278
n = df + số tham số = 347+6 = 353 53

53

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
> anova(hoiquy1)
Analysis of Variance Table

Response: log(salary)
Df Sum Sq Mean Sq F value Pr(>F)
years 1 165.980 165.980 314.4067 < 2.2e-16 ***
gamesyr 1 127.884 127.884 242.2441 < 2.2e-16 ***
bavg 1 0.881 0.881 1.6695 0.1972
hrunsyr 1 13.055 13.055 24.7299 1.039e-06 ***
rbisyr 1 1.189 1.189 2.2514 0.1344
Residuals 347 183.186 0.528
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’
0.1 ‘ ’ 1
SSR = 183.186
SSR  ˆ 2 .df  0, 7266 2 * 347

54

54

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 27
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
> #Load package car
> library(car)
> # Kiem dinh F
> linearHypothesis(hoiquy1, c("bavg=0","hrunsyr=0", "rbisyr=0"))
Linear hypothesis test

Hypothesis:
bavg = 0
hrunsyr = 0
rbisyr = 0

Model 1: restricted model


Model 2: log(salary) ~ years + gamesyr + bavg + hrunsyr + rbisyr

Res.Df RSS Df Sum of Sq F Pr(>F)


1 350 198.31
2 347 183.19 3 15.125 9.5503 4.474e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

• F = 9,5503 > F0,05(3,347) = 2,6 : bác bỏ H0


• p-value = 4,47410-6 < 0,05 : bác bỏ H0
55

55

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
Phaân phoái Fisher F
 Trong EXCEL:
Ñeå tính F0,05(1,6) = 5.987
goõ coâng thöùc sau: =FINV(0.05,1,6)
p–value cuûa phaân phoái F ñöôïc tính theo coâng thöùc:
p–value= P(F >F)
goõ coâng thöùc =FDIST(5.987,1,6) ta ñöôïc p–value = 0.05

> # Gia tri toi han F0,05(3,20)


> c(F_alpha = round(qf(1-0.05,3,20),digits=4))
F_alpha
3.0984
> # p-value cua F= 3,0984 voi bac tu do 3 va 20
> c(p_value = round(1-pf(3.0984,3,20),digits=4))
p_value
0.05
56

56

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 28
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội


Vấn đề suy diễn
Kiểm định ý nghĩa toàn bộ của mô hình hồi quy

UR: 4.34

Giả thuyết không phát biểu rằng các biến


độc lập hoàn toàn không có tác dụng giải
4.44
thích cho biến phụ thuộc
R: 4.45 Mô hình đã gán ràng buộc
(hồi quy với hệ số chặn)
4.46

Kiểm định ý nghĩa toàn bộ của mô hình hồi quy được trình bày trong
hầu hết các phần mềm hồi quy. Giả thuyết không thường bị bác bỏ
H0: R2 = 0 (Hàm hồi quy mẫu SRF không phù hợp với mẫu khảo sát) 4.44
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

57

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
Tập tin mlb1.wf1
> hoiquy1<-lm(log(salary) ~ years + gamesyr + bavg
+ hrunsyr + rbisyr, data = mlb1)
> summary(hoiquy1)
Call:
lm(formula = log(salary) ~ years + gamesyr + bavg + hrunsyr
+ rbisyr, data = mlb1)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.119e+01 2.888e-01 38.752 < 2e-16 ***
years 6.886e-02 1.211e-02 5.684 2.79e-08 ***
gamesyr 1.255e-02 2.647e-03 4.742 3.09e-06 ***
bavg 9.786e-04 1.104e-03 0.887 0.376
hrunsyr 1.443e-02 1.606e-02 0.899 0.369
rbisyr 1.077e-02 7.175e-03 1.500 0.134
---
Multiple R-squared: 0.6278, Adjusted R-squared: 0.6224
F-statistic: 117.1 on 5 and 347 DF, p-value: < 2.2e-16

• H0: β1 = … = β5 = 0 ; H1: H0 sai


• p-value < 2,210-16 < 0,05 : bác bỏ H0
58

58

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 29
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
Tập tin mlb1.wf1
> linearHypothesis(hoiquy1, c("years=0", "gamesyr=0",
"bavg=0","hrunsyr=0", "rbisyr=0"))
Linear hypothesis test

Hypothesis:
years = 0
gamesyr = 0
bavg = 0
hrunsyr = 0
rbisyr = 0

Model 1: restricted model


Model 2: log(salary) ~ years + gamesyr + bavg + hrunsyr + rbisy
r

Res.Df RSS Df Sum of Sq F Pr(>F)


1 352 492.18
2 347 183.19 5 308.99 117.06 < 2.2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

• H0: β1 = … = β5 = 0 ; H1: H0 sai


• p-value < 2,210-16 < 0,05 : bác bỏ H0
59

59

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
Kiểm định ràng buộc tuyến tính tổng quát với kiểm định F

• Mô hình chưa gán ràng buộc (UR)

y = β0 + β1x1 + β2x2 + β3x3 + β4x4 + β5x5 + β6x6 + u

• H0: β2 = 2, β4 = 0, β5 = -3 ; H1: H0 sai

• Mô hình đã gán ràng buộc (R)

y = β0 + β1x1 + 2x2 + β3x3 -3x5 + β6x6 + u (không chạy được)


 y - 2x2 + 3x5 = β0 + β1x1 + β3x3 + β6x6 + u (chạy được)
Chỉ dùng công thức (4.37), không dùng được công thức (4.41)

60

60

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 30
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội


Vấn đề suy diễn
Kiểm định ràng buộc tuyến tính tổng quát với kiểm định F
Ví dụ: Kiểm định sự hợp lý của việc định giá nhà
Giá dự kiến (giá được định ra Kích thước lô đất
Giá nhà thực tế
trước khi căn nhà được bán) (tính bằng feet)

4.47

Diện tích bình phương Số phòng ngủ

Hơn nữa, các yếu tố khác nhất thiết


4.48 không có tác động đến giá thực tế
một khi đã kiểm soát giá dự kiến.
Nếu căn nhà được định giá hợp lý, thì 1% sự thay đổi trong
giá dự kiến sẽ tương ứng với 1% thay đổi trong giá thực tế.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

61

Phân tích hồi quy bội


Vấn đề suy diễn
Mô hình chưa gán ràng buộc (UR)

y   0  1 x1   2 x2   3 x3   4 x4  u 4.49

Mô hình đã gán ràng buộc thực


Mô hình đã gán ràng buộc (R) chất là mô hình hồi quy [y-x1]
theo một hằng số

y   0  x1  u  y  x1   0  u 4.50

Thống kê kiểm định

F ~ F4,83 ; = 5% F0,05(4,83)= 2,50


F= 0,661 < F0,05(4,83)= 2,50 : chấp nhận H0 với mức ý nghĩa 5%
© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

62

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 31
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
• Tập tin hprice1.wf1

> hoiquy1<-lm(log(price) ~ log(assess) + log(lotsize)


+ log(sqrft) + bdrms, data = hprice1)
> summary(hoiquy1)

Call:
lm(formula = log(price) ~ log(assess) + log(lotsize)
+ log(sqrft) + bdrms, data = hprice1)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.263743 0.569665 0.463 0.645
log(assess) 1.043066 0.151446 6.887 1.01e-09 ***
log(lotsize) 0.007438 0.038561 0.193 0.848
log(sqrft) -0.103239 0.138430 -0.746 0.458
bdrms 0.033839 0.022098 1.531 0.129
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Multiple R-squared: 0.7728, Adjusted R-squared: 0.7619
F-statistic: 70.58 on 4 and 83 DF, p-value: < 2.2e-16

63

63

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
> linearHypothesis(hoiquy1, c("log(assess)=1", "log(lotsize)=0",
"log(sqrft)=0","bdrms=0"))
Linear hypothesis test

Hypothesis:
log(assess) = 1
log(lotsize) = 0
log(sqrft) = 0
bdrms = 0

Model 1: restricted model


Model 2: log(price) ~ log(assess) + log(lotsize) + log(sqrft) + b
drms

Res.Df RSS Df Sum of Sq F Pr(>F)


1 87 1.8801
2 83 1.8215 4 0.05862 0.6678 0.6162

• p-value = 0,6162 > 0,05 : chấp nhận H0


64

64

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 32
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Phân tích hồi quy bội


Vấn đề suy diễn
Kết quả hồi quy của mô hình chưa gán ràng buộc (UR)

Khi kiểm định riêng rẽ,


không có bằng chứng
chống lại sự hợp lý của
việc định giá nhà

Kiểm định F áp dụng được với dạng tổng quát của các giả thuyết bội và tuyến tính
Với tất cả các kiểm định và các khoảng tin cậy, các giả thiết MLR.1 – MLR.6 được
giả định là thỏa mãn; nếu không các kiểm định sẽ không còn đáng tin cậy.

© 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part.

65

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
• Mối liên hệ giữa thống kê t và F:
Kiểm định giả thiết đối 2 phía thì kết quả theo t và F là như nhau.

• Tập tin wage2.wf1

> hoiquy1<-lm(wage ~ educ + exper + tenure, data = wage2)


> summary(hoiquy1)
Call:
lm(formula = wage ~ educ + exper + tenure, data = wage2)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -276.240 106.702 -2.589 0.009778 **
educ 74.415 6.287 11.836 < 2e-16 ***
exper 14.892 3.253 4.578 5.33e-06 ***
tenure 8.257 2.498 3.306 0.000983 ***
---
Multiple R-squared: 0.1459, Adjusted R-squared: 0.1431

66

66

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 33
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
• Mối liên hệ giữa thống kê t và F:

1) H0: βeduc = 63 ; H0: βeduc ≠ 63

74,41486  63
t  1,815631 ;  = 5%
6, 286993

|t| = 1,815631 < t0,025() = 1,96 : chấp nhận H0

Hay: p-value(2p) = P(|t| > 1,815631) = 0,0697 (phần mềm)

p-value(2p) > 0,05 : chấp nhận H0

2) H0: βeduc = 63 ; H0: βeduc > 63

t = 1,815631 > t0,05() = 1,645 : bác bỏ H0

Hay: p-value(1p) = 0,0697/2 = 0,0349 < 0,05 : bác bỏ H0


67

67

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
• Mối liên hệ giữa thống kê t và F:

# Kiem dinh t
t_test <- function(reg, coefnum, val){
coefnum <- coefnum+1 # he so chan o vi tri so 1
co <- coef(summary(reg))
tstat <- (co[coefnum,1]-val)/co[coefnum,2]
p_value <- 2 * pt(abs(tstat), reg$df.residual, lower.tail = FALSE)
result1 <- c(t_stat = round(tstat, digits=4))
result2 = c(p_value_2p = round(p_value, digits=4))
result3 = c(p_value_1p = round(p_value/2, digits=4))
return(list(result1, result2,result3))
}
# y = b0 + b1*x1 + b2*x2 + b3*x3
# H0: b1 = 63 ; H1: b1 <> 63
# Chay ham Kiem dinh t truoc
t_test(hoiquy1,1,63) # nhap so 1 cho b1

68

68

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 34
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
• Mối liên hệ giữa thống kê t và F:

> t_test(hoiquy1,1,63) # nhap so 1 cho b1


[[1]]
t_stat
1.8156

[[2]]
p_value_2p
0.0697

[[3]]
p_value_1p
0.0349

> 1.8156^2
[1] 3.296403

69

69

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
• Mối liên hệ giữa thống kê t và F:
> #Load package car
> library(car)
> # Kiem dinh F
> linearHypothesis(hoiquy1, c("educ=63"))
Linear hypothesis test

Hypothesis:
educ = 63

Model 1: restricted model


Model 2: wage ~ educ + exper + tenure

Res.Df RSS Df Sum of Sq F Pr(>F)


1 932 130899834
2 931 130437974 1 461859 3.2965 0.06975 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘
’ 1

Nhận xét:
t2 = F
1,81562 = 3,2964
70

70

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 35
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
• 4.6 Trình bày kết quả hồi quy (bằng tay)
• Ví dụ 4.10 Sự đánh đổi Giữa tiền Lương và Phụ cấp của Giáo viên

71

71

PHÂN TÍCH HỒI QUY BỘI


VẤN ĐỀ SUY DIỄN
• Ví dụ 4.10 Sự đánh đổi Giữa tiền Lương và Phụ cấp của Giáo viên

• salary lương của giáo viên


• b/s là viết tắt của “tỷ lệ phụ cấp trên lương”
• enroll quy mô của trường
• staff số giáo viên trên một nghìn học sinh
• droprate tỷ lệ học sinh bỏ học
• gradrate tỷ lệ học sinh tốt nghiệp
• totcomp tổng thu nhập hàng năm trung bình cho một giáo viên, bao gồm
lương và các phụ cấp (lương hưu, bảo hiểm y tế và các khoản khác)

72

72

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 36
Chương 4 - Nhập môn Kinh tế lượng * 03.08.2021
Jeffrey M. Wooldridge

Môøi gheù thaêm trang web:

 https://sites.google.com/a/ueh.edu.vn/phamtricao/
 https://sites.google.com/site/phamtricao/

73

73

https://sites.google.com/a/ueh.edu.vn/ph
amtricao/ 37

You might also like