Download as pdf or txt
Download as pdf or txt
You are on page 1of 98

CHƢƠNG II

MÔ HÌNH HỒI QUY ĐƠN,


ƢỚC LƢỢNG VÀ KIỂM
ĐỊNH GIẢ THIẾT
Giới thiệu
 Lý thuyết kinh tế đề xuất nhiều mối liên hệ
giữa các biến kinh tế.
 + Chẳng hạn trong kinh tế vĩ mô, người ta xem
xét tác động của chính sách tiền tệ đến tăng
trưởng kinh tế; xem xét cầu tiền của các hộ gia
đình.
 Hoặc xem xét mối quan hệ giữa hiệu quả hoạt
động của các ngân hàng thương mại thông qua
ước lượng các hàm sản xuất hoặc các hàm chi
phí.
 Thí dụ:Nghiên cứu mối quan hệ giữa cung tiền và tăng
trưởng kinh tế thì phải căn cứ vào lý thuyết kinh tế để
ước lượng mối quan hệ giữa cung tiền và tăng trưởng
và kiểm định giả thiết là liệu có mối quan hệ nhân quả
không.
 Như vậy những chỉ định này liên quan đến mối liên hệ
giữa các biến kinh tế. Trong chương này, chúng ta sẽ
học một cách thức là làm sao có thể sử dụng mẫu của
số liệu kinh tế để biết về mối liên hệ như vậy.
 Ta quan tâm đến câu hỏi như nếu một biến thay đổi
theo một cách nhất định thì sẽ làm cho các biến kinh tế
khác (tăng trưởng, lạm phát) thay đổi như thế nào.
 Hoặc,nếu thay đổi một chính sách (có thể vi mô hay vĩ
mô) thì kết quả sản xuất, tiêu dùng hay kinh doanh sẽ
thay đổi như thế nào.
 Những câu hỏi như vậy có thể trả lời theo ngôn ngữ
của kinh tế lượng là dự báo của biến phụ thuộc khi
biến độc lập được phép thay đổi. Dự báo được thực
hiện thông qua sử dụng hồi quy. Cũng giống như các
mô hình khác, mô hình hồi quy dựa trên các giả thiết.
 Chúng ta xem xét vấn đề ước lượng hàm hồi quy và
kiểm định giả thiết. Có một số phương pháp ước
lượng hàm hồi quy mẫu, phương pháp sử dụng ở đây
là phương pháp bình thường nhỏ nhất (OLS).
I. PHƢƠNG PHÁP BÌNH PHƢƠNG NHỎ NHẤT
 1. Hồi quy tổng thể
 Thí dụ
 Chúng ta quan tâm đến đến mối liên hệ giữa thu nhập
(X) và tiêu dùng thực phẩm (Y) trong một khoảng thời
gian của các hộ gia đình.
 Thậm chí, chúng ta muốn dự đoán mức chi tiêu trung
bình của các hộ gia đình này khi biết thu nhập của họ.
 Giả sử ta đã có một bảng cho biết mức thu nhập và chi
tiêu của tất cả các hộ gia đình .
 Chẳng hạn với mức thu nhập 8 triệu đồng một
tháng (X=8 triệu đồng/1 tháng), thì trung bình
hộ gia đình ở Việt Nam năm 2005, chi tiêu cho
tiêu dùng thực phẩm là 1 triệu đồng.
 Như vậy trung bình có điều kiện có thể ký hiệu
là E (Y / X  X i ) ứng với mỗi một gia đình
khác nhau thì mức thu nhập cũng khác nhau,
nghĩa là trung bình có điều kiện đã mô tả như
trên là hàm của Xi vì thế ta có thể viết:
E (Y / X i )  f ( X i )
 f(Xi) là hàm của biến giải thích (mà ở đây là thu
nhập của hộ gia đình). (1) được gọi là hàm hồi
quy tổng thể (PRF) hay hồi quy tổng thể. Hàm
này ngụ ý rằng phân phối trung bình của tổng
thể Y với Xi đã cho là hàm của Xi.
 Vấn đề đặt ra là dạng hàm của f(Xi) là gì? Ở
trong thí dụ nêu trên, lý thuyết kinh tế đề nghị
mối quan hệ giữa chi tiêu tiêu dùng và thu nhập
có dạng tuyến tính, nghĩa là

E (Y / X i )  f ( X i )  1   2 X i
 Các 1 và 2 là các tham số cố định chưa biết.
Trong đó 1 được gọi là hệ số chặn, 2 là là hệ
số độ dốc của hàm hồi quy. Mô hình (2) được
gọi là mô hình hồi quy tổng thể dạng tuyến
tính.
 Lưu ý rằng thuật ngữ tuyến tính ở đây ngụ ý là
tuyến tính theo tham số (giải thích).
 Một vấn đề cần làm rõ ở đây là E (Y / X  X i ) chỉ
cho biết mức chi tiêu trung bình của hộ có thu
nhập Xi, nhưng các hộ gia đình cụ thể thì không
nhất thiết giống nhau.
 Chẳng hạn, cùng mức thu nhập 8 triệu đồng/
tháng, nhưng có hộ chi tiêu 1 triệu, có hộ chi
tiêu 0,8 triệu, cũng có hộ chi tiêu 2 triệu,
nghĩa là chi tiêu của mỗi hộ, nói chung
không đúng bằng Xi, mà giá trị này dao động
quanh giá trị trung bình của nó.
 Do vậy chúng ta có thể biểu diễn độ lệch của
chi tiêu Yi quanh giá trị trung bình là:
 ui  Yi  (1   2 X i ) hay Yi  1   2 X i  ui (3)
 ui được gọi là nhiễu ngẫu nhiên.
2. Hồi quy mẫu
 Trên đây, chúng ta đã nghiên cứu mối quan hệ
giữa thu nhập (X cố định) và chi tiêu (Y) của
của tất cả các hộ gia đình và chúng ta phải điều
tra toàn bộ các hộ gia đình ở Việt Nam để thu
được các dữ liệu cần thiết (tổng thể), với cơ sở
dữ liệu như vậy ta có được hàm hồi quy tổng
thể.
 Nhưng một vấn đề đặt ra là nếu chúng ta muốn
nghiên cứu mối quan hệ đó thì chúng ta phải
tiến hành một cuộc điều tra với quy mô rất lớn,
 nhiều khi điều này không thể thực hiện được vì
lý do tài chính và thời gian không cho phép. Để
khắc phục nhược điểm đó, người ta chỉ xem
xét mẫu của tổng thể đã cho và do đó nhiệm vụ
của chúng ta là phải ước lượng hàm hồi quy
tổng thể trên cơ sở mẫu quan sát.
 Tương tự như đã làm với hồi quy tổng thể,
chúng ta cũng phát triển quan niệm về hàm hồi
quy mẫu (SRF) có dạng:

Yˆi ˆ1 ˆ2X i
 . Yˆi là ước lượng của E (Y Xi; )
 ˆ1 là ước lượng của 1 và

 ˆ2 là ước lượng của 2.
 Cũng giống như đã giải thích trong việc thiết
lập hồi quy tổng thể, chúng ta cũng có thể biểu
diễn hồi quy qua mẫu dưới dạng ngẫu nhiên của
nó, nghĩa là:
Yi ˆ1 ˆ2Xi ei
 , trong đó ei ký hiệu là số hạng phần dư và được
coi như là ước lượng của ui.
 Tóm lại từ mục đích nghiên cứu mối quan hệ
giữa chi tiêu cho tiêu dùng và thu nhập của các
hộ gia đình ở Việt Nam ta đã đi đến đòi hỏi ước
lượng hàm hồi quy tổng thể:
Yi E(Y Xi ) ui 1 2Xi ui
 , trên cơ sở hồi quy mẫu:
Yi ˆ ˆX ei
1 2 i
3. Phƣơng pháp bình phƣơng nhỏ nhất
 Phương pháp bình phương nhỏ nhất do nhà
toán học Đức Carl Friedrich Gauss đề xuất. Sử
dụng phương pháp này kèm theo một vài giả
thiết, các ước lượng thu được có tính đặc biệt.
 Tư tưởng căn bản của phương pháp này là như
sau: Ước lượng hồi quy tổng thể trên cơ sở hồi
quy mẫu và số liệu mẫu. Vấn đề đặt ra là làm
thế nào để cho hồi quy mẫu ước lượng được
gần hồi quy tổng thể nhất.
 Nội dung phương pháp bình phương nhỏ nhất :
 Giả sử
E(Y Xi ) 1 2Xi

 là hồi quy tổng thể (PRF)


 Khi đó giá trị quan sát Yi:
Yi E(Y Xi ) ui 1 2Xi ui

 Trong đó: Yi là biến được giải thích;


 Xi là biến hồi quy;
 ui là nhiễu ngẫu nhiên;
 E(Y I Xi ) là kỳ vọng có điều kiện của Y.
 Hồi quy mẫu (SRF):; Yi ˆ ˆX ei
1 2 i

Yˆ ˆ ˆX
i 1 2 i

ˆ
 là hồi quy mẫu ước lượng được. Trong đó : 1
và ˆ là giá trị ước lượng được của  và 
2 1 2
 tương ứng; ei là sai số; Yˆi là giá trị ước lượng
của Yi.
 Vấn đề là phải tìm . Giả sử rằng chúng ta có n
cặp quan sát của Y và X, Ta phải tìm sao cho
nó càng gần với giá trị thực của Yi có thể được,
nghĩa là càng nhỏ càng tốt.
 Ta xem đồ thị sau đây:
Y SRF

e3

e1
.
e2

X
 Do ei (i=1,2,...,n) có thể dương, có thể âm, do
vậy cần phải tìm Yˆ sao cho tổng bình phương
i

 của các phần dư đạt cực tiểu. Tức là:


n n n
e2 i (Y Yˆ )2
i i (Y ˆ ˆ X )2 i 1 2 i min
i 1 i 1 i 1 n

 Do Xi và Yi đã biết, nên ei2 là hàm của ˆ , :ˆ


i 1
1 2
n n

f ( ˆ1, ˆ2 ) ei2 (Yi ˆ ˆ X )2 min
 i 1 i 1
1 2 i

 Từ điều kiện cần của cực trị thì ˆ1, ˆ2 là


nghiệm của hệ thống phương trình sau:
 Hệ phương trình:
f ( ˆ1, ˆ2 ) n
2(Yi ˆ ˆ X )( 1) 0
ˆ 1 2 i
1 i 1
n n
 Hay n ˆ ˆ Xi Yi
1 1
i 1 i 1
f(ˆ , ˆ )
1 2
n
ˆ ˆ X )( X )
2(Yi 0
ˆ 1 1 i i
2 i 1
 hay
n n n
ˆ Xi ˆ Xi2 Yi Xi
1 2
i 1 i 1 i 1
 ˆ1, ˆ2 được tìm
n
từ hệ phương
n
trình sau:
 nˆ ˆ Xi Yi ,
1 2
 i 1 i 1 (1.1)
n n n
ˆ Xi ˆ Xi2 Yi Xi
1 2
i 1 i 1 i 1
 Hệ phương trình (1.1) gọi là hệ phương trình
chuẩn. Giải hệ phương trình trên ta được:
n n n
n Yi Xi Xi Yi
ˆ i i i 1 i 1
1 n n
n Xi2 Xi
i 1 i 1
ˆ Y ˆX
1 2

 Đặt xi Xi X
yi Yi Y
n

 Khi đó yi x i
ˆ i 1
2 n
2
xi
i 1
Thí dụ 1
 Giả sử ta có số liệu về chi tiêu cho quảng cáo
(X) và doanh số bán ra của một công ty (Y)
trong 5 tháng:
 Tháng 1 2 3 4 5
Y =3 4 2 6 8
X =1 2 3 4 5
Tính các tham số của mô hình

QS Yi Xi yi xi x2 xi yi

1 3 1 -1.6 -2 4 3.2

2 4 2 -0.6 -1 1 0.6

3 2 3 -2.6 0 0 0
4 6 4 1.4 1 1 1.4
5 8 5 3.4 2 4 6.8

15 4.6 3 10 12

ˆ 2  1.2 ˆ1  1.0


Đƣờng hồi quy ƣớc lƣợng đƣợc
 Trong đó
5
x i yi
i 1 12
2 5 1.2
10
x i2
i 1
ˆ1 Y 2X 4.6 1.2 * 3 1
Thí dụ 2. thực hành
 Giả sử ta có số liệu về chi tiêu cho quảng cáo
(X) và doanh số bán ra của một công ty (Y)
trong 5 tháng:
 Tháng 1 2 3 4 5
Y =3 4 4 2 6
X =1 2 2 1 3
 Hãy ước lượng mô hình hồi quy tuyến tính về
mối quan hệ giữa doanh thu và quảng cáo.
II. CÁC TÍNH CHẤT CỦA CÁC ƢỚC
LƢỢNG BÌNH PHƢƠNG NHỎ NHẤT.
ˆ , ˆ
 (i) 1 2 được xác định một cách duy nhất ứng
với n cặp quan sát (Xi , Yi).
 (ii) ˆ , ˆ là các ước lượng điểm của và các
1 2

 loại đại lượng ngẫu nhiên, với các mẫu khác


nhau chúng có giá trị khác nhau.
 Yˆ ˆ ˆ X (SRF )
i 1 2 i

 có các tính chất sau đây:


 (iii) SRF đi qua trung bình mẫu ( X ,Y ), nghĩa
là:
Y ˆ ˆX
1 2
 (iv) Giá trị trung bình của Yi bằng giá trị

 trung bình của các quan sát: Yˆ Y


n
 (v) Giá trị trung bình của các phần dư: ei 0
i 1

 (vi) Cácnphần dư ei không tương quan với Yˆi ,


tức là Yˆiei 0
 i 1
 (vii) Các phần dư ei không tương quan với Xi
III. CÁC GIẢ THIẾT CƠ BẢN CỦA PHƢƠNG
PHÁP BÌNH PHƢƠNG NHỎ NHẤT.
 Trong phân tích hồi quy, mục đích của chúng ta là
ước lượng, dự báo về tổng thể, tức là ước lượng
E(Y|Xi) hay trong mô hình hồi quy tuyến tính đơn là
ước lượng E(Y Xi ) 1 2Xi ˆ1 và ˆ2 tìm được
 bằng phương pháp bình phương nhỏ nhất là các ước
lượng điểm của 1 và 2 .
 Chúng ta không biết được chất lượng của các ước
lượng này như thế nào. Chất lượng của các ước
lượng phụ thuộc vào dạng hàm của mô hình được lựa
chọn vào các biến giải thích Xi và nhiễu ui, cũng như
kích thước mẫu.
 Ở đây chúng ta sẽ nói về các giả thiết đối với X
và u. Với các giả thiết này thì các ước lượng
tìm được bằng phương pháp bình phương nhỏ
nhất là các ước lượng tuyến tính, không chệch,
có phương sai nhỏ nhất.
 Giả thiết 1: Kỳ vọng của yếu tố ngẫu nhiên u
bằng không, tức là:
E (u | X i ) 0
 Về mặt hình học giả thiết này được mô tả bằng
đồ thị ở dưới.
 Đồ thị chỉ ra rằng với mỗi giá trị của X, các giá
trị có thể có của Y xoay quanh giá trị trung
bình.
 Phân bố của phần lớn hơn hay nhỏ hơn giá trị
trung bình chính là các ui, theo giả thiết này
trung bình của các chênh lệch này bằng 0.

 Chú ý: Giả thiết E (u | X i ) 0 kéo theo

E (Yi | Xi ) 1 2X i
.

PRF : Yi  1   2 X i
 ui 

X1 X2 X3
Giả thiết 2:
Phương sai của các nhiễu ui là không đổi.
2
Var (u | Xi ) Var (u | X j ) i j
 có nghĩa là phân bố có điều kiện của Y với giá
trị đã cho của X có phương sai bằng nhau, các
giá trị cá biệt của Y xoay quanh giá trị trung
bình với phương sai như nhau.
f(u) Mật độ

X1

X2

X3

2
Var (u | X i ) Var (u | X i )
Phương sai sai số thay đổi
mËt ®é
. f(u)

X1

X2
X3
 Giả thiết 3. Kéo theo phương sai có điều kiện
của Yi cũng thuần nhất. Nghĩa là
2
Var (Yi | Xi )
 Giả thiết 4. Không có sự tương quan giữa các
ui, nghĩa là .
Cov(ui , u j ) 0, i j
 Giả thiết 5. u và X không tương quan với nhau.
Cov (ui , Xi ) 0, i

 Giả thiết 6. Các biến giải thích là phi ngẫu


nhiên, tức là các giá trị của chúng là các số đã
được xác định trong mẫu lặp.
IV. ĐỘ CHÍNH XÁC CỦA CÁC ƢỚC
LƢỢNG BÌNH PHƢƠNG NHỎ NHẤT.
 Theo phương pháp bình phương nhỏ nhất, các
ước lượng : ˆ ,
1 2
n
x i yi
ˆ Y i 1
1 2X , 2 n
x i2
i 1
 Các ước lượng này là hàm của mẫu, là đại
lượng ngẫu nhiên, với các mẫu khác nhau ta có
các ước lượng khác nhau.
 Vì phương sai hay độ lệch chuẩn đặc trưng cho
độ phân tán của đại lượng ngẫu nhiên nên ta
dùng chúng làm thước đo cho chất lượng của
ước lượng.
 Với các giả thiết của phương pháp bình phương
nhỏ nhất, phương sai và độ lệch chuẩn của các
ước lượng được cho bởi các công thức sau:
.

 Trong đó
2
Var (ui )
 Se là sai số tiêu chuẩn: xi Xi X
 Trong các công thức ở trên 2 chưa biết,
được ước lượng bằng ước lượng không chệch
của nó n
ei2
ˆ2 i 1
n 2
 là là sai số tiêu chuẩn của đường hồi quy. Nó
chính là độ lệch chuẩn các giá trị Y quanh
đường hồi quy mẫu.
 Các tính chất của các ước lượng bình phương
nhỏ nhất được thể hiện qua định lý sau đây:
Thí dụ: Tính sai số tiêu chuẩn từ thí dụ
1
 Thủ tục
 1. Tính ei2 và ei2/(n-2)
 2. Thế RSS/(n-2) cho 2
 3. Lấy căn bậc hai (2).
 Ta có bảng sau:
Sai số tiêu chuẩn của ƣớc lƣợng bình
phƣơng nhỏ nhất
Qs Y X y x x2 xy e2 X2

1 3 1 -1.6 -2 4 3.2 0.6 1

2 4 2 -0.6 -1 1 0.6 0.4 4

3 2 3 -2.6 0 0 0 6.8 9

4 6 4 1.4 1 1 1.4 0 16

5 8 5 3.4 2 4 6.8 1 25

Tổng 4.6 3 10 12 8.8 55


5
.
ei2
ˆ2 i 1
2.93
3
2
Var ( 2 ) 0.29 se ( 2 ) (0.29)1/2 0.54
5
x i2
i 1
5
Xi2
2
Var ( 1 ) i 1
3.23; se ( 1) (3.23)1/2 1.8
5
n xi2
i 1
 Thủ tục tính sai số tiêu chuẩn trong thí dụ 1.
Thủ tục như sau:
 1. Tính ei2 và ei2/(n-2)
 2. Thế RSS/(n-2) cho 2
 3. Lấy căn bậc hai của kết quả thu được.
Bài tập thực hành:
Tính phương sai và sai số tiêu chuẩn trong thí dụ
2.
Định lý Gauss - Markov
 Với các giả thiết của phương pháp bình
phương nhỏ nhất, các ước lượng bình
phương nhỏ nhất là các ước lượng tuyến
tính, không chệch và có phương sai nhỏ
nhất trong lớp các ước lượng tuyến tính
không chệch.
V. HỆ SỐ R2 ĐO ĐỘ PHÙ HỢP CỦA
HÀM HỒI QUY MẪU SRF
 Từ định nghĩa hồi quy mẫu ta có: Yi Yˆi ei
 , mà có thể viết lại như sau:

Yi Y Yˆi Y ei Yˆi Yˆ ei hay yi yˆi ei


 , từ đây suy ra
n n n n n n
yi2 yˆi2 ei2 2 yˆi ei ei2 ei2 0
i 1 i 1 i 1 i 1 i 1 i 1

 vì ˆx
yˆi 2 i
n n n
yi2 ˆ2 x i2 ei2
 i 1
2
i 1 i 1

 Ký hiệu: n n
2 2
TSS yi (Yi Y )
i 1 i 1

 TSS là tổng bình phương của tất cả các sai lệch
giữa các giá trị quan sát Yi với giá trị trung
bình của chúng.
n n n n
ESS (Yˆi Yˆ)2 (Yˆi Y )2 yˆi2 ˆ2
2 x i2
i 1 i 1 i 1 i 1
 ESS là tổng bình phương của tất cả các sai lệch
giữa các giá trị của biến phụ thuộc Y nhận được
từ hàm hồi quy mẫu với giá trị trung bình của
chúng (Yˆ Y)
 , nó đo độ chính xác của hàm hồi quy.
n n
RSS ei2 (Yi Yˆi )2
i 1 i 1
 , RSS là tổng bình phương của tất cả các sai
lệch giữa các giá trị quan sát Y và các giá trị
nhận được từ hàm hồi quy.
 Về mặt hình học có thể minh họa như trên hình
1.5.
Hình 1.5. Phân rã phƣơng sai của Yi
thành 2 thành phần TSS = ESS + RSS

Y
ei: do phần dư
.
Yi  Y = tổng
biến thiên

: do hồi quy Yˆi  Y

0
 TSS được chia thành hai phần: một phần ESS
do đường hồi quy mẫu gây ra và phần của RSS
do các yếu tố ngẫu nhiên gây ra.
n n
(Yˆi Y )2 ei2
ESS RSS i 1 i 1
1
TSS TSS n n
(Yi Y )2 (Yi Y )2
i 1 i 1

 Từ TSS = ESS + RSS, chia cả hai vế cho TSS,


ta có:
 Đặt n
(Yˆi Y )2
2 i 1 ESS RSS
r 1
n TSS TSS
(Yi Y )2
i 1
n n n
yˆi2 ˆ2 x i2 x i2
2
i 1 i 1 ˆ2 i 1
n n 2 n
yi2 yi2 yi2
i 1 i 1 i 1
n
x 12
i 1
2
ˆ2 n 1 S
ˆ2 X
r2 2 2
n
SY2
yi2
i 1
n 1
2 2
 trong đó:sx S
và y là phương sai mẫu của
X và Y tương ứng:
 Mặt khác:
n n 2
x i yi x i yi
ˆ2 i 1
n r2 n
i 1
n
x i2 x i2 yi2
i 1 i 1 i 1
n
 và x i yi
i 1
r n n
x i2 yi2
i 1 i 1
 Từ định nghĩa r2 chúng ta thấy r2 do tỷ lệ hay số
phần trăm của toàn bộ sai lệch của Y với giá trị
trung bình của chúng được giải thích bằng mô
hình (hay biến độc lập), r2 được sử dụng để đo
độ thích hợp của hàm hồi quy. Dễ dàng thấy
được.
 Nếu lấy căn bậc hai của r2 ta được r; r chính là
hệ số tương quan mẫu, tuy nhiên dấu của r tùy
thuộc vào quan hệ cùng chiều hay ngược chiều
giữa Y và X.
Thí dụ tính r2
qs Y X y y2 x x2 xy

1 3 1 -1.6 2.56 -2 4 3.2

2 4 2 -0.6 0.36 -1 1 0.6

3 2 3 -2.6 6.76 0 0 0

4 6 4 1.4 1.96 1 1 1.4

5 8 5 3.4 11.6 2 4 6.8

4.6 3 23.2 10 12
Các tính chất của hệ số tương quan r.
 1. r có thể âm hoặc dương, dấu của r phụ thuọc
vào dấu của tỷ số, đó chính là dấu của Cov (X,
Y). Nếu r>0 Xi và Yi tương quan cùng chiều
 2. -1  r  1
 3. r có tính chất đối xứng r(X, Y) = r (Y, X)
 4. Nếu X*=aX +cY*=bY+d, với a, b, c, d là các
hằng số và a, b >0 thì r(X*,Y*)=r(X,Y)
 5. Nếu X, Y độc lập với nhau thì r (Y, X)=0;
Điều ngược lại không đúng.
 6. r đo sự phụ thuộc tuyến tính. Nhưng không
có ý nghĩa trong việc định rõ tính chất các quan
hệ phi tuyến.
 7. r đo độ phụ thuộc tuyến tính giữa X và Y,
nhưng không đòi hỏi X, Y có mối quan hệ nhân
quả.
 8. r2 cũng có thể tính bằng công thức:
2 2
n n
(Yi Y )(Yˆi Y) yiyˆi
2 i 1 i 1
r
n n n n
(Yi Y )2 (Yˆi Y )2 yi2 yˆi2
i 1 i 1 i 1 i 1
TÓM TẮT 1
. n
x i yi
ˆ Y i 1
1 2X , 2 n
x i2
i 1

n n
Xi2 Xi2
i 1 2 i 1
Var ( 1) n ; se ( 1) n
xi2 n xi2
i 1 i 1
.
2
Var ( 2 ) ; se ( 2 )
n n
2
xi x i2
i 1 i 1

n n
ei2 ei2
ˆ2 i 1
;ˆ i 1
n 2 (n 2)
VI. PHÂN BỐ XÁC SUẤT CỦA ˆ , ˆ
1 2
 Phần trên chúng ta đã trình bày các ước lượng
điểm của và thu được bằng phương pháp bình
phương nhỏ nhất. Với các giả thiết cơ bản:
E (ui ) 0
2
Var (ui )
Cov(ui , u j ) 0( j)
 thì là các ước lượng tuyến tính không
chệch có phương sai nhỏ nhất của 1 và 2
tương ứng. Mục đích của phân tích hồi quy
không phải chỉ là suy đoán về 1 và 2 hay
PRE mà còn phải kiểm tra bản chất của sự phụ
thuộc, còn phải thực các dự đoán khác.
 Do vậy cần phải biết phân bố xác suất của 1
và 2 . Các nhân tố này phụ thuộc vào phân bố
của các ui.
 Bây giờ chúng ta bổ sung vào các giả thiết trên
giả thiết sau đây: N (0, 2 )
 Giả thiết 7. ui có phân bố
 Với các giả thiết trên,
ˆ cácˆước lượng
2 bình
phương nhỏ nhất 1 và 2 và ˆ có các tính
chất sau đây:
 1. Chúng là các ước lượng không chệch.
 2. Có phương sai cực tiểu.
 3. Khi số quan sát đủ lớn thì các ước lượng này
xấp xỉ với giá trị thực của phân bố.
 4. ˆ1
2
N ( 1, ˆ) Từ tính chất này suy ra:
1

ˆ
1 1
Z N (0,1)
ˆ
1

2
 5. (n 2) ˆ 2
(n 2)
 2

 6. Trong các ước lượng không chệch của 1 và


2 thì ˆ1, ˆ2 có phương sai nhỏ nhất.
 7. 2
Yi N( 1 2X i , )

 Với tính chất trên chúng ta có thể tìm khoảng


tin cậy và kiểm định giả thiết về các tham số
hồi quy.
VII. KHOẢNG TIN CẬY VÀ KIỂM ĐỊNH GIẢ THIẾT
VỀ CÁC HỆ SỐ HỒI QUY.
 Với các giả thiết trên thì: . ˆ1 N ( 1, 2
ˆ1 )
 ˆ2 N ( 2 , 2ˆ )
1

 Trong đó: n
Xi2 2
2 i 1 2 2
ˆ n
; ˆ n
1 2
n x i2 x i2
i 1 i 1

 Do đó, có thể tìm khoảng tin cậy, kiểm định giả
thiết cho các hệ số hồi quy và 2.
ˆ
 1. Khoảng tin cậy của 1 t 1
t(n 2)
se ( ˆ )1

 Với hệ số tin cậy 1- ta tìm được t /2(n 2) thỏa


mãn. ˆ
1
P( t /2 (n 2) t /2 (n 2)) 1
se( ˆ1 )
 Khoảng tin cậy 1- của 1 là:

( ˆ1 t /2 (n 2)se ( ˆ1 ); ˆ1 t /2 (n 2)se ( ˆ1))

 2. Kiểm định giả thiết đối với 1 Có thể đưa ra


giả thiết nào đó về 1, chẳng hạn giả thiết: .
 H0: 1= 1* Nếu giả thiết này đúng thì:
ˆ *
1 1
t t(n 2)
se( ˆ1 )
Loại giả thiết Giả thiết H0 Giả thiết đối Miền bác bỏ
H1
 1=  1*  1#  1*
Hai phía
| t | t /2 (n 2)
 1  1*  1 >  1*
Phía phải
t t (n 2)
1 1*  1 <  1*
Phía trái t t (n 2)
 3. Khoảng tin cậy của 2
 Dựa vào biểu thức : t ˆ
2 2
t(n 2)
se ( ˆ2 )
 do đó với hệ số tin cậy , khoảng tin cậy của
được xác định bởi:
ˆ
2 2
P( t /2(n 2) t /2(n 2)) 1
se( ˆ2 )
P( ˆ2 t /2(n 2)se( ˆ2 ) 2
ˆ
2 t /2(n 2)se( ˆ2 )) 1
4. Kiểm định giả thiết đối với 2

 Có thể đưa ra giả thiết về giá trị thực của 2,
chẳng hạn giả thiết H0: 2 = 2*.
 Nếu giả thiết này đúng thì:

ˆ2 *
2
t t(n 2)
se( ˆ2 )
Bảng :Kiểm định giả thiết về 2
Loại giả thiết Giả thiết H0 Giả thiết đối Miền bác bỏ
H1
 2=  2*  2#  2*
Hai phía
| t | t /2 (n 2)
 2  2*  2 >  2*
Phía phải
t t (n 2)
2 2*  2 <  2*
Phía trái t t (n 2)
 Nếu như đưa ra giả thiết 2= 2*=0 nghĩa là ta
đưa ra giả thiết về biến độc lập X không ảnh
hưởng đến biến phụ thuộc Y. Thì khi đó t được
tính bằng công thức:
ˆ
2
t
se( ˆ2 )
 Thí dụ thực hành: Tính khoảng tin cậy 95% cho
 2 và kiểm định giả thiết H0: 2=0.
5. Khoảng tin 2cậy đối với 2
2 ˆ 2
 Ta có (n 2) (n 2)
2

 Do đó, khoảng tin cậy (1- ) của 2 được xác


định từ:
2 ˆ2 2
P( 1 /2 (n 2) (n 2) /2 (n 2)) 1
2

 hay (n 2) ˆ2 2 (n 2) ˆ2
P 1
2 2
/2 (n 2) 1 /2 (n 2)
6. Kiểm định giả thiết đối với 2
Nội dung của kiểm định giả thiết đối với 2 có thể
trình bày trong bảng sau:

Loại giả thiết Giả thiết H0 GT đối H1 Miền bác bỏ

 2=  20  2#  20
Hai phía

 2=  20  2>  20
Phía phải

 2=  20  2<  20
Phía trái
7. Phân tích phƣơng sai.
 7.1. Định nghĩa.
 Phân tích phương sai trong hồi quy là việc phân
rã phương sai (TSS) của biến phụ thuộc thành
hai phần, mỗi phần gây ra bởi biến giải thích
(ESS) và phần còn lại gây ra bởi số hạng sai số
(RSS).
 Phần gây ra do số hạng sai số gọi là phần không
giải thích được, phần gây ra do biến giải thích
gọi là phần giải thích được.
Bảng 1.3. Phân tích phƣơng sai cho mô
hình hồi quy hai biến
Nguồn biến Tổng bình Bậc tự do Phƣơng sai
thiên phƣơng
n n
Do hồi quy ˆ2
2 x i2 1 ˆ2 x i2 / 1
(ESS) 2
i 1 i 1

n n
Do phần dƣ
e12 n-2 ei2 / (n 2)
(RSS)
i 1 i 1

n
TSS yi2 n-1
i 1
8. DỰ BÁO
 Mục đích của phân tích hồi quy là dự báo và đề
xuất chính sách.
 Ở đây ta sẽ trình bày phương pháp sử dụng hồi
quy ước lượng được để dự báo như sau:
 Có hai loại dự báo trên hàm hồi quy.
 - Đó là dự báo giá trị trung bình và
 - dự báo riêng.
 (a) Dự báo giá trị trung bình:
 Giả sử cho trước giá trị của biến ngoại sinh: X=X0,
yêu cầu dự báo cho E(Y | X )
0

 Hồi quy mẫu cho ta ước lượng điểm:


 E (Y | X 0 ) : Yˆ0 ˆ ˆX
1 2 0

 Yˆ0 là ước lượng không chệch, có phương sai nhỏ
nhất của E(Y | X )
0
 ,
 tuy nhiên Yˆ0 vẫn khác so với giá trị thực của nó.


 Yˆ0 có phân bố chuẩn với kỳ vọng là 1 2X0
 và phương sai là:
1 (X 0 X )2
var(Yˆ0 ) 2
n n
x i2
i 1

 nhưng vì phương sai nhiễu 2 nói chung là


chưa biết nên ta dùng ước lượng không chệch
của nó là: ˆ2 , khi đó
Yˆ0 ( 1 2X 0 )
t t(n 2)
Se(Yˆ0 )
 cho nên khoảng tin cậy (1-) của E(Y|X0) là:
(Yˆ0 t /2 (n 2)se(Yˆ0 ) E(Y | X0 ) Yˆ0 t /2 (n 2)se(Yˆ0 ))
(b) Dự báo riêng:
 Giả sử cho trước giá trị của biến ngoại sinh:
X=X0, yêu cầu dự báo cho Y=Y0. Hồi quy mẫu
cho ta ước lượng điểm của E(Y|X0):
E (Y | X 0 ) : Yˆ0 ˆ1 ˆ2X 0

 phương sai là:


; 2 1 (X 0 X )2
var(Y0 ) 1
n n
x i2
i 1
 nhưng vì phương sai nhiễu nói chung là chưa
biết nên ta dùng ước lượng không chệch của nó
2
là: ˆ , khi đó.
Y0 Yˆ
t t(n 2)
Se(Y0 )
 cho nên khoảng tin cậy (1- ) của Y0 là:

Yˆ0 t /2 (n 2)se (Y0 ) Y0 Yˆ0 t /2 (n 2)se(Y0 )


 Thí dụ :
 Tính dự báo y0 cho x0=6

 Phương sai của dự báo là

 Từ
 Sai số tiêu chuẩn của dự báo:

 Khoảng tin cậy 90% cho y0 với x0=6 là


 Thí dụ :
 Tính dự báo E(y0) cho x0=6

 Phương sai của dự báo là

 Từ
 Sai số tiêu chuẩn của dự báo:

 Khoảng tin cậy 90% cho E(y0) với x0=6 là


 ĐƠN VỊ ĐO LƢỜNG TRONG PHÂN TÍCH
HỒI QUY
 Các biến số trong mô hình hồi quy thường gắn
với đơn vị đo lường, chẳng hạn GDP của Việt
Nam có thể được đo bằng tỷ USD hoặc tỷ đồng
Việt Nam; năng suất lúa có thể được đo bằng
tấn/hecta hay kg/hecta. Từ công thức tính ước
lượng tham số ta biết rằng khi sử dụng các đơn
vị đo lường khác nhau thì giá trị của các biến số
sẽ thay đổi; nếu sử dụng đơn vị là tấn/hecta
chẳng hạn thì giá trị của biến số sẽ nhỏ đi 1000
lần so với khi sử dụng đơn vị kg/hecta.
 Vậy một câu hỏi đặt ra là việc sử dụng các đơn
vị đo lường khác nhau thì có ảnh hưởng như thế
nào tới kết quả ước lượng và kết luận trong
phân tích hồi quy?
 Chúng ta sẽ xem xét một số tình huống cơ bản
dưới đây.
 Khi thay đổi đơn vị đo lường của biến đốc lập:
Chẳng hạn thay đổi đơn vị đo lường của X bằng
cách gia tăng 10 lần, như từ kg sang yến, thì giá
trị của biến X sẽ giảm đi 10 lần và khi đó từ
công thức tính hệ số ước lượng ta thấy:
 Hệ số sẽ tăng lên 10 lần (về độ lớn), như vậy
ý nghĩa của hệ số này thực tế vẫn là không thay
đổi.
 Hệ số không đổi
 Do đó các giá trị ( i= 1-n) không đổi
 Do đó sai số chuẩn của các ước lượng sẽ tăng
lên 10 lần, do đó quan hệ tương đối giữa và
se ( ) là không thay đổi
 do đó cũng không thay đổi

 Khi cả biến độc lập và biến phụ thuộc đều thay
đổi đơn vị đo lương với cùng một tỷ lệ.
 Nếu cả biến độc lập và biến phụ thuộc đều thay
đổi đơn vị đo lường theo cùng một tỷ lệ, chẳng
hạn gia tăng 10 lần, khi đó các giá trị X và Y
đều bị giảm đi 10 lần, và do đó có:
 Hệ số sẽ không đổi; Hệ số giảm đi 10 lần
 Các đại lượng ( i= 1-n) đều giảm 10
lần. Các đại lượng này giảm về con số, nhưng
lại tăng về đơn vị đo lường, nên về thực chất nó
vẫn không thay đổi về mặt ý nghĩa.
 không đổi
 Người đọc có thể suy luận tương tự cho trường
hợp đơn vị đo lường của biến độc lập và biến
 phụ thuộc thay đổi theo các tỷ lệ khác nhau.
 Nhận xét : Từ các kết quả trên cho thấy rằng:
 (i) Khi thay đổi đơn vị đo lường, độ lớn của các
hệ số ước lượng nói chung sẽ thay đổi. Điều
này nhăc nhở chúng ta một điều rằng, khi nói
về các độ lớn của hệ số ước lượng nếu không
gắn với đơn vị đo lường của các biến số trong
mô hình thì dể đưa đến những cảm nhận sai
lệch.
 (ii) Tuy độ lớn của các hệ số có thể thay đổi khi
thay đổi đơn vị đo lường của các biến số,
 nhưng ý nghĩa của các con số này vẫn không
thay đổi. Do phân tích hồi quy quan tâm đến ý
nghĩa của các hệ số chứ không phải độ lớn của
các hệ số này, nên có thể nói phân tích hồi quy
không bị tác động của đơn vị đo lường.
 Hệ số chặn và mô hình hồi quy
 Trong các phần trình bày ở trên, các mô hình
đều có chứa hệ số chặn mặc dù nó không thể
hiện tác động của biến X lên biến Y. Như ta
biết ý nghĩa của hệ số chặn, rằng hệ số này
bằng giá trị trung bình của biến Y khi X bằng 0.
 Tuy nhiên có những tình huống cách giải thích
này là không phù hợp, và cũng có những tình
huống mô hình không chứa hệ số chặn. Phần này
chúng ta sẽ làm rõ hơn ý nghĩa của hệ số chặn
trong mô hình hồi quy cũng như tác động của
việc không sử dụng hệ số chặn trong mô hình.
 Để xem xét ý nghĩa của hệ số chặn trong mô
hình hồi quy ta xét thí dụ sau:
 Giả sử có hàm hồi quy mẫu về mối quan hệ giũa
số năm kinh nghiệm X (năm) và mức thu nhập
của người lao động Y ( triệu đồng/tháng? Trong
ngành chế biến thực phẩm.
 Khi đó việc diễn giải ý nghĩa của
hệ số chặn là khá đơn giản: Khi số năm kinh
nghiệm bằng 0 – nghĩa là người vừa mới bắt
đầu làm việc- thì mức thu nhập trung bình của
người lao động là 3 triệu/tháng.
 Một thí dụ khác , chẳng hạn xét hàm hồi quy
mẫu về mối quan hệ giữa giá vàng (P) cầu về
vàng và cầu về vàng (Q): .
 Kết quả ước lượng này cho phép giải thích rằng
cầu về vàng là 2.71828 đơn vị khi giá vàng
bằng 1.
 Ta xét về hàm hồi quy mẫu về số khách (Y,
trăm người) đi du lịch trong các kỳ nghỉ phụ
thuộc vào thu nhập của họ (X):
 Khi đó việc diễn giải ý nghĩa của hệ số chặn
tương tự như trong ví dụ trên là hoàn toàn vô
nghĩa: số khách đi du lịch trong kỳ nghỉ không
thể bằng 0.
 Tóm lại ý nghĩa của hệ số chặn: Hệ số chặn
có ý nghĩa như được trình bày ở trên chỉ khi
biến độc lập có nhận giá trị 0. Nói chung trong
phân tích hồi quy, chúng ta không quan tâm
nhiều đến ý nghĩa của hệ số chặn
 Tuy nhiên hệ số chặn không có ý nghĩa thực tế trong
các mô hình trên, nhưng việc đưa nó vào mô hình lại
là cần thiết về mặt kỹ thuật với các lý do sau đây.
 (i).Giúp xác định đúng bản chất của mối quan hệ
giữa biến độc lập và biến phụ thuộc: Nếu không có
hệ số này thì kỳ vọng của biến phụ thuộc là tỷ lệ với
biến độc lập, điều này rất hiếm khi xảy ra trong thực
tế.
 (ii).Nó giúp làm giảm nhẹ mức độ chặt của giả thiết
2
 (iii).Nó đảm bảo cho ý nghĩa của hệ số xác định, như
được chỉ ra trong mục tiếp theo.
 Mô hình hồi quy không có hệ số chặn
 Trong một số trường hợp chúng ta biết chắc chắn rằng
trung bình của biến phụ thuộc sẽ bằng o khi biến độc lập
bằng 0, chẳng hạn khi Y là tổng thuế thu từ nhập khẩu ô
tô, và X là mức thuế nhập khẩu ô tô. Hoặc khi hồi quy y
, theo x thay vì hồi quy Y theo X. Trong những tình
huống này chúng ta có thể xem xét sử dụng mô hình hồi
quy không có hệ số chặn.
 Tuy nhiên khi này hệ số xác định R2 được tính tho công
thức trên có thể sẽ không nhận giá trị trong khoảng nữa.
Ta có thể lý giải một cách đơn giản như sau : nếu không
có hệ số chắn thì khi đó chúng ta không thu được biểu
thức , khi đó không có gì đảm bảo
 BÀI TẬP CHƢƠNG II
 Bài 2.1 Định nghĩa các thuật ngữ sau:
 (i). Mô hình kinh tế
 (ii). Mô hình thống kê
 (iii) Mô hình kinh tế lượng
 (iv) Nguyên tắc bình phương nhỏ nhất
 Phương pháp ước lượng bình phương nhỏ nhất
 (v) Ước lượng bình phương nhỏ nhất
 Bài 2.2 Hãy giải thích các khái niệm sau đây:
 Hàm hồi quy tổng thể và hàm hồi quy mẫu.
 Yếu tố ngẫu nhiên và phần dư.
 Các hệ số hồi quy, ước lượng của các hệ số hồi
quy.
 Tự tương quan.
 Phương sai của sai số đồng đều.
 Hàm hồi quy tuyến tính.
 Bài 2.3 Cho các mô hình sau đây, mô hình nào
tuyến tính với các tham số, mô hình nào tuyến
tính đối với các biến số, mô hình nào tuyến tính
đối với cả tham số và biến số? Mô hình nào là
mô hình hồi quy tuyến tính?

 Bài 2.4 Các mô hình sau đây có phải là mô
hình hồi quy tuyến tính theo tham số không? Vì
sao?
 Bài 2.5 Trong mô hình .
 Nếu ta nhân mỗi Xi với một hằng số, chẳng hạn
10, khi đó các phần dư e và các giá trị sẽ
thay đổi? Hãy giải thích?
 Nếu ta cộng mỗi với một hằng số thì các e và
các giá trị sẽ thay đổi không?
 Bài 2.6 Bảng sau đây cho cặp biến phụ thuộc
và độc lập. Trong mỗi trường hợp hãy cho biết
quan hệ giữa hai biến là: cùng chiều, ngược
chiều hay không xác định. Hãy giải thích?

Biến phụ thuộc Biến độc lập

1 GDP Lãi suất

2 Tiết kiệm cá Lãi suất


nhân

3 Cầu tiền GDP

4 Sản lƣợng Lao động

5 Lƣợng cầu xe Giá xăng


máy

6 Lƣợng điện tiêu Giá ga


thụ của hộ gia
đình
 Bài 2.7
 Cho mô hình
 a. Chứng minh công thức xác định trong
mô hình có dạng:

 b. Chứng minh
 c. Chứng minh
 d. Chứng minh là ước lượng tuyến tính
không chệch của
 e. là ước lượng không chệch của .
. Thí dụ TD2.1: giả sử ta có số liệu về chi phí quảng
cáo (X) trên 1 tuần và doanh thu bán hàng (Y) ở bảng
sau:
Bảng 2.1. Chi phí quảng cáo và doanh thu bán hàng

Thán 1 2 3 4 5 6 7 8 9 10
g
chi 10 7 10 5 8 8 6 7 9 10
phi
quảng
cáo
(X)
Doan 11 10 12 6 10 7 9 10 11 10
h thu
(Y)
 (i). Sử dụng phương pháp bình phương nhỏ
nhất để ước lượng các tham số của hàm hồi quy
mẫu dạng tuyến tính và dạng loga
 (ii) Sử dụng kiểm định t để kiểm định xem các
hệ số hồi quy có ý nghĩa thống kê không (với
mức ý nghĩa 5%)?
 (iii) Kiểm định giả thiết H0 rằng phương sai
bằng 2
 (iv) Tính khoảng tin cậy 95% cho các tham số
của tổng thể.
 (iv) Phân tích phương sai

You might also like