Professional Documents
Culture Documents
Mô Hình Hồi Quy Đơn, Ƣớc Lƣợng Và Kiểm Định Giả Thiết
Mô Hình Hồi Quy Đơn, Ƣớc Lƣợng Và Kiểm Định Giả Thiết
E (Y / X i ) f ( X i ) 1 2 X i
Các 1 và 2 là các tham số cố định chưa biết.
Trong đó 1 được gọi là hệ số chặn, 2 là là hệ
số độ dốc của hàm hồi quy. Mô hình (2) được
gọi là mô hình hồi quy tổng thể dạng tuyến
tính.
Lưu ý rằng thuật ngữ tuyến tính ở đây ngụ ý là
tuyến tính theo tham số (giải thích).
Một vấn đề cần làm rõ ở đây là E (Y / X X i ) chỉ
cho biết mức chi tiêu trung bình của hộ có thu
nhập Xi, nhưng các hộ gia đình cụ thể thì không
nhất thiết giống nhau.
Chẳng hạn, cùng mức thu nhập 8 triệu đồng/
tháng, nhưng có hộ chi tiêu 1 triệu, có hộ chi
tiêu 0,8 triệu, cũng có hộ chi tiêu 2 triệu,
nghĩa là chi tiêu của mỗi hộ, nói chung
không đúng bằng Xi, mà giá trị này dao động
quanh giá trị trung bình của nó.
Do vậy chúng ta có thể biểu diễn độ lệch của
chi tiêu Yi quanh giá trị trung bình là:
ui Yi (1 2 X i ) hay Yi 1 2 X i ui (3)
ui được gọi là nhiễu ngẫu nhiên.
2. Hồi quy mẫu
Trên đây, chúng ta đã nghiên cứu mối quan hệ
giữa thu nhập (X cố định) và chi tiêu (Y) của
của tất cả các hộ gia đình và chúng ta phải điều
tra toàn bộ các hộ gia đình ở Việt Nam để thu
được các dữ liệu cần thiết (tổng thể), với cơ sở
dữ liệu như vậy ta có được hàm hồi quy tổng
thể.
Nhưng một vấn đề đặt ra là nếu chúng ta muốn
nghiên cứu mối quan hệ đó thì chúng ta phải
tiến hành một cuộc điều tra với quy mô rất lớn,
nhiều khi điều này không thể thực hiện được vì
lý do tài chính và thời gian không cho phép. Để
khắc phục nhược điểm đó, người ta chỉ xem
xét mẫu của tổng thể đã cho và do đó nhiệm vụ
của chúng ta là phải ước lượng hàm hồi quy
tổng thể trên cơ sở mẫu quan sát.
Tương tự như đã làm với hồi quy tổng thể,
chúng ta cũng phát triển quan niệm về hàm hồi
quy mẫu (SRF) có dạng:
Yˆi ˆ1 ˆ2X i
. Yˆi là ước lượng của E (Y Xi; )
ˆ1 là ước lượng của 1 và
ˆ2 là ước lượng của 2.
Cũng giống như đã giải thích trong việc thiết
lập hồi quy tổng thể, chúng ta cũng có thể biểu
diễn hồi quy qua mẫu dưới dạng ngẫu nhiên của
nó, nghĩa là:
Yi ˆ1 ˆ2Xi ei
, trong đó ei ký hiệu là số hạng phần dư và được
coi như là ước lượng của ui.
Tóm lại từ mục đích nghiên cứu mối quan hệ
giữa chi tiêu cho tiêu dùng và thu nhập của các
hộ gia đình ở Việt Nam ta đã đi đến đòi hỏi ước
lượng hàm hồi quy tổng thể:
Yi E(Y Xi ) ui 1 2Xi ui
, trên cơ sở hồi quy mẫu:
Yi ˆ ˆX ei
1 2 i
3. Phƣơng pháp bình phƣơng nhỏ nhất
Phương pháp bình phương nhỏ nhất do nhà
toán học Đức Carl Friedrich Gauss đề xuất. Sử
dụng phương pháp này kèm theo một vài giả
thiết, các ước lượng thu được có tính đặc biệt.
Tư tưởng căn bản của phương pháp này là như
sau: Ước lượng hồi quy tổng thể trên cơ sở hồi
quy mẫu và số liệu mẫu. Vấn đề đặt ra là làm
thế nào để cho hồi quy mẫu ước lượng được
gần hồi quy tổng thể nhất.
Nội dung phương pháp bình phương nhỏ nhất :
Giả sử
E(Y Xi ) 1 2Xi
Yˆ ˆ ˆX
i 1 2 i
ˆ
là hồi quy mẫu ước lượng được. Trong đó : 1
và ˆ là giá trị ước lượng được của và
2 1 2
tương ứng; ei là sai số; Yˆi là giá trị ước lượng
của Yi.
Vấn đề là phải tìm . Giả sử rằng chúng ta có n
cặp quan sát của Y và X, Ta phải tìm sao cho
nó càng gần với giá trị thực của Yi có thể được,
nghĩa là càng nhỏ càng tốt.
Ta xem đồ thị sau đây:
Y SRF
e3
e1
.
e2
X
Do ei (i=1,2,...,n) có thể dương, có thể âm, do
vậy cần phải tìm Yˆ sao cho tổng bình phương
i
Đặt xi Xi X
yi Yi Y
n
Khi đó yi x i
ˆ i 1
2 n
2
xi
i 1
Thí dụ 1
Giả sử ta có số liệu về chi tiêu cho quảng cáo
(X) và doanh số bán ra của một công ty (Y)
trong 5 tháng:
Tháng 1 2 3 4 5
Y =3 4 2 6 8
X =1 2 3 4 5
Tính các tham số của mô hình
QS Yi Xi yi xi x2 xi yi
1 3 1 -1.6 -2 4 3.2
2 4 2 -0.6 -1 1 0.6
3 2 3 -2.6 0 0 0
4 6 4 1.4 1 1 1.4
5 8 5 3.4 2 4 6.8
15 4.6 3 10 12
E (Yi | Xi ) 1 2X i
.
PRF : Yi 1 2 X i
ui
X1 X2 X3
Giả thiết 2:
Phương sai của các nhiễu ui là không đổi.
2
Var (u | Xi ) Var (u | X j ) i j
có nghĩa là phân bố có điều kiện của Y với giá
trị đã cho của X có phương sai bằng nhau, các
giá trị cá biệt của Y xoay quanh giá trị trung
bình với phương sai như nhau.
f(u) Mật độ
X1
X2
X3
2
Var (u | X i ) Var (u | X i )
Phương sai sai số thay đổi
mËt ®é
. f(u)
X1
X2
X3
Giả thiết 3. Kéo theo phương sai có điều kiện
của Yi cũng thuần nhất. Nghĩa là
2
Var (Yi | Xi )
Giả thiết 4. Không có sự tương quan giữa các
ui, nghĩa là .
Cov(ui , u j ) 0, i j
Giả thiết 5. u và X không tương quan với nhau.
Cov (ui , Xi ) 0, i
Trong đó
2
Var (ui )
Se là sai số tiêu chuẩn: xi Xi X
Trong các công thức ở trên 2 chưa biết,
được ước lượng bằng ước lượng không chệch
của nó n
ei2
ˆ2 i 1
n 2
là là sai số tiêu chuẩn của đường hồi quy. Nó
chính là độ lệch chuẩn các giá trị Y quanh
đường hồi quy mẫu.
Các tính chất của các ước lượng bình phương
nhỏ nhất được thể hiện qua định lý sau đây:
Thí dụ: Tính sai số tiêu chuẩn từ thí dụ
1
Thủ tục
1. Tính ei2 và ei2/(n-2)
2. Thế RSS/(n-2) cho 2
3. Lấy căn bậc hai (2).
Ta có bảng sau:
Sai số tiêu chuẩn của ƣớc lƣợng bình
phƣơng nhỏ nhất
Qs Y X y x x2 xy e2 X2
3 2 3 -2.6 0 0 0 6.8 9
4 6 4 1.4 1 1 1.4 0 16
5 8 5 3.4 2 4 6.8 1 25
vì ˆx
yˆi 2 i
n n n
yi2 ˆ2 x i2 ei2
i 1
2
i 1 i 1
Ký hiệu: n n
2 2
TSS yi (Yi Y )
i 1 i 1
TSS là tổng bình phương của tất cả các sai lệch
giữa các giá trị quan sát Yi với giá trị trung
bình của chúng.
n n n n
ESS (Yˆi Yˆ)2 (Yˆi Y )2 yˆi2 ˆ2
2 x i2
i 1 i 1 i 1 i 1
ESS là tổng bình phương của tất cả các sai lệch
giữa các giá trị của biến phụ thuộc Y nhận được
từ hàm hồi quy mẫu với giá trị trung bình của
chúng (Yˆ Y)
, nó đo độ chính xác của hàm hồi quy.
n n
RSS ei2 (Yi Yˆi )2
i 1 i 1
, RSS là tổng bình phương của tất cả các sai
lệch giữa các giá trị quan sát Y và các giá trị
nhận được từ hàm hồi quy.
Về mặt hình học có thể minh họa như trên hình
1.5.
Hình 1.5. Phân rã phƣơng sai của Yi
thành 2 thành phần TSS = ESS + RSS
Y
ei: do phần dư
.
Yi Y = tổng
biến thiên
0
TSS được chia thành hai phần: một phần ESS
do đường hồi quy mẫu gây ra và phần của RSS
do các yếu tố ngẫu nhiên gây ra.
n n
(Yˆi Y )2 ei2
ESS RSS i 1 i 1
1
TSS TSS n n
(Yi Y )2 (Yi Y )2
i 1 i 1
3 2 3 -2.6 6.76 0 0 0
4.6 3 23.2 10 12
Các tính chất của hệ số tương quan r.
1. r có thể âm hoặc dương, dấu của r phụ thuọc
vào dấu của tỷ số, đó chính là dấu của Cov (X,
Y). Nếu r>0 Xi và Yi tương quan cùng chiều
2. -1 r 1
3. r có tính chất đối xứng r(X, Y) = r (Y, X)
4. Nếu X*=aX +cY*=bY+d, với a, b, c, d là các
hằng số và a, b >0 thì r(X*,Y*)=r(X,Y)
5. Nếu X, Y độc lập với nhau thì r (Y, X)=0;
Điều ngược lại không đúng.
6. r đo sự phụ thuộc tuyến tính. Nhưng không
có ý nghĩa trong việc định rõ tính chất các quan
hệ phi tuyến.
7. r đo độ phụ thuộc tuyến tính giữa X và Y,
nhưng không đòi hỏi X, Y có mối quan hệ nhân
quả.
8. r2 cũng có thể tính bằng công thức:
2 2
n n
(Yi Y )(Yˆi Y) yiyˆi
2 i 1 i 1
r
n n n n
(Yi Y )2 (Yˆi Y )2 yi2 yˆi2
i 1 i 1 i 1 i 1
TÓM TẮT 1
. n
x i yi
ˆ Y i 1
1 2X , 2 n
x i2
i 1
n n
Xi2 Xi2
i 1 2 i 1
Var ( 1) n ; se ( 1) n
xi2 n xi2
i 1 i 1
.
2
Var ( 2 ) ; se ( 2 )
n n
2
xi x i2
i 1 i 1
n n
ei2 ei2
ˆ2 i 1
;ˆ i 1
n 2 (n 2)
VI. PHÂN BỐ XÁC SUẤT CỦA ˆ , ˆ
1 2
Phần trên chúng ta đã trình bày các ước lượng
điểm của và thu được bằng phương pháp bình
phương nhỏ nhất. Với các giả thiết cơ bản:
E (ui ) 0
2
Var (ui )
Cov(ui , u j ) 0( j)
thì là các ước lượng tuyến tính không
chệch có phương sai nhỏ nhất của 1 và 2
tương ứng. Mục đích của phân tích hồi quy
không phải chỉ là suy đoán về 1 và 2 hay
PRE mà còn phải kiểm tra bản chất của sự phụ
thuộc, còn phải thực các dự đoán khác.
Do vậy cần phải biết phân bố xác suất của 1
và 2 . Các nhân tố này phụ thuộc vào phân bố
của các ui.
Bây giờ chúng ta bổ sung vào các giả thiết trên
giả thiết sau đây: N (0, 2 )
Giả thiết 7. ui có phân bố
Với các giả thiết trên,
ˆ cácˆước lượng
2 bình
phương nhỏ nhất 1 và 2 và ˆ có các tính
chất sau đây:
1. Chúng là các ước lượng không chệch.
2. Có phương sai cực tiểu.
3. Khi số quan sát đủ lớn thì các ước lượng này
xấp xỉ với giá trị thực của phân bố.
4. ˆ1
2
N ( 1, ˆ) Từ tính chất này suy ra:
1
ˆ
1 1
Z N (0,1)
ˆ
1
2
5. (n 2) ˆ 2
(n 2)
2
Trong đó: n
Xi2 2
2 i 1 2 2
ˆ n
; ˆ n
1 2
n x i2 x i2
i 1 i 1
Do đó, có thể tìm khoảng tin cậy, kiểm định giả
thiết cho các hệ số hồi quy và 2.
ˆ
1. Khoảng tin cậy của 1 t 1
t(n 2)
se ( ˆ )1
Có thể đưa ra giả thiết về giá trị thực của 2,
chẳng hạn giả thiết H0: 2 = 2*.
Nếu giả thiết này đúng thì:
ˆ2 *
2
t t(n 2)
se( ˆ2 )
Bảng :Kiểm định giả thiết về 2
Loại giả thiết Giả thiết H0 Giả thiết đối Miền bác bỏ
H1
2= 2* 2# 2*
Hai phía
| t | t /2 (n 2)
2 2* 2 > 2*
Phía phải
t t (n 2)
2 2* 2 < 2*
Phía trái t t (n 2)
Nếu như đưa ra giả thiết 2= 2*=0 nghĩa là ta
đưa ra giả thiết về biến độc lập X không ảnh
hưởng đến biến phụ thuộc Y. Thì khi đó t được
tính bằng công thức:
ˆ
2
t
se( ˆ2 )
Thí dụ thực hành: Tính khoảng tin cậy 95% cho
2 và kiểm định giả thiết H0: 2=0.
5. Khoảng tin 2cậy đối với 2
2 ˆ 2
Ta có (n 2) (n 2)
2
hay (n 2) ˆ2 2 (n 2) ˆ2
P 1
2 2
/2 (n 2) 1 /2 (n 2)
6. Kiểm định giả thiết đối với 2
Nội dung của kiểm định giả thiết đối với 2 có thể
trình bày trong bảng sau:
2= 20 2# 20
Hai phía
2= 20 2> 20
Phía phải
2= 20 2< 20
Phía trái
7. Phân tích phƣơng sai.
7.1. Định nghĩa.
Phân tích phương sai trong hồi quy là việc phân
rã phương sai (TSS) của biến phụ thuộc thành
hai phần, mỗi phần gây ra bởi biến giải thích
(ESS) và phần còn lại gây ra bởi số hạng sai số
(RSS).
Phần gây ra do số hạng sai số gọi là phần không
giải thích được, phần gây ra do biến giải thích
gọi là phần giải thích được.
Bảng 1.3. Phân tích phƣơng sai cho mô
hình hồi quy hai biến
Nguồn biến Tổng bình Bậc tự do Phƣơng sai
thiên phƣơng
n n
Do hồi quy ˆ2
2 x i2 1 ˆ2 x i2 / 1
(ESS) 2
i 1 i 1
n n
Do phần dƣ
e12 n-2 ei2 / (n 2)
(RSS)
i 1 i 1
n
TSS yi2 n-1
i 1
8. DỰ BÁO
Mục đích của phân tích hồi quy là dự báo và đề
xuất chính sách.
Ở đây ta sẽ trình bày phương pháp sử dụng hồi
quy ước lượng được để dự báo như sau:
Có hai loại dự báo trên hàm hồi quy.
- Đó là dự báo giá trị trung bình và
- dự báo riêng.
(a) Dự báo giá trị trung bình:
Giả sử cho trước giá trị của biến ngoại sinh: X=X0,
yêu cầu dự báo cho E(Y | X )
0
Yˆ0 có phân bố chuẩn với kỳ vọng là 1 2X0
và phương sai là:
1 (X 0 X )2
var(Yˆ0 ) 2
n n
x i2
i 1
Từ
Sai số tiêu chuẩn của dự báo:
Từ
Sai số tiêu chuẩn của dự báo:
Khi cả biến độc lập và biến phụ thuộc đều thay
đổi đơn vị đo lương với cùng một tỷ lệ.
Nếu cả biến độc lập và biến phụ thuộc đều thay
đổi đơn vị đo lường theo cùng một tỷ lệ, chẳng
hạn gia tăng 10 lần, khi đó các giá trị X và Y
đều bị giảm đi 10 lần, và do đó có:
Hệ số sẽ không đổi; Hệ số giảm đi 10 lần
Các đại lượng ( i= 1-n) đều giảm 10
lần. Các đại lượng này giảm về con số, nhưng
lại tăng về đơn vị đo lường, nên về thực chất nó
vẫn không thay đổi về mặt ý nghĩa.
không đổi
Người đọc có thể suy luận tương tự cho trường
hợp đơn vị đo lường của biến độc lập và biến
phụ thuộc thay đổi theo các tỷ lệ khác nhau.
Nhận xét : Từ các kết quả trên cho thấy rằng:
(i) Khi thay đổi đơn vị đo lường, độ lớn của các
hệ số ước lượng nói chung sẽ thay đổi. Điều
này nhăc nhở chúng ta một điều rằng, khi nói
về các độ lớn của hệ số ước lượng nếu không
gắn với đơn vị đo lường của các biến số trong
mô hình thì dể đưa đến những cảm nhận sai
lệch.
(ii) Tuy độ lớn của các hệ số có thể thay đổi khi
thay đổi đơn vị đo lường của các biến số,
nhưng ý nghĩa của các con số này vẫn không
thay đổi. Do phân tích hồi quy quan tâm đến ý
nghĩa của các hệ số chứ không phải độ lớn của
các hệ số này, nên có thể nói phân tích hồi quy
không bị tác động của đơn vị đo lường.
Hệ số chặn và mô hình hồi quy
Trong các phần trình bày ở trên, các mô hình
đều có chứa hệ số chặn mặc dù nó không thể
hiện tác động của biến X lên biến Y. Như ta
biết ý nghĩa của hệ số chặn, rằng hệ số này
bằng giá trị trung bình của biến Y khi X bằng 0.
Tuy nhiên có những tình huống cách giải thích
này là không phù hợp, và cũng có những tình
huống mô hình không chứa hệ số chặn. Phần này
chúng ta sẽ làm rõ hơn ý nghĩa của hệ số chặn
trong mô hình hồi quy cũng như tác động của
việc không sử dụng hệ số chặn trong mô hình.
Để xem xét ý nghĩa của hệ số chặn trong mô
hình hồi quy ta xét thí dụ sau:
Giả sử có hàm hồi quy mẫu về mối quan hệ giũa
số năm kinh nghiệm X (năm) và mức thu nhập
của người lao động Y ( triệu đồng/tháng? Trong
ngành chế biến thực phẩm.
Khi đó việc diễn giải ý nghĩa của
hệ số chặn là khá đơn giản: Khi số năm kinh
nghiệm bằng 0 – nghĩa là người vừa mới bắt
đầu làm việc- thì mức thu nhập trung bình của
người lao động là 3 triệu/tháng.
Một thí dụ khác , chẳng hạn xét hàm hồi quy
mẫu về mối quan hệ giữa giá vàng (P) cầu về
vàng và cầu về vàng (Q): .
Kết quả ước lượng này cho phép giải thích rằng
cầu về vàng là 2.71828 đơn vị khi giá vàng
bằng 1.
Ta xét về hàm hồi quy mẫu về số khách (Y,
trăm người) đi du lịch trong các kỳ nghỉ phụ
thuộc vào thu nhập của họ (X):
Khi đó việc diễn giải ý nghĩa của hệ số chặn
tương tự như trong ví dụ trên là hoàn toàn vô
nghĩa: số khách đi du lịch trong kỳ nghỉ không
thể bằng 0.
Tóm lại ý nghĩa của hệ số chặn: Hệ số chặn
có ý nghĩa như được trình bày ở trên chỉ khi
biến độc lập có nhận giá trị 0. Nói chung trong
phân tích hồi quy, chúng ta không quan tâm
nhiều đến ý nghĩa của hệ số chặn
Tuy nhiên hệ số chặn không có ý nghĩa thực tế trong
các mô hình trên, nhưng việc đưa nó vào mô hình lại
là cần thiết về mặt kỹ thuật với các lý do sau đây.
(i).Giúp xác định đúng bản chất của mối quan hệ
giữa biến độc lập và biến phụ thuộc: Nếu không có
hệ số này thì kỳ vọng của biến phụ thuộc là tỷ lệ với
biến độc lập, điều này rất hiếm khi xảy ra trong thực
tế.
(ii).Nó giúp làm giảm nhẹ mức độ chặt của giả thiết
2
(iii).Nó đảm bảo cho ý nghĩa của hệ số xác định, như
được chỉ ra trong mục tiếp theo.
Mô hình hồi quy không có hệ số chặn
Trong một số trường hợp chúng ta biết chắc chắn rằng
trung bình của biến phụ thuộc sẽ bằng o khi biến độc lập
bằng 0, chẳng hạn khi Y là tổng thuế thu từ nhập khẩu ô
tô, và X là mức thuế nhập khẩu ô tô. Hoặc khi hồi quy y
, theo x thay vì hồi quy Y theo X. Trong những tình
huống này chúng ta có thể xem xét sử dụng mô hình hồi
quy không có hệ số chặn.
Tuy nhiên khi này hệ số xác định R2 được tính tho công
thức trên có thể sẽ không nhận giá trị trong khoảng nữa.
Ta có thể lý giải một cách đơn giản như sau : nếu không
có hệ số chắn thì khi đó chúng ta không thu được biểu
thức , khi đó không có gì đảm bảo
BÀI TẬP CHƢƠNG II
Bài 2.1 Định nghĩa các thuật ngữ sau:
(i). Mô hình kinh tế
(ii). Mô hình thống kê
(iii) Mô hình kinh tế lượng
(iv) Nguyên tắc bình phương nhỏ nhất
Phương pháp ước lượng bình phương nhỏ nhất
(v) Ước lượng bình phương nhỏ nhất
Bài 2.2 Hãy giải thích các khái niệm sau đây:
Hàm hồi quy tổng thể và hàm hồi quy mẫu.
Yếu tố ngẫu nhiên và phần dư.
Các hệ số hồi quy, ước lượng của các hệ số hồi
quy.
Tự tương quan.
Phương sai của sai số đồng đều.
Hàm hồi quy tuyến tính.
Bài 2.3 Cho các mô hình sau đây, mô hình nào
tuyến tính với các tham số, mô hình nào tuyến
tính đối với các biến số, mô hình nào tuyến tính
đối với cả tham số và biến số? Mô hình nào là
mô hình hồi quy tuyến tính?
Bài 2.4 Các mô hình sau đây có phải là mô
hình hồi quy tuyến tính theo tham số không? Vì
sao?
Bài 2.5 Trong mô hình .
Nếu ta nhân mỗi Xi với một hằng số, chẳng hạn
10, khi đó các phần dư e và các giá trị sẽ
thay đổi? Hãy giải thích?
Nếu ta cộng mỗi với một hằng số thì các e và
các giá trị sẽ thay đổi không?
Bài 2.6 Bảng sau đây cho cặp biến phụ thuộc
và độc lập. Trong mỗi trường hợp hãy cho biết
quan hệ giữa hai biến là: cùng chiều, ngược
chiều hay không xác định. Hãy giải thích?
Biến phụ thuộc Biến độc lập
b. Chứng minh
c. Chứng minh
d. Chứng minh là ước lượng tuyến tính
không chệch của
e. là ước lượng không chệch của .
. Thí dụ TD2.1: giả sử ta có số liệu về chi phí quảng
cáo (X) trên 1 tuần và doanh thu bán hàng (Y) ở bảng
sau:
Bảng 2.1. Chi phí quảng cáo và doanh thu bán hàng
Thán 1 2 3 4 5 6 7 8 9 10
g
chi 10 7 10 5 8 8 6 7 9 10
phi
quảng
cáo
(X)
Doan 11 10 12 6 10 7 9 10 11 10
h thu
(Y)
(i). Sử dụng phương pháp bình phương nhỏ
nhất để ước lượng các tham số của hàm hồi quy
mẫu dạng tuyến tính và dạng loga
(ii) Sử dụng kiểm định t để kiểm định xem các
hệ số hồi quy có ý nghĩa thống kê không (với
mức ý nghĩa 5%)?
(iii) Kiểm định giả thiết H0 rằng phương sai
bằng 2
(iv) Tính khoảng tin cậy 95% cho các tham số
của tổng thể.
(iv) Phân tích phương sai