Professional Documents
Culture Documents
BT KTL - 2
BT KTL - 2
BT KTL - 2
Để nghiên cứu các yếu tố ảnh hưởng đến chi tiêu của các hộ gia đình ở thành phố Hồ Chí Minh, tiến
hành thu thập một mẫu như sau:
Y 12 15 18 22 23 25 30 31 36 38
X2 16 20 24 28 32 36 40 44 48 52
X3 3 4 5 6 5 5 7 6 8 8
X4 400 600 750 870 1070 1250 1430 1650 1800 2000
Z 1 1 0 1 0 0 1 0 1 0
Trong đó:
Y là chi tiêu (triệu đồng/tháng), và X2 là thu nhập (triệu đồng /tháng), X3 là số thành viên, X4 là tài sản
của hộ gia đình (triệu đồng); D là khu vực sống của hộ gia đình. D=1 nếu hộ gia đình ở nội thành, D=0
nếu hộ gia đình ở ngoại thành.
Chương 1. Mô hình hồi quy đơn
Với Mô hình 1, trả lời câu hỏi 1-3
1. Viết hàm hồi quy tổng thể Y theo X2 (Mô hình 1). Giải thích các hệ số hồi quy trong mô hình hồi
quy tổng thể.
2. Với mẫu trên, ước lượng hàm hồi quy tuyến tính mẫu Y theo X2. Nêu ý nghĩa ước lượng của các
hệ số hồi quy. Các giá trị đó có phù hợp với lý thuyết kinh tế hay không?
3. Tính và nêu ý nghĩa của hệ số xác định của mô hình hồi quy mẫu.
4. Viết mô hình hồi quy tổng thể, mô hình hồi quy mẫu. Giải thích ý nghĩa kết quả ước lượng. Giải
thích ý nghĩa hệ số xác định của mô hình hồi quy.
5. Tìm tổng bình phương phần dư (RSS), sai số chuẩn của hàm hồi quy và nêu ý nghĩa của giá trị sai
số chuẩn của hàm hồi quy.
6. Từ các kết quả hồi quy mô hình tuyến tính chi tiêu theo thu nhập của hộ gia đình dạng Log-log,
Log-lin. Nêu ý nghĩa của các hệ số tương ứng với mỗi mô hình.
1
Mô hình 3
Dependent Variable: LOG(Y)
Method: Least Squares
Sample: 1 10
Included observations: 10
7. Từ mô hình 2 và mô hình 3, hãy tìm ước lượng điểm của Chi tiêu khi hộ gia đình có mức Thu
nhập là 25 triệu đồng/tháng, 3 thành viên và tổng tài sản là 700 triệu đồng .
Chương 3. Suy diễn thống kê
Với Mô hình 2 trả lời câu hỏi 8-15.
8. Với độ tin cậy 95%, khi thu nhập của hộ gia đình tăng 1 triệu đồng/tháng thì chi tiêu trung bình
thay đổi trong khoảng nào?
9. Với độ tin cậy 90%, khi thu nhập của hộ gia đình tăng 500 ngàn đồng/tháng, hộ bớt đi một người
thì chi tiêu trung bình thay đổi trong khoảng nào?
10. Với mức ý nghĩa 5%, có thể cho rằng khi thu nhập tăng 1 triệu đồng/tháng thì chi tiêu trung bình
tăng hơn 500 ngàn đồng/tháng hay không?
11. Với mức ý nghĩa 5%, khi thu nhập của hộ gia đình tăng 500 ngàn đồng/tháng, hộ bớt đi một người
thì chi tiêu trung bình có thay đổi không?
12. Với độ tin cậy 95%, tìm khoảng tin cậy cho phương sai của sai số ngẫu nhiên (nhiễu).
13. Kiểm định sự phù hợp của hàm hồi quy tuyến tính đó đối với tổng thể, với mức ý nghĩa 5%.
14. Từ kết quả hồi quy Mô hình 2, dùng kiểm định Wald để xem có nên thêm biến X3, X4 vào Mô
hình 1 hay không?
15. Dự báo chi tiêu trung bình khi thu nhập là 50 triệu đồng/tháng với độ tin cậy 90%.
16. Giải thích ý nghĩa các hệ số cuả hàm hồi quy mẫu.
17. Với mức ý nghĩa 5%, mô hình 5 có phù hợp với mẫu dữ liệu hay không?
18. Với độ tin cậy 90%, hãy ước lượng chênh lệch chi tiêu trung bình của hộ gia đình ở ngoại thành và
ở nội thành khi cùng mức thu nhập.
19. Với mức ý nghĩa 5%, có thể cho rằng khi cùng mức thu nhập hộ gia đình ở nội thành chi tiêu
nhiều hơn hộ gia đình ở ngoại thành không tới 1 triệu/tháng hay không?
20. Với độ tin cậy 90%, hãy ước lượng mức thay đổi của chi tiêu trung bình của hộ gia đình khi thu
nhập tăng 1 triệu đồng/tháng và không thay đổi chỗ ở.
21. Với mức ý nghĩa 5%, có thể cho rằng chi tiêu trung bình của hộ gia đình sẽ tăng 500 ngàn
đồng/tháng khi thu nhập tăng 1 triệu đồng/tháng và không thay đổi chỗ ở.
22. Nếu đặt Z=1 nếu hộ ở ngoại thành, Z=0 nếu hộ gia đình ở nội thành thì mô hình hồi quy mẫu như
thế nào?
23. Mô hình 1 hay mô hình 5 tốt hơn? Tại sao?
Với Mô hình 2 trả lời câu hỏi 24-27
24. Dự báo điểm cho mức chi tiêu trung bình của hộ gia đình có thu nhập 50 triệu/tháng.
25. Với mức ý nghĩa 5%, có thể cho rằng mô hình là phù hợp không?
26. Từ bảng ma trận hệ số tương quan giữa các biến độc lập có thể kết luận gì về Mô hình 2.
27. Hãy cho biết các Bảng 1- 6 dùng để làm gì? Kết luận như thế nào?
Bảng ma trận hệ số tương quan giữa các biến độc lập
X2 X3 X4
X2 1.000000 0.908280 0.998784
X3 0.908280 1.000000 0.900654
X4 0.998784 0.900654 1.000000
3
Bảng 1
Breusch-Godfrey Serial Correlation LM Test:
Bảng 2
Heteroskedasticity Test: White
Value df Probability
F-statistic 6.984697 (2, 4) 0.0496
Likelihood ratio 15.02376 2 0.0005
Bảng 4.
Redundant Variables Test
Equation: UNTITLED
Specification: Y C X2 X3 X4
Redundant Variables: X3 X4
Value df Probability
F-statistic 30.60307 (2, 6) 0.0007
Likelihood ratio 24.16005 2 0.0000
Bảng 5.
Omitted Variables Test
Equation: UNTITLED
Specification: Y C X2 X3 X4
Omitted Variables: Z
Value df Probability
t-statistic 2.975667 5 0.0310
F-statistic 8.854594 (1, 5) 0.0310
Likelihood ratio 10.19179 1 0.0014
4
Bảng 6
5
Series: Residuals
Sample 1 10
4 Observations 10
Mean 1.52e-15
3 Median 0.003001
Maximum 0.464937
Minimum -0.506422
2 Std. Dev. 0.261565
Skewness -0.159454
Kurtosis 3.212388
1
Jarque-Bera 0.061171
Probability 0.969878
0
-0.75 -0.50 -0.25 0.00 0.25 0.50
5
CHƯƠNG 1,2,3
Mọi ước lượng và kiểm định các bài tập dưới đây sử dụng mức ý nghĩa 𝛂=5%.
Bài tập 1
Cho QA là lượng bán (đơn vị: nghìn lít), PA là giá bán (đơn vị: nghìn đồng/lít) của hãng nước
giải khát A, thu được kết quả hồi quy như sau:
Bảng1
Dependent Variable: QA
Method: Least Squares
Included observations: 24
a. Viết hàm hồi quy tổng thể, hồi quy mẫu và giải thích ý nghĩa kết quả ước lượng.
b. Tìm một ước lượng điểm của lượng bán trung bình khi giá bán là 20 nghìn đồng/lít.
c. Lượng bán trung bình có thực sự phụ thuộc vào giá bán không?
d. Giảm giá có làm tăng lượng bán không?
e. Giá bán giảm một nghìn thì lượng bán trung bình thay đổi trong khoảng nào?
g. Có thể cho rằng giá tăng 1 nghìn thì lượng bán giảm nhiều hơn 50 nghìn lít hay không?
i. Hệ số xác định của mô hình bằng bao nhiêu, đại lượng đó có ý nghĩa như thế nào?
l. Dự báo khoảng cho giá trị trung bình của lượng bán khi giá bán là 18 nghìn/lít.
Bài tập 2
Cho Y là sản lượng, L là lượng lao động và kết quả hồi quy mô hình như sau
Bảng2
Dependent Variable: Y
Method: Least Squares
Sample: 1 20
Included observations: 20
a. Viết hàm hồi quy tổng thể, hồi quy mẫu; giải thích ý nghĩa các hệ số hồi quy mẫu, dấu của các ước
lượng hệ số có phù hợp với lý thuyết kinh tế hay không?
b. Hệ số chặn của mô hình có ý nghĩa thống kê không? Nếu mức ý nghĩa còn 1% thì kết luận thế nào?
6
c. Biến sản lượng có phụ thuộc vào biến lao động không? Hãy giải thích ý nghĩa của hệ số xác định của
mô hình.
d. Theo kết quả này, khi thêm một đơn vị lao động thì sản lượng trung bình thay đổi trong khoảng nào?
Bài tập 3.
Cho QA là lượng bán (đơn vị: nghìn lít), PA là giá bán của hãng nước giải khát A; PB là giá bán của
hãng nước giải khát B cạnh tranh với hãng A (đơn vị: nghìn đồng/lít) và kết quả hồi quy mô hình như
sau:
Bảng 3
Dependent Variable: QA
Method: Least Squares
Included observations: 24
Cho hiệp phương sai ước lượng hai hệ số góc bằng -63.071
a. Viết hàm hồi quy tổng thể và hàm hồi quy mẫu. Giải thích ý nghĩa ước lượng các hệ số góc.
b. Khi giá hãng A tăng 1 nghìn, giá hãng B không đổi, ước lượng lượng thay đổi trung bình lượng bán
hãng A.
c. Khi giá hãng B tăng 1 nghìn, giá hãng A không đổi, ước lượng lượng thay đổi trung bình lượng bán
hang B.
d. Khi giá của hai hãng A và B cùng tăng 1 nghìn thì lượng bán trung bình của hãng A có thay đổi
không?
e. Nếu giá của hãng B tăng 1 nghìn, và hãng A giảm giá 1 nghìn, ước lượng lượng thay đổi trung bình
của lượng bán hãng A.
f. Biết rằng khi hồi quy QA theo PA và hệ số chặn thì hệ số xác định bằng 0,557 và tổng bình phương
phần dư bằng 873438,5; hãy nêu các cách để có thể kiểm định xem có nên bỏ biến PB ra khỏi mô
hình 3 hay không?
Bài tập 4.
Cho kết quả hồi quy với Y là sản lượng, K là vốn, L là lao động; LOG là logarit tự nhiên của các biến
tương ứng.
Bảng 4
Dependent Variable: LOG(Y)
Method: Least Squares
Sample: 1 20
Included observations: 20
Bài tập 5
Cho kết quả hồi quy, với QA là lượng bán (nghìn lít), PA là giá bán (nghìn đồng/lít) của hãng
nước giải khát A, H là biến nhận giá trị bằng 1 nếu quan sát vào mùa nóng, và H bằng 0 nếu quan sát
vào mùa lạnh.
Bảng 5
Dependent Variable: QA
Method: Least Squares
Included observations: 24
Cho hiệp phương sai ước lượng hai hệ số của PA và H*PA bằng: -32,89
a. Viết hàm hồi quy tổng thể, hồi quy mẫu cho hai mùa nóng và lạnh.
b. Tìm ước lượng điểm lượng bán của hãng khi giá bán là 15 nghìn vào hai mùa nóng và lạnh.
c. Hệ số chặn của mô hình có khác nhau giữa hai mùa không?
d. Hệ số góc có khác nhau giữa hai mùa không? Nếu có thì chênh lệch trong khoảng nào?
e. Vào mùa nóng, khi giảm giá một nghìn thì lượng bán tăng trong khoảng nào?
f. Đánh giá việc đưa yếu tố mùa nóng-lạnh vào mô hình, biết rằng mô hình hồi quy QA theo PA và hệ
số chặn thì hệ số xác định bằng 0,557 và tổng bình phương phần dư bằng 873438,5.
8
g. Có ý kiến cho rằng từ đầu năm 2006 về sau, do bị cạnh tranh mạnh nên yếu tố giá cả có tác động
đến lượng bán mạnh hơn so với trước đó. Hãy nêu cách xây dựng mô hình để có thể kiểm tra và
đánh giá về ý kiến đó.
Bài tập 6
Cho kết quả hồi quy sau, với QA là lượng bán của hãng nước giải khát A, PA là giá của hãng A,
PB là giá của hãng B, QB là lượng bán của hãng B.
Bảng 6
Dependent Variable: QA
Method: Least Squares
Included observations: 24
R-squared MeaMMem
0.664147 Mean dependent var 923.5833
Adjusted R-squared 0.613769 F-statistic 13.18329
Sum squared resid 2.442813 Prob(F-statistic) 0.000056
a. Viết hàm hồi quy mẫu. So sánh với Bảng 3, nhận xét gì về dấu và giá trị của các ước lượng.
b. Có nhận xét gì về ý nghĩa thống kê của biến PB, so sánh với Bảng 3.
c. Nếu mô hình ở Bảng 6 có VIF(QB) = 2500, mô hình có thể mắc khuyết tật gì?
d. Cho hai kết quả hồi quy phụ sau trên cùng bộ số liệu, hãy cho biết hai kết quả đó dùng để làm gì, và
có kết luận gì về hiện tượng đa cộng tuyến của mô hình ở bảng 6?
Bảng 6A
Dependent Variable: PA
Included observations: 24
R-squared MeaMMem
0.134873 F-statistic 1.636949
Durbin-Watson stat 0.292773 Prob(F-statistic) 0.218443
Bảng 6B
Dependent Variable: QB
Included observations: 24
e. Mô hình QA phụ thuộc PA, PB, QB và hệ số chặn có hiện tượng đa cộng tuyến cao không? Đa
cộng tuyến này là hoàn hảo hay không hoàn hảo? Nếu có, hãy nêu một cách khắc phục đơn giản hiện
tượng đa cộng tuyến trong câu trên.
f. Khi bỏ biến QB khỏi mô hình Bảng 6, hồi quy QA theo PA, PB và hệ số chặn (mô hình Bảng 3)
thì mô hình này có chắc chắn khắc phục được hiện tượng đa cộng tuyến cao không? Nếu không, hãy
nêu một cách kiểm định có thể sử dụng.
g . Sử dụng ma trận hệ số tương quan của các biến độc lập có thể phát hiện được hiện tượng đa cộng
tuyến cao trong mô hình hay không? Phương pháp này có thể thay thế cho phương pháp tính toán
nhân tử phóng đại phương sai trong việc phát hiện đa cộng tuyến cao không?
Bài tập 7
Cho kết quả hồi quy với Y là sản lượng, L là lượng lao động, K là lượng vốn
Bảng 7
Dependent Variable: Y
Included observations: 20
R-squared MeaMMem
0.905040 Prob(F-statistic) 0.000000
a. Với phần dư thu được của mô hình ban đầu kí hiệu là RESID, hãy viết mô hình hồi quy phụ
trong mô hình Bảng 7A và cho biết ý nghĩa của kết quả đó.
Bảng 7A
White Heteroskedasticity Test – Cross terms
Test Equation:
Dependent Variable: RESID^2
Included observations: 20
Bảng 7B
White Heteroskedasticity Test – No Cross terms
c. Cho biết kết quả hồi quy dưới đây dùng để làm gì, có kết luận gì về mô hình gốc ban đầu, biết
RESID là phần dư và ABS là hàm lấy giá trị tuyệt đối.
Bảng 7C
Dependent Variable: ABS(RESID)
Included observations: 20
d. Khi hồi quy ln của bình phương phần dư e theo ln của biến K, có hệ số chặn, thì hệ số xác định
của mô hình này bằng 0,105. Hãy cho biết kết quả đó dùng để làm gì, có kết luận gì?
e. Hồi quy bình phương phần dư e theo bình phương giá trị ước lượng của biến phụ thuộc trong mô
hình gốc, có hệ số chặn, thì thu được ước lượng điểm hệ số góc bằng 0,852 và sai số chuẩn tương ứng
bằng 0,126. Hãy cho biết kết quả đó dùng để làm gì, dựa trên giả thiết nào, có kết luận gì thu được về
mô hình gốc.
f. Dựa trên kết luận ở câu trên, hãy nêu một cách khắc phục hiện tượng phát hiện được.
g. Hồi quy bình phương của e theo bình phương của L, có hệ số chặn, thì hệ số xác định bằng
0,722. Kết quả đó dùng để làm gì, có kết luận gì?
h. Cho kết quả sau đây, cho biết kết quả đó dùng để làm gì và đã đạt mục đích chưa?
Bảng 7D
Dependent Variable: Y/L
R-squared MeaMMem
0.672855 Prob(F-statistic) 0.000075
i. Với kết quả trên, viết lại mô hình với các biến Y, L, K. Khi đó nếu lao động tăng một đơn vị thì
sản lượng tăng trong khoảng nào, với độ tin cậy 95%.
j. Với kết quả dưới đây, viết hồi quy phụ của kiểm định, thực hiện kiểm định và kết luận về ước
lượng thu được.
11
Bảng 7E
Dependent Variable: LOG(Y)
Included observations: 20
R-squared MeaMMem
0.910215 Prob(F-statistic) 0.000000
F-statistic 1.779605 Probability
Obs*R-squared 7.771870 Probability
k. Với RESID và FITTED là giá trị ước lượng biến phụ thuộc thu được từ Bảng 7E, được kết quả
hồi quy Bảng 7F. Hãy cho biết kết quả đó dùng để làm gì, kết luận gì về mô hình Bảng 7E?
Bảng 7F
Dependent Variable: RESID^2
R-squared MeaMMem
0.024853 Mean dependent var
Durbin-Watson stat 2.202629 Prob(F-statistic)
Bảng 8A
Dependent Variable: QA
Included observations: 24
a. Dùng kiểm định Durbin-Watson để kiểm định về hiện tượng tự tương quan bậc 1 của mô hình.
12
b. Cho kết quả kiểm định tự tương quan bậc nhất – AR(1) – dưới đây. Hãy viết mô hình hồi quy
phụ để kiểm định và kết luận.
Bảng 8B
Breusch-Godfrey Serial Correlation LM Test-AR(1)
Test Equation:
Dependent Variable: RESID
Presample missing value lagged residuals set to zero
Variable Coefficient Std. Error t-Statistic Prob.
c. Cho kết quả sau. Hãy cho biết mô hình có tự tương quan bậc 2 không?
Bảng 8C
Test Equation:
Dependent Variable: RESID
Presample missing value lagged residuals set to zero
Variable Coefficient Std. Error t-Statistic Prob.
Test Equation:
Dependent Variable: QA
Include observations: 24
Variable Coefficient Std. Error t-Statistic Prob.
b. Khi thêm biến PB vào mô hình, được kết quả dưới đây, hãy viết các hồi quy phụ ứng với các
kiểm định Ramsey và thực hiện kiểm định để cho kết luận.
Bảng 9B
Dependent Variable: QA
Sample (adjusted): 2 24
Included observations: 23 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
14
C 1003.407 355.4275 2.823098 0.0102
PA -59.05641 9.269155 -6.371283 0.0000
PB 55.63005 21.91590 2.538342 0.0191
c. Sau khi hồi quy mô hình trong bảng 9B trên, thu được phần dư và giá trị ước lượng. Hồi quy
phần dư theo PA, PB và bình phương giá trị ước lượng thì thu được kết quả có hệ số xác định bằng 0,88.
Hãy cho biết kết quả đó dùng để làm gì, và có kết luận gì thu được?
Bài tập 10
a. Cho kết quả sau đây, cho biết mô hình có khuyết tật nào trong số các hiện tượng: phương sai sai
số thay đổi, tự tương quan, định dạng hàm sai, đa cộng tuyến? Nếu mức ý nghĩa là 10%, thì có
kết luận nào thay đổi không?
Bảng 10A
Dependent Variable: QA
Sample (adjusted): 2 24
Included observations: 23 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
15
F-statistic 2.487672 Probability 0.132154
Obs*R-squared 2.977387 Probability 0.084436
b. Với các bảng kết quả 10B, 10C, 10D sau đây, thực hiện các kiểm định về các khuyết tật có thể
có, và nhận xét về tính chất của các ước lượng?
Bảng 10B
Dependent Variable: LOG(Y)
Included observations: 20 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
Bảng 10C
Dependent Variable: LOG(Y)
Included observations: 20 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
Bảng 10D
Dependent Variable: LOG(Y)
Included observations: 20 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob.
c. Với các kiểm định, hãy viết phương trình hồi quy phụ của các kiểm định đó.
d. Hãy so sánh các bảng kết quả hồi quy và nêu ra nhận xét về mối quan hệ giữa các biến sản
lượng, vốn, lao động.
17