Professional Documents
Culture Documents
Bt chương 1 nộp thầy
Bt chương 1 nộp thầy
THEORY
Câu 0.1: Ôn tập Xác suất
a) Thế nào là một Biến ngẫu nhiên (Đại lượng ngẫu nhiên - ĐLNN) (BNN)
Có 3 cách định nghĩa một BNN (Random Variable):
(i) Random Variable là biến mà giá trị nhận được là các kết quả của phép thử ngẫu
nhiên.
(ii) Random Variable là biến mà giá trị nhận được thay đổi từ phần tử (đối tượng khảo
sát) này sang phần tử khác trong một phép thử ngẫu nhiên (định nghĩa dễ hiểu nhất).
(iii) Random Variable là biến có quy luật phân phối xác suất phản ánh sự biến động về
mặt giá trị mà Random Variable có thể nhận được.
Ví dụ: Gieo một con xúc xắc, nếu gọi biến ngẫu nhiên X = “số nút trên mặt con xúc
xắc” thì các giá trị có thể của X được viết là X ∈ {1,2,3,4,5,6} với các xác suất tương
ứng của mỗi phần tử đều là 1/6.
Về mặt hình thức, có thể định nghĩa biến ngẫu nhiên như là một hàm số có giá trị thực
được xác định trên không gian các sự kiện sơ cấp (sao cho nghịch ảnh của một khoảng
số là một sự kiện), tức là:
X:Ω→R
trong đó Ω là không gian các sự kiện sơ cấp. Để có thể dễ dàng phân biệt và thực hiện
các phép tính toán, ta thống nhất kí hiệu X,Y,⋯ là các biến ngẫu nhiên (BNN), còn
x,y,⋯ là giá trị của các BNN đó. Như vậy, X mang tính ngẫu nhiên, còn x là giá trị cụ
thể quan sát được khi ta tiến hành phép thử.
b) Với một BNN điều kiện cần và đủ để tuân theo quy luật phân phối chuẩn là
gì?
Điều kiện cần: Biến X phải là một biến ngẫu nhiên liên tục, nhận giá trị trong khoảng
(−∞;+∞).
Điểu kiện đủ: BNN liên tục X nhận giá trị trong khoảng (−∞;+∞)có phân phối chuẩn
với các tham số μ và σ 2, nếu hàm mật độ xác suất của nó có dạng:
2
(x−μ)
i=1
Bước 3: Lập 1 cột mới (tên cột là Chọn ngẫu nhiên 3 hộ gia đình). Tại ô C2 ta
nhập công thức =INDEX($B$2:$B$6,RANK(A2,$A$2:$A$6)) và nhấn Enter,
ta chọn được ngẫu nhiên 1 hộ gia đình. Dùng chức năng Fill Handle cho 2 dòng
tiếp theo, ta sẽ chọn được ngẫu nhiên 3 hộ gia đình từ 5 hộ gia đình.
- Ứng với các mẫu gồm 3 hộ gia đình hãy tính trung bình mẫu và phương sai
mẫu hiệu chỉnh trên từng mẫu.
+) Quy ước: “3 hộ gia đình có thu nhập (a,b,c)” được ký hiệu trong bảng là “(a,b,c)”
+) Sử dụng phần mềm Excel:
Trung bình mẫu: sử dụng hàm Average
Phương sai mẫu hiệu chỉnh: sử dụng hàm Var.S
tổng (8,9, (8,9, (8,9, (8,10 (8,10 (8,11 (9,10 (9,10 (9,11 (10,11
thế 10) 11) 12) ,11) ,12) ,12) ,11) ,12) ,12) ,12)
Mô hình hồi quy tuyến tính đa biến trên tổng thể: là mô hình mô tả sự phụ thuộc giữa
một biến (gọi là biến phụ thuộc) vào nhiều biến khác (gọi là các biến độc lập, biến giải
thích) cộng với sai số ngẫu nhiên, có dạng sau:
k
Y = β1 + ∑ β i X i +ε với k > 2
i=2
Trong đó:
+) Y là giá trị của biến phụ thuộc
+) X i là giá trị của biến độc lập (biến giải thích thứ i)
+) ε là các yếu tố khác, có tính ngẫu nhiên được gọi là yếu tố sai số ngẫu nhiên
b) Phát biểu hàm hồi quy tuyến tính đơn biến, đa biến trên tổng thể
Hàm hồi quy tuyến tính đơn biến trên tổng thể: là hàm hồi quy tuyến tính có dạng:
2
f(X2) = β 1+ ∑ β i X i =¿ β 1+ β2 X 2 với k = 2
i=2
Hàm hồi quy tuyến tính đa biến trên tổng thể: là hàm hồi quy tuyến tính có dạng:
k
f(X2,…,Xk) = β 1+ ∑ β i X i =¿ ¿ β 1+ β2 X 2 +¿ … + β k X k với k>2
i=2
Trong đó:
+) β 1 ; β 2 ;... ; β k là các tham số của mô hình còn được gọi là hệ số hồi quy
β 1là tung độ góc; (hệ số chặn, hệ số tự do)
β 2 ; …; β k là các hệ số góc của đường hồi quy ứng với X 2 ,… X k
c) Sai số ngẫu nhiên trên tổng thể ( ε ) là gì: Sai số ngẫu nhiên là thể hiện những yếu
tố ảnh hưởng ngoài mô hình lên biến phụ thuộc, có thể là do sai số đo lường, do cách
thu thập dữ liệu, do có thể có biến độc lập khác giải thích cho biến phụ thuộc mà chưa
được được vào mô hình nghiên cứu… . Sai số ngẫu nhiên thường gắn với tổng thể, khi
ta không biết tổng thể ta cũng không biết sai số ngẫu nhiên.
a) Phát biểu mô hình hồi quy tuyến tính đơn biến, đa biến trên mẫu ? So sánh với
các khái niệm này trên tổng thể.
Đơn biến: Y = ^
β1 + ^
β 2 X +e=Y^ +e ⟹ y i= ^
β1 + ^
β 2 x i +e i= ^
y i +e i
Trong đó: Y^ = ^
β1 + ^ y i= β^1 + ^
β 2 X (SRF); ^ β 2 xi
Đa biến: Y= ^
β 1+ ^
β2 X 2 +…+ ^
βk X k + e ⟹ Y i = ^
β 1+ ^
β2 X 2 i +…+ β^k X ki + ei
Trong đó: Y^ = ^
β1 + ^
β 2 X 2+ …+ ^
β k X k (SRF); Y^i= β^1 + ^
β 2 X 2i + …+ ^
β k X ki
So sánh mô hình hồi quy tuyến tính đơn biến trên mẫu so với mô hình hồi quy tuyến
tính đơn biến trên tổng thể:
Ta có thể thấy:
- Xét trên N của tổng thể ta chỉ có thể viết được 1 mô hình hồi quy. Xét trên n của
mẫu, mẫu ở đây là mẫu được chọn ngẫu nhiên nên có thể có nhiều đường hồi quy
mẫu.
- Nếu đường hồi quy mẫu n và đường hồi quy tổng thể N không nằm gần nhau
→ đường hồi quy không tốt (đường hồi quy tốt khi cả hai đường nằm gần nhau ). Tuy
nhiên N,n lệch nhưng đều phản ánh được quy luật x tăng thì y tăng.
Nhận xét: không cần đường hồi quy tổng thể. Đường hồi quy mẫu hoàn toàn phản
ánh được đường hồi quy tổng thể theo một xu thế.
b) Phát biểu hàm hồi quy tuyến tính đơn biến, đa biến trên mẫu ? So sánh với
các khái niệm này trên tổng thể.
Hàm hồi quy tuyến tính trên mẫu: là một hàm số mô tả xu thế biến động của biến phụ
thuộc theo biến giải thích về mặt trung bình, Y^ = ^
f ( X) gọi là hàm hồi quy mẫu (SRF)
Đơn biến:
Nếu PRF có dạng: E(Y/X)= β 1+ β 2X
Thì SRF có dạng: E(Ŷ/X)= ^
β 1 +^
β 2 X =Ŷ
Đa biến:
k
Nếu PRF có dạng: E(Y/ X 2 , … , X k ¿=Y =β 1+ ∑ βi X i (k>2)
i=2
So sánh hàm hồi quy mẫu và hàm hồi quy tổng thể:
- Bất kỳ một giá trị xi nào trên tổng thể đều có thể viết theo 2 cách sau:
y i=f( x i)= β 1+ β 2 x i( trên N ) ( i=1,2,3,..,N)
y i= ^
β 1 +^
β 2 x i (trên n )
- Hàm hồi quy tổng thể chỉ có một còn hàm hồi quy mẫu thì có nhiều.
Nhận xét: mọi giá trị cụ thể của biến phụ thuộc ( y i) thay vì phải giải thích trên hàm
hồi quy tổng thể ( y i=f( x i)= β 1+ β 2 x i) hoàn toàn có thể được viết hay giải thích bằng hàm
hồi quy mẫu ( y i= ^
β 1 +^
β 2 x i). Do đó ta không bao giờ cần tìm hàm hồi quy tổng thể
(f(X)= β 1+ β 2X). Vấn đề ta chỉ cần tìm một hàm hồi quy mẫu tốt (mẫu tốt là mẫu mà
các phần tử được chọn ngẫu nhiên).
c) Sai số ngẫu nhiên trên mẫu là gì ? So sánh với khái niệm này trên tổng thể.
Khái niệm: Sai số ngẫu nhiên trên mẫu (e) là yếu tố khác cũng có tác động đến biến
phụ thuộc khi ta khảo sát mẫu (có thể là những yếu tố không biết, không có số liệu
hay tác động của nó quá nhỏ không mang tính hệ thống), có tính ngẫu nhiên nên được
gọi là sai số ngẫu nhiên.
So sánh với khái niệm biến ngẫu nhiên trên tổng thể: bản chất của sai số ngẫu nhiên
trên mẫu e giống yếu tố sai số ngẫu nhiên trên tổng thể ε.
d) Theo bạn ứng với một mẫu ngẫu nhiên n phần tử có bao nhiêu đường hồi quy
mẫu có thể thu thập trong thực tế ? Giải thích ?
Theo em, ứng với một mẫu ngẫu nhiên n phần tử có duy nhất một đường hồi quy mẫu
có thể thu thập trong thực tế. Vì ứng với một mẫu quan sát gồm n cặp giá trị (xi, yi)
thì các tham số ^
β 1 và ^
β 2tìm được là duy nhất. Các tham số ^
β 1 và ^
β 2 là các ước lượng
điểm của các tham số β 1và β 2 trên đường hồi quy tổng thể và các tham số này là các
Biến ngẫu nhiên, giá trị của chúng thay đổi từ mẫu này sang mẫu khác (chỉ cần
thay đổi 1 giá trị của mẫu ngẫu nhiên sẽ được một cặp ^
β 1 và ^
β 2 khác). Do ^
β 1 và ^
β 2tìm
được là duy nhất nên ta chỉ có được duy nhất một đường hồi quy mẫu.
Câu 0.5: Econometric
a) Các tham số trên hàm hồi quy mẫu là ngẫu nhiên hay không ngẫu nhiên? Vì
sao?
Các tham số trên hàm hồi quy mẫu là ngẫu nhiên. Vì trong một tổng thể ta có thể chọn
ra nhiều mẫu với mỗi mẫu gồm n phần tử chọn ngẫu nhiên. Ứng với một mẫu quan
sát gồm n cặp giá trị (xi, yi) thì các tham số ^
β 1 và ^
β 2tìm được là duy nhất. Các tham
số β^1 và β^2 là các ước lượng điểm của các tham số β 1và β 2 trên đường hồi quy tổng thể
và các tham số này là các Biến ngẫu nhiên, giá trị của chúng thay đổi từ phần tử
này sang phần tử khác, từ mẫu này sang mẫu khác.(chỉ cần thay đổi 1 giá trị của
mẫu ngẫu nhiên sẽ được một cặp ^
β 1 và ^
β 2 khác).
b) Phương pháp OLS dùng để làm gì?
OLS là phương pháp được sử dụng rộng rãi nhất để ước lượng các tham số trong
phương trình hồi quy. Để tối thiểu hóa tổng bình phương của các khoảng cách theo
phương thẳng đứng giữa số liệu thu thập được và đường (hay mặt) hồi quy.
c) Trong phương pháp OLS thì R2 có ý nghĩa là gì ? Mối liên hệ của nó với hệ số
tương quan tuyến tính là gì ?
Trong phương pháp OLS thì R2 có ý nghĩa là: nó cho biết sự thay đổi của Y có cao
nhiêu % là sự thay đổi do biến X (và từ đó bao nhiêu % còn lại là do các nguyên nhân
khác) hay nói cách khác có bao nhiêu % giá trị của biến Y được giải thích qua các
biến X và bao nhiêu % còn lại là do các nguyên nhân khác (có thể là do sai số đo
lường, do cách thu thập dữ liệu, do có thể có biến độc lập khác giải thích cho biến phụ
thuộc mà chưa được được vào mô hình nghiên cứu…)
● Ý nghĩa của R2:
R2=1: biến X giải thích được 100% sự thay đổi của biến Y.
R2=a(0< a<1): biến X giải thích được a% sự thay đổi của biến Y.
R2=0: X và Y không có quan hệ tuyến tính.
● Mối liên hệ giữa R2 và hệ số tương quan r xy: r xy =√ R2
Nếu r xy > 0 tương quan dương, tức là khi X tăng thì Y có khuynh hướng tăng
Nếu r xy < 0 tương quan âm, tức là khi X tăng thì Y có khuynh hướng giảm r xy gần về
phía ±1 gọi là tương quan mạnh, r xy gần về phía 0 thì gọi là tương quan yếu.
|r xy|=1: biến X giải thích được 100% sự thay đổi của biến Y.
|r xy|=b(0< b<1): biến X giải thích được a% sự thay đổi của biến Y, còn lại phụ
thuộc vào các yếu tố khác.
|r xy|=0: X và Y không có quan hệ tuyến tính.
d) Trong cùng một chủ để về phân tích mối liên hệ giữa thu nhập (X) và chi tiêu
(Y), có hai nhóm khảo sát với nhóm 1, 2 có cỡ mẫu lần lượt là n1= 60; n2= 100.
Cả hai cùng sử dụng phương pháp OLS để tìm hàm hồi quy mẫu với R21= 30%;
2
R2= 70%. Theo bạn đường hồi quy nào là phù hợp khi phân tích mối liên hệ giữa
Y và X? Giải thích?
Ta có hai mẫu n1 = 60 => R21= 30%
và n2 = 100 => R22= 70%
Cả hai đường hồi quy đều phù hợp để phân tích mối liên hệ giữa Y và X, có nghĩa là ở
cả hai đường hồi quy, biến chi tiêu Y đều có thể được giải thích qua biến thu nhập X.
Vì chúng đều có R2 ≠0 . Vậy nên, ta chỉ có thể xét xem mô hình nào phù hợp hơn để
phân tích. Ta thấy rằng mô hình 2 sẽ phù hợp hơn vì có tới 70 hộ cho thấy mối liên hệ
giữa thu nhập (X) và chi tiêu (Y), so với mô hình 1 chỉ có 18 hộ.
II. PRACTICE iRESEARCH
Bài 1.1: Quan sát thu nhập (triệu đồng) và chi tiêu (triệu đồng) của 10 hộ gia đình, ta
có mẫu số liệu:
a) Paper ủng hộ cho mối liên hệ giữa Thu nhập và Chi tiêu.
Does Government Spending Affect Income Poverty? A Meta-regression Analysis
Link:https://reader.elsevier.com/reader/sd/pii/S0305750X17303200?
token=75AC6A4792B4A7048C29B8032D7A18DAD78A4F5BDBFF2C6B58133480
56C247E00EA6C9D8E189F1B502C7799D7F91D6A3&originRegion=eu-west-
1&originCreation=20220327072458
Paper này trình bày kết quả của một phân tích hồi quy tổng hợp về mối quan hệ giữa
chi tiêu của chính phủ và nghèo đói về thu nhập, tập trung vào các quốc gia có thu
nhập thấp và trung bình. Thông qua quá trình tìm kiếm và sàng lọc toàn diện, đã xác
định được tổng cộng 19 nghiên cứu kinh tế lượng xuyên quốc gia có chứa 169 ước
tính về mối quan hệ này. Chúng tôi thấy rằng quy mô và hướng của mối quan hệ ước
tính bị ảnh hưởng bởi nhiều yếu tố, đáng chú ý nhất là thành phần của mẫu được sử
dụng để ước tính, kiểm soát các biến có trong mô hình hồi quy và loại chi tiêu của
chính phủ. Nhìn chung, không có bằng chứng rõ ràng cho thấy chi tiêu chính phủ cao
hơn đã đóng một vai trò quan trọng trong việc giảm nghèo về thu nhập ở các nước có
thu nhập thấp và trung bình.
b) Đây là mô hình hồi quy tuyến tính đa biến hay đơn biến? Vì sao?
Đây là mô hình hồi quy tuyến tính đơn biến. Vì mô hình này có hai biến là thu nhập
và chi tiêu, trong đó có một biến độc lập (biến giải thích) là thu nhập và một biến phụ
thuộc (biến được giải thích) là chi tiêu.
c) Viết hàm hồi quy tuyến tính mẫu chi tiêu theo thu nhập? Ý nghĩa các hệ số hồi
quy?
Ta có:
x = 13.3
y = 10.5
xy=¿ 148.3
x 2 =190.5
Y^ = 2.047 + 0.636X
Ý nghĩa của các hệ số hồi quy:
β 1= 2.047 có nghĩa là khi các hộ gia đình thất nghiệp thì mức chi tiêu trung binh tối
14
12
10
0
6 8 10 12 14 16 18 20 22
- Mô tả mối liên hệ giữa Thu nhập và Chi tiêu: Nhìn vào đồ thị scatter ta có thể
thấy khi thu nhập càng tăng thì chi tiêu sẽ tăng theo.
- Hàm hồi quy tuyến tính: Hàm hồi quy tuyến được viết dưới dạng:
Y^ = 2.047 + 0.636X
- Sai số ngẫu nhiên (ei) trên từng hộ gia đình:
Hộ gia đình có:
Thu nhập = 8 và Chi tiêu = 7 thì sai số ngẫu nhiên (ei) là -0.13152094
Thu nhập = 9 và Chi tiêu = 8 thì sai số ngẫu nhiên (ei) là 0.2326
Thu nhập = 10 và Chi tiêu = 9 thì sai số ngẫu nhiên (ei) là 0.597
Thu nhập = 11 và Chi tiêu = 8 thì sai số ngẫu nhiên (ei) là -1.0386
Thu nhập = 12 và Chi tiêu = 10 thì sai số ngẫu nhiên (ei) là 0.3258
Thu nhập = 15 và Chi tiêu = 12 thì sai số ngẫu nhiên (ei) là 0.419
Thu nhập = 15 và Chi tiêu = 11 thì sai số ngẫu nhiên (ei) là -0.581
Thu nhập = 16 và Chi tiêu = 13 thì sai số ngẫu nhiên (ei) là 0.7834
Thu nhập = 17 và Chi tiêu = 12 thì sai số ngẫu nhiên (ei) là -0.8522
Thu nhập = 20 và Chi tiêu = 15 thì sai số ngẫu nhiên (ei) là 0.241
e) Theo bạn sai số ngẫu nhiên ( e i) tồn tại trên mỗi hộ gia đình (mỗi phần tử) là
hợp lý hay bất hợp lý ? Vì sao? Khi nào thì (ei) của hộ gia đình thứ i là 0 ? Giải
thích ?
-Sai số ngẫu nhiên (e i tồn tại trên mỗi hộ gia đình (mỗi phần tử) là hợp lý bởi vì chi
tiêu của mỗi hộ gia đình không chỉ phụ thuộc vào thu nhập mà còn phụ thuộc vào
những yếu tố khác chăng hạn như tiền chu cấp cha mẹ, tiền mua sắm vào dịp lễ,…
-(e i) của hộ gia đình thứ i là 0 khi và chỉ khi chi tiêu phụ thuộc hoàn toàn vào thu nhập
và không phụ thuộc vào các yếu tố khác.
f) Hãy cho biết vì sao sai số ngẫu nhiên ( e i) lại nhận giá trị dương hay âm, nhỏ
hay lớn ? Giải thích cụ thể trên từng hộ gia đình trong mẫu.
-Sai số ngẫu nhiên (e i) lại nhận giá trị dương hay lớn là khi họ có nhiều khoản để chi
tiêu hơn (ví dụ như nhà có nhiều con hơn mức trung bình, có xe hơi nên phải chi tiêu
nhiều hơn,..)
-Sai số ngẫu nhiên (e i) lại nhận giá trị âm hay nhỏ khi họ không cần phải chi tiêu quá
nhiều (ví dụ như họ chưa kết hôn, không cần chu cấp tiền cho ba mẹ,..)
Bài 1.2: Gọi
- Y (lượng cam được bán – tấn/tháng)
- X (giá cam – ngàn đ/kg)
Lượng 14 13 12 10 8 9 8 7 6 6
cam
Giá cam 2 2 3 4 5 5 6 7 8 9
a) Viết hàm hồi quy tuyến tính mẫu lượng cam bán ra theo giá cam? Ý nghĩa các
hệ số hồi quy?
Hàm hồi quy tuyến tính mẫu lượng cam bán ra theo giá cam:
+) Áp dụng công thức:
^ xy−x . y
β2 = 2 2 = 15,11
x −(x )
^
β 1 = y− ^
β2 . x = -1.14
trị của ^
β 2 sẽ nằm ở cột Coefficients, dòng X Variable 1
{ H 0 : β 2=0
Cặp giả thiết: H : β ≠ 0
1 2
2
R (n−2) 0.9276 ×8
Giá trị kiểm định F = = = 102.497
1−R
2
1−0.9276
^
β 1¿= -3.42: Khi cam được bán với giá 0 ngàn đ/kg thì lượng cam bán ra trung bình tối
thiểu là -3.42 tấn/quý.
^
β 2¿= 45.33: Khi giá cam tăng1 ngàn đ/kg thì lượng cam bán ra trung bình tăng 45.33
tấn/quý.
Lượng cam tính theo đơn vị là tấn/năm:
1 năm = 12 tháng
→ Y^¿=12 ^
β1 +12 ^
β 2 X ¿ = -13.68 + 181.32 X ¿
^ ¿
β 1 = -13.68: Khi cam được bán với giá 0 ngàn đ/kg thì lượng cam bán ra trung bình tối
thiểu là -13.68 tấn/năm.
^ ¿
β 2 = 181.32: Khi giá cam tăng 1 ngàn đ/kg thì lượng cam bán ra trung bình tăng
181.32 tấn/năm.
d) Nếu giá cam tính theo đơn vị là triệu đồng/kg; triệu đồng/tạ; tỉ đồng/tấn;
nghìn đồng/tạ thì hàm hồi quy thay đổi như thế nào ? Viết và giải thích cụ thể
các hệ số trong hàm hồi quy mẫu ứng với các trường hợp trên.
Giá cam tính theo đơn vị là triệu đồng/kg:
Ta có: 1 ngàn đồng = 0,001 triệu đồng
15,11
Y^¿= -1,14 + X* = -1.14 + 151100X*
0,001
^ ¿
β 1 = -1.14: Khi cam được bán với giá 0 triệu đồng/ kg thì lượng cam bán ra trung bình
tối thiểu là -1.14 ngàn đ/kg.
^ ¿
β 2 = 151100: Khi giá cam tăng lên 1 đơn vị là triệu đồng/kg thì lượng cam bán ra
trung bình tăng 151100 ngàn đ/kg.
Giá cam tính theo đơn vị là triệu đồng/tạ:
0,001
Ta có: 1 ngàn đồng/kg = triệu đồng/ tạ=0.1 triệu đồng/tạ
0,01
15,11
Y^¿ = -1,14 + X* = -1.14 + 151,1X*
0,1
^ ¿
β 1 = -1.14: Khi cam được bán với giá 0 triệu đồng/tạ thì lượng cam bán ra trung bình
tối thiểu là -1.14 ngàn đ/kg.
^ ¿
β 2 = 151,1: Khi giá cam tăng lên 1 đơn vị là triệu đồng/kg thì lượng cam bán ra trung
bình tăng 151,1 ngàn đ/kg.
Giá cam tính theo đơn vị là tỉ đồng/tấn:
0,000001
Ta có: 1 ngàn đồng/kg = tỉ đồng/tấn= 0.001 tỉ đồng/tấn
0,001
15,11
Y^¿ = -1,14 + X* = -1.14 + 151100X*
0,001
^ ¿
β 1 = -1.14: Khi cam được bán với giá 0 tỉ đồng/tấn thì lượng cam bán ra trung bình tối
thiểu là -1.14 ngàn đ/kg.
^ ¿
β 2 = 151100: Khi giá cam tăng lên 1 đơn vị là tỉ đồng/tấn thì lượng cam bán ra trung
bình tăng 151100 ngàn đ/kg.
Giá cam tính theo đơn vị là nghìn đồng/tạ:
1
Ta có: 1 nghìn đồng/kg = nghìn đồng/ tạ= 100 nghìn đồng/tạ
0,01
15,11
Y^¿ = -1,14 + X* = -1.14 + 0,1511X*
100
^ ¿
β 1 = -1.14: Khi cam được bán với giá 0 nghìn đồng/tạ thì lượng cam bán ra trung bình
tối thiểu là -1.14 ngàn đ/kg.
^ ¿
β 2 = 151100: Khi giá cam tăng lên 1 đơn vị là nghìn đồng/tạ thì lượng cam bán ra
trung bình tăng 151100 ngàn đ/kg.
e) Khi giá cam có đơn vị là triệu đồng/tạ còn lượng cam có đơn vị tạ/quý thì hàm
hồi quy thay đổi như thế nào? Viết và giải thích cụ thể các hệ số trong hàm hồi
quy mẫu.
Khi giá cam có đơn vị là triệu đồng/tạ còn lượng cam có đơn vị tạ/quý
Ta có: 1 ngàn đồng/kg = 0.1 triệu đồng/ tạ
10
Và 1 tấn/tháng = = 30 tạ/quý
1/3
15,11
Y^ *= -1,14.30 + .30 X* = -34,2+ 4533X*
0,1
^ ¿
β 1 = -34,2: Khi cam được bán với giá 0 triệu đồng/tạ thì lượng cam bán ra trung bình
tối thiểu là -34,2 tạ/quý.
^ ¿
β 2 = 4533 : Khi giá cam tang 1 triệu đồng/tạ thì lượng cam bán ra trung bình tang
4533 tạ/quý.
f) Khi giá cam có đơn vị là triệu đồng/tấn còn lượng cam có đơn vị tấn/năm thì
hàm hồi quy thay đổi như thế nào? Viết và giải thích cụ thể các hệ số trong hàm
hồi quy mẫu.
Khi giá cam có đơn vị là triệu đồng/tấn còn lượng cam có đơn vị tấn/năm
0,001
Ta có: 1 ngàn đồng/kg = triệu đồng/ tấn= 1 triệu đồng/tấn
0,001
1
Và 1 tấn/tháng = = 12 tấn/năm
1/12
15,11
Y^ *= -1,14.12 + .12X* = -13,68+ 181,32X*
1
^ ¿
β 1 = -13,68: Khi cam được bán với giá 0 triệu đồng/tấn thì lượng cam bán ra trung
bình tối thiểu là -13,68 tấn/tháng.
^
β 2¿= 181,32 : Khi giá cam tăng 1 triệu đồng/tấn thì lượng cam bán ra trung bình tăng
181,32 tấn/tháng.
Bài 1.3: Cho số liệu về tiền thuê một căn hộ nhà trọ sinh viên như trong Bảng 1.1 (file
Data_Chuong1.xlsx). Các biến số được định nghĩa như sau:
RENT = tổng tiền thuê hàng tháng cho một căn hộ. ($)
No = số người ở trong căn hộ (người)
RM = số phòng trong căn hộ (phòng)
DIST = khoảng cách từ căn hộ đến trường (khu phố)
RPP = RENT/No = tiền thuê bình quân trên người ($/người)
Với sự hỗ trợ của phần mềm Excel trong tính toán,
a) Hãy tính các giá trị trung bình (mean), phương sai (variance), và độ lệch
chuẩn (standard deviation) của các biến số trên.
+) Sử dụng phần mềm Excel:
Ta sẽ dùng Data Analysis để tính các giá trị trên
b) Hãy tính hiệp phương sai (covariance) và hệ số tương quan tuyến tính giữa các
cặp biến số sau:
RENT và DIST, RENT và RM, RENT và No, RPP và RENT, RPP và No.
Hãy nêu nhận xét cụ thể về sự tương quan cho từng cặp biến số trên.
Tính hiệp phương sai (Covariance): (sử dụng phần mềm Excel)
Link:https://sci-hub.se/10.1080/10835547.1989.12090581
Bài báo này xem xét ảnh hưởng của các tiện nghi, dịch vụ và các yếu tố ngoại lệ khác
nhau đối với tiền thuê nhà ở cho nhiều gia đình. Các thuộc tính được nghiên cứu bao
gồm các tiện nghi và dịch vụ như bãi đậu xe có mái che, nhà bếp hiện đại và dịch vụ
giúp việc, các hạn chế về cư trú như không cho phép vật nuôi và các yếu tố bên ngoài
như tắc nghẽn giao thông, gần cơ quan và khả năng tiếp cận phương tiện giao thông
công cộng. Các kết quả thực nghiệm cho thấy một số đặc điểm này có ảnh hưởng đến
tiền thuê. Trong đó, các tác giả đã chỉ ra rằng có mối liên hệ giữa số phòng ngủ và giá
thuê căn hộ - kích thước tăng thì giá tăng.
a) Hãy vẽ đồ thị phân bố rãi (scatter diagram) của hai tỉ lệ trên
Bôi đen cột Tỷ lệ bỏ việc (Trên 100 lao động) và cột Tỷ lệ thất nghiệp (%) Chọn
Insert Chọn vẽ đồ thị X Y (scatter).
Scatter diagram
Tỷ lệ bỏ việc (Trên 100 lao độ ng) 3
2.5
1.5
0.5
0
2 3 4 5 6 7 8 9
Tỷ lệ thất nghiệp (%)
b) Giả sử tỉ lệ bỏ việc có quan hệ tuyến tính với tỉ lệ thất nghiệp như sau: Yt = β1
+ β2Xt + et. Hãy ước lượng β1, β2, và cho biết độ lệch chuẩn của chúng.
+) Sử dụng phần mềm Excel: Chọn Data Data Analysis Regression Chọn
vùng Input Y (Tỷ lệ bỏ việc) Chọn vùng Input X (Tỷ lệ thất nghiệp) Chọn vùng
Output (nơi xuất dữ liệu) → Nhấn OK. Ta có kết quả:
^
β 1=3,366258 ^
β 2=−0,286212
Khoảng ước lượng β1, β2, với độ tin cậy 95% là:
β 1 ϵ(2,637547; 4,094969)
β 2 ϵ(−0,42462;−0,1478)
+) Áp dụng công thức: (áp dụng các công thức của trung bình mẫu, phương sai mẫu)
x=5,069231 y=1,915385
x 2=27,71923 xy=9,130769
^ xy−x . y
β 2= 2 =−0.28621
x −( x )2
^
β 1= y− ^
β2 . x =3,36626
13
RSS=∑ ( y i− ^
2
y i ) =¿ ¿1,14351
i=1
2 RSS 1,14351
σ = = =0,103955
n−2 13−2
√ √
σ2 0,103955
β 2 ¿=√ Var ( ^
^ β 2)= = =0,062885
se( 13
26,287692
∑ (x i− x́ )2
i=1
11
t 0,025=2,201
Vậy khoảng ước lượng cho tham số β 2 với độ tin cậy 95% (khi n>30) là:
β2 ϵ ( ^ 0,025 . se ( β2 ) ) 2
β2 ± t 10 ^ β ϵ (−0,42462 ;−0,1478 )
√
13
∑ xi2
se( ^ √
β 1 ¿= Var ( ^
β 1) =
i=1
n
. 13
σ2
∑ ( x i−x́ )2
=
√ 360,35 ×0,103955
13 ×26,287692
=0,331083
i=1
10
t 0,025 =2,201
Vậy khoảng ước lượng cho tham số β 1 với độ tin cậy 95% (khi n>30) là:
c) Hãy giải thích (diễn giải) các kết quả của bạn.
Y^ =3.366258-0.286212X
^
β 1=¿3.366258: Trong giai đoạn 1960-1972, khi không có người thất nghiệp trong lãnh
vực chế tạo công nghiệp ở Mỹ (tỉ lệ thất nghiệp trong lãnh vực này bằng 0%) thì tỉ lệ
bỏ việc trung bình tối thiểu trên 100 người làm việc trong lãnh vực này ở Mỹ là
3.366258%.
^
β 2=¿-0.286212: Trong giai đoạn 1960-1972, khi tỉ lệ thất nghiệp trong lãnh vực chế
tạo công nghiệp ở Mỹ tăng 1% thì tỷ lệ bỏ việc trung bình trên 100 người làm việc
trong lãnh vực này ở Mỹ giảm 0,286212% và ngược lại.
d) Hãy tính R2. Giải thích ý nghĩa của hệ số này.
R =0,653158Ý nghĩa: Tỷ lệ thất nghiệp giải thích được 65,32% thay đổi của tỷ lệ bỏ
2
việc trong 13 năm (1960-1972), còn 34,68% là do các nguyên nhân khác. Hay nói
cách khác, trong gần 8,5 năm ta thấy được tỷ lệ bỏ việc có mối quan hệ tuyến tính với
tỷ lệ thất nghiệp.
e) Hãy vẽ đồ thị của đại lượng sai số e (với e trên trục tung và thời gian (năm)
trên trục hoành). Bạn có thể nhận biết được điều gì từ những sai số này.
Ta có: ε i= y i−^
yi
Đồ thị củ a đạ i lượ ng sai số e
0.5
0.4
0.3
0.2
0.1
0
1958 1960 1962 1964 1966 1968 1970 1972 1974
-0.1
-0.2
-0.3
-0.4
-0.5
Từ những sai số này, ta có thể nhận thấy được có sự ảnh hưởng của các yếu tố ngoài
mô hình lên biến phụ thuộc. Tức là, có sự tác động của các yếu tố khác ngoài biến giải
thích (tỷ lệ thất nghiệp) tới giá trị của biến phụ thuộc (tỷ lệ bỏ việc trên 100 lao động).
Đó có thể là những yếu tố mà ta không biết, những yếu tố không có số liệu hoặc
những yếu tố mà tác động của nó quá nhỏ không mang tính hệ thống.
f) Tính giá trị kiểm định p_value khi kiểm định tính có ý nghĩa của các hệ số
trong mô hình trên? Với mức ý nghĩa 5% hãy cho biết p_value tính được lớn hơn
hay nhỏ hơn mức ý nghĩa 5% ? Giải thích ý nghĩa của các p_value tính được ?
{ H : β =0
Đặt giả thiết: H 0 : βi ≠ 0
1 i
{ H 0 : β 1=0
Đặt giả thiết: H : β ≠ 0
1 1
^ ¿
β1 −β1 3,36626−0
T 0= = =10,16742
se ( ^
β 1) 0,331083
{ H 0 : β 2=0
Đặt giả thiết: H : β ≠ 0
1 2
^
β 2−β 2¿ −0.28621−0
T 0= = =−4,55132
se ( ^
β 2) 0,062885
Bài 1.5: Dữ liệu về giá vàng (GP), Chỉ số giá tiêu dùng (CPI), và Chỉ số chứng khoán
trên thị trường chứng khoán New York (NYSE) trong thời kỳ 1977-1991 ở M ỹ được
cho ở Bang1.3 (file Data_Chuong1.xlsx)
a) Hãy vẽ đồ thị scatter của GP với CPI; NYSE với CPI trên cùng một đồ thị.
Bôi đen cột dữ liệu về giá vàng (GP) và cột chỉ số giá tiêu dung (CPI) Chọn Insert
Chọn vẽ đồ thị X Y (scatter).
Bôi đen cột dữ liệu về chỉ số chứng khoán (NISE) và cột chỉ số giá tiêu dùng (CPI)
Chọn Insert Chọn vẽ đồ thị X Y (scatter).
b) Một quyết định đầu tư (mua vàng hay mua chứng khoán) có tính tới việc
phòng ngừa lạm phát là nếu giá của nó (hàng hóa mà bạn đầu tư vào) và/hay
suất sinh lợi của nó ít nhất là bắt kịp với tỉ lệ lạm phát. Để kiểm tra giả thiết này,
giả sử bạn quyết định xây dựng hai mô hình sau đây, giả sử rằng đồ thị trong câu
a gợi ý cho bạn thấy sau đây là thích hợp:
GPt = α1 + β1CPIt + et
NYSEt = α2 + β2 CPIt + et
Với hai mô hình trên, hãy trả lời các câu hỏi sau:
- Tính hệ số tương quan tuyến tính giữa GP và CPI; NYSE và CPI? Bạn nhận xét gì
về các hệ số này.
Tính hệ số tương quan tuyến tính (Correlation) giữa GP và CPI; NYSE và CPI:
Hệ số tương quan tuyến tính giữa GP và CPI sẽ nằm ở cột GP, dòng CPI
Hệ số tương quan tuyến tính giữa CPI và NYSE sẽ nằm ở cột CPI, dòng NYSE
+ Giải thích:
Hệ số tương quan giữa GP và CPI là 0.387582844 có nghĩa là biến CPI giải thích
được 0.387582844% sự thay đổi của biến GP, còn lại phụ thuộc vào các yếu tố khác.
Hệ số tương quan giữa NYSE và CPI là 0.93168 có nghĩa là biến CPI giải thích được
0.93168% sự thay đổi của biến NYSE, còn lại phụ thuộc vào các yếu tố khác.
- Bạn kỳ vọng về dấu của các hệ số đứng trước các biến giải thích trong 2 mô
hình trên ? Giải thích.
Kỳ vọng về dấu của các hệ số đứng trước các biến giải thích trong 2 mô hình trên là
dấu dương.
- Hãy tìm ít nhất 3 paper để ủng hộ cho các mối liên hệ trên.
Link: https://sci-hub.hkvisa.net/10.1016/j.eap.2019.08.003
Bài báo này xem xét ảnh hưởng của chính sách tiền tệ của Hoa Kỳ , giá dầu và giá
vàng đối với chỉ số chứng khoán của các nước BRICS . Mô hình hồi quy tự động
Vector được áp dụng để nghiên cứu các chỉ số chứng khoán của tất cả các quốc gia
BRICS như một nhóm trong giai đoạn 1996–2018. Chúng tôi nhận thấy rằng Bombay
Sensex phản ứng tích cực với Lãi suất quỹ liên bang. Chỉ số chứng khoán của Nam
Phi - FTSE JSE của Johannesburg - phản ứng tiêu cực với cú sốc giá dầu trong khi chỉ
số chứng khoán của Nga và Brazil - RTSI của Moscow và BVSP của Sao Paulo -
phản ứng tích cực với những thay đổi của giá vàng. Chúng tôi cung cấp các hàm ý về
quản lý và chính sách của những kết quả này.
Price-switching spillovers between gold, oil, and stock markets: Evidence from the
USA and China during the COVID-19 pandemic
Link: https://scihub.hkvisa.net/https://www.sciencedirect.com/science/article/abs/pii/
S0301420721002294?fbclid=IwAR1cYe-Ebx5p2O_ZBkMNoiD3FXnty3c-
PyTsktvshNicgK7J_RAj1dJe4Z4
Bài báo này xem xét các tác động lan tỏa chuyển đổi giá giữa thị trường chứng khoán,
dầu thô và vàng tương lai của Hoa Kỳ và Trung Quốc trước và trong đại dịch COVID-
19. Sử dụng mô hình tự động hồi quy vectơ chuyển mạch Markov, chúng tôi cho thấy
rằng thị trường chứng khoán chủ yếu bị ảnh hưởng bởi các cú sốc của chính chúng,
với các tác động nhạy cảm với sự thay đổi của chế độ. Phân tích mạng kết nối tiết lộ
rằng vàng và thị trường chứng khoán là những yếu tố đóng góp ròng (thu nhận) tác
động lan tỏa trong chế độ ít biến động (chế độ biến động cao), trong khi dầu là yếu tố
thu nhận (đóng góp) chính của tác động lan tỏa trong chế độ ít biến động (chế độ biến
động cao). Các chế độ chủ yếu có mức độ biến động thấp từ tháng 1 năm 2019 đến
tháng 2 năm 2020 và mức độ biến động cao từ tháng 3 năm 2020 đến tháng 5 năm
2020. Chúng tôi kết luận rằng đại dịch COVID-19 đã tăng cường sự lan tỏa từ thị
trường hàng hóa sang thị trường chứng khoán Hoa Kỳ và Trung Quốc.
US monetary policy, oil and gold prices: Which has a greater impact on BRICS
stock markets?
Link: https://sci-hub.hkvisa.net/10.1016/j.eap.2019.08.003
Bài báo này xem xét ảnh hưởng của chính sách tiền tệ của Hoa Kỳ , giá dầu và giá
vàng đối với chỉ số chứng khoán của các nước BRICS . Mô hình hồi quy tự động
Vector được áp dụng để nghiên cứu các chỉ số chứng khoán của tất cả các quốc gia
BRICS như một nhóm trong giai đoạn 1996–2018. Chúng tôi nhận thấy rằng Bombay
Sensex phản ứng tích cực với Lãi suất quỹ liên bang. Chỉ số chứng khoán của Nam
Phi - FTSE JSE của Johannesburg - phản ứng tiêu cực với cú sốc giá dầu trong khi chỉ
số chứng khoán của Nga và Brazil - RTSI của Moscow và BVSP của Sao Paulo -
phản ứng tích cực với những thay đổi của giá vàng. Chúng tôi cung cấp các hàm ý về
quản lý và chính sách của những kết quả này.
- Kiểm định sự phù hợp của các mô hình hồi quy trên? Giải thích ý nghĩa các hệ
số hồi quy tìm được. Kỳ vọng về dấu của các hệ số hồi quy và kết quả hồi quy
mẫu có phù hợp không? Giải thích?
+) Sử dụng phần mềm Excel: Chọn Data Data Analysis Regression Chọn
vùng Input Y (GP) Chọn vùng Input X (CPI) Chọn vùng Output (nơi xuất dữ
liệu) → Nhấn OK. Ta có kết quả:
^
β 1=¿186,1833092: Khi chỉ số giá tiêu dùng CPI bằng 0 thì giá vàng trung bình tối
thiểu (GP) là 186,1833092$.
^
β 2=1,841992698: Khi chỉ số giá tiêu dung CPI tăng 1 đơn vị thì giá vàng trung bình
tăng 1,841992698 và ngược lại.
^
β 1=¿186,1833092: Khi chỉ số giá tiêu dùng CPI bằng 0 thì chỉ số chứng khoán
(NYSE) trung bình tối thiểu là -102,06055
^
β 2=2,12944 : Khi chỉ số giá tiêu dùng CPI tăng 1 đơn vị thì chỉ số chứng khoán
(NYSE) trung bình tăng 2,12944 và ngược lại.
Theo em, công cụ tài chính phòng chống lạm phát tốt hơn chính là vàng. Khi lạm phát
xảy ra, lãi suất ngân hàng trung ương sẽ giảm xuống dẫn đến nguồn cung tiền cho nền
kinh tế sẽ tăng. Tại thời điểm xảy ra tình trạng lạm phát, các nhà đầu tư có xu hướng
mua vàng để tích trữ nhiều hơn vì thế giá vàng sẽ tăng cao và ngược lại.
d) Tính giá trị kiểm định p_value khi kiểm định tính có ý nghĩa của các hệ số
trong 2 mô hình trên? Với mức ý nghĩa 5% hãy cho biết p_value tính được lớn
hơn hay nhỏ hơn mức ý nghĩa 5% ? Giải thích ý nghĩa của các p_value tính
được?
{ H 0 : β 1=0
Đặt giả thiết: H : β ≠ 0
1 1
{ H 0 : β 1=0
Đặt giả thiết: H : β ≠ 0
1 1
^
β1 −β1¿ 186,183−0
T 0= = =1,4846774
se ( ^
1β) 125,403
{ H 0 : β 2=0
Đặt giả thiết: H : β ≠ 0
1 2
^ ¿
β 2−β 2 1,84199−0
T 0= = =1,5159437
se ( ^
β 2) 1,21507
{ H 0 : β 1=0
Đặt giả thiết: H : β ≠ 0
1 1
^
β1 −β1¿ −102.60655−0
T 0= = =−4.317
se ( ^
β 1) 23,766
p-value = 2 × P ( T >−4.317 )=2× ( 0,5−0,5 )=0< α=0,05
{ H 0 : β 2=0
Đặt giả thiết: H : β ≠ 0
1 2
^ ¿
β 2−β 2 2,129442516−0
T 0= = =9,247017975
se ( ^
2β) 0,230284241
Bài 1.6: Trong kinh tế học vĩ mô, có hai lý thuyết khác nhau liên quan đến hành vi
tiêu dùng của dân chúng. Theo Keynes, tổng tiêu dùng (CONS) sẽ phụ thuộc vào
tổng thu nhập (khả dụng) (YD). Trong khi đó, các nhà kinh tế học cổ điển tin rằng tiêu
dùng có quan hệ nghịch biến với lãi suất (RR) trong nền kinh tế. Sử dụng số liệu trong
Bang1.4 (file Data_Chuong1.xlsx) (dữ liệu từ năm 1955-1986), bạn hãy:
a) Xây dựng các mô hình kinh tế cho mỗi giả thiết trên.
* Mô hình kinh tế của giả thiết theo Keynes, tổng tiêu dùng (CONS) sẽ phụ thuộc vào
tổng thu nhập (khả dụng) (YD).
Thu nhập: X
Tiêu dùng: Y
^
β 1 = -8,793
^
β 2 = 0,91311
Mô hình ước lượng từ mẫu: Y^ =-8,793+0,9131X
Hoặc: Y^ =-8,793+0,9131X+e
* Mô hình kinh tế của giả thiết các nhà kinh tế học cổ điển tin rằng tiêu dùng có quan
hệ nghịch biến với lãi suất (RR) trong nền kinh tế.
Lãi xuất: X
Tiêu dùng: Y
^
β 1 = 1370,69517
^
β 2 = 59,85887
Mô hình ước lượng từ mẫu: Y^ =1370,69517+59,85887X
Hoặc: Y^ =1370,69517+59,85887X+e
b) Bạn kỳ vọng như thế nào về dấu các hệ số đứng trước các biến giải thích trong
các mô hình này.
Kỳ vọng vào dấu của các hệ số đứng trước các biến giải thích ( β 2) trong các mô hình
tính được là số dương.
c) Ước lượng các tham số cho mỗi mô hình.
(Với độ tin cậy 95%, n>30)
Ước lượng tham số cho mô hình kinh tế của giả thiết theo Keynes:
- Khoảng ước lượng của tham số β 1
^
β 1 = -8,793
t n−2 30
α / 2 = t 0,025 = 2,042
se ¿ ) = 16,7198
¿> β 1 ∈¿ ))=(-42,9348;25,34883)
t n−2 30
α / 2 = t 0,025 = 2,042
se ¿ ) = 0,00944
¿> β 2 ∈¿ ))=(0,893838;0,93239)
Ước lượng tham số cho mô hình kinh tế của các nhà kinh tế học cổ điển:
- Khoảng ước lượng của tham số β 1
^
β 1 = 1370,69517
n−2 30
t α / 2 = t 0,025 = 2,042
se ¿ ) = 115,37482
¿> β 1 ∈¿ ))=(1135,09979;1606,29056)
d) Dựa trên các kết quả kinh tế lượng của bạn, bạn có nhận xét gì về giá trị của
hai giả thiết trên.
Dựa vào kết quả kinh tế lượng đã tính ở trên ta có thể thấy được theo mô hình
kinh tế của giả thiết theo Keynes khoảng ước lượng của các tham số β 2 chênh lệch
thấp -> ε i bé nên gía trị thực tế của biến phụ thuộc nằm gần đường hồi quy.
Dựa vào kết quả kinh tế lượng đã tính ở trên ta có thể thấy được mô hình kinh tế
của các nhà kinh tế học cổ điển khoảng ước lượng của các tham số β 2 chênh lệch
rất lớn -> ε i lớn nên gía trị thực tế của biến phụ thuộc nằm xa đường hồi quy.
e) Với các mô hình trên hãy tìm ít nhất 2 paper ủng hộ các quan điểm này.
Ủng hộ quan điểm Keynes:
Link: https://sci-hub.hkvisa.net/10.1016/S0926-6437(97)80003-0
Lý thuyết Tổng quát cho rằng phân phối thu nhập ảnh hưởng đến tiêu dùng. Bình đẳng
thu nhập cao hơn đưa nhiều tiền hơn vào tay những người có MPC cao hơn, dẫn đến
tăng tiêu dùng; và bất bình đẳng lớn hơn đã có tác động ngược lại. Tuy nhiên, trong số
sáu yếu tố khách quan mà Keynes xác định là ảnh hưởng đến tiêu dùng, chỉ có yếu tố
phân phối đã không trở thành một phần của lý thuyết tiêu dùng chủ đạo. Bài báo này
xem xét lý do tại sao lại như vậy, và sau đó phát triển một mô hình kết hợp phân phối
sau thuế vào một hàm tiêu dùng theo trường phái Keynes. Các thử nghiệm thực
nghiệm của mô hình này cho thấy rằng phân phối thu nhập sau thuế là một yếu tố
quyết định đáng kể đến tiêu dùng.
Keynes's personal investments in the London Stock Exchange and his views on the
transformation of the British economy.
Link: https://sci-hub.hkvisa.net/10.1016/j.strueco.2020.02.002
Trong bài báo này, chúng tôi phân tích các khoản đầu tư cá nhân của Keynes trong sở
giao dịch chứng khoán Luân Đôn tập trung vào lựa chọn của Keynes và mô hình lựa
chọn tài sản và lĩnh vực hơn là hiệu suất danh mục đầu tư. Trong số những thứ khác,
cách tiếp cận này có thể giúp định giá của Keynes về nền kinh tế Anh đã trải qua
những thay đổi cấu trúc đáng kể trong cuộc chiến giữa các giai đoạn. Đánh giá dựa
trên hành vi giao dịch của Keynes và triết lý đầu tư cung cấp mục bổ sung đáng kể
cho những gì chúng tôi cũng biết từ những tuyên bố công khai của những vị trí đã đảm
nhận chính trường, thậm chí còn hơn thế nữa, cho đến nay không có nỗ lực xây dựng
lại chi tiết các khoản đầu tư cá nhân của ông.
Ủng hộ quan điểm của các nhà kinh tế học cổ điển:
Link: https://sci-hub.hkvisa.net/10.1016/j.jedc.2018.07.004
Chúng tôi xem xét ảnh hưởng của việc thay đổi lãi suất đối với các quyết định tiêu
dùng và tiết kiệm của một đại lý khi thu nhập của cô ấy biến động. Trong mỗi thời kỳ,
một đại lý tồn tại lâu dài sẽ quyết định tiết kiệm bao nhiêu (tức là đầu tư vào một trái
phiếu rủi ro) và bao nhiêu để tiêu dùng trong khi thu nhập và tỷ suất lợi nhuận trên
khoản tiết kiệm của cô ấy không chắc chắn và phụ thuộc vào tình trạng của nền kinh
tế. Chúng tôi chỉ ra rằng dưới sự cô đọng của hàm tiêu dùng, một điều kiện đảm bảo
rằng tác động thay thế chiếm ưu thế so với tác động thu nhập, lãi suất thấp hơn
khuyến khích tiêu dùng của đại lý trên tất cả các tiểu bang.
Link: https://sci-hub.hkvisa.net/10.1016/j.jfineco.2005.02.004
Bài báo này đề xuất một mô hình dựa trên tiêu dùng có nhiều đặc điểm trong cấu trúc
kỳ hạn danh nghĩa của lãi suất. Động lực đằng sau mô hình là giá rủi ro thay đổi theo
thời gian do thói quen bên ngoài tạo ra. Trái phiếu danh nghĩa phụ thuộc vào tăng
trưởng tiêu dùng trong quá khứ thông qua thói quen và lạm phát kỳ vọng. Khi được
hiệu chỉnh với dữ liệu về tiêu dùng, lạm phát và thị trường tổng hợp, mô hình tạo ra
các phương tiện và độ biến động thực tế của lợi tức trái phiếu và tính toán cho câu đố
kỳ vọng. Mô hình này cũng thể hiện phần bù vốn chủ sở hữu cao và sự biến động vượt
mức của thị trường chứng khoán.
f) Kiểm định tính có ý nghĩa của các hệ số hồi quy ? Theo bạn việc các hệ số đứng
trước biến giải thích có ý nghĩa có thể được xem là mô hình đưa ra phù hợp
không ? Giải thích.
( kiểm định với mức ý nghĩa 5%)
Kiểm định tính có ý nghĩa của hệ số hồi quy cho mô hình kinh tế của giả thiết theo
Keynes:
Đặt giả thiết: H 0 : β 2=0 ; H 1 : β 2 ≠ 0
n−2 30
t α / 2 = t 0,025 = 2,042
^
β 2−β ¿2 0,91311−0 30 30
T 0= = =96,7277 ∉(−t 0,025 ; t 0,025)
^
se ( β ) 0,00944
2
→ Bác bỏ H 0, vậy hệ số β 2thật sự có ý nghĩa trong mô hình hồi quy hay ta có thể nói
rằng thu nhập có ảnh hưởng đến tiêu dùng
Kiểm định tính có ý nghĩa của hệ số hồi quy cho mô hình kinh tế của các nhà kinh tế
học cổ điển:
Đặt giả thiết: H 0 : β 2=0 ; H 1 : β 2 ≠ 0
t n−2 30
α / 2 = t 0,025 = 2,042
^ ¿
β 2−β 2 59,85887−0
T 0= = =2,03 ∈(−t 30 30
0,025 ;t 0,025 )
^
se ( β ) 29,4878
2
→ Chấp nhận H 0, vậy hệ số β 2 không có ý nghĩa trong mô hình hồi quy hay ta có thể
nói rằng lãi xuất không ảnh hưởng đến tiêu dùng.
Kết luận:
1) Theo em việc các hệ số đứng trướng biến giải thích có ý nghĩa có thể xem là
mô hình đưa ra phù hợp chỉ trong mô hình hồi quy đơn biến. Tại vì để kiểm
định sự phù hợp của mô hình ta sẽ đưa ra cặp giả thiết cần kiểm định là
H 0 : R =0 ; H 1 : R ≠ 0tương đường với giả thiết kiểm định tính có ý nghĩa
2 2
H 0 : β 2=0 ; H 1 : β 2 ≠ 0 . Mục đích kiểm định tính có ý nghĩa của hệ số hồi quy là
một hệ số (tham số) hồi quy được gọi là có ý nghĩa khi và chi khi β ikhác 0 và
một mô hình hồi quy được gọi là phù hợp khi và chỉ khi R2 khác 0.
2) Còn trong hồi quy đa biến thì R2 khác 0; β ikhác 0 là hoàn toàn khác biệt nhau.
g) Dự báo điểm, khoảng cho các giá trị của biến phụ thuộc trong mô hình trên
Dự báo điểm từ năm (1955-1986) chạy bằng excel:
(Cột dự báo điểm là cột Predicted)
Tính thủ công với một điểm cụ thể:
Với một điểm cụ thể khi với thu nhập là 2001 ( năm 1976 ) ta xét trong 3 trường hợp
sau:
Trường hợp 1: Dự báo cho tiêu dùng trung bình.
Ứng với X=2001 thì E(Y/X=2001)=-8,973+0,91311*2001=1818,34011
→ Đây là dự báo điểm cho tiêu dùng trung bình.
Trường hợp 2: Dự báo cho tiêu dùng trung bình với độ tin cậy 95%
RSS 21906,3715
σ 2= = =730,21238
n−2 32−2
n
S XX =∑ x i −n ¿100369917,7-32¿(1697,2125)2=8192949,055
2
i=1
√( )
2
1 ( x i−x )
y i ) =√ Var ( ^
se ( ^ yi )= + σ2
n S XX
√( )
2
1 ( 2001−1697,2125 )
¿ + ∗730,21238=5,5717
32 8192949,055
E(Y/X= x i ¿ ∈ ^ (
y i ±t n−2
α ∗se ( ^
2
y i ) =¿ )
)
⇒E(Y/X= x i ¿ ∈ (1806,96;1829,7175)
→ Đây là dự báo khoảng cho tiêu dùng trung bình
Trường hợp 3: Dự báo cho tiêu dùng cụ thể với thu nhập là 2001 với độ tin cậy 95%
√( )
2
1 ( x i−x ) 2
yi ) =√ Var ( y i−^
se ( y i− ^ y i )= 1+ + σ =27,59
n S XX
(
y i ± t n−2
yi ∈ ^ α ∗se ( y i −^
2
)
y i ) =( 1818,34011± 2,042∗27,59 ) =(1762 ; 1874,68)
^β = 5.067: Khi không tự học thì số điểm trung bình tối thiểu mà một bạn sinh viên có
1
trung bình môn KTCT của sinh viên đó tăng thêm 0.463 điểm.
b) Tính toán hệ số xác định R2. Dựa vào hệ số xác định, hãy cho nhận xét về chất
lượng mô hình. Giải thích nguyên nhân vì sao dẫn đến hệ số xác định R2 có kết
quả như trên.
- Hệ số xác định R2 = 0.262
- Nhận xét về chất lượng mô hình: Vì hệ số xác định R2= 0.262 nên các phần tử trong
mô hình có ít phần tử nằm gần đường hồi quy, do vậy đường hồi quy mẫu ở mô hình
sẽ phản ánh xu thế của đường hồi quy tổng thể kém hơn hơn. Do đó, chất lượng mô
hình yếu, điểm trung bình của KTCT phụ thuộc vào những yếu tố khác nhiều hơn là
số giờ tự học trong tuần.
- Nguyên nhân vì sao dẫn đến hệ số xác định R2 có kết quả như trên: Trong 100% sự
biến động của điểm trung bình môn KTCT thì có 26.2% sự biến động là do số giờ tự
học trong tuần ảnh hưởng, còn lại là do các yếu tố khác. Nghĩa là, trong 36 sinh viên
khoảng 9 sinh viên mà điểm trung bình KTCT được giải thích qua giờ tự học mỗi
tuần.
c) Tính toán giá trị kiểm định T o tương ứng của từng biến. Các biến này có ý
nghĩa thống kê ở mức 5% không?
β^ 2−0 β^ 2 0.463
T0 = = = =3.481 với se( ^β2 ) là Standard error trong bảng Excel
^ ^
se ( β 2) se ( β 2 ) 0.133
{ H 0 : β 2=0
H 1 : β2≠ 0
T0 ∉ (-2.03;2.03)
→ Bác bỏ H0. Vậy với mức ý nghĩa 5%, mô hình hồi quy có ý nghĩa. Tức là, điểm
trung bình môn KTCT của sinh viên phụ thuộc vào số giờ tự học trong tuần.
d) Xác định độ tin cậy 95% của β2 tổng thể. Nêu ý nghĩa của độ tin cậy vừa xác
định được.
^β = 0.463 34
t 0.025=2.36 (dùng hàm “=T.INV.2T(alpha, n-2)” trong Excel)
2
Ý nghĩa của độ tin cậy vừa xác định được: Khi tham số (hệ số) β 2 ∈
(0.14912;0.77688) thì
e) Tìm ít nhất 2 paper ủng hộ cho mối liên hệ trong mô hình.
Temporally-focused analytics of self-regulated learning: A systematic review of
literature - JohnSaint, YizhouFan, DraganGašević, AbelardoPardo.
Link: https://reader.elsevier.com/reader/sd/pii/S2666920X22000157?
token=67988898554D256531A42A3648066DE6D92CEA69846BF14F5B8036A3416
D74F875990383A01EDA7E24C92B2A01854082&originRegion=eu-west-
1&originCreation=20220326072501
Nghiên cứu này nhằm điều tra các đặc điểm tự học và mối quan hệ của nó với thành
tích học tập. Bài báo phản ánh việc sử dụng thực tế giờ tự học trong quá trình học tập.
Ngoài ra, phân tích dựa trên các mô hình lý thuyết và tài khoản phương pháp luận
thường được sử dụng trong nghiên cứu trong lĩnh vực này. Do đó, những phát hiện
trong đây có thể được khái quát cho các nghiên cứu đại diện cho nghiên cứu về các
khía cạnh thời gian và tuần tự trong quá trình tự học.
Self-Regulated Learning and Academic Achievement: An Overview - Barry J.
Zimmerman.
Link:https://ciel.viu.ca/sites/default/files/
self_regulated_learning_and_academic_achievement_an_overview_0.pdf
Nghiên cứu thảo luận về cách nghiên cứu các quy trình thành phần góp phần vào sự
hiểu về các đặc điểm đặc biệt của việc tự học của sinh viên. Bên cạnh đó, ý nghĩa của
sự tự điều chỉnh hối cảnh học tập và thành tích của sinh viên được chọn để xem xét.
Cách sinh viên chọn, sắp xếp hoặc tạo môi trường học tập thuận lợi cho bản thân và
về cách họ lập kế hoạch và kiểm soát giờ tự học. Phân tích nghiên cứu và lý thuyết
gần đây về các quy trình tự điều tiết quan trọng của sinh viên sử dụng để học và đạt
được học tập. Những nỗ lực có thể được đưa ra để dạy tự điều chỉnh cho những sinh
viên tiếp cận học tập thụ động, và một số nỗ lực đáng chú ý đã được thực hiện.
Câu 1.8: Giả sử chúng ta nghiên cứu mối quan hệ giữa chi tiêu cho nghiên cứu và
phát triển (ký hiệu là , tính bằng tỷ dollars, giá cố định 1992) với số lượng bằng sáng
chế phát minh (ký hiệu là , tình bằng số lượng nghìn), tại Mỹ từ năm 1960 -1993; tức
là chúng ta có bộ số liệu gồm quan sát. Dưới đây là bảng báo cáo kết quả hồi quy:
PATENTS = 34.571+ 0.792R & D
(5.44) (13.79)
R2=0.859 N =34 ESS=3994.3
(số trong ngoặc là standard error)
a) Nếu thu chi tiêu cho nghiên cứu phát triển tăng thêm lên 1 tỷ dollars, thì số
lượng bằng phát minh sáng chế sẽ tăng lên bao nhiêu?
Nếu thu chi tiêu cho nghiên cứu phát triển tăng thêm lên 1 tỷ dollars, thì số lượng
bằng phát minh sáng chế sẽ tăng lên 0.792 (nghìn) bằng, tức là tăng lên 792 bằng.
b) Cho trước t 32
0.025 =2.042. Hãy tìm khoảng tin cậy của hệ số
β 1của tổng thể với
se( ^β 0) = 5.44
=> β 0 ∈(23.46252 ; 45.67948)
Vậy khoảng tin cậy cuả hệ số β 0 là (23.46252 ; 45.67948)
e) Một nhà báo nói rằng, cứ 1 tỷ dollars chi tiêu cho nghiên cứu phát triển, thì sẽ
làm tăng số lượng bằng phát minh sáng chế lên vào khoảng 500. Hãy kiểm định
lại nhận định đó với mức ý nghĩa là 10%, tức là sử dụng t 32
0.05=¿ 1.679.
Cứ 1 tỷ dollars chi tiêu cho nghiên cứu phát triển, thì sẽ làm tăng số lượng bằng phát
minh sáng chế lên vào khoảng 500 bằng ≡ Cứ 1 tỷ dollars chi tiêu cho nghiên cứu
phát triển, thì sẽ làm tăng số lượng bằng phát minh sáng chế lên vào khoảng 0.5
(nghìn) bằng ⟺ β 1 (trong slide của thầy là β 2)=0.5
Cặp giả thiết cần kiểm định;
{ H 0 : β 1=0.5
H 1 : β 1 ≠ 0.5
^β 1= 0.792. t 0,05 [32] =1.679
→ Chấp nhận H 0. Vậy nhận định của nhà báo là đúng (Cứ 1 tỷ dollars chi tiêu cho
nghiên cứu phát triển, thì sẽ làm tăng số lượng bằng phát minh sáng chế lên vào
khoảng 500 bằng).
Bài 1.9:
a) Ước Lượng mối quan hệ giữa bảo hiểm nhân thọ (INSUR) và thu nhập gia
đình (INC).
+) Áp dụng công thức:
Tính toán thủ công ta có được:
x=59,3 y=236,95
2
x =4336,3 xy=17232,15
^ xy−x . y
β2 = 2 2 = 3.88
x −(x )
^
β 1 = y− ^
β2 . x = 6.85
√
n
∑ x 2i σ
2
β 1) = √ Var ( ^
se ( ^ β 1) = i=1
. = 7.38
n n
∑ ( x i−x ) 2
i=1
√
2
σ
β 2) = √ Var ( ^
se( ^ β 2) = n
= 0.112
∑ ( x i−x)2
i=1
Khoảng tin cậy ^
β 1:
β 2 ∈( ^
β 2 ± t α . se ( β^2 ) ) = (3.644620543 ; 4.115750763)
n−2
{
Cách 1: Ứng với cặp giả thiết cần kiểm định là: H : β ≠ 0
1 2
H 0 : β 2=0
{
Cách 2: Ứng với cặp giả thiết cần kiểm định là: H : β ≠ 0
1 2
H 0 : β 2=0
^ ¿
β2 −β2 3.88−0
Giá trị kiểm định T 0 = = = 34.64
se( ^
β2 ) 0.112
Ta có: t n−2 18
α / 2 = t 0.025 = 2.101
3. Nếu một thành viên ban quản lý tuyên bố rằng, cứ mỗi 1000 USD tăng lên về
thu nhập sẽ làm tăng bảo hiểm nhân thọ lên 5000 USD. Liệu kết quả ước lượng
của bạn có hỗ trợ cho lời tuyên bố này với mức ý nghĩa 5% (5% significance
level)?
Cứ mỗi 1000 USD tăng lên về thu nhập sẽ làm tăng bảo hiểm nhân thọ lên 5000 USD
hay nói cách khác Cứ mỗi 1000 USD tăng lên về thu nhập sẽ làm tăng bảo hiểm nhân
thọ lên 0,5 (chục nghìn) USD.
{ H 0 : β 2=0,5
Đặt giả thiết: H : β ≠ 0,5
1 2
t 18
0,025 =2,101
^ ¿
β 2−β 2 3,88−0,5
T 0= = =30,18 ∉(−2,101 ; 2,101)
se ( β^ )
2
0.112
Bác bỏ H 0.
Vậy lời tuyên bố: cứ mỗi 1000 USD tăng lên về thu nhập sẽ làm tăng bảo hiểm nhân
thọ lên 5000 USD là không đúng.
4. Dự đoán mức bảo hiểm nhân thọ điểm, khoảng cho hộ gia đình có thu nhập là
100 nghìn USD.
13
RSS=∑ ( y i− ^
y i )2=¿ ¿3710,37
i=1
2 RSS
σ = =206,13
n−2
20
S xx =∑ ( xi −x́)2=16396,2
i=1
√( )
2
1 ( x i− x́ )
y i ¿= √ Var ( y i− ^
se( y i− ^ 2
yi ) = 1+ + . σ =15,4
n S xx
y i ∈(362,4946 ; 427,2054)
Chọn Data → Data Analysis → Regression → Chọn vùng Input Y (INSUR) → Chọn
vùng Input X (INC) → Chọn vùng Output (nơi xuất dữ liệu) → Chọn Line Fit Plot →
Nhấn OK.
c) Tìm ít nhất 2 paper ủng hộ mối liên hệ trên.
The impact of real income on insurance premiums: Evidence from panel data.
Link:https://doi.org/10.1016/j.iref.2011.07.003
Tác giả sử dung mô hình hồi quy ngưỡng để phân tích độ co giãn của chi phí bảo hiểm
so với thu nhập thực tế của 36 quốc gia được chọn và trong khoảng thời gian từ 1979-
2007. Tác giả đã kết luận rằng những thay đổi trong thu nhập thực tế là một trong
những yếu tố gây ra sự thay đổi cơ cấu trong mối quan hệ giữa phí bảo hiểm và thu
nhập.
Link:https://core.ac.uk/reader/188225700
Ba loại phân tích dữ liệu được thực hiện là giải thích thống kê mô tả cho tất cả các
biến; sử dụng phương pháp Bình phương tối thiểu (OLS) để đánh giá mối quan hệ
tuyến tính giữa các biến phụ thuộc và các biến độc lập; và việc thực hiện kiểm định
Johansen và phép thử quan hệ nhân quả Granger để xác định xem liệu có tồn tại mối
quan hệ nhân quả giữa thu nhập với mức độ biết và sử dụng bảo hiểm nhân thọ hay
không. Tác giả đưa ra ba giả thiết và lần lượt kiểm định chúng. Trong đó, có một giả
thiết đề cập đến thu nhập bình quân đầu người được coi là một yếu tố quyết định tích
cực và đáng kể đến việc tiêu dùng bảo hiểm tang lễ và nhân thọ. Cuối cùng, tác giả đã
đưa ra kết luận rằng kết quả kiểm định phù hợp với giả thiết đã đề ra.
Bài 1.10: Hội Sinh viên một trường Đại học tại Mỹ của một trường Đại học tại Mỹ
mở một cuộc điều tra ngẫu nhiên 427 sinh viên một trường Đại học tại Mỹ của trường
để hiểu thêm về mối quan hệ giữa điểm trung bình tích lũy đại học (COLGPA), lần
lượt với điểm trung bình cuối năm phổ thông (HSGPA), điểm kiểm tra kỹ năng học
tập (VSAT) và điểm kiểm tra toán trong kỳ thi SAT (MSAT). Hội Sinh viên một
trường Đại học tại Mỹ này chạy hồi qui ra được 3 mô hình hồi qui đơn biến như sau
(số trong ngoặc là standard error):
CLOGPA= 0.92058 + 0.52147HSGPA + ε R2 =0.165
(0.20463) (0.05712)
CLOGPA= 1.99740 + 0.00157VSAT +ε R2 =0.070
(0.20463) (0.05712)
CLOGPA= 1.62845 + 0.00204MAST +ε R =0.124
2
(0.15135) (0.00026)
a) Nhận xét ý nghĩa kinh tế của từng mô hình trong 3 mô hình trên?
Mô hình 1:
CLOGPA= 0.92058 + 0.52147HSGPA + ε R =0.165
2
(0.20463) (0.05712)
β 1=0.92058 : Khi sinh viên một trường Đại học tại Mỹ đạt 0 điểm trung bình cuối
năm phổ thông thì điểm trung bình tích lũy đại học của họ có giá trị trung bình tối
thiểu là 0.92058 điểm.
β 2=0.52147 : Khi điểm trung bình cuối năm phổ thông của sinh viên một trường Đại
học tại Mỹ tăng thêm 1 điểm thì điểm trung bình tích lũy đại học trung bình của họ
tăng thêm 0.52147 điểm (trong điều kiện các yếu tố khác không đổi).
Mô hình 2:
CLOGPA= 1.99740 + 0.00157VSAT +ε R2 =0.070
(0.20463) (0.05712)
β 1=1.99740: Khi sinh viên một trường Đại học tại Mỹ đạt 0 điểm kiểm tra kỹ năng
học tập thì điểm trung bình tích lũy đại học của họ có giá trị trung bình tối thiểu là
1.99740 điểm..
β 2=0.00157 : Khi điểm kiểm tra kỹ năng học tập của sinh viên một trường Đại học
tại Mỹ tăng thêm 1 điểm thì điểm trung bình tích lũy đại học trung bình của họ tăng
thêm 0.00157 điểm (trong điều kiện các yếu tố khác không đổi).
Mô hình 3:
CLOGPA= 1.62845 + 0.00204MAST +ε R2 =0.124
(0.15135) (0.00026)
β 1=1.62845: Khi sinh viên một trường Đại học tại Mỹ đạt 0 điểm kiểm tra Toán
trong kỳ thi SAT thì điểm trung bình tích lũy đại học của họ có giá trị trung bình tối
thiểu là 1.62845.
β 2=0.00204 : Khi điểm kiểm tra Toán trong kỳ thi SAT của sinh viên một trường Đại
học tại Mỹ tăng thêm 1 điểm thì điểm trung bình tích lũy đại học trung bình của họ
tăng thêm 0.00204 điểm (trong điều kiện các yếu tố khác không đổi).
b) Ý nghĩa của hệ số xác định. Dựa trên hệ số xác định, mô hình nào là tốt nhất.
Ý nghĩa của hệ số xác định:
Mô hình 1:
CLOGPA= 0.92058 + 0.52147HSGPA + ε R2 =0.165
(0.20463) (0.05712)
→ Có khoảng 70 sinh viên mà điểm trung bình tích lũy đại học (CLOGPA) được giải
thích qua điểm trung bình cuối năm phổ thông (HSGPA) của họ.
Mô hình 2:
CLOGPA= 1.99740 + 0.00157VSAT +ε R =0.070
2
(0.20463) (0.05712)
→ Có khoảng 30 sinh viên mà điểm trung bình tích lũy đại học (CLOGPA) được giải
thích qua điểm kiểm tra kỹ năng học tập (VSAT) của họ.
Mô hình 3:
CLOGPA= 1.62845 + 0.00204MAST +ε R2 =0.124
(0.15135) (0.00026)
→ Có khoảng 53 sinh viên mà điểm trung bình tích lũy đại học (CLOGPA) được giải
thích qua điểm kiểm tra Toán trong kỳ thi SAT (MSAT) của họ.
Ở cả 3 mô hình, cỡ mẫu khảo sát đều là n=427 sinh viên nên mô hình 1 là tốt nhất
vì hệ số xác định R2 của mô hình này là lớn nhất trong 3 mô hình⇒ Các phần tử
trong mô hình 1 sẽ có nhiều phần tử nằm gần đường hồi quy hơn, đồng thời
đường hồi quy mẫu ở mô hình 1 sẽ phản ánh xu thế của đường hồi quy tổng thể
tốt hơn.
c) Hãy tính giá trị kiểm định T 0 (t stat ) của các biến độc lập tương ứng với từng mô
hình trong 3 mô hình trên với mức ý nghĩa 5%. Nhận xét về ý nghĩa của các biến
giải thích trong từng mô hình. Cho biết mô hình nào là tốt nhất theo R2 và t stat
- Ý thứ nhất: Hãy tính giá trị kiểm định T 0 (t stat ) của các biến độc lập tương ứng với
từng mô hình trong 3 mô hình trên với mức ý nghĩa 5%.
Với mức ý nghĩa α =0.05
Mô hình 1:
^
β 2−0 ^
β2 0.52147
T 0= = = ≈ 9.13
se ( β^ ) se ( ^
2 2β ) 0.05712
Mô hình 2:
^
β 2−0 ^
β2 0.00157
T 0= = = ≈ 0.03
se ( ^
β 2 ) se ( ^
β 2 ) 0.05712
Mô hình 3:
^
β 2−0 ^
β2 0.00204
T 0= = = ≈ 7.85
se ( β ) se ( β ) 0.00026
^
2
^
2
- Ý thứ hai: Nhận xét về ý nghĩa của các biến giải thích trong từng mô hình.
Cặp giả thiết cần kiểm định:
{ H 0 : β 2=0
H 1 : β2≠ 0
Mô hình 1:
^
β 2−0 ^
β2 0.52147
T 0= = = ≈ 9.13 ∉ (-1,97;1,97)
se ( β ) se ( β ) 0.05712
^
2
^
2
→ Bác bỏ H 0. Vậy hệ số β 2 có ý nghĩa, suy ra mô hình hồi quy có ý nghĩa, tức là điểm
trung bình tích lũy đại học có phụ thuộc vào điểm trung bình cuối năm phổ thông (Khi
điểm trung bình cuối năm phổ thông tăng lên thì điểm trung bình tích lũy đại học cũng
tăng).
Mô hình 2:
^
β 2−0 ^
β2 0.00157
T 0= = = ≈ 0.03 ∈ (-1,97;1,97)
se ( β^ ) se ( ^
2 β ) 0.05712
2
→ Chấp nhận H 0 . Vậy hệ số β 2 không có ý nghĩa, suy ra mô hình hồi quy không có ý
nghĩa, tức là điểm trung bình tích lũy đại học không phụ thuộc vào điểm kiểm tra kỹ
năng học tập (Khi điểm kiểm tra kỹ năng học tập tăng lên thì điểm trung bình tích lũy
đại học cũng tăng).
Mô hình 3:
^
β 2−0 ^
β2 0.00204
T 0= = = ≈ 7.85 ∉ (-1,97;1,97)
se ( ^
β ) se ( ^
2 β ) 0.00026
2
→ Bác bỏ H 0. Vậy hệ số β 2 có ý nghĩa, suy ra mô hình hồi quy có ý nghĩa, tức là điểm
trung bình tích lũy đại học có phụ thuộc vào điểm kiểm tra Toán trong kỳ thi SAT
(Khi điểm kiểm tra Toán trong kỳ thi SAT tăng lên thì điểm trung bình tích lũy đại
học cũng tăng).
Cách 2:
Mô hình 1:
^
β 2−0 ^
β2 0.52147
T 0= = = ≈ 9.13
se ( ^
β 2 ) se ( ^
β 2 ) 0.05712
⟹ p value=2∗P ( T > 9.13 )=2∗( 0.5−0.5 )=0< α=0.05
→ Bác bỏ H 0. Vậy hệ số β 2 có ý nghĩa, suy ra mô hình hồi quy có ý nghĩa, tức là điểm
trung bình tích lũy đại học có phụ thuộc vào điểm trung bình cuối năm phổ thông (Khi
điểm trung bình cuối năm phổ thông tăng lên thì điểm trung bình tích lũy đại học cũng
tăng).
Mô hình 2:
^
β 2−0 ^
β2 0.00157
T 0= = = ≈ 0.03
se ( β^ ) se ( ^
2 β ) 0.05712
2
se ( ^
β 2 ¿=0.05712
⟹ Khoảng tin cậy cho tham số β 2 ∈ (0,409;0,634)
¿
Ta thấy β 2=0 (điểm) không thuộc khoảng này.
→ Bác bỏ H 0. Vậy hệ số β 2 có ý nghĩa, suy ra mô hình hồi quy có ý nghĩa, tức là điểm
trung bình tích lũy đại học có phụ thuộc vào điểm trung bình cuối năm phổ thông (Khi
điểm trung bình cuối năm phổ thông tăng lên thì điểm trung bình tích lũy đại học cũng
tăng).
Mô hình 2:
^
β 2=0.00157 t 425
0.05=1.97
se ( ^
β 2 ¿=0.05712
⟹ Khoảng tin cậy cho tham số β 2 ∈ (-0,11;0,11)
¿
Ta thấy β 2=0 (điểm) thuộc khoảng này.
→ Chấp nhận H 0 . Vậy hệ số β 2 không có ý nghĩa, suy ra mô hình hồi quy không có ý
nghĩa, tức là điểm trung bình tích lũy đại học không phụ thuộc vào điểm kiểm tra kỹ
năng học tập (Khi điểm kiểm tra kỹ năng học tập tăng lên thì điểm trung bình tích lũy
đại học cũng tăng).
Mô hình 3:
^
β 2=0.00204 t 425
0.05=1.97
se ( ^
β 2 ¿=0.00026
⟹ Khoảng tin cậy cho tham số β 2 ∈ (0,0015;0,0026)
¿
Ta thấy β 2=0 (điểm) không thuộc khoảng này.
→ Bác bỏ H 0. Vậy hệ số β 2 có ý nghĩa, suy ra mô hình hồi quy có ý nghĩa, tức là điểm
trung bình tích lũy đại học có phụ thuộc vào điểm kiểm tra Toán trong kỳ thi SAT
(Khi điểm kiểm tra Toán trong kỳ thi SAT tăng lên thì điểm trung bình tích lũy đại
học cũng tăng).
- Ý thứ ba: Cho biết mô hình nào là tốt nhất theo R2 và t stat
Theo R2:
Kiểm định sự phù hợp của mô hình:
{
2
H : R =0
Cặp giả thiết cần kiểm định 0 2
H1 : R ≠ 0
Mô hình 1:
2
R ∗( n−2 )
F= =83.98
1−R 2
Mô hình 2:
2
R ∗( n−2 )
F= 2
=31.99
1−R
Mô hình 3:
2
R ∗( n−2 )
F= 2
=60.16
1−R
Theo R2 với mức ý nghĩa 5%, cả 3 mô hình đều phù hợp do có F > F 0.05;1;425. Thế
nhưng mô hình 1 là tốt nhất do có R2 lớn nhất khi xét trên cùng một cỡ mẫu (n=427).
Theo t stat :
Theo bài toán kiểm định ở ý 1 câu c, mô hình 1 và mô hình 3 có ý nghĩa, mô hình 2
không có ý nghĩa nên mô hình 2 không phải là một mô hình tốt.
d) Hãy tính giá trị kiểm định t stat của các biến độc lập tương ứng với từng mô
hình trong 3 mô hình trên với mức ý nghĩa 1%. Nhận xét về ý nghĩa của các biến
giải thích trong từng mô hình. Cho biết mô hình nào là tốt nhất theo R2 và t stat .
- Ý thứ nhất: Hãy tính giá trị kiểm định T 0 (t stat ) của các biến độc lập tương ứng với
từng mô hình trong 3 mô hình trên với mức ý nghĩa 1%.
Với mức ý nghĩa α =0.0 1
Mô hình 1:
^
β 2−0 ^
β2 0.52147
T 0= = = ≈ 9.13
se ( β ) se ( β ) 0.05712
^
2
^
2
Mô hình 2:
^
β 2−0 ^
β2 0.00157
T 0= = = ≈ 0.03
se ( ^
β 2 ) se ( ^
β 2 ) 0.05712
Mô hình 3:
^
β 2−0 ^
β2 0.00204
T 0= = = ≈ 7.85
se ( β ) se ( β ) 0.00026
^
2
^
2
- Ý thứ hai: Nhận xét về ý nghĩa của các biến giải thích trong từng mô hình.
Cặp giả thiết cần kiểm định:
{ H 0 : β 2=0
H 1 : β2≠ 0
Mô hình 1:
^
β 2−0 ^
β2 0.52147
T 0= = = ≈ 9.13 ∉ (-2.59;2.59)
se ( β^ ) se ( ^
2 2 β ) 0.05712
→ Bác bỏ H 0. Vậy hệ số β 2 có ý nghĩa, suy ra mô hình hồi quy có ý nghĩa, tức là điểm
trung bình tích lũy đại học có phụ thuộc vào điểm trung bình cuối năm phổ thông (Khi
điểm trung bình cuối năm phổ thông tăng lên thì điểm trung bình tích lũy đại học cũng
tăng).
Mô hình 2:
^
β 2−0 ^
β2 0.00157
T 0= = = ≈ 0.03 ∈ (-2.59;2.59)
se ( ^
β ) se ( ^
2 2β ) 0.05712
→ Chấp nhận H 0 . Vậy hệ số β 2 không có ý nghĩa, suy ra mô hình hồi quy không có ý
nghĩa, tức là điểm trung bình tích lũy đại học không phụ thuộc vào điểm kiểm tra kỹ
năng học tập (Khi điểm kiểm tra kỹ năng học tập tăng lên thì điểm trung bình tích lũy
đại học cũng tăng).
Mô hình 3:
^
β 2−0 ^
β2 0.00204
T 0= = = ≈ 7.85 ∉ (-2.59;2.59)
se ( ^
β ) se ( ^
2 2β ) 0.00026
→ Bác bỏ H 0. Vậy hệ số β 2 có ý nghĩa, suy ra mô hình hồi quy có ý nghĩa, tức là điểm
trung bình tích lũy đại học có phụ thuộc vào điểm kiểm tra Toán trong kỳ thi SAT
(Khi điểm kiểm tra Toán trong kỳ thi SAT tăng lên thì điểm trung bình tích lũy đại
học cũng tăng).
Cách 2:
Mô hình 1:
^
β 2−0 ^
β2 0.52147
T 0= = = ≈ 9.13
se ( ^
β ) se ( ^
2 2β ) 0.05712
⟹ p value=2∗P ( T > 9.13 )=2∗( 0.5−0.5 )=0< α=0.05
→ Bác bỏ H 0. Vậy hệ số β 2 có ý nghĩa, suy ra mô hình hồi quy có ý nghĩa, tức là điểm
trung bình tích lũy đại học có phụ thuộc vào điểm trung bình cuối năm phổ thông (Khi
điểm trung bình cuối năm phổ thông tăng lên thì điểm trung bình tích lũy đại học cũng
tăng).
Mô hình 2:
^
β 2−0 ^
β2 0.00157
T 0= = = ≈ 0.03
se ( ^
2β ) se ( ^
β ) 0.05712
2
{
2
H : R =0
Cặp giả thiết cần kiểm định 0 2
H1 : R ≠ 0
Mô hình 1:
2
R ∗( n−2 )
F= 2
=83.98
1−R
Mô hình 2:
R 2∗( n−2 )
F= 2
=31.99
1−R
Mô hình 3:
2
R ∗( n−2 )
F= 2
=60.16
1−R
Theo R2 với mức ý nghĩa 1%, cả 3 mô hình đều phù hợp do có F > F0.01;1;425. Thế
nhưng mô hình 1 là tốt nhất do có R2 lớn nhất khi xét trên cùng một cỡ mẫu (n=427).
Theo t stat :
Theo bài toán kiểm định ở ý 1 câu c, mô hình 1 và mô hình 3 có ý nghĩa, mô hình 2
không có ý nghĩa nên mô hình 2 không phải là một mô hình tốt.