Bt chương 1 nộp thầy

I.
THEORY
Câu 0.1: Ôn tập Xác suất
a) Thế nào là một Biến ngẫu nhiên (Đại lượng ngẫu nhiên - ĐLNN) (BNN)
Có 3 cách định nghĩa một BNN (Random Variable):
(i) Random Variable là biến mà giá trị nhận được là các kết quả của phép thử ngẫu
nhiên.
(ii) Random Variable là biến mà giá trị nhận được thay đổi từ phần tử (đối tượng khảo
sát) này sang phần tử khác trong một phép thử ngẫu nhiên (định nghĩa dễ hiểu nhất).
(iii) Random Variable là biến có quy luật phân phối xác suất phản ánh sự biến động về
mặt giá trị mà Random Variable có thể nhận được.
Ví dụ: Gieo một con xúc xắc, nếu gọi biến ngẫu nhiên X = “số nút trên mặt con xúc
xắc” thì các giá trị có thể của X được viết là X ∈ {1,2,3,4,5,6} với các xác suất tương
ứng của mỗi phần tử đều là 1/6.
Về mặt hình thức, có thể định nghĩa biến ngẫu nhiên như là một hàm số có giá trị thực
được xác định trên không gian các sự kiện sơ cấp (sao cho nghịch ảnh của một khoảng
số là một sự kiện), tức là:
X:Ω→R
trong đó Ω là không gian các sự kiện sơ cấp. Để có thể dễ dàng phân biệt và thực hiện
các phép tính toán, ta thống nhất kí hiệu X,Y,⋯ là các biến ngẫu nhiên (BNN), còn
x,y,⋯ là giá trị của các BNN đó. Như vậy, X mang tính ngẫu nhiên, còn x là giá trị cụ
thể quan sát được khi ta tiến hành phép thử.
b) Với một BNN điều kiện cần và đủ để tuân theo quy luật phân phối chuẩn là
gì?
Điều kiện cần: Biến X phải là một biến ngẫu nhiên liên tục, nhận giá trị trong khoảng
(−∞;+∞).
Điểu kiện đủ: BNN liên tục X nhận giá trị trong khoảng (−∞;+∞)có phân phối chuẩn
với các tham số μ và σ 2, nếu hàm mật độ xác suất của nó có dạng:
2
(x−μ)
f(x)= 1 ∗e với μ= E( X ) , σ 2= Var ( X ).

2
2δ
δ √2 π
c) Giá trị đại diện cho mức độ tập trung, phân tán của một BNN là gì ? Vì sao
Giá trị đại diện cho mức độ tập trung của một BNN: Trung bình E(X) ≡ μ. Bởi vì khi
thu thập dữ liệu ta thường gặp các giá trị ở dạng rời rạc nên để có thể mô tả một cách
đơn giản nhất mức độ tập trung của dữ liệu, ta sẽ quan tâm đến giá trị đại diện tốt nhất
cho các giá trị thu thập được của biến ngẫu nhiên X, đó là giá trị trung bình. Trung
bình E(X) phản ánh giá trị trung tâm của biến ngẫu nhiên. E(X) chỉ đại diện tốt cho
tập dữ liệu khi biến ngẫu nhiên X có phân phối Chuẩn (đồ thị về dữ liệu của X có
dạng hình chuông).
Giá trị đại diện cho mức độ phân tán của một BNN: Phương sai Var(X). Phương sai
của biến ngẫu nhiên X là trung bình của bình phương sai lệch giữa các giá trị của biến
ngẫu nhiên X và trung bình của nó. Vì vậy, phương sai Var(X) là đại lượng đặc trưng
cho độ phân tán các giá trị của biến ngẫu nhiên xung quanh giá trị trung bình E(X).
Nếu Var(X) lớn chứng tỏ sự biến động của X lớn. Ngược lại, khi Var(X) nhỏ thì X
biến động ít, tương đối ổn định.
Chẳng hạn, X là biến ngẫu nhiên chỉ chi tiêu hàng năm của các hộ gia đình ở một
vùng, E(X) cho biết mức chi tiêu trung bình hàng năm của các hộ gia đình vùng đó,
Var(X) cho biết độ dao động của mức chi tiêu hàng năm xung quanh giá trị trung bình
đó. Nếu Var(X) lớn thì mức chi tiêu của các hộ gia đình ở vùng đó biến động thất
thường, nếu Var(X) nhỏ thì mức chi tiêu của các hộ gia đình ở vùng đó tương đối ổn
định.
Câu 0.2: Ôn tập Thống kê
a) Mẫu ngẫu nhiên là mẫu có tính chất gì?
Mẫu ngẫu nhiên (Random sample) là mẫu được chọn một cách ngẫu nhiên trong đó
mỗi đơn vị (phần tử) trong tổng thể có khả năng được lựa chọn ngang nhau (tức là xác
suất được chọn của mỗi phần tử trong tổng thể là như nhau). Do đó, kỳ vọng và
phương sai của đại lượng nghiên cứu và mỗi phần tử được chọn đều bằng nhau. Mẫu
được chọn một cách ngẫu nhiên sẽ có tính đại diện tốt nhất cho tổng thể.
→ Phát biểu theo ngôn ngữ thống kê:
Một mẫu ngẫu nhiên kích thước n là tập hợp n biến ngẫu nhiên độc lập X 1 , X2,…, Xn
được thành lập từ biến ngẫu nhiên X trong tổng thể và có cùng phân phối với biến
ngẫu nhiên gốc X.
Ký hiệu mẫu ngẫu nhiên: W = (X1 , X2,…, Xn).
Do mỗi lần lấy phần tử cho mẫu, biến ngẫu nhiên X đều là như nhau, do đó kỳ vọng
và phương sai của chúng đều bằng nhau:
 E(X1) = E( X2) = … = E(Xn) = E(X) = m
 V(X1) = V(X2) = … = V(Xn) = V(X) = σ2
b) Giá trị đại diện cho mức độ tập trung, phân tán của một mẫu ngẫu nhiên là
gì?
Đối với một mẫu ngẫu nhiên:
Giá trị đại diện cho mức độ tập trung: Trung bình mẫu ( X ), Số yếu vị (mode), Trung
vị (median), Phân vị (quantile).
Giá trị đại diện cho mức độ phân tán: Phương sai mẫu và độ lệch chuẩn mẫu, Hệ số
biến thiên, Khoảng biến thiên, Độ trải giữa.
c) Với BNN là Thu nhập trên một Tổng thể giả định là N = 5 có giá trị như sau
- Tính trung bình tổng thể, phương sai tổng thể.

Trung bình tổng thể:
N
+) Áp dụng công thức: ∑ X i → μ= 8+9+10+11+12 = 10

μ= i=1 5
N
+) Sử dụng phần mềm Excel:
 Bước 1: Nhập các giá trị thu nhập của 5 hộ gia đình vào bảng excel (đặt tên là
cột Thu nhập).
 Bước 2: Nhập công thức “=AVERAGE (Phạm vi các ô chứa các giá trị của
biến thu nhập)” và bấm Enter.
 Bước 3: Ra kết quả bằng 10.
Phương sai tổng thể:
+) Áp dụng công thức:
N
σ = ∑ ¿ ¿ ¿ → σ2 = 2
2
i=1

cột Thu nhập).
 Bước 2: Nhập công thức “VAR.P (Phạm vi các ô chứa các giá trị của biến thu
nhập)” và bấm Enter.
 Bước 3: Ra kết quả bằng 2.
Nếu giả sử không thể khảo sát hết 5 hộ gia đình, cần phải chọn ngẫu nhiên 3 hộ gia
đình hãy thực hiện các yêu cầu sau:
- Có bao nhiêu cách chọn mẫu ngẫu nhiên 3 hộ trong 5 hộ ? Giải thích ? Nêu cụ
thể giá trị trên các mẫu được chọn và cách thức thực hiện trong Excel.
+) Chọn ngẫu nhiên 3 hộ trong 5 hộ nên số cách chọn là C 35= 10 cách chọn.
+) Chọn 3 hộ gia đình trong 5 hộ gia đình (có tính đến thứ tự được chọn) thì số cách
chọn là số chỉnh hợp chập 3 của 5 ( A35 ). Tuy nhiên, việc chọn ngẫu nhiên 3 hộ gia đình
từ 5 hộ gia đình không phân biệt thứ tự của các hộ gia đình nên số cách chọn là A35 /3!
= C 35 = 10 cách chọn
cột Thu nhập).
 Bước 2: Chèn một cột với ý nghĩa là các số thứ tự ngẫu nhiên của các hộ gia
đình (đặt tên là cột Stt). Nhập hàm RAND:=RAND() tại ô A2. Dùng chức
năng Fill Handle để áp dụng hàm RAND() cho 4 dòng còn lại để có ngẫu nhiên
4 số nữa.
 Bước 3: Lập 1 cột mới (tên cột là Chọn ngẫu nhiên 3 hộ gia đình). Tại ô C2 ta
nhập công thức =INDEX($B$2:$B$6,RANK(A2,$A$2:$A$6)) và nhấn Enter,
ta chọn được ngẫu nhiên 1 hộ gia đình. Dùng chức năng Fill Handle cho 2 dòng
tiếp theo, ta sẽ chọn được ngẫu nhiên 3 hộ gia đình từ 5 hộ gia đình.
- Ứng với các mẫu gồm 3 hộ gia đình hãy tính trung bình mẫu và phương sai
mẫu hiệu chỉnh trên từng mẫu.
+) Quy ước: “3 hộ gia đình có thu nhập (a,b,c)” được ký hiệu trong bảng là “(a,b,c)”
 Trung bình mẫu: sử dụng hàm Average
 Phương sai mẫu hiệu chỉnh: sử dụng hàm Var.S
tổng (8,9, (8,9, (8,9, (8,10 (8,10 (8,11 (9,10 (9,10 (9,11 (10,11
thế 10) 11) 12) ,11) ,12) ,12) ,11) ,12) ,12) ,12)
TB 10 9 9.33 9.66 9.66 10 10.3 10 10.3 10.6 11

3333 6666 6666 3333 3333 6666
333 667 667 333 333 667
PS 2 1 2.33 4.33 2.33 4 4.33 1 2.33 2.33 1
3333 3333 3333 3333 3333 3333
333 333 333 333 333 333
- Mối liên hệ giữa giá trị trung bình mẫu trên mỗi mẫu cụ thể với giá trị trung
bình của tổng thể là gì ?
Tính trung bình của tất cả các giá trị trung bình mẫu ta có thể suy luận ra giá trị trung
bình của tổng thể μ (đối với mẫu được chọn ngẫu nhiên thì giá trị trung bình của tất cả
các trung bình mẫu bằng trung bình tổng thể μ).
- Ứng với mỗi mẫu cụ thể gồm 3 phần tử có một trung bình mẫu, theo bạn trung
bình của tất cả các trung bình mẫu gồm 3 phần tử sẽ có giá trị là bao nhiêu ?
Tính cụ thể và giải thích
Để tính trung bình của tất cả trung bình mẫu ta sẽ tính tổng của tất cả các trung bình
mẫu (ở đây có 10 mẫu) và chia cho số mẫu mà ta có (10 mẫu ). Đối với excel ta sẽ
dùng hàm “=AVERAGE(Tất cả các ô chứa giá trị trung bình của các mẫu)”
→ Kết quả: Trung bình của tất cả các trung bình mẫu gồm 3 phần tử là: 10 (bằng
trung bình tổng thể).
→ Giải thích:
E ( X 1 ) + E ( X 2) + …+ E( X n) n∗E(X )
= =E ( X ) =μ
n n
Có thể nói, xét về mặt đại số và về mặt xác suất thì trung bình mẫu phản ánh được giá
trị của trung bình tổng thể. Tuy nhiên vẫn tồn tại sự sai lệch, sự sai lệch nhiều hay ít
được đánh giá bằng phương sai tổng thể chia cho kích thước mẫu (cỡ mẫu). Khi kích
thước mẫu càng lớn thì sự sai lệch càng nhỏ. Nói cách khác, khi kích thước mẫu càng
lớn, việc ta dùng trung bình mẫu để phản ánh trung bình tổng thể sẽ càng chính xác.
Đặc biệt, đối với mẫu được chọn ngẫu nhiên thì giá trị trung bình của tất cả các
trung bình mẫu bằng trung bình tổng thể ( E ( X ) =E ( X )=μ ).
- Ứng với mỗi mẫu cụ thể gồm 3 phần tử có một phương sai mẫu hiệu chỉnh, theo
bạn phương sai của tất cả các phương sai mẫu hiệu chỉnh gồm 3 phần tử sẽ có giá
trị là bao nhiêu ? Tính cụ thể và giải thích
+) Tính thủ công:
 Bước 1: Tính trung bình của 10 phương sai mẫu hiệu chỉnh của 10 mẫu ngẫu
nhiên (1+2.333+4.333+...+1)/10, ta được kết quả 2.5.
 Bước 2: Tính phương sai của 10 phương sai mẫu hiệu chỉnh của 10 mẫu ngẫu
2 2 2
(1−2.5) +(2.333−2.5) +…+(1−2.5)
nhiên =1.583333
10
Để tính phương sai mẫu hiệu chỉnh ta sử dụng hàm “VAR.P(“Tất cả các giá trị
phương sai của các mẫu”)” ở trong Excel.
→ Kết quả: Phương sai của tất cả các phương sai mẫu hiệu chỉnh gồm 3 phần tử sẽ có
giá trị là: 1.5833333
→ Giải thích: Phương sai của tất cả các phương sai mẫu hiệu chỉnh gồm 3 phần tử
không bằng phương sai tổng thể. Giữa phương sai tổng thể và phương sai của tất cả
các phương sai mẫu ngẫu nhiên có sự sai lệch với nhau.
- Trong thực tế nếu phải chọn ngẫu nhiên n= 3 phần tử trong N = 5, bạn sẽ chọn
3 phần tử nào ? Vì sao ?
Trong thực tế nếu phải chọn ngẫu nhiên n=3 phần tử trong N= 5, cách chọn tốt nhất là
ta sẽ chọn mẫu ngẫu nhiên 3 phần tử vì mẫu được chọn một cách ngẫu nhiên sẽ có
tính đại diện tốt nhất cho tổng thể.
- Trong thực tế nếu phải khảo sát ngẫu nhiên n phần tử bạn sẽ khảo sát bao
nhiêu lần để chọn được n phần tử tốt nhất trong N phần tử của tổng thể ? Giải
thích
Trong thực tế, ta chỉ cần thực hiện khảo sát một lần để chọn được n phần tử tốt nhất
trong N phần tử của tổng thể.
→ Giải thích: Ứng với một mẫu quan sát gồm n cặp giá trị (xi, yi) thì các
tham số ^
β 1 và ^
β 2tìm được là duy nhất. Các tham số ^
β 1 và ^
β 2 là các ước lượng điểm
của các tham số β 1và β 2 trên đường hồi quy tổng thể và các tham số này là các Biến
ngẫu nhiên, giá trị của chúng thay đổi từ mẫu này sang mẫu khác (chỉ cần thay đổi
1 giá trị của mẫu ngẫu nhiên sẽ được một cặp ^
β 1 và ^
β 2 khác). Mục đích của ta là cần
tìm một hàm hồi quy mẫu tốt (mẫu tốt là mẫu mà các phần tử được chọn một cách
ngẫu nhiên) để có thể phản ánh hàm hồi quy tổng thể, cho nên trong thực tế nếu cần
khảo sát ngẫu nhiên n phần tử từ N phần tử của tổng thể, ta chỉ cần khảo sát mẫu ngẫu
nhiên một lần để chọn được n phần tử tốt nhất.
Câu 0.3: Econometric
a) Phát biểu mô hình hồi quy tuyến tính đơn biến, đa biến trên tổng thể
Mô hình hồi quy tuyến tính đơn biến trên tổng thể: là mô hình mô tả sự phụ thuộc
giữa một biến (gọi là biến phụ thuộc) vào một biến khác (gọi là biến độc lập, biến giải
thích) cộng với sai số ngẫu nhiên, có dạng sau:
k
Y = β1 + ∑ β i X i +ε với k = 2
i=2
Mô hình hồi quy tuyến tính đa biến trên tổng thể: là mô hình mô tả sự phụ thuộc giữa
một biến (gọi là biến phụ thuộc) vào nhiều biến khác (gọi là các biến độc lập, biến giải
thích) cộng với sai số ngẫu nhiên, có dạng sau:
k
Y = β1 + ∑ β i X i +ε với k > 2
i=2
Trong đó:
+) Y là giá trị của biến phụ thuộc
+) X i là giá trị của biến độc lập (biến giải thích thứ i)
+) ε là các yếu tố khác, có tính ngẫu nhiên được gọi là yếu tố sai số ngẫu nhiên
b) Phát biểu hàm hồi quy tuyến tính đơn biến, đa biến trên tổng thể
Hàm hồi quy tuyến tính đơn biến trên tổng thể: là hàm hồi quy tuyến tính có dạng:
2
f(X2) = β 1+ ∑ β i X i =¿ β 1+ β2 X 2 với k = 2
i=2
Hàm hồi quy tuyến tính đa biến trên tổng thể: là hàm hồi quy tuyến tính có dạng:
k
f(X2,…,Xk) = β 1+ ∑ β i X i =¿ ¿ β 1+ β2 X 2 +¿ … + β k X k với k>2
i=2
Trong đó:
+) β 1 ; β 2 ;... ; β k là các tham số của mô hình còn được gọi là hệ số hồi quy
 β 1là tung độ góc; (hệ số chặn, hệ số tự do)
 β 2 ; …; β k là các hệ số góc của đường hồi quy ứng với X 2 ,… X k
c) Sai số ngẫu nhiên trên tổng thể ( ε ) là gì: Sai số ngẫu nhiên là thể hiện những yếu
tố ảnh hưởng ngoài mô hình lên biến phụ thuộc, có thể là do sai số đo lường, do cách
thu thập dữ liệu, do có thể có biến độc lập khác giải thích cho biến phụ thuộc mà chưa
được được vào mô hình nghiên cứu… . Sai số ngẫu nhiên thường gắn với tổng thể, khi
ta không biết tổng thể ta cũng không biết sai số ngẫu nhiên.
a) Phát biểu mô hình hồi quy tuyến tính đơn biến, đa biến trên mẫu ? So sánh với
các khái niệm này trên tổng thể.
Mô hình hồi quy tuyến tính trên mẫu (SRM):
Đơn biến: Y = ^
β1 + ^
β 2 X +e=Y^ +e ⟹ y i= ^
β1 + ^
β 2 x i +e i= ^
y i +e i
Trong đó: Y^ = ^
β1 + ^ y i= β^1 + ^
β 2 X (SRF); ^ β 2 xi
Đa biến: Y= ^
β 1+ ^
β2 X 2 +…+ ^
βk X k + e ⟹ Y i = ^
β 1+ ^
β2 X 2 i +…+ β^k X ki + ei
Trong đó: Y^ = ^
β1 + ^
β 2 X 2+ …+ ^
β k X k (SRF); Y^i= β^1 + ^
β 2 X 2i + …+ ^
β k X ki
So sánh mô hình hồi quy tuyến tính đơn biến trên mẫu so với mô hình hồi quy tuyến
tính đơn biến trên tổng thể:
Ta có thể thấy:
- Xét trên N của tổng thể ta chỉ có thể viết được 1 mô hình hồi quy. Xét trên n của
mẫu, mẫu ở đây là mẫu được chọn ngẫu nhiên nên có thể có nhiều đường hồi quy
mẫu.
- Nếu đường hồi quy mẫu n và đường hồi quy tổng thể N không nằm gần nhau
→ đường hồi quy không tốt (đường hồi quy tốt khi cả hai đường nằm gần nhau ). Tuy
nhiên N,n lệch nhưng đều phản ánh được quy luật x tăng thì y tăng.
Nhận xét: không cần đường hồi quy tổng thể. Đường hồi quy mẫu hoàn toàn phản
ánh được đường hồi quy tổng thể theo một xu thế.
b) Phát biểu hàm hồi quy tuyến tính đơn biến, đa biến trên mẫu ? So sánh với
các khái niệm này trên tổng thể.
Hàm hồi quy tuyến tính trên mẫu: là một hàm số mô tả xu thế biến động của biến phụ
thuộc theo biến giải thích về mặt trung bình, Y^ = ^
f ( X) gọi là hàm hồi quy mẫu (SRF)
Đơn biến:
Nếu PRF có dạng: E(Y/X)= β 1+ β 2X
Thì SRF có dạng: E(Ŷ/X)= ^
β 1 +^
β 2 X =Ŷ
Đa biến:
k
Nếu PRF có dạng: E(Y/ X 2 , … , X k ¿=Y =β 1+ ∑ βi X i (k>2)
i=2
Thì SRF có dạng: Y^ = ^

β 1+ ^
β2 X 2 +…+ ^
βk X k
 Vì có vô số mẫu ngẫu nhiên, nên có vô số giá trị của ^

βi → ^
β i là biến ngẫu
nhiên.
 Với một mẫu cụ thể kích thước n, n quan sát thì ^
β i sẽ là con số cụ thể.
So sánh hàm hồi quy mẫu và hàm hồi quy tổng thể:
- Bất kỳ một giá trị xi nào trên tổng thể đều có thể viết theo 2 cách sau:
y i=f( x i)= β 1+ β 2 x i( trên N ) ( i=1,2,3,..,N)
y i= ^
β 1 +^
β 2 x i (trên n )
- Hàm hồi quy tổng thể chỉ có một còn hàm hồi quy mẫu thì có nhiều.
Nhận xét: mọi giá trị cụ thể của biến phụ thuộc ( y i) thay vì phải giải thích trên hàm
hồi quy tổng thể ( y i=f( x i)= β 1+ β 2 x i) hoàn toàn có thể được viết hay giải thích bằng hàm
hồi quy mẫu ( y i= ^
β 1 +^
β 2 x i). Do đó ta không bao giờ cần tìm hàm hồi quy tổng thể
(f(X)= β 1+ β 2X). Vấn đề ta chỉ cần tìm một hàm hồi quy mẫu tốt (mẫu tốt là mẫu mà
các phần tử được chọn ngẫu nhiên).
c) Sai số ngẫu nhiên trên mẫu là gì ? So sánh với khái niệm này trên tổng thể.
Khái niệm: Sai số ngẫu nhiên trên mẫu (e) là yếu tố khác cũng có tác động đến biến
phụ thuộc khi ta khảo sát mẫu (có thể là những yếu tố không biết, không có số liệu
hay tác động của nó quá nhỏ không mang tính hệ thống), có tính ngẫu nhiên nên được
gọi là sai số ngẫu nhiên.
So sánh với khái niệm biến ngẫu nhiên trên tổng thể: bản chất của sai số ngẫu nhiên
trên mẫu e giống yếu tố sai số ngẫu nhiên trên tổng thể ε.
d) Theo bạn ứng với một mẫu ngẫu nhiên n phần tử có bao nhiêu đường hồi quy
mẫu có thể thu thập trong thực tế ? Giải thích ?
Theo em, ứng với một mẫu ngẫu nhiên n phần tử có duy nhất một đường hồi quy mẫu
có thể thu thập trong thực tế. Vì ứng với một mẫu quan sát gồm n cặp giá trị (xi, yi)
thì các tham số ^
β 1 và ^
β 2tìm được là duy nhất. Các tham số ^
β 1 và ^
β 2 là các ước lượng
điểm của các tham số β 1và β 2 trên đường hồi quy tổng thể và các tham số này là các
Biến ngẫu nhiên, giá trị của chúng thay đổi từ mẫu này sang mẫu khác (chỉ cần
thay đổi 1 giá trị của mẫu ngẫu nhiên sẽ được một cặp ^
β 1 và ^
β 2 khác). Do ^
β 1 và ^
β 2tìm
được là duy nhất nên ta chỉ có được duy nhất một đường hồi quy mẫu.
a) Các tham số trên hàm hồi quy mẫu là ngẫu nhiên hay không ngẫu nhiên? Vì
sao?
Các tham số trên hàm hồi quy mẫu là ngẫu nhiên. Vì trong một tổng thể ta có thể chọn
ra nhiều mẫu với mỗi mẫu gồm n phần tử chọn ngẫu nhiên. Ứng với một mẫu quan
sát gồm n cặp giá trị (xi, yi) thì các tham số ^
β 1 và ^
β 2tìm được là duy nhất. Các tham
số β^1 và β^2 là các ước lượng điểm của các tham số β 1và β 2 trên đường hồi quy tổng thể
và các tham số này là các Biến ngẫu nhiên, giá trị của chúng thay đổi từ phần tử
này sang phần tử khác, từ mẫu này sang mẫu khác.(chỉ cần thay đổi 1 giá trị của
mẫu ngẫu nhiên sẽ được một cặp ^
β 1 và ^
β 2 khác).
b) Phương pháp OLS dùng để làm gì?
OLS là phương pháp được sử dụng rộng rãi nhất để ước lượng các tham số trong
phương trình hồi quy. Để tối thiểu hóa tổng bình phương của các khoảng cách theo
phương thẳng đứng giữa số liệu thu thập được và đường (hay mặt) hồi quy.
c) Trong phương pháp OLS thì R2 có ý nghĩa là gì ? Mối liên hệ của nó với hệ số
tương quan tuyến tính là gì ?
Trong phương pháp OLS thì R2 có ý nghĩa là: nó cho biết sự thay đổi của Y có cao
nhiêu % là sự thay đổi do biến X (và từ đó bao nhiêu % còn lại là do các nguyên nhân
khác) hay nói cách khác có bao nhiêu % giá trị của biến Y được giải thích qua các
biến X và bao nhiêu % còn lại là do các nguyên nhân khác (có thể là do sai số đo
lường, do cách thu thập dữ liệu, do có thể có biến độc lập khác giải thích cho biến phụ
thuộc mà chưa được được vào mô hình nghiên cứu…)
● Ý nghĩa của R2:
 R2=1: biến X giải thích được 100% sự thay đổi của biến Y.
 R2=a(0< a<1): biến X giải thích được a% sự thay đổi của biến Y.
 R2=0: X và Y không có quan hệ tuyến tính.
● Mối liên hệ giữa R2 và hệ số tương quan r xy: r xy =√ R2
Nếu r xy > 0 tương quan dương, tức là khi X tăng thì Y có khuynh hướng tăng
Nếu r xy < 0 tương quan âm, tức là khi X tăng thì Y có khuynh hướng giảm r xy gần về
phía ±1 gọi là tương quan mạnh, r xy gần về phía 0 thì gọi là tương quan yếu.
 |r xy|=1: biến X giải thích được 100% sự thay đổi của biến Y.
 |r xy|=b(0< b<1): biến X giải thích được a% sự thay đổi của biến Y, còn lại phụ
thuộc vào các yếu tố khác.
 |r xy|=0: X và Y không có quan hệ tuyến tính.
d) Trong cùng một chủ để về phân tích mối liên hệ giữa thu nhập (X) và chi tiêu
(Y), có hai nhóm khảo sát với nhóm 1, 2 có cỡ mẫu lần lượt là n1= 60; n2= 100.
Cả hai cùng sử dụng phương pháp OLS để tìm hàm hồi quy mẫu với R21= 30%;
2
R2= 70%. Theo bạn đường hồi quy nào là phù hợp khi phân tích mối liên hệ giữa
Y và X? Giải thích?
Ta có hai mẫu n1 = 60 => R21= 30%
và n2 = 100 => R22= 70%
Cả hai đường hồi quy đều phù hợp để phân tích mối liên hệ giữa Y và X, có nghĩa là ở
cả hai đường hồi quy, biến chi tiêu Y đều có thể được giải thích qua biến thu nhập X.
Vì chúng đều có R2 ≠0 . Vậy nên, ta chỉ có thể xét xem mô hình nào phù hợp hơn để
phân tích. Ta thấy rằng mô hình 2 sẽ phù hợp hơn vì có tới 70 hộ cho thấy mối liên hệ
giữa thu nhập (X) và chi tiêu (Y), so với mô hình 1 chỉ có 18 hộ.
II. PRACTICE iRESEARCH
Bài 1.1: Quan sát thu nhập (triệu đồng) và chi tiêu (triệu đồng) của 10 hộ gia đình, ta
có mẫu số liệu:
a) Paper ủng hộ cho mối liên hệ giữa Thu nhập và Chi tiêu.
Does Government Spending Affect Income Poverty? A Meta-regression Analysis
Link:https://reader.elsevier.com/reader/sd/pii/S0305750X17303200?
token=75AC6A4792B4A7048C29B8032D7A18DAD78A4F5BDBFF2C6B58133480
56C247E00EA6C9D8E189F1B502C7799D7F91D6A3&originRegion=eu-west-
1&originCreation=20220327072458
Paper này trình bày kết quả của một phân tích hồi quy tổng hợp về mối quan hệ giữa
chi tiêu của chính phủ và nghèo đói về thu nhập, tập trung vào các quốc gia có thu
nhập thấp và trung bình. Thông qua quá trình tìm kiếm và sàng lọc toàn diện, đã xác
định được tổng cộng 19 nghiên cứu kinh tế lượng xuyên quốc gia có chứa 169 ước
tính về mối quan hệ này. Chúng tôi thấy rằng quy mô và hướng của mối quan hệ ước
tính bị ảnh hưởng bởi nhiều yếu tố, đáng chú ý nhất là thành phần của mẫu được sử
dụng để ước tính, kiểm soát các biến có trong mô hình hồi quy và loại chi tiêu của
chính phủ. Nhìn chung, không có bằng chứng rõ ràng cho thấy chi tiêu chính phủ cao
hơn đã đóng một vai trò quan trọng trong việc giảm nghèo về thu nhập ở các nước có
thu nhập thấp và trung bình.
b) Đây là mô hình hồi quy tuyến tính đa biến hay đơn biến? Vì sao?
Đây là mô hình hồi quy tuyến tính đơn biến. Vì mô hình này có hai biến là thu nhập
và chi tiêu, trong đó có một biến độc lập (biến giải thích) là thu nhập và một biến phụ
thuộc (biến được giải thích) là chi tiêu.
c) Viết hàm hồi quy tuyến tính mẫu chi tiêu theo thu nhập? Ý nghĩa các hệ số hồi
quy?
Ta có:
x = 13.3
y = 10.5
xy=¿ 148.3
x 2 =190.5
^ xy−x . y 148,3−13,3. 10,5

β 2= 2 2 = = 0.636
x −( x ) 190,5−¿ ¿
^
β 1= y− ^
β2 . x = 10.5 – 0.636. 13.3 = 2.047
Hàm hồi quy tuyến tính mẫu chi tiêu theo thu nhập là:
Y^ = ^
β 1+ ^
β 2X
Y^ = 2.047 + 0.636X
Ý nghĩa của các hệ số hồi quy:
β 1= 2.047 có nghĩa là khi các hộ gia đình thất nghiệp thì mức chi tiêu trung binh tối
thiểu của họ là 2,047 triệu đồng

β 2= 0.636 có nghĩa là khi thu nhập tăng 1 triệu đồng thì mức chi tiêu trung binh sẽ
tăng 0,636 triệu đồng.

d) Vẽ đồ thị scatter thể hiện RÕ các yêu cầu sau:
- Mô tả mối liên hệ giữa Thu nhập và Chi tiêu.
- Hàm hồi quy tuyến tính
- Sai số ngẫu nhiên (e i) trên từng hộ gia đình
Mối liên hệ giữa thu nhập X và chi tiêu Y
16
14
12
10
0
6 8 10 12 14 16 18 20 22
- Mô tả mối liên hệ giữa Thu nhập và Chi tiêu: Nhìn vào đồ thị scatter ta có thể
thấy khi thu nhập càng tăng thì chi tiêu sẽ tăng theo.
- Hàm hồi quy tuyến tính: Hàm hồi quy tuyến được viết dưới dạng:
Y^ = 2.047 + 0.636X
- Sai số ngẫu nhiên (ei) trên từng hộ gia đình:
Hộ gia đình có:
Thu nhập = 8 và Chi tiêu = 7 thì sai số ngẫu nhiên (ei) là -0.13152094
Thu nhập = 9 và Chi tiêu = 8 thì sai số ngẫu nhiên (ei) là 0.2326
e) Theo bạn sai số ngẫu nhiên ( e i) tồn tại trên mỗi hộ gia đình (mỗi phần tử) là
hợp lý hay bất hợp lý ? Vì sao? Khi nào thì (ei) của hộ gia đình thứ i là 0 ? Giải
thích ?
-Sai số ngẫu nhiên (e i tồn tại trên mỗi hộ gia đình (mỗi phần tử) là hợp lý bởi vì chi
tiêu của mỗi hộ gia đình không chỉ phụ thuộc vào thu nhập mà còn phụ thuộc vào
những yếu tố khác chăng hạn như tiền chu cấp cha mẹ, tiền mua sắm vào dịp lễ,…
-(e i) của hộ gia đình thứ i là 0 khi và chỉ khi chi tiêu phụ thuộc hoàn toàn vào thu nhập
và không phụ thuộc vào các yếu tố khác.
f) Hãy cho biết vì sao sai số ngẫu nhiên ( e i) lại nhận giá trị dương hay âm, nhỏ
hay lớn ? Giải thích cụ thể trên từng hộ gia đình trong mẫu.
-Sai số ngẫu nhiên (e i) lại nhận giá trị dương hay lớn là khi họ có nhiều khoản để chi
tiêu hơn (ví dụ như nhà có nhiều con hơn mức trung bình, có xe hơi nên phải chi tiêu
nhiều hơn,..)
-Sai số ngẫu nhiên (e i) lại nhận giá trị âm hay nhỏ khi họ không cần phải chi tiêu quá
nhiều (ví dụ như họ chưa kết hôn, không cần chu cấp tiền cho ba mẹ,..)
Bài 1.2: Gọi
- Y (lượng cam được bán – tấn/tháng)
- X (giá cam – ngàn đ/kg)
Lượng 14 13 12 10 8 9 8 7 6 6
cam
Giá cam 2 2 3 4 5 5 6 7 8 9
a) Viết hàm hồi quy tuyến tính mẫu lượng cam bán ra theo giá cam? Ý nghĩa các
hệ số hồi quy?
Hàm hồi quy tuyến tính mẫu lượng cam bán ra theo giá cam:
^ xy−x . y
β2 = 2 2 = 15,11
x −(x )
^
β 1 = y− ^
β2 . x = -1.14
→ Hàm hồi quy: Y^ = -1.14 + 15.11X

Ta sẽ dùng Data Analysis để tính các hệ số ^
β 1, ^
β 2:
 Bước 1: Chọn Data → Data Analysis

 Bước 2: Chọn mục Regression
 Bước 3: Chọn vùng input Y (cột Lượng cam)
 Bước 4: Chọn vùng input X (cột Giá cam)
 Bước 5: Chọn vùng output (nơi xuất dữ liệu)
 Bước 6: Nhấn OK. Giá trị của ^
β 1 sẽ nằm ở cột Coefficients, dòng Intercept. Giá
trị của ^
β 2 sẽ nằm ở cột Coefficients, dòng X Variable 1
Ý nghĩa của các hệ số hồi quy ^

β 1, ^
β 2:
^
β 1 = -1.14: Khi cam được bán với giá 0 ngàn đ/kg thì lượng cam bán ra trung bình tối
thiểu là -1.14 tấn/tháng
^
β 2 = 15.11: Khi giá cam tăng 1 ngàn đ/kg thì lượng cam bán ra trung bình tăng 15.11
tấn/tháng
b) Giả định mối liên hệ giữa Y và X là mối quan hệ tuyến tính. Kiểm định sự phù
hợp của mô hình hồi quy Y= f(X) +ε khi phân tích mối liên hệ giữa Y và X?
{ H 0 : β 2=0
Cặp giả thiết: H : β ≠ 0
1 2
2
R (n−2) 0.9276 ×8
Giá trị kiểm định F = = = 102.497
1−R
2
1−0.9276
Ta có: F 0.05 ;1; 8 = 5.318

Vì F=102.497 > 5.318 nên ta bác bỏ H 0
Vậy mô hình phù hợp.
Ta sẽ dùng Data Analysis để tính giá trị kiểm định F:
 Bước 3: Chọn vùng input Y (cột Lượng cam)
 Bước 4: Chọn vùng input X (cột Giá cam)
 Bước 6: Nhấn OK. Giá trị kiểm định F ở cột F, dòng Regression.
c) Nếu lượng cam tính theo đơn vị là kg/tháng; tấn/ quý (1 quý là 3 tháng); tấn/
năm thì hàm hồi quy thay đổi như thế nào? Viết và giải thích cụ thể các hệ số
trong hàm hồi quy mẫu ứng với các trường hợp trên.
Lượng cam tính theo đơn vị là kg/tháng:
1 kg = 0.001 tấn
→Y^¿ =0.001 ^
β 1 +0.001 ^
β 2 X ¿ = -0.00114 + 0.01511 X ¿
^ ¿
β 1 = -0.00114: Khi cam được bán với giá 0 ngàn đ/kg thì lượng cam bán ra trung bình
tối thiểu là -0.00114 kg/tháng.
^ ¿
β 2 = 0.01511: Khi giá cam tăng 1 ngàn đ/kg thì lượng cam bán ra trung bình tăng
0.01511 kg/tháng.
Lượng cam tính theo đơn vị là tấn/quý:
1 quý = 3 tháng
→ Y^¿ =3 ^
β 1 +3 ^
¿
β 2 X = -3.42 + 45.33 X
¿
^
β 1¿= -3.42: Khi cam được bán với giá 0 ngàn đ/kg thì lượng cam bán ra trung bình tối
thiểu là -3.42 tấn/quý.
^
β 2¿= 45.33: Khi giá cam tăng1 ngàn đ/kg thì lượng cam bán ra trung bình tăng 45.33
tấn/quý.
Lượng cam tính theo đơn vị là tấn/năm:
1 năm = 12 tháng
→ Y^¿=12 ^
β1 +12 ^
β 2 X ¿ = -13.68 + 181.32 X ¿
^ ¿
β 1 = -13.68: Khi cam được bán với giá 0 ngàn đ/kg thì lượng cam bán ra trung bình tối
thiểu là -13.68 tấn/năm.
^ ¿
β 2 = 181.32: Khi giá cam tăng 1 ngàn đ/kg thì lượng cam bán ra trung bình tăng
181.32 tấn/năm.
d) Nếu giá cam tính theo đơn vị là triệu đồng/kg; triệu đồng/tạ; tỉ đồng/tấn;
nghìn đồng/tạ thì hàm hồi quy thay đổi như thế nào ? Viết và giải thích cụ thể
các hệ số trong hàm hồi quy mẫu ứng với các trường hợp trên.
Giá cam tính theo đơn vị là triệu đồng/kg:
Ta có: 1 ngàn đồng = 0,001 triệu đồng
15,11
 Y^¿= -1,14 + X* = -1.14 + 151100X*
0,001
^ ¿
β 1 = -1.14: Khi cam được bán với giá 0 triệu đồng/ kg thì lượng cam bán ra trung bình
tối thiểu là -1.14 ngàn đ/kg.
^ ¿
β 2 = 151100: Khi giá cam tăng lên 1 đơn vị là triệu đồng/kg thì lượng cam bán ra
trung bình tăng 151100 ngàn đ/kg.
Giá cam tính theo đơn vị là triệu đồng/tạ:
0,001
Ta có: 1 ngàn đồng/kg = triệu đồng/ tạ=0.1 triệu đồng/tạ
0,01
15,11
 Y^¿ = -1,14 + X* = -1.14 + 151,1X*
0,1
^ ¿
β 1 = -1.14: Khi cam được bán với giá 0 triệu đồng/tạ thì lượng cam bán ra trung bình
^ ¿
β 2 = 151,1: Khi giá cam tăng lên 1 đơn vị là triệu đồng/kg thì lượng cam bán ra trung
bình tăng 151,1 ngàn đ/kg.
Giá cam tính theo đơn vị là tỉ đồng/tấn:
0,000001
Ta có: 1 ngàn đồng/kg = tỉ đồng/tấn= 0.001 tỉ đồng/tấn
0,001
15,11
 Y^¿ = -1,14 + X* = -1.14 + 151100X*
0,001
^ ¿
β 1 = -1.14: Khi cam được bán với giá 0 tỉ đồng/tấn thì lượng cam bán ra trung bình tối
thiểu là -1.14 ngàn đ/kg.
^ ¿
β 2 = 151100: Khi giá cam tăng lên 1 đơn vị là tỉ đồng/tấn thì lượng cam bán ra trung
bình tăng 151100 ngàn đ/kg.
Giá cam tính theo đơn vị là nghìn đồng/tạ:
1
Ta có: 1 nghìn đồng/kg = nghìn đồng/ tạ= 100 nghìn đồng/tạ
0,01
15,11
 Y^¿ = -1,14 + X* = -1.14 + 0,1511X*
100
^ ¿
β 1 = -1.14: Khi cam được bán với giá 0 nghìn đồng/tạ thì lượng cam bán ra trung bình
^ ¿
β 2 = 151100: Khi giá cam tăng lên 1 đơn vị là nghìn đồng/tạ thì lượng cam bán ra
trung bình tăng 151100 ngàn đ/kg.
e) Khi giá cam có đơn vị là triệu đồng/tạ còn lượng cam có đơn vị tạ/quý thì hàm
hồi quy thay đổi như thế nào? Viết và giải thích cụ thể các hệ số trong hàm hồi
quy mẫu.
Khi giá cam có đơn vị là triệu đồng/tạ còn lượng cam có đơn vị tạ/quý
Ta có: 1 ngàn đồng/kg = 0.1 triệu đồng/ tạ
10
Và 1 tấn/tháng = = 30 tạ/quý
1/3
15,11
 Y^ *= -1,14.30 + .30 X* = -34,2+ 4533X*
0,1
^ ¿
β 1 = -34,2: Khi cam được bán với giá 0 triệu đồng/tạ thì lượng cam bán ra trung bình
tối thiểu là -34,2 tạ/quý.
^ ¿
β 2 = 4533 : Khi giá cam tang 1 triệu đồng/tạ thì lượng cam bán ra trung bình tang
4533 tạ/quý.
f) Khi giá cam có đơn vị là triệu đồng/tấn còn lượng cam có đơn vị tấn/năm thì
hàm hồi quy thay đổi như thế nào? Viết và giải thích cụ thể các hệ số trong hàm
hồi quy mẫu.
Khi giá cam có đơn vị là triệu đồng/tấn còn lượng cam có đơn vị tấn/năm
0,001
Ta có: 1 ngàn đồng/kg = triệu đồng/ tấn= 1 triệu đồng/tấn
0,001
1
Và 1 tấn/tháng = = 12 tấn/năm
1/12
15,11
 Y^ *= -1,14.12 + .12X* = -13,68+ 181,32X*
1
^ ¿
β 1 = -13,68: Khi cam được bán với giá 0 triệu đồng/tấn thì lượng cam bán ra trung
bình tối thiểu là -13,68 tấn/tháng.
^
β 2¿= 181,32 : Khi giá cam tăng 1 triệu đồng/tấn thì lượng cam bán ra trung bình tăng
181,32 tấn/tháng.
Bài 1.3: Cho số liệu về tiền thuê một căn hộ nhà trọ sinh viên như trong Bảng 1.1 (file
Data_Chuong1.xlsx). Các biến số được định nghĩa như sau:
RENT = tổng tiền thuê hàng tháng cho một căn hộ. ($)
No = số người ở trong căn hộ (người)
RM = số phòng trong căn hộ (phòng)
DIST = khoảng cách từ căn hộ đến trường (khu phố)
RPP = RENT/No = tiền thuê bình quân trên người ($/người)
Với sự hỗ trợ của phần mềm Excel trong tính toán,
a) Hãy tính các giá trị trung bình (mean), phương sai (variance), và độ lệch
chuẩn (standard deviation) của các biến số trên.
Ta sẽ dùng Data Analysis để tính các giá trị trên

 Bước 2: Chọn mục Covariance
 Bước 3: Chọn vùng input Y
 Bước 4: Chọn vùng input X
 Bước 5: Chọn vùng output (nơi xuất dữ liệu) và tick vào ô Summary Statistics
 Bước 6: Nhấn OK
b) Hãy tính hiệp phương sai (covariance) và hệ số tương quan tuyến tính giữa các
cặp biến số sau:
RENT và DIST, RENT và RM, RENT và No, RPP và RENT, RPP và No.
Hãy nêu nhận xét cụ thể về sự tương quan cho từng cặp biến số trên.
Tính hiệp phương sai (Covariance): (sử dụng phần mềm Excel)

 Bước 2: Chọn mục Covariance
 Bước5: Chọn vùng output (nơi xuất dữ liệu)
Covariance giữa RENT và DIST sẽ nằm ở cột RENT, dòng DIST

Covariance giữa RENT và RM sẽ nằm ở cột RENT, dòng RM
Covariance giữa RENT và No sẽ nằm ở cột RENT, dòng No
Covariance giữa RPP và RENT sẽ nằm ở cột RENT, dòng RPP
Covariance giữa RPP và No sẽ nằm ở cột No, dòng RPP
Tính hệ số tương quan tuyến tính (Correlation): (sử dụng phần mềm Excel)

 Bước 2: Chọn mục Correlation
Correlation giữa RENT và DIST sẽ nằm ở cột RENT, dòng DIST

Correlation giữa RENT và RM sẽ nằm ở cột RENT, dòng RM
Correlation giữa RENT và No sẽ nằm ở cột RENT, dòng No
Correlation giữa RPP và RENT sẽ nằm ở cột RENT, dòng RPP
Correlation giữa RPP và No sẽ nằm ở cột No, dòng RPP
c) Tìm ít nhất 5 paper ủng hộ cho việc phân tích sự phụ thuộc giữa RENT và No,
RM, DIST, RPP.
Determining Apartment Rent: The Value of Amenities, Services and External
Factors (Stacy Sirmans, C. Sirmans & John Benjamin ).
Link:https://sci-hub.se/10.1080/10835547.1989.12090581
Bài báo này xem xét ảnh hưởng của các tiện nghi, dịch vụ và các yếu tố ngoại lệ khác
nhau đối với tiền thuê nhà ở cho nhiều gia đình. Các thuộc tính được nghiên cứu bao
gồm các tiện nghi và dịch vụ như bãi đậu xe có mái che, nhà bếp hiện đại và dịch vụ
giúp việc, các hạn chế về cư trú như không cho phép vật nuôi và các yếu tố bên ngoài
như tắc nghẽn giao thông, gần cơ quan và khả năng tiếp cận phương tiện giao thông
công cộng. Các kết quả thực nghiệm cho thấy một số đặc điểm này có ảnh hưởng đến
tiền thuê. Trong đó, các tác giả đã chỉ ra rằng có mối liên hệ giữa số phòng ngủ và giá
thuê căn hộ - kích thước tăng thì giá tăng.
Examining the Variability of Apartment Rent (K.L. Guntermann & S. Norrbin,

1987).
Link:https://sci-hub.se/https://doi.org/10.1111/1540-6229.00435
Nghiên cứu được báo cáo ở đây sử dụng phân tích hồi quy để phân tích sự thay đổi giá
thuê trong một mẫu dữ liệu căn hộ từ khu vực đô thị Phoenix. Tác giả đã đưa ra kết
luận cho rất nhiều biến ảnh hưởng đến giá thuê nhà. Tróng đó, ông chỉ ra rằng kích
thước của cản hộ ảnh hưởng rất lớn đến giá thuê; đồng thời, số lượng phòng ngủ cũng
ảnh hưởng đến giá thuê nhưng lại có mối quan hệ phức tạp hơn. Ngoài ra nghiên cứu
của ông cũng cho thấy mối liên hệ giữa gía thuê và khoảng cách đến trường (đối với
thị trường thuê nhà của sinh viên), tuy nhiên, tác động của biến này là không đáng kể.
An evaluation of apartment preferences using conjoint analysis (R.S. Prave &
J.K.Ord).
Prave and Ord [17] sử dụng phương pháp luận liên hợp (tức là phương pháp phân tách
để mô hình hóa sở thích của người tiêu dùng) để lập mô hình sở thích của người thuê
đối với tiền thuê căn hộ, khoảng cách đến khuôn viên trường đại học, tình trạng của
căn hộ, hàng xóm các căn liền kề, diện tích căn hộ, số lượng nội thất được trang bị
sẵn. Kết quả của họ chỉ ra rằng phần lớn sinh viên mong muốn có một căn hộ nằm
trong bán kính hai mươi phút đi bộ đến trường (85,7%),… Tác giả đã đưa ra kết luận
có mối quan hệ giữa giá thuê căn hộ và khoảng cách từ căn hộ đén trường.
The user cost of housing and the price-rent ratio in Shanghai (Jie Chen, Yu Chen,
Robert J.Hill & Pei Hu).
Link: https://doi.org/10.1016/j.regsciurbeco.2021.103738
Trong paper này, các nhà nghiên cứu tính toán tỷ lệ giá trên giá thuê được điều chỉnh
theo chất lượng theo mô hình Hedonic (phương pháp điều chỉnh giá hưởng thụ, trong
đó bao gồm số người ở trong căn hộ) đối với nhà ở dân dụng ở Thượng Hải. Phương
pháp của bỏ qua các nhà ở có chủ sở hữu và các biến bỏ sót. Các nhà nghiên thấy rằng
việc điều chỉnh chất lượng sống ở căn hộ (trong đó có việc điều chỉnh số người sống
chung trong căn hộ) làm giảm tỷ lệ giá trên giá thuê đi 14%. Mặc dù vậy, tỷ lệ giá trên
giá thuê ở Thượng Hải năm 2017 đạt trên 70 vẫn là rất cao theo tiêu chuẩn quốc tế. Có
thể thấy, Rent (tổng số tiền thuê căn hộ) và No (số người ở trong căn hộ) có mối liên
hệ với nhau. Các nhà nghiên cứu tìm hiểu xem điều này ảnh hưởng như thế nào đến
việc giải thích các tỷ lệ giá trên giá thuê quan sát được.
Distributional consequences of surging housing rents (VolkerGrossmann,
Benjamin Larin, Hans Torben Lofflad, Thomas Steger)
Link:https://scihub.hkvisa.net/https://www.sciencedirect.com/science/article/abs/pii/
S0022053121000922?via%3Dihub
Bài viết trên nghiên cứu xu hướng đi lên của giá thuê nhà thực tế và giá mua nhà thực
tế đã ở hầu hết các nước công nghiệp kể từ Thế chiến 2. Gánh nặng của việc tăng giá
thuê nhà có thể rơi vào tình trạng phân phối không công bằng vì các hộ nghèo dành
một phần chi tiêu tiêu dùng cho việc thuê nhà ở lớn hơn các hộ giàu có. Mối quan hệ
nghịch đảo này giữa thu nhập và tỷ lệ chi tiêu cho nhà ở được gọi là định luật
Schwabe ("Người nào càng nghèo thì càng phải chi một khoản tiền lớn hơn theo thu
nhập cho nhà ở"). Khi tăng giá thuê nhà đồng nghĩa với việc tiền thuê bình quân đầu
người (RPP) cũng sẽ tăng. Các nhà nghiên cứu sẽ tập trung xem xét việc RPP tăng sẽ
ảnh hưởng như thế nào đến quyết định thuê căn hộ của các hộ gia đình.
Bài 1.4: Tỉ lệ bỏ việc trên 100 người làm việc (Yt) và tỉ lệ thất nghiệp (Xt) trong lãnh
vực chế tạo công nghiệp ở Mỹ trong giai đoạn 1960-1972 được cho ở Bang 1.2 (file
Data_Chuong1.xlsx)
a) Hãy vẽ đồ thị phân bố rãi (scatter diagram) của hai tỉ lệ trên
Bôi đen cột Tỷ lệ bỏ việc (Trên 100 lao động) và cột Tỷ lệ thất nghiệp (%)  Chọn
Insert  Chọn vẽ đồ thị X Y (scatter).
Scatter diagram
Tỷ lệ bỏ việc (Trên 100 lao độ ng) 3
2.5
1.5
0.5
0
2 3 4 5 6 7 8 9
Tỷ lệ thất nghiệp (%)
b) Giả sử tỉ lệ bỏ việc có quan hệ tuyến tính với tỉ lệ thất nghiệp như sau: Yt = β1
+ β2Xt + et. Hãy ước lượng β1, β2, và cho biết độ lệch chuẩn của chúng.
+) Sử dụng phần mềm Excel: Chọn Data  Data Analysis  Regression  Chọn
vùng Input Y (Tỷ lệ bỏ việc)  Chọn vùng Input X (Tỷ lệ thất nghiệp)  Chọn vùng
Output (nơi xuất dữ liệu) → Nhấn OK. Ta có kết quả:
^
β 1=3,366258 ^
β 2=−0,286212
 Hàm hồi quy: Y^ =3,366258-0,286212X
Độ lệch chuẩn: β 1=0,331084 β 2=0,062885
Khoảng ước lượng β1, β2, với độ tin cậy 95% là:
β 1 ϵ(2,637547; 4,094969)
β 2 ϵ(−0,42462;−0,1478)
+) Áp dụng công thức: (áp dụng các công thức của trung bình mẫu, phương sai mẫu)
x=5,069231 y=1,915385
x 2=27,71923 xy=9,130769
^ xy−x . y
β 2= 2 =−0.28621
x −( x )2
^
β 1= y− ^
β2 . x =3,36626
 Hàm hồi quy: Y^ =3,36626-0,28621X

 Đối với tham số ^
β 2:
13
RSS=∑ ( y i− ^
2
y i ) =¿ ¿1,14351
i=1
2 RSS 1,14351
σ = = =0,103955
n−2 13−2
√ √
σ2 0,103955
β 2 ¿=√ Var ( ^
^ β 2)= = =0,062885
se( 13
26,287692
∑ (x i− x́ )2
i=1
11
t 0,025=2,201
Vậy khoảng ước lượng cho tham số β 2 với độ tin cậy 95% (khi n>30) là:
β2 ϵ ( ^ 0,025 . se ( β2 ) ) 2
β2 ± t 10 ^ β ϵ (−0,42462 ;−0,1478 )
 Đối với tham số ^

β 1:
√
13
∑ xi2
se( ^ √
β 1 ¿= Var ( ^
β 1) =
i=1
n
. 13
σ2
∑ ( x i−x́ )2
=
√ 360,35 ×0,103955
13 ×26,287692
=0,331083
i=1
10
t 0,025 =2,201
Vậy khoảng ước lượng cho tham số β 1 với độ tin cậy 95% (khi n>30) là:
β1 ϵ ( ^ 0,025 . se ( β1 ) )  β 1 ϵ ( 2,637546 ; 4,094974 )

β1 ±t 10 ^
c) Hãy giải thích (diễn giải) các kết quả của bạn.
Y^ =3.366258-0.286212X
^
β 1=¿3.366258: Trong giai đoạn 1960-1972, khi không có người thất nghiệp trong lãnh
vực chế tạo công nghiệp ở Mỹ (tỉ lệ thất nghiệp trong lãnh vực này bằng 0%) thì tỉ lệ
bỏ việc trung bình tối thiểu trên 100 người làm việc trong lãnh vực này ở Mỹ là
3.366258%.
^
β 2=¿-0.286212: Trong giai đoạn 1960-1972, khi tỉ lệ thất nghiệp trong lãnh vực chế
tạo công nghiệp ở Mỹ tăng 1% thì tỷ lệ bỏ việc trung bình trên 100 người làm việc
trong lãnh vực này ở Mỹ giảm 0,286212% và ngược lại.
d) Hãy tính R2. Giải thích ý nghĩa của hệ số này.
R =0,653158Ý nghĩa: Tỷ lệ thất nghiệp giải thích được 65,32% thay đổi của tỷ lệ bỏ
2
việc trong 13 năm (1960-1972), còn 34,68% là do các nguyên nhân khác. Hay nói
cách khác, trong gần 8,5 năm ta thấy được tỷ lệ bỏ việc có mối quan hệ tuyến tính với
tỷ lệ thất nghiệp.
e) Hãy vẽ đồ thị của đại lượng sai số e (với e trên trục tung và thời gian (năm)
trên trục hoành). Bạn có thể nhận biết được điều gì từ những sai số này.
Ta có: ε i= y i−^
yi
Đồ thị củ a đạ i lượ ng sai số e
0.5
0.4
0.3
0.2
0.1
0
1958 1960 1962 1964 1966 1968 1970 1972 1974
-0.1
-0.2
-0.3
-0.4
-0.5
Từ những sai số này, ta có thể nhận thấy được có sự ảnh hưởng của các yếu tố ngoài
mô hình lên biến phụ thuộc. Tức là, có sự tác động của các yếu tố khác ngoài biến giải
thích (tỷ lệ thất nghiệp) tới giá trị của biến phụ thuộc (tỷ lệ bỏ việc trên 100 lao động).
Đó có thể là những yếu tố mà ta không biết, những yếu tố không có số liệu hoặc
những yếu tố mà tác động của nó quá nhỏ không mang tính hệ thống.
f) Tính giá trị kiểm định p_value khi kiểm định tính có ý nghĩa của các hệ số
trong mô hình trên? Với mức ý nghĩa 5% hãy cho biết p_value tính được lớn hơn
hay nhỏ hơn mức ý nghĩa 5% ? Giải thích ý nghĩa của các p_value tính được ?
{ H : β =0
Đặt giả thiết: H 0 : βi ≠ 0
1 i
Tham số β 1 có p-value =6,26. 10−7 <α =0,05
 Bác bỏ H 0. Vậy hệ số β 1 có ý nghĩa trong mô hình hồi quy.
Tham số β 2 có p-value =0,0008283< α=0,05
 Bác bỏ H 0. Vậy hệ số β 2 có ý nghĩa trong mô hình hồi quy.

Kiểm định tính có ý nghĩa của β 1:
{ H 0 : β 1=0
Đặt giả thiết: H : β ≠ 0
1 1
^ ¿
β1 −β1 3,36626−0
T 0= = =10,16742
se ( ^
β 1) 0,331083
 p-value = 2 × P ( T >10,16742 )=2 × ( 0,5−0,5 )=0< α=0,05
Bác bỏ H 0. Vậy hệ số β 1 có ý nghĩa trong mô hình hồi quy.
{ H 0 : β 2=0
1 2
^
β 2−β 2¿ −0.28621−0
T 0= = =−4,55132
se ( ^
β 2) 0,062885
 p-value = 2 × P ( T >−4,55132 )=2 × ( 0,5−0,5 )=0<α =0,05
Bác bỏ H 0. Vậy hệ số β 2 có ý nghĩa trong mô hình hồi quy.
Bài 1.5: Dữ liệu về giá vàng (GP), Chỉ số giá tiêu dùng (CPI), và Chỉ số chứng khoán
trên thị trường chứng khoán New York (NYSE) trong thời kỳ 1977-1991 ở M ỹ được
cho ở Bang1.3 (file Data_Chuong1.xlsx)
a) Hãy vẽ đồ thị scatter của GP với CPI; NYSE với CPI trên cùng một đồ thị.
Bôi đen cột dữ liệu về giá vàng (GP) và cột chỉ số giá tiêu dung (CPI)  Chọn Insert
 Chọn vẽ đồ thị X Y (scatter).
Bôi đen cột dữ liệu về chỉ số chứng khoán (NISE) và cột chỉ số giá tiêu dùng (CPI) 
Chọn Insert  Chọn vẽ đồ thị X Y (scatter).
b) Một quyết định đầu tư (mua vàng hay mua chứng khoán) có tính tới việc
phòng ngừa lạm phát là nếu giá của nó (hàng hóa mà bạn đầu tư vào) và/hay
suất sinh lợi của nó ít nhất là bắt kịp với tỉ lệ lạm phát. Để kiểm tra giả thiết này,
giả sử bạn quyết định xây dựng hai mô hình sau đây, giả sử rằng đồ thị trong câu
a gợi ý cho bạn thấy sau đây là thích hợp:
GPt = α1 + β1CPIt + et
NYSEt = α2 + β2 CPIt + et
Với hai mô hình trên, hãy trả lời các câu hỏi sau:
- Tính hệ số tương quan tuyến tính giữa GP và CPI; NYSE và CPI? Bạn nhận xét gì
về các hệ số này.
Tính hệ số tương quan tuyến tính (Correlation) giữa GP và CPI; NYSE và CPI:

 Bước 2: Chọn mục Correlation
Hệ số tương quan tuyến tính giữa GP và CPI sẽ nằm ở cột GP, dòng CPI
Hệ số tương quan tuyến tính giữa CPI và NYSE sẽ nằm ở cột CPI, dòng NYSE
+ Giải thích:
Hệ số tương quan giữa GP và CPI là 0.387582844 có nghĩa là biến CPI giải thích
được 0.387582844% sự thay đổi của biến GP, còn lại phụ thuộc vào các yếu tố khác.
Hệ số tương quan giữa NYSE và CPI là 0.93168 có nghĩa là biến CPI giải thích được
0.93168% sự thay đổi của biến NYSE, còn lại phụ thuộc vào các yếu tố khác.
- Bạn kỳ vọng về dấu của các hệ số đứng trước các biến giải thích trong 2 mô
hình trên ? Giải thích.
Kỳ vọng về dấu của các hệ số đứng trước các biến giải thích trong 2 mô hình trên là
dấu dương.
- Hãy tìm ít nhất 3 paper để ủng hộ cho các mối liên hệ trên.
Effects of Price of Gold on Bombay Stock Exchange Sectoral Indices: New

Evidence for Portfolio Risk Management
Link: https://sci-hub.hkvisa.net/10.1016/j.eap.2019.08.003
Bài báo này xem xét ảnh hưởng của chính sách tiền tệ của Hoa Kỳ , giá dầu và giá
vàng đối với chỉ số chứng khoán của các nước BRICS . Mô hình hồi quy tự động
Vector được áp dụng để nghiên cứu các chỉ số chứng khoán của tất cả các quốc gia
BRICS như một nhóm trong giai đoạn 1996–2018. Chúng tôi nhận thấy rằng Bombay
Sensex phản ứng tích cực với Lãi suất quỹ liên bang. Chỉ số chứng khoán của Nam
Phi - FTSE JSE của Johannesburg - phản ứng tiêu cực với cú sốc giá dầu trong khi chỉ
số chứng khoán của Nga và Brazil - RTSI của Moscow và BVSP của Sao Paulo -
phản ứng tích cực với những thay đổi của giá vàng. Chúng tôi cung cấp các hàm ý về
quản lý và chính sách của những kết quả này.
Price-switching spillovers between gold, oil, and stock markets: Evidence from the
USA and China during the COVID-19 pandemic
Link: https://scihub.hkvisa.net/https://www.sciencedirect.com/science/article/abs/pii/
S0301420721002294?fbclid=IwAR1cYe-Ebx5p2O_ZBkMNoiD3FXnty3c-
PyTsktvshNicgK7J_RAj1dJe4Z4
Bài báo này xem xét các tác động lan tỏa chuyển đổi giá giữa thị trường chứng khoán,
dầu thô và vàng tương lai của Hoa Kỳ và Trung Quốc trước và trong đại dịch COVID-
19. Sử dụng mô hình tự động hồi quy vectơ chuyển mạch Markov, chúng tôi cho thấy
rằng thị trường chứng khoán chủ yếu bị ảnh hưởng bởi các cú sốc của chính chúng,
với các tác động nhạy cảm với sự thay đổi của chế độ. Phân tích mạng kết nối tiết lộ
rằng vàng và thị trường chứng khoán là những yếu tố đóng góp ròng (thu nhận) tác
động lan tỏa trong chế độ ít biến động (chế độ biến động cao), trong khi dầu là yếu tố
thu nhận (đóng góp) chính của tác động lan tỏa trong chế độ ít biến động (chế độ biến
động cao). Các chế độ chủ yếu có mức độ biến động thấp từ tháng 1 năm 2019 đến
tháng 2 năm 2020 và mức độ biến động cao từ tháng 3 năm 2020 đến tháng 5 năm
2020. Chúng tôi kết luận rằng đại dịch COVID-19 đã tăng cường sự lan tỏa từ thị
trường hàng hóa sang thị trường chứng khoán Hoa Kỳ và Trung Quốc.
US monetary policy, oil and gold prices: Which has a greater impact on BRICS
stock markets?
Link: https://sci-hub.hkvisa.net/10.1016/j.eap.2019.08.003
Bài báo này xem xét ảnh hưởng của chính sách tiền tệ của Hoa Kỳ , giá dầu và giá
vàng đối với chỉ số chứng khoán của các nước BRICS . Mô hình hồi quy tự động
Vector được áp dụng để nghiên cứu các chỉ số chứng khoán của tất cả các quốc gia
BRICS như một nhóm trong giai đoạn 1996–2018. Chúng tôi nhận thấy rằng Bombay
Sensex phản ứng tích cực với Lãi suất quỹ liên bang. Chỉ số chứng khoán của Nam
Phi - FTSE JSE của Johannesburg - phản ứng tiêu cực với cú sốc giá dầu trong khi chỉ
số chứng khoán của Nga và Brazil - RTSI của Moscow và BVSP của Sao Paulo -
phản ứng tích cực với những thay đổi của giá vàng. Chúng tôi cung cấp các hàm ý về
quản lý và chính sách của những kết quả này.
- Kiểm định sự phù hợp của các mô hình hồi quy trên? Giải thích ý nghĩa các hệ
số hồi quy tìm được. Kỳ vọng về dấu của các hệ số hồi quy và kết quả hồi quy
mẫu có phù hợp không? Giải thích?
+) Sử dụng phần mềm Excel: Chọn Data  Data Analysis  Regression  Chọn
vùng Input Y (GP)  Chọn vùng Input X (CPI)  Chọn vùng Output (nơi xuất dữ
liệu) → Nhấn OK. Ta có kết quả:
 Mô hình hồi quy giữa GP và CPI

^
β 1=186,1833092 ^
β 2=1,841992698
^
β 1=¿186,1833092: Khi chỉ số giá tiêu dùng CPI bằng 0 thì giá vàng trung bình tối
thiểu (GP) là 186,1833092$.
^
β 2=1,841992698: Khi chỉ số giá tiêu dung CPI tăng 1 đơn vị thì giá vàng trung bình
tăng 1,841992698 và ngược lại.
 Hàm hồi quy giữa CPI và GP: Y^ =186,1833092-1,841992698X
Hay GPt = 186,18330921 + 1,841992698CPIt + et
 Mô hình hồi quy giữa SYNE và CPI

^
β 1=−102,06055 ^
β 2=2,12944
^
β 1=¿186,1833092: Khi chỉ số giá tiêu dùng CPI bằng 0 thì chỉ số chứng khoán
(NYSE) trung bình tối thiểu là -102,06055
^
β 2=2,12944 : Khi chỉ số giá tiêu dùng CPI tăng 1 đơn vị thì chỉ số chứng khoán
(NYSE) trung bình tăng 2,12944 và ngược lại.
 Hàm hồi quy giữa CPI và GP: ^ =-102,06055-2,12944X

Y
Hay NYSEt = -102,06066 – 2,12944 CPIt + et
Kỳ vọng về dấu của các hệ số hồi quy:
+ Hệ số β j >0: Khi đó Xj và Y có quan hệ thuận, nghĩa là khi Xj tăng (hoặc giảm)

trong điều kiện các biến độc lập khác không đổi thì Y cũng sẽ tăng (hoặc giảm).
=> Biến X giải thích được sự thay đổi của biến Y.
+ Hệ số β j <0: Khi đó Xj và Y có quan hệ nghịch, nghĩa là khi Xj tăng (hoặc giảm)

trong điều kiện các biến độc lập khác không đổi thì Y cũng sẽ giảm (hoặc tăng).
+ Hệ số β j =0: Khi đó Xj và Y không có tương quan với nhau.
c) Theo bạn, công cụ tài chính nào phòng chống lạm phát tốt hơn, vàng hay
chứng khoán? Giải thích?
Theo em, công cụ tài chính phòng chống lạm phát tốt hơn chính là vàng. Khi lạm phát
xảy ra, lãi suất ngân hàng trung ương sẽ giảm xuống dẫn đến nguồn cung tiền cho nền
kinh tế sẽ tăng. Tại thời điểm xảy ra tình trạng lạm phát, các nhà đầu tư có xu hướng
mua vàng để tích trữ nhiều hơn vì thế giá vàng sẽ tăng cao và ngược lại.
d) Tính giá trị kiểm định p_value khi kiểm định tính có ý nghĩa của các hệ số
trong 2 mô hình trên? Với mức ý nghĩa 5% hãy cho biết p_value tính được lớn
hơn hay nhỏ hơn mức ý nghĩa 5% ? Giải thích ý nghĩa của các p_value tính
được?
{ H 0 : β 1=0
1 1
Tham số β 1 có p-value =8,73. 10−4 < α =0,05
→ Bác bỏ H 0. Vậy hệ số β 1 có ý nghĩa trong mô hình hồi quy.
Tham số β 2 có p-value =4.42E-07 <α=0,05
 Mô hình hồi quy giữa GP và CPI
Tham số β 1 có p-value =0.161<α=0,05
Tham số β 2 có p-value =0.153< α=0,05

+) Áp dụng công thức
 Mô hình hồi quy giữa CPI và GP
{ H 0 : β 1=0
1 1
^
β1 −β1¿ 186,183−0
T 0= = =1,4846774
se ( ^
1β) 125,403
 p-value = 2 × P ( T >1,4846774 )=2 × ( 0,5−0,5 )=0<α =0,05
{ H 0 : β 2=0
1 2
^ ¿
β 2−β 2 1,84199−0
T 0= = =1,5159437
se ( ^
β 2) 1,21507
 p-value = 2 × P ( T >1,5159437 )=2× ( 0,5−0,5 )=0< α =0,05
{ H 0 : β 1=0
1 1
^
β1 −β1¿ −102.60655−0
T 0= = =−4.317
se ( ^
β 1) 23,766
 p-value = 2 × P ( T >−4.317 )=2× ( 0,5−0,5 )=0< α=0,05
{ H 0 : β 2=0
1 2
^ ¿
β 2−β 2 2,129442516−0
T 0= = =9,247017975
se ( ^
2β) 0,230284241
 p-value = 2 × P ( T > 9,247017975 )=2× ( 0,5−0,5 )=0< α =0,05
Bài 1.6: Trong kinh tế học vĩ mô, có hai lý thuyết khác nhau liên quan đến hành vi
tiêu dùng của dân chúng. Theo Keynes, tổng tiêu dùng (CONS) sẽ phụ thuộc vào
tổng thu nhập (khả dụng) (YD). Trong khi đó, các nhà kinh tế học cổ điển tin rằng tiêu
dùng có quan hệ nghịch biến với lãi suất (RR) trong nền kinh tế. Sử dụng số liệu trong
Bang1.4 (file Data_Chuong1.xlsx) (dữ liệu từ năm 1955-1986), bạn hãy:
a) Xây dựng các mô hình kinh tế cho mỗi giả thiết trên.
* Mô hình kinh tế của giả thiết theo Keynes, tổng tiêu dùng (CONS) sẽ phụ thuộc vào
tổng thu nhập (khả dụng) (YD).
Thu nhập: X
Tiêu dùng: Y
^
β 1 = -8,793
^
β 2 = 0,91311
Mô hình ước lượng từ mẫu: Y^ =-8,793+0,9131X
Hoặc: Y^ =-8,793+0,9131X+e
* Mô hình kinh tế của giả thiết các nhà kinh tế học cổ điển tin rằng tiêu dùng có quan
hệ nghịch biến với lãi suất (RR) trong nền kinh tế.
Lãi xuất: X
Tiêu dùng: Y
^
β 1 = 1370,69517
^
β 2 = 59,85887
Mô hình ước lượng từ mẫu: Y^ =1370,69517+59,85887X
Hoặc: Y^ =1370,69517+59,85887X+e
b) Bạn kỳ vọng như thế nào về dấu các hệ số đứng trước các biến giải thích trong
các mô hình này.
Kỳ vọng vào dấu của các hệ số đứng trước các biến giải thích ( β 2) trong các mô hình
tính được là số dương.
c) Ước lượng các tham số cho mỗi mô hình.
(Với độ tin cậy 95%, n>30)
Ước lượng tham số cho mô hình kinh tế của giả thiết theo Keynes:
- Khoảng ước lượng của tham số β 1
^
β 1 = -8,793
t n−2 30
α / 2 = t 0,025 = 2,042
se ¿ ) = 16,7198
¿> β 1 ∈¿ ))=(-42,9348;25,34883)

^
β 2 = 0,91311
t n−2 30
α / 2 = t 0,025 = 2,042
se ¿ ) = 0,00944
¿> β 2 ∈¿ ))=(0,893838;0,93239)
Ước lượng tham số cho mô hình kinh tế của các nhà kinh tế học cổ điển:
^
β 1 = 1370,69517
n−2 30
t α / 2 = t 0,025 = 2,042
se ¿ ) = 115,37482
¿> β 1 ∈¿ ))=(1135,09979;1606,29056)

^
β 2 = 59,85887
n−2 30
t α / 2 = t 0,025 = 2,042
se ¿ ) = 29,4878
¿> β 2 ∈¿ ))=(-0,3552176;120,0729576)
d) Dựa trên các kết quả kinh tế lượng của bạn, bạn có nhận xét gì về giá trị của
hai giả thiết trên.
 Dựa vào kết quả kinh tế lượng đã tính ở trên ta có thể thấy được theo mô hình
kinh tế của giả thiết theo Keynes khoảng ước lượng của các tham số β 2 chênh lệch
thấp -> ε i bé nên gía trị thực tế của biến phụ thuộc nằm gần đường hồi quy.
 Dựa vào kết quả kinh tế lượng đã tính ở trên ta có thể thấy được mô hình kinh tế
của các nhà kinh tế học cổ điển khoảng ước lượng của các tham số β 2 chênh lệch
rất lớn -> ε i lớn nên gía trị thực tế của biến phụ thuộc nằm xa đường hồi quy.
e) Với các mô hình trên hãy tìm ít nhất 2 paper ủng hộ các quan điểm này.
Ủng hộ quan điểm Keynes:
Consumption, income distribution and taxation: Keynes' fiscal polic.
Link: https://sci-hub.hkvisa.net/10.1016/S0926-6437(97)80003-0
Lý thuyết Tổng quát cho rằng phân phối thu nhập ảnh hưởng đến tiêu dùng. Bình đẳng
thu nhập cao hơn đưa nhiều tiền hơn vào tay những người có MPC cao hơn, dẫn đến
tăng tiêu dùng; và bất bình đẳng lớn hơn đã có tác động ngược lại. Tuy nhiên, trong số
sáu yếu tố khách quan mà Keynes xác định là ảnh hưởng đến tiêu dùng, chỉ có yếu tố
phân phối đã không trở thành một phần của lý thuyết tiêu dùng chủ đạo. Bài báo này
xem xét lý do tại sao lại như vậy, và sau đó phát triển một mô hình kết hợp phân phối
sau thuế vào một hàm tiêu dùng theo trường phái Keynes. Các thử nghiệm thực
nghiệm của mô hình này cho thấy rằng phân phối thu nhập sau thuế là một yếu tố
quyết định đáng kể đến tiêu dùng.
Keynes's personal investments in the London Stock Exchange and his views on the
transformation of the British economy.
Link: https://sci-hub.hkvisa.net/10.1016/j.strueco.2020.02.002
Trong bài báo này, chúng tôi phân tích các khoản đầu tư cá nhân của Keynes trong sở
giao dịch chứng khoán Luân Đôn tập trung vào lựa chọn của Keynes và mô hình lựa
chọn tài sản và lĩnh vực hơn là hiệu suất danh mục đầu tư. Trong số những thứ khác,
cách tiếp cận này có thể giúp định giá của Keynes về nền kinh tế Anh đã trải qua
những thay đổi cấu trúc đáng kể trong cuộc chiến giữa các giai đoạn. Đánh giá dựa
trên hành vi giao dịch của Keynes và triết lý đầu tư cung cấp mục bổ sung đáng kể
cho những gì chúng tôi cũng biết từ những tuyên bố công khai của những vị trí đã đảm
nhận chính trường, thậm chí còn hơn thế nữa, cho đến nay không có nỗ lực xây dựng
lại chi tiết các khoản đầu tư cá nhân của ông.
Ủng hộ quan điểm của các nhà kinh tế học cổ điển:
The effect of interest rates on consumption in an income fluctuation problem.
Link: https://sci-hub.hkvisa.net/10.1016/j.jedc.2018.07.004
Chúng tôi xem xét ảnh hưởng của việc thay đổi lãi suất đối với các quyết định tiêu
dùng và tiết kiệm của một đại lý khi thu nhập của cô ấy biến động. Trong mỗi thời kỳ,
một đại lý tồn tại lâu dài sẽ quyết định tiết kiệm bao nhiêu (tức là đầu tư vào một trái
phiếu rủi ro) và bao nhiêu để tiêu dùng trong khi thu nhập và tỷ suất lợi nhuận trên
khoản tiết kiệm của cô ấy không chắc chắn và phụ thuộc vào tình trạng của nền kinh
tế. Chúng tôi chỉ ra rằng dưới sự cô đọng của hàm tiêu dùng, một điều kiện đảm bảo
rằng tác động thay thế chiếm ưu thế so với tác động thu nhập, lãi suất thấp hơn
khuyến khích tiêu dùng của đại lý trên tất cả các tiểu bang.
A consumption-based model of the term structure of interest rates.
Link: https://sci-hub.hkvisa.net/10.1016/j.jfineco.2005.02.004
Bài báo này đề xuất một mô hình dựa trên tiêu dùng có nhiều đặc điểm trong cấu trúc
kỳ hạn danh nghĩa của lãi suất. Động lực đằng sau mô hình là giá rủi ro thay đổi theo
thời gian do thói quen bên ngoài tạo ra. Trái phiếu danh nghĩa phụ thuộc vào tăng
trưởng tiêu dùng trong quá khứ thông qua thói quen và lạm phát kỳ vọng. Khi được
hiệu chỉnh với dữ liệu về tiêu dùng, lạm phát và thị trường tổng hợp, mô hình tạo ra
các phương tiện và độ biến động thực tế của lợi tức trái phiếu và tính toán cho câu đố
kỳ vọng. Mô hình này cũng thể hiện phần bù vốn chủ sở hữu cao và sự biến động vượt
mức của thị trường chứng khoán.
f) Kiểm định tính có ý nghĩa của các hệ số hồi quy ? Theo bạn việc các hệ số đứng
trước biến giải thích có ý nghĩa có thể được xem là mô hình đưa ra phù hợp
không ? Giải thích.
( kiểm định với mức ý nghĩa 5%)
Kiểm định tính có ý nghĩa của hệ số hồi quy cho mô hình kinh tế của giả thiết theo
Keynes:
Đặt giả thiết: H 0 : β 2=0 ; H 1 : β 2 ≠ 0
n−2 30
t α / 2 = t 0,025 = 2,042
^
β 2−β ¿2 0,91311−0 30 30
T 0= = =96,7277 ∉(−t 0,025 ; t 0,025)
^
se ( β ) 0,00944
2
→ Bác bỏ H 0, vậy hệ số β 2thật sự có ý nghĩa trong mô hình hồi quy hay ta có thể nói
rằng thu nhập có ảnh hưởng đến tiêu dùng
Kiểm định tính có ý nghĩa của hệ số hồi quy cho mô hình kinh tế của các nhà kinh tế
học cổ điển:
Đặt giả thiết: H 0 : β 2=0 ; H 1 : β 2 ≠ 0
t n−2 30
α / 2 = t 0,025 = 2,042
^ ¿
β 2−β 2 59,85887−0
T 0= = =2,03 ∈(−t 30 30
0,025 ;t 0,025 )
^
se ( β ) 29,4878
2
→ Chấp nhận H 0, vậy hệ số β 2 không có ý nghĩa trong mô hình hồi quy hay ta có thể
nói rằng lãi xuất không ảnh hưởng đến tiêu dùng.
Kết luận:
1) Theo em việc các hệ số đứng trướng biến giải thích có ý nghĩa có thể xem là
mô hình đưa ra phù hợp chỉ trong mô hình hồi quy đơn biến. Tại vì để kiểm
định sự phù hợp của mô hình ta sẽ đưa ra cặp giả thiết cần kiểm định là
H 0 : R =0 ; H 1 : R ≠ 0tương đường với giả thiết kiểm định tính có ý nghĩa
2 2
H 0 : β 2=0 ; H 1 : β 2 ≠ 0 . Mục đích kiểm định tính có ý nghĩa của hệ số hồi quy là
một hệ số (tham số) hồi quy được gọi là có ý nghĩa khi và chi khi β ikhác 0 và
một mô hình hồi quy được gọi là phù hợp khi và chỉ khi R2 khác 0.
2) Còn trong hồi quy đa biến thì R2 khác 0; β ikhác 0 là hoàn toàn khác biệt nhau.
g) Dự báo điểm, khoảng cho các giá trị của biến phụ thuộc trong mô hình trên
Dự báo điểm từ năm (1955-1986) chạy bằng excel:
(Cột dự báo điểm là cột Predicted)
Tính thủ công với một điểm cụ thể:
Với một điểm cụ thể khi với thu nhập là 2001 ( năm 1976 ) ta xét trong 3 trường hợp
sau:
Trường hợp 1: Dự báo cho tiêu dùng trung bình.
Ứng với X=2001 thì E(Y/X=2001)=-8,973+0,91311*2001=1818,34011
→ Đây là dự báo điểm cho tiêu dùng trung bình.
Trường hợp 2: Dự báo cho tiêu dùng trung bình với độ tin cậy 95%
RSS 21906,3715
σ 2= = =730,21238
n−2 32−2
n
S XX =∑ x i −n ¿100369917,7-32¿(1697,2125)2=8192949,055
2
i=1
√( )
2
1 ( x i−x )
y i ) =√ Var ( ^
se ( ^ yi )= + σ2
n S XX
√( )
2
1 ( 2001−1697,2125 )
¿ + ∗730,21238=5,5717
32 8192949,055
E(Y/X= x i ¿ ∈ ^ (
y i ±t n−2
α ∗se ( ^
2
y i ) =¿ )
)
⇒E(Y/X= x i ¿ ∈ (1806,96;1829,7175)
→ Đây là dự báo khoảng cho tiêu dùng trung bình
Trường hợp 3: Dự báo cho tiêu dùng cụ thể với thu nhập là 2001 với độ tin cậy 95%
√( )
2
1 ( x i−x ) 2
yi ) =√ Var ( y i−^
se ( y i− ^ y i )= 1+ + σ =27,59
n S XX
(
y i ± t n−2
yi ∈ ^ α ∗se ( y i −^
2
)
y i ) =( 1818,34011± 2,042∗27,59 ) =(1762 ; 1874,68)
→ Đây là dự báo khoảng cho một mức tiêu dùng cụ thể

Bài 1.7: Dựa trên việc điều tra thực tế từ 36 bạn sinh viên các trường Bách Khoa,
Nông Lâm, Tự Nhiên, Xã Hội Nhân Văn, Khoa Kinh tế ĐHQG… nhóm sinh viên
K03403 Khoa Kinh tế ĐHQG lập mô hình nghiên cứu mối quan hệ giữa Điểm trung
bình cuối cùng của môn Kinh tế chính trị 1 (DTB) và Số giờ tự học trong tuần của
sinh viên (GTH).
a) Dựa vào bộ số liệu ở Bang1.5 (file Data_Chuong1.xlsx), hãy xác định tung độ
gốc và hệ số độ dốc của mô hình ước lượng. Nêu ý nghĩa kinh tế của mô hình ước
lượng vừa tìm được.
Chạy hàm Regression trong Excel, ta được:
- Tung độ gốc ^β 1= 5.067
- Hệ số độ dốc ^β 2= 0.463
- Mô hình ước lượng: Y= 5.067 + 0.463X +e
- Ý nghĩa kinh tế của mô hình ước lượng:
^β = 5.067: Khi không tự học thì số điểm trung bình tối thiểu mà một bạn sinh viên có
1
thể đạt được là 5.067 điểm.

^β = 0.463: Khi số giờ tự học trong tuần của một sinh viên tăng thêm 1 giờ thì điểm
2
trung bình môn KTCT của sinh viên đó tăng thêm 0.463 điểm.
b) Tính toán hệ số xác định R2. Dựa vào hệ số xác định, hãy cho nhận xét về chất
lượng mô hình. Giải thích nguyên nhân vì sao dẫn đến hệ số xác định R2 có kết
quả như trên.
- Hệ số xác định R2 = 0.262
- Nhận xét về chất lượng mô hình: Vì hệ số xác định R2= 0.262 nên các phần tử trong
mô hình có ít phần tử nằm gần đường hồi quy, do vậy đường hồi quy mẫu ở mô hình
sẽ phản ánh xu thế của đường hồi quy tổng thể kém hơn hơn. Do đó, chất lượng mô
hình yếu, điểm trung bình của KTCT phụ thuộc vào những yếu tố khác nhiều hơn là
số giờ tự học trong tuần.
- Nguyên nhân vì sao dẫn đến hệ số xác định R2 có kết quả như trên: Trong 100% sự
biến động của điểm trung bình môn KTCT thì có 26.2% sự biến động là do số giờ tự
học trong tuần ảnh hưởng, còn lại là do các yếu tố khác. Nghĩa là, trong 36 sinh viên
khoảng 9 sinh viên mà điểm trung bình KTCT được giải thích qua giờ tự học mỗi
tuần.
c) Tính toán giá trị kiểm định T o tương ứng của từng biến. Các biến này có ý
nghĩa thống kê ở mức 5% không?
β^ 2−0 β^ 2 0.463
T0 = = = =3.481 với se( ^β2 ) là Standard error trong bảng Excel
^ ^
se ( β 2) se ( β 2 ) 0.133
Cặp giả thiết cần kiểm định:
{ H 0 : β 2=0
H 1 : β2≠ 0
Mức ý nghĩa α=0.05; n=36

t 0.05=2.03 (dùng hàm “=T.INV.2T(alpha, n-2)” trong Excel)
34
T0 ∉ (-2.03;2.03)
→ Bác bỏ H0. Vậy với mức ý nghĩa 5%, mô hình hồi quy có ý nghĩa. Tức là, điểm
trung bình môn KTCT của sinh viên phụ thuộc vào số giờ tự học trong tuần.
d) Xác định độ tin cậy 95% của β2 tổng thể. Nêu ý nghĩa của độ tin cậy vừa xác
định được.
^β = 0.463 34
t 0.025=2.36 (dùng hàm “=T.INV.2T(alpha, n-2)” trong Excel)
2
se( ^β 2 ¿ = 0.133 (Standard error)

→ β 2 ∈ (0.14912;0.77688)
Vậy với độ tin cậy 95% thì khoảng tin cậy của β2 tổng thể từ (0.14912;0.77688)
Ý nghĩa của độ tin cậy vừa xác định được: Khi tham số (hệ số) β 2 ∈
(0.14912;0.77688) thì
e) Tìm ít nhất 2 paper ủng hộ cho mối liên hệ trong mô hình.
Temporally-focused analytics of self-regulated learning: A systematic review of
literature - JohnSaint, YizhouFan, DraganGašević, AbelardoPardo.
Link: https://reader.elsevier.com/reader/sd/pii/S2666920X22000157?
token=67988898554D256531A42A3648066DE6D92CEA69846BF14F5B8036A3416
D74F875990383A01EDA7E24C92B2A01854082&originRegion=eu-west-
1&originCreation=20220326072501
Nghiên cứu này nhằm điều tra các đặc điểm tự học và mối quan hệ của nó với thành
tích học tập. Bài báo phản ánh việc sử dụng thực tế giờ tự học trong quá trình học tập.
Ngoài ra, phân tích dựa trên các mô hình lý thuyết và tài khoản phương pháp luận
thường được sử dụng trong nghiên cứu trong lĩnh vực này. Do đó, những phát hiện
trong đây có thể được khái quát cho các nghiên cứu đại diện cho nghiên cứu về các
khía cạnh thời gian và tuần tự trong quá trình tự học.
Self-Regulated Learning and Academic Achievement: An Overview - Barry J.
Zimmerman.
Link:https://ciel.viu.ca/sites/default/files/
self_regulated_learning_and_academic_achievement_an_overview_0.pdf
Nghiên cứu thảo luận về cách nghiên cứu các quy trình thành phần góp phần vào sự
hiểu về các đặc điểm đặc biệt của việc tự học của sinh viên. Bên cạnh đó, ý nghĩa của
sự tự điều chỉnh hối cảnh học tập và thành tích của sinh viên được chọn để xem xét.
Cách sinh viên chọn, sắp xếp hoặc tạo môi trường học tập thuận lợi cho bản thân và
về cách họ lập kế hoạch và kiểm soát giờ tự học. Phân tích nghiên cứu và lý thuyết
gần đây về các quy trình tự điều tiết quan trọng của sinh viên sử dụng để học và đạt
được học tập. Những nỗ lực có thể được đưa ra để dạy tự điều chỉnh cho những sinh
viên tiếp cận học tập thụ động, và một số nỗ lực đáng chú ý đã được thực hiện.
Câu 1.8: Giả sử chúng ta nghiên cứu mối quan hệ giữa chi tiêu cho nghiên cứu và
phát triển (ký hiệu là , tính bằng tỷ dollars, giá cố định 1992) với số lượng bằng sáng
chế phát minh (ký hiệu là , tình bằng số lượng nghìn), tại Mỹ từ năm 1960 -1993; tức
là chúng ta có bộ số liệu gồm quan sát. Dưới đây là bảng báo cáo kết quả hồi quy:
PATENTS = 34.571+ 0.792R & D
(5.44) (13.79)
R2=0.859 N =34 ESS=3994.3
(số trong ngoặc là standard error)
a) Nếu thu chi tiêu cho nghiên cứu phát triển tăng thêm lên 1 tỷ dollars, thì số
lượng bằng phát minh sáng chế sẽ tăng lên bao nhiêu?
Nếu thu chi tiêu cho nghiên cứu phát triển tăng thêm lên 1 tỷ dollars, thì số lượng
bằng phát minh sáng chế sẽ tăng lên 0.792 (nghìn) bằng, tức là tăng lên 792 bằng.
b) Cho trước t 32
0.025 =2.042. Hãy tìm khoảng tin cậy của hệ số
β 1của tổng thể với
mức ý nghĩa 5%.

Khoảng ước lượng của tham số β 1
^β = 0.792. t 0,025 [32]=2.042
1
se( ^β 1) = 13.79
=> β 1 ∈(−27.36718 ;28.95118)
Vậy khoảng tin cậy cuả hệ số β 1của tổng thể với mức ý nghĩa 5% cần tìm là
(−27.36718 ;28.95118)
c) Hãy tìm khoảng tin cậy của hệ số β 0 của tổng thể.
^β = 34.571. t 0,025 [32]=2.042
0
se( ^β 0) = 5.44
=> β 0 ∈(23.46252 ; 45.67948)
Vậy khoảng tin cậy cuả hệ số β 0 là (23.46252 ; 45.67948)
e) Một nhà báo nói rằng, cứ 1 tỷ dollars chi tiêu cho nghiên cứu phát triển, thì sẽ
làm tăng số lượng bằng phát minh sáng chế lên vào khoảng 500. Hãy kiểm định
lại nhận định đó với mức ý nghĩa là 10%, tức là sử dụng t 32
0.05=¿ 1.679.
Cứ 1 tỷ dollars chi tiêu cho nghiên cứu phát triển, thì sẽ làm tăng số lượng bằng phát
minh sáng chế lên vào khoảng 500 bằng ≡ Cứ 1 tỷ dollars chi tiêu cho nghiên cứu
phát triển, thì sẽ làm tăng số lượng bằng phát minh sáng chế lên vào khoảng 0.5
(nghìn) bằng ⟺ β 1 (trong slide của thầy là β 2)=0.5
Cặp giả thiết cần kiểm định;
{ H 0 : β 1=0.5
H 1 : β 1 ≠ 0.5
^β 1= 0.792. t 0,05 [32] =1.679
se( ^β 1) = 13.79; β 1=0.5

¿
Giá trị kiểm định:

^β1 −β1¿ 0.792−0.5
T 0= = =0.0212∈ (−1.679 ;1.679 ) .
se ( ^β )
1
13.79
→ Chấp nhận H 0. Vậy nhận định của nhà báo là đúng (Cứ 1 tỷ dollars chi tiêu cho
nghiên cứu phát triển, thì sẽ làm tăng số lượng bằng phát minh sáng chế lên vào
khoảng 500 bằng).
Bài 1.9:
a) Ước Lượng mối quan hệ giữa bảo hiểm nhân thọ (INSUR) và thu nhập gia
đình (INC).
Tính toán thủ công ta có được:
x=59,3 y=236,95
2
x =4336,3 xy=17232,15
^ xy−x . y
β2 = 2 2 = 3.88
x −(x )
^
β 1 = y− ^
β2 . x = 6.85
→ Hàm hồi quy: Y^ =6.85+3.88X

+) Sử dụng Excel:
Ta sẽ dùng Data Analysis để tính các hệ số ^
β 1, ^
β 2:

Giá trị của ^

β 1 sẽ nằm ở cột Coefficients, dòng Intercept
Giá trị của ^

β 2 sẽ nằm ở cột Coefficients, dòng X Variable 1
b) Đánh giá mối quan hệ đã ước lượng, cụ thể là:
1. Nếu thu nhập tăng thêm 1000 USD thì bảo hiểm nhân thọ sẽ tăng lên bao
nhiêu?
Vì ^
β 2 = 3.88 nên khi thu nhập tăng 1000 thì bảo hiểm nhân thọ trung bình tăng 3880
2. Độ lệch chuẩn [standard error, (se)] của ước lượng là bao nhiêu. Và làm thế
nào để sử dụng se để ước lượng khoảng tin cậy [confidence interval, (ci)] và kiểm
định mức độ có ý nghĩa của biến giải thích.
√
n
∑ x 2i σ
2
β 1) = √ Var ( ^
se ( ^ β 1) = i=1
. = 7.38
n n
∑ ( x i−x ) 2
i=1
√
2
σ
β 2) = √ Var ( ^
se( ^ β 2) = n
= 0.112
∑ ( x i−x)2
i=1
Khoảng tin cậy ^
β 1:
β 1 ± t α . se ( β^1 ) ) = (-8.657110329 ; 22.36709191)

β 1 ∈( ^
n−2
Khoảng tin cậy ^

β 2:
β 2 ∈( ^
β 2 ± t α . se ( β^2 ) ) = (3.644620543 ; 4.115750763)
n−2
Kiểm định mức độ có ý nghĩa của biến giải thích:
{
Cách 1: Ứng với cặp giả thiết cần kiểm định là: H : β ≠ 0
1 2
H 0 : β 2=0
Khoảng tin cậy cho tham số β 2 ∈ (3.644620543 ; 4.115750763)

Ta thấy β 2* = 0 (USD) không thuộc vào khoảng này→Bác bỏ H 0
Vậy hệ số β 2 thực sự có ý nghĩa trong mô hình hồi quy
{
Cách 2: Ứng với cặp giả thiết cần kiểm định là: H : β ≠ 0
1 2
H 0 : β 2=0
^ ¿
β2 −β2 3.88−0
Giá trị kiểm định T 0 = = = 34.64
se( ^
β2 ) 0.112
Ta có: t n−2 18
α / 2 = t 0.025 = 2.101
T 0 = 34.64 ∉ (-2.101 ;2.101) → Bác bỏ H 0
Vậy hệ số β 2 thực sự có ý nghĩa trong mô hình hồi quy

Ta sẽ dùng Data Analysis để tính giá trị kiểm định t-stat:
Giá trị điểm định t-stat của β 2 nằm ở cột t stat, dòng X Variable 1
3. Nếu một thành viên ban quản lý tuyên bố rằng, cứ mỗi 1000 USD tăng lên về
thu nhập sẽ làm tăng bảo hiểm nhân thọ lên 5000 USD. Liệu kết quả ước lượng
của bạn có hỗ trợ cho lời tuyên bố này với mức ý nghĩa 5% (5% significance
level)?
Cứ mỗi 1000 USD tăng lên về thu nhập sẽ làm tăng bảo hiểm nhân thọ lên 5000 USD
hay nói cách khác Cứ mỗi 1000 USD tăng lên về thu nhập sẽ làm tăng bảo hiểm nhân
thọ lên 0,5 (chục nghìn) USD.
{ H 0 : β 2=0,5
Đặt giả thiết: H : β ≠ 0,5
1 2
t 18
0,025 =2,101
^ ¿
β 2−β 2 3,88−0,5
T 0= = =30,18 ∉(−2,101 ; 2,101)
se ( β^ )
2
0.112
Bác bỏ H 0.
Vậy lời tuyên bố: cứ mỗi 1000 USD tăng lên về thu nhập sẽ làm tăng bảo hiểm nhân
thọ lên 5000 USD là không đúng.
4. Dự đoán mức bảo hiểm nhân thọ điểm, khoảng cho hộ gia đình có thu nhập là
100 nghìn USD.
Dự báo điểm cho mức bảo hiểm nhân thọ:
Ứng với X=100 thì E(Y/X=100) = 6,85 + 3,88.100 = 394,85
Dự báo khoảng cho mức bảo hiểm nhân thọ cụ thể:
13
RSS=∑ ( y i− ^
y i )2=¿ ¿3710,37
i=1
2 RSS
σ = =206,13
n−2
20
S xx =∑ ( xi −x́)2=16396,2
i=1
√( )
2
1 ( x i− x́ )
y i ¿= √ Var ( y i− ^
se( y i− ^ 2
yi ) = 1+ + . σ =15,4
n S xx
yi ∈( ^ 0,025 . se ( yi − y i ) ) =( 394,85± 2,101 ×15,4 )

y i ± t 18 ^
y i ∈(362,4946 ; 427,2054)
Chọn Data → Data Analysis → Regression → Chọn vùng Input Y (INSUR) → Chọn
vùng Input X (INC) → Chọn vùng Output (nơi xuất dữ liệu) → Chọn Line Fit Plot →
Nhấn OK.
c) Tìm ít nhất 2 paper ủng hộ mối liên hệ trên.
The impact of real income on insurance premiums: Evidence from panel data.
Link:https://doi.org/10.1016/j.iref.2011.07.003
Tác giả sử dung mô hình hồi quy ngưỡng để phân tích độ co giãn của chi phí bảo hiểm
so với thu nhập thực tế của 36 quốc gia được chọn và trong khoảng thời gian từ 1979-
2007. Tác giả đã kết luận rằng những thay đổi trong thu nhập thực tế là một trong
những yếu tố gây ra sự thay đổi cơ cấu trong mối quan hệ giữa phí bảo hiểm và thu
nhập.
Determinants of Life and Funeral Insurance Penetration and Density in South

Africa.
Link:https://core.ac.uk/reader/188225700
Ba loại phân tích dữ liệu được thực hiện là giải thích thống kê mô tả cho tất cả các
biến; sử dụng phương pháp Bình phương tối thiểu (OLS) để đánh giá mối quan hệ
tuyến tính giữa các biến phụ thuộc và các biến độc lập; và việc thực hiện kiểm định
Johansen và phép thử quan hệ nhân quả Granger để xác định xem liệu có tồn tại mối
quan hệ nhân quả giữa thu nhập với mức độ biết và sử dụng bảo hiểm nhân thọ hay
không. Tác giả đưa ra ba giả thiết và lần lượt kiểm định chúng. Trong đó, có một giả
thiết đề cập đến thu nhập bình quân đầu người được coi là một yếu tố quyết định tích
cực và đáng kể đến việc tiêu dùng bảo hiểm tang lễ và nhân thọ. Cuối cùng, tác giả đã
đưa ra kết luận rằng kết quả kiểm định phù hợp với giả thiết đã đề ra.
Bài 1.10: Hội Sinh viên một trường Đại học tại Mỹ của một trường Đại học tại Mỹ
mở một cuộc điều tra ngẫu nhiên 427 sinh viên một trường Đại học tại Mỹ của trường
để hiểu thêm về mối quan hệ giữa điểm trung bình tích lũy đại học (COLGPA), lần
lượt với điểm trung bình cuối năm phổ thông (HSGPA), điểm kiểm tra kỹ năng học
tập (VSAT) và điểm kiểm tra toán trong kỳ thi SAT (MSAT). Hội Sinh viên một
trường Đại học tại Mỹ này chạy hồi qui ra được 3 mô hình hồi qui đơn biến như sau
(số trong ngoặc là standard error):
CLOGPA= 0.92058 + 0.52147HSGPA + ε R2 =0.165
(0.20463) (0.05712)
CLOGPA= 1.99740 + 0.00157VSAT +ε R2 =0.070
(0.20463) (0.05712)
CLOGPA= 1.62845 + 0.00204MAST +ε R =0.124
2
(0.15135) (0.00026)
a) Nhận xét ý nghĩa kinh tế của từng mô hình trong 3 mô hình trên?
Mô hình 1:
CLOGPA= 0.92058 + 0.52147HSGPA + ε R =0.165
2
(0.20463) (0.05712)
β 1=0.92058 : Khi sinh viên một trường Đại học tại Mỹ đạt 0 điểm trung bình cuối
năm phổ thông thì điểm trung bình tích lũy đại học của họ có giá trị trung bình tối
thiểu là 0.92058 điểm.
β 2=0.52147 : Khi điểm trung bình cuối năm phổ thông của sinh viên một trường Đại
học tại Mỹ tăng thêm 1 điểm thì điểm trung bình tích lũy đại học trung bình của họ
tăng thêm 0.52147 điểm (trong điều kiện các yếu tố khác không đổi).
Mô hình 2:
CLOGPA= 1.99740 + 0.00157VSAT +ε R2 =0.070
(0.20463) (0.05712)
β 1=1.99740: Khi sinh viên một trường Đại học tại Mỹ đạt 0 điểm kiểm tra kỹ năng
học tập thì điểm trung bình tích lũy đại học của họ có giá trị trung bình tối thiểu là
1.99740 điểm..
β 2=0.00157 : Khi điểm kiểm tra kỹ năng học tập của sinh viên một trường Đại học
tại Mỹ tăng thêm 1 điểm thì điểm trung bình tích lũy đại học trung bình của họ tăng
thêm 0.00157 điểm (trong điều kiện các yếu tố khác không đổi).
Mô hình 3:
CLOGPA= 1.62845 + 0.00204MAST +ε R2 =0.124
(0.15135) (0.00026)
β 1=1.62845: Khi sinh viên một trường Đại học tại Mỹ đạt 0 điểm kiểm tra Toán
trong kỳ thi SAT thì điểm trung bình tích lũy đại học của họ có giá trị trung bình tối
thiểu là 1.62845.
β 2=0.00204 : Khi điểm kiểm tra Toán trong kỳ thi SAT của sinh viên một trường Đại
học tại Mỹ tăng thêm 1 điểm thì điểm trung bình tích lũy đại học trung bình của họ
tăng thêm 0.00204 điểm (trong điều kiện các yếu tố khác không đổi).
b) Ý nghĩa của hệ số xác định. Dựa trên hệ số xác định, mô hình nào là tốt nhất.
Ý nghĩa của hệ số xác định:
Mô hình 1:
CLOGPA= 0.92058 + 0.52147HSGPA + ε R2 =0.165
(0.20463) (0.05712)
→ Có khoảng 70 sinh viên mà điểm trung bình tích lũy đại học (CLOGPA) được giải
thích qua điểm trung bình cuối năm phổ thông (HSGPA) của họ.
Mô hình 2:
CLOGPA= 1.99740 + 0.00157VSAT +ε R =0.070
2
(0.20463) (0.05712)
thích qua điểm kiểm tra kỹ năng học tập (VSAT) của họ.
Mô hình 3:
CLOGPA= 1.62845 + 0.00204MAST +ε R2 =0.124
(0.15135) (0.00026)
thích qua điểm kiểm tra Toán trong kỳ thi SAT (MSAT) của họ.
Ở cả 3 mô hình, cỡ mẫu khảo sát đều là n=427 sinh viên nên mô hình 1 là tốt nhất
vì hệ số xác định R2 của mô hình này là lớn nhất trong 3 mô hình⇒ Các phần tử
trong mô hình 1 sẽ có nhiều phần tử nằm gần đường hồi quy hơn, đồng thời
đường hồi quy mẫu ở mô hình 1 sẽ phản ánh xu thế của đường hồi quy tổng thể
tốt hơn.
c) Hãy tính giá trị kiểm định T 0 (t stat ) của các biến độc lập tương ứng với từng mô
hình trong 3 mô hình trên với mức ý nghĩa 5%. Nhận xét về ý nghĩa của các biến
giải thích trong từng mô hình. Cho biết mô hình nào là tốt nhất theo R2 và t stat
- Ý thứ nhất: Hãy tính giá trị kiểm định T 0 (t stat ) của các biến độc lập tương ứng với
từng mô hình trong 3 mô hình trên với mức ý nghĩa 5%.
Với mức ý nghĩa α =0.05
Mô hình 1:
^
β 2−0 ^
β2 0.52147
T 0= = = ≈ 9.13
se ( β^ ) se ( ^
2 2β ) 0.05712
Mô hình 2:
^
β 2−0 ^
β2 0.00157
T 0= = = ≈ 0.03
se ( ^
β 2 ) se ( ^
β 2 ) 0.05712
Mô hình 3:
^
β 2−0 ^
β2 0.00204
T 0= = = ≈ 7.85
se ( β ) se ( β ) 0.00026
^
2
^
2
- Ý thứ hai: Nhận xét về ý nghĩa của các biến giải thích trong từng mô hình.
{ H 0 : β 2=0
H 1 : β2≠ 0
Mức ý nghĩa α =0.05 ; n=427

Cách 1:
t 0.05=1.97 (dùng hàm “=T.INV.2T(alpha, n-2)” trong Excel
425
Mô hình 1:
^
β 2−0 ^
β2 0.52147
T 0= = = ≈ 9.13 ∉ (-1,97;1,97)
se ( β ) se ( β ) 0.05712
^
2
^
2
→ Bác bỏ H 0. Vậy hệ số β 2 có ý nghĩa, suy ra mô hình hồi quy có ý nghĩa, tức là điểm
trung bình tích lũy đại học có phụ thuộc vào điểm trung bình cuối năm phổ thông (Khi
điểm trung bình cuối năm phổ thông tăng lên thì điểm trung bình tích lũy đại học cũng
tăng).
Mô hình 2:
^
β 2−0 ^
β2 0.00157
T 0= = = ≈ 0.03 ∈ (-1,97;1,97)
se ( β^ ) se ( ^
2 β ) 0.05712
2
→ Chấp nhận H 0 . Vậy hệ số β 2 không có ý nghĩa, suy ra mô hình hồi quy không có ý
nghĩa, tức là điểm trung bình tích lũy đại học không phụ thuộc vào điểm kiểm tra kỹ
năng học tập (Khi điểm kiểm tra kỹ năng học tập tăng lên thì điểm trung bình tích lũy
đại học cũng tăng).
Mô hình 3:
^
β 2−0 ^
β2 0.00204
T 0= = = ≈ 7.85 ∉ (-1,97;1,97)
se ( ^
β ) se ( ^
2 β ) 0.00026
2
trung bình tích lũy đại học có phụ thuộc vào điểm kiểm tra Toán trong kỳ thi SAT
(Khi điểm kiểm tra Toán trong kỳ thi SAT tăng lên thì điểm trung bình tích lũy đại
học cũng tăng).
Cách 2:
Mô hình 1:
^
β 2−0 ^
β2 0.52147
T 0= = = ≈ 9.13
se ( ^
β 2 ) se ( ^
β 2 ) 0.05712
⟹ p value=2∗P ( T > 9.13 )=2∗( 0.5−0.5 )=0< α=0.05
tăng).
Mô hình 2:
^
β 2−0 ^
β2 0.00157
T 0= = = ≈ 0.03
se ( β^ ) se ( ^
2 β ) 0.05712
2
⟹ p value=2∗P ( T >0.03 )=2∗ ( 0.5−0.012 )=0.976>α=0.05

Mô hình 3:
^
β 2−0 ^
β2 0.00204
T 0= = = ≈ 7.85
se ( ^
β ) se ( ^
2 β ) 0.00026
2
⟹ p value=2∗P ( T >7.85 ) =2∗( 0.5−0.5 ) =0<α =0.05

học cũng tăng).
Cách 3:
Mô hình 1:
^
β 2=0.52147 t 425
0.05=1.97
se ( ^
β 2 ¿=0.05712
⟹ Khoảng tin cậy cho tham số β 2 ∈ (0,409;0,634)
¿
Ta thấy β 2=0 (điểm) không thuộc khoảng này.
tăng).
Mô hình 2:
^
β 2=0.00157 t 425
0.05=1.97
se ( ^
β 2 ¿=0.05712
⟹ Khoảng tin cậy cho tham số β 2 ∈ (-0,11;0,11)
¿
Ta thấy β 2=0 (điểm) thuộc khoảng này.
Mô hình 3:
^
β 2=0.00204 t 425
0.05=1.97
se ( ^
β 2 ¿=0.00026
¿
học cũng tăng).
- Ý thứ ba: Cho biết mô hình nào là tốt nhất theo R2 và t stat
Theo R2:
Kiểm định sự phù hợp của mô hình:
{
2
H : R =0
Cặp giả thiết cần kiểm định 0 2
H1 : R ≠ 0
Mô hình 1:
2
R ∗( n−2 )
F= =83.98
1−R 2
Mô hình 2:
2
R ∗( n−2 )
F= 2
=31.99
1−R
Mô hình 3:
2
R ∗( n−2 )
F= 2
=60.16
1−R
Theo R2 với mức ý nghĩa 5%, cả 3 mô hình đều phù hợp do có F > F 0.05;1;425. Thế
nhưng mô hình 1 là tốt nhất do có R2 lớn nhất khi xét trên cùng một cỡ mẫu (n=427).
Theo t stat :
Theo bài toán kiểm định ở ý 1 câu c, mô hình 1 và mô hình 3 có ý nghĩa, mô hình 2
không có ý nghĩa nên mô hình 2 không phải là một mô hình tốt.
d) Hãy tính giá trị kiểm định t stat của các biến độc lập tương ứng với từng mô
hình trong 3 mô hình trên với mức ý nghĩa 1%. Nhận xét về ý nghĩa của các biến
giải thích trong từng mô hình. Cho biết mô hình nào là tốt nhất theo R2 và t stat .
- Ý thứ nhất: Hãy tính giá trị kiểm định T 0 (t stat ) của các biến độc lập tương ứng với
từng mô hình trong 3 mô hình trên với mức ý nghĩa 1%.
Với mức ý nghĩa α =0.0 1
Mô hình 1:
^
β 2−0 ^
β2 0.52147
T 0= = = ≈ 9.13
se ( β ) se ( β ) 0.05712
^
2
^
2
Mô hình 2:
^
β 2−0 ^
β2 0.00157
T 0= = = ≈ 0.03
se ( ^
β 2 ) se ( ^
β 2 ) 0.05712
Mô hình 3:
^
β 2−0 ^
β2 0.00204
T 0= = = ≈ 7.85
se ( β ) se ( β ) 0.00026
^
2
^
2
- Ý thứ hai: Nhận xét về ý nghĩa của các biến giải thích trong từng mô hình.
{ H 0 : β 2=0
H 1 : β2≠ 0
Mức ý nghĩa α =0.0 1; n=427

Cách 1:
t 0.0 1=¿2.59 (dùng hàm “=T.INV.2T(alpha, n-2)” trong Excel
425
Mô hình 1:
^
β 2−0 ^
β2 0.52147
T 0= = = ≈ 9.13 ∉ (-2.59;2.59)
se ( β^ ) se ( ^
2 2 β ) 0.05712
tăng).
Mô hình 2:
^
β 2−0 ^
β2 0.00157
T 0= = = ≈ 0.03 ∈ (-2.59;2.59)
se ( ^
β ) se ( ^
2 2β ) 0.05712
Mô hình 3:
^
β 2−0 ^
β2 0.00204
T 0= = = ≈ 7.85 ∉ (-2.59;2.59)
se ( ^
β ) se ( ^
2 2β ) 0.00026
học cũng tăng).
Cách 2:
Mô hình 1:
^
β 2−0 ^
β2 0.52147
T 0= = = ≈ 9.13
se ( ^
β ) se ( ^
2 2β ) 0.05712
⟹ p value=2∗P ( T > 9.13 )=2∗( 0.5−0.5 )=0< α=0.05
tăng).
Mô hình 2:
^
β 2−0 ^
β2 0.00157
T 0= = = ≈ 0.03
se ( ^
2β ) se ( ^
β ) 0.05712
2
⟹ p value=2∗P ( T >0.03 )=2∗ ( 0.5−0.012 )=0.976>α=0.05

Mô hình 3:
^
β 2−0 ^
β2 0.00204
T 0= = = ≈ 7.85
se ( β ) se ( β ) 0.00026
2
^ ^
2
⟹ p value=2∗P ( T >7.85 ) =2∗( 0.5−0.5 ) =0<α =0.05

học cũng tăng).
Cách 3:
Mô hình 1:
^ 425
β 2=0.52147 t 0.01=2.59
se ( ^
β 2 ¿=0.05712
¿
tăng).
Mô hình 2:
^ 425
β 2=0.00157 t 0.01=2.59
se ( ^
β 2 ¿=0.05712
⟹ Khoảng tin cậy cho tham số β 2 ∈ (-0,15;0,15)
¿
Ta thấy β 2=0 (điểm) thuộc khoảng này.
Mô hình 3:
^ 425
β 2=0.00204 t 0.0 1=2.59
se ( ^
β 2 ¿=0.00026
¿
học cũng tăng).
- Ý thứ ba: Cho biết mô hình nào là tốt nhất theo R2 và t stat
Theo R2:
Kiểm định sự phù hợp của mô hình:
{
2
H : R =0
Cặp giả thiết cần kiểm định 0 2
H1 : R ≠ 0
Mô hình 1:
2
R ∗( n−2 )
F= 2
=83.98
1−R
Mô hình 2:
R 2∗( n−2 )
F= 2
=31.99
1−R
Mô hình 3:
2
R ∗( n−2 )
F= 2
=60.16
1−R
Theo R2 với mức ý nghĩa 1%, cả 3 mô hình đều phù hợp do có F > F0.01;1;425. Thế
nhưng mô hình 1 là tốt nhất do có R2 lớn nhất khi xét trên cùng một cỡ mẫu (n=427).
Theo t stat :
Theo bài toán kiểm định ở ý 1 câu c, mô hình 1 và mô hình 3 có ý nghĩa, mô hình 2
không có ý nghĩa nên mô hình 2 không phải là một mô hình tốt.

Bt chương 1 nộp thầy

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Bt chương 1 nộp thầy

Uploaded by

Copyright:

Available Formats

I.

f(x)= 1 ∗e với μ= E( X ) , σ 2= Var ( X ).

- Tính trung bình tổng thể, phương sai tổng thể.

+) Áp dụng công thức: ∑ X i → μ= 8+9+10+11+12 = 10

+) Sử dụng phần mềm Excel:

TB 10 9 9.33 9.66 9.66 10 10.3 10 10.3 10.6 11

Câu 0.4: Econometric

Mô hình hồi quy tuyến tính trên mẫu (SRM):

Thì SRF có dạng: Y^ = ^

 Vì có vô số mẫu ngẫu nhiên, nên có vô số giá trị của ^

^ xy−x . y 148,3−13,3. 10,5

thiểu của họ là 2,047 triệu đồng

tăng 0,636 triệu đồng.

→ Hàm hồi quy: Y^ = -1.14 + 15.11X

 Bước 1: Chọn Data → Data Analysis

Ý nghĩa của các hệ số hồi quy ^

Ta có: F 0.05 ;1; 8 = 5.318

 Bước 1: Chọn Data → Data Analysis

 Bước 1: Chọn Data → Data Analysis

Covariance giữa RENT và DIST sẽ nằm ở cột RENT, dòng DIST

 Bước 1: Chọn Data → Data Analysis

Correlation giữa RENT và DIST sẽ nằm ở cột RENT, dòng DIST

Examining the Variability of Apartment Rent (K.L. Guntermann & S. Norrbin,

 Hàm hồi quy: Y^ =3,366258-0,286212X

Độ lệch chuẩn: β 1=0,331084 β 2=0,062885

 Hàm hồi quy: Y^ =3,36626-0,28621X

 Đối với tham số ^

β1 ϵ ( ^ 0,025 . se ( β1 ) )  β 1 ϵ ( 2,637546 ; 4,094974 )

+) Sử dụng phần mềm Excel:

Tham số β 1 có p-value =6,26. 10−7 <α =0,05

 Bác bỏ H 0. Vậy hệ số β 1 có ý nghĩa trong mô hình hồi quy.

Tham số β 2 có p-value =0,0008283< α=0,05

 Bác bỏ H 0. Vậy hệ số β 2 có ý nghĩa trong mô hình hồi quy.

+) Áp dụng công thức:

 p-value = 2 × P ( T >10,16742 )=2 × ( 0,5−0,5 )=0< α=0,05

Bác bỏ H 0. Vậy hệ số β 1 có ý nghĩa trong mô hình hồi quy.

Kiểm định tính có ý nghĩa của β 1:

 p-value = 2 × P ( T >−4,55132 )=2 × ( 0,5−0,5 )=0<α =0,05

Bác bỏ H 0. Vậy hệ số β 2 có ý nghĩa trong mô hình hồi quy.

 Bước 1: Chọn Data → Data Analysis

Effects of Price of Gold on Bombay Stock Exchange Sectoral Indices: New

 Mô hình hồi quy giữa GP và CPI

 Hàm hồi quy giữa CPI và GP: Y^ =186,1833092-1,841992698X

Hay GPt = 186,18330921 + 1,841992698CPIt + et

 Mô hình hồi quy giữa SYNE và CPI

 Hàm hồi quy giữa CPI và GP: ^ =-102,06055-2,12944X

Kỳ vọng về dấu của các hệ số hồi quy:

+ Hệ số β j >0: Khi đó Xj và Y có quan hệ thuận, nghĩa là khi Xj tăng (hoặc giảm)

=> Biến X giải thích được sự thay đổi của biến Y.

+ Hệ số β j <0: Khi đó Xj và Y có quan hệ nghịch, nghĩa là khi Xj tăng (hoặc giảm)

 Mô hình hồi quy giữa SYNE và CPI

Tham số β 1 có p-value =8,73. 10−4 < α =0,05

→ Bác bỏ H 0. Vậy hệ số β 1 có ý nghĩa trong mô hình hồi quy.

Tham số β 2 có p-value =4.42E-07 <α=0,05

→ Bác bỏ H 0. Vậy hệ số β 2 có ý nghĩa trong mô hình hồi quy.

 Mô hình hồi quy giữa GP và CPI

Tham số β 1 có p-value =0.161<α=0,05

→ Bác bỏ H 0. Vậy hệ số β 1 có ý nghĩa trong mô hình hồi quy.

Tham số β 2 có p-value =0.153< α=0,05

→ Bác bỏ H 0. Vậy hệ số β 2 có ý nghĩa trong mô hình hồi quy.

 Mô hình hồi quy giữa CPI và GP

Kiểm định tính có ý nghĩa của β 1:

 p-value = 2 × P ( T >1,4846774 )=2 × ( 0,5−0,5 )=0<α =0,05