Professional Documents
Culture Documents
Bt Chương 1 Bản Word
Bt Chương 1 Bản Word
THEORY
Câu 0.1: Ôn tập Xác suất
a) Thế nào là một Biến ngẫu nhiên (Đại lượng ngẫu nhiên - ĐLNN) (BNN)
Có 3 cách định nghĩa một BNN (Random Variable):
(i) Random Variable là biến mà giá trị nhận được là các kết quả của phép thử ngẫu
nhiên.
(ii) Random Variable là biến mà giá trị nhận được thay đổi từ phần tử (đối tượng khảo
sát) này sang phần tử khác trong một phép thử ngẫu nhiên (định nghĩa dễ hiểu nhất).
(iii) Random Variable là biến có quy luật phân phối xác suất phản ánh sự biến động về
mặt giá trị mà Random Variable có thể nhận được.
Ví dụ: Gieo một con xúc xắc, nếu gọi biến ngẫu nhiên X = “số nút trên mặt con xúc
xắc” thì các giá trị có thể của X được viết là X ∈ {1,2,3,4,5,6} với các xác suất tương
ứng của mỗi phần tử đều là 1/6.
Về mặt hình thức, có thể định nghĩa biến ngẫu nhiên như là một hàm số có giá trị thực
được xác định trên không gian các sự kiện sơ cấp (sao cho nghịch ảnh của một khoảng
số là một sự kiện), tức là:
X:Ω→R
trong đó Ω là không gian các sự kiện sơ cấp. Để có thể dễ dàng phân biệt và thực hiện
các phép tính toán, ta thống nhất kí hiệu X,Y,⋯ là các biến ngẫu nhiên (BNN), còn
x,y,⋯ là giá trị của các BNN đó. Như vậy, X mang tính ngẫu nhiên, còn x là giá trị cụ
thể quan sát được khi ta tiến hành phép thử.
b) Với một BNN điều kiện cần và đủ để tuân theo quy luật phân phối chuẩn là
gì?
Điều kiện cần: Biến X phải là một biến ngẫu nhiên liên tục, nhận giá trị trong khoảng
(−∞;+∞).
Điểu kiện đủ: BNN liên tục X nhận giá trị trong khoảng (−∞;+∞)có phân phối chuẩn
với các tham số , nếu hàm mật độ xác suất của nó có dạng:
c) Giá trị đại diện cho mức độ tập trung, phân tán của một BNN là gì ? Vì sao
Giá trị đại diện cho mức độ tập trung của một BNN: Trung bình E(X) ≡ μ. Bởi vì khi
thu thập dữ liệu ta thường gặp các giá trị ở dạng rời rạc nên để có thể mô tả một cách
đơn giản nhất mức độ tập trung của dữ liệu, ta sẽ quan tâm đến giá trị đại diện tốt nhất
cho các giá trị thu thập được của biến ngẫu nhiên X, đó là giá trị trung bình. Trung
bình E(X) phản ánh giá trị trung tâm của biến ngẫu nhiên. E(X) chỉ đại diện tốt cho
tập dữ liệu khi biến ngẫu nhiên X có phân phối Chuẩn (đồ thị về dữ liệu của X có
dạng hình chuông).
Giá trị đại diện cho mức độ phân tán của một BNN: Phương sai Var(X). Phương sai
của biến ngẫu nhiên X là trung bình của bình phương sai lệch giữa các giá trị của biến
ngẫu nhiên X và trung bình của nó. Vì vậy, phương sai Var(X) là đại lượng đặc trưng
cho độ phân tán các giá trị của biến ngẫu nhiên xung quanh giá trị trung bình E(X).
Nếu Var(X) lớn chứng tỏ sự biến động của X lớn. Ngược lại, khi Var(X) nhỏ thì X
biến động ít, tương đối ổn định.
Chẳng hạn, X là biến ngẫu nhiên chỉ chi tiêu hàng năm của các hộ gia đình ở một
vùng, E(X) cho biết mức chi tiêu trung bình hàng năm của các hộ gia đình vùng đó,
Var(X) cho biết độ dao động của mức chi tiêu hàng năm xung quanh giá trị trung bình
đó. Nếu Var(X) lớn thì mức chi tiêu của các hộ gia đình ở vùng đó biến động thất
thường, nếu Var(X) nhỏ thì mức chi tiêu của các hộ gia đình ở vùng đó tương đối ổn
định.
Câu 0.2: Ôn tập Thống kê
a) Mẫu ngẫu nhiên là mẫu có tính chất gì?
Mẫu ngẫu nhiên (Random sample) là mẫu được chọn một cách ngẫu nhiên trong đó
mỗi đơn vị (phần tử) trong tổng thể có khả năng được lựa chọn ngang nhau (tức là xác
suất được chọn của mỗi phần tử trong tổng thể là như nhau). Do đó, kỳ vọng và
phương sai của đại lượng nghiên cứu và mỗi phần tử được chọn đều bằng nhau. Mẫu
được chọn một cách ngẫu nhiên sẽ có tính đại diện tốt nhất cho tổng thể.
→ Phát biểu theo ngôn ngữ thống kê:
Một mẫu ngẫu nhiên kích thước n là tập hợp n biến ngẫu nhiên độc lập X1 , X2,…, Xn
được thành lập từ biến ngẫu nhiên X trong tổng thể và có cùng phân phối với biến
ngẫu nhiên gốc X.
Ký hiệu mẫu ngẫu nhiên: W = (X1 , X2,…, Xn).
Do mỗi lần lấy phần tử cho mẫu, biến ngẫu nhiên X đều là như nhau, do đó kỳ vọng
và phương sai của chúng đều bằng nhau:
E(X1) = E( X2) = … = E(Xn) = E(X) = m
V(X1) = V(X2) = … = V(Xn) = V(X) = σ2
b) Giá trị đại diện cho mức độ tập trung, phân tán của một mẫu ngẫu nhiên là
gì?
Đối với một mẫu ngẫu nhiên:
Giá trị đại diện cho mức độ tập trung: Trung bình mẫu (̅), Số yếu vị (mode), Trung vị
(median), Phân vị (quantile).
Giá trị đại diện cho mức độ phân tán: Phương sai mẫu và độ lệch chuẩn mẫu, Hệ số
biến thiên, Khoảng biến thiên, Độ trải giữa.
c) Với BNN là Thu nhập trên một Tổng thể giả định là N = 5 có giá trị như sau
Bước 3: Lập 1 cột mới (tên cột là Chọn ngẫu nhiên 3 hộ gia đình). Tại ô C2 ta
nhập công thức =INDEX($B$2:$B$6,RANK(A2,$A$2:$A$6)) và nhấn Enter,
ta chọn được ngẫu nhiên 1 hộ gia đình. Dùng chức năng Fill Handle cho 2 dòng
tiếp theo, ta sẽ chọn được ngẫu nhiên 3 hộ gia đình từ 5 hộ gia đình.
- Ứng với các mẫu gồm 3 hộ gia đình hãy tính trung bình mẫu và phương sai
mẫu hiệu chỉnh trên từng mẫu.
+) Quy ước: “3 hộ gia đình có thu nhập (a,b,c)” được ký hiệu trong bảng là “(a,b,c)”
+) Sử dụng phần mềm Excel:
Trung bình mẫu: sử dụng hàm Average
Phương sai mẫu hiệu chỉnh: sử dụng hàm Var.S
tổng (8,9, (8,9, (8,9, (8,10 (8,10 (8,11 (9,10 (9,10 (9,11 (10,11
thế 10) 11) 12) ,11) ,12) ,12) ,11) ,12) ,12) ,12)
Có thể nói, xét về mặt đại số và về mặt xác suất thì trung bình mẫu phản ánh được giá
trị của trung bình tổng thể. Tuy nhiên vẫn tồn tại sự sai lệch, sự sai lệch nhiều hay ít
được đánh giá bằng phương sai tổng thể chia cho kích thước mẫu (cỡ mẫu). Khi kích
thước mẫu càng lớn thì sự sai lệch càng nhỏ. Nói cách khác, khi kích thước mẫu càng
lớn, việc ta dùng trung bình mẫu để phản ánh trung bình tổng thể sẽ càng chính xác.
Đặc biệt, đối với mẫu được chọn ngẫu nhiên thì giá trị trung bình của tất cả các
trung bình mẫu bằng trung bình tổng thể ( ̅ ).
- Ứng với mỗi mẫu cụ thể gồm 3 phần tử có một phương sai mẫu hiệu chỉnh, theo
bạn phương sai của tất cả các phương sai mẫu hiệu chỉnh gồm 3 phần tử sẽ có giá
trị là bao nhiêu ? Tính cụ thể và giải thích
+) Tính thủ công:
Bước 1: Tính trung bình của 10 phương sai mẫu hiệu chỉnh của 10 mẫu ngẫu
nhiên (1+2.333+4.333+...+1)/10, ta được kết quả 2.5.
Bước 2: Tính phương sai của 10 phương sai mẫu hiệu chỉnh của 10 mẫu ngẫu
⋯
nhiên
c) Sai số ngẫu nhiên trên tổng thể ( ) là gì: Sai số ngẫu nhiên là thể hiện những yếu
tố ảnh hưởng ngoài mô hình lên biến phụ thuộc, có thể là do sai số đo lường, do cách
thu thập dữ liệu, do có thể có biến độc lập khác giải thích cho biến phụ thuộc mà chưa
được được vào mô hình nghiên cứu… . Sai số ngẫu nhiên thường gắn với tổng thể, khi
ta không biết tổng thể ta cũng không biết sai số ngẫu nhiên.
a) Phát biểu mô hình hồi quy tuyến tính đơn biến, đa biến trên mẫu ? So sánh với
các khái niệm này trên tổng thể.
Đơn biến: ̂ ̂ ̂ ̂ ̂ ̂
Đa biến: Y= ̂ ̂ ⋯ ̂ ̂ ̂ ⋯ ̂
So sánh mô hình hồi quy tuyến tính đơn biến trên mẫu so với mô hình hồi quy tuyến
tính đơn biến trên tổng thể:
Ta có thể thấy:
- Xét trên N của tổng thể ta chỉ có thể viết được 1 mô hình hồi quy. Xét trên n của
mẫu, mẫu ở đây là mẫu được chọn ngẫu nhiên nên có thể có nhiều đường hồi quy
mẫu.
- Nếu đường hồi quy mẫu n và đường hồi quy tổng thể N không nằm gần nhau
→ đường hồi quy không tốt (đường hồi quy tốt khi cả hai đường nằm gần nhau ). Tuy
nhiên N,n lệch nhưng đều phản ánh được quy luật x tăng thì y tăng.
Nhận xét: không cần đường hồi quy tổng thể. Đường hồi quy mẫu hoàn toàn phản
ánh được đường hồi quy tổng thể theo một xu thế.
b) Phát biểu hàm hồi quy tuyến tính đơn biến, đa biến trên mẫu ? So sánh với
các khái niệm này trên tổng thể.
Hàm hồi quy tuyến tính trên mẫu: là một hàm số mô tả xu thế biến động của biến phụ
thuộc theo biến giải thích về mặt trung bình, ̂ ̂ gọi là hàm hồi quy mẫu (SRF)
Đơn biến:
Nếu PRF có dạng: E(Y/X)= + X
Thì SRF có dạng: E(Ŷ/X)= ̂ + ̂ =Ŷ
Đa biến:
Nếu PRF có dạng: E(Y/ ∑ (k>2)
Thì SRF có dạng: ̂= ̂ ̂ ⋯ ̂
a) Paper ủng hộ cho mối liên hệ giữa Thu nhập và Chi tiêu.
Does Government Spending Affect Income Poverty? A Meta-regression Analysis
Link:https://reader.elsevier.com/reader/sd/pii/S0305750X17303200?token=75AC6A4
792B4A7048C29B8032D7A18DAD78A4F5BDBFF2C6B5813348056C247E00EA6
C9D8E189F1B502C7799D7F91D6A3&originRegion=eu-west-
1&originCreation=20220327072458
Paper này trình bày kết quả của một phân tích hồi quy tổng hợp về mối quan hệ giữa
chi tiêu của chính phủ và nghèo đói về thu nhập, tập trung vào các quốc gia có thu
nhập thấp và trung bình. Thông qua quá trình tìm kiếm và sàng lọc toàn diện, đã xác
định được tổng cộng 19 nghiên cứu kinh tế lượng xuyên quốc gia có chứa 169 ước
tính về mối quan hệ này. Chúng tôi thấy rằng quy mô và hướng của mối quan hệ ước
tính bị ảnh hưởng bởi nhiều yếu tố, đáng chú ý nhất là thành phần của mẫu được sử
dụng để ước tính, kiểm soát các biến có trong mô hình hồi quy và loại chi tiêu của
chính phủ. Nhìn chung, không có bằng chứng rõ ràng cho thấy chi tiêu chính phủ cao
hơn đã đóng một vai trò quan trọng trong việc giảm nghèo về thu nhập ở các nước có
thu nhập thấp và trung bình.
b) Đây là mô hình hồi quy tuyến tính đa biến hay đơn biến? Vì sao?
Đây là mô hình hồi quy tuyến tính đơn biến. Vì mô hình này có hai biến là thu nhập
và chi tiêu, trong đó có một biến độc lập (biến giải thích) là thu nhập và một biến phụ
thuộc (biến được giải thích) là chi tiêu.
c) Viết hàm hồi quy tuyến tính mẫu chi tiêu theo thu nhập? Ý nghĩa các hệ số hồi
quy?
Ta có:
̅ = 13.3
̅= 10.5
̅̅̅ 148.3
̅̅̅ =190.5
̅̅̅̅ ̅ ̅
̂ = = 0.636
̅̅̅ ̅
14
12
10
0
0 5 10 15 20 25
- Mô tả mối liên hệ giữa Thu nhập và Chi tiêu: Nhìn vào đồ thị scatter ta có thể
thấy khi thu nhập càng tăng thì chi tiêu sẽ tăng theo.
- Hàm hồi quy tuyến tính: Hàm hồi quy tuyến được viết dưới dạng:
̂= 2.047 + 0.636X
- Sai số ngẫu nhiên (ei) trên từng hộ gia đình:
Hộ gia đình có:
Thu nhập = 8 và Chi tiêu = 7 thì sai số ngẫu nhiên (ei) là -0.13152094
Thu nhập = 9 và Chi tiêu = 8 thì sai số ngẫu nhiên (ei) là 0.2326
Thu nhập = 10 và Chi tiêu = 9 thì sai số ngẫu nhiên (ei) là 0.597
Thu nhập = 11 và Chi tiêu = 8 thì sai số ngẫu nhiên (ei) là -1.0386
Thu nhập = 12 và Chi tiêu = 10 thì sai số ngẫu nhiên (ei) là 0.3258
Thu nhập = 15 và Chi tiêu = 12 thì sai số ngẫu nhiên (ei) là 0.419
Thu nhập = 15 và Chi tiêu = 11 thì sai số ngẫu nhiên (ei) là -0.581
Thu nhập = 16 và Chi tiêu = 13 thì sai số ngẫu nhiên (ei) là 0.7834
Thu nhập = 17 và Chi tiêu = 12 thì sai số ngẫu nhiên (ei) là -0.8522
Thu nhập = 20 và Chi tiêu = 15 thì sai số ngẫu nhiên (ei) là 0.241
e) Theo bạn sai số ngẫu nhiên ( ) tồn tại trên mỗi hộ gia đình (mỗi phần tử) là
hợp lý hay bất hợp lý ? Vì sao? Khi nào thì (ei) của hộ gia đình thứ i là 0 ? Giải
thích ?
-Sai số ngẫu nhiên ( tồn tại trên mỗi hộ gia đình (mỗi phần tử) là hợp lý bởi vì chi
tiêu của mỗi hộ gia đình không chỉ phụ thuộc vào thu nhập mà còn phụ thuộc vào
những yếu tố khác chăng hạn như tiền chu cấp cha mẹ, tiền mua sắm vào dịp lễ,…
-( ) của hộ gia đình thứ i là 0 khi và chỉ khi chi tiêu phụ thuộc hoàn toàn vào thu nhập
và không phụ thuộc vào các yếu tố khác.
f) Hãy cho biết vì sao sai số ngẫu nhiên ( ) lại nhận giá trị dương hay âm, nhỏ
hay lớn ? Giải thích cụ thể trên từng hộ gia đình trong mẫu.
-Sai số ngẫu nhiên ( ) lại nhận giá trị dương hay lớn là khi họ có nhiều khoản để chi
tiêu hơn (ví dụ như nhà có nhiều con hơn mức trung bình, có xe hơi nên phải chi tiêu
nhiều hơn,..)
-Sai số ngẫu nhiên ( ) lại nhận giá trị âm hay nhỏ khi họ không cần phải chi tiêu quá
nhiều (ví dụ như họ chưa kết hôn, không cần chu cấp tiền cho ba mẹ,..)
Bài 1.2: Gọi
- Y (lượng cam được bán – tấn/tháng)
- X (giá cam – ngàn đ/kg)
Lượng 14 13 12 10 8 9 8 7 6 6
cam
Giá cam 2 2 3 4 5 5 6 7 8 9
a) Viết hàm hồi quy tuyến tính mẫu lượng cam bán ra theo giá cam? Ý nghĩa các
hệ số hồi quy?
Hàm hồi quy tuyến tính mẫu lượng cam bán ra theo giá cam:
+) Áp dụng công thức:
̅̅̅̅ ̅ ̅
̂= = 15,11
̅̅̅ ̅
̂=̅ ̂ ̅ = -1.14
Ta có: = 5.318
Vì F=102.497 > 5.318 nên ta bác bỏ
Vậy mô hình phù hợp.
+) Sử dụng phần mềm Excel:
Ta sẽ dùng Data Analysis để tính giá trị kiểm định F:
Bước 1: Chọn Data → Data Analysis
Bước 2: Chọn mục Regression
Bước 3: Chọn vùng input Y (cột Lượng cam)
Bước 4: Chọn vùng input X (cột Giá cam)
Bước 5: Chọn vùng output (nơi xuất dữ liệu)
Bước 6: Nhấn OK. Giá trị kiểm định F ở cột F, dòng Regression.
c) Nếu lượng cam tính theo đơn vị là kg/tháng; tấn/ quý (1 quý là 3 tháng); tấn/
năm thì hàm hồi quy thay đổi như thế nào? Viết và giải thích cụ thể các hệ số
trong hàm hồi quy mẫu ứng với các trường hợp trên.
Lượng cam tính theo đơn vị là kg/tháng:
1 kg = 0.001 tấn
→̂ = ̂ +0.001 ̂ = -0.00114 + 0.01511
̂ = -0.00114: Khi cam được bán với giá 0 ngàn đ/kg thì lượng cam bán ra trung bình
tối thiểu là -0.00114 kg/tháng.
̂ = 0.01511: Khi giá cam tăng 1 ngàn đ/kg thì lượng cam bán ra trung bình tăng
0.01511 kg/tháng.
Lượng cam tính theo đơn vị là tấn/quý:
1 quý = 3 tháng
→ ̂ = ̂ +3̂ = -3.42 + 45.33
̂ = -3.42: Khi cam được bán với giá 0 ngàn đ/kg thì lượng cam bán ra trung bình tối
thiểu là -3.42 tấn/quý.
̂ = 45.33: Khi giá cam tăng1 ngàn đ/kg thì lượng cam bán ra trung bình tăng 45.33
tấn/quý.
Lượng cam tính theo đơn vị là tấn/năm:
1 năm = 12 tháng
→ ̂= ̂ +12̂ = -13.68 + 181.32
̂ = -13.68: Khi cam được bán với giá 0 ngàn đ/kg thì lượng cam bán ra trung bình
tối thiểu là -13.68 tấn/năm.
̂ = 181.32: Khi giá cam tăng 1 ngàn đ/kg thì lượng cam bán ra trung bình tăng
181.32 tấn/năm.
d) Nếu giá cam tính theo đơn vị là triệu đồng/kg; triệu đồng/tạ; tỉ đồng/tấn;
nghìn đồng/tạ thì hàm hồi quy thay đổi như thế nào ? Viết và giải thích cụ thể các
hệ số trong hàm hồi quy mẫu ứng với các trường hợp trên.
Giá cam tính theo đơn vị là triệu đồng/kg:
Ta có: 1 ngàn đồng = 0,001 triệu đồng
̂= -1,14 + X* = -1.14 + 151100X*
̂ = -1.14: Khi cam được bán với giá 0 triệu đồng/ kg thì lượng cam bán ra trung bình
tối thiểu là -1.14 ngàn đ/kg.
̂ = 151100: Khi giá cam tăng lên 1 đơn vị là triệu đồng/kg thì lượng cam bán ra
trung bình tăng 151100 ngàn đ/kg.
Giá cam tính theo đơn vị là triệu đồng/tạ:
Ta có: 1 ngàn đồng/kg = triệu đồng/ tạ=0.1 triệu đồng/tạ
̂ = -1.14: Khi cam được bán với giá 0 triệu đồng/tạ thì lượng cam bán ra trung bình
tối thiểu là -1.14 ngàn đ/kg.
̂ = 151,1: Khi giá cam tăng lên 1 đơn vị là triệu đồng/kg thì lượng cam bán ra trung
bình tăng 151,1 ngàn đ/kg.
Giá cam tính theo đơn vị là tỉ đồng/tấn:
Ta có: 1 ngàn đồng/kg = tỉ đồng/tấn= 0.001 tỉ đồng/tấn
̂ = -1.14: Khi cam được bán với giá 0 tỉ đồng/tấn thì lượng cam bán ra trung bình tối
thiểu là -1.14 ngàn đ/kg.
̂ = 151100: Khi giá cam tăng lên 1 đơn vị là tỉ đồng/tấn thì lượng cam bán ra trung
bình tăng 151100 ngàn đ/kg.
Giá cam tính theo đơn vị là nghìn đồng/tạ:
Ta có: 1 nghìn đồng/kg = nghìn đồng/ tạ= 100 nghìn đồng/tạ
̂ = -1.14: Khi cam được bán với giá 0 nghìn đồng/tạ thì lượng cam bán ra trung
bình tối thiểu là -1.14 ngàn đ/kg.
̂ = 151100: Khi giá cam tăng lên 1 đơn vị là nghìn đồng/tạ thì lượng cam bán ra
trung bình tăng 151100 ngàn đ/kg.
e) Khi giá cam có đơn vị là triệu đồng/tạ còn lượng cam có đơn vị tạ/qu thì hàm
hồi quy thay đổi như thế nào? Viết và giải thích cụ thể các hệ số trong hàm hồi
quy mẫu.
Khi giá cam có đơn vị là triệu đồng/tạ còn lượng cam có đơn vị tạ/quý
Ta có: 1 ngàn đồng/kg = 0.1 triệu đồng/ tạ
Và 1 tấn/tháng = = 30 tạ/quý
̂ = -34,2: Khi cam được bán với giá 0 triệu đồng/tạ thì lượng cam bán ra trung bình
tối thiểu là -34,2 tạ/quý.
̂ = 4533 : Khi giá cam tang 1 triệu đồng/tạ thì lượng cam bán ra trung bình tang
4533 tạ/quý.
f) Khi giá cam có đơn vị là triệu đồng/tấn còn lượng cam có đơn vị tấn/năm thì
hàm hồi quy thay đổi như thế nào? Viết và giải thích cụ thể các hệ số trong hàm
hồi quy mẫu.
Khi giá cam có đơn vị là triệu đồng/tấn còn lượng cam có đơn vị tấn/năm
Ta có: 1 ngàn đồng/kg = triệu đồng/ tấn= 1 triệu đồng/tấn
Và 1 tấn/tháng = = 12 tấn/năm
̂ = -13,68: Khi cam được bán với giá 0 triệu đồng/tấn thì lượng cam bán ra trung
bình tối thiểu là -13,68 tấn/tháng.
̂ = 181,32 : Khi giá cam tăng 1 triệu đồng/tấn thì lượng cam bán ra trung bình tăng
181,32 tấn/tháng.
Bài 1.3: Cho số liệu về tiền thuê một căn hộ nhà trọ sinh viên như trong Bảng 1.1 (file
Data_Chuong1.xlsx). Các biến số được định nghĩa như sau:
RENT = tổng tiền thuê hàng tháng cho một căn hộ. ($)
No = số người ở trong căn hộ (người)
RM = số phòng trong căn hộ (phòng)
DIST = khoảng cách từ căn hộ đến trường (khu phố)
RPP = RENT/No = tiền thuê bình quân trên người ($/người)
Với sự hỗ trợ của phần mềm Excel trong tính toán,
a) Hãy tính các giá trị trung bình (mean), phương sai (variance), và độ lệch
chuẩn (standard deviation) của các biến số trên.
+) Sử dụng phần mềm Excel:
Ta sẽ dùng Data Analysis để tính các giá trị trên
Bước 1: Chọn Data → Data Analysis
Bước 2: Chọn mục Covariance
Bước 3: Chọn vùng input Y
Bước 4: Chọn vùng input X
Bước 5: Chọn vùng output (nơi xuất dữ liệu) và tick vào ô Summary Statistics
Bước 6: Nhấn OK
b) Hãy tính hiệp phương sai (covariance) và hệ số tương quan tuyến tính giữa các
cặp biến số sau:
RENT và DIST, RENT và RM, RENT và No, RPP và RENT, RPP và No.
Hãy nêu nhận xét cụ thể về sự tương quan cho từng cặp biến số trên.
Tính hiệp phương sai (Covariance): (sử dụng phần mềm Excel)
Link:https://sci-hub.se/10.1080/10835547.1989.12090581
Bài báo này xem xét ảnh hưởng của các tiện nghi, dịch vụ và các yếu tố ngoại lệ khác
nhau đối với tiền thuê nhà ở cho nhiều gia đình. Các thuộc tính được nghiên cứu bao
gồm các tiện nghi và dịch vụ như bãi đậu xe có mái che, nhà bếp hiện đại và dịch vụ
giúp việc, các hạn chế về cư trú như không cho phép vật nuôi và các yếu tố bên ngoài
như tắc nghẽn giao thông, gần cơ quan và khả năng tiếp cận phương tiện giao thông
công cộng. Các kết quả thực nghiệm cho thấy một số đặc điểm này có ảnh hưởng đến
tiền thuê. Trong đó, các tác giả đã chỉ ra rằng có mối liên hệ giữa số phòng ngủ và giá
thuê căn hộ - kích thước tăng thì giá tăng.
Bôi đen cột Tỷ lệ bỏ việc (Trên 100 lao động) và cột Tỷ lệ thất nghiệp (%) Chọn
Insert Chọn vẽ đồ thị X Y (scatter).
Scatter diagram
Tỷ lệ bỏ việc (Trên 100 lao động) 3
2.5
1.5
0.5
0
0 2 4 6 8 10
Tỷ lệ thất nghiệp (%)
b) Giả sử tỉ lệ bỏ việc có quan hệ tuyến tính với tỉ lệ thất nghiệp như sau: t = β1
+ β2Xt + et. Hãy ước lượng β1, β2, và cho biết độ lệch chuẩn của chúng.
+) Sử dụng phần mềm Excel: Chọn Data Data Analysis Regression Chọn
vùng Input Y (Tỷ lệ bỏ việc) Chọn vùng Input X (Tỷ lệ thất nghiệp) Chọn vùng
Output (nơi xuất dữ liệu) Nhấn OK. Ta có kết quả:
̂
̂
Độ lệch chuẩn:
Khoảng ước lượng β1, β2, với độ tin cậy 95% là:
+) Áp dụng công thức: (áp dụng các công thức của trung bình mẫu, phương sai mẫu)
̅ ̅
̅̅̅ ̅̅̅
̅̅̅ ̅ ̅
̂
̅̅̅ ̅
̂ ̅ ̂ ̅
Hàm hồi quy: ̂=3,36626-0,28621X
RSS=∑ ̂ 1,14351
se(̂ √ ̂ √∑ √
̿
Vậy khoảng ước lượng cho tham số với độ tin cậy 95% (khi n>30) là:
(̂ ( ̂ ))
∑
se(̂ √ (̂) √ ∑
√
̿
Vậy khoảng ước lượng cho tham số với độ tin cậy 95% (khi n>30) là:
(̂ (̂))
c) Hãy giải thích (diễn giải) các kết quả của bạn.
̂=3.366258-0.286212X
̂ 3.366258: Trong giai đoạn 1960-1972, khi không có người thất nghiệp trong lãnh
vực chế tạo công nghiệp ở M (tỉ lệ thất nghiệp trong lãnh vực này bằng 0%) thì tỉ lệ
bỏ việc trung bình tối thiểu trên 100 người làm việc trong lãnh vực này ở M là
3.366258%.
̂ -0.286212: Trong giai đoạn 1960-1972, khi tỉ lệ thất nghiệp trong lãnh vực chế
tạo công nghiệp ở M tăng 1% thì tỷ lệ bỏ việc trung bình trên 100 người làm việc
trong lãnh vực này ở M giảm 0,286212% và ngược lại.
Ý nghĩa: Tỷ lệ thất nghiệp giải thích được 65,32% thay đổi của tỷ lệ bỏ việc trong 13
năm (1960-1972), còn 34,68% là do các nguyên nhân khác. Hay nói cách khác, trong
gần 8,5 năm ta thấy được tỷ lệ bỏ việc có mối quan hệ tuyến tính với tỷ lệ thất nghiệp.
e) Hãy vẽ đồ thị của đại lượng sai số e (với e trên trục tung và thời gian (năm)
trên trục hoành). Bạn có thể nhận biết được điều gì từ những sai số này.
Ta có: ̂
Đò thị củ a đạ i lượng sai só e
0.5
0.4
0.3
0.2
0.1
0
1958 1960 1962 1964 1966 1968 1970 1972 1974
-0.1
-0.2
-0.3
-0.4
-0.5
Từ những sai số này, ta có thể nhận thấy được có sự ảnh hưởng của các yếu tố ngoài
mô hình lên biến phụ thuộc. Tức là, có sự tác động của các yếu tố khác ngoài biến giải
thích (tỷ lệ thất nghiệp) tới giá trị của biến phụ thuộc (tỷ lệ bỏ việc trên 100 lao động).
Đó có thể là những yếu tố mà ta không biết, những yếu tố không có số liệu hoặc
những yếu tố mà tác động của nó quá nhỏ không mang tính hệ thống.
f) Tính giá trị kiểm định p value khi kiểm định tính có nghĩa của các hệ số
trong mô hình trên? Với mức nghĩa 5 hãy cho biết p value tính được lớn hơn
hay nhỏ hơn mức nghĩa 5 ? Giải thích nghĩa của các p value tính được ?
Tham số có p-value =
̂
̂
p-value =
̂
̂
p-value =
Bài 1.5: Dữ liệu về giá vàng (GP), Chỉ số giá tiêu dùng (CPI), và Chỉ số chứng khoán
trên thị trường chứng khoán New York (NYSE) trong thời kỳ 1977-1991 ở M được
cho ở Bang1.3 (file Data_Chuong1.xlsx)
a) Hãy vẽ đồ thị scatter của GP với CPI; N SE với CPI trên cùng một đồ thị.
Bôi đen cột dữ liệu về giá vàng (GP) và cột chỉ số giá tiêu dung (CPI) Chọn Insert
Chọn vẽ đồ thị X Y (scatter).
Bôi đen cột dữ liệu về chỉ số chứng khoán (NISE) và cột chỉ số giá tiêu dùng (CPI)
Chọn Insert Chọn vẽ đồ thị X Y (scatter).
b) Một quyết định đầu tư (mua vàng hay mua chứng khoán) có tính tới việc
phòng ngừa lạm phát là nếu giá của nó (hàng hóa mà bạn đầu tư vào) và/hay
suất sinh lợi của nó ít nhất là bắt kịp với tỉ lệ lạm phát. Để kiểm tra giả thiết này,
giả sử bạn quyết định xây dựng hai mô hình sau đây, giả sử rằng đồ thị trong câu
a gợi cho bạn thấy sau đây là thích hợp:
GPt = α1 + β1CPIt + et
NYSEt = α2 + β2 CPIt + et
Với hai mô hình trên, hãy trả lời các câu hỏi sau:
- Tính hệ số tương quan tuyến tính giữa GP và CPI; NYSE và CPI? Bạn nhận xét
gì về các hệ số này.
Tính hệ số tương quan tuyến tính (Correlation) giữa GP và CPI; NYSE và CPI:
Hệ số tương quan tuyến tính giữa GP và CPI sẽ nằm ở cột GP, dòng CPI
Hệ số tương quan tuyến tính giữa CPI và NYSE sẽ nằm ở cột CPI, dòng NYSE
+ Giải thích:
Hệ số tương quan giữa GP và CPI là 0.387582844 có nghĩa là biến CPI giải thích
được 0.387582844% sự thay đổi của biến GP, còn lại phụ thuộc vào các yếu tố khác.
Hệ số tương quan giữa NYSE và CPI là 0.93168 có nghĩa là biến CPI giải thích được
0.93168% sự thay đổi của biến NYSE, còn lại phụ thuộc vào các yếu tố khác.
- Bạn kỳ vọng về dấu của các hệ số đứng trước các biến giải thích trong 2 mô
hình trên ? Giải thích.
Kỳ vọng về dấu của các hệ số đứng trước các biến giải thích trong 2 mô hình trên là
dấu dương.
- Hãy tìm ít nhất 3 paper để ủng hộ cho các mối liên hệ trên.
Link: https://sci-hub.hkvisa.net/10.1016/j.eap.2019.08.003
Bài báo này xem xét ảnh hưởng của chính sách tiền tệ của Hoa Kỳ , giá dầu và giá
vàng đối với chỉ số chứng khoán của các nước BRICS . Mô hình hồi quy tự động
Vector được áp dụng để nghiên cứu các chỉ số chứng khoán của tất cả các quốc gia
BRICS như một nhóm trong giai đoạn 1996–2018. Chúng tôi nhận thấy rằng Bombay
Sensex phản ứng tích cực với Lãi suất qu liên bang. Chỉ số chứng khoán của Nam
Phi - FTSE JSE của Johannesburg - phản ứng tiêu cực với cú sốc giá dầu trong khi chỉ
số chứng khoán của Nga và Brazil - RTSI của Moscow và BVSP của Sao Paulo -
phản ứng tích cực với những thay đổi của giá vàng. Chúng tôi cung cấp các hàm ý về
quản lý và chính sách của những kết quả này.
Price-switching spillovers between gold, oil, and stock markets: Evidence from the
USA and China during the COVID-19 pandemic
Link:
https://scihub.hkvisa.net/https://www.sciencedirect.com/science/article/abs/pii/S03014
20721002294?fbclid=IwAR1cYe-Ebx5p2O_ZBkMNoiD3FXnty3c-
PyTsktvshNicgK7J_RAj1dJe4Z4
Bài báo này xem xét các tác động lan tỏa chuyển đổi giá giữa thị trường chứng khoán,
dầu thô và vàng tương lai của Hoa Kỳ và Trung Quốc trước và trong đại dịch COVID-
19. Sử dụng mô hình tự động hồi quy vectơ chuyển mạch Markov, chúng tôi cho thấy
rằng thị trường chứng khoán chủ yếu bị ảnh hưởng bởi các cú sốc của chính chúng,
với các tác động nhạy cảm với sự thay đổi của chế độ. Phân tích mạng kết nối tiết lộ
rằng vàng và thị trường chứng khoán là những yếu tố đóng góp ròng (thu nhận) tác
động lan tỏa trong chế độ ít biến động (chế độ biến động cao), trong khi dầu là yếu tố
thu nhận (đóng góp) chính của tác động lan tỏa trong chế độ ít biến động (chế độ biến
động cao). Các chế độ chủ yếu có mức độ biến động thấp từ tháng 1 năm 2019 đến
tháng 2 năm 2020 và mức độ biến động cao từ tháng 3 năm 2020 đến tháng 5 năm
2020. Chúng tôi kết luận rằng đại dịch COVID-19 đã tăng cường sự lan tỏa từ thị
trường hàng hóa sang thị trường chứng khoán Hoa Kỳ và Trung Quốc.
US monetary policy, oil and gold prices: Which has a greater impact on BRICS
stock markets?
Link: https://sci-hub.hkvisa.net/10.1016/j.eap.2019.08.003
Bài báo này xem xét ảnh hưởng của chính sách tiền tệ của Hoa Kỳ , giá dầu và giá
vàng đối với chỉ số chứng khoán của các nước BRICS . Mô hình hồi quy tự động
Vector được áp dụng để nghiên cứu các chỉ số chứng khoán của tất cả các quốc gia
BRICS như một nhóm trong giai đoạn 1996–2018. Chúng tôi nhận thấy rằng Bombay
Sensex phản ứng tích cực với Lãi suất qu liên bang. Chỉ số chứng khoán của Nam
Phi - FTSE JSE của Johannesburg - phản ứng tiêu cực với cú sốc giá dầu trong khi chỉ
số chứng khoán của Nga và Brazil - RTSI của Moscow và BVSP của Sao Paulo -
phản ứng tích cực với những thay đổi của giá vàng. Chúng tôi cung cấp các hàm ý về
quản lý và chính sách của những kết quả này.
- Kiểm định sự phù hợp của các mô hình hồi quy trên? Giải thích nghĩa các hệ
số hồi quy tìm được. Kỳ vọng về dấu của các hệ số hồi quy và kết quả hồi quy
mẫu có phù hợp không? Giải thích?
+) Sử dụng phần mềm Excel: Chọn Data Data Analysis Regression Chọn
vùng Input Y (GP) Chọn vùng Input X (CPI) Chọn vùng Output (nơi xuất dữ
liệu) Nhấn OK. Ta có kết quả:
Mô hình hồi quy giữa GP và CPI
̂
̂
̂ 186,1833092: Khi chỉ số giá tiêu dùng CPI bằng 0 thì giá vàng trung bình tối
thiểu (GP) là 186,1833092$.
̂ : Khi chỉ số giá tiêu dung CPI tăng 1 đơn vị thì giá vàng trung
bình tăng 1,841992698 và ngược lại.
̂ 186,1833092: Khi chỉ số giá tiêu dùng CPI bằng 0 thì chỉ số chứng khoán
(NYSE) trung bình tối thiểu là -102,06055
̂ : Khi chỉ số giá tiêu dùng CPI tăng 1 đơn vị thì chỉ số chứng khoán
(NYSE) trung bình tăng 2,12944 và ngược lại.
Theo em, công cụ tài chính phòng chống lạm phát tốt hơn chính là vàng. Khi lạm phát
xảy ra, lãi suất ngân hàng trung ương sẽ giảm xuống dẫn đến nguồn cung tiền cho nền
kinh tế sẽ tăng. Tại thời điểm xảy ra tình trạng lạm phát, các nhà đầu tư có xu hướng
mua vàng để tích trữ nhiều hơn vì thế giá vàng sẽ tăng cao và ngược lại.
d) Tính giá trị kiểm định p value khi kiểm định tính có nghĩa của các hệ số
trong 2 mô hình trên? Với mức nghĩa 5 hãy cho biết p value tính được lớn
hơn hay nhỏ hơn mức nghĩa 5 ? Giải thích nghĩa của các p value tính
được?
Tham số có p-value =
Tham số có p-value =
Tham số có p-value =
Tham số có p-value =
̂
̂
p-value =
̂
̂
p-value =
̂
̂
p-value =
̂
̂
p-value =
Bài 1.6: Trong kinh tế học vĩ mô, có hai lý thuyết khác nhau liên quan đến hành vi
tiêu dùng của dân chúng. Theo Keynes, tổng tiêu dùng (CONS) sẽ phụ thuộc vào
tổng thu nhập (khả dụng) (YD). Trong khi đó, các nhà kinh tế học cổ điển tin rằng tiêu
dùng có quan hệ nghịch biến với lãi suất (RR) trong nền kinh tế. Sử dụng số liệu trong
Bang1.4 (file Data_Chuong1.xlsx) (dữ liệu từ năm 1955-1986), bạn hãy:
a) Xây dựng các mô hình kinh tế cho mỗi giả thiết trên.
* Mô hình kinh tế của giả thiết theo Keynes, tổng tiêu dùng (CONS) sẽ phụ thuộc vào
tổng thu nhập (khả dụng) (YD).
Thu nhập: X
Tiêu dùng: Y
̂ = -8,793
̂ = 0,91311
= = 2,042
̂ ) = 16,7198
∈ ̂ ̂ ))=(-42,9348;25,34883)
= = 2,042
̂ ) = 0,00944
∈ ̂ ̂ ))=(0,893838;0,93239)
Ước lượng tham số cho mô hình kinh tế của các nhà kinh tế học cổ điển:
- Khoảng ước lượng của tham số
̂ = 1370,69517
= = 2,042
̂ ) = 115,37482
∈ ̂ ̂ ))=(1135,09979;1606,29056)
∈ ̂ ̂ ))=(-0,3552176;120,0729576)
d) Dựa trên các kết quả kinh tế lượng của bạn, bạn có nhận xét gì về giá trị của
hai giả thiết trên.
Dựa vào kết quả kinh tế lượng đã tính ở trên ta có thể thấy được theo mô hình
kinh tế của giả thiết theo Keynes khoảng ước lượng của các tham số chênh
lệch thấp -> bé nên gía trị thực tế của biến phụ thuộc nằm gần đường hồi quy.
Dựa vào kết quả kinh tế lượng đã tính ở trên ta có thể thấy được mô hình kinh tế
của các nhà kinh tế học cổ điển khoảng ước lượng của các tham số chênh lệch
rất lớn -> lớn nên gía trị thực tế của biến phụ thuộc nằm xa đường hồi quy.
e) Với các mô hình trên hãy tìm ít nhất 2 paper ủng hộ các quan điểm này.
Ủng hộ quan điểm Keynes:
Link: https://sci-hub.hkvisa.net/10.1016/S0926-6437(97)80003-0
Lý thuyết Tổng quát cho rằng phân phối thu nhập ảnh hưởng đến tiêu dùng. Bình đẳng
thu nhập cao hơn đưa nhiều tiền hơn vào tay những người có MPC cao hơn, dẫn đến
tăng tiêu dùng; và bất bình đẳng lớn hơn đã có tác động ngược lại. Tuy nhiên, trong số
sáu yếu tố khách quan mà Keynes xác định là ảnh hưởng đến tiêu dùng, chỉ có yếu tố
phân phối đã không trở thành một phần của lý thuyết tiêu dùng chủ đạo. Bài báo này
xem xét lý do tại sao lại như vậy, và sau đó phát triển một mô hình kết hợp phân phối
sau thuế vào một hàm tiêu dùng theo trường phái Keynes. Các thử nghiệm thực
nghiệm của mô hình này cho thấy rằng phân phối thu nhập sau thuế là một yếu tố
quyết định đáng kể đến tiêu dùng.
Keynes's personal investments in the London Stock Exchange and his views on the
transformation of the British economy.
Link: https://sci-hub.hkvisa.net/10.1016/j.strueco.2020.02.002
Trong bài báo này, chúng tôi phân tích các khoản đầu tư cá nhân của Keynes trong sở
giao dịch chứng khoán Luân Đôn tập trung vào lựa chọn của Keynes và mô hình lựa
chọn tài sản và lĩnh vực hơn là hiệu suất danh mục đầu tư. Trong số những thứ khác,
cách tiếp cận này có thể giúp định giá của Keynes về nền kinh tế Anh đã trải qua
những thay đổi cấu trúc đáng kể trong cuộc chiến giữa các giai đoạn. Đánh giá dựa
trên hành vi giao dịch của Keynes và triết lý đầu tư cung cấp mục bổ sung đáng kể cho
những gì chúng tôi cũng biết từ những tuyên bố công khai của những vị trí đã đảm
nhận chính trường, thậm chí còn hơn thế nữa, cho đến nay không có nỗ lực xây dựng
lại chi tiết các khoản đầu tư cá nhân của ông.
Ủng hộ quan điểm của các nhà kinh tế học cổ điển:
Link: https://sci-hub.hkvisa.net/10.1016/j.jedc.2018.07.004
Chúng tôi xem xét ảnh hưởng của việc thay đổi lãi suất đối với các quyết định tiêu
dùng và tiết kiệm của một đại lý khi thu nhập của cô ấy biến động. Trong mỗi thời kỳ,
một đại lý tồn tại lâu dài sẽ quyết định tiết kiệm bao nhiêu (tức là đầu tư vào một trái
phiếu rủi ro) và bao nhiêu để tiêu dùng trong khi thu nhập và tỷ suất lợi nhuận trên
khoản tiết kiệm của cô ấy không chắc chắn và phụ thuộc vào tình trạng của nền kinh
tế. Chúng tôi chỉ ra rằng dưới sự cô đọng của hàm tiêu dùng, một điều kiện đảm bảo
rằng tác động thay thế chiếm ưu thế so với tác động thu nhập, lãi suất thấp hơn
khuyến khích tiêu dùng của đại lý trên tất cả các tiểu bang.
Link: https://sci-hub.hkvisa.net/10.1016/j.jfineco.2005.02.004
Bài báo này đề xuất một mô hình dựa trên tiêu dùng có nhiều đặc điểm trong cấu trúc
kỳ hạn danh nghĩa của lãi suất. Động lực đằng sau mô hình là giá rủi ro thay đổi theo
thời gian do thói quen bên ngoài tạo ra. Trái phiếu danh nghĩa phụ thuộc vào tăng
trưởng tiêu dùng trong quá khứ thông qua thói quen và lạm phát kỳ vọng. Khi được
hiệu chỉnh với dữ liệu về tiêu dùng, lạm phát và thị trường tổng hợp, mô hình tạo ra
các phương tiện và độ biến động thực tế của lợi tức trái phiếu và tính toán cho câu đố
kỳ vọng. Mô hình này cũng thể hiện phần bù vốn chủ sở hữu cao và sự biến động vượt
mức của thị trường chứng khoán.
f) Kiểm định tính có nghĩa của các hệ số hồi quy ? Theo bạn việc các hệ số đứng
trước biến giải thích có nghĩa có thể được xem là mô hình đưa ra phù hợp
không ? Giải thích.
( kiểm định với mức ý nghĩa 5%)
Kiểm định tính có ý nghĩa của hệ số hồi quy cho mô hình kinh tế của giả thiết theo
Keynes:
Đặt giả thiết:
= = 2,042
̂
̂
→ Bác bỏ , vậy hệ số thật sự có ý nghĩa trong mô hình hồi quy hay ta có thể nói
rằng thu nhập có ảnh hưởng đến tiêu dùng
Kiểm định tính có ý nghĩa của hệ số hồi quy cho mô hình kinh tế của các nhà kinh tế
học cổ điển:
Đặt giả thiết:
= = 2,042
̂
∈
̂
→ Chấp nhận , vậy hệ số không có ý nghĩa trong mô hình hồi quy hay ta có thể
nói rằng lãi xuất không ảnh hưởng đến tiêu dùng.
Kết luận:
1) Theo em việc các hệ số đứng trướng biến giải thích có ý nghĩa có thể xem là
mô hình đưa ra phù hợp chỉ trong mô hình hồi quy đơn biến. Tại vì để kiểm
định sự phù hợp của mô hình ta sẽ đưa ra cặp giả thiết cần kiểm định là
tương đường với giả thiết kiểm định tính có ý nghĩa
. Mục đích kiểm định tính có ý nghĩa của hệ số hồi quy
là một hệ số (tham số) hồi quy được gọi là có ý nghĩa khi và chi khi khác 0
và một mô hình hồi quy được gọi là phù hợp khi và chỉ khi khác 0.
2) Còn trong hồi quy đa biến thì khác 0; khác 0 là hoàn toàn khác biệt nhau.
g) Dự báo điểm, khoảng cho các giá trị của biến phụ thuộc trong mô hình trên
Dự báo điểm từ năm (1955-1986) chạy bằng excel:
(Cột dự báo điểm là cột Predicted)
∑ 100369917,7-32 =8192949,055
̅
̂ √ ̂ √( )
√( )
E(Y/X= ∈ (̂ ̂ ) )
E(Y/X= ∈ (1806,96;1829,7175)
→ Đây là dự báo khoảng cho tiêu dùng trung bình
Trường hợp 3: Dự báo cho tiêu dùng cụ thể với thu nhập là 2001 với độ tin cậy 95%
̅
̂ √ ̂ √( )
∈ (̂ ̂ )
̂ = 5.067: Khi không tự học thì số điểm trung bình tối thiểu mà một bạn sinh viên có
thể đạt được là 5.067 điểm.
̂ = 0.463: Khi số giờ tự học trong tuần của một sinh viên tăng thêm 1 giờ thì điểm
trung bình môn KTCT của sinh viên đó tăng thêm 0.463 điểm.
b) Tính toán hệ số xác định . Dựa vào hệ số xác định, hãy cho nhận xét về chất
lượng mô hình. Giải thích nguyên nhân vì sao dẫn đến hệ số xác định 2 có kết
quả như trên.
- Hệ số xác định = 0.262
- Nhận xét về chất lượng mô hình: Vì hệ số xác định = 0.262 nên các phần tử trong
mô hình có ít phần tử nằm gần đường hồi quy, do vậy đường hồi quy mẫu ở mô hình
sẽ phản ánh xu thế của đường hồi quy tổng thể kém hơn hơn. Do đó, chất lượng mô
hình yếu, điểm trung bình của KTCT phụ thuộc vào những yếu tố khác nhiều hơn là
số giờ tự học trong tuần.
- Nguyên nhân vì sao dẫn đến hệ số xác định có kết quả như trên: Trong 100% sự
biến động của điểm trung bình môn KTCT thì có 26.2% sự biến động là do số giờ tự
học trong tuần ảnh hưởng, còn lại là do các yếu tố khác. Nghĩa là, trong 36 sinh viên
khoảng 9 sinh viên mà điểm trung bình KTCT được giải thích qua giờ tự học mỗi
tuần.
c) Tính toán giá trị kiểm định To tương ứng của từng biến. Các biến này có
nghĩa thống kê ở mức 5 không?
̂ ̂
T0 = với ̂ là Standard error trong bảng Excel
̂ ̂
d) Xác định độ tin cậy 95 của β2 tổng thể. Nêu nghĩa của độ tin cậy vừa xác
định được.
̂ = 0.463 =2.36 (dùng hàm “=T.INV.2T(alpha, n-2)” trong Excel)
se( ̂ = 0.133 (Standard error)
→ ∈ (0.14912;0.77688)
Vậy với độ tin cậy 95% thì khoảng tin cậy của β2 tổng thể từ (0.14912;0.77688)
Ý nghĩa của độ tin cậy vừa xác định được: Khi tham số (hệ số) ∈
(0.14912;0.77688) thì
e) Tìm ít nhất 2 paper ủng hộ cho mối liên hệ trong mô hình.
Temporally-focused analytics of self-regulated learning: A systematic review of
literature - JohnSaint, YizhouFan, DraganGašević, AbelardoPardo.
Link:
https://reader.elsevier.com/reader/sd/pii/S2666920X22000157?token=67988898554D
256531A42A3648066DE6D92CEA69846BF14F5B8036A3416D74F875990383A01
EDA7E24C92B2A01854082&originRegion=eu-west-
1&originCreation=20220326072501
Nghiên cứu này nhằm điều tra các đặc điểm tự học và mối quan hệ của nó với thành
tích học tập. Bài báo phản ánh việc sử dụng thực tế giờ tự học trong quá trình học tập.
Ngoài ra, phân tích dựa trên các mô hình lý thuyết và tài khoản phương pháp luận
thường được sử dụng trong nghiên cứu trong lĩnh vực này. Do đó, những phát hiện
trong đây có thể được khái quát cho các nghiên cứu đại diện cho nghiên cứu về các
khía cạnh thời gian và tuần tự trong quá trình tự học.
Self-Regulated Learning and Academic Achievement: An Overview - Barry J.
Zimmerman.
Link:https://ciel.viu.ca/sites/default/files/self_regulated_learning_and_academic_achie
vement_an_overview_0.pdf
Nghiên cứu thảo luận về cách nghiên cứu các quy trình thành phần góp phần vào sự
hiểu về các đặc điểm đặc biệt của việc tự học của sinh viên. Bên cạnh đó, ý nghĩa của
sự tự điều chỉnh hối cảnh học tập và thành tích của sinh viên được chọn để xem xét.
Cách sinh viên chọn, sắp xếp hoặc tạo môi trường học tập thuận lợi cho bản thân và
về cách họ lập kế hoạch và kiểm soát giờ tự học. Phân tích nghiên cứu và lý thuyết
gần đây về các quy trình tự điều tiết quan trọng của sinh viên sử dụng để học và đạt
được học tập. Những nỗ lực có thể được đưa ra để dạy tự điều chỉnh cho những sinh
viên tiếp cận học tập thụ động, và một số nỗ lực đáng chú ý đã được thực hiện.
Câu 1.8: Giả sử chúng ta nghiên cứu mối quan hệ giữa chi tiêu cho nghiên cứu và
phát triển (ký hiệu là , tính bằng tỷ dollars, giá cố định 1992) với số lượng bằng sáng
chế phát minh (ký hiệu là , tình bằng số lượng nghìn), tại M từ năm 1960 -1993; tức
là chúng ta có bộ số liệu gồm quan sát. Dưới đây là bảng báo cáo kết quả hồi quy:
PATENTS = 34.571+ 0.792R & D
(5.44) (13.79)
̂ = 0.792. =1.679
se( ̂ ) = ;
Giá trị kiểm định:
̂
∈
(̂ )
→ Chấp nhận . Vậy nhận định của nhà báo là đúng (Cứ 1 tỷ dollars chi tiêu cho
nghiên cứu phát triển, thì sẽ làm tăng số lượng bằng phát minh sáng chế lên vào
khoảng 500 bằng).
Bài 1.9:
a) Ước Lượng mối quan hệ giữa bảo hiểm nhân thọ (INSU ) và thu nhập gia
đình (INC).
+) Áp dụng công thức:
Tính toán thủ công ta có được:
̅ ̅
̅̅̅ ̅̅̅
̅̅̅̅ ̅ ̅
̂= = 3.88
̅̅̅ ̅
̂=̅ ̂ ̅ = 6.85
se (̂) = √ ̂ = √∑ = 7.38
∑ ̅
se(̂) = √ ̂ =√
∑
= 0.112
̅
Cách 1: Ứng với cặp giả thiết cần kiểm định là: {
Cách 2: Ứng với cặp giả thiết cần kiểm định là: {
̂
Giá trị kiểm định = ̂ = = 34.64
Ta có: = = 2.101
3. Nếu một thành viên ban quản l tuyên bố rằng, cứ mỗi 1000 USD tăng lên về
thu nhập sẽ làm tăng bảo hiểm nhân thọ lên 5000 USD. Liệu kết quả ước lượng
của bạn có hỗ trợ cho lời tuyên bố này với mức nghĩa 5 (5 significance
level)?
Cứ mỗi 1000 USD tăng lên về thu nhập sẽ làm tăng bảo hiểm nhân thọ lên 5000 USD
hay nói cách khác Cứ mỗi 1000 USD tăng lên về thu nhập sẽ làm tăng bảo hiểm nhân
thọ lên 0,5 (chục nghìn) USD.
̂
̂
Bác bỏ .
Vậy lời tuyên bố: cứ mỗi 1000 USD tăng lên về thu nhập sẽ làm tăng bảo hiểm nhân
thọ lên 5000 USD là không đúng.
4. Dự đoán mức bảo hiểm nhân thọ điểm, khoảng cho hộ gia đình có thu nhập là
100 nghìn USD.
RSS=∑ ̂ 3710,37
∑ ̿
̿
se( ̂ √ ̂ √( )
∈ (̂ ̂ )
Chọn Data Data Analysis Regression Chọn vùng Input Y (INSUR) Chọn
vùng Input X (INC) Chọn vùng Output (nơi xuất dữ liệu) Chọn Line Fit Plot
Nhấn OK.
The impact of real income on insurance premiums: Evidence from panel data.
Link:https://doi.org/10.1016/j.iref.2011.07.003
Tác giả sử dung mô hình hồi quy ngưỡng để phân tích độ co giãn của chi phí bảo hiểm
so với thu nhập thực tế của 36 quốc gia được chọn và trong khoảng thời gian từ 1979-
2007. Tác giả đã kết luận rằng những thay đổi trong thu nhập thực tế là một trong
những yếu tố gây ra sự thay đổi cơ cấu trong mối quan hệ giữa phí bảo hiểm và thu
nhập.
Link:https://core.ac.uk/reader/188225700
Ba loại phân tích dữ liệu được thực hiện là giải thích thống kê mô tả cho tất cả các
biến; sử dụng phương pháp Bình phương tối thiểu (OLS) để đánh giá mối quan hệ
tuyến tính giữa các biến phụ thuộc và các biến độc lập; và việc thực hiện kiểm định
Johansen và phép thử quan hệ nhân quả Granger để xác định xem liệu có tồn tại mối
quan hệ nhân quả giữa thu nhập với mức độ biết và sử dụng bảo hiểm nhân thọ hay
không. Tác giả đưa ra ba giả thiết và lần lượt kiểm định chúng. Trong đó, có một giả
thiết đề cập đến thu nhập bình quân đầu người được coi là một yếu tố quyết định tích
cực và đáng kể đến việc tiêu dùng bảo hiểm tang lễ và nhân thọ. Cuối cùng, tác giả đã
đưa ra kết luận rằng kết quả kiểm định phù hợp với giả thiết đã đề ra.
Bài 1.10: Hội Sinh viên một trường Đại học tại M của một trường Đại học tại M
mở một cuộc điều tra ngẫu nhiên 427 sinh viên một trường Đại học tại M của trường
để hiểu thêm về mối quan hệ giữa điểm trung bình tích lũy đại học (COLGPA), lần
lượt với điểm trung bình cuối năm phổ thông (HSGPA), điểm kiểm tra k năng học
tập (VSAT) và điểm kiểm tra toán trong kỳ thi SAT (MSAT). Hội Sinh viên một
trường Đại học tại M này chạy hồi qui ra được 3 mô hình hồi qui đơn biến như sau
(số trong ngoặc là standard error):
CLOGPA= 0.92058 + 0.52147HSGPA + ε =0.165
(0.20463) (0.05712)
CLOGPA= 1.99740 + 0.00157VSAT +ε =0.070
(0.20463) (0.05712)
CLOGPA= 1.62845 + 0.00204MAST +ε =0.124
(0.15135) (0.00026)
a) Nhận xét nghĩa kinh tế của từng mô hình trong 3 mô hình trên?
Mô hình 1:
CLOGPA= 0.92058 + 0.52147HSGPA + ε =0.165
(0.20463) (0.05712)
: Khi sinh viên một trường Đại học tại M đạt 0 điểm trung bình cuối
năm phổ thông thì điểm trung bình tích lũy đại học của họ có giá trị trung bình tối
thiểu là 0.92058 điểm.
: Khi điểm trung bình cuối năm phổ thông của sinh viên một trường
Đại học tại M tăng thêm 1 điểm thì điểm trung bình tích lũy đại học trung bình của
họ tăng thêm 0.52147 điểm (trong điều kiện các yếu tố khác không đổi).
Mô hình 2:
CLOGPA= 1.99740 + 0.00157VSAT +ε =0.070
(0.20463) (0.05712)
: Khi sinh viên một trường Đại học tại M đạt 0 điểm kiểm tra k
năng học tập thì điểm trung bình tích lũy đại học của họ có giá trị trung bình tối
thiểu là 1.99740 điểm..
: Khi điểm kiểm tra k năng học tập của sinh viên một trường Đại
học tại M tăng thêm 1 điểm thì điểm trung bình tích lũy đại học trung bình của họ
tăng thêm 0.00157 điểm (trong điều kiện các yếu tố khác không đổi).
Mô hình 3:
CLOGPA= 1.62845 + 0.00204MAST +ε =0.124
(0.15135) (0.00026)
: Khi sinh viên một trường Đại học tại M đạt 0 điểm kiểm tra Toán
trong kỳ thi SAT thì điểm trung bình tích lũy đại học của họ có giá trị trung bình tối
thiểu là 1.62845.
: Khi điểm kiểm tra Toán trong kỳ thi SAT của sinh viên một trường
Đại học tại M tăng thêm 1 điểm thì điểm trung bình tích lũy đại học trung bình của
họ tăng thêm 0.00204 điểm (trong điều kiện các yếu tố khác không đổi).
b) Ý nghĩa của hệ số xác định. Dựa trên hệ số xác định, mô hình nào là tốt nhất.
Ý nghĩa của hệ số xác định:
Mô hình 1:
CLOGPA= 0.92058 + 0.52147HSGPA + ε =0.165
(0.20463) (0.05712)
→ Có khoảng 70 sinh viên mà điểm trung bình tích lũy đại học (CLOGPA) được giải
thích qua điểm trung bình cuối năm phổ thông (HSGPA) của họ.
Mô hình 2:
CLOGPA= 1.99740 + 0.00157VSAT +ε =0.070
(0.20463) (0.05712)
→ Có khoảng 30 sinh viên mà điểm trung bình tích lũy đại học (CLOGPA) được giải
thích qua điểm kiểm tra k năng học tập (VSAT) của họ.
Mô hình 3:
CLOGPA= 1.62845 + 0.00204MAST +ε =0.124
(0.15135) (0.00026)
→ Có khoảng 53 sinh viên mà điểm trung bình tích lũy đại học (CLOGPA) được giải
thích qua điểm kiểm tra Toán trong kỳ thi SAT (MSAT) của họ.
Ở cả 3 mô hình, c mẫu khảo sát đều là n=427 sinh viên nên mô hình 1 là tốt nhất
vì hệ số xác định của mô hình này là lớn nhất trong 3 mô hình Các phần tử
trong mô hình 1 sẽ có nhiều phần tử nằm gần đường hồi quy hơn, đồng thời
đường hồi quy mẫu ở mô hình 1 sẽ phản ánh xu thế của đường hồi quy tổng thể
tốt hơn.
c) Hãy tính giá trị kiểm định ( ) của các biến độc lập tương ứng với từng
mô hình trong 3 mô hình trên với mức nghĩa 5 . Nhận xét về nghĩa của các
biến giải thích trong từng mô hình. Cho biết mô hình nào là tốt nhất theo và
- Ý thứ nhất: Hãy tính giá trị kiểm định ( ) của các biến độc lập tương ứng với
từng mô hình trong 3 mô hình trên với mức ý nghĩa 5%.
Với mức ý nghĩa
Mô hình 1:
̂ ̂
(̂) (̂)
Mô hình 2:
̂ ̂
(̂) (̂)
Mô hình 3:
̂ ̂
(̂) (̂)
- Ý thứ hai: Nhận xét về ý nghĩa của các biến giải thích trong từng mô hình.
Cặp giả thiết cần kiểm định:
→ Chấp nhận Vậy hệ số không có ý nghĩa, suy ra mô hình hồi quy không có ý
nghĩa, tức là điểm trung bình tích lũy đại học không phụ thuộc vào điểm kiểm tra k
năng học tập (Khi điểm kiểm tra k năng học tập tăng lên thì điểm trung bình tích lũy
đại học cũng tăng).
Mô hình 3:
̂ ̂
(-1,97;1,97)
(̂) (̂)
→ Chấp nhận Vậy hệ số không có ý nghĩa, suy ra mô hình hồi quy không có ý
nghĩa, tức là điểm trung bình tích lũy đại học không phụ thuộc vào điểm kiểm tra k
năng học tập (Khi điểm kiểm tra k năng học tập tăng lên thì điểm trung bình tích lũy
đại học cũng tăng).
Mô hình 3:
̂ ̂
(̂) (̂)
se (̂
Khoảng tin cậy cho tham số ∈ (0,409;0,634)
Ta thấy (điểm) không thuộc khoảng này.
→ Bác bỏ . Vậy hệ số có ý nghĩa, suy ra mô hình hồi quy có ý nghĩa, tức là
điểm trung bình tích lũy đại học có phụ thuộc vào điểm trung bình cuối năm phổ
thông (Khi điểm trung bình cuối năm phổ thông tăng lên thì điểm trung bình tích lũy
đại học cũng tăng).
Mô hình 2:
̂
se (̂
Khoảng tin cậy cho tham số ∈ (-0,11;0,11)
Ta thấy (điểm) thuộc khoảng này.
→ Chấp nhận Vậy hệ số không có ý nghĩa, suy ra mô hình hồi quy không có ý
nghĩa, tức là điểm trung bình tích lũy đại học không phụ thuộc vào điểm kiểm tra k
năng học tập (Khi điểm kiểm tra k năng học tập tăng lên thì điểm trung bình tích lũy
đại học cũng tăng).
Mô hình 3:
̂
se (̂
Khoảng tin cậy cho tham số ∈ (0,0015;0,0026)
Ta thấy (điểm) không thuộc khoảng này.
→ Bác bỏ . Vậy hệ số có ý nghĩa, suy ra mô hình hồi quy có ý nghĩa, tức là
điểm trung bình tích lũy đại học có phụ thuộc vào điểm kiểm tra Toán trong kỳ thi
SAT (Khi điểm kiểm tra Toán trong kỳ thi SAT tăng lên thì điểm trung bình tích lũy
đại học cũng tăng).
- Ý thứ ba: Cho biết mô hình nào là tốt nhất theo và
Theo :
Kiểm định sự phù hợp của mô hình:
Mô hình 1:
Mô hình 2:
Mô hình 3:
Theo R2 với mức ý nghĩa 5%, cả 3 mô hình đều phù hợp do có F > F0.05;1;425. Thế
nhưng mô hình 1 là tốt nhất do có R2 lớn nhất khi xét trên cùng một cỡ mẫu (n=427).
Theo :
Theo bài toán kiểm định ở ý 1 câu c, mô hình 1 và mô hình 3 có ý nghĩa, mô hình 2
không có ý nghĩa nên mô hình 2 không phải là một mô hình tốt.
d) Hãy tính giá trị kiểm định của các biến độc lập tương ứng với từng mô
hình trong 3 mô hình trên với mức nghĩa 1%. Nhận xét về nghĩa của các biến
giải thích trong từng mô hình. Cho biết mô hình nào là tốt nhất theo và .
- Ý thứ nhất: Hãy tính giá trị kiểm định ( ) của các biến độc lập tương ứng với
từng mô hình trong 3 mô hình trên với mức ý nghĩa 1%.
Với mức ý nghĩa
Mô hình 1:
̂ ̂
(̂) (̂)
Mô hình 2:
̂ ̂
(̂) (̂)
Mô hình 3:
̂ ̂
(̂) (̂)
- Ý thứ hai: Nhận xét về ý nghĩa của các biến giải thích trong từng mô hình.
Cặp giả thiết cần kiểm định:
{
→ Chấp nhận Vậy hệ số không có ý nghĩa, suy ra mô hình hồi quy không có ý
nghĩa, tức là điểm trung bình tích lũy đại học không phụ thuộc vào điểm kiểm tra k
năng học tập (Khi điểm kiểm tra k năng học tập tăng lên thì điểm trung bình tích lũy
đại học cũng tăng).
Mô hình 3:
̂ ̂
(-2.59;2.59)
(̂) (̂)
→ Chấp nhận Vậy hệ số không có ý nghĩa, suy ra mô hình hồi quy không có ý
nghĩa, tức là điểm trung bình tích lũy đại học không phụ thuộc vào điểm kiểm tra k
năng học tập (Khi điểm kiểm tra k năng học tập tăng lên thì điểm trung bình tích lũy
đại học cũng tăng).
Mô hình 3:
̂ ̂
(̂) (̂)
se (̂
Khoảng tin cậy cho tham số ∈ (0,32;0,67)
Ta thấy (điểm) không thuộc khoảng này.
→ Bác bỏ . Vậy hệ số có ý nghĩa, suy ra mô hình hồi quy có ý nghĩa, tức là
điểm trung bình tích lũy đại học có phụ thuộc vào điểm trung bình cuối năm phổ
thông (Khi điểm trung bình cuối năm phổ thông tăng lên thì điểm trung bình tích lũy
đại học cũng tăng).
Mô hình 2:
̂
se (̂
Khoảng tin cậy cho tham số ∈ (-0,15;0,15)
Ta thấy (điểm) thuộc khoảng này.
→ Chấp nhận Vậy hệ số không có ý nghĩa, suy ra mô hình hồi quy không có ý
nghĩa, tức là điểm trung bình tích lũy đại học không phụ thuộc vào điểm kiểm tra k
năng học tập (Khi điểm kiểm tra k năng học tập tăng lên thì điểm trung bình tích lũy
đại học cũng tăng).
Mô hình 3:
̂
se (̂
Khoảng tin cậy cho tham số ∈ (0,0014;0,0027)
Ta thấy (điểm) không thuộc khoảng này.
→ Bác bỏ . Vậy hệ số có ý nghĩa, suy ra mô hình hồi quy có ý nghĩa, tức là
điểm trung bình tích lũy đại học có phụ thuộc vào điểm kiểm tra Toán trong kỳ thi
SAT (Khi điểm kiểm tra Toán trong kỳ thi SAT tăng lên thì điểm trung bình tích lũy
đại học cũng tăng).
- Ý thứ ba: Cho biết mô hình nào là tốt nhất theo và
Theo :
Kiểm định sự phù hợp của mô hình:
Mô hình 1:
Mô hình 2:
Mô hình 3:
Theo R2 với mức ý nghĩa 1%, cả 3 mô hình đều phù hợp do có F > F0.01;1;425. Thế
nhưng mô hình 1 là tốt nhất do có R2 lớn nhất khi xét trên cùng một cỡ mẫu (n=427).
Theo :
Theo bài toán kiểm định ở ý 1 câu c, mô hình 1 và mô hình 3 có ý nghĩa, mô hình 2
không có ý nghĩa nên mô hình 2 không phải là một mô hình tốt.