Download as pdf or txt
Download as pdf or txt
You are on page 1of 11

TOÁN ỨNG DỤNG - ĐỀ ÔN TẬP CUỐI KÌ

Dữ liệu bên dưới cho câu 1 và câu 3


Câu 1. Cho biến ngẫu nhiên liên tục X có hàm mật độ
 k
  1 + x 2 , x   −1;1
f ( x) =  ( ) (k  \ 0 )
0, x   −1;1

Giá trị của tham số k, chọn khẳng định đúng
3 5
A. k   ; 
2 2
B. k  ( 2;3)
C. k  ( 2;3
D. k  ( 4;5
 1 
Câu 2. Tính xác suất p = P  −  X  1 , chọn khẳng định đúng
 2 
A. p  0.7952
B. p  0.8952
C. p  0.6952
D. p  0.5952
Câu 3. Tính kỳ vọng và phương sai của biến ngẫu nhiên X, chọn khẳng định đúng
A. E  X  = 0;Var  X   0.2732
B. E  X  = 1;Var  X   0.2732
C. E  X  = 1;Var  X   0.3732
D. E  X  = 2;Var  X   0.2732
Dữ liệu bên dưới cho câu 4 và câu 8
Câu 4. Giả sử chiều cao của nam sinh viên Việt Nam là biến ngẫu nhiên có phân phối
chuẩn với trung bình  = 165cm và độ lệch chuẩn  = 5cm .
Tính xác suất (tỷ lệ) các nam sinh viên có chiều cao từ 166cm đến 170cm.
A. 0.2621
B. 0.4671
C. 0.3675
D. 0.8571
Câu 5. Tính xác suất (tỷ lệ) các nam sinh viên có chiều cao trên 170cm.
A. 0.1587
B. 0.1671
C. 0.3675
D. 0.3571
Câu 6. Size L của bộ đồ thể dục là size dành cho nam sinh viên có chiều cao từ 166cm
đến 170cm. Năm 2024 trường Đại học Công nghiệp TP.HCM có 10000 sinh
viên nam. Tính số nam sinh viên sẽ nhận đồ thể dục size L.
A. 2621
B. 4671
C. 3675
D. 8571
Câu 7. Gọi A là biến cố : “Nam sinh viên Việt Nam có chiều cao không quá h0”. Tìm
giá trị chiều cao h0 (cm) biết P  A = 0.85 .
A. 170.2 (cm)
B. 175.5 (cm)
C. 168.5 (cm)
D. 169.5 (cm)
Câu 8. Gọi X là các biến ngẫu nhiên độc lập có phân phối chuẩn với kỳ vọng  X = 165
và độ lệch chuẩn  X = 5 . Biết biến ngẫu nhiên Y = X + 10 , chọn khẳng định
đúng
A. Y có phân phối chuẩn với kỳ vọng Y = 175 và độ lệch chuẩn  Y = 5
B. Y có phân phối chuẩn với kỳ vọng Y = 180 và độ lệch chuẩn  Y = 15
C. Y có phân phối chuẩn với kỳ vọng Y = 165 và độ lệch chuẩn  Y = 15
D. Y có phân phối chuẩn với kỳ vọng Y = 180 và độ lệch chuẩn  Y = 5
Dữ liệu bên dưới cho câu 9 và câu 13
Bộ dữ liệu Iris có 4 biến định lượng là Sepal.Length, Sepal.Width, Petal.Length,
Petal.Width thu thập số đo chiều dài, chiều rộng của đài hoa và cánh hoa. Biến định tính
Species phân loại hoa Iris thành 3 nhóm gồm: setosa, versicolor và virginica. Phân tích
mô tả dữ liệu chiều dài đài hoa của nhóm setosa ta có kết quả mô tả từ phần mềm
thống kê R >như sau:
summary(iris.setosa$Sepal.Length)
Min. 1st Qu. Median Mean 3rd Qu. Max.
4.300 4.800 5.000 5.006 5.200 5.800

Câu 9. Khẳng định nào sau đây là đúng về dữ liệu chiều dài đài hoa của nhóm setosa
A. 25% số quan sát trong dữ liệu có giá trị nhỏ hơn hoặc bằng 4.8
B. Giá trị nhỏ nhất của dữ liệu là 5.2
C. Giá trị trung bình của dữ liệu phân tích là 5.8
D. 50% số quan sát trong dữ liệu có giá trị nhỏ hơn 5.006
Câu 10. Khẳng định nào sau đây là đúng về dữ liệu chiều dài đài hoa của nhóm setosa
A. Trung vị của dữ liệu có giá trị là 5
B. Giá trị nhỏ nhất của dữ liệu là 5.2
C. Giá trị trung bình của dữ liệu phân tích là 5
D. 50% số quan sát trong dữ liệu có giá trị nhỏ hơn 5.006
Câu 11. Khẳng định nào sau đây là đúng về dữ liệu chiều dài đài hoa của nhóm setosa
A. 75% số quan sát trong dữ liệu có giá trị nhỏ hơn hoặc bằng 5.2
B. Giá trị nhỏ nhất của dữ liệu là 4.8
C. Giá trị trung bình của dữ liệu phân tích là 5.8
D. 25% số quan sát trong dữ liệu có giá trị nhỏ hơn 5.0
Câu 12. Khẳng định nào sau đây là đúng theo kết quả được phân tích ở trên về lower
whisker (râu dưới) của biểu đồ hộp mô tả dữ liệu chiều dài đài hoa của nhóm
setosa
A. lower whisker là giá trị nhỏ nhất của dữ liệu
B. lower whisker là 4.2
C. lower whisker là 4.1
D. lower whisker là 4.0
Câu 13. Khẳng định nào sau đây là đúng nhất theo kết quả được phân tích ở trên về
upper whisker (râu trên) của biểu đồ hộp mô tả dữ liệu chiều dài đài hoa của
nhóm setosa
A. upper whisker là 5.8
B. upper whisker là 5.9
C. upper whisker là 6.0
D. upper whisker là 5.6
Dữ liệu bên dưới cho câu 14 và câu 17
Bộ dữ liệu Iris có 4 biến định lượng là Sepal.Length, Sepal.Width, Petal.Length,
Petal.Width thu thập số đo chiều dài, chiều rộng của đài hoa và cánh hoa. Biến định tính
Species phân loại hoa Iris thành 3 nhóm gồm: setosa, versicolor và virginica. Phân tích
mô tả dữ liệu chiều dài đài hoa để so sánh giữa các nhóm của loài hoa Iris ta có kết quả
sau:

Câu 14. Khẳng định nào sau đây là đúng theo kết quả được phân tích ở trên
A. Chiều dài trung bình của nhóm setosa là 5.01
B. Chiều dài trung bình của nhóm versicolor là 50
C. Chiều dài trung bình của nhóm virginica là 6.5
D. Chiều dài trung bình của nhóm setosa là 5.0
Câu 15. Các khẳng định nào sau đây là đúng về giá trị độ lệch chuẩn (sd-standard
deviation) và sai số chuẩn (se – standard deviation of the set of means) cho dữ
liệu chiều dài đài hoa của nhóm setosa
A. 0.35; 0.05
B. 5; 0.05
C. 5.94; 0.05
D. 0.52; 0.07
Câu 16. Khẳng định nào sau đây là đúng theo kết quả được phân tích ở trên
A. Dữ liệu chiều dài đài hoa của nhóm setosa tập trung gần giá trị trung bình nhất.
B. Dữ liệu chiều dài đài hoa của nhóm versicolor tập trung gần giá trị trung bình nhất.
C. Dữ liệu chiều dài đài hoa của nhóm virginica tập trung gần giá trị trung bình nhất.
D. Dữ liệu chiều dài đài hoa của nhóm virginica tập trung gần giá trị trung bình hơn
so với loài versicolor .
Câu 17. Khẳng định nào sau đây là đúng về giá trị độ lệch tuyệt đối trung bình (MAD -
Mean Absolute Deviation) cho dữ liệu chiều dài đài hoa.
A. MAD của nhóm setosa là nhỏ nhất.
B. MAD của nhóm versicolor là lớn nhất.
C. MAD của nhóm virginica là nhỏ nhất.
D. Từ thông tin MAD cho thấy dữ liệu chiều dài đài hoa của nhóm versicolor là ổn
định và tập trung gần nhất xung quanh giá trị trung bình.
Dữ liệu bên dưới cho câu 18 và câu 19
Nghiên cứu về lãi suất cho vay tiêu dùng quý I năm 2024 tại Việt Nam. Qua khảo sát
thực tế từ 50 ngân hàng cho thấy lãi suất cho vay trung bình là 8,1% và độ lệch chuẩn
hiệu chỉnh là 0,24%.
Câu 18. Xây dựng khoảng tin cậy hai phía đối xứng, với độ tin cậy 95% mô tả lãi suất
cho vay trung bình  của các ngân hàng tại Việt Nam trong quý I năm 2024.
Chọn kết quả phù hợp nhất
A. ( 8.03%;8.17% )
B. ( 7.03%;9.17% )
C. ( 6.03%;10.17% )
D. ( 8.13%;8.17% )
Câu 19. Xây dựng khoảng tin cậy trái   1 , với độ tin cậy 90% mô tả lãi suất cho vay
trung bình  của các ngân hàng tại Việt Nam trong quý I năm 2024. Chọn kết
quả phù hợp nhất
A.   8.14%
B.   8.04%
C.   8.24%
D.   8.34%
Dữ liệu bên dưới cho câu 20 và câu 21
Khảo sát ngẫu nhiên 1000 sinh viên năm cuối của trường đại học X thì có 750 sinh viên
đủ điều kiện tốt nghiệp đợt 1.
Câu 20. Với mẫu trên, tìm khoảng tin cậy hai phía mô tả tỷ lệ p sinh viên tốt nghiệp
đợt 1 của trường X với độ tin cậy 98%. Chọn kết quả phù hợp nhất
A. ( 0.72;0.78)
B. ( 0.62;0.88)
C. ( 0.52;0.98)
D. ( 0.72;0.88)
Câu 21. Biết rằng, cỡ mẫu tối thiểu để khoảng tin cậy hai phía 1 −  đối xứng với p mô
z 2
tả tỷ lệ mẫu f A có độ lệch biên d là n = , trong đó z 2 là giá trị mà
4d 2

P ( Z  z 2 ) = 1 − với Z N ( 0,1) . Từ kết quả khảo sát trên, giả sử tỷ lệ sinh
2
viên tốt nghiệp của trường X là p=0.75. Tìm cỡ mẫu tối thiểu để khoảng tin cậy
hai phía mô tả tỷ lệ mẫu có độ lệch biên so với p là không quá 0.02 và độ tin
cậy là 98%.
A. 1454
B. 1464
C. 1474
D. 1444
Dữ liệu bên dưới cho câu 22 và câu 23
Bộ dữ liệu Iris có 4 biến định lượng là Sepal.Length, Sepal.Width, Petal.Length,
Petal.Width thu thập số đo chiều dài, chiều rộng của đài hoa và cánh hoa. Biến định tính
Species phân loại hoa Iris thành 3 nhóm gồm: setosa, versicolor và virginica. Nghi
ngờ một kết luận trước đó cho rằng “chiều dài trung bình cánh hoa của nhóm
versicolor không khác biệt so với 4”, giả thuyết lựa chọn “Chiều dài cánh hoa của
nhóm versicolor là khác 4” được đặt ra cho bài toán kiểm định giả thuyết.
Câu 22. Gọi  là chiều dài trung bình cánh hoa của nhóm versicolor. Chọn khẳng
định đúng về mô hình kiểm định giả thuyết trên.
H :  = 4
A.  0
 H1 :   4
H0 :   4
B. 
 H1 :   4
H0 :   4
C. 
 H1 :   4
H0 :   4
D. 
 H1 :   4
Câu 23. Kết quả phân tích kiểm định từ phần mềm thống kê R được cho bên dưới

Từ kết quả phân tích kiểm định thống kê mẫu, với mức ý nghĩa 5\% chọn khẳng định
đúng cho bài toán kiểm định giả thuyết thống kê ở trên
A. p-value < 0.05, bác bỏ giả thuyết H0, kiểm định có ý nghĩa thống kê.
B. p-value < 0.05, không thể bác bỏ giả thuyết H0, kiểm định có ý nghĩa thống kê.
C. p-value > 0.05, bác bỏ giả thuyết H0, kiểm định có ý nghĩa thống kê.
D. p-value > 0.05, không thể bác bỏ giả thuyết H0.
Dữ liệu bên dưới cho câu 24 và câu 25
Bộ dữ liệu Iris có 4 biến định lượng là Sepal.Length, Sepal.Width, Petal.Length,
Petal.Width thu thập số đo chiều dài, chiều rộng của đài hoa và cánh hoa. Biến định tính
Species phân loại hoa Iris thành 3 nhóm gồm: setosa, versicolor và virginica. Nghi
ngờ một kết luận trước đó cho rằng “Chiều rộng cánh hoa nhóm versicolor không
khác biệt so với chiều rộng cánh hoa nhóm verginica”, giả thuyết lựa chọn “Chiều
rộng cánh hoa nhóm versicolor khác biệt so với chiều rộng cánh hoa nhóm
verginica” được đặt ra cho bài toán kiểm định giả thuyết thống kê.
Câu 24. Gọi 1 là trung bình chiều rộng cánh hoa nhóm versicolor và 2 là trung
bình chiều rộng cánh hoa nhóm verginica. Mô hình kiểm định giả thuyết
thống kê trên là
 H :  = 2
A.  0 1
 H1 : 1  2
 H 0 : 1 = 2
B. 
 H1 : 1  2
 H 0 : 1 = 2
C. 
 H1 : 1  2
 H 0 : 1  2
D. 
 H1 : 1  2
Kết quả phân tích kiểm định từ phần mềm thống kê R được cho bên dưới
> t.test(iris.versicolor$Petal.Width,iris.virginica$Petal.Width,altern
ative = "two.sided",var.equal = F)

Welch Two Sample t-test

data: iris.versicolor$Petal.Width and iris.virginica$Petal.Width


t = -14.625, df = 89.043, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.7951002 -0.6048998
sample estimates:
mean of x mean of y
1.326 2.026
Câu 25. Từ kết quả phân tích kiểm định thống kê mẫu, với mức ý nghĩa 5% chọn khẳng
định đúng cho bài toán kiểm định giả thuyết thống kê ở trên
A. p − value  0.05 , bác bỏ giả thuyết H0, kiểm định có ý nghĩa thống kê.
B. p − value  0.05 , không thể bác bỏ giả thuyết H0, kiểm định có ý nghĩa thống kê.
C. p − value  0.05 , bác bỏ giả thuyết H0, kiểm định có ý nghĩa thống kê.
D. p − value  0.05 , không thể bác bỏ giả thuyết H0.
Dữ liệu bên dưới cho câu 26 và câu 29
Bộ dữ liệu Arthritis của Koch & Edwards năm 1988 trong pakage (vcd) từ phần mềm
thống kê R, thu thập thông tin từ 84 đối tượng là người bệnh viêm khớp dạng thấp để
nghiên cứu về một phương pháp điều trị mới cho bệnh này.
Dữ liệu có 3 biến định tính:
Treatment: phương pháp điều trị
Sex:giới tính
Improved: mức độ đáp ứng thuốc.
Dữ liệu có 2 biến định lượng "ID" và "Age" thông tin về mã số bệnh nhân và tuổi của
người bệnh.
Câu 26. Nghi ngờ một kết luận từ trước cho rằng “Tỷ lệ bệnh nhân nữ viêm khớp dạng
thấp là lớn hơn hoặc bằng 65%”, giả thuyết lựa chọn “Tỷ lệ bệnh nhân nữ
viêm khớp dạng thấp là nhỏ hơn 65%” được đặt ra cho bài toán kiểm định giả
thuyết. Gọi p là tỷ lệ bệnh nhân nữ viêm khớp dạng thấp, mô hình đúng cho
kiểm định giả thuyết thống kê trên là
 H 0 : p  0.65
A. 
 H1 : p  0.65
 H 0 : p  0.65
B. 
 H1 : p  0.65
 H 0 : p = 0.65
C. 
 H1 : p  0.65
 H 0 : p  0.65
D. 
 H1 : p  0.65
Câu 27. Kết quả phân tích kiểm định từ phần mềm thống kê R được cho bên dưới.
Từ kết quả phân tích kiểm định thống kê mẫu, với mức ý nghĩa 5\% chọn khẳng định
đúng cho bài toán kiểm định giả thuyết thống kê ở trên.
A. p-value > 0.05, không thể bác bỏ giả thuyết H0.
B. p-value > 0.05, bác bỏ giả thuyết H0, kiểm định có ý nghĩa thống kê.
C. p-value < 0.05, bác bỏ giả thuyết H0, kiểm định có ý nghĩa thống kê.
D. p-value < 0.05, không thể bác bỏ giả thuyết H0, kiểm định có ý nghĩa thống kê.
Câu 28. Biến "Treatment" cho biết thông tin về phương pháp điều trị là giả dược
hay theo phương pháp điều trị mới (Placebo, Treated), biến
"Improved" cho biết mức độ cải thiện sức khỏe và bệnh thuyên giảm: không
có, một ít, cải thiện tốt (None, Some, Marked). Dữ liệu từ mẫu cho biết
thông tin như sau:
None Some Marked
Placebo 29 7 7
Treated 13 7 21
Nghi ngờ kết luận “Tỷ lệ bệnh nhân cải thiện tốt của nhóm điều trị phương pháp mới
nhỏ hơn hoặc bằng so với nhóm bệnh nhân dùng giả dược”, giả thuyết lựa chọn “Tỷ
lệ bệnh nhân cải thiện tốt của nhóm điều trị phương pháp mới lớn hơn so với nhóm
bệnh nhân dùng giả dược” được đặt ra cho bài toán kiểm định giả thuyết.
Gọi p1 là tỷ lệ các bệnh nhân có cải thiện tốt theo phương pháp điều trị mới, p2 là tỷ
lệ bệnh nhân cải thiện tốt khi dùng giả dược của nghiên cứu trên.Chọn đúng mô hình
kiểm định giả thuyết so sánh tỷ lệ p1 , p2 ở trên.
 H 0 : p1  p2
A. 
 H1 : p1  p2
 H 0 : p1  p2
B. 
 H1 : p1  p2
 H 0 : p1  p2
C. 
 H1 : p1  p2
 H 0 : p1  p2
D. 
 H1 : p1  p2
Câu 29. Kết quả phân tích kiểm định giả thuyết trên từ phần mềm thống kê R được cho
bên dưới.
Từ kết quả phân tích kiểm định thống kê mẫu, với mức ý nghĩa 5\% chọn khẳng định
đúng cho bài toán kiểm định giả thuyết thống kê ở trên.
A. p − value  0.05 , bác bỏ giả thuyết H0, kiểm định có ý nghĩa thống kê.
B. p − value  0.05 , không thể bác bỏ giả thuyết H0, kiểm định có ý nghĩa thống kê.
C p − value  0.05 , bác bỏ giả thuyết H0, kiểm định có ý nghĩa thống kê.
D. p − value  0.05 , không thể bác bỏ giả thuyết H0.
Dữ liệu bên dưới cho câu 30
Câu 30. Công thức tính hệ số tương quan (Pearson) giữa hai biến X và Y trong thống kê
là:

Trong đó,

Các yếu tố ảnh hưởng đến hệ số tương quan r là


A. n, X i , Yi ;1  i  n
B. X i , Yi ;1  i  n
C. n, Yi ;1  i  n
D. n, X i ;1  i  n
Dữ liệu bên dưới cho câu 31 và câu 35
Bộ dữ liệu Iris có 4 biến định lượng là Sepal.Length, Sepal.Width, Petal.Length,
Petal.Width thu thập số đo chiều dài, chiều rộng của đài hoa và cánh hoa. Biến định tính
Species phân loại hoa Iris thành 3 nhóm gồm: setosa, versicolor và virginica. Kết quả
phân tích hệ số tương quan giữa các biến định lượng của nhóm versicolor được cho bên
dưới,
Câu 31. Dựa vào kết quả trên, cho biết cặp biến có hệ số tương quan cao nhất.
A. chiều rộng cánh hoa; Chiều dài cánh hoa
B. Chiều rộng cánh hoa; Chiều dài đài hoa
C. Chiều rộng đài hoa; Chiều dài đài hoa
D. Chiều rộng đài hoa; Chiều rộng cánh hoa
Câu 32. Kết quả phân tích mô hình hồi quy mẫu của hai biến được cho bên dưới,

Gọi y là biến phụ thuộc và x là biến độc lập trong mô hình hồi quy theo phân tích trên.
Phương trình hồi quy đúng là,
A. y = 0.6905 x + 2.639 .
B. x = 0.6905 y + 2.639 .
C. y = 2.639 x + 0.6905 .
D. x = 2.639 y + 0.6905 .
Câu 33. Từ mô hình hồi quy của kết quả phân tích trên, nếu chiều rộng đài hoa tăng 1
đơn vị chiều dài thì chiều dài đài hoa tăng thêm bao nhiêu? Chọn khẳng định
đúng(kết quả phần thập phân làm tròn đến hàng trăm)
A. 0.69 .
B. 2.64 .
C. 8.51 .
D. 7.68 .
Câu 34. Trong kết quả phân tích trên, biến “Residuals” mô tả thông tin gì? Chọn
khẳng định đúng
A. Mô tả độ lệch của biến chiều dài đài hoa trong dữ liệu với chiều dài đài hoa được
tính từ mô hình hồi quy.
B. Mô tả độ lệch của biến chiều rộng đài hoa trong dữ liệu với chiều rộng đài hoa
được tính từ mô hình hồi quy.
C. Mô tả độ lệch của biến chiều rộng đài hoa trong dữ liệu với chiều dài đài hoa
được tính từ mô hình hồi quy.
D. Mô tả độ lệch của biến chiều dài đài hoa trong dữ liệu với chiều rộng đài hoa
được tính từ mô hình hồi quy.
Câu 35. Trong kết quả phân tích trên, “Multiple R-squared: 0.5514, Adjusted
R-squared: 0.542” mô tả thông tin gì? Chọn khẳng định đúng
A. Khoảng 55% giá trị của chiều dài đài hoa trong dữ liệu thu thập có thể được ước
tính bởi biến chiều rộng đài hoa theo mô hình hồi quy trên.
B. Khoảng 55% giá trị của chiều rộng đài hoa trong dữ liệu thu thập có thể được ước
tính bởi biến chiều rộng đài hoa theo mô hình hồi quy trên.
C. Khoảng 55% giá trị của chiều dài đài hoa trong dữ liệu thu thập có thể được ước
tính bởi biến chiều dài đài hoa theo mô hình hồi quy trên.
D. Khoảng 59% giá trị của chiều dài đài hoa trong dữ liệu thu thập có thể được ước
tính bởi biến chiều dài đài hoa theo mô hình hồi quy trên.

You might also like