Professional Documents
Culture Documents
Nhập môn Thống kê ứng dụng trong giáo dục
Nhập môn Thống kê ứng dụng trong giáo dục
XÁC SUẤT
3 Biến ngẫu nhiên & quy luật phân phối xác suất
4 Summary
1 Hoán vị
2 Tổ hợp
3 Chỉnh hợp chập
4 Chỉnh hợp lặp
Phép thử ngẫu nhiên: Thực hiện một nhóm các điều kiện cơ bản để quan
sát một hiện tượng nào đó có xảy ra hay không được gọi là thực hiện một
phép thử ngẫu nhiên.
Biến cố sơ cấp: Là kết quả sơ đẳng nhất của phép thử ngẫu nhiên. Tập
hợp các biến cố sơ cấp của phép thử được gọi là không gian mẫu, ký hiệu
Ω.
Biến cố ngẫu nhiên: Là tập hợp các biến cố sơ cấp của phép thử ngẫu
nhiên có chung đặc tính, ký hiệu biến cố ngẫu nhiên: A, B, C, · · ·
Phân loại biến cố: Biến cố không thể có; Biến cố chắc chắn; Biến cố ngẫu
nhiên.
Dạng cổ điển:
P (A ∪ B) = P (A) + P (B); P (A ∩ B) = 0.
Quy tắc cộng xác suất của hợp hai biến cố: A và B là hai biến cố
bất kỳ:
P (A ∪ B) = P (A) + P (B) − P (A ∩ B). (3)
Quy tắc cộng xác suất của hợp n biến cố: A1 , A2 , · · · , An dãy gồm
n biến cố bất kỳ:
n
[ n
X .
X .
X
P( Ai ) = P (Ai ) − P (Ai Aj ) + P (Ai Aj Ak )+
i=1 i=1 1≤i<j≤n 1≤i<j<k≤n
n
\
+ · · · + (−1)n P ( Ai ). (4)
i=1
P (A ∩ B)
P (A/B) = , (5)
P (B)
Ví dụ 7. Một nhóm có 5 học viên, trong đó có 3 học viên nam và 2 học viên
nữ. Theo thứ tự, cần lựa chọn ngẫu nhiên 2 học viên để đảm nhiệm các công
việc điều hành và truyền thông cho nhóm. Xác suất để cả hai học viên được
chọn đều có giới tính nam bằng bao nhiêu?
X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education
Ngày 9 tháng 10 năm 2021 16 / 42
Quy tắc xác suất đầy đủ, định lý Bayes
Ví dụ 8. Phân tích sơ bộ kết quả khảo sát 1220 người (433 giáo viên, 787
sinh viên sư phạm) về mức độ chấp nhận sử dụng công cụ hỗ trợ tư duy trong
phát triển cá nhân và nghề nghiệp tại 104 cơ sở giáo dục, đào tạo trên cả
nướca , cho thấy có 171 giáo viên và 191 sinh viên thường xuyên sử dụng công
cụ hỗ trợ tư duy trong phát triển cá nhân và nghề nghiệp. Chọn ngẫu nhiên 1
người vừa tham gia khảo sát:
a) Tính xác suất để người ngày thường xuyên sử dụng công cụ hỗ trợ tư duy
trong phát triển cá nhân và nghề nghiệp.
b) Biết rằng, người vừa chọn thường xuyên sử dụng công cụ hỗ trợ tư duy
trong phát triển cá nhân và nghề nghiệp. Người này thuộc nhóm giáo viên hay
sinh viên sư phạm?
c) Trong số 10 người chọn ngẫu nhiên từ 1220 người, tính xác suất để có ít
nhất 9 người thường xuyên sử dụng công cụ hỗ trợ tư duy trong phát triển cá
nhân và nghề nghiệp.
a Nguồn dữ liệu: Dự án FIRST, http: education.edu.vn
BIẾN NGẪU NHIÊN & QUY LUẬT PHÂN PHỐI XÁC SUẤT
Hàm mật độ xác suất của X (P.D.F), ký hiệu f (x) được cho bởi:
Zx
F (x) = f (u)du, ∀x ∈ R, (11)
−∞
Hàm hiểm độ tích lũy của X (C.H.F), ký hiệu Λ(t) được cho bởi:
Zt
Λ(t) = λ(u)du = − ln {S(t)}, (13)
0
Rõ ràng: Phân phối xác suất của bnn rời rạc thỏa mãn 2 điều kiện:
.
X
0 ≤ pi ≤ 1, ∀i, và pi = 1.
i=1
Nếu X là b.n.n liên tục có P.D.F f (t), C.D.F F (t) và F (t) có đạo hàm tại
t thì:
P {t < X < t + h}
f (t) = lim = F 0 (t) = −S 0 (t),
h→0 h
Rõ ràng: P.D.F f (x) của X thỏa mãn: f (x) là hàm không âm với mọi x
+∞
R Rb
và f (t)dt = 1. Hơn nữa: P {a ≤ X ≤ b} = F (b) − F (a) = f (t)dt.
−∞ a
2 Kỳ vọng hình học Nếu X là b.n.n chỉ nhận các giá trị dương, thì giá trị
kỳ vọng hình học của X, ký hiệu G(X) được cho bởi công thức:
Z +∞
G(X) = exp {E(ln X)} = exp ln x.f (x)dx .
0
p
2 Độ lệch chuẩn của b.n.n X: σX = V ar(X).
X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education
Ngày 9 tháng 10 năm 2021 25 / 42
Một số đặc trưng cơ bản
Ví dụ 9.
9.1 Giả sử điểm thi của các sinh viên có phân phối xác suất như sau:
Điểm 3.5 4 5 5.5 6 7 7.5 8 8.5 9
p 0.03 0.05 0.1 0.19 0.25 0.17 0.1 0.07 0.02 0.01
1 Tìm kì vọng, phương sai của X.
2 Thiết lập hàm phân phối F (x) của X.
3 Tìm kì vọng của biến ngẫu nhiên Y = 3X 2 + 2X − 1.
9.2 Biến ngẫu nhiên X có kì vọng EX = 3.2, kì vọng của E(X 2 ) = 11.5. Biến
ngẫu Y nhận được từ X bằng cách nhân các giá trị của X với 0.75. Y có
kì vọng và phương sai bằng?
Nếu X ' B(n, p) thì kì vọng EX = np; phương sai V ar(X) = np(1 − p).
N(2, 0.9)
N(3, 0.9) Có Mean ≡ Mode ≡ Median = µ.
0.4
N(3, 1.5)
Probability distribution function
Phương sai DX = σ 2 .
0.3
Lưu ý:
0.1
X −µ
0.0
−2 0 2 4 6 8
X ' N (µ, σ 2 ) ⇐⇒ ' N (0, 1).
σ
x
X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education
Ngày 9 tháng 10 năm 2021 28 / 42
Một số phân phối thường sử dụng
P {µ ≤ X ≤ µ + σ} = 34.13%.
P {µ + σ ≤ X ≤ µ + 2σ} = 13.59%.
P {X ≥ µ + 2σ} = 2.28%.
Quy tắc 2σ:
P {| X − µ |< 2σ} = 95.44%.
Hình 3: The normal distribution following a Quy tắc 3σ:
zscore transformation (Frederick J. G. et all.
(2013))
P {| X − µ |< 3σ} = 99.74%.
X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education
Ngày 9 tháng 10 năm 2021 29 / 42
Một số phân phối thường sử dụng
Ví dụ 10. Về phân phối chuẩn Điểm thi SAT tuân theo luật phân phối chuẩn
với kỳ vọng µ = 500, độ lệch chuẩn σ = 100a .
Tính xác suất để 1 người dự thi có điểm lớn hơn 700.
Trong số 1000 người dự thi, có bao nhiêu người có điểm lớn hơn 700 là có
khả năng nhất?
a Frederick J. G. et all. (2013)
700 − 500
zscore = = 2.
100
Hình 4: The distribution of SAT zscore Điểm SAT 700 nằm ở vị trí 2
described in Ex 10.2
độ lệch so với trung bình
n=4
Probability distribution function
n=6
n=9
hợp của một phân phối thực nghiệm
0.3
0 2 4 6 8
x
X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education
Ngày 9 tháng 10 năm 2021 33 / 42
Phân phối liên tục-Phân phối Student
X
T =p ,
Y /n
tuân theo luật phân phối Student với n bậc tự do, ký hiệu T ' tn .
n=0.5
0.4
n=2
n=5
Probability distribution function
n=300
0.3
biết.
0.1
0.0
−4 −2 0 2 4
X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education
Ngày 9 tháng 10 năm 2021 34 / 42
Phân phối liên tục-Phân phối mũ
E(0.5)
E(1)
quá trình sản xuất và cung cấp dịch
Probability distribution function
vụ.
1.5
x
gian giữa những lần giao dịch tại
một quầy hàng,...
X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education
Ngày 9 tháng 10 năm 2021 35 / 42
Tóm tắt chủ đề 2
1 Hai kẻ trộm đeo mặt nạ, bị cảnh sát đuổi bắt, bèn vứt mặt nạ đi và trà
trộn vào đám đông. Cảnh sát bắt giữ toàn bộ đám đông, tổng cộng 60
người và sử dụng máy phát hiện nói dối để điều tra xem ai trong đám
đông là kẻ trộm. Biết rằng, đối với kẻ trộm, xác suất bị máy nghi là có tội
là 85%, còn đối với người vô tôi, xác suất để bị máy nghi thành có tội là
7%. Gọi ngẫu nhiên 1 người trong số đó để kiểm tra bằng máy phát hiện
nói dối,
Tính xác suất để người này bị máy nghi là có tội.
Biết rằng người vừa kiểm tra bị máy nghi là có tội, tính xác suất để người
này là kẻ trộm.
2 Cho X là biến ngẫu nhiên có phân phối chuẩn với kỳ vọng bằng 100, độ
lệch chuẩn 15. Tính các xác suất sau:
P (X < 120).
P (80 < X < 120).
P (X > 125).
3 Phân phối gốc score của một kỳ thi có trung bình µ = 57 và độ lệch
chuẩn σ = 14. Người kiểm tra chuyển sang sử dụng một phân phối score
mới có điểm trung bình bằng 50, độ lệch chuẩn 10 để tiện so sánh các thí
sinh. Hãy cho biết điều gì xảy ra với hai thí sinh A và B, biết điểm score
gốc của hai thí sinh này tương ứng bằng 64 và 43?
4 Điểm thi môn văn tuân theo phân bố lệch dương với trung bình µ = 40 và
độ lệch chuẩn σ = 10. Tính xác suất để một thí sinh có điểm lớn hơn 45.
5 Điểm Toán trong kỳ thi SAT tuân theo phân bố chuẩn với trung bình
500, độ lệch chuẩn 100. Nếu một trường đại học chỉ tuyển những thí sinh
nằm trong Top 60% sinh viên được điểm cao nhất thì điểm tối thiểu sinh
viên cần đạt được là bao nhiêu để có thể nhập học?
5 Cho hai phân bố chuẩn với các trung bình và độ lệch chuẩn như sau:
Phân bố A: Trung bình bằng 50, độ lệch chuẩn bằng 10.
Phân bố B: Trung bình bằng 100, độ lệch chuẩn bằng 15.
Hỏi:
a Nếu một thí sinh có điểm số là 70 trong phân bố A thì zscore tương ứng
bằng bao nhiêu?
b Có bao nhiêu phần trăm thí sinh trong phân bố A có điểm số giữa 50 và
70?
c Nếu điểm số là 70 trong phân bố B, hãy trả lời hai câu hỏi trên.
6 Dưới đây là kết quả thi của học sinh Nam:
Môn thi Điểm thi của Nam Trung bình Độ lệch chuẩn
Ngữ văn 68 70.2 5.1
Toán 84 78 4.1
Khoa học xã hội 82 78 7.2
Chuyển đổi điểm của thí sinh Nam ra zscore .
Thí sinh Nam làm tốt môn nào nhất? Yếu môn nào nhất?
Môn thi Trung bình Độ lệch chuẩn Thí sinh A Thí sinh B Thí
Toán học 5.64 1.73 9.60 9.60 9
Ngữ văn 5.48 1.33 5.00 6.00 4
Ngoại ngữ 4.35 1.81 5.40 4.40 6
Nguồn: Bộ Giáo dục & Đào tạo, 2019.
1. Ba thí sinh A, B, C có năng lực tương đương nhau không?
2. Một trường Đại học X tuyển sinh theo tổ hợp ba môn Toán học, Ngữ
văn, Ngoại ngữ và chỉ tuyển những thí sinh nằm trong top 35% thí sinh
có tổng điểm ba môn cao nhất. Hỏi: Ba thí sinh A, B, C với số điểm như
trên có trúng tuyển vào trường X không?
Biết rằng, tổng điểm ba môn Toán học, Ngữ văn, Ngoại ngữ tuân theo
quy luật chuẩn với trung bình 15.75 điểm; độ lệch chuẩn 3.83 điểm.