Download as pdf or txt
Download as pdf or txt
You are on page 1of 42

EAM3002

Nhập môn Thống kê ứng dụng trong giáo dục

TS. TRAN Xuan Quang

Trường Đại học Giáo dục, ĐHQGHN

Ngày 9 tháng 10 năm 2021

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 1 / 42
CHỦ ĐỀ 2

XÁC SUẤT

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 2 / 42
Mục lục

1 Mục tiêu cần đạt

2 Xác suất của biến cố

3 Biến ngẫu nhiên & quy luật phân phối xác suất

4 Summary

5 Bài tập thực hành

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 3 / 42
Mục tiêu cần đạt

Mục tiêu cần đạt


Hoàn thành chủ đề, học viên cần đat được:
1 Hiểu rõ một số khái niệm cơ bản của lý thuyết xác suất.
2 Nắm chắc một số khái niệm cơ bản trong thống kê toán như: Phân phối
của tổng thể; phân phối của các số thống kê.
3 Tính toán được một số bài toán cơ bản và nâng cao về xác suất và quy
luật phân phối xác suất của biến ngẫu nhiên, đặc biệt là phân phối chuẩn.
4 Nhận diện được phân phối chuẩn trong thực tiễn.
5 Vận dụng được quy luật phân phối quan trọng vào các bài toán thực tiễn
trong nghiên cứu khoa học giáo dục như: Đánh giá năng lực người học;
Xác định phân phối của dãy dữ liệu khoa học giáo dục.

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 4 / 42
Phần I

XÁC SUẤT CỦA BIẾN CỐ

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 5 / 42
Mục lục chương 1

1 Giải tích tổ hợp


2 Xác suất
Biến cố ngẫu nhiên, phân loại và quan hệ
Xác suất: Một số định nghĩa và Tính chất
Quy tắc tính xác suất: Quy tắc cộng, Quy tắc nhân
Quy tắc xác suất đầy đủ, định lý Bayes
3 Biến ngẫu nhiên
Khái niệm và phân loại
Quy luật phân phối xác suất
Một số đặc trưng cơ bản
4 Một số phân phối thường sử dụng
Phân phối rời rạc: Nhị thức, Poisson
Phân phối chuẩn và điểm z
Một số phân phối khác
5 Tóm tắt chương 1
6 Bài tập thực hành

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 6 / 42
Giải tích tổ hợp

1 Hoán vị
2 Tổ hợp
3 Chỉnh hợp chập
4 Chỉnh hợp lặp

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 7 / 42
Biến cố ngẫu nhiên, phân loại và quan hệ

Phép thử ngẫu nhiên: Thực hiện một nhóm các điều kiện cơ bản để quan
sát một hiện tượng nào đó có xảy ra hay không được gọi là thực hiện một
phép thử ngẫu nhiên.
Biến cố sơ cấp: Là kết quả sơ đẳng nhất của phép thử ngẫu nhiên. Tập
hợp các biến cố sơ cấp của phép thử được gọi là không gian mẫu, ký hiệu
Ω.
Biến cố ngẫu nhiên: Là tập hợp các biến cố sơ cấp của phép thử ngẫu
nhiên có chung đặc tính, ký hiệu biến cố ngẫu nhiên: A, B, C, · · ·
Phân loại biến cố: Biến cố không thể có; Biến cố chắc chắn; Biến cố ngẫu
nhiên.

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 8 / 42
Biến cố ngẫu nhiên, phân loại và quan hệ

Hình 1: Phép toán trên các biến cố

Mối quan hệ:


- Hai biến cố A và B xung khắc iff chúng không đồng thời xảy ra trong phép
thử.
- Biến cố đối (ký hiệu A) của biến cố A là biến cố "Không xảy ra biến cố A".
- Hai biến cố A và B là độc lập nếu việc xảy ra hay không xảy ra của biến cố
này không làm thay đổi khả năng xảy ra biến cố kia và ngược lại.
X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education
Ngày 9 tháng 10 năm 2021 9 / 42
Xác suất: Định nghĩa và Tính chất

Định nghĩa 5. Xác suất


Xác suất của biến cố A (ký hiệu bởi P (A)) là số đo khả năng xuất hiện
biến cố A trong phép thử.

Dạng cổ điển:

Số biến cố sơ cấp đồng khả năng thuận lợi cho A


P (A) = , (1)
Số biến cố sơ cấp đồng khả năng của phép thử

Dạng thống kê:


m
P (A) = lim , (2)
n→∞ n
Trong đó: m là số lần biến cố A xuất hiện trong n lần thực hiện phép thử.

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 10 / 42
Xác suất: Định nghĩa và Tính chất

Ví dụ 5. 5 đề thi tự luận được đánh số theo thứ tự từ 1 đến 5. Chọn ngẫu


nhiên 1 đề, xác suất để 1 học viên chọn được đề chẵn? Xác suất để học viên
chọn được đề số 2?

Xác suất để học viên chọn được đề chẵn:


2
P (Đề chẵn) = = 0, 4.
5
Xác suất để học viên chọn được đề số 3:
1
P (Đề số 3) = = 0, 2.
5

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 11 / 42
Xác suất: Định nghĩa và Tính chất

Ví dụ 6. The following data which relate to a group of 1000 randomly


selected adults who were asked if they are in favor of abortion or are against
it. The results of this survey is presented in Table 1
Reponse
Gender In favor Against Total
Male 248 203 451
Female 310 239 549
Total 558 442 1000
Bảng 1: Survey frequency distribution (Bayo Lawal et al. (2018)).

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 12 / 42
Xác suất: Định nghĩa và Tính chất

Hình 2: The Role of Probability in Inferential Statistics (Frederick et al.(2013)).

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 13 / 42
Xác suất: Định nghĩa và Tính chất
Một vài tính chất:

P (Φ) = 0; P (Ω) = 1; 0 ≤ P (A) ≤ 1.


P (A) = 1 − P (A).
Nếu A và B là hai biến cố xung khắc thì:

P (A ∪ B) = P (A) + P (B); P (A ∩ B) = 0.

Nếu A1 , A2 , · · · , An là hệ đầy đủ các biến cố thì:


Xn
P( Ai ) = P (Ω) = 1.
i=1

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 14 / 42
Quy tắc tính xác suất: Quy tắc cộng, Quy tắc nhân

Quy tắc cộng xác suất của hợp hai biến cố: A và B là hai biến cố
bất kỳ:
P (A ∪ B) = P (A) + P (B) − P (A ∩ B). (3)
Quy tắc cộng xác suất của hợp n biến cố: A1 , A2 , · · · , An dãy gồm
n biến cố bất kỳ:
n
[ n
X .
X .
X
P( Ai ) = P (Ai ) − P (Ai Aj ) + P (Ai Aj Ak )+
i=1 i=1 1≤i<j≤n 1≤i<j<k≤n
n
\
+ · · · + (−1)n P ( Ai ). (4)
i=1

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 15 / 42
Quy tắc tính xác suất: Quy tắc cộng, Quy tắc nhân

Định nghĩa 6. Xác suất có điều kiện


Xác suất của biến cố A trong điều kiện biến cố B đã xảy ra được gọi là xác
suất của A với điều kiện B.

P (A ∩ B)
P (A/B) = , (5)
P (B)

Chú ý: Nếu A và B độc lập thì: P (A/B) = P (A) và P (B/A) = P (B).


Công thức nhân xác suất

P (A ∩ B) = P (A/B).P (B) = P (B/A).P (A), (6)

Ví dụ 7. Một nhóm có 5 học viên, trong đó có 3 học viên nam và 2 học viên
nữ. Theo thứ tự, cần lựa chọn ngẫu nhiên 2 học viên để đảm nhiệm các công
việc điều hành và truyền thông cho nhóm. Xác suất để cả hai học viên được
chọn đều có giới tính nam bằng bao nhiêu?
X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education
Ngày 9 tháng 10 năm 2021 16 / 42
Quy tắc xác suất đầy đủ, định lý Bayes

Công thức xác suất đầy đủ


Phép thử ngẫu nhiên T có hệ {A1 , A2 , · · · , Am } tạo thành hệ đầy đủ các biến
cố. Biến cố A có thể xảy ra đồng thời với chỉ một trong các biến cố Ai
(i = 1, 2, · · · , m). Khi đó:
m
X
P (A) = P (Ai ).P (A/Ai ), (7)
i=1

Công thức xác suất Bayes


Phép thử ngẫu nhiên T có hệ {A1 , A2 , · · · , Am } tạo thành hệ đầy đủ các biến
cố. Biến cố A có thể xảy ra đồng thời với chỉ một trong các biến cố Ai
(i = 1, 2, · · · , m). Khi đó:

P (Ai ).P (A/Ai ) P (Ai ).P (A/Ai )


P (Ai /A) = = P
m , (8)
P (A)
P (Ai ).P (A/Ai )
i=1

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 17 / 42
Quy tắc xác suất đầy đủ, định lý Bayes

Ví dụ 8. Phân tích sơ bộ kết quả khảo sát 1220 người (433 giáo viên, 787
sinh viên sư phạm) về mức độ chấp nhận sử dụng công cụ hỗ trợ tư duy trong
phát triển cá nhân và nghề nghiệp tại 104 cơ sở giáo dục, đào tạo trên cả
nướca , cho thấy có 171 giáo viên và 191 sinh viên thường xuyên sử dụng công
cụ hỗ trợ tư duy trong phát triển cá nhân và nghề nghiệp. Chọn ngẫu nhiên 1
người vừa tham gia khảo sát:
a) Tính xác suất để người ngày thường xuyên sử dụng công cụ hỗ trợ tư duy
trong phát triển cá nhân và nghề nghiệp.
b) Biết rằng, người vừa chọn thường xuyên sử dụng công cụ hỗ trợ tư duy
trong phát triển cá nhân và nghề nghiệp. Người này thuộc nhóm giáo viên hay
sinh viên sư phạm?
c) Trong số 10 người chọn ngẫu nhiên từ 1220 người, tính xác suất để có ít
nhất 9 người thường xuyên sử dụng công cụ hỗ trợ tư duy trong phát triển cá
nhân và nghề nghiệp.
a Nguồn dữ liệu: Dự án FIRST, http: education.edu.vn

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 18 / 42
Phần II

BIẾN NGẪU NHIÊN & QUY LUẬT PHÂN PHỐI XÁC SUẤT

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 19 / 42
Biến ngẫu nhiên: Khái niệm và Phân loại

Định nghĩa 7. Biến ngẫu nhiên


Biến ngẫu nhiên (b.n.n) là đại lượng mà giá trị của nó được xác định một cách
ngẫu nhiên với một xác suất tương ứng nhất định.
Thường ký hiệu biến ngẫu nhiên bởi các chữ cái viết hoa như: X, Y, Z, · · · ;
giá trị của biến ngẫu nhiên bằng các chữ cái thường: a, b, x, [a, b); [a ; b].

Phân loại biến ngẫu nhiên


Biến ngẫu nhiên rời rạc, ví dụ: Số trang sách bị lỗi, Số người đến giao
dịch tại 1 quầy dịch vụ,....
Biến ngẫu nhiên liên tục, ví dụ: Cân nặng, chiều cao, kết quả học tập,
thời gian để sinh viên thực hiện khóa học, nhiệt độ, doanh thu,....

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 20 / 42
Quy luật phân phối xác suất

Định nghĩa 8. Một số khái niệm


Biến ngẫu nhiên X, hàm phân phối xác suất của X(C.D.F), ký hiệu F (x)
:
F (x) = P {X < x}, ∀x ∈ R, (9)

B.n.n liên tục X, Hàm sống sót của X cho bởi:

S(x) = P {X ≥ x} = 1 − F (x), ∀x ∈ R, (10)

Hàm mật độ xác suất của X (P.D.F), ký hiệu f (x) được cho bởi:
Zx
F (x) = f (u)du, ∀x ∈ R, (11)
−∞

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 21 / 42
Quy luật phân phối xác suất

Định nghĩa 8. Một số khái niệm


Hàm hiểm độ tỷ lệ của X (H.R.F), ký hiệu λ(t) được cho bởi:

P {t < X < t + h|X > t} f (t) −S 0 (t)


λ(t) = lim = = , (12)
h→0 h S(t) S(t)

Hàm hiểm độ tích lũy của X (C.H.F), ký hiệu Λ(t) được cho bởi:

Zt
Λ(t) = λ(u)du = − ln {S(t)}, (13)
0

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 22 / 42
Quy luật phân phối xác suất
Nếu X là b.n.n rời rạc, nhận các giá trị x1 , x2 , · · · với các xác suất tương
ứng P {X = xi } = pi thì:
X
F (x) = pi , ∀x ∈ R.
i: xi <x

Rõ ràng: Phân phối xác suất của bnn rời rạc thỏa mãn 2 điều kiện:
.
X
0 ≤ pi ≤ 1, ∀i, và pi = 1.
i=1

Nếu X là b.n.n liên tục có P.D.F f (t), C.D.F F (t) và F (t) có đạo hàm tại
t thì:
P {t < X < t + h}
f (t) = lim = F 0 (t) = −S 0 (t),
h→0 h
Rõ ràng: P.D.F f (x) của X thỏa mãn: f (x) là hàm không âm với mọi x
+∞
R Rb
và f (t)dt = 1. Hơn nữa: P {a ≤ X ≤ b} = F (b) − F (a) = f (t)dt.
−∞ a

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 23 / 42
Một số đặc trưng cơ bản

Định nghĩa 9. Kỳ vọng, Kỳ vọng hình học


1 Kỳ vọng của b.n.n X, ký hiệu EX là số đặc trưng, phản ánh mức độ tập
trung của phân phối xác suất, nó cho biết trọng tâm của phân phối.
Nếu X là b.n.n rời rạc, nhận các giá trị x1 , x2 , · · · với P {X = xi } = pi :
.
X
EX = xi .pi ,
i≥1

Nếu X là b.n.n liên tục có P.D.F f (t):


Z +∞
EX = t.f (t)dt.
−∞

2 Kỳ vọng hình học Nếu X là b.n.n chỉ nhận các giá trị dương, thì giá trị
kỳ vọng hình học của X, ký hiệu G(X) được cho bởi công thức:


Z +∞
G(X) = exp {E(ln X)} = exp ln x.f (x)dx .
0

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 24 / 42
Một số đặc trưng cơ bản

Định nghĩa 10. Phương sai, Độ lệch chuẩn


1 Phương sai của b.n.n X, ký hiệu DX (hoặc V ar(X)) là số đặc trưng,
phản ánh mức độ phân tán của phân phối xác suất, cho bởi công thức:

V ar(X) = E{(X − EX)2 } = E(X 2 ) − (EX)2 .

Nếu X là b.n.n rời rạc, nhận các giá trị x1 , x2 , · · · với P {X = xi } = pi :


.
X
V ar(X) = (xi − EX)2 pi ,
i≥1

Nếu X là b.n.n liên tục có P.D.F f (t):


+∞
Z
V ar(X) = (t − EX)2 .f (t)dt.
−∞

p
2 Độ lệch chuẩn của b.n.n X: σX = V ar(X).
X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education
Ngày 9 tháng 10 năm 2021 25 / 42
Một số đặc trưng cơ bản

Ví dụ 9.
9.1 Giả sử điểm thi của các sinh viên có phân phối xác suất như sau:
Điểm 3.5 4 5 5.5 6 7 7.5 8 8.5 9
p 0.03 0.05 0.1 0.19 0.25 0.17 0.1 0.07 0.02 0.01
1 Tìm kì vọng, phương sai của X.
2 Thiết lập hàm phân phối F (x) của X.
3 Tìm kì vọng của biến ngẫu nhiên Y = 3X 2 + 2X − 1.
9.2 Biến ngẫu nhiên X có kì vọng EX = 3.2, kì vọng của E(X 2 ) = 11.5. Biến
ngẫu Y nhận được từ X bằng cách nhân các giá trị của X với 0.75. Y có
kì vọng và phương sai bằng?

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 26 / 42
Phân phối rời rạc-Phân phối nhị thức

Phân phối nhị thức, dãy Bernoulli


Dãy n phép thử là dãy Bernoulli nếu thoả mãn:
+/ Là n phép thử độc lập.
+/ Mỗi phép thử chỉ xuất hiện biến cố A hoặc đối lập A.
+/ Xác suất P (A) = p không thay đổi trong mỗi phép thử.
Xác suất biến cố A xuất hiện m lần trong n phép thử Bernoulli:

Pn (m; p) = Cnm pm .(1 − p)n−m .

X là số lần biến cố A xuất hiện trong dãy n phép thử Bernoulli, X có


phân phối nhị thức, kí hiệu X ' B(n, p) với quy luật:

P (X = k) = Cnk pk .(1 − p)n−k , ∀ k = 0, 1, · · · , n.

Nếu X ' B(n, p) thì kì vọng EX = np; phương sai V ar(X) = np(1 − p).

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 27 / 42
Phân phối liên tục, phân phối chuẩn

Phân phối chuẩn


1 x2
X ' N (0, 1) có mật độ: ϕ(x) = √ .e− 2 ; Hàm phân phối:

1 R x − u2
Φ(x) = √ . −∞ e 2 du.

1 (x−µ)2
X ' N (µ, σ 2 ) có mật độ: f (x) = √ .e− 2σ2 .
σ. 2π

Đối xứng qua x = µ.


0.5

N(2, 0.9)
N(3, 0.9) Có Mean ≡ Mode ≡ Median = µ.
0.4

N(3, 1.5)
Probability distribution function

Phương sai DX = σ 2 .
0.3

Thoải dần về hai phía, hai đuôi


không cắt trục hoành.
0.2

Lưu ý:
0.1

X −µ
0.0

−2 0 2 4 6 8
X ' N (µ, σ 2 ) ⇐⇒ ' N (0, 1).
σ
x
X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education
Ngày 9 tháng 10 năm 2021 28 / 42
Một số phân phối thường sử dụng

Phân phối chuẩn X ' N (µ, σ 2 )


b − µ a − µ
Khi đó: P {a ≤ X ≤ b} = Φ −Φ
σ σ
X − µ
Nếu X ' N (µ, σ 2 ) ⇐⇒ ' N (0, 1), do đó: người ta thường sử
σ
X −X
dụng zscore = để tìm vị trí tương đối của các điểm số trong một
σ
phân bố đồng thời so sánh với các phân bố có phương sai (độ lệch chuẩn)
khác nhau.

P {µ ≤ X ≤ µ + σ} = 34.13%.
P {µ + σ ≤ X ≤ µ + 2σ} = 13.59%.
P {X ≥ µ + 2σ} = 2.28%.
Quy tắc 2σ:
P {| X − µ |< 2σ} = 95.44%.
Hình 3: The normal distribution following a Quy tắc 3σ:
zscore transformation (Frederick J. G. et all.
(2013))
P {| X − µ |< 3σ} = 99.74%.
X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education
Ngày 9 tháng 10 năm 2021 29 / 42
Một số phân phối thường sử dụng

Ví dụ 10. Về phân phối chuẩn Điểm thi SAT tuân theo luật phân phối chuẩn
với kỳ vọng µ = 500, độ lệch chuẩn σ = 100a .
Tính xác suất để 1 người dự thi có điểm lớn hơn 700.
Trong số 1000 người dự thi, có bao nhiêu người có điểm lớn hơn 700 là có
khả năng nhất?
a Frederick J. G. et all. (2013)

Tìm giá trị ngoại biên bằng phân phối chuẩn


B.n.n X có phân phối chuẩn với trung bình µ, độ lệch σ, giá trị x0 là ngoại
biên nếu:
|x0 − µ|
z0 = > 3.
σ

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 30 / 42
Một số phân phối thường sử dụng

1 Tính xác suất để 1 người dự thi có điểm lớn hơn 700?


Câu hỏi trên tương đương với:
Trong số 1000 người dự thi,
tỷ lệ thí sinh đạt điểm SAT
lớn hơn 700 chiếm bao nhiêu %.
Chuyển đổi tỷ lệ thí sinh có điểm
lớn hơn 700 sang zscore , có

700 − 500
zscore = = 2.
100

Hình 4: The distribution of SAT zscore Điểm SAT 700 nằm ở vị trí 2
described in Ex 10.2
độ lệch so với trung bình

P (X > 700) = P (z > 2) = 2.28%

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 31 / 42
Một số phân phối thường sử dụng

Hình 5: Bảng phân phối chuẩn hóa N (0, 1)

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 32 / 42
Phân phối liên tục-Phân phối χ2n

Phân phối χ2n


Giả sử X1 , X2 , · · · , Xn là n biến ngẫu nhiên độc lập, có cùng phân phối
n
Xi2 tuân theo luật phân phối χ2 với n bậc tự do, ký
P
N (0, 1). Khi đó: X =
i=1
hiệu X ' χ2n hoặc X ' χ2 (n).
0.5

n=2 Sử dụng trong kiểm định phù hợp


n=1
khi-bình phương để kiểm tra sự phù
0.4

n=4
Probability distribution function

n=6
n=9
hợp của một phân phối thực nghiệm
0.3

với phân phối lý thuyết;


Sử dụng để tìm các khoảng tin cậy
0.2

cho phương sai hoặc độ lệch chuẩn


0.1

của các biến ngẫu nhiên có phân


phối chuẩn.
0.0

0 2 4 6 8

x
X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education
Ngày 9 tháng 10 năm 2021 33 / 42
Phân phối liên tục-Phân phối Student

Phân phối Student (Phân phối t)


Giả sử X ' N (0, 1) và Y ' χ2n , khi đó, biến ngẫu nhiên

X
T =p ,
Y /n

tuân theo luật phân phối Student với n bậc tự do, ký hiệu T ' tn .

n=0.5
0.4

n=2
n=5
Probability distribution function

n=300
0.3

Sử dụng trong tìm ước lượng khoảng cho


kỳ vọng trong trường hợp phương sai chưa
0.2

biết.
0.1
0.0

−4 −2 0 2 4
X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education
Ngày 9 tháng 10 năm 2021 34 / 42
Phân phối liên tục-Phân phối mũ

Phân phối Mũ (E(λ))


B.n.n X có phân phối mũ, ký hiệu X ' E(λ) nếu X có mật độ:
1 − −t
f (t) = e λ, ∀t ≥ 0, λ > 0.
λ
Là mô hình quan trọng nhất trong
phân tích sống sót.
E(2) Được sử dụng trong việc đánh giá
2.0

E(0.5)
E(1)
quá trình sản xuất và cung cấp dịch
Probability distribution function

vụ.
1.5

Ứng dụng rộng rãi trong lý thuyết về


1.0

hàng chờ để mô hình hóa độ dài


khoảng thời gian trôi qua giữa các
0.5

lần xảy ra sự kiện, ví dụ: Thời gian


0.0

giữa những lần xe tải vào bến; thời


0 1 2 3 4 5

x
gian giữa những lần giao dịch tại
một quầy hàng,...
X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education
Ngày 9 tháng 10 năm 2021 35 / 42
Tóm tắt chủ đề 2

Xác suất của biến cố ngẫu nhiên và các tính chất


Công thức tính xác suất đầy đủ, công thức Bayes
Biến ngẫu nhiên
Quy luật phân phối xác suất của B.n.n
Một số đặc trưng và ý nghĩa
Một số quy luật phân phối thường sử dụng

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 36 / 42
Phần III

BÀI TẬP THỰC HÀNH

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 37 / 42
Bài tập thực hành

1 Hai kẻ trộm đeo mặt nạ, bị cảnh sát đuổi bắt, bèn vứt mặt nạ đi và trà
trộn vào đám đông. Cảnh sát bắt giữ toàn bộ đám đông, tổng cộng 60
người và sử dụng máy phát hiện nói dối để điều tra xem ai trong đám
đông là kẻ trộm. Biết rằng, đối với kẻ trộm, xác suất bị máy nghi là có tội
là 85%, còn đối với người vô tôi, xác suất để bị máy nghi thành có tội là
7%. Gọi ngẫu nhiên 1 người trong số đó để kiểm tra bằng máy phát hiện
nói dối,
Tính xác suất để người này bị máy nghi là có tội.
Biết rằng người vừa kiểm tra bị máy nghi là có tội, tính xác suất để người
này là kẻ trộm.
2 Cho X là biến ngẫu nhiên có phân phối chuẩn với kỳ vọng bằng 100, độ
lệch chuẩn 15. Tính các xác suất sau:
P (X < 120).
P (80 < X < 120).
P (X > 125).

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 38 / 42
Bài tập thực hành

3 Phân phối gốc score của một kỳ thi có trung bình µ = 57 và độ lệch
chuẩn σ = 14. Người kiểm tra chuyển sang sử dụng một phân phối score
mới có điểm trung bình bằng 50, độ lệch chuẩn 10 để tiện so sánh các thí
sinh. Hãy cho biết điều gì xảy ra với hai thí sinh A và B, biết điểm score
gốc của hai thí sinh này tương ứng bằng 64 và 43?
4 Điểm thi môn văn tuân theo phân bố lệch dương với trung bình µ = 40 và
độ lệch chuẩn σ = 10. Tính xác suất để một thí sinh có điểm lớn hơn 45.
5 Điểm Toán trong kỳ thi SAT tuân theo phân bố chuẩn với trung bình
500, độ lệch chuẩn 100. Nếu một trường đại học chỉ tuyển những thí sinh
nằm trong Top 60% sinh viên được điểm cao nhất thì điểm tối thiểu sinh
viên cần đạt được là bao nhiêu để có thể nhập học?

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 39 / 42
Bài tập thực hành

5 Cho hai phân bố chuẩn với các trung bình và độ lệch chuẩn như sau:
Phân bố A: Trung bình bằng 50, độ lệch chuẩn bằng 10.
Phân bố B: Trung bình bằng 100, độ lệch chuẩn bằng 15.
Hỏi:
a Nếu một thí sinh có điểm số là 70 trong phân bố A thì zscore tương ứng
bằng bao nhiêu?
b Có bao nhiêu phần trăm thí sinh trong phân bố A có điểm số giữa 50 và
70?
c Nếu điểm số là 70 trong phân bố B, hãy trả lời hai câu hỏi trên.
6 Dưới đây là kết quả thi của học sinh Nam:
Môn thi Điểm thi của Nam Trung bình Độ lệch chuẩn
Ngữ văn 68 70.2 5.1
Toán 84 78 4.1
Khoa học xã hội 82 78 7.2
Chuyển đổi điểm của thí sinh Nam ra zscore .
Thí sinh Nam làm tốt môn nào nhất? Yếu môn nào nhất?

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 40 / 42
Bài tập thực hành
7 Giả sử điểm các môn thi Toán học; Ngữ văn; Ngoại ngữ của kỳ thi
THPTQG năm 2019 tuân theo quy luật chuẩn. Bảng sau cho biết trung
bình, độ lệch chuẩn và điểm thi của ba thí sinh A, B, C cùng có tổng
điểm bằng 20.00 điểm:

Môn thi Trung bình Độ lệch chuẩn Thí sinh A Thí sinh B Thí
Toán học 5.64 1.73 9.60 9.60 9
Ngữ văn 5.48 1.33 5.00 6.00 4
Ngoại ngữ 4.35 1.81 5.40 4.40 6
Nguồn: Bộ Giáo dục & Đào tạo, 2019.
1. Ba thí sinh A, B, C có năng lực tương đương nhau không?
2. Một trường Đại học X tuyển sinh theo tổ hợp ba môn Toán học, Ngữ
văn, Ngoại ngữ và chỉ tuyển những thí sinh nằm trong top 35% thí sinh
có tổng điểm ba môn cao nhất. Hỏi: Ba thí sinh A, B, C với số điểm như
trên có trúng tuyển vào trường X không?
Biết rằng, tổng điểm ba môn Toán học, Ngữ văn, Ngoại ngữ tuân theo
quy luật chuẩn với trung bình 15.75 điểm; độ lệch chuẩn 3.83 điểm.

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 41 / 42
MANY THANKS FOR YOUR ATTENTION

X. Q. TRAN (QMF, UEd) Introduction of Applied Statistics in Education


Ngày 9 tháng 10 năm 2021 42 / 42

You might also like