Chuong 3 Mot So Phan Phoi Thong Dung

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 40

Chương 3: Một số phân phối xác suất thông

dụng

Phan Thị Khánh Vân

E-mail: khanhvanphan@hcmut.edu.vn

Ngày 19 tháng 2 năm 2022

(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 1 / 40
Nội dung

1 Phân phối Bernoulli

2 Phân phối nhị thức

3 Phân phối Poisson

4 Phân phối đều

5 Phân phối mũ

6 Phân phối chuẩn. Định lý giới hạn trung tâm

(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 2 / 40
Phân phối Bernoulli
Biến ngẫu nhiên (BNN) X được gọi là biến ngẫu nhiêu Bernoulli nếu nó nhận
giá trị 1 với xác suất p và giá trị 0 với xác suất q = 1 − p. Ký hiệu: X ∼ B(1, p).

Kỳ vọng và phương sai


Nếu X ∼ B(1, p), ta có:
µ = E(X ) = p, σ 2 = V(X ) = p(1 − p).

Ví dụ
Một cỗ máy sản xuất ra sản phẩm với tỉ lệ 1% phế phẩm. Số phế phẩm tạo ra
trong một lần sản xuất là một biến ngẫu nhiêu Bernoulli với tham số p = 0.01.
E(X ) = 0.01
V(X ) = 0.01 × 0.99 = 0.0099.

(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 3 / 40
Ví dụ về phân phối nhị thức

1 Tung đồng xu 3 lần. X = số mặt sấp thu được.


2 Một cỗ máy sản xuất ra sản phẩm với tỉ lệ 1% phế phẩm. X = số phế phẩm
thu được trong 25 lần sản xuất.
3 Mỗi mẫu không khí có xác suất 10% chứa một loại khí hiếm. X = số mẫu
chứa loại khí hiếm này trong 18 mẫu được phân tích.
4 Một đề trắc nghiệm chứa 25 câu hỏi, một sinh viên chọn ngẫu nhiên đáp án
của các câu hỏi này. X = số câu trả lời đúng.
5 Xét 20 em bé được sinh ra trong bệnh viên, X = số lượng bé gái.

(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 4 / 40
Phân phối nhị thức
Làm một thí nghiệm ngẫu nhiên với n phép thử Bernoulli:
1 Các phép thử là độc lập
2 Kết quả của mỗi phép thử: "thành công" hay "thất bại".
3 Xác suất của "thành công" trong mỗi phép thử là như nhau, ký hiệu là p.
BNN X : số phép thử thành công trong n phép thử là một BNN theo phân phối
nhị thức, với tham số 0 < p < 1 và n = 1, 2, · · · . KH: X ∼ B(n, p).
Hàm xác suất (PMF) của X là
f (x) = P(X = x) = Cnx p x (1 − p)n−x , x = 0, 1, , · · · , n
n
P
X = Xi với Xi là BNN Bernoulli: số "thành công" trong phép thử thứ i.
i=1

Ví dụ
Tung một đồng xu 3 lần biết đồng xu này không cân bằng,
P(S) = 0.6, P(N) = 0.4. Gọi X là số mặt sấp thu được.
x 0 1 2 3
P(x) 0.43 = 0.064 C31 0.42 0.6 = 0.288 C32 0.62 0.4 = 0.432 0.63 = 0.216
(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 5 / 40
Ví dụ về truyền dữ liệu trong một kênh kỹ thuật số
Một bit được truyền trong một kênh kỹ thuật số với xác suất xảy ra lỗi là 0.1. Giả
sử sự truyền dữ liệu là độc lập giữa các bit. Gọi X là số bit bị lỗi khi truyền đi 4
bit. Tìm phân phối xác suất của X .
X 0 1 2 3 4
P(x) 0.6561 0.2916 0.0486 0.0036 0.0001

Kỳ vọng và phương sai


Nếu X ∼ B(n, p), ta có
µ = E(X ) = np, σ 2 = V(X ) = np(1 − p).

Ví dụ về truyền dữ liệu
Gọi X là số bit bị lỗi khi truyền đi 4 bit.
Số bit bị lỗi trung bình là: E(X ) = 0.4.
Phương sai: V(X ) = 0.36

(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 6 / 40
(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 7 / 40
Ví dụ
Một đề trắc nghiệm có 25 câu hỏi, mỗi câu hỏi có 4 đáp án. Một sinh viên chỉ
chọn ngẫu nhiên đáp án cho các câu hỏi. Tìm xác suất để (a) sinh viên đó trả lời
đúng hơn 20 câu.
(b) sinh viên đó trả lời đúng ít hơn 5 câu.

Gọi X là số câu trả lời đúng. X là một BNN theo phân phối nhị thức với tham số
p = 0.25, n = 25.
(a) Xác suất để sinh viên đó trả lời đúng hơn 20 câu: P(X > 20)
= P(X = 21) + P(X = 22) + P(X = 23) + P(X = 24) + P(X = 25)
21
= C25 .0.2521 0.754 +C25
22
.0.2522 0.753 +C25
23
.0.2523 0.752 +C25
24
.0.2524 0.751
25
+C25 .0.2525 = 9.6769.10−10 .
(b) Xác suất để sinh viên đó trả lời đúng ít hơn 5 câu là: P(X < 5)
= P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4)
0
= C25 .0.7525 +C25
1
.0.251 0.7524 +C25
2
.0.252 0.7523 +C25
3
.0.253 0.7522
4
+C25 .0.254 0.7521 = 0.2137.

(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 8 / 40
Quá trình ngẫu nhiên

Trong cuộc sống ta thường quan sát các biến ngẫu nhiên trong một khoảng thời
gian. Ví dụ S(t) - giá cổ phiếu với thời gian t ∈ [0, ∞). Tại một thời điểm t∗ ,
S(t∗ ) là một BNN S(t), t ∈ [0, ∞) - quá trình ngẫu nhiên.

Quá trình ngẫu nhiên


Một quá trình ngẫu nhiên là tập hợp của các biến ngẫu nhiên thông thường được
đánh số bằng thời gian.
(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 9 / 40
Quá trình ngẫu nhiên thời gian liên tục và rời rạc
Một quá trình ngẫu nhiên liên tục là một quá trình {X (t), t ∈ J}, với J là
một đoạn trên tập số thực, ví dụ [−1, 1], [0, ∞), (−∞, ∞)....
Một quá trình ngẫu nhiên rời rạc là một quá trình {X (n) = Xn , n ∈ J}, với J
là một tập đếm được, ví dụ N hoặc Z...

Gọi N(t) ∈ {0, 1, 2...} là số khách hàng ghé một nhà băng trong một khoảng
thời gian từ 9 giờ sáng tới thời điểm t t ∈ [9, 16] - Qúa trình NN liên tục.
Gọi W (t) ∈ R là điện áp nhiễu nhiệt được tạo ra trên một điện trở trong
mạch điện tại thời điểm t, với t ∈ [0, ∞) - liên tục.
Gọi X (tn ) = Xn ∈ [25, 39] là nhiệt độ của TP HCM vào ngày thứ n của
tháng năm: n = 1, 2, 3....31 - rời rạc.

(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 10 / 40
(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 11 / 40
Quá trình Poisson

Quá trình Poisson


Thường được sử dụng trong các tình huống mà chúng ta đang đếm số lần xuất
hiện của một số sự kiện nhất định dường như xảy ra với một tỷ lệ nhất định,
nhưng hoàn toàn ngẫu nhiên.

Ví dụ:
Số lần động đất trong một khu vực với tỷ lệ λ = 2 lần 1 tháng và thời điểm
xảy ra động đất hoàn toàn là ngẫu nhiên.
Số vụ tai nạn ô tô xảy ra trong một khu vực
Số yêu cầu cho từng tài liệu trên một máy chủ
Số lần bùng nổ chiến tranh the outbreak of wars;
Số photon trên di-ốt quang

(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 12 / 40
Biến ngẫu nhiên Poisson
Một BNN X là số sự kiện xảy ra trong một khoảng có độ dài T trong 1 quá trình
Poisson với tần suất trung bình xảy ra sự kiện λ > 0 được gọi là một BNN
Poisson.
1 (Tính đồng nhất) Tỉ lệ λ mà các sự kiện xảy ra là không đổi theo thời gian:
trong khoảng có độ dài T , kỳ vọng của số sự kiện xảy ra là λT .
2 (Tính độc lập) Số lượng sự kiện xảy ra trong các khoảng rời nhau là các biến
ngẫu nhiên độc lập.
Ký hiệu: X ∼ Poisson(λT ). Hàm xác suất của BNN Poisson có dạng
e −λT (λT )x
f (x) = P(X = x) = , x = 0, 1, 2...
x!

Kỳ vọng và phương sai


Nếu X là một BNN Poisson trên khoảng T với tần suất λ, thì
µ = E(X ) = λT , σ 2 = V(X ) = λT .

(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 13 / 40
Ví dụ 1
Số lượng cuộc gọi đến một tổng đài điện thoại thường được mô phỏng như một
biến ngẫu nhiên Poisson. Giả sử rằng trung bình có 10 cuộc gọi mỗi giờ.
a) Xác suất để có đúng 5 cuộc gọi trong một giờ là bao nhiêu?
b) Xác suất để có tối đa 3 cuộc gọi trong một giờ là bao nhiêu?
c) Xác suất để có đúng 15 cuộc gọi trong 2 giờ là bao nhiêu?
d) Xác suất để có đúng 5 cuộc gọi trong 30 phút là bao nhiêu?

Gọi X là số cuộc gọi trong T giờ. Ta có λ = 10.


e −10 105
a) T = 1: P(X = 5) = 5! = 0.0378.
b) T = 1: P(X ≤ 3) = P(X = 0)+ P(X = 1) + P(X = 2) + P(X = 3)
0
101 102 103
= e −10 10
0! + 1! + 2! + 3! = 0.0103.
e −20 2015
c) T = 2, P(X = 15) = 15! ≈ 0.0516.
e −5 55
d) T = 0.5, P(X = 5) = 5! ≈ 0.1755.

(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 14 / 40
Ví dụ 2
Các nhà thiên văn coi số lượng ngôi sao trong một thể tích không gian nhất định
là một biến ngẫu nhiên Poisson. Mật độ trong Thiên hà Milky Way trong vùng lân
cận của hệ mặt trời của chúng ta là một ngôi sao trên 16 khối năm ánh sáng.
a) Xác suất để ít nhất 2 ngôi sao trong 16 khối năm ánh sáng là bao nhiêu?
b) Phải xem xét bao nhiêu khối năm ánh sáng khối trong không gian để xác
suất có ít nhất một ngôi sao xuất hiện vượt quá 0.95?

a) Gọi X là số ngôi sao xuất hiện trong 16 khối năm ánh sáng. λ = 1.
e −1 10 e −1
T = 1: P(X ≥ 2) 1 − P(X = 0) − P(X = 1) = 1 − 0! − 1! = 0.2642.
b) Gọi N là số khối năm ánh sáng cần quan sát, và X là số ngôi sao xuất hiện
N
trong vùng này. Ta có: T = 16 .
Ta có P(Y ≥ 1) > 0.95 ⇔ 1 − P(Y = 0) > 0.95
−N
⇔ P(Y = 0) = e −1.T = e 16 ≤ 0.05
⇔ N ≥ −16 ln 0.05 = 47.9317 (khối năm ánh sáng).

(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 15 / 40
Ví dụ 3
Số lượng khách hàng đến cửa hàng tạp hóa có thể được mô hình hóa bằng quy
trình Poisson với tần suất λ = 10 khách hàng mỗi giờ.
a) Tìm xác suất để có 2 khách hàng trong khoảng từ 10 : 00 đến 10 : 20.
b) Tìm xác suất để có 3 khách hàng trong khoảng từ 10 : 00 đến 10 : 20 và 7
khách hàng trong khoảng từ 10 : 20 đến 11 : 00.

λ = 10, Gọi 2 khoảng I1 : 10 : 00 − 10 : 20, I2 : 10 : 20 − 11 : 00. Độ dài của từng


khoảng T1 = 13 , T2 = 2
3 giờ. Gọi X và Y tương ứng là số khách hàng đến trong 2
khoảng thời gian I1 và I2 . Vì I1 và I2 là 2 khoảng rời nhau, ta có X , Y là 2 BNN
Poisson độc lập.
−10
2
e 3 ( 10
3 )
a) P(X = 2) = 2! = 0.1982
−10 −20
3 7
e 3 ( 10
3 ) e 3 ( 20
3 )
b) P(X = 3, Y = 7) = P(X = 3).P(Y = 7) = 3! . 7! = 0.0325.

(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 16 / 40
Tổng của các BNN Poisson độc lập
Xét 2 BNN Poisson độc lập X1 ∼ Poisson(µ), X2 ∼ Poisson(ν). Ta có tổng của 2
BNN này Y = X1 + X2 cũng là một BNN Poisson:
Y ∼ Poisson(µ + ν).

Tổng quát: Xét n BNN Poisson độc lập:


X1 ∼ Poisson(µ1 ), X2 ∼ Poisson(µ2 )..., Xn ∼ Poisson(µn ) thì:
n
P n
P
Xi ∼ Poisson( µi ).
i=1 i=1

Ví dụ
Số lượng khách hàng đến cửa hàng tạp hóa có thể được mô hình hóa bằng quy
trình Poisson với tần suất λ = 10 khách hàng mỗi giờ.
Số khách hàng trong khoảng từ 10 : 00 đến 10 : 10 là: X1 ∼ Poisson(λT1 = 35 ).
Số khách hàng trong khoảng từ 10 : 10 đến 10 : 30 là: X2 ∼ Poisson(λT2 = 103 ).
Ta có X = X1 + X2 là số khách hàng đến cửa hàng 10 : 00 đến 10 : 30 cũng là
một BNN X ∼ Poisson( 53 + 10 3 = 5).

(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 17 / 40
Xấp xỉ BNN nhị thức bằng BNN Poisson

Định lý
Cho X ∼ B(n, p), ta có: E(X ) = np. Nếu p → 0 và np → µ khi n → ∞ thì
µx
lim P(X = x) = e −µ .
n→∞ x!
Khi p rất nhỏ và n khá lớn ta có thể xấp xỉ X bởi BNN Poisson(np).

Ví dụ
Một tổng đài nội bộ của một cơ quan phục vụ 100 máy điện thoại. Xác suất để
trong một phút mỗi máy điện thoại gọi đến tổng đài là p = 0.02. Bằng cách tính
trực tiếp và bằng xấp xỉ phân phối Poisson hãy tính xác suất để trong một phút
có 3 máy gọi đến tổng đài.

Gọi X là số máy gọi đến tổng đài trong vòng một phút. Ta có: X ∼ B(100, 0.02).
3
Tính trực tiếp: P(X = 3) = C100 0.023 .0.9897 = 0.1823.
3
Dùng PP Poisson: X ≈ Poisson(np = 2): P(X = 3) = e −2 . 23! = 0.1804.
(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 18 / 40
Phân phối đều liên tục

Phân phối đều liên tục


Một BNN đều liên tục X (KH: X ∼ U(a, b)) là một biến ngẫu nhiên liên tục với
hàm mật độ xác suất và hàm phân phối xác suất là:
( 
1
PDF: f (x) = b−a , a ≤ x ≤ b,
. 0
 x < a,
0, x < a or x > b CDF: F (x) = x−a
b−a , a ≤ x ≤ b,

1, x >b

Kỳ vọng và phương sai


(a+b) (b−a)2
µ = E(X ) = 2 , σ2 = 12

(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 19 / 40
Ví dụ 1
Một tin nhắn e-mail sẽ đến vào một thời điểm có phân phối đều giữa 9 : 00 và
11 : 00. Bạn kiểm tra e-mail lúc 9 : 15 và cứ sau 30 phút sau đó.
a) Tính độ lệch chuẩn của thời gian đến (tính bằng phút).
b) Tìm xác suất để tin nhắn đến tối đa 10 phút trước khi bạn xem nó?
c) Tìm xác suất để tin nhắn đến tối thiểu 15 phút trước khi bạn xem nó?

Gọi X là thời gian


qmà tin nhắn
q đến.
√ (11−9)2
a) σ= V = 12 = 13 (hour).
1
b) PDF: f (x) = b−a = 0.5 Xác suất để tin nhắn đến tối đa 10 phút trước khi
bạn xem nó:
P(9 : 05 ≤ X ≤ 9 : 15) + P(9 : 35 ≤ X ≤ 9 : 45)
+P(10 : 05 ≤ X ≤ 10 : 15) + P(10 : 35 ≤ X ≤ 10 : 45)
= 4 · 0.5 · 16 ) = 0.3333
c) Xác suất để tin nhắn đến tối thiểu 15 phút trước khi bạn xem nó:
P(9 : 15 ≤ X ≤ 9 : 30) + P(9 : 45 ≤ X ≤ 10 : 00) + P(10 : 15 ≤ X ≤ 10 : 30)
1
= 0.5 · 3 · 4 = 0.375
(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 20 / 40
Ví dụ 2
Thể tích của các chai dầu gội đầu trong một thùng chứa được phân bố đều trong
khoảng từ 374 đến 380 ml.
a) Giá trị trung bình và độ lệch chuẩn của thể tích dầu gội đầu?
b) Tính xác suất để một chai dầu gội đầu chứa ít hơn so với số được quảng cáo
là 375 ml.
c) Tính thể tích mà 95% các chai dầu gội đầu chứa nhiều hơn lượng này.
d) Mỗi ml dầu gội đầu tốn $0.002. Phần dầu gội nhiều hơn 375 ml trong mỗi
chai là chi phí tăng thêm của nhà sản xuất. Tính chi phí tăng thêm trung
bình.

a) Gọi thể tích dầu gội trong mỗi chai là X . Ta có X ∼ U(374, 380).
p √
E(X ) = a+b
2 = 377. σ = V(x) = √ b−a
12
= 3.
R 375
b) P(X < 375) = 374 dt6 = 16 .
R 380
c) P(X > x0 ) = x0 dt6 = 0.95 ⇔ 380−x 6
0
= 0.95 ⇔ x0 = 374.3 (ml)
d) Chi phí tăng thêm trung bình:
C = (E(X ) − 375) · 0.002 = ( 374+380
2 − 375) · 0.002 = 0.004($)
(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 21 / 40
Phân phối mũ
Khoảng cách giữa 2 sự kiện liên tục trong một quá trình Poisson với tần suất
trung bình λ > 0 trên một đơn vị khoảng được gọi là một BNN X theo phân
phối mũ với tham số λ. Ký hiệu: X ∼ E (λ).
Hàm mật độ xác suất và hàm phân phối xác suất của X là
−λx
PDF: f (x) = λe
Rx , for 0 ≤ x < ∞
CDF: F (x) = 0 f (t)dt = 1 − e −λx .

Kỳ vọng và phương sai


µ = E (X ) = λ1 , σ 2 = V (X ) = 1
λ2

Tính không nhớ


Nếu BNN X có phân phối mũ với tham số λ, thì X là một BNN không nhớ, có
nghĩa là

P(X > x + a X > a) = P(X > x), với a, x ≥ 0

(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 22 / 40
Ví dụ 1
Trong một mạng máy tính lớn, người dùng đăng nhập vào hệ thống có thể được
mô hình hóa như một quá trình Poisson với trung bình 25 đăng nhập mỗi giờ. Xác
suất để không có lần đăng nhập nào trong khoảng thời gian sáu phút là bao
nhiêu?

Gọi X là thời gian tính bằng giờ kể từ khi bắt đầu khoảng thời gian cho đến lần
đăng nhập đầu tiên. Khi đó X có phân phối mũ với λ = 25 đăng nhập mỗi giờ.
Đơn vị thời gian: giờ, 6 phút = 0.1 giờ.
R∞
Do đó, P(X > 0.1) = 25e −25x dx = e −25(0.1) = 0.082.
0.1
Có thể sử dụng hàm phân phối xác suất:
P(X > 0.1) = 1 − P(X ≤ 0.1) = 1 − F (0.1) = e −25(0.1) = 0.082.
Nếu sử dụng PP Poisson: Gọi Y là số lần đăng nhập trong 6 phút.
0
P(Y = 0) = e −25.(0.1) 2.5
0! = 0.082.

(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 23 / 40
Ví dụ 2
Trình thu thập thông tin web cần ước tính tần suất thay đổi các trang Web để
duy trì chỉ mục hiện tại cho các tìm kiếm trên Web. Giả sử rằng các thay đổi của
một trang Web tuân theo quá trình Poisson xảy ra sau trung bình 3.5 ngày.
a) Tính xác suất để lần thay đổi tiếp theo xảy ra trong vòng 2 ngày tới.
b) Tính xác suất để lần thay đổi tiếp theo xảy ra ít nhất sau 7 ngày.
c) Tìm thời gian để xác suất lần thay đổi kế tiếp xảy ra sau thời gian này là 90%.
d) Tính xác suất để thay đổi tiếp theo xảy ra trong vòng 10 ngày tới, biết rằng
nó chưa xảy ra sau 3 ngày?
−x
1
X - thời gian (ngày) đến lần thay đổi kế tiếp. λ = 3.5 . CDF: F (x) = 1 − e 3.5
a) P(X ≤ 2) = F (2) = 0.4353.
b) P(X > 7) = 1 − P(X ≤ 7) = 1 − F (7) = 0.1353
−x0
c) P(X > x0 ) = 1 − P(X ≤ x0 ) = e = 0.9 ⇒ x0 = −3.5 ln 0.9 = 0.3688
3.5

F (10) − F (3)
P(3<X ≤10)
d) P(X ≤ 10|X > 3) = =
P(X >3) = 0.8647.
1 − F (3)
Có thể sử dụng tính không nhớ:
7
P(X ≤ 10|X > 3) = P(X ≤ (10 − 3)) = F (7) = 1 − e − 3.5 = 0.8647.
(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 24 / 40
Phân phối chuẩn

Phân phối chuẩn là 1 quy luật phân phối rất thường gặp vì có nhiều phân bố xác
suất trong tự nhiên và trong thực tế đời sống có hình dáng khá giống phân phối
chuẩn.
Trong công nghiệp, người ta đã xác định được rằng kích thước của các chi
tiết do các nhà máy sản xuất ra sẽ có phân phối chuẩn nếu quá trình sản
xuất diễn ra bình thường.
Trong nông nghiệp, năng suất của cùng một loại cây trồng tại các thửa
ruộng khác nhau cũng có phân phối chuẩn.
Các chỉ số về thể lực và trí tuệ con người: chiều cao, chỉ số IQ... cũng tuân
theo phân phối chuẩn.

(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 25 / 40
Phân phối chuẩn

Biến ngẫu nhiên X với hàm mật độ xác suất


−(x−µ)2
f (x) = √1 e 2σ 2 , −∞ < x < ∞
2πσ

được gọi là một BNN theo phân phối chuẩn với tham số µ (hữu hạn), và
σ 2 > 0. Ký hiệu: X ∼ N(µ, σ 2 ).

Kỳ vọng và phương sai


E(X ) = µ, V(X ) = σ 2 .

(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 26 / 40
Ví dụ
Giả sử rằng cường độ dòng điện trong một dải dây tuân theo phân phối chuẩn với
giá trị trung bình là 10 miliampe và phương sai là 4 (miliampe2 ). Tính xác suất
mà cường độ dòng điện vượt quá 13 miliampe.

X - cường độ dòng điện (mA).


1
R∞ −(x−10)2
P(X > 13) = √2π.2 e 2.4 dx
13
≈ 0.0668.

Phân phối chuẩn tắc


Một BNN phân phối chuẩn với µ = 0, σ 2 = 1 được gọi là một BNN theo phân
phối chuẩn tắc. KH: Z ∼ N(0, 1). Hàm phân phối xác suất: Φ(z) = P(Z ≤ z).
Mức phân vị α (trên): zα , với P(Z > zα ) = α.

X −µ
Xét BNN phân phối chuẩn X ∼ N(µ, σ 2 ). Sử dụng phép đổi biến Z = σ , ta
có E(Z ) = 0, V(Z ) = 1 : Z ∼ N(0, 1) : BNN phân phối chuẩn tắc.
(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 27 / 40
Bảng hàm phân phối xác suất của phân phối chuẩn tắc Φ(z).

(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 28 / 40
(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 29 / 40
Ví dụ 1
Giả sử rằng cường độ dòng điện trong một dải dây tuân theo phân phối chuẩn với
giá trị trung bình là 10 miliampe và phương sai là 4 (miliampe2 ). Tính xác suất
mà cường độ dòng điện vượt quá 13 miliampe.
X −µ X −10
X - cường độ dòng điện (mA). Đổi biến: Z = σ = 2 ∼ N(0, 1).
P(X > 13) = P(Z > 1.5) = 1 − P(Z ≤ 1.5) = 1 − Φ(1.5) ≈ 0.0668.

Ví dụ 2
Thời gian sử dụng cho đến khi sạc lại pin trong máy tính xách tay trong các điều
kiện thông thường tuân theo phân phối chuẩn với giá trị trung bình là 260 phút
và độ lệch chuẩn là 50 phút.
a. Tìm xác suất để pin kéo dài hơn bốn giờ.
b. Tìm thời gian mà thời gian pin kéo dài hơn mức này với xác suất 75%.
X −µ X −260
a. X ∼ N(260, 502 ) - thời gian sử dụng của pin. Z = σ = 50 ∼ N(0, 1).
P(X ≥ 240) = P(Z ≥ −0.4) = 1 − Φ(−0.4) ≈ 1 − 0.3446 = 0.6554.
X0 −260
b. P(X > X0 ) = P(Z > zα = 50 ) = 1 − Φ(zα ) = 0.75 (= α).
Tra bảng: zα = −0.67. Thời gian cần tìm: X0 = 260 − 50 × 0.67 = 226 (phút).
(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 30 / 40
Ví dụ 3
Khối lượng của một đôi giày chạy bộ thường được phân bố chuẩn= với mức trung
bình là 12 ounce và độ lệch chuẩn là 0.5 ounce.
a) Tìm xác suất để một chiếc giày nặng hơn 13 ounce.
b) Tìm khối lượng biết 95% số giày nặng hơn giá trị này.
c) Độ lệch chuẩn của trọng lượng phải là bao nhiêu để công ty tuyên bố rằng
99.9% đôi giày của họ nặng dưới 13 ounce?
d) Nếu độ lệch chuẩn vẫn ở mức 0.5 ounce thì khối lượng trung bình phải bằng
bao nhiêu để công ty có thể tuyên bố rằng 99.9% trong tổng số đôi giày nặng
dưới 13 ounce?

Gọi X là khối lượng của đôi giày chạy bộ. σ = 0.5, µ = 12, X ∼ N(12, 0.52 ).
X −µ X −12
Đổi biến: Z = σ = 0.5 ∼ N(0, 1).
a) P(X > 13) = P(Z > 2) = 1 − Φ(2) (tra bảng) = 1 − 0.9773 = 0.0227
X0 −12
b) P(X > X0 ) = P(Z > zα = 0.5 ) = 1 − Φ(zα ) = 0.95 ⇒ Φ(zα ) = 0.05 (tra
bảng) ⇒ zα = −1.64 ⇒ x0 = zα · 0.5 + 12 = 11.18.
1 1 1
c) P(X < 13) = P(Z < σ ) = Φ( σ ) = 0.999 ⇒ σ = 3.1 ⇒ σ = 0.3226.
13−µ 13−µ 13−µ
d) P(X < 13) = P(Z < 0.5 ) = Φ( 0.5 ) = 0.999 ⇒ 0.5 = 3.1 ⇒ µ = 11.45.
(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 31 / 40
Tổng của các BNN phân phối chuẩn độc lập
Xét 2 BNN phân phối chuẩn độc lập X1 ∼ N(µ1 , σ12 ), X2 ∼ N(µ2 , σ22 ). Ta có
tổng của 2 BNN này Y = X1 + X2 cũng là một BNN phân phối chuẩn:

Y ∼ N(µ1 + µ2 , σ12 + σ22 ).


Tổng quát: Xét n BNN phân phối chuẩn độc lập từng đôi một:
X1 ∼ N(µ1 , σ12 ), X2 ∼ N(µ2 , σ22 ),· · · , Xn ∼ N(µn , σn2 ), ta có
n n n
ci2 σi2 ).
P P P
Y = ci Xi ∼ N( ci µi ,
i=1 i=1 i=1

Định lý giới hạn trung tâm


Xét một dãy các BNN độc lập X1 , X2 , · · · có cùng phân phối, cùng µ và σ 2 .
Khi đó phân phối của BNN
X1 + ....Xn − nµ
Z= √ tiến tới phân phối chuẩn tắc N(0, 1) khi n → ∞.
σ n
n o Ra −x 2 /2
√ n −nµ ≤ a → √1
Có nghĩa là P X1 +···+X e dx, khi n → ∞.
σ n 2π
−∞
(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 32 / 40
Ví dụ về định lý giới hạn trung tâm
Thông thường điều kiện để sử dụng định lý GHTT: n ≥ 30 hoặc n ≥ 40.
P
Xi − nµ
Z= √ ≈ N(0, 1), hoặc
σ n P
Xi 2
Xi ≈ N(nµ, nσ 2 ), ≈ N(µ, σn ).
P
Y = X̄ =
n

Ví dụ
Giả sử rằng tuổi trung bình của sinh viên một trường đại học là 22.3 với độ lệch
chuẩn là 4. Chọn ngẫu nhiên 64 sinh viên, tính xác suất tuổi trung bình các sinh
viên lớn hơn 23.

Gọi Xi , i = 1, 64 là tuổi của 64 sinh viên được chọn ngẫu nhiên trong trường.
Ta có Xi là các BNN độc lập có cùng phân phối với µ = 22.3, σ = 4.
X1 + · · · + Xn
Xét BNN tuổi trung bình của 64 sinh viên: X̄ = với n = 64.
n
X̄ − µ
Theo định lý GHTT: Z = √ ≈ N(0, 1).
σ/ n
23−22.3
Ta có: P(X̄ > 23) = P(Z > 4/√64 ) ≈ 1 − Φ(1.4) = 1 − 0.9192 = 0.0808.
(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 33 / 40
Xấp xỉ phân phối nhị thức bằng phân phối chuẩn

Ví dụ
Giả sử rằng trong một kênh giao tiếp kỹ thuật số, số lượng bit nhận được bị lỗi có
thể được mô hình hóa bởi một biến ngẫu nhiên nhị thức và giả sử rằng xác suất
nhận được một bit lỗi là 10−5 . Nếu 16 triệu bit được truyền đi, xác suất để tối đa
150 bit xảy ra lỗi là bao nhiêu?

Gọi X là số bit bị lỗi. X ∼ B(16.106 , 10−5 ).


150
x
(10−5 )x (1 − 10−5 )16,000,000−x
P
P(X ≤ 150) = C16,000,000
x=0

- rất khó để tính toán.


Ta biểu diễn X dưới dạng tổng của n = 16 triệu BNN Bernoulli độc lập Xi cùng
phân phối với µ = p = 10−5 , σ 2 = p(1 − p). Theo định lý giới hạn trung tâm, ta
có thể xấp xỉ BNN Z = √X −np bởi BNN phân phối chuẩn tắc N(0, 1).
np(1−p)

(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 34 / 40
Xấp xỉ phân phối nhị thức bằng phân phối chuẩn
Nếu X là một BNN nhị thức X ∼ B(n, p), thì BNN

Z = √X −np
np(1−p)

được xấp xỉ bằng biến ngẫu nhiên phân phối chuẩn tắc. Khi xấp xỉ, ta cần hiệu
chỉnh cho sự liên tục như sau:
 
x+0.5−np
P(X ≤ x) = P(X ≤ x + 0.5) ≈ P Z ≤ √
np(1−p)


 
x−0.5−np
P(X ≥ x) = P(X ≥ x − 0.5) ≈ P Z ≥ √ .
np(1−p)

Điều kiện để sự xấp xỉ này tốt (sai số nhỏ) là np > 5 và n(1 − p) > 5 (trong một
số trường hợp, yêu cầu np > 10, n(1 − p) > 10).

(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 35 / 40
(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 36 / 40
Xét ví dụ về truyền thông tin trong kênh kỹ thuật số
Giả sử rằng trong một kênh giao tiếp kỹ thuật số, số lượng bit nhận được bị lỗi có
thể được mô hình hóa bởi một biến ngẫu nhiên nhị thức và giả sử rằng xác suất
nhận được một bit lỗi là 10−5 . Nếu 16 triệu bit được truyền đi, xác suất để tối đa
150 bit xảy ra lỗi là bao nhiêu?

Gọi X là số bit bị lỗi. X ∼ B(16.106 , 10−5 ).


 
X −160 150.5−160
P(X ≤ 150) = P(X ≤ 150.5) = P √ −5
≤√
6 16∗10 ∗10 (1−10−5 ) 16∗106 ∗10−5 (1−10−5 )
≈ P (Z ≤ −0.75) = 0.227.

Ở đây, np = 16, 000, 000 · 10−5 = 160, n(1 − p) > 5.

(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 37 / 40
Xấp xỉ phân phối Poisson bằng phân phối chuẩn
Nếu X là một BNN Poisson X ∼ Poisson(λ), thì BNN
X√−λ
Z= λ
≈ N(0, 1).

Để xấp xỉ, ta cần hiệu chỉnh cho sự liên tục như sau:
 
x+0.5−λ
P(X ≤ x) = P(X ≤ x + 0.5) ≈ P Z ≤ √
λ
,
 
x−0.5−λ
P(X ≥ x) = P(X ≥ x − 0.5) ≈ P Z ≥ √
λ
.

Điều kiện để sự xấp xỉ này tốt là λ > 5.

(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 38 / 40
Xấp xỉ phân phối Poisson bằng phân phối chuẩn

Ví dụ 1
Số lượng sinh viên đăng ký vào một khóa học tâm lý học là một biến ngẫu nhiên
Poisson với giá trị trung bình là µ = 100. Giáo sư phụ trách khóa học đã quyết
định rằng nếu số lượng đăng ký từ 120 sinh viên trở lên, ông sẽ dạy khóa học
thành hai lớp riêng biệt, trong khi nếu ít hơn 120 sinh viên đăng ký, ông sẽ dạy
tất cả học sinh cùng một lúc. Xác suất mà giáo sư sẽ phải tách lớp là bao nhiêu?

X biểu thị số lượng sinh viên đăng ký vào khóa học, X ∼ Poisson(100).

100i
Xác suất giáo sư phải tách lớp: P(X ≥ 120) = e −100
P
i! : khó tính toán!
i=120
Tuy nhiên, một BNN Poisson với trung bình 100 là tổng của 100 các BNN
Poisson độc lập, mỗi biến có giá trị trung bình 1, chúng ta có thể sử dụng định lý
giới hạn trung tâm để có được nghiệm gần đúng.

P(X ≥ 120) = P(X ≥ 119.5) (hiệu chỉnh cho sự liên tục)


= P( X√−100
100
≥ 119.5−100

100
) ≈ 1 − Φ(1.95) = 0.0256.

(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 39 / 40
Xấp xỉ phân phối Poisson bằng phân phối chuẩn

Ví dụ 2
Giả sử rằng số lượng hạt amiăng trong một mét vuông bề mặt bụi tuân theo phân
phối Poisson với giá trị trung bình là 1000. Nếu phân tích một mét vuông bụi, xác
suất để tìm thấy tối đa 950 hạt là bao nhiêu?

Gọi biến ngẫu nhiên X biểu thị số lượng hạt amiăng trong một mét vuông bề mặt
bụi, X ∼ Poisson(1000).
950
e −1000 1000x
P
P(X ≤ 950) = x! .
x=0

Ta có thể xấp xỉ bằng phân phối chuẩn


 tắc 
P(X ≤ 950) = P(X ≤ 950.5) ≈ P Z ≤ 950.5−1000

1000
= Φ(−1.57) = 0.0582.

(Phan Thị Khánh Vân) Chương 3: Một số phân phối xác suất thông dụng Ngày 19 tháng 2 năm 2022 40 / 40

You might also like