Giao Trinh Xs Sdh17

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 78

TRƯỜNG ĐẠI HỌC Y KHOA PHẠM NGỌC THẠCH

BỘ MÔN THỐNG KÊ Y HỌC - TIN HỌC

ÔN TẬP XÁC SUẤT

TP. HỒ CHÍ MINH 4/2016


Mục lục

Chương 1. Đại cương về xác suất 3


1.1. Ôn tập giải tích tổ hợp . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.1. Qui tắc đếm . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.2. Chỉnh hợp . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.1.3. Chỉnh hợp lặp . . . . . . . . . . . . . . . . . . . . . . . . 4
1.1.4. Tổ hợp . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2. Xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.1. Hiện tượng ngẫu nhiên . . . . . . . . . . . . . . . . . . . 7
1.2.2. Các loại biến cố . . . . . . . . . . . . . . . . . . . . . . . 8
1.2.3. Một số tính chất của biến cố . . . . . . . . . . . . . . . . 10
1.2.4. Định nghĩa xác suất . . . . . . . . . . . . . . . . . . . . 11
1.3. Xác suất có điều kiện . . . . . . . . . . . . . . . . . . . . . . . . 17
1.3.1. Định nghĩa . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.3.2. Công thức nhân xác suất . . . . . . . . . . . . . . . . . . 18
1.3.3. Công thức xác suất toàn phần . . . . . . . . . . . . . . . 18
1.3.4. Công thức Bayès . . . . . . . . . . . . . . . . . . . . . . 20
1.3.5. Biến cố độc lập . . . . . . . . . . . . . . . . . . . . . . . 20
1.4. Một số khái niệm xác suất trong Y học . . . . . . . . . . . . . . 27
1.4.1. Độ nhạy . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.4.2. Độ đặc hiệu . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.4.3. Giá trị tiên lượng dương . . . . . . . . . . . . . . . . . . 28
1.4.4. Giá trị tiên lượng âm . . . . . . . . . . . . . . . . . . . . 28
1.5. Bài tập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
Hướng dẫn và đáp số . . . . . . . . . . . . . . . . . . . . . . . . . . 37
1

Chương 2. Biến số ngẫu nhiên 39


2.1. Biến ngẫu nhiên rời rạc . . . . . . . . . . . . . . . . . . . . . . . 40
2.1.1. Bảng phân phối xác suất . . . . . . . . . . . . . . . . . . 40
2.1.2. Hàm mật độ . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.1.3. Hàm phân phối . . . . . . . . . . . . . . . . . . . . . . . 41
2.2. Biến ngẫu nhiên liên tục . . . . . . . . . . . . . . . . . . . . . . 42
2.2.1. Hàm mật độ . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.2.2. Hàm phân phối . . . . . . . . . . . . . . . . . . . . . . . 42
2.3. Tham số đặc trưng của biến ngẫu nhiên . . . . . . . . . . . . . 44
2.3.1. Kỳ vọng . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.3.2. Phương sai . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.3.3. Mốt và trung vị . . . . . . . . . . . . . . . . . . . . . . . 46
2.3.4. Hàm đặc trưng . . . . . . . . . . . . . . . . . . . . . . . 47
2.4. Bài tập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Hướng dẫn và đáp số . . . . . . . . . . . . . . . . . . . . . . . . . . 49

Chương 3. Hàm phân phối 52


3.1. Phân phối nhị thức B(n;p) . . . . . . . . . . . . . . . . . . . . . 52
3.1.1. Định nghĩa . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.1.2. Mệnh đề . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.2. Phân phối siêu bội H(N;K;n) . . . . . . . . . . . . . . . . . . . . 55
3.2.1. Định nghĩa . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.2.2. Mệnh đề . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.3. Phân phối Poisson . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.3.1. Định nghĩa . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.3.2. Mệnh đề . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.4. Phân phối chuẩn . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.4.1. Định nghĩa . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.4.2. Mệnh đề . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.4.3. Định nghĩa . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.4.4. Mệnh đề . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.4.5. Mệnh đề . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
2

3.4.6. Định lý Moivre - Laplace . . . . . . . . . . . . . . . . . 62


3.4.7. Định lý giới hạn trung tâm . . . . . . . . . . . . . . . . . 63
3.5. Phân phối Chi - bình phương, χ2 . . . . . . . . . . . . . . . . . 64
3.5.1. Mệnh đề: . . . . . . . . . . . . . . . . . . . . . . . . . . 64
3.5.2. Mệnh đề: . . . . . . . . . . . . . . . . . . . . . . . . . . 64
3.6. Phân phối Student . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.7. Phân phối Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.8. Bài tập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
Hướng dẫn và đáp số . . . . . . . . . . . . . . . . . . . . . . . . . . 71
Tài liệu tham khảo . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
Chương 1
Đại cương về xác suất

MỤC TIÊU:

1. Trình bày được các khái niệm liên quan đến biến cố

2. Tính được xác suất của biến cố dựa trên các định nghĩa xác suất, các
tính chất, các công thức

1.1. Ôn tập giải tích tổ hợp

1.1.1. Qui tắc đếm


Quy Tắc cộng: Giả sử một công việc có thể thực hiện bằng một trong k
phương pháp, trong đó
phương pháp 1 có n1 cách thực hiện,
phương pháp 2 có n2 cách thực hiện,
.....
phương pháp k có nk cách thực hiện,
và hai phương pháp khác nhau không có cách thực hiện chung.
Khi đó, ta có n1 + n2 + ... + nk cách thực hiện công việc.
Quy Tắc nhân: Giả sử một công việc được thực hiện tuần tự theo k giai
đoạn, trong đó
giai đoạn 1 có n1 cách thực hiện,
giai đoạn 2 có n2 cách thực hiện,
.....
giai đoạn k có nk cách thực hiện.
Khi đó, ta có n1 .n2 ...nk cách thực hiện công việc.
Chẳng hạn, nếu ta có 2 áo sơ mi ngắn tay và 3 áo sơ mi dài tay thì ta có
cả thảy 2+3 = 5 cách chọn áo. Nếu ta có 5 áo sơ mi và 4 quần tây thì ta có
4

5.4=20 cách chọn quần áo.

1.1.2. Chỉnh hợp


Cho tập hợp gồm n phần tử. Mỗi nhóm k phần tử (1 ≤ k ≤ n) khác nhau,
có thứ tự lấy từ tập hợp này gọi là một chỉnh hợp chập k của n phần tử. Số
các chỉnh hợp chập k của n phần tử là
n!
Akn = n(n − 1)....(n − k + 1) = .
(n − k)!

Với ba phần tử {a, b, c}, ta có số các chỉnh hợp chập 2 của 3 phần tử là
3!
A23 = (3−2)! = 6, được liệt kê như sau

{ab, ba, bc, cb, ac, ca} .

Chú ý: Khi k = n ta được một hoán vị của n phần tử. Số các hoán vị của n
phần tử là
Pn = Ann = n(n − 1)....2.1 = n!.
Với ba phần tử {a, b, c}, ta có số các hoán vị của 3 phần tử đó là 3!= 6,
được liệt kê như sau
{abc, acb, bac, bca, cab, cba} .

1.1.3. Chỉnh hợp lặp


Cho tập hợp gồm n phần tử. Mỗi nhóm k phần tử có thể trùng nhau, có
thứ tự lấy từ tập hợp này gọi là một chỉnh hợp lặp chập k của n phần tử. Số
các chỉnh hợp lặp chập k của n phần tử là

Ãkn = nk .

Với ba phần tử {a, b, c}, ta có số các chỉnh hợp lặp chập 2 của 3 phần tử
là 32 = 9, liệt kê ra là

{ab, ba, bc, cb, ac, ca, aa, bb, cc} .

1.1.4. Tổ hợp
Cho tập hợp gồm n phần tử. Mỗi nhóm k phần tử (0 ≤ k ≤ n) khác nhau,
không phân biệt thứ tự lấy từ tập hợp này gọi là một tổ hợp chập k của n phần
tử. Số các tổ hợp chập k của n phần tử là
1 k n!
Cnk = An = .
k! k!(n − k)!
5

Với ba phần tử {a, b, c}, ta có số các tổ hợp chập 2 của 3 phần tử là


3!
C32 = 2!(3−2)! = 3, liệt kê ra là

{ab, bc, ac} .

Chú ý: Cho dãy


a1 , a2 , ..., an (1) gồm n phần tử, và
b1 , b2 , ..., bm (2) gồm m phần tử.
Xét số các cặp (ai , bj ), ở đây ai lấy bất kì từ (1), bj lấy bất kì từ (2). Hai cặp
được coi là khác nhau nếu chúng khác nhau ở ít nhất một vị trí. Số các cặp
khác nhau thành lập từ (1) và (2) bằng: n.m.
Chẳng hạn, một cỗ bài tú lơ khơ có 52 quân. Chọn ngẫu nhiên cùng lúc 2
quân. Khi đó số các khả năng để chọn được một quân rô và quân màu đen là
13.26 = 338 khẳ năng.

Ví dụ 1.1. Sắp xếp ngẫu nhiên 6 sinh viên gồm 3 nam, 3 nữ vào một bàn dài
6 chỗ
a. Có mấy cách sắp xếp chỗ cho sinh viên?
b. Có mấy cách sắp xếp sao cho ngồi hai đầu bàn là hai sinh viên nam?
c. Có mấy cách sắp xếp sao cho ngồi vào hai đầu bàn là một sinh viên nam
và một sinh viên nữ?
d. Có mấy cách sắp xếp sao cho nam nữ ngồi xen kẽ nhau?

Giải:

a. Sắp xếp 6 sinh viên vào 6 chỗ là một hoán vị của 6 phần tử, nên số cách
sắp xếp chỗ là 6! = 720.
b. Công việc sắp xếp sinh viên chia làm 2 giai đoạn:
- Chọn 2 từ 3 sinh viên nam xếp vào 2 đầu bàn (2 sinh viên này đổi chỗ
cho nhau nên có tính thứ tự), có A23 cách chọn.
- Sắp xếp 4 sinh viên vào 4 chỗ còn lại, có 4! cách xếp.
Vậy có A23 .4! = 144 cách xếp.
c. Công việc chia làm 4 giai đoạn:
- Chọn 1 nữ từ 3 nữ sinh viên, có C31 cách chọn.
- Chọn 1 nam từ 3 nam sinh viên, có C31 cách chọn.
- Sắp xếp 2 sinh viên này vào 2 đầu bàn, có 2! cách xếp.
6

- Sắp xếp 4 sinh viên vào 4 chỗ còn lại, có 4! cách xếp.
Vậy có C31 .C31 .2!.4! = 432 cách sắp xếp.
d. Công việc được chia làm 3 giai đoạn.
- Chọn vị trí cho sinh viên nam và nữ (nam ngồi vị trí lẻ, nữ ngồi vị trí
chẵn và ngược lại), có 2! cách chọn.
- Xếp 3 nam vào 3 vị trí vừa chọn, có 3! cách xếp.
- Xếp 3 nữ vào 3 vị trí vừa chọn, có 3! cách xếp.
Vậy có 2!.3!.3! = 72 cách.

Ví dụ 1.2. Một đội văn nghệ gồm 20 người trong đó có 10 nam và 10 nữ. Hỏi
có bao nhiêu cách chọn ra 5 người tham gia biểu diễn sao cho:
a. Có đúng 2 nam trong 5 người đó.
b. Có ít nhất 2 nam và ít nhất 1 nữ trong 5 người đó.

Giải:

a. Công việc chia làm 2 giai đoạn:


2
- Chọn 2 nam trong 10 nam, có C10 cách chọn.
3
- Chọn 3 nữ trong 10 nữ, cóC10 cách chọn.
2 3
Vậy có C10 .C10 = 5400 cách chọn.
b. Công việc có thể thực hiện theo 3 phương pháp sau:
- Chọn 2 nam và 3 nữ.
- Chọn 3 nam và 2 nữ.
- Chọn 4 nam và 1 nữ.
Mỗi phương pháp chia làm 2 giai đoạn, với cách giải như câu a, ta được
2 3 3 2 4 1
C10 .C10 + C10 .C10 + C10 .C10 = 5400 + 5400 + 2100 = 12900 cách chọn.

Ví dụ 1.3. Tung một đồng xu ba lần. Tìm số kết quả có thể xảy ra.

Giải:

Mỗi lần tung, đồng xu chỉ có thể sấp (S) hoặc ngửa (N). Do vậy số các kết
quả của phép tung đồng xu là:

{(SSS); (SSN ); (SN S); (N SS); (SN N ); (N SN ); (N N S); (N N N )} .


7

Đó chính là số chỉnh hợp lặp chập 3 của 2 phần tử {S, N } và bằng 23 = 8.


Chúng ta dễ dàng tổng quát kết quả trên, khi tung đồng xu n lần sẽ có 2n
kết quả có thể xảy ra.

Ví dụ 1.4. Gieo một con xúc xắc 6 mặt 2 lần. Tìm số kết quả có thể của phép
gieo.

Giải:

Mỗi lần gieo, xúc xắc có thể xuất hiện mặt 1, 2, ...,6. Do vậy số các kết quả
của phép gieo là:
{(1, 1); (1, 2); (1, 3); ....; (6, 6)}
có 6.6 = 36 phần tử.
Chúng ta dễ dàng tổng quát kết quả trên, khi gieo con xúc xắc n lần sẽ có
n
6 kết quả có thể xảy ra.

Ví dụ 1.5. Một lô hàng có N sản phẩm, trong đó có K phế phẩm. Có bao


nhiêu cách chọn ra n sản phẩm trong đó có k phế phẩm.

Giải:

Công việc chọn sản phẩm chia làm 2 giai đoạn:


k
- Chọn k phế phẩm trong K phế phẩm, có CK cách chọn.
- Chọn n-k sản phẩm trong N-K sản phẩm, có CNn−k
−K cách chọn.
k n−k
Vậy có CK CN −K cách chọn.

1.2. Xác suất

1.2.1. Hiện tượng ngẫu nhiên


Là hiện tượng mà dù được thực hiện trong cùng điều kiện chúng vẫn có
thể cho kết quả khác nhau. Chẳng hạn,

• Khi tung một đồng xu, có thể xuất hiện mặt ngửa nhưng cũng có thể
không xuất hiện mặt ngửa.

• Khi gieo một con xúc xắc, có thể xuất hiện mặt 6 chấm nhưng cũng có
thế không xuất hiện mặt 6 chấm.
8

• Khi khám bệnh cho một bệnh nhân, có thể bệnh nhân có bệnh X nào
đó cũng có thể bệnh nhân không có bệnh X.

Hiện tượng ngẫu nhiên là đối tượng khảo sát của lý thuyết xác suất và để
khảo sát một hiện tượng ngẫu nhiên, người ta cho hiện tượng này xuất hiện
nhiều lần để quan sát. Mỗi lần cho xuất hiện một hiện tượng ngẫu nhiên được
gọi là thực hiện một phép thử. Khi thực hiện một phép thử, dù ta không dự
đoán được kết quả nào sẽ xảy ra nhưng thường ta có thể liệt kê tất cả các kết
quả có thể xảy ra. Tập tất cả các kết quả có thể xảy ra của một phép thử được
gọi là không gian mẫu của phép thử đó. Mỗi phần tử của không gian mẫu
gọi là một biến cố sơ cấp và mỗi tập con của không gian mẫu gọi là một biến cố.

Ta thường dùng kí hiệu Ω cho không gian mẫu, các chữ cái in hoa A, B,
N, S ... kí hiệu tập con của Ω để chỉ các biến cố.

Ví dụ 1.6.

1. Trong phép thử tung một đồng xu, kí hiệu


S là biến cố xuất hiện mặt sấp, ta viết S: "Xuất hiện mặt sấp",
N là biến cố xuất hiện mặt ngửa, ta viết N: "Xuất hiện mặt ngửa".
Ta được S, N là các biến cố sơ cấp và không gian mẫu Ω = {S, N } .

2. Trong phép thử gieo một con xúc xắc, kí hiệu


Ai : "Xuất hiện mặt i chấm", là các biến cố sơ cấp.
Không gian mẫu Ω = {A1 , A2 , ..., A6 } ≡ {1, 2, ..., 6} .
Ta cũng có các biến cố khác như:
A: "Xuất hiện mặt số lẻ", A = {A1 , A3 , A5 } ≡ {1, 3, 5} .
B: "Xuất hiện mặt số chẵn", B = {A2 , A4 , A6 } ≡ {2, 4, 6}.
C: "Xuất hiện mặt số nguyên tố", C = {A2 , A3 , A5 } ≡ {2, 3, 5}.

1.2.2. Các loại biến cố


Biến cố chắc chắn A = Ω: là biến cố luôn xảy ra khi thực hiện phép thử.

Ví dụ 1.7. Phép thử gieo 2 quân xúc xắc. Biến cố "tổng số nút ≥ 2 và ≤ 12"
là biến cố chắc chắn.
9

Biến cố không thể A = Ø: là biến cố không bao giờ xảy ra khi thực hiện
phép thử.

Ví dụ 1.8. Với phép thử trên. Biến cố "tổng số nút >12" là biến cố không
thể.

Biến cố kéo theo: A ⊂ B là nếu biến cố A xảy ra thì dẫn tới biến cố B
xảy ra.

Ví dụ 1.9.
a. Phép thử gieo quân xúc xắc. Gọi
A: "Xuất hiện mặt 1 chấm ", B: "Xuất hiện mặt có số chấm là số lẻ".
Thì A ⊂ B.
b. Phép thử khám cho 3 người xem có bị cao huyết áp hay không? Gọi
C: "có một người bị huyết áp cao", D: "có ít nhất một người bị huyết áp
cao".
Thì C ⊂ D.

Biến cố tổng: A ∪ B là biến cố "ít nhất có A hoặc B xảy ra", được gọi là
tổng của hai biến cố A và B.
A1 ∪ A2 ∪ .... ∪ An gọi là tổng của n biến cố A1 , A2 , ...An .

Ví dụ 1.10.
a. Phép thử gieo 2 quân xúc xắc. Gọi
A: "tổng số nút > 10", B: "tổng số nút < 4". => ít nhất có A hoặc B xảy ra
Khi đó, biến cố Nếu có phần tử chung => viết 1 lần

A ∪ B = {(5, 6), (6, 5), (6, 6), (1, 2), (2, 1), (1, 1)} .

b. Phép thử khám cho một bệnh nhân, gọi


C: "tim đập yếu", D: "giãn mạch".
Thì C ∪ D: "hạ huyết áp".

Biến cố tích: A ∩ B là biến cố "cả A và B cùng xảy ra", được gọi là tích
của hai biến cố A và B.
A1 ∩ A2 ∩ .... ∩ An gọi là tích của n biến cố A1 , A2 , ...An .
10

Ví dụ 1.11.
a. Phép thử gieo 2 quân xúc xắc. Gọi A: "tổng số nút >7", B: "tổng số nút
< 10".
Khi đó, biến cố

A ∩ B = {(2, 6), (6, 2), (3, 5), (5, 3), (4, 5), (5, 4), (4, 4)} .

b. Phép thử khám cho một bệnh nhân, gọi


C: "nhiệt độ cao", D: "mệt".
Thì C ∩ D: "sốt".

Biến cố xung khắc: Hai biến cố A và B gọi là xung khắc nếu khi biến
cố này xảy ra thì biến cố kia không xảy ra, tức là A ∩ B = Ø.

Ví dụ 1.12.
a. Phép thử gieo 2 quân xúc xắc. Đặt biến cố
A: "tổng số nút < 7", B: "tổng số nút > 10".
Khi đó, A và B là 2 biến cố xung khắc.
b. Phép thử xét nghiệm vi khuẩn đường ruột cho một bệnh nhân. Gọi các
biến cố
C: "vi khuẩn Subtilis phát triển", D: "vi khuẩn E.coli phát triển". Thì C
và D xung khắc vì hai loại vi khuẩn đó thường không thể hiện đồng thời trong
đường ruột.

Biến cố đối: Biến cố đối của biến cố A trong không gian mẫu Ω, kí hiệu
là Ā, là biến cố "không xảy ra A". giống phủ định

Ví dụ 1.13.
a. Phép thử gieo 2 quân xúc xắc. Đặt biến cố A: "tổng số nút là chẵn", thì
Ā: "tổng số nút là lẻ".
b. Khám cho một người. Đặt biến cố A: "ốm", thì Ā: "khỏe".

Mối quan hệ giữa các biến cố trên được minh họa bằng sơ đồ Ven sau (hình
1.1)

1.2.3. Một số tính chất của biến cố


Cho các biến cố A, B, C trong không gian mẫu Ω, ta có một số tính chất
thường dùng sau
11

Hình 1.1 Quan hệ giữa các biến cố

(i) A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C), A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C).


(ii) A ∪ B = Ā ∩ B̄, A ∩ B = Ā ∪ B̄.
(iii) A ∩ Ā = Ø, A ∪ Ā = Ω.
(iv) B = (B ∩ A) ∪ (B ∩ Ā), (B ∩ A) ∩ (B ∩ Ā) = Ø.

1.2.4. Định nghĩa xác suất


Định nghĩa cổ điển: Xét một phép thử với n kết quả có thể xảy ra, nghĩa
là không gian mẫu Ω có n biến cố sơ cấp, và biến cố A của Ω có k phần tử.
Nếu các biến cố sơ cấp có cùng khả năng xảy ra thì xác suất của A được định
nghĩa là
Số phần tử của A k
P (A) = = .
Số phần tử của Ω n

Ví dụ 1.14.
a. Xét phép thử gieo một xúc xắc với các biến cố
A: "nhận được mặt 1",
B: "nhận được mặt lẻ".
Theo định nghĩa ta có P (A) = 61 , P (B) = 3
6
= 0.5.
b. Lấy ngẫu nhiên một viên bi trong hộp đựng 4 bi xanh và 6 bi đỏ. Với các
biến cố
C: "nhận được bi xanh",
D: "nhận được bi đỏ".
4 6
Ta được P (C) = 10 = 0.4 và P (D) = 10
= 0.6.

Chú ý: Đối với định nghĩa cổ điển ta cần 2 điều kiện

• Các kết quả của phép thử là hữu hạn,

• Các kết quả đồng khả năng xảy ra.


12

Khi một trong 2 điều kiện trên không xảy ra, ta có thể định nghĩa xác suất
bằng thống kế như sau
Định nghĩa xác suất bằng tần suất: Giả sử phép thử có thể lặp lại
n phép thử nhiều lần trong điều kiện giống nhau. Nếu trong n lần thực hiện phép thử mà
biến cố A xảy ra k lần thì tỉ số nk được gọi là tần suất xuất hiện của A trong
n phép thử.
Người ta chứng minh được rằng, khi n đủ lớn, tần suất của biến cố A sẽ
dao động quanh một giá trị nào đó gọi là xác suất của A, kí hiệu là P(A).
Trong thực tế, với n đủ lớn, người ta lấy tần suất của A làm giá trị gần đúng
cho xác suất của biến cố A,
k
P (A) = .
n
Ví dụ 1.15. Thống kê trên 10000 người dân của thành phố cho thấy có 51
người bị bệnh cao huyết áp, ta nói xác suất của biến cố A: "bi bệnh cao huyết
áp" là
51
P (A) = = 0, 0051.
10000
Ví dụ 1.16. Button và Pearson đã tiến hành gieo nhiều lần một đồng tiền
cân đối và đồng chất. Kết quả các số liệu được ghi trong bảng 1.1:

Bảng 1.1 Kết quả gieo đồng xu của Button và Pearson

Ví dụ 1.17. Một số người đã tiến hành quan sát tỉ lệ sinh con trai của một
số vùng lãnh thổ trong những điều kiện khác nhau. Kết quả các số liệu quan
sát được ghi lại trong bảng 1.2:

Định nghĩa theo tiên đề Kolmogorov: Xác suất P(.) là hàm số xác
định trên tập các biến cố của không gian mẫu Ω thỏa:

• Với biến cố bất kì A, 0 ≤ P (A) ≤ 1.


13

Bảng 1.2 Tỉ lệ sinh con trai

• P (Ø) = 0, P (Ω) = 1.

• Nếu biến cố A và B xung khắc thì

P (A ∪ B) = P (A) + P (B).

Tổng quát hơn, nếu A1 , A2 , ... là dãy các biến cố xung khắc với nhau từng đôi
một thì
P (A1 ∪ A2 ∪ ...) = P (A1 ) + P (A2 ) + ....
Hệ quả:

• P (A) + P (Ā) = 1

• Công thức cộng: Với hai biến cố bất kì A và B,

P (A ∪ B) = P (A) + P (B) − P (A ∩ B).

Nguyên lí xác suất nhỏ


Một biến cố không thể có xác suất bằng 0. Tuy nhiên một biến cố có xác
suất bằng 0 vẫn có thể xảy ra trong một số rất lớn phép thử. Qua thực nghiệm
và quan sát thực tế, các biến cố có xác suất bé sẽ không xảy ra khi chỉ thực
hiện một phép thử hay một vài phép thử. Từ đó, người ta thừa nhân nguyên
lí sau đây, gọi là "nguyên lí xác suất nhỏ": "Nếu một biến cố có xác suất rất
14

nhỏ thì thực tế có thể cho rằng trong một phép thử biến cố đó sẽ không xảy
ra".
Chẳng hạn mỗi chiếc máy bay đều có một xác suất rất nhỏ để xảy ra tai
nạn. Nhưng trên thực tế ta vẫn không từ chối đi máy bay vì tin tưởng rằng
trong chuyến bay ta đi biến cố máy bay rơi sẽ không xảy ra.
Hiển nhiên việc qui định một mức xác suất như thế nào được gọi là nhỏ
sẽ tùy thuộc vào từng bài toán cụ thể. Chẳng hạn xác suất để máy bay rơi là
0.01 thì xác suất đó chưa được coi là nhỏ. Song nếu xác suất một chuyến tàu
khởi hành châm là 0,01 thì có thể coi rằng xác suất này nhỏ.
Mức xác suất nhỏ này gọi là mức ý nghĩa. Nếu α là mức ý nghĩa thì số
β = 1 − α gọi là độ tin cậy. Khi dựa trên nguyên lí xác suất nhỏ, ta tuyên bố
rằng: "Biến cố A có xác suất nhỏ (tức là P (A) ≤ α) sẽ không xảy ra trong
thực tế" thì độ tin cậy của kết luận trên là β. Tính đúng đắn của kết luận trên
chỉ xảy ra trong 100.β%.
Một số ví dụ minh họa
Ví dụ 1.18. Gieo lần lượt 3 đồng xu. Với các biến cố
A: "Ít nhất hai mặt sấp xuất hiện",
B: "Ba mặt giống nhau".
a. Tính các xác suất của A, B.
b. Tính các xác suất A ∪ B, A ∩ B.

Giải:

Không gian mẫu

Ω = {(SSS), (SSN ), (SN S), (N SS), (SN N ), (N SN ), (N N S), (N N N )}

gồm 8 phần tử. Đó chính là số chỉnh hợp lặp chập 3 của 2 phần tử {S, N }.
a. Biến cố
A = {(SSS), (SSN ), (N SS), (SN S)},
B = {(SSS), (N N N )}.
Do đó P (A) = 84 = 12 , P (B) = 2
8
= 14 .
b. Biến cố
A ∪ B = {(SSS), (SSN ), (N SS), (SN S), (N N N )},
A ∩ B = {(SSS)}.
Do đó P (A ∪ B) = 85 , P (A ∩ B) = 81 .
15

Ví dụ 1.19. Gieo lần lượt một đồng xu và một quân xúc xắc.
a. Tính xác suất của biến cố A: "đồng xu xuất hiện mặt sấp và số nút quân
xúc sắc xuất hiện là một số chẵn".
b. Tính xác suất của biến cố B: "số nút quân xúc sắc xuất hiện là một số
nguyên tố".
c. Tính xác suất của biến cố C: "đồng xu xuất hiện mặt ngủa và số nút
quân xúc sắc xuất hiện là một số lẻ".
d. Tính các xác suất A ∪ B, A ∩ B, A ∩ B ∩ C.

Giải:

Không gian mẫu có 2.6 = 12 phần tử gồm

Ω = {N 1, N 2, ..., N 6, S1, S2, ..., S6} .

3
a. Biến cố A = {S2, S4, S6}, có P (A) = 12
= 14 .
6
b. Biến cố B = {S2, S3, S5, N 2, N 3, N 5}, có P (B) = 12
= 12 .
3
c. Biến cố C = {N 1, N 3, N 5}, có P (C) = 12
= 14 .
8
d. Biến cố A∪B = {S2, S3, S4, S5, S6, N 2, N 3, N 5} có P (A∪B) = 12
= 23 .
1
Biến cố A ∩ B = {S2}, có P (A ∩ B) = 12
.
Biến cố A ∩ B ∩ C = Ø nên P (A ∩ B ∩ C) = 0.

Ví dụ 1.20. Một lô hàng có N sản phẩm, trong đó có K phế phẩm. Chọn ngẫu
nhiên cùng lúc n sản phẩm. Tính xác suất để trong n sản phẩm được chọn có
k phế phẩm.

Giải:

Gọi biến cố Ak : "trong n sản phẩm được chọn có k phế phẩm". Không gian
mẫu Ω có CNn phần tử.
Ta phải chọn k phế phẩm trong K phế phẩm và n − k sản phẩm trong số
k
N − K sản phẩm còn lại. Do đó số phần tử của A là CK .CNn−k
−K .
Vậy
C k .C n−k
P (Ak ) = K nN −K .
CN
16

Ví dụ 1.21. Một hộp chứa 5 cầu trắng, 3 cầu xanh và 4 cầu đen cùng kích
thước. Chọn ngẫu nhiên cùng lúc 3 cầu. Tính xác suất của các biến cố
a. A: "cả ba cầu cùng màu".
b. B: "có đúng 2 cầu cùng màu".
c. C: "có ít nhất 2 cầu cùng màu".
d. D: "cả ba cầu khác màu nhau".

Giải:

a. Kí hiệu các biến cố


A1 : "ba cầu rút được cùng màu trắng",
A2 : "ba cầu rút được cùng màu đen",
A3 : "ba cầu rút được cùng màu xanh".
Khi đó các biến A1 , A2 , A3 xung khắc từng đôi và A = A1 ∪ A2 ∪ A3 nên

C53 + C43 + C33 3


P (A) = P (A1 ∪ A2 ∪ A3 ) = P (A1 ) + P (A2 ) + P (A3 ) = 3
= .
C12 44

b. Tương tự, kí hiệu các biến cố


B1 : "trong 3 cầu rút được có 2 cầu trắng",
B2 : "trong 3 cầu rút được có 2 cầu đen",
B3 : "trong 3 cầu rút được có 2 cầu xanh".
Khi đó các biến B1 , B2 , B3 xung khắc từng đôi và B = B1 ∪ B2 ∪ B3 nên

C52 C71 + C42 C81 + C32 C91 29


P (B) = P (B1 ) + P (B2 ) + P (B3 ) = 3
= .
C12 44
3 29 8
c. P (C) = P (A) + P (B) = 44
+ 44
= 11
.
8 3
d. D = C̄ nên P (D) = 1 − P (C) = 1 − 11 = 11
.

Ví dụ 1.22. Một lớp học có 100 sinh viên. Có 30 em giỏi cả Toán và Văn, 40
em giỏi Toán và 50 em giỏi Văn. Chọn ngẫu nhiên một em và xét các biến cố
A: "chọn được sinh viên giỏi Toán",
B: "chọn được sinh viên giỏi Văn".
Khi đó A ∩ B là biến cố "chọn được sinh viên giỏi cả Toán và Văn" và
40 50 30
P (A) = = 0, 4; P (B) = = 0, 5; P (A ∩ B) = = 0, 3.
100 100 100
17

Từ đó, ta có thể tính một số xác suất như


P (A ∪ B) = P (A) + P (B) − P (A ∩ B) = 0, 4 + 0, 5 − 0, 3 = 0, 6
nghĩa là có 60% sinh viên giỏi (Toán hay văn),
P (A ∪ B) = 1 − P (A ∪ B) = 1 − 0, 6 = 0, 4
nghĩa là có 40% sinh viên không giỏi môn nào cả,
P (A) = 1 − P (A) = 1 − 0, 4 = 0, 6
nghĩa là có 60% sinh viên không giỏi Toán.

1.3. Xác suất có điều kiện

1.3.1. Định nghĩa


Xác suất của biến cố A với điều kiện biến cố B đã xảy ra (P(B)>0), được
kí hiệu P (A/B), nó biểu thị khả năng xảy ra biến cố A trong tình huống biến
cố B đã xảy ra
P (A ∩ B)
P (A/B) = .
P (B)
Ví dụ 1.23. Xét phép thử "tung xúc xắc". Với các biến cố
A: "nhận được mặt ≤ 3",
B: "nhận được mặt chẵn ,
C: "nhận được mặt 1 hoặc 2".

Ta có
P (A ∩ B) P [{1, 2, 3} ∩ {2, 4, 6}] P [{2}] 1/6 1
P (A/B) = = = = = .
P (B) P [{2, 4, 6}] P [{2, 4, 6}] 3/6 3
P (A ∩ C) P [{1, 2, 3} ∩ {1, 2}] P [{1, 2}] 2/6
P (A/C) = = = = = 1.
P (C) P [{1, 2}] P [{1, 2}] 2/6
P (B ∩ C) P [{2, 4, 6} ∩ {1, 2}] P [{2}] 1/6 1
P (B/C) = = = = = .
P (C) P [{1, 2}] P [{1, 2}] 2/6 2
Nhận xét: Khi chúng ta đặt điều kiện B, tức là chúng ta đã hạn chế không
gian xác suất từ Ω xuống B, và hạn chế biến cố A xuống còn A ∩ B. Cho nên
xác suất của A với điều kiện B chính là xác suất của A ∩ B trong không gian
xác suất mới B với một xác xuất P1 (A ∩ B) = P (A/B).
Tính chất: Với các biến cố A, B, C bất kì, ta có
18

(i) P (A ∩ B) = P (A/B)P (B) = P (B/A)P (A)


(ii) P (Ā/B) = 1 − P (A/B)
P (A∩B) P (A)
(iii) nếu A ⊂ B thì P (A/B) = P (B)
= P (B)
, P (B/A) =1

1.3.2. Công thức nhân xác suất


Với hai biến cố A, B bất kì, ta có

P (A ∩ B) = P (A)P (B/A).

Tổng quát, với n biến cố bất kỳ A1 , A2 , ..., An , ta có:

P (A1 ∩A2 ∩...∩An ) = P (A1 )P (A2 /A1 )P (A3 /A1 ∩A2 )...P (An /A1 ∩A2 ∩...∩An ).

Ví dụ 1.24. Một lô thuốc có 50 lọ, trong đó 5 lọ bị hỏng. Lấy ngẫu nhiên từng
lọ thuốc. Tính xác suất để:
a. Lọ thứ 1 và 2 đều hỏng,
b. Cả 3 lọ đều hỏng.

Giải: Với biến cố Ai : "Lấy được lọ thứ i bị hỏng", i = 1, 2, 3.


5 4 2
a. P (A1 ∩ A2 ) = P (A1 )P (A2 /A1 ) = 50 49
= 245
.
5 4 3 1
b. P (A1 ∩ A2 ∩ A3 ) = P (A1 )P (A2 /A1 )P (A3 /A1 ∩ A2 ) = 50 49 48
= 1960
.

1.3.3. Công thức xác suất toàn phần


Định lý 1.1. Với hai biến cố A, B bất kì, ta có

P (A) = P (A/B)P (B) + P (A/B̄)P (B̄)

Tổng quát: Giả sử A1 , A2 , ...An là 1 nhóm đầy đủ các biến cố, tức là chúng
xung khắc với nhau từng đôi một và biến cố tổng A1 ∪ A2 ∪ .... ∪ An = Ω, thì
với mọi biến cố B (trong cùng phép thử), ta có

P (B) = P (B/A1 )P (A1 ) + P (B/A2 )P (A2 ) + ... + P (B/An )P (An ).

Chứng minh. Do A ∩ B và A ∩ B̄ là hai biến cố xung khắc và

A = (A ∩ B) ∪ (A ∩ B̄)
19

nên
P (A) = P (A ∩ B) + P (A ∩ B̄)
= P (A/B)P (B) + P (A/B̄)P (B̄).

Tổng quát, do các biến cố A ∩ B1 , A ∩ B2 , ..., A ∩ Bn xung khắc từng đôi


nên do công thức công xác suất
P (A) = P [(A ∩ B1 ) ∪ (A ∩ B2 ) ∪ ... ∪ (A ∩ Bn )]
= P (A ∩ B1 ) + P (A ∩ B2 ) + ... + P (A ∩ Bn )
và do công thức nhân xác suất,
P (A ∩ Bi ) = P (A/Bi )P (Bi ), i = 1, 2, ..., n
ta suy ra
P (B) = P (B/A1 )P (A1 ) + P (B/A2 )P (A2 ) + ... + P (B/An )P (An ).

Ví dụ 1.25. Một bệnh viện nhận các lọ thuốc Vắc-xin từ ba xí nghiệp A, B


và C. Tổng số các lọ thuốc Vắc-xin của xí nghiệp A chiếm 30%, xí nghiệp B
chiếm 50%, xí nghiệp C chiếm 20%. Trong đó tỉ lệ Vắc-xin không đảm bảo
chất lượng của xí nghiệp A, B và C lần lượt là 1%, 3% và 5%. Kiểm tra ngẫu
nhiên một lọ vắc-xin, tính xác suất để lọ này không đảm bảo chất lượng.

Giải:

Xét các biến cố


A1 : "nhận được vắc-xin của xí nghiệp A",
A2 : "nhận được vắc-xin của xí nghiệp B",
A3 : "nhận được vắc-xin của xí nghiệp C",
B: "nhận được lọ vác-xin không đảm bảo chất lượng".
Ta được A1 , A2 , A3 là nhóm đầy đủ các biến cố, với
P (A1 ) = 0, 3; P (A2 ) = 0, 5; P (A3 ) = 0, 2.
Ngoài ra,
P (B/A1 ) = 0, 01; P (B/A2 ) = 0, 03; P (B/A3 ) = 0, 05.
Theo công thức xác suất toàn phần, ta có
P (B) = P (B/A1 )P (A1 ) + P (B/A2 )P (A2 ) + P (B/A3 )P (A3 )
= 0, 01.0, 3 + 0, 03.0, 5 + 0, 05.0, 2 = 0, 028.
20

1.3.4. Công thức Bayès


Định lý 1.2. Giả sử A1 , A2 , ..., An là một họ đầy đủ các biến cố và xét biến
cố B với P (B) > 0. Với mỗi k = 1,2,...,n ta có
P (B/Ak )P (Ak )
P (Ak /B) = .
P (B/A1 )P (A1 ) + P (B/A2 )P (A2 ) + ... + P (B/An )P (An )

Chứng minh. Áp dụng công thức nhân xác xuất

P (Ak /B)P (B) = P (Ak B) = P (B/Ak )P (Ak ),

và công thức xác suất toàn phần

P (B) = P (B/A1 )P (A1 ) + P (B/A2 )P (A2 ) + ... + P (B/An )P (An ).

Ta suy ra
P (B/Ak )P (Ak )
P (Ak /B) =
P (B)
P (B/Ak )P (Ak )
= .
P (B/A1 )P (A1 ) + P (B/A2 )P (A2 ) + ... + P (B/An )P (An )

Ví dụ 1.26. Trong ví dụ nhận vắc-xin ở trên. Giả sử kiểm tra thấy lọ không
đảm bảo chất lượng. Tính xác suất để lọ đó do xí nghiệp A sản xuất.

Giải:
P (B/A1 )P (A1 ) 0, 3.0, 01 3
P (A1 /B) = = = .
P (B) 0, 028 28

1.3.5. Biến cố độc lập


Hai biến cố A, B được gọi là độc lập nếu xác suất để biến cố này xảy ra
không phụ thuộc vào biến cố kia xảy ra, nghĩa là

P (A/B) = P (A)

và do đó
P (A ∩ B) = P (A)P (B).

Tổng quát, n biến cố A1 , A2 , ..., An được gọi là độc lập nếu mỗi biến cố Ai ,
với i = 1, 2, ..., n độc lập với tích bất kì các biến cố còn lại.
21

Ví dụ 1.27. Thảy một đồng xu và một con xúc xắc, ta có không gian mẫu

Ω = {(S, 1), (S, 2), ..., (S, 6), (N, 1), (N, 2), ..., (N, 6)} .

Xét các biến cố


A: "nhận được mặt ngửa của đồng xu",
B: "nhận được nút chẵn của xúc xắc".
Một cách trực giác, đồng xu xuất hiện mặt sấp hay ngửa không ảnh hưởng
gì đến số nút xuất hiện trên con xúc xắc, nghĩa là A, B độc lập nhau. Cụ thể,
ta có
A = {(N, 1), (N, 2), (N, 3), (N, 4), (N, 5), (N, 6)},
B = {(S, 2), (S, 4), (S, 6), (N, 2), (N, 4), (N, 6)},
A ∩ B = {(N, 2), (N, 4), (N, 6)}.
Do đó,
6 1 6 1 3 1
P (A) = = , P (B) = = , P (AB) = = .
12 2 12 2 12 4
1
Vì P (A ∩ B) = P (A)P (B) = 4
nên A, B độc lập với nhau.

Do định nghĩa, nếu 3 biến cố A, B, C độc lập thì A độc lập với B, C và
B ∩ C nên
P (A ∩ B) = P (A)P (B),
P (A ∩ C) = P (A)P (C),
P (A ∩ (B ∩ C)) = P (A)P (B ∩ C).
Do B, C cũng độc lập nhau nên

P (B ∩ C) = P (B)P (C),

và do đó
P (A ∩ B ∩ C) = P (A)P (B)P (C).
Tính chất: Nếu A, B độc lập với nhau thì

• A, B̄ độc lập với nhau.

• Ā, B độc lập với nhau.

• Ā, B̄ độc lập với nhau.


22

Một số ví dụ minh họa

Ví dụ 1.28. Hai xạ thủ A và B cùng nhắm bắn một con thỏ. Xác suất để A
bắn trúng là 27 , xác suất để B bắn trúng là 81 . Tính xác suất để:
a. Cả hai xạ thủ bắn trúng.
b. Chỉ một trong hai người bắn trúng.
c. ít nhất một trong hai người bắn trúng.
d. Cả hai xạ thủ đều bắn trượt.

Giải:

Gọi biến cố
A: "xạ thủ A bắn trúng",
B: "xạ thủ B bắn trúng".
Khi đó A, B là 2 biến cố độc lập và P (A) = 27 , P (B) = 81 .
a. Biến cố cả hai xạ thủ bắn trúng chính là A ∩ B, với
2 1 1
P (A ∩ B) = P (A)P (B) = . = .
7 8 28
5
b. Ta có P (Ā) = 1 − P (A) = 7
và P (B̄) = 1 − P (B) = 78 .
Biến cố chỉ một người bắn trúng là (Ā ∩ B) ∪ (A ∩ B̄), với
 5 1 2 7 19
P (Ā ∩ B) ∪ (A ∩ B̄) = P (Ā)P (B) + P (A)P (B̄) = . + . = .
7 8 7 8 56
2
c. P (A ∪ B) = P (A) + P (B) − P (A ∩ B) = 7
+ 18 − 1
28
= 38 .
d. P (Ā ∩ B̄) = P (Ā)P (B̄) = 57 . 78 = 85 .
Cách khác:
 3 5
P (Ā ∩ B̄) = P A ∪ B = 1 − P (A ∪ B) = 1 − = .
8 8

Ví dụ 1.29. Tại một sảnh chờ của bệnh viện có 30 bệnh nhân chờ tái khám
(sau khi đã đăng kí), trong đó có 17 nữ và 13 nam. Có 3 người tên là Thanh,
gồm 1 nữ và 2 nam. Bác sĩ gọi ngẫu nhiên một nữ bệnh nhân vào phòng khám.
Khi đó xác xuất để người đó tên Thanh là bao nhiêu?

Giải:
23

Với các biến cố


A: "gọi được bệnh nhân tên Thanh",
B: "gọi được bệnh nhân nữ".
Khi đó:
P (A ∩ B) 1/30 1
P (A/B) = = = .
P (B) 17/30 17

Trong trường hợp Bác sĩ gọi một bệnh nhân tên Thanh vào khám. Xác
suất để bệnh nhân đó là nữ

P (A ∩ B) 1/30 1
P (B/A) = = = .
P (A) 3/30 3

Ví dụ 1.30. Tại một thành phố, tỉ lệ người nghiện rượu và mắc chứng ung
thu gan là 15%. Có 25% số người nghiện rượu nhưng không ung thư gan, 50%
không nghiện rượu và cũng không ung thư gan, 10% số người không nghiện
rượu nhưng ung thư gan. Sử dụng số liệu thống kê này để rút ra kết luận về
mối quan hệ giữa bệnh ung thư gan và thói quen nghiện rượu.

Giải:

Xét các biến cố


A: "người nghiện rượu",
B: "người bị ung thư gan".
Tính các xác suất để một người bị ung thư gan với điều kiện người ấy nghiện
rượu, tức là
P (A ∩ B)
P (B/A) =
P (A)
và xác suất để một người bị ung thư gan với điều kiện người ấy không nghiện
rượu, tức là
P (Ā ∩ B)
P (B/Ā) = .
P (Ā)
Ta có P (A ∩ B) = 0, 15; P (Ā ∩ B) = 0, 1; P (A ∩ B̄) = 0, 25 và do

A = (A ∩ B) ∪ (A ∩ B̄)

nên
P (A) = P (A ∩ B) + P (A ∩ B̄) = 0, 15 + 0, 25 = 0, 4.
24

Từ đó P (Ā) = 1 − P (A) = 1 − 0, 4 = 0, 6.
Suy ra
0,15
P (B/A) = 0,4
= 0, 375,
0,1
P (B/Ā) = 0,6
= 0, 167.
Vậy P (B/A) > 2P (B/Ā), tức là một người nghiện rượu sẽ có nguy cơ bị ung
thư gan lớn gấp hai lần một người không nghiện rượu.

Ví dụ 1.31. Để dập tắt nạn dịch do muỗi gây ra, một bệnh viện đã tiến hành
phun thuốc diệt lăng quăng 3 lần liên tiếp trong một tuần. Theo kết quả thí
nghiệm thì khả năng lăng quăng bị chết sau lần phun thứ nhất là 50%; nếu
lăng quăng sống sót thì khả năng bị chết sau lần phun thứ 2 là 70%; tương tự
lần phun thứ ba là 90%. Tính xác suất để lăng quăng chết sau đợt phun này.

Giải:

Đặt các biến cố


A: "lăng quăng chết sau đợt phun thuốc",
Ai : "lăng quăng chết sau lần phun thứ i", i=1,2,3.
Ta có

P (Ā) = P (Ā1 ∩ Ā2 ∩ Ā3 ) = P (Ā1 ).P (Ā2 /Ā1 ).P (Ā3 /Ā1 ∩ Ā2 )
  
= [1 − P (A)] 1 − P (A2 /Ā1 ) 1 − P (A3 /Ā2 )
= (1 − 0, 5)(1 − 0, 7)(1 − 0, 9) = 0, 015.

Suy ra
P (A) = 1 − P (Ā) = 1 − 0, 015 = 0, 985.

Cách khác: Tính xác suất

A = A1 ∪ Ā1 A2 ∪ Ā1 Ā2 A3 .

Ví dụ 1.32. Trong số bệnh nhân ở một bệnh viện PNT có 50% điều trị bệnh
A, 30% điều trị bệnh B, 20% điều trị bệnh C. Xác suất để chữa khỏi bệnh A,
B và C trong bệnh viện tương ứng là 0,7 , 0,8 và 0,9. Hãy tính tỉ lệ chữa khỏi
bệnh A trong tổng số bệnh nhân đã được chữa khỏi bệnh.

Giải:
25

Gọi
A: "bệnh nhân điều trị bệnh A"
B: "bệnh nhân điều trị bệnh B"
C: "bệnh nhân điều trị bệnh C"
H : "bệnh nhân được chữa khỏi bệnh".
Ta có
P (A) = 0, 5; P (B) = 0, 3; P (C) = 0, 2,
P (H/A) = 0, 7; P (H/B) = 0, 8; P (H/C) = 0, 9.
Theo công thức Bayès:

P (H/A)P (A)
P (A/H) =
P (H/A)P (A) + P (H/B)P (B) + P (H/C)P (C)
0, 5.0, 7 5
= = .
0, 5.0, 7 + 0, 3.0, 8 + 0, 2.0, 9 11

Ví dụ 1.33. Có một bệnh nhân mà bác sĩ chẩn đoán mắc bệnh A với xác suất
70%, mắc bệnh B với xác suất 30%. Để có thêm một thông tin chuẩn đoán, bác
sĩ đã cho xét nghiệm sinh hóa. Sau 3 lần thử thấy có một lần dương tính, biết
rằng khả năng dương tính của mỗi lần xét nghiệm đối với bệnh A và B tương
ứng là 10% và 30%. Hãy cho biết nên chuẩn đoán bệnh nhân mắc bệnh nào?

Giải:

Xét các biến cố


C: "thấy dương tính sau 3 lần xét nghiệm",
A: "bệnh nhân mắc bệnh A",
B: "bệnh nhân mắc bệnh B".
Ta có A, B lập thành nhóm đầy đủ và P (A) = 0, 7, P (B) = 0, 3. Chúng ta
phải tính các xác suất
P (C/A)P (A)
P (A/C) = P (C)
,
P (C/B)P (B)
P (B/C) = P (C)
.
Gọi
Ai là biến cố lần thứ i khám dương tính đối với bệnh A, i=1,2,3,
Bj là biến cố lần thứ j khám dương tính đối với bệnh B, j=1,2,3.
26

Khi đó

P (C/A) = P (A1 ∩ Ā2 ∩ Ā3 ) ∪ (Ā1 ∩ A2 ∩ Ā3 ) ∪ (Ā1 ∩ Ā2 ∩ A3 )
= 0, 1.0, 9.0, 9 + 0, 9.0, 1.0, 9 + 0, 9.0, 9.0, 1
= 3.0, 1.0, 9.0, 9 = 0, 243.

P (C/B) = P (B1 ∩ B̄2 ∩ B̄3 ) ∪ (B̄1 ∩ B2 ∩ B̄3 ) ∪ (B̄1 ∩ B̄2 ∩ B3 )
= 0, 3.0, 7.0, 7 + 0, 7.0, 3.0, 7 + 0, 7.0, 7.0, 3
= 3.0, 3.0, 7.0, 7 = 0, 441.

Theo công thức xác suất toàn phần, ta có

P (C) = P (C/A)P (A) + P (C/B)P (B)


= 0, 243.0, 7 + 0, 441.0, 3 = 0, 3024.

Áp dụng công thức Bayès cho ta


0, 243.0, 7
P (A/C) = = 0, 5625,
0, 3024
0, 441.0, 3
P (B/C) = = 0, 4375.
0, 3024
Vậy nên chuẩn đoán bệnh nhân mắc bệnh A thì khả năng đúng cao hơn.
(Nếu tiến hành xét nghiệm sinh hóa, sau n lần thực hiện có k lần cho kết quả
dương tính thì bài toán giải như thế nào? )

Ví dụ 1.34. Từ một lọ có 10 viên thuốc, trong đó có 4 viên còn hạn sử dụng,


lấy lần lượt ra 2 viên. Gọi Tk , với k = 1, 2, là biến cố "nhận được viên thuốc
còn hạn sử dụng ở lần lấy thứ k". Xét tính độc lập của của T1 , T2 trong trường
hợp lấy có hoàn lại và không hoàn lại.

Giải:

a. Trường hợp có hoàn lại: Khi đó, một cách trực giác, ta thấy biến cố
T1 , T2 độc lập với nhau. Chúng ta kiểm chứng lại như sau:
4
P (T1 ) = ,
10
P (T2 ) = P (T2 /T1 )P (T1 ) + P (T2 /T¯1 )P (T¯1 )
4 4 4 6 4
= + = .
10 10 10 10 10
27

Do đó
4 4
P (T1 ∩ T2 ) = P (T2 /T1 )P (T1 ) = = P (T1 )P (T2 ).
10 10
b. Trường hợp không hoàn lại: Vì cơ may để lần thứ nhì lấy được viên
thuốc còn hạn sử dụng phụ thuộc viên thuốc nhận được ở lần thứ nhất có là
còn hạn sử dụng hay không? vì thế 2 biến cố T1 , T2 không độc lập. Thật vậy,
ta có
4
P (T1 ) = ,
10
P (T2 ) = P (T2 /T1 )P (T1 ) + P (T2 /T¯1 )P (T¯1 )
3 4 4 6 4
= + = .
9 10 9 10 10
nhưng
3 4
P (T1 ∩ T2 ) = P (T2 /T1 )P (T1 ) = 6= P (T1 )P (T2 ).
9 10

1.4. Một số khái niệm xác suất trong Y học

Giả sử chúng ta đang cần sàng tuyển cộng đồng một loại bệnh nào đó. Gọi
D , D− là các biến cố một người có bệnh, không có bệnh và T + , T − là các
+

biến cố kĩ thuật chẩn đoán cho kết quả dương tính, âm tính.

1.4.1. Độ nhạy
Độ nhạy của một nghiệm pháp sàng tuyển là xác suất cho kết quả dương
tính trong số những người bị bệnh, kí hiệu là Se

Se = P (T + /D+ ).

Độ nhạy đại diện cho tính chính xác, không bỏ sót bệnh.

1.4.2. Độ đặc hiệu


Độ đặc hiệu của một nghiệm pháp sàng tuyển là xác suất cho kết quả âm
tính trong số những người không bị bệnh, kí hiệu là Sp

Sp = P (T − /D− ).

Độ đạc hiệu đại diện cho việc không chẩn đoán nhầm bệnh.
Chú ý: Một nghiệm pháp sàng tuyển được coi là tốt nếu cả độ nhạy và
độ đặc hiệu đều cao. Tuy nhiên, nếu độ nhạy cao thì độ đặc hiệu sẽ thấp và
28

ngược lại. Do đó, trên thực tế tùy thuộc vào từng loại bệnh mà chúng ta ưu
tiên cho độ nhạy hay độ đạc hiệu

• Các loại bệnh ưu tiên độ nhạy cao là các loại bệnh nguy hiểm, có thể
chữa khỏi nếu phát hiện sớm hoặc việc phát hiện nhầm không gây tổn
thương về tinh thần cũng như vật chất cho người bệnh.

• Các loại bệnh ưu tiên cho độ đạc hiệu cao là các bệnh khó chữa, nếu có
phát hiện sớm thì hiệu quả điều trị cũng không cao hơn việc phát hiện
muộn là mấy.

Người ta có thể kết hợp cả độ nhạy và độ đạc hiệu để đánh giá một nghiệm
pháp sàng tuyển bằng tỉ số khá dĩ LR
P (T + /D+ ) Se
LR = = .
P (T + /D− ) 1 − Sp
Rõ rằng một nghiệm pháp có độ nhạy và độ đạc hiệu cao thì LR sẽ cao.

1.4.3. Giá trị tiên lượng dương


Giá trị tiên lượng dương là xác suất một người bị bệnh thực sự trong trường
hợp kết quả chẩn đoán là dương tính, kí hiệu là PPV

P P V = P (D+ /T + ).

1.4.4. Giá trị tiên lượng âm


Giá trị tiên lượng âm là xác suất một người không bị bệnh thực sự trong
trường hợp kết quả chẩn đoán là âm tính, kí hiệu là NPV

N P V = P (D− /T − ).

Giả sử kết quả của một nghiệm pháp sàng tuyển trong một cộng đồng, áp
dụng đối với n người được trình bày dưới dạng bảng ??:
Khi đó, ta có:
a
Se =
a+c
d
Sp =
b+d
a
PPV =
a+b
d
NP V =
c+d
29

Cũng từ bảng trên chúng ta có


Tỉ lệ hiện mắc, tức là xác suất một người bị mắc bệnh

Số người bị bệnh a+c


P (D+ ) = = .
Tổng số dân a+b+c+d

Tỉ lệ dương tính giả, tức là xác suất cho kết quả xét nghiệm dương tính
trong trường hợp một người không bị bệnh

b
P (T + /D− ) = = 1 − Sp.
b+d

Tỉ lệ âm tính giả, tức là xác suất cho kết quả xét nghiệm âm tính trong
trường hợp một người bị bệnh

c
P (T − /D+ ) = = 1 − Se.
a+c

Ví dụ 1.35. Giả sử kết quả chẩn đoán ung thư phổi của một nghiệm pháp
sàng tuyển cho bởi bảng 1.3

Bảng 1.3

Căn cứ vào bảng ta có:


30

240
Se = = 0, 6
240 + 160
576
Sp = = 0, 96
24 + 576
240
PPV = = 0, 91
240 + 24
576
NP V = = 0, 78
160 + 576
0, 6
LR = = 15
1 − 0, 96
400
P (D+ ) = = 0, 4
1000
P (T − /D+ ) = 1 − Se = 1 − 0, 6 = 0, 4
P (T + /D− ) = 1 − Sp = 1 − 0, 96 = 0, 04

Ví dụ 1.36. Tỉ lệ hiện mắc của một loại bệnh tại một địa phương là 0,02.
Dùng một kĩ thuật chẩn đoán có độ nhạy là 0,95 và tỉ lệ dương tính giả là 10%.
a. Tính xác suất phản ứng dương tính.
b. Tính giá trị tiên đoán dương.
c. Tính xác suất chẩn đoán đúng.

Giải:

Gọi D+ , D− là các biến cố có bệnh, không có bệnh và T + , T − là các biến


cố kĩ thuật chẩn đoán cho kết quả dương tính, âm tính.
Khi đó, ta có P (D+ ) = 0, 02, P (T + /D+ ) = 0, 95, P (T + /D− ) = 0, 1.
Suy ra P (D− ) = 1 − 0, 02 = 0, 98, P (T − /D− ) = 1 − 0, 1 = 0, 9.
a. Xác suất phản ứng dương tính

P (T + ) = P (D+ )P (T + /D+ ) + P (D− )P (T + /D− )


= 0, 02.0, 95 + 0, 98.0, 1 = 0, 117.

b. Giá trị tiên đoán dương

P (D+ )P (T + /D+ ) 0, 02.0, 95


P (D+ /T + ) = +
= = 0, 162.
P (T ) 0, 117
31

c. Xác suất chẩn đoán đúng


P (T + D+ + T − D− ) = P (T + D+ ) + P (T − D− )
= P (D+ )P (T + /D+ ) + P (D− )P (T − /D− )
= 0, 02.0, 95 + 0, 98.0, 9 = 0, 901.

1.5. Bài tập

Giải tích Tổ hợp


13P2 - (13-1)x2
Bài tập 1.1. Giải vô địch bóng đá quốc gia gồm 13 đội được thi đấu theo
thể thức hai lượt trên sân nhà và sân khách. Hỏi phải tổ chức tổng cộng bao
nhiêu trận đấu? Tính cả lượt đi và lượt về mỗi đội phải đấu mấy trận?
Bài tập 1.2. Xếp ngẫu nhiên 6 bệnh nhân vào 6 phòng điều trị (mỗi phòng
có ít nhất 6 giường bệnh).
a. Có bao nhiêu cách? 6 người: mỗi người 6 lựa chọn; 6^6
b. Có bao nhiêu cách sao cho phòng nào cũng có bệnh nhân? 6!
Bài tập 1.3. Một đa giác lồi n cạnh có bao nhiêu đường chéo? nC2 -n
Bài tập 1.4. Trong một lớp có 100 sinh viên. Có mấy cách thành lập ban đại
diện gồm 1 lớp trưởng, 1 lớp phó, 1 thủ quỹ? 100P3
Bài tập 1.5. Một hộp đựng 8 viên bi xanh, 5 viên bi đỏ, 3 viên bi vàng. Có
bao nhiêu cách chọn từ đó ra 4 viên bi nếu
a. Có đúng 2 bi xanh. 8C2x8C4
b. Số bi xanh bằng bi đỏ. 8x5x3C2 +
8C2+5C2
Xác suất
Bài tập 1.6. Một hộp thuốc có 100 viên, trong đó có 10 viên kém chất lượng.
Lấy ngẫu nhiên ra 20 viên. Tìm xác suất để cho trong 20 viên lấy ra:
a. Có 5 viên kém chất lượng.
b. Bị cả 10 viên kém chất lượng.
Bài tập 1.7. Lấy ngẫu nhiên ra 5 con bài từ bộ tú lơ khơ 52 quân. Tìm xác
suất của các biến cố sau:
a. Lấy được 2 con màu đỏ.
b. Lấy được 1 con cơ, 2 con rô và 2 con đen.
c. Lấy được 2 con át, 1 con 9 và 2 con 5.
32

Bài tập 1.8. Công ty X phát hành 25 vé khuyến mãi trong đó có 5 vé trúng
thưởng. Một đại lí được phân phối 3 vé. Tính xác suất để đại lí đó có:
a. Một vé trúng.
b. Ít nhất một vé trúng.

Bài tập 1.9. Một bình đựng 5 viên bi xanh, 7 viên bi đỏ và 4 viên bi vàng.
Lấy ngẫu nhiên 4 viên bi. Tính xác suất trong các tình huống sau:
a. Lấy được 1 bi xanh và 3 vàng.
b. Lấy được đủ 3 màu.
c. Lấy được 4 viên bi cùng màu.

Bài tập 1.10. Cho A, B và C là 3 biến cố. Chứng minh

P (A + B + C) = P (A) + P (B) + P (C) − P (AB) − P (BC) − P (AC) + P (ABC).

Bài tập 1.11. Cho P (A) = 13 , P (B) = 1


2
và P (A ∪ B) = 43 .
Tính P (A ∩ B), P (Ā ∩ B̄), P (Ā ∪ B̄), P (Ā ∩ B) và P (A ∩ B̄).

Bài tập 1.12. Trong điều trị bệnh lao có hiện tượng kháng thuốc. Gọi A là
hiện tượng "kháng INH của vi khuẩn lao", B là hiện tượng "kháng PAS của vi
khuẩn lao", C là hiện tượng "kháng Streptomycin của vi khuẩn lao". Qua theo
dõi ta biết khả năng kháng INH của vi khuẩn lao là 20%, nghĩa là P (A) = 0, 2.
Tương tự, P (B) = 0, 4, P (C) = 0, 3. Việc kháng các loại thuốc khác nhau là
độc lập với nhau. Nếu phối hợp cả 3 loại thuốc trên thì khả năng khỏi bệnh
là bao nhiêu? 1 - 0.2x0.3x0.4

Bài tập 1.13. Tỷ lệ người bị mắc bệnh tim trong một vùng dân cư là 9%,
mắc bệnh huyết áp là 12%, mắc cả hai bệnh là 7%. Chọn ngẫu nhiên một
người trong vùng. Tính xác suất để người đó
a. Bị bệnh tim hay bị huyết áp.
b. Không bị bệnh tim cũng không bị huyết áp.
c. Không bị bệnh tim hay không bị huyết áp.
d. Bị bệnh tim nhưng không bị huyết áp.
e. Không bị bệnh tim nhưng bị huyết áp.

Bài tập 1.14. Một khoa điều trị có 3 bệnh nhân nặng với xác suất cần cấp
cứu trong mỗi ca trực của bệnh nhân tương ứng là 50%, 60%, 80%. Tìm khả
năng xảy ra các tình huống sau:
33

a. Không bệnh nhân nào phải cấp cứu. 0.04


b. Có ít nhất một người phải cấp cứu. 0.96
c. Chỉ có một bệnh nhân phải cấp cứu. 0.26
d. Cả 3 bệnh nhân đều phải cấp cứu. 0.24

Xác suất có điều kiện


Bài tập 1.15. Cho A, B là hai biến cố độc lập. Chứng minh rằng A, B̄; Ā, B
và Ā, B̄ cũng là các cặp biến cố độc lập.
Bài tập 1.16. Cho P (A) = 0, 5 và P (A ∪ B) = 0, 7. Tính P(B) nếu
a. A và B là 2 biến cố độc lập. 0.6
b. A và B là 2 biến cố xung khắc. 0.2

Bài tập 1.17. Cho P (A) = 0, 25 và P (B/A) = 2P (B/Ā). Tính P (A/B) 0.4 áp CT
Bayes
Bài tập 1.18. Cho A, B, C và D là các biến cố thỏa B = Ā, C ∩ D = Ø và
P (A) = 41 , P (B) = 34 , P (C/A) = 21 , P (C/B) = 34 , P (D/A) = 41 , P (D/B) = 81
Tính P (C ∪ D). 27/32 áp CT xác suất toàn phần
Bài tập 1.19. Chứng minh công thức Bayès trong chẩn đoán (xem 1.4.):
p.Se
PPV =
p.Se + (1 − p)(1 − Sp)
trong đó: p, Se, Sp, PPV lần lượt là tỉ lệ hiện mắc, độ nhạy, độ đạc hiệu và
giá trị tiên lượng dương.
Bài tập 1.20. Tỉ lệ cha mắt đen, con mắt đen là 0,782; cha mắt đen, con mắt
xanh là 0,079; cha mắt xanh, con mắt đen là 0,089; cha mắt xanh, con mắt
xanh là 0,05.
a. Tính khả năng con mắt đen, biết rằng cha mắt đen?
b. Tính khả năng con mắt xanh, biết rằng cha mắt xanh?
Bài tập 1.21. Một cặp trẻ sinh đôi có thể do cùng 1 trứng (sinh đôi thật) hay
do 2 trứng khác nhau sinh ra (sinh đôi giả). Các cặp sinh đôi thật luôn cùng
giới tính. Các cặp sinh đôi giả thì xác suất để cùng giới tính là 0,5. Thống kê
cho thấy 34% cặp sinh đôi là trai; 30% cặp sinh đôi là gái và 36% cặp sinh đôi
có giới tính khác nhau.
a. Tính tỉ lệ cặp sinh đôi thật.
b. Tìm tỷ lệ cặp sinh đôi thật trong số các cặp sinh đôi cùng giới tính.
34

Bài tập 1.22. Trong một vùng dân cư, tỉ lệ những người bị nghiện rượu là
20%, những người bị ung thư gan là 23%, những người vừa bị ung thư gan vừa
nghiện rượu là 18%. Gặp ngẫu nhiên một người của vùng dân cư đó, người
này không bị nghiện rượu. Tính khả năng người bị ung thư gan.
12
Bài tập 1.23. Trong một làng, tỷ lệ giữa nam và nữ là 13
. Khả năng bệnh
bạch tạng ở nam là 0,6%, ở nữ là 0,35%
a. Tính xác suất mắc bệnh bạch tạng chung của cả làng.
b. Gặp trong làng một người không mắc bệnh. Tìm xác suất để người đó
là nam? là nữ?

Bài tập 1.24. Một nghiên cứu cho thấy, có 5% đàn ông bị mù màu và 0,25%
đàn bà bị mù màu. Giả sử số đàn ông bằng số đàn bà. Chọn 1 người mù màu
một cách ngẫu nhiên. Hỏi xác suất để người đó là đàn ông là bao nhiêu?

Bài tập 1.25. Ở một vùng dân cư, cứ 100 người có 30 người hút thuốc lá.
Biết rằng tỉ lệ bị viêm họng trong số những người hút thuốc lá là 60%, còn
những người không hút thuốc là 30%. Khám ngẫu nhiên một người thì thấy
anh ta bị viêm họng. Tìm xác suất để người đó hút thuốc lá? Nếu người đó
không bị viêm họng thì xác suất người đó hút thuốc lá là bao nhiêu?

Bài tập 1.26. Các nhà nghiên cứu y tế biết rằng xác suất bị ung thư phổi
nếu người hút thuốc là 0,34; người không hút thuốc lá bị ung thư phổi là 0,03.
Họ cũng cho biết rằng có 11% dân số hút thuốc lá. Khám ngẫu nhiên cho một
người thì anh ta không bi viêm phổi. Tính xác suất để anh ta là người không
hút thuốc.

Bài tập 1.27. Trong số bệnh nhân ở bệnh viện có 20% điều trị bệnh A, 50%
điều trị bệnh B và 30% điều trị bệnh C. Xác suất để chữa khỏi các bệnh A, B
và C trong bệnh viện này tương ứng là 0,7; 0,8 và 0,8. Hãy tính tỉ lệ bệnh nhân
được chữa khỏi bệnh B trong tổng số bệnh nhân đã được chữa khỏi bệnh.

Bài tập 1.28. Khi đến phòng cấp cứu của bệnh viện, bệnh nhân được phân
loại theo tình trạng của họ như nguy kịch, nghiêm trọng, hoặc ổn định. Trong
năm qua có 10% số bệnh nhân phòng cấp cứu là nguy kịch, 30% số bệnh nhân
phòng cấp cứu nghiêm trọng, còn lại là ổn định. 40% số bệnh nhân nguy kịch,
10% số bệnh nhân nghiêm trọng, 1% của bệnh nhân ổn định đã chết. Gặp
một bệnh nhân xuất viện từ phòng cấp cứu, tính xác suất để đó là bệnh nhân
nghiệm trọng ?
35

Bài tập 1.29. Hộp A có 15 lọ thuốc gồm: 3 lọ hỏng và 12 lọ tốt,


Hộp B có 15 lọ thuốc gồm: 4 lọ hỏng và 11 lọ tốt,
Từ hộp A lấy ngẫu nhiên một lọ rồi bỏ vào hộp B, rồi từ đó lấy ngẫu nhiên
một lọ
a. Tìm xác suất để lọ lấy ra từ hộp B là lọ hỏng.
b. Giả sử lọ lấy ra từ hộp B là lọ hỏng. Theo ý bạn thì lọ lấy từ hộp A bỏ
sang hộp B là lọ thuốc hỏng hay tốt?
Bài tập 1.30. Hộp A có 15 lọ thuốc gồm: 3 lọ hỏng và 12 lọ tốt,
Hộp B có 15 lọ thuốc gồm: 4 lọ hỏng và 11 lọ tốt,
Hộp C có 15 lọ thuốc gồm: 5 lọ hỏng và 10 lọ tốt.
Chọn ngẫu nhiên một hộp, rồi từ đó lấy ra 3 lọ. Tính xác suất để:
a. Được 3 lọ tốt.
b. Được 2 lọ tốt và 1 lọ hỏng.
Bài tập 1.31. Một hồi cứu về ung thứ vú đã phẫu thuật cho biết: Tỷ lệ sống
quá 5 năm là 90%, tỷ lệ không có hạch di căn trong số những người sống quá
5 năm là 80%, tỷ lệ có hạch di căn trong số những người không sống quá 5
năm là 70%, Một người ung thứ vú mà có hạch di căn, tính khả năng người
này sống quá 5 năm sau khi phẫu thuật.
Bài tập 1.32. Một nghiên cứu y tế theo dõi một nhóm người trong 5 năm.
Khi bắt đầu nghiên cứu, 20% được phân loại hút thuốc lá nặng, 30% là người
hút thuốc lá nhẹ và 50% là người không hút thuốc. Kết quả của nghiên cứu cho
thấy rằng tỉ lệ người tử vong do hút thuốc lá nhẹ gấp đôi những người không
hút thuốc, nhưng chỉ một nửa những người hút thuốc lá nặng. Một người được
lựa chọn ngẫu nhiên từ nghiên cứu này đã tử vong trong khoảng thời gian năm
năm. Tính toán xác suất để người này là một người hút thuốc nặng.
Bài tập 1.33. Giả sử có một loại bệnh mà tỉ lệ mắc bệnh là 1/1000. Giả sử
có một loại xét nghiệm mà ai mắc bệnh cũng ra phản ứng dương tính, nhưng
tỉ lệ phản ứng dương tính nhầm là 5% (tức là trong số những người không bị
bệnh có 5% số người thử ra phản ứng dương tính). Khi một người xét nghiệm
bị phản ứng dương tính, thì khả năng mắc bệnh của người đó là bao nhiêu?
Bài tập 1.34. Biết rằng tỉ lệ người mắc bệnh X ở một địa phương là 2%.
Người ta sử dụng một xét nghiệm mà nếu người bị bệnh thì kết quả luôn luôn
dương tính, nếu không bị bệnh thì kết quả có thể dương tính với xác suất là
0,2.
36

a. Tìm xác suất phản ứng dương tính.


b. Tìm tỉ lệ người bị bệnh, tỉ lệ người không bị bệnh trong nhóm người có
kết quả dương tính.
Bài tập 1.35. Tại một bệnh viện, tỉ lệ mắc bệnh X là 15%. Để chẩn đoán
xác định người ta làm phản ứng miễn dịch, nếu không bị bệnh thì phản ứng
dương tính chỉ có 10%. Mặt khác biết rằng khi phản ứng là dương tính thì xác
suất bị bệnh là 0,5.
a. Tìm xác suất phản ứng dương tính của nhóm có bệnh.
b. Tìm xác suất chẩn đoán đúng.
Bài tập 1.36. Hai xét nghiệm T1 và T2 được dùng để chẩn đoán bệnh X.
Bệnh này không lây lan và diễn tiến đến tử vong nếu không được chẩn đoán
và điều trị, mà việc điều trị cũng ít tốn kém. T1 cho âm tính giả 2%, dương
tính giả 25%; còn T2 cho dương tính giả 2%, âm tính giả 25%.
a. Tính độ nhạy và độ đạc hiệu của T1 và T2 .
b. Nếu chỉ dùng một trong hai xét nghiệm dùng để chẩn đoán bệnh nhân
nghi ngờ bị bệnh X, nên chọn xét nghiệm nào? Tại sao?
Bài tập 1.37. Thống kê cho thấy khả năng mắc bệnh X rất hiếm khi xảy ra,
P(X)=1/1000. Hai bác sĩ nổi tiếng được mời chẩn đoán cho một bệnh nhân,
biết xác suất chẩn đoán đúng của cả hai bác sĩ đều là 0,9. Giả sử cả hai bác
sĩ đều độc lập với nhau đều khẳng định bệnh nhân mắc bệnh X. Khi đó cần
đánh giá xác suất mắc bệnh là bao nhiêu?
Bài tập 1.38. Một bệnh nhân bị nghi mắc một trong 3 bệnh A, B, C với xác
suất tương ứng là 0,3; 0,4; 0,3. Người đó đến khám bệnh ở 4 bác sĩ một cách
độc lập. Bác sĩ thứ nhất chẩn đoán bệnh A, bác sĩ thứ 2 chẩn đoán bệnh B,
bác sĩ thứ 3 chẩn đoán bệnh C và bác sĩ thứ 4 chẩn đoán bệnh A. Hỏi sau khi
khám bệnh xong, người bệnh cần đánh giá lại xác suất mắc bệnh của mình là
bao nhiêu. Biết rằng xác suất chẩn đoán đúng của mỗi bác sĩ là 0,6 và chẩn
đoán nhầm sang hai bệnh còn lại là 0,2 và 0,2.
Bài tập 1.39. Cho biết tỉ lệ người có nhóm máu O, A, B và AB của dân cư
thành phố X là 25%; 40%; 25%; 10% và thành phố Y là 45%; 40%; 10%; 5%.
Biết rằng một người có nhóm máu AB có thể nhận máu của bất kì nhóm
máu nào. Nếu người đó có nhóm máu còn lại (A hoặc B hoặc O) thì chỉ có thể
nhận máu của người cùng nhóm với mình hoặc người có nhóm máu O. Giả sử
một bệnh nhân là người thành phố X.
37

a. Nếu biết bệnh nhân có nhóm máu B . Tính xác suất để chọn ngẫu nhiên
một người của thành phố Y có thể truyền máu cho bệnh nhân được.
b. Nếu chưa biết nhóm máu của bệnh nhân. Tính xác suất để chọn ngẫu
nhiên một người của thành phố Y có thể truyền máu cho bệnh nhân được.

Hướng dẫn và đáp số


2 = 13.12 = 156 trận.
1.1 Cần phải tổ chức: 2.C13
Một đội phải đá: 2(13 − 1) = 24 trận.

1.2 66 , 6!.

1.3 Cn2 − n.

1.4 Nếu kiêm nhiệm: 1003 . Nếu không kiêm nhiệm: A3100 .

1.5 a. C82 C82 , b.C82 C52 + C81 C51 C32 .

5 C 15 /C 20 , b. C 10 C 10 /C 20 .
1.6 a. C10 90 100 10 90 100

2 C 3 /C 5 ; b. C 1 C 2 C 2 /C 5 ; c. C 2 C 1 C 2 /C 5 .
1.7 a. C26 26 52 13 13 26 52 4 4 4 52

1.8 a. C51 C20


2 /C 3 ; b. 1 − C 0 C 3 /C 3 .
25 5 20 25

1.9 a. C51 C43 /C16


4 ; b. C 1 C 1 C 2 + C 1 C 2 C 1 + C 2 C 1 C 1 /C 4 ;

4 7 5 4 7 5 4 7 5 16
c. C54 + C74 + C44 /C16
 4
.

1.10 Suy từ công thức cộng 2 biến cố.

1
1.11 P (A ∩ B) = 12 , P (Ā ∩ B̄) = 41 , P (Ā ∪ B̄) = 11
12 , P (B ∩ Ā) = 5
12 , P (A ∩ B̄) = 41 .

1.12 0.976

1.13 Tương tự bài tập 1.11, sử dụng công thức cộng và các tính chất của biến cố.

1.14 a. 0,04; b. 0,96; c. 0,26; d. 0,24.

1.15 Sử dụng công thức xác suất có điều kiện.

1.16 a. 0,4, b. 0,2.


38
2
1.17 5

27
1.18 32 .

1.18

1.20 a. 0,9082; b. 0,3597

1.21 a. 0,28; b.0,438

1.22 0,0625.

1.23 a. 0,0047; b. 0,4794; 0,5206.

1.24 0,9524.

1.25 6/13; 12/61.

1.26 0,4167.

1.27 0,5128.

1.28 0,2922.

1.29 tự giải.

1.30 a. 0,37; b. 0,47.

1.31 0,72.

1.32 0,42

1.33 0,02.

1.34 a. 0,216; b.0,0926; 0,9074.

1.35

1.36 Chọn T1 .

1.37 0,075 (tăng 7,5 lần)

1.38 0,5625; 0,25; 0,1875.

1.39 a. 0,55; b. 0,69


Chương 2
Biến số ngẫu nhiên

MỤC TIÊU:

1. Trình bày được các khái niệm liên quan đến biến ngẫu nhiên, phân biệt
được biến ngẫu nhiên rời rạc và liên tục

2. Lập bảng phân phối xác suất, tính được các tham số đặc trưng của biến
ngẫu nhiên

Xét phép thử, với không gian mẫu Ω. Giả sử ứng với mỗi biến cố sơ cấp
ω ∈ Ω, ta liên kết với một số thực X(ω) ∈ R, thì X được gọi là biến số ngẫu
nhiên hay vắn tắt là biến ngẫu nhiên (tài liệu viết tắt là BNN).

Ví dụ 2.1. a. Xét phép thử tung một đồng xu, với không gian mẫu Ω = {S, N } .
Gọi X là số lần xuất hiện mặt sấp, khi đó X là BNN nhận các giá trị 0, 1.
Ta kí hiệu các biến cố X = 0 để chỉ số lần xuất hiện mặt sấp là 0 và biến
cố X = 1 để chỉ số lần xuất hiện mặt sấp là 1. Đồng thời P (X = 0) = 21 ,
P (X = 1) = 12 chỉ các xác suất của các biến cố X=0, X=1 là 21 .
b. Phép thử gieo một con xúc xắc. Gọi X là số chấm xuất hiện, thì X là BNN
nhận các giá trị 1, 2, 3, 4, 5 và 6. Tương tự như trên ta cũng có các xác suất
tương ứng với các biến cố X=1, X=2, X=3, X=4, X=5, X=6 là P (Xi ) = 16 ,
với i=1,2,...,6.
c. Kiểm tra một hộp thuốc. Gọi X là số viên bị hỏng trong hộp gồm n viên,
thì X là BNN nhận các giá trị 0, 1, 2, ..., n.
d. Khám bệnh cho 50 người. Gọi X là số người bị bệnh thì X là BNN nhận
giá trị 0, 1, 2, ..., 50.

Dễ thấy là nhiều biến cố ngẫu nhiên mà ta khảo sát ở chương 1 đều có thể
được biểu diễn thông qua khái niệm BNN. Một số trường hợp như gieo đồng
xu để chờ mặt sấp hay ngửa xuất hiện thì các kết quả thu được không phải là
những con số. Tuy nhiên chúng ta có thể đặt ra qui định như: nếu xuất hiện
40

mặt sấp thì được 10 đồng, nếu xuất hiện mặt ngửa thì ta mất 5 đồng. Khi
đó, gọi X là số tiền được hay mất, thì X là BNN nhận các giá trị 10, -5 và
P (X = 10) = P (X = −5) = 12 .
Biến ngẫu nhiên thường được kí hiệu bằng các kí tự in như X, Y, Z, ... các
giá trị mà BNN nhận thường viết bằng các kí tự thường x1 , x2 , ..., y, z....
Khi BNN X nhận giá trị hữu hạn hay vô hạn đếm được, ta nói X là biến
ngẫu nhiên rời rạc. Các BBN ở các ví dụ vừa nêu ở trên là các biến ngẫu nhiên
rời rạc.
Khi BNN X nhận giá trị là một khoảng của R (hay cả R), ta nói X là biến
ngẫu nhiên liên tục. Chẳng hạn như khi đo chiều cao, huyết áp, nhiệt độ, ...
của một nhóm bệnh nhân, ta gọi X là các kết quả thu được thì X là BNN liên
tục.

2.1. Biến ngẫu nhiên rời rạc

2.1.1. Bảng phân phối xác suất


Xét BNN rời rạc X nhận các giá trị x1 , x2 , ..., xn , .... Giả sử x1 < x2 < ... <
xn < .... Bảng các bộ giá trị tương ứng

X x1 x2 ... xn ...
P p1 p2 ... pn ...

với pi = P (X = xi ), p1 + p2 + ... + pn + ... = 1, được gọi là bảng phân phối


xác suất của X.

Ví dụ 2.2. Thảy hai đồng xu, nếu được một mặt sấp và một mặt ngửa thì
được 5đ, nếu được 2 mặt sấp thì mất 3đ, nếu được 2 mặt ngửa thì mất 2đ. Gọi
X để chỉ số tiền được hay mất. Ta có X là BNN nhận các giá trị là -3, -2 và
5 với
1
P (X = −3) = P (SS) = 4
= 0, 25,
1
P (X = −2) = P (N N ) = 4
= 0, 25,
P (X = 5) = P ({SN, N S}) = 42 = 0, 5.
Từ đó ta có bảng phân phối xác suất của X

X −3 −2 5
P 0, 25 0, 25 0, 5
41

2.1.2. Hàm mật độ


Hàm số f: R → R xác định bởi
(
pi khi x = xi
f (x) =
0 6 xi , với i= 1, 2, ...
khi x =
được gọi là hàm mật độ xác suất, hay vắn tắt là hàm mật độ của BNN X. Từ
tính chất của bảng phân phối xác suất ta có
(i) Với mọi x, f (x) ≥ 0,
(ii) p1 + p2 + ... + pn + ... = 1.
Ví dụ 2.3. Tung đồng xu 3 lần. Gọi X là số mặt sấp nhận được, thì X nhận
các giá trị 0, 1, 2, 3. Ta có không gian mẫu
Ω = {SSS, SSN, SN S, SN N, N SS, N SN, N N S, N N N } .
Với
P (X = 0) = P (N N N ) = 18 ,
P (X = 1) = P ({SN N, N SN, N N S}) = 38 ,
P (X = 2) = P ({SSN, SN S, N SS}) = 83 ,
P (X = 3) = P (N N N ) = 18 .
Ta có bảng phân phối xác suất
X 0 1 2 3
1 3 3 1
P 8 8 8 8

Từ đó, ta nhận được hàm mật độ của X



1

 8
khi x=0

3
khi x=1


8

f (x) = 38 khi x=2
 1
khi x=3




 8
0 khi x 6= 0, 1, 2, 3.

2.1.3. Hàm phân phối


Với f: R → R là hàm mật độ của BNN rời rạc X, hàm số F : R → R xác
định bởi

0
 khi x < x1
F (x) = P (X < x) = p1 + p2 + ... + pk−1 khi xk−1 ≤ x < xk

1 khi x ≥ xn

42

được gọi là hàm phân phối tích lũy hay văn tắt là hàm phân phối của X.
Từ tính chất của hàm mật độ và định nghĩa hàm phân phối ta có
(i) 0 ≤ F (x) ≤ 1, với mọi x ∈ R,
(ii) F (−∞) = 0 và F (+∞) = 1,
(iii) F là hàm tăng, nghĩa là nếu x1 < x2 thì F (x1 ) ≤ F (x2 ),
(iv) F liên tục bên phải tại mọi x ∈ R.

Ví dụ 2.4. Với biến ngẫu nhiên X ở ví dụ 2.3, ta có hàm phân phối




 0 khi x<0

1
khi 0≤x<1


8

F (x) = 48 khi 1≤x<2
 7
khi 2≤x<3




 8
1 khi 3≤x

2.2. Biến ngẫu nhiên liên tục

2.2.1. Hàm mật độ


Hàm số f: R → R được gọi là hàm mật độ xác suất, hay vắn tắt là hàm
mật độ của BNN liên tục X nếu
Z b
P (a ≤ x ≤ b) = f (x)dx
a

với mọi a, b ∈ R, a ≤ b.
Từ đó, ta có các tính chất sau
(i) với mọi x ∈ R, f (x) ≥ 0,
R +∞
(ii) −∞ f (x)dx = 1.

2.2.2. Hàm phân phối


Hàm số F: R → R được gọi là hàm phân phối tích lũy , hay vắn tắt là hàm
phân phối của BNN liên tục X nếu

F (x) = P (X < x), với mọi x ∈ R.

Suy trực tiếp từ định nghĩa, ta được


(i) 0 ≤ F (x) ≤ 1, với mọi x ∈ R,
43

(ii) F (−∞) = 0 và F (+∞) = 1,


(iii) F là hàm tăng, nghĩa là nếu x1 < x2 thì F (x1 ) ≤ F (x2 ),
(iv) P (a ≤ x < b) = F (b) − F (a).
Hơn nữa, ta có sự liên hệ giữa hàm mật độ f và hàm phân phối F của BNN
liên tục X như sau
Z x
F (x) = f (t)dt, với mọix ∈ R.
−∞

Ví dụ 2.5. Cho X là BNN liên tục với hàm mật độ




 0 khi x<0

x khi 0≤x<1
f (x) =


 2−x khi 1≤x<2
2≤x

0 khi

a. Tìm hàm phân phối xác suất của X.


b. Tính P (X < 21 ).

Giải:

Rx
a. Ta có F (x) = P (X ≤ x) = −∞
f (t)dt. Do đó
Khi x < 0, F (x) = 0,
Rx x2
Khi 0 ≤ x < 1, F (x) = tdt = ,
R01 R2x 2
Khi 1 ≤ x < 2, F (x) = tdt + 0
− t)dt = − x2 + 2x − 1,
1
(2
R1 R2
Khi 2 ≤ x, F (x) = 0 tdt + 1 (2 − t)dt = 1.
Vậy ta có hàm phân phối xác suất của X là


0 khi x < 0
 x2

khi 0 ≤ x < 1
2
F (x) = 2


− x2 + 2x − 1 khi 1 ≤ x < 2
khi 2 ≤ x

1

1 2
b. P (X < 12 ) = F ( 21 ) = 1
= 18 .

2 2
44

2.3. Tham số đặc trưng của biến ngẫu nhiên

2.3.1. Kỳ vọng
Định nghĩa: Cho X là BNN với hàm mật độ f(x) và u(X) là một hàm theo
BNN X. Kỳ vọng của u(X) được xác định là
X
E(u(X)) = u(xi )pi
i

khi X là BNN rời rạc, và


Z +∞
E(u(X)) = u(x)f (x)
−∞

khi X là BNN liên tục.


Đặc biệt, khi u(X)=X thì E(X) được gọi là trung bình của X, ký hiệu là
µX , hay vắn tắt là µ. Lúc này trung bình của BNN rời rạc X là
X
µX = x i pi ,
i

và Z +∞
µX = xf (x)
−∞

đối với BNN X liên tục.


Ví dụ 2.6. Một hộp đựng 3 bi đỏ và 7 bi trắng. Mỗi lần lấy một bi (rồi trả
lại vào hộp). Nếu được bi đỏ thì được thưởng 5000đ, nếu được bi trắng thì bị
phạt 2300đ. Xét xem có nên tham gia trò chơi này nhiều lần không?

Gọi X là số tiền nhận được sau mỗi lần lấy bi. X là BNN với bảng phân
bố xác suất
X −2300 5000
7 3
P 10 10

Kỳ vọng của X là
7 3
µX = (−2300) + 5000 = −110.
10 10

Điều này có nghĩa là nếu ta chơi nhiều lần thì bình quân mỗi lần lấy một
bi, ta bị lỗ 110đ. Vậy không nên chơi trò này nhiều lần.
45

Tính chất: Với các BNN X, Y và hằng số C ta có


(i) E(C) = C,
(ii) E(CX) = CE(X),
(iii) E(X ± Y ) = E(X) ± E(Y ),
(iv) Nếu X, Y độc lập thì E(XY ) = E(X)E(Y ).

2.3.2. Phương sai


Định nghĩa: Cho X là BNN có hàm mật độ f(x) và trung bình µX . Phương
2
sai của X, ký hiệu là D(X) hay ở dạng tham số σX , được xác định bởi
(P
2
2 i (xi − µX ) pi Khi X là BNN rời rạc

D(X) = E (X − µX ) = R +∞ 2
−∞
(x − µX ) f (x)dx Khi X là BNN liên tục.

Tính chất: Với các BNN X, Y và hằng số C ta có


(i) D(C) = 0,
(ii) D(CX) = C 2 D(X),
(iii) Nếu X, Y độc lập thì D(X ± Y ) = D(X) + D(Y ).
Ý nghĩa: Phương sai của BNN là một số không âm dùng để đo mức độ
phân tán của các giá trị của BNN X xung quanh trung bình µX . Phương sai
càng nhỏ thì các giá trị của BNN càng tập trung xung quanh giá trị trung
bình µ của nó, còn nếu phương sai càng lớn thì các giá
ptrị của BNN càng phân
2
tán, càng tản mát. Thay cho việc dùng σ ta dùng D(X) = σ, được gọi là
độ lệch tiêu chuẩn. Nếu BNN có độ lệch tiêu chuẩn nhỏ thì khoảng cách từ
giá trị nhỏ đến giá trị lớn hay sự chênh lệch giữa giá trị lớn và giá trị nhỏ sẽ
không lớn. Còn BNN có độ lệch tiêu chuẩn lớn thì sự chênh lệch giữa giá trị
lớn và giá trị nhỏ sẽ khá lớn.
Ví dụ 2.7. Xét 2 BNN rời rạc X, Y với các giá tri cho bởi bảng sau
X 4 4 5 6 4 6 8 7 6 5
P 3 2 4 9 8 9 3 7 3 10

2
Ta có µX = µY = 6 nhưng σX = 1, 9 nhỏ hơn khá nhiều so với σY2 = 8, 2.
Do đó X ít phân tan hơn Y.
Ví dụ 2.8. Cho X là BNN với hàm mật độ xác suất
(
3
khi |x| ≤ 1
f (x) = 4
0 khi |x| > 1
46
2
Tính µX và σX .

Ta có
Z +∞ Z 1
3x
µX = xf (x)dx = (1 − x2 )dx = 0
−∞ −1 4
Z +∞ Z 1 x
2 2 3x
σX = (x − µX ) f (x)dx = (1 − x2 )dx
−∞ −1 4
Z 1 x
3x 1
= 2 (1 − x2 )dx = .
0 4 5

Mệnh đề: Cho X là BNN với trung bình µX . Ta có


2
σX = E(X 2 ) − µ2X .
Ví dụ 2.9. Cho BNN rời rạc X với bảng phân xác suất

X 0 1 2 3
1 3 3 1
P 8 8 8 8

Ta tính được trung bình


X 1 3 3 1 3
µX = xi pi = 0. + 1. + 2. + 3. = .
i
8 8 8 8 2
Phương sai
!
X
2
σX = E(X 2 ) − µ2X = x2i pi − µ2X
i
 2
1 3 3 1 3 3
= 0 . + 12 . + 22 . + 32 . −
2
= .
8 8 8 8 2 4

2.3.3. Mốt và trung vị


Mốt: Mốt của BNN rời rạc X, ký hiệu là Mod(X), là giá trị x0 của X mà
P (X = x0 ) là lớn nhất. Người ta còn nói Mod(X) là giá trị tin chắc nhất của
X. Trong trường hợp X là BNN liên tục với hàm mật độ f(x), thì Mod(X) là
giá trị x0 của X sao cho f (x0 ) là lớn nhất.
Trung vị: Trung vị (hay Median) của BNN X là giá trị m của BNN X sao
cho P (X < m) = P (X > m), ký hiệu là Med(X).
Ý nghĩa hình học của trung vị là hoành độ mà tại đó, chia diện tích giới
hạn bởi đường cong hàm mật độ của BNN X thành hai phần bằng nhau.
47

Ví dụ 2.10. Trong một gia đình có 3 người con. Gọi X là số người con trai,
ta có bảng phân phối xác suất của X

X 0 1 2 3
1 3 3 1
P 8 8 8 8

Ta có Mod(X)= 1 hay Mod(X)=2 và 1< med(X) <2.

2.3.4. Hàm đặc trưng


Định nghĩa: Cho X là BNN với hàm mật độ f(x). Hàm đặc trưng (hay
hàm gây Moment) của X được xác định bởi
(P
txi
i (e ) pi khi X là BNN rời rạc
M (t) = E etX = R +∞

tx
−∞
(e ) f (x)dx khi X là BNN liên tục.

Mệnh đề: Cho X là BNN với trung bình µ, phương sai σ 2 và hàm đặc
trưng M(t). Ta có

µ = M 0 (0),
2
σ 2 = M 00 (0) − (M 0 (0)) .

Ví dụ 2.11. Xét BNN X với trung bình µ, phương sai σ 2 và hàm mật độ
(
e−x khi x > 0
f (x) =
0 khi x ≤ 0

a. Tìm µ và σ 2 .
b. Tìm hàm đặc trưng M(t), suy ra µ và σ 2 .

Giải

a. Ta có
Z +∞ Z ∞
−x
µ = xe dx = xe−x dx = 1.
−∞ 0
Z +∞
σ2 = x2 e−x dx − µ2 = 2 − 1 = 1.
−∞
48

b. Ta có
Z +∞ Z +∞
tx −x 1
M (t) = e e dx = e−(1−t)x dx = (t < 1)
−∞ 0 1−t


1 2
M 0 (t) = 2
, M 00 (t) = .
(1 − t) (1 − t)3
Do đó

µ = M 0 (0) = 1,
2
σ 2 = M 00 (0) − (M 0 (0)) = 2 − 1 = 1.

2.4. Bài tập

Bài tập 2.1. Cho BNN X có phân phối như sau:

X 0 1 3 6
1 4 3 2
P 8 8 8 8

a. Tìm mod(X).
b. Tìm kỳ vọng và phương sai Y=5X+ D(X).
c. Tìm P (1 ≤ X ≤ 3).

Bài tập 2.2. Cho 2 BNN X, Y độc lập với bảng phân phối xác suất như sau

X 0 1 2
P 0, 3 0, 4 0, 3

Y −1 1
P 0, 4 0, 6

Hãy lập bảng phân phối xác suất của X + Y, XY .

Bài tập 2.3. Một lô có 10 lọ thuốc trong đó có 6 lọ loại I và 4 lọ loại II. Lấy
ngẫu nhiên 3 lọ. Gọi X là số lọ loại II lấy được. Lập bảng phân bố xác suất
2
của X. Tìm µX , σX , mod(X).
49

Bài tập 2.4. Có hai lô thuốc A và B, trong đó


- Lô A có 10 lọ gồm 8 lọ tốt và 2 lọ hỏng,
- Lô B có 10 lọ gồm 7 lọ tốt và 3 lọ hỏng.
Lấy ngẫu nhiên một lọ từ lô thuốc A bỏ sang lô B, rồi từ lô thuốc B lấy ra
3 lọ. Lập bảng phân phối xác suất số lọ hỏng lấy phải trong 3 lọ lấy ra từ lô
B.

Bài tập 2.5. Cơ quan dự báo khi tượng thủy văn chia thời tiết thành 3 loại:
xấu; bình thường và tốt với xác suất tương ứng là 0,25; 0,45 và 0,3. Với tình
trạng thời tiết trên thì khả năng sản xuất nông nghiệp được mùa tương ứng là
0,2; 0,6 và 0,7. Nếu được mùa thì mức xuất khẩu tương ứng với 3 tình trạng
thời tiết là 3,5 triệu tấn; 4,2 triệu tấn và 4,5 triệu tấn. Hãy tính mức xuất
khẩu lương thực có thể hy vọng.

Hướng dẫn và đáp số


2.1 a. 1.
b.Ta có
1 4 3 2
E(X) = 0. + 1. + 3. + 6. = 3, 125,
8 8 8 8

1 4 3 2
D(X) = 02 . + 12 . + 32 . + 62 . − (3, 125)2 = 3, 1094.
8 8 8 8
Suy ra

E (5X + D(X)) = E (5X + 3, 1094) = 5E(X) + 3, 1094 = 18, 73


D (5X + D(X)) = D (5X + 3, 1094) = 25D(X) = 77, 74.
1 4
c. P (1 ≤ X ≤ 3) = P (X = 1) + P (X = 3) = 8 + 8 = 58 .

2.2 Xét BNN X+Y, ta có


P (X + Y = −1) = P (X = 0).P (Y = −1),
P (X + Y = 0) = P (X = 1).P (Y = −1),
P (X + Y = 1) = P (X = 0).P (Y = 1) + P (X = 2).P (Y = −1),
P (X + Y = 2) = P (X = 1).P (Y = 1),
P (X + Y = 3) = P (X = 2).P (Y = 1).
Từ đó,
Xét BNN XY, ta có
P (XY = −2) = P (X = 2).P (Y = −1),
50
X+Y −1 0 1 2 3
P 0,12 0, 16 0, 3 0, 24 0,18

P (XY = −1) = P (X = 1).P (Y = −1),


P (XY = 0) = P (X = 0).P (Y = −1) + P (X = 0).P (Y = 1),
P (XY = 1) = P (X = 1).P (Y = 1).
P (XY = 2) = P (X = 2).P (Y = 1).
Từ đó,

XY −2 −1 0 1 2
P 0,12 0, 16 0, 3 0, 24 0,18

2.3 Ta có
C4k C63−k
P (X = k) = 3 .
C10
Tính toán ta được bảng phân bố xác suất

X 0 1 2 3
1 1 3 1
P 6 2 10 30

2 = 0, 56, mod(X) = 1.
µX = 1, 2, σX

2.4 Gọi X là số lọ hỏng trong 3 lọ lấy ra từ lô B, X nhận các giá trị 0,1,2,3.
Đặt Y là biến cố "lấy được 1 lọ hỏng từ lô A".
Áp dụng công thức xác suất toàn phần,

P (X = 0) = P (Y )P (X = 0/Y ) + P (Ȳ )P (X = 0/Ȳ )


2 C40 C73 8 C30 C83 259
= 3 + 3 = .
10 C11 10 C11 825

Tương tự, ta cũng có


2 C41 C72 8 C31 C82 420
P (X = 1) = 3 + 3 = ,
10 C11 10 C11 825

2 C42 C71 8 C32 C81 138


P (X = 2) = 3 + 3 = ,
10 C11 10 C11 825

2 C43 C70 8 C33 C80 8


P (X = 3) = 3 + 3 = .
10 C11 10 C11 825
Bảng phân phối xác suất
51
X 0 1 2 3
259 420 138 8
P 825 825 825 825

2.5 Đặt các biến cố


A1 : "tình trạng thời tiết xấu",
A2 : "tình trạng thời tiết bình thường",
A3 : "tình trạng thời tiết tốt",
và B: "sản xuất được mùa".
Gọi X là mức xuất khẩu lương thực, thì X có thể nhận các giá trị 3,5; 4,2 và 4,5
triệu tấn.
Áp dụng công thức xác suất toàn phần.

P (B) = P (A1 )P (B/A1 ) + P (A2 )P (B/A2 ) + P (A3 )P (B/A3 )


= 0, 25.0, 2 + 0, 45.0, 6 + 0, 3.0, 7 = 0, 53.

Áp dụng công thức Bayès:


P (A1 )P (B/A1 ) 0,25.0,2
P (X = 3, 5) = P (A1 /B) = P (B) = 0,53 = 0, 0943,
P (A2 )P (B/A2 ) 0,45.0,6
P (X = 4, 2) = P (A2 /B) = P (B) = 0,53 = 0, 5094,
P (A3 )P (B/A3 ) 0,3.0,7
P (X = 4, 5) = P (A3 /B) = P (B) = 0,53 = 0, 3962.
Bảng phân phối xác suất.

X 3, 5 4, 2 4, 5
P 0, 0943 0, 5094 0, 3962

E(X)= 3,5.0,0943+4,2.0,5094+4,5.0,3962=4,2524 triệu tấn.


Chương 3
Hàm phân phối

MỤC TIÊU:

1. Nhận biết được các phân phối xác suất

2. Tính được xác suất, các giá trị đặc trưng của một phân phối

3. Xác định được mối liên hệ giữa các loại phân phối

3.1. Phân phối nhị thức B(n;p)

3.1.1. Định nghĩa


Biến số ngẫu nhiên X gọi là có phân phối theo luật nhị thức, ký hiệu
X ∼ B(n; p) nếu hàm mật độ của X có dạng
(
Cnx px (1 − p)n−x khi x = 0, 1, 2, ..., n
f (x) =
0 khi x 6= 0, 1, 2, ..., n

3.1.2. Mệnh đề
Cho X là BNN, X ∼ B(n; p), ta có
(i) Trung bình: µX = np,
2
(ii) Phương sai: σX = np(1 − p),
(iii) Giá trị tin chắc nhất (mốt): Mod(X)=k0 , với k0 được xác định như sau
- Nếu np+p-1 là số nguyên thì k0 chính là np+p-1 và np+p,
- Nếu np+p-1 là số thập phân thì k0 chính là số nguyên bé nhất nhưng lớn
hơn np+p-1.
Ví dụ 3.1. Một gia đình có 6 người con. Gọi X là số con trai trong gia đình
đó. Ta có X ∼ B(6; 0, 5) với hàm mật độ
(
C6x (0, 5)x (1 − 0, 5)6−x khi x = 0, 1, 2, 3, 4, 5, 6
f (x) =
0 6 0, 1, 2, 3, 4, 5, 6
khi x =
53

và bảng phân phối xác suất của X

X 0 1 2 3 4 5 6
P 0,016 0, 093 0, 240 0, 320 0,240 0, 093 0, 016

Hình 3.1 Biểu đồ phân phối xác suất số con trai.

Từ đó, ta tính được


- Xác suất để gia đình có đúng 3 con trai

P (X = 3) = 0, 32.

- Xác suất để gia đình này có nhiều nhất 3 con trai

P (X ≤ 3) = P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) = 0, 6563.

- Trung bình: µX = 6.0, 5 = 3.


2
- Phương sai: σX = 6.0, 5(1 − 0, 5) = 1, 5.
- Giá trị tin chắc nhất : Mod(X)=3.

Ví dụ 3.2. Trong một vùng dân cư tỉ lệ sốt rét là 5% dân số, chọn ngẫu nhiên
30 người. Gọi X là số người bị số rét trong 30 người này.
54

Ta có X ∼ B(30; 0, 05), ta có thể tính một số xác suất của X như:


- Xác suất để nhận được đúng 5 người bị sốt rét là
5
P (X = 5) = C30 (0, 05)5 (1 − 0, 05)30−5 = 0, 0027,

- Xác suất để ít nhất 2 người bị sốt rét là

P (X ≥ 2) = 1 − [P (X = 0) + P (X = 1)]
= 1 − (0, 95)30 + C30
1
(0, 05)1 (1 − 0, 05)30−1 = 0.8122.
 

- Trung bình: µX = 30.0, 05 = 1, 5,


2
- Phương sai: σX = 30.0, 05(1 − 0, 05) = 1, 425,
- Giá trị tin chắc nhất: Mod(X)=1.
Ví dụ 3.3. Một lô thuốc gồm 10 lọ, trong đó có 2 lọ hỏng. Lấy ngẫu nhiên 5
lọ từ lô thuốc đó, có hoàn lại. Gọi X là số lọ hỏng trong 5 lọ lấy ra. Tìm hàm
mật độ của X.

Việc lấy 5 lọ thuốc có hoàn lại từ lô thuốc là thực hiện phép thử " lấy một
2
lọ từ lô thuốc" 5 lần độc lập nhau. Do đó X ∼ B(5; 10 ) và ta có hàm mật độ
(
C5x (0, 2)x (1 − 0, 2)6−x khi x = 0, 1, 2, 3, 4, 5
f (x) =
0 khi x 6= 0, 1, 2, 3, 4, 5

Chú ý: Trong ví dụ trên, nếu ta lấy 5 lọ thuốc từ lô thuốc nhưng không


hoàn lại thì X không thỏa phân phối nhị thức (vì 5 lần lấy không độc lập
nhau). Lúc này, giá trị X nhận là 0, 1, 2. Gọi Ai là biến cố " lấy được i lọ
hỏng", ta có
C k C 5−k
P (X = k) = P (Ak ) = 2 58 .
C10
Do đó, ta có hàm mật độ của X là
C2 C85−k
( k
5
C10
khi x = 0, 1, 2
f (x) =
0 khi x 6= 0, 1, 2

Tổng quát, nếu ta lấy n phần tử từ tập hợp N phần tử, trong đó có K phần
tử mang tính chất T nào đó và gọi X là số phần tử mang tính chất T nhận
được trong n phần tử lấy ra, thì X chỉ có thể lấy các giá trị từ 0 đến n và
k
CK CNn−k
−K
P (X = k) = .
CNn
55

Chú ý rằng khi k > K hay k < n − N + K thì biến cố X= k không thể có.
Do đó, ta có hàm mật độ cho X,
x n−x
CK CN −K
f (x) =
CNn

với x ≥ max {0, n − N + K} và x ≤ min {n, K}, f(x)=0 trong các trường hợp
còn lại.
Từ đó, ta có

3.2. Phân phối siêu bội H(N;K;n)

3.2.1. Định nghĩa


Biến số ngẫu nhiên X gọi là có phân phối theo luật siêu bội, ký hiệu là
X ∼ H(N, K, n) nếu hàm mật độ của X có dạng
x n−x
CK CN −K
f (x) =
CNn

với x ≥ max {0, n − N + K} và x ≤ min {n, K}, f(x)=0 trong các trường hợp
còn lại.

3.2.2. Mệnh đề
K
Cho BNN X ∼ H(N, K, n), với p = N
và q = 1 − p, ta có
(i) Trung bình: µX = np.
−n
2
(ii) Phương sai: σX = npq N
N −1
.

Ví dụ 3.4. Một hộp thuốc có 15 lọ trong đó có 5 lọ hỏng. Lấy ngẫu nhiên 3


lọ. Gọi X là số lọ hỏng trong 3 lọ lấy ra. Ta có X ∼ H(15, 5, 3). Xác suất để
3 lọ hỏng là
C 3C 0
P (X = 3) = 5 3 10 ≈ 0, 0219.
C15

5
µX = 3 = 1,
15
 
2 5 5 15 − 3 12
σX = 3 1− = .
15 15 15 − 1 21
56

Chú ý: Người ta chứng minh được rằng nếu X ∼ H(N, K, n) thì

P (X = k) → Cnk pk (1 − p)n−k
K
với p = N
khi N → ∞ với mọi k = 0, 1, 2, ..., n.
Nghĩa là, nếu X ∼ H(N, K, n) và n khá nhỏ so với N thì để tính xác suất
P(X=k), ta có thể xấp xỉ bằng phân phối nhị thức B(n;p) với p = K
N
.
Ví dụ 3.5. Một lô thuốc lớn có tỷ lệ thuốc hỏng là p = 0, 2. Lấy ngẫu nhiên
5 lọ. Gọi X là số lọ hỏng trong 5 lọ lấy ra. Tìm hàm mật độ xác suất của X.

Ta có X ∼ H(N, K, 5), và K N
= 0, 2. Do N lớn nên ta có thể xấp xỉ bằng
phân phối nhị thức B(5;0,2) với hàm mật độ
(
C5x (0, 2)x (0, 8)5−x khi x = 0, 1, 2, ..., 5
f (x) =
0 khi x 6= 0, 1, 2, ..., 5.

Tuy nhiên, việc tính toán các giai thừa m! và các lũy thừa pm , q m với m
lớn là không đơn giản. Do đó, khi n lớn, người ta lại xấp xỉ X bằng phân phối
Poisson sau đây

3.3. Phân phối Poisson

3.3.1. Định nghĩa


Biến số ngẫu nhiên X gọi là có phân phối Poisson1 , ký hiệu X ∼ P (λ), nếu
hàm mật độ xác suất của X có dạng
( −λ x
e λ
x!
khi x = 0, 1, 2, ..., n, ...
f (x) =
0 khi x 6= 0, 1, 2, ..., n, ...

3.3.2. Mệnh đề
Cho X ∼ P (λ), ta có
2
µX = σ X = λ.

Ví dụ 3.6. Ở một bệnh viện, trung bình cứ 2 ngày có một người nhập viện do
tai nạn giao thông. Tính xác để:
a. Trong một tuần có 5 người nhập viện do tai nạn giao thông.
b. Ít nhất 3 người nhập viện trong 1 tuần.
1
Do nhà toán học người Pháp Simeon Denis Poisson (1781–1840) tìm ra vào năm 1837.
57

Giải:

Gọi X là số người nhập viên do tai nạn giao thông trong một tuần. Khi đó
X ∼ P (3.5).
a.
e−3.5 (3.5)5
P (X = 5) = = 0.132.
5!
b.

P (X ≥ 3) = 1 − P (X < 3) = 1 − P (X = 0) − P (X = 1) − P (X = 2)
e−3.5 (3.5)0 e−3.5 (3.5)1 e−3.5 (3.5)2
= 1− − −
0! 1! 3!
= 0.679.

Phân phối Poisson có nhiều ứng dụng đối với nhiều quá trình liên quan
đến quan sát đối với một đơn vị thời gian hoặc không gian. Chẳng hạn số cuộc
điện thoại nhận ở một trạm điện thoại trong một phút, số khách hàng đến nhà
băng đối với mỗi chu kì 30 phút, số vụ tai nạn giao thông trong một giờ tại
một giao lộ , số người nhập viện do bị bệnh X trong một ngày... Nói chung là
dòng vào của một hệ phục vụ (quán ăn, hiệu cắt tóc, hiệu sữa chữa xe, một
cửa hàng nào đó...) là các biến ngẫu nhiên tuân theo luật phân phối Poisson.
Người ta chứng minh được rằng nếu X ∼ B(n; p) thì

e−λ λk
P (X = k) →
k!
với λ = np khi n → ∞ với mọi k = 0, 1, 2, ..., n.
Nghĩa là, nếu X ∼ B(n; p), trong đó p đủ nhỏ và n đủ lớn, thì X được xem
như có phân phối Poisson P (λ), với λ = np.

Ví dụ 3.7. Tỷ lệ thuốc hỏng trong một lô thuốc rất nhiều là p=0,05. Lấy ngẫu
nhiên 20 lọ. Gọi X là số lọ hỏng. Tìm hàm mật độ của X và so sánh với giá
trị xấp xỉ bởi phân phối Poisson.

Giải:

Do X ∼ B(20; 0, 05) nên có hàm mật độ


(
x
C20 (0, 05)x (0, 95)20−x khi x = 0, 1, 2, ..., 20
f (x) =
0 6 0, 1, 2, ..., 20
khi x =
58

Nếu ta xấp xỉ bởi phân phối Poisson, nghĩa là X ∼ P (λ), với λ = np =


20.0, 05 = 1 thì hàm mật độ trở thành
( −1 x −1
e 1
x!
= ex! khi x = 0, 1, 2, ..., 20
f (x) =
0 khi x 6= 0, 1, 2, ..., 20.

Ta có bảng kết quả so sánh xấp xỉ phân phối Poisson P(1) bởi phân phối
nhị thức B(20;0,05) sau

X 0 1 2 3 4 5 6
B(20,0,05) 0, 3585 0, 3774 0, 1887 0, 0596 0, 0133 0, 0022 0, 0003
P(1) 0,3674 0, 3679 0, 1839 0, 0613 0,0153 0, 0031 0, 0005
sai số 0,0089 0, 0095 0, 0048 0, 0017 0,0020 0, 0009 0, 0002

Trong ứng dụng: Khi X ∼ B(n; p), trong đó

n > 50, p < 0, 01 và np < 5,

thì ta dùng xấp xỉ X ∼ P (np).

3.4. Phân phối chuẩn

3.4.1. Định nghĩa


Biến số ngẫu nhiên Z gọi là có phân phối chuẩn tắc, ký hiệu Z ∼ N (0; 1),
nếu hàm mật độ của Z là
1 x2
f (x) = √ e− 2 , −∞ < x < ∞.

Đồ thị của hàm mật độ Z có dạng sau đây
Đó là một đường cong đối xứng qua trục tung có dạng hình chuông, có
điểm cực đại tại x=0.
Hàm phân phối của Z, kí hiệu bởi φ(x), là
Z x
1 t2
φ(x) = √ e− 2 dt.
−∞ 2π
Người ta đã lập bảng tính sẵn các giá trị của φ(x) (xem bảng B). Tuy
nhiên, ở bảng này người ta chỉ cho các giá trị của φ(x) với x > 0. Với x < 0 ta
sử dụng công thức sau
φ(−x) = 1 − φ(x).
59

Hình 3.2 Đồ thị hàm mật độ của phân phối Gauss.

Chẳng hạn

φ(−0.35) = 1 − φ(0.35) = 1 − 0.6368 = 0.3632.

Như vậy ta có

• P (Z < a) = φ(a)

• P (Z > a) = 1 − φ(a)

• P (a < Z < b) = φ(b) − φ(a).

Ví dụ 3.8.

P (Z < 1, 51) = φ(1, 51) = 0, 9394.


P (1, 2 < Z) = 1 − φ(1, 2) = 1 − 0, 5793 = 0, 4207.
P (−0, 34 < Z < 1) = φ(1) − φ(−0, 34) = φ(1) − (1 − φ(0, 34))
= φ(1) + φ(0, 34) − 1
= 0, 8413 + 0, 6331 − 1 = 0, 4744.

3.4.2. Mệnh đề
Cho BNN Z ∼ N (0; 1). Ta có
(i) trung bình: µZ = 0,
(ii) phương sai: σZ2 = 1.
60

3.4.3. Định nghĩa


Biến số ngẫu nhiên X gọi là có phân phối chuẩn, ký hiệu X ∼ N (µ; σ 2 ),
nếu hàm mật độ của X là
1 (x−µ)2
f (x) = √ e− 2σ2 , −∞ < x < ∞.
σ 2π

Hình 3.3 Đồ thị hàm mật độ của phân phối chuẩn N (2; (0, 5)2 ).

3.4.4. Mệnh đề
Cho BNN X ∼ N (µ; σ 2 ). Ta có
(i) trung bình: µX = µ,
2
(ii) phương sai: σX = σ2.
Từ phân phối chuẩn, bằng cách đổi biến ta đưa về phân phối chuẩn tắc

3.4.5. Mệnh đề
X−µ
Cho X ∼ N (µ; σ 2 ), nếu Z = σ
thì Z ∼ N (0; 1).
Hệ quả: Nếu X ∼ N (µ; σ 2 )
a−µ

• P (X < a) = φ σ
.
a−µ

• P (a < X) = 1 − φ σ
.
b−µ a−µ
 
• P (a < X < b) = φ σ
−φ σ
.
61

Ví dụ 3.9. Giả sử rằng chiều cao của sinh viên trường PNT có phân phối
chuẩn X ∼ N (165(cm); 36(cm2 )). Tính tỉ lệ sinh viên có chiều cao thấp hơn
155 cm.

Giải

Do X ∼ N (165; 62 ) nên
 
155 − 165
P (X ≤ 155) = φ = φ(−1, 66)
6
= 1 − φ(1, 66) = 1 − 0, 952 = 0, 048.

Hình 3.4 Đồ thị hàm mật độ xác suất chiều cao của SV trường PNT.

Tương tự, ta cũng tính được tỉ lệ sinh viên có chiều cao trong khoảng từ
160cm đến 170 cm
   
170 − 165 160 − 165
P (160 ≤ X ≤ 170) = φ −φ
6 6
 
5 5 5 5
= φ( ) − φ(− ) = φ( ) − 1 − φ( )
6 6 6 6
5
= 2φ( ) − 1 = 2.0, 7967 − 1 = 0, 593,
6
và tỉ lệ sinh viên có chiều cao trên 180 cm
 
180 − 165
P (X ≥ 180) = 1 − φ = 1 − φ(2, 5)
6
= 1 − 0, 9938 = 0, 0062.
62

3.4.6. Định lý Moivre - Laplace


Cho X ∼ B(n; p) và n đủ lớn, ta có

X ∼ N (np; np(1 − p)).

Trong ứng dụng, xấp xỉ trên có hiệu quả khi np ≥ 5 và np(1 − p) ≥ 5.


Chú ý: Vì biến ngẫu nhiên X trong phân phối nhị thức là biến ngẫu nhiên
liên tục rời rạc nên khi tính xấp xỉ các giá trị xác suất của X bằng phân phối
chuẩn ta đã chuyển sang một biến mới là biến liên tục nên trong thực hành
phải thực hiện phép hiệu chỉnh liên tục như sau

• Nếu xác suất cần tính có dạng P (X ≤ a) hoặc P (X > a) thì hiệu chỉnh
liên tục là (a + 0.5),

P (X ≤ a) = P (X ≤ a + 0.5)

P (X > a) = P (X > a + 0.5)

• Nếu xác suất cần tính có dạng P (X ≥ a) hoặc P (X < a) thì hiệu chỉnh
liên tục là (a − 0.5),

P (X ≥ a) = P (X ≥ a − 0.5)

P (X < a) = P (X < a − 0.5)

Ví dụ 3.10. Số bệnh nhân cao huyết áp chiếm 20% dân số. Chọn ngẫu nhiên
100 người. Tính xác suất để
a. Có đúng 10 người bị cao huyết áp.
b. Số người bị cao huyết áp trong khoảng từ 15 đến 30 người.

Giải

Gọi X là số người bị bệnh cao huyết áp. Rõ rằng X ∼ B(100; 0.2), tuy nhiên
việc tính theo phân phối nhị thức khá phức tạp nên ta tính bằng cách xấp xỉ
phân phối chuẩn.
Ta có np = 100.0, 2 = 20 ≥ 5 và np(1 − p) = 20(1 − 0, 2) = 16 ≥ 5. Do đó
X ∼ N (20; 42 ).
63

a.
   
10, 5 − 20 9, 5 − 20
P (X = 10) = φ −φ
4 4
= φ(−2, 38) − φ(−2, 63) = φ(2, 63) − φ(2, 38) = 0, 0044.

b.
   
30.5 − 20 14.5 − 20
P (15 ≤ X ≤ 30) = φ −φ
4 4
= φ(2.63) − φ(−1.375) = φ(2.63) − [1 − φ(1.38)]
= φ(2.63) + φ(1.38) − 1 = 0.9957 + 0.9162 − 1 = 0.9119.

3.4.7. Định lý giới hạn trung tâm


Dãy các BNN độc lập X1 , X2 , ...Xn , ... có cùng phân phối chuẩn, nghĩa là
Xi ∼ N (µ; σ 2 ), với mọi i. Với

1
X̄ = (X1 + X2 + ... + Xn ) (3.1)
n

ta có
σ2
X̄ ∼ N (µ; )
n

và do đó
X̄ − µ √
Z≡ n ∼ N (0; 1).
σ

Đây là thống kê Z rất thường dùng thống kê.

Trong nhiều lĩnh vực nghiên cứu của khoa học ta gặp các biến ngẫu nhiên
có phân phối chuẩn hoặc "xấp xỉ" phân phối chuẩn. Chẳng hạn, trong nông
nghiệp, năng suất của một giống cây trồng có phân phối chuẩn; một số lớn
các biến ngẫu nhiên trong kinh tế, dân số, sinh vật cũng có phân phối chuẩn
(như nhu cầu tiêu thụ một loại hàng nào đó, mức lãi của một công ty, chiều
cao, trọng lượng, vòng ngực, chiều dài cánh tay, chỉ số thông minh của những
người cùng giới, ....).
64

3.5. Phân phối Chi - bình phương, χ2

Biến số ngẫu nhiên X gọi là có phân phối Chi - bình phương2 , ký hiệu là
χ2 (n) nếu hàm mật độ xác suất của X là
( n x
1
n x 2 −1 e− 2 khi x > 0
Γ( n )2 2
f (x) = 2

0 khi x ≤ 0
R∞
với hàm Gamma: Γ(x) = 0
tx−1 e−t dt.

Hình 3.5 Đồ thị hàm mật độ Phân phối χ2 .

3.5.1. Mệnh đề:


Cho BNN X ∼ χ2 (n), ta có
(i) trung bình: µX = n,
2
(ii) phương sai: σX = 2n.

3.5.2. Mệnh đề:


(i) Nếu BNN X có phân phối chuẩn tắc X ∼ N (0; 1) thì BNN Y = X 2 có
phân phối χ2 , Y ∼ χ2 (1).
(ii) Nếu các BNN độc lập X, Y thỏa: X ∼ χ2 (n1 ), Y ∼ χ2 (n2 ) và Z = X +Y
thì Z ∼ χ2 (n1 + n2 ).
2
Do nhà toán học người Anh Karl Pearson (1857-1936) tìm ra năm 1900.
65

Từ đó, nếu ta có n BNN X1 , X2 , ...Xn độc lập có phân phối chuẩn tắc
X ∼ N (0; 1) thì BNN
n
X
Y = Xi2 = X12 + X22 + ... + Xn2 (3.2)
i=1

sẽ có phân phối khi bình phương với n bậc tự do, Y ∼ χ2 (n).


Người ta đã tìm ra được kết quả rất hữu ích khi chứng minh các qui tắc
thống kê: Nếu n BNN độc lập X1 , X2 , ...Xn có cùng phân phối chuẩn nhưng
không biết kì vọng, nghĩa là Xi ∼ N (.; σ 2 ), thì
n  2
X Xi − X̄
∼ χ2 (n − 1) (3.3)
i=1
σ

Và do
n
2 1 X 2
s = Xi − X̄ (3.4)
n − 1 i=1

nên
(n − 1)s2
∼ χ2 (n − 1) (3.5)
σ2

3.6. Phân phối Student

Xét hai BNN độc lập X, Y với X ∼ N (0; 1) và Y ∼ χ2 (n). Đặt


X
T =p .
Y /n

Thì T được gọi là biến số ngẫu nhiên tuân theo luật phân phối Student3
với n độ tự do, ký hiệu là T ∼ S(n) hay vắn tắt là T ∼ t(n).
Hàm mật độ của T là
Γ( n+1
2
)
g(t) = √  n+1 .
t2
nπΓ( n2 ) 1 + n
2

Đồ thị của g(t) (hình 3.6) gần giống với đồ thị hàm mật độ của phân phối
chuẩn tắc. Trên thực tế, khi n ≥ 30 thì có thể xem phân phối T và phân phối
chuẩn tắc là như nhau.
3
Do nhà toán học người Anh William Sealy Gosset (1876-1937) tìm ra năm 1908.
66

Hình 3.6 Đồ thị hàm mật độ của phân phối Student.

Tổng quát hơn: Nếu n BNN độc lập X1 , X2 , ...Xn có cùng phân phối chuẩn
nhưng không biết phương sai (Xi ∼ N (µ; .)) thì
X̄ − µ √
T ≡ n ∼ t(n − 1).
s

3.7. Phân phối Fisher

Xét hai BNN độc lập X, Y với X ∼ χ2 (n), Y ∼ χ2 (m). Đặt


X/n
F = .
Y /m

Ta nói F là biến số ngẫu nhiên tuân theo luật phân phối Fisher 4 với độ tự
do (n,m), ký hiệu F ∼ F (n, m).
Dạng đồ thị của hàm mật độ của phân phối Fisher (hình 3.7) tương đối
giống với phân phối χ2 .
Một kết quả thường dùng trong thống kê: Nếu ta có X1 , X2 , ...Xn và
Y1 , Y2 , ...Ym là các BNN độc lập và có phân phối chuẩn (các Xi có cùng phân
phối chuẩn, các Yi cũng vậy) thì
s21
F ≡ ∼ F (n − 1; m − 1).
s22

với s1 , s2 được xác định theo công thức (3.4).


4
Do nhà thống kê học người Anh Ronald Aylmer Fisher (1890 -1962) tìm ra năm.
67

Hình 3.7 Đồ thi hàm mật độ của phân phối Fisher.

Phân phối T và F được dùng nhiều trong thống kê suy đoán. Phân phối T
được dùng để giải quyết các bài toán liên quan đến trung bình và tỉ lệ. Phân
phối F được dùng để giải quyết các bài toán liên quan đến phương sai. Do đó
người ta đã thiết lập sẵn bảng tính cho những giá trị cần thiết trong phân
phối T và F.

3.8. Bài tập

Bài tập 3.1. Để tiêu diệt được máy bay phải bắn trúng ít nhất 2 viên đạn.
Bắn 10 viên, xác suất trúng mỗi viên là 0,8. Tính xác suất để máy bay bị bắn
hạ.

Bài tập 3.2. Xác suất để mỗi con gà đẻ mỗi ngày là 0,6. Trong chuồng có 15
con. Tính xác suất để một ngày có
a. 10 con đẻ.
b. 4 con đẻ.
c. Tất cả đều không đẻ.
d. Phải nuôi ít nhất bao nhiêu con gà để trung bình mỗi ngày thu được
không ít hơn 30 trứng?

Bài tập 3.3. Một nhân viên tiếp thị bán hàng ở 5 chỗ khác nhau trong ngày.
Xác suất bán được hàng ở mỗi nơi đều là 0,4.
a. Tìm xác suất để nhân viên bán được hàng trong ngày.
68

b. Mỗi năm nhân viên đi bán hàng 330 ngày. Gọi Y là số ngày bán được
hàng trong năm. Tìm giá trị tin chắc nhất của Y, nghĩa là tìm số ngày bán
được hàng nhiều khả năng nhất trong năm.

Bài tập 3.4. Có hai lô thuốc, mỗi lô có 10 lọ. Lô thứ nhất có có 3 lọ loại I,
lô thứ hai có 6 lọ loại I. Lấy từ lô thứ nhất ra 2, lô thứ hai ra 4 lọ. Tính xác
suất để lấy được
a. Từ lô thứ nhất, 1 lọ loại I.
b. Từ lô thứ nhất, ít nhất 2 lọ loại I.
c. 4 lọ loại I.

Bài tập 3.5. Một lô thuốc rất nhiều, có tỷ lệ hỏng p=0,2. Lấy ngẫu nhiên 5
lọ. Gọi X là số lọ hỏng lấy ra. Tìm hàm mật độ xác suất của X.

Bài tập 3.6. Một hộp thuốc có 10 000 viên, trong đó có 4000 viên loại I. Lấy
ngẫu nhiên 10 viên. Tính xác suất có
a. 3 viên loại I.
b. Ít nhất 1 viên loại I.

Bài tập 3.7. Giả sử xác suất tử vong của bệnh số xuất huyết là 0,7%. Tính
xác suất để 5 người chết do sốt xuất huyết trong nhóm 400 người.

Bài tập 3.8. Một máy dệt co 5000 ống sợi. Xác suất để trong 1 phút, một
ống sợi bị đứt là 0,0002. Tìm xác suất để trong một phút có không quá 2 ống
sợi bị đứt.

Bài tập 3.9. Trong số 500 trang của một cuốn sách có 10 lỗi. Tìm xác suất
để khi xem một trang sách có
a. Đúng 2 lỗi in.
b. Không ít hơn 2 lỗi in.

Bài tập 3.10. Tại một đại lý bưu điện, các cuộc gọi đến xuất hiện ngẫu nhiên,
độc lập với nhau và có tốc độ trung bình 2 cuộc trong 1 phút. Biết rằng số
cuộc gọi trong một khoảng thời gian cố định có phân phối Poisson. Tính xác
suất để
a. Có đúng 5 cuộc gọi trong 2 phút.
b. Không có cuộc gọi nào trong khoảng thời gian 30 giây.
c. Có ít nhất một cuộc gọi trong khoảng thời gian 10 giây.
69

Bài tập 3.11. Ở một con đường trong thành phố, trung bình cứ 1 tuần có 3
vụ tai nạn. Tính xác suất để:
a. Không có vụ tai nạn nào trong 1 ngày.
b. Có ít nhất 3 vụ tai nạn trong 4 ngày.

Bài tập 3.12. Ở một bệnh viện, trung bình cứ 1 ngày có 3 người nhập viện
do tai nạn giao thông. Tính xác để:
a. Trong một tuần có 10 người nhập viện do tai nạn giao thông.
b. Ít nhất 15 người nhập viện trong 1 tuần.

Bài tập 3.13. Khi tiêm truyền một loại huyết thanh, trung bình có 1 trường
hợp tiêm bị phản ứng trên 1000 người được tiêm. Ta dùng huyết thanh trên
tiêm cho 2000 người. Tính xác suất để:
a. Có đúng 3 người bị phản ứng.
b. Nhiều nhất 3 người bị phản ứng.
c. Hơn 3 người bị phản ứng.

Bài tập 3.14. Tỷ lệ một bệnh bẩm sinh trong dân số là 1%. Bệnh này cần
được chăm sóc đặc biệt từ lúc mới sinh. Một nhà bảo sinh thường có 20 ca
sinh trong một tuần lễ. Tính xác suất để:
a. Không có ca nào cần có sự chăm sóc đó.
b. Có đúng một trường hợp cần.
c. Có hơn một trường hợp cần.
Tính bằng quy luật phân phối nhị thức và Poisson. Lập bảng so sánh kết
quả.

Bài tập 3.15. Một viện đạn súng trường bắn trúng máy bay với xác suất
0,01. Có 5000 khẩu bắn lên một lượt. Máy bay chắc chắn sẽ rơi nếu có ít nhất
2 viên trúng, còn 1 viên trúng thì xác suất rơi của máy bay là 80%. Tính xác
suất để máy bay bị rơi. 0.001

Bài tập 3.16. Có hai lô thuốc A và B, trong đó mỗi lô có 10 lọ gồm 6 lọ tốt


và 4 lọ hỏng. Lấy ngẫu nhiên 2 lọ từ lô thuốc A bỏ sang lô B, rồi từ lô thuốc
B lấy ra 3 lọ (có hoàn lại). Lập luật phân phối của số số lọ hỏng trong 3 lọ lấy
ra từ lô B.

Bài tập 3.17. Có một bệnh nhân mà bác sĩ chuẩn đoán mắc bệnh A với xác
suất 30%, bệnh B với xác suất 40% và bệnh C với xác suất 30% . Để có thêm
70

thông tin chẩn đoán, bác sĩ đã cho xét nghiệm sinh hóa. Sau 20 lần thử, thấy
có 5 lần dương tính, biết rằng khả năng dương tính của mỗi lần xét nghiệm đối
với bệnh A, B và C tương ứng là 10%, 40% và 20%. Hãy cho biết nên chuẩn
đoán bệnh nhân mắc bệnh nào?

Bài tập 3.18. Cho X ∼ N (0; 1)


a. Tính P (0 < X < 1, 5), P (−1, 4 < X < 0), P (−1, 22 < X < 2), P (−2 <
X < −1, 31), P (|X − 1| < 3).
b. Tìm c sao cho P(X<c)=0,975; P(-1<X<c) =0,22.

Bài tập 3.19. Cho X ∼ N (10; 9). Tính P (X < 9, 5); P (X > 11, 2); P (5 <
X < 20).

Bài tập 3.20. Khối lượng X (gam) một loại trái cây có phân phối chuẩn
N (200(gam), 32 (gam2 )). Trái cây thu hoạch được phân loại theo khối lượng
như sau:
- Loại 1: Trên 205 gam,
- Loại 2: từ 190 đến 205 gam,
- Loại 3: dưới 190 gam.
Tính tỉ lệ mỗi loại trên.

Bài tập 3.21. Đường kính của một chi tiết máy do máy tiện tự động sản xuất
có phân phối chuẩn N (50mm; (0, 05)2 (mm)2 ). Chi tiết máy được xem là đạt
yêu cầu nếu đường kính không sai quá 0,1 mm.
a. Tính tỉ lệ sản phẩm đạt yêu cầu.
b. Lấy ngẫu nhiên 3 sản phẩm. Tính xác suất để có ít nhất một sản phẩm
không đạt yêu cầu.

Bài tập 3.22. Cho biết trọng lượng viên thuốc sản xuất tại xí nghiệp là
độc lập và có phân phối chuẩn N (150mg; 32 (mg 2 )). Thuốc được đóng thành
vỉ, mỗi vỉ 10 viên. Vỉ thuốc được là đạt tiêu chuẩn nếu trọng lượng trong
khoảng 1490-1510 mg (không tính khối lượng bao thuốc). Lấy ngẫu nhiên 100
vỉ thuốc.Tính xác suất để
a. Có đúng 75 vỉ đạt tiêu chuẩn.
b. Có không quá 60 vỉ đạt tiêu chuẩn.

Bài tập 3.23. Đối với trẻ sơ sinh đủ tháng (không dưới 40 tuần mang thai),
trọng lượng cơ thể dao động trong khoảng từ 3,2-3,8 kg. Cho biết trong lượng
71

trẻ sơ sinh tuân theo phân phối chuẩn N (3, 5(kg), (0, 4)2 (kg 2 )). Đo trọng lượng
ngẫu nhiên 100 trẻ sơ sinh.
a. Tính xác suất để có đúng 60 trẻ đủ tháng.
b. Tính xác suất để có ít nhất 50 trẻ đủ tháng.

Hướng dẫn và đáp số


3.1 0,9999.

3.2 a. 0,1859; b. 0,0245; c. (0, 4)15 ; d.50.

3.3 a. 0,9222; b. 305

3.4 a. 7/5; b. 1/15; c. 151/63

3.5 (
C5x (0, 2)x (0, 8)5−x khi x = 0, 1, 2, 3, 4, 5
f (x) =
0 6 0, 1, 2, 3, 4, 5.
khi x =

và bảng phân phối xác suất của X

X 0 1 2 3 4 5
P 0,3277 0, 4096 0, 2948 0, 0515 0,0064 0, 0003

3.6 a. 0,129; b. 0,9939.

3.7 0,0872

3.8 0,920

3.9 Xấp xỉ phân phối nhị thức bằng phân phối Poisson.
a. 0, 0002.e−0,02 ; b. ≈ 0.

3.10 a. 0,1563; b. 0,3679; c. 0,2835.

3.11 a. 0,6514; b.0,1083

3.12 Phân phối Poisson.


72

3.13 a. 0,1804; b.0,8571; c.1429.

3.14 Bài tập tự giải.

3.15

3.16 Đặt các biến cố Ai : "trong 2 lọ lấy từ lô A có i lọ hỏng", i=0,1,2. Ta có

C4i C62−i
P (Ai ) = 2 , i = 0, 1, 2.
C10
Suy ra
C40 C62−0
P (A0 ) = 2 = 0, 3333,
C10
C41 C62−1
P (A1 ) = 2 = 0, 5333,
C10
C42 C62−2
P (A2 ) = 2 = 0, 1333.
C10
Gọi X số lọ hỏng trong 3 lọ lấy ra từ lô B, thì X nhận các giá trị 0, 1, 2.
Theo định lí Định lí Bernoulli
k 
4 + i 3−k
 
k 4+i
P (X = k/Ai ) = C3 1− , k = 0, 1, 2.
12 12
Suy ra
0 
4 + 0 3−0
 
4+0
P (X = 0/A0 ) = C30 1− = 0, 2963.
12 12
Tương tự ta tính được
P (X = 0/A1 ) = 0, 1985,
P (X = 0/A2 ) = 0, 1250,
P (X = 1/A0 ) = 0, 4444,
P (X = 1/A1 ) = 0, 4253,
P (X = 1/A2 ) = 0, 3750,
P (X = 2/A0 ) = 0, 2222,
P (X = 2/A1 ) = 0, 3038,
P (X = 2/A2 ) = 0, 3750.

Áp dụng công thức xác suất toàn phần ta có

P (X = k) = P (X = k/A0 )P (A0 ) + P (X = k/A1 )P (A1 ) + P (X = k/A2 )P (A2 ).


73

Suy ra

P (X = 0) = P (X = 0/A0 )P (A0 ) + P (X = 0/A1 )P (A1 ) + P (X = 0/A2 )P (A2 )


= 0, 3333.0, 2963 + 0, 5333.0, 1985 + 0, 1333.0, 1250 = 0, 2213,


P (X = 1) = 0, 4250,
P (X = 1) = 0, 2861.
Từ đó ta có bảng phân phối xác suất

X 0 1 2
P 0, 2213 0, 4250 0, 2861

3.17 Sử dụng phân phối nhị thức và công thức Bayès.

3.18 Sử dụng công thức P (a < X < b) = P (X < b) − P (X < a).


a. 0,4331; 0,4192; 0,8660; 0,0723; 0,9772.
b. 1,96; -0,31.

3.19 0,4338; 0,3446; 0,9517.

3.20 0,0478 ; 0,9518; 0,0004.

3.21 a. Đặt X là đường kính của chi tiết máy. Ta có

P (|X − µ| < 0, 1) = 0, 9545.

b. Gọi Y là số sản phẩm không đạt yêu cầuP (Y ≥ 1) = 0, 1304.

3.22 a.0,059; b. 0,0104.

3.23 a. 0,045; b. 0,8485.


74
75
Tài liệu tham khảo

[1] Wayne W. Daniel (2011)), Biostatistics: A Foundation for Analysis in the


Health Sciences (9th Edition), Wiley Publeshing, Inc, Canada.

[2] Đào Hữu Hồ (2010), Xác suất thống kê (Tái bản lần XII), NXB Đại học
Quốc gia Hà nội, Hà Nội.
[3] Phạm Hoàng Quân, Đinh Ngọc Thanh (2011), Xác suất thống kê, NXB
giáo dục, Hà Nội
[4] D. Rumsey (2006), Probabilities for Dummies, Wiley Publeshing, Inc,
Canada.
[5] Đặng Hùng Thắng (2010), Bài tập xác suất (Tái bản lần X), NXB Giáo
dục, Hà Nội.
[6] Chu Văn Thọ, Phạm Minh Bửu, Trần Đình Thanh, Nguyễn Văn Liêng
(2011), Bài tập xác suất thống kê, Giáo trình Đại Học Y Dược TP Hồ Chí
Minh.

[7] Lê Khánh Trai, Hoàng Hữu Như (1979), Ứng dụng xác suất thống kê trong
Y, Sinh học, NXB Khoa học và Kỹ thuật, Hà Nội.

You might also like