Download as pdf or txt
Download as pdf or txt
You are on page 1of 58

BÀI GIẢNG XÁC SUẤT THỐNG KÊ CHO KỸ SƯ

(Năm học 2023 – 2024. Trường Đại học Hoa Sen)


CHƯƠNG I. ÔN TẬP ĐẠI SỐ TỔ HỢP
1. Quy tắc cộng
Giả sử một công việc V có thể thực hiện theo hai phương án V1 hoặc V2, trong đó V1 có
m1 cách thực hiện, V2 có m2 cách thực hiện và mỗi cách thực hiện V1 không trùng với bất
kì cách thực hiện V2 nào. Khi đó số cách thực hiện công việc V là n = m1 + m2 .
2. Quy tắc nhân
Giả sử một công việc V bao gồm hai công đoạn V1 và V2, trong đó V1 có m1 cách thực
hiện, V2 có m2 cách thực hiện và mỗi cách thực hiện V1 đều có m2 cách thực hiện V2 .
Khi đó số cách thực hiện công việc V là n = m1 . m2 .
3. Tổ hợp
Mỗi tập con gồm k phần tử khác nhau lấy ra từ tập hợp có n phần tử được gọi là một tổ
n!
hợp chập k của n phần tử đã cho. Số các tổ hợp chập k của n phần tử là Cnk  .
k !( n  k )!

Lưu ý: a) Số cách lấy k phần tử từ n phần tử bằng số tổ hợp: C nk


b) Muốn tính C nk bằng máy tính Casio fx-570ES, cần nhấn lần lượt các phím sau:
1) Số n;
2) SHIFT;
3) Phép chia (máy sẽ hiểu đó là lệnh gián tiếp tính C nk );
4) Số k;
5) Dấu bằng.
Sau đó đọc kết quả ở góc dưới, bên phải của màn hình.
Ví dụ 1. Một lớp học có 36 sinh viên, trong đó có 21 nữ. Chọn ngẫu nhiên 7 sinh viên trong
lớp. Hỏi có bao nhiêu cách chọn
a) các sinh viên bất kỳ; b) 3 sinh viên nam;
c) ít nhất 6 sinh viên nữ; d) it nhất 1 sinh viên nữ?
Ví dụ 2. Trong một cái hộp có 10 viên phấn trắng và 6 viên phấn màu. Lấy ra 5 viên phấn.
Hỏi có bao nhiêu cách lấy được:
a) các viên phấn bất kì; b) 2 viên phấn màu;
c) ít nhất 4 viên phấn màu; d) ít nhất 1 viên phấn màu?
BÀI TẬP CHƯƠNG I
1.1. Một lô hàng có 40 sản phẩm, trong đó có 5 phế phẩm. Chọn ra 10 sản phẩm để kiểm
tra. Hỏi có bao nhiêu cách chọn được
a) các sản phẩm bất kì; b) không quá 2 phế phẩm;
c) ít nhất 8 sản phẩm tốt; d) ít nhất 1 phế phẩm;
1.2. Người ta lấy ra 3 viên bi từ một cái hộp đựng 6 viên vi đỏ, 4 viên bi xanh, 5 viên bi
vàng. Hỏi có bao nhiêu cách lấy ra
a) các viên bi tùy ý; b) 2 viên bi đỏ, 1 viên bi xanh;
c) các viên bi có màu khác nhau; d) một viên màu vàng;
e) nhiều nhất một viên màu đỏ; f) ít nhất một viên màu xanh?
1
CHƯƠNG II. XÁC SUẤT
II.1. PHÉP THỬ - BIẾN CỐ
1. Khái niệm
Hành động mà ta thực hiện là phép thử.
Kết quả của phép thử được gọi là biến cố.
Ví dụ 1. Hãy chỉ ra phép thử và biến cố trong từng ví dụ sau đây:
a) Tung một viên phấn lên cao, viên phấn rơi xuống.
b) Một sinh viên đi thi môn Toán và đậu môn này, nhưng đi thi ngoại ngữ lại bị rớt.
c) Bóc một tờ lịch trong quyển lốc lịch năm 2017, được tờ có ghi ngày 31/11/2017.
2. Phân loại biến cố
- Biến cố luôn luôn xảy ra trong phép thử được gọi là biến cố chắc chắn, kí hiệu là .
- Biến cố không bao giờ xảy ra được gọi là biến cố không thể, kí hiệu là  .
- Biến cố có thể xảy ra, hoặc không xảy ra trong phép thử được gọi là biến cố ngẫu nhiên,
kí hiệu là A, B, ... , C1, C2, ...
Ví dụ 2. Các biến cố ở ví dụ 1 là biến cố gì?
3. Các phép toán đối với biến cố
a) Tổng các biến cố
Cho hai biến cố A và B. Tổng của chúng là một biến cố C sao cho C xảy ra khi A hoặc B
xảy ra, kí hiệu C = A + B.
b) Tích các biến cố
Cho hai biến cố A và B. Tích của chúng là một biến cố D sao cho D xảy ra khi A và B xảy
ra, kí hiệu D = A.B
c) Biến cố đối lập
Hai biến cố A và B được gọi là đối lập nhau nếu biến cố A xảy ra thì biến cố B không xảy
ra và nếu A không xảy ra thì B phải xảy ra, kí hiệu B  A.
Lưu ý. Hai biến cố sau đây đối lập nhau:
A: Có ít nhất một phần tử của tập hợp có tính chất (  )
B  A: Không có phần tử nào của tập hợp có tính chất (  ).
Ví dụ 3. Lấy 3 viên bi trong cái hộp đựng 4 bi đỏ và 6 bi xanh.
Gọi A là biến cố: "Lấy được ít nhất 1 bi đỏ"; B là biến cố: "Lấy được 3 bi xanh".
Khi đó A và B là hai biến cố đối lập nhau.
Ví dụ 4. Một sinh viên thi hai môn - Toán Cao cấp (TCC) và Pháp luật Đại cương (PLĐC).
Gọi T là biến cố sinh viên đó đậu TCC, L là biến cố sinh viên đó đậu PLĐC. Hãy viết các
biến cố sau thành phép toán của T và L:
a) Sinh viên đó đậu ít nhất một môn; b) Sinh viên đó đậu cả hai môn;
c) Sinh viên đó chỉ đậu môn PLĐC; d) Sinh viên đó bị rớt cả hai môn;
e) Sinh viên đó chỉ đậu một môn; f) Sinh viên đó đậu không quá một môn.
Ví dụ 5. Có hai người cùng đi săn một con thú, mỗi người bắn 1 viên đạn. Gọi N1 , N 2 lần
lượt là biến cố người thứ nhất, người thứ hai bắn trúng con thú. Hãy biểu diễn các biến cố
sau đây thành phép toán của N1 , N 2 :
a) Cả hai người cùng bắn trúng; b) Con thú bị trúng đạn;
2
c) Chỉ có một người bắn trúng; d) Không ai bắn trúng;
e) Có không quá 1 người bắn trúng; f) Có ít nhất 1 người bắn trúng.
d) Các tính chất
(1) A  A  A (2) A. A  A
(3) A    A (4) A.  
(5) A     (6) A.  A
(7) A  A   (8) A. A  
(9) A( B  C )  AB  AC
4. Mối quan hệ của các biến cố
a) Hai biến cố xung khắc
Hai biến cố được gọi là xung khắc nhau nếu chúng không cùng xảy ra.
b) Hai biến cố độc lập
Hai biến cố được gọi là độc lập nếu biến cố này xảy ra không ảnh hưởng đến biến cố kia và
ngược lại.
c) Hệ biến cố đầy đủ
Hệ n biến cố A1, A2,..., An được gọi là hệ đầy đủ nếu luôn có một và chỉ một biến cố của
hệ xảy ra trong phép thử.
Ví dụ 6. Hai biến cố A , A tạo thành một hệ đầy đủ.
Ví dụ 7. Một sinh viên phải thi 4 môn. Gọi §k ( k  0,1,2,3,4) là biến cố sinh viên đó đậu k
môn (trong 4 môn đã thi). Ta có hai biến cố bất kì trong các biến cố này xung khắc với
nhau và hệ 5 biến cố đó là hệ đầy đủ.
Ví dụ 8. Tung một xúc xắc (tức là hình lập phương gồm 6 mặt có đánh số từ 1 đến 6).
Gọi Ak là biến cố xuất hiện mặt k (k = 1, 2, …, 6).
a) Hãy nêu các biến cố xung khắc nhau.
b) Các biến cố nào tạo thành hệ đầy đủ?
Ví dụ 9. Một xạ thủ bắn hai viên đạn vào một mục tiêu. Hãy đặt tên cho các biến cố của
phép thử này và nêu các biến cố
a) xung khắc nhau; b) độc lập với nhau;
c) đối lập nhau; d) tạo thành hệ đầy đủ.

II.2. ĐỊNH NGHĨA XÁC SUẤT


1. Định nghĩa
Cho T là một phép thử và A là biến cố có thể xảy ra trong phép thử đó.
Giả sử T có n trường hợp có thể xảy ra, trong số đó có m trường hợp làm biến cố A xuất
m
hiện. Khi đó tỉ số n được gọi là xác suất của biến cố A, kí hiệu là P(A).

Vậy P ( A)  m
n

Ý nghĩa của xác suất: Xác suất của một biến cố là một số đặc trưng cho khả năng xuất
hiện biến cố đó trong phép thử, xác suất càng lớn, khả năng xuất hiện biến cố càng nhiều.

3
Phương pháp tính xác suất bằng định nghĩa:
Để tính xác suất của một biến cố, ta thực hiện các bước sau đây:
- Gọi phép thử, tính số trường hợp có thể xảy ra (hoặc tính số cách thực hiện phép thử).
- Gọi tên biến cố cần tìm xác suất, tính số cách làm biến cố đó xuất hiện.
- Áp dụng công thức định nghĩa, tìm xác suất của biến cố đã cho.
Ví dụ 1. Từ một hộp chứa 7 chính phẩm và 3 phế phẩm, lấy ra 3 sản phẩm. Tìm xác suất
lấy được:
a) 2 phế phẩm (Đề thi Học kỳ 15.2A)
b) không quá 1 phế phẩm;
c) ít nhất 1 phế phẩm.
Ví dụ 2. Một thùng có 6 trái cây loại A, 5 trái loại B và 2 trái loại C. Lấy ngẫu nhiên ra
cùng lúc 3 trái. Tính xác suất lấy được:
a) 3 trái cùng một loại;
b) 3 trái thuộc ba loại khác nhau. (Đề thi Học kỳ 13.2A)
Ví dụ 3. Tung 2 đồng tiền, mỗi đồng có một mặt sấp và một mặt ngửa. Tìm xác suất thu
được:
a) 2 mặt đều sấp;
b) 2 mặt đều ngửa;
c) 1 mặt sấp và 1 mặt ngửa.
Trong ba biến cố trên, biến cố nào thường xảy ra nhiều hơn? Tại sao?
2. Các tính chất của xác suất
1) Với mọi biến cố A ta luôn có 0  P( A)  1
2) P ( )  0 3) P ( )  1 4) P ( A)  1  P ( A)
Ví dụ 4. Một chi đoàn có 30 sinh viên nam và 15 sinh viên nữ. Cần chọn ra 8 sinh viên
tham gia chiến dịch mùa hè xanh. Tìm xác suất trong nhóm chọn ra:
a) có 3 sinh viên nữ; b) có số sinh viên nam, nữ như nhau;
c) không có sinh viên nữ; d) có ít nhất 1 sinh viên nữ.
Ví dụ 5. Một lô hàng có 50 sản phẩm, trong đó có 6 phế phẩm. Lấy ngẫu nhiên 10 sản
phẩm từ lô hàng đó. Tìm xác suất lấy được
a) 8 sản phẩm tốt; b) không quá 1 phế phẩm;
c) Ít nhất 1 phế phẩm; d) ít nhất 1 sản phẩm tốt.

II.3. CÁC CÔNG THỨC TÍNH XÁC SUẤT


1. Công thức cộng
Cho hai biến cố A, B và C = A + B. Cần tính xác suất của C theo xác suất của A và B.
a) Trường hợp hai biến cố A và B xung khắc:
P(A+B) = P(A) + P(B) (1)
b) Trường hợp A và B không xung khắc:
P(A+B) = P(A) + P(B) - P(AB) (2)
Ví dụ 1. Có 10 cái bút, trong đó có 4 bút đỏ, số còn lại là bút xanh. Lấy ngẫu nhiên 3 cái
bút. Tìm xác suất lấy được
a) 1 bút đỏ; b) 3 bút xanh;

4
c) không quá 1 bút đỏ; d) ít nhất 1 bút đỏ.
Ví dụ 2. Trong hộp phấn có 6 viên phấn màu và 14 viên phấn trắng. Lấy ngẫu nhiên 5 viên
phấn. Tìm xác suất lấy được
a) 1 viên phấn màu; b) toàn phấn trắng;
c) nhiều nhất 1 viên phấn màu; d) ít nhất 1 viên phấn màu.
Ví dụ 3. Một công ty sử dụng hai hình thức quảng cáo là quảng cáo trên đài phát thanh và
quảng cáo trên tivi. Theo thăm dò, có 54% khách hàng biết thông tin quảng cáo của công ty
qua tivi, 23% khách hàng biết thông tin quảng cáo qua đài phát thanh, 10% khách hàng biết
thông tin qua cả hai hình thức quảng cáo đó. Chọn ngẫu nhiên 1 khách hàng, tìm xác suất
người đó biết thông tin quảng cáo. (Đề thi Học kỳ 14.1A)
Ví dụ 4. Tại vùng dân cư ngoại ô X, có 60% các hộ gia đình mua tờ báo đô thị được phát
hành tại một thành phố gần đó, 80% mua tờ báo địa phương và 50% mua cả hai tờ báo.
Chọn ngẫu nhiên một hộ gia đình trong vùng dân cư X. Tính xác suất hộ gia đình này:
a) Mua ít nhất một trong hai tờ báo đó;
b) Chỉ mua một tờ báo. (Đề thi Học kỳ 13.2A)
2. Công thức nhân
Cho hai biến cố A, B và C = AB. Cần tính xác suất của C theo xác suất của A và B.
a) Trường hợp hai biến cố A và B độc lập:
P(AB) = P(A) P(B) (3)
b) Trường hợp hai biến cố A và B không độc lập:
P(AB) = P(A) P(B/A)
hoặc P(AB) = P(B) P(A/B) (4)
trong đó P(A/B) là xác suất của biến cố A khi biến cố B đã xảy ra.
Ví dụ 5. Một sinh viên thi TCC và PLĐC. Cho biết xác suất đậu hai môn đó lần lượt là 0,7;
0,8. Hãy tính các xác suất sau đây:
a) Sinh viên đó rớt TCC; rớt PLĐC; b) Sinh viên đó chỉ đậu TCC;
c) Sinh viên đó đậu cả hai môn; d) Sinh viên đó chỉ đậu một môn;
e) Sinh viên đó đậu không quá một môn. f) Sinh viên đó đậu ít nhất một môn.
Ví dụ 6. Một xạ thủ bắn hai viên đạn, xác suất bắn trúng từng viên lần lượt là 0,6 ; 0,7. Tìm
xác suất anh ta bắn trúng
a) cả hai viên; b) chỉ một viên; c) ít nhất một viên.
Ví dụ 7. Có hai lô sản phẩm, mỗi lô chứa 10 sản phẩm, trong đó lô thứ i có i phế phẩm. Từ
mỗi lô lấy ngẫu nhiên ra 1 sản phẩm. Tính xác suất
a) Cả 2 sản phẩm đều tốt;
b) Có đúng 1 sản phẩm tốt. (Đề thi Học kỳ 16.1B)
Ví dụ 8. Trong một đợt thi đấu, một vận động viên phải đấu hai trận (kết quả mỗi trận là
thắng hoặc thua, không có hòa). Cho biết xác suất vận động viên này thắng trận thứ nhất là
0,6. Do ảnh hưởng tâm lý nên nếu thắng trận thứ nhất thì xác suất thắng trận thứ hai tăng
thành 0,8, nếu thua trận thứ nhất thì xác suất thắng trận thứ hai chỉ còn 0,4.
a) Tính xác suất vận động viên này thắng cả hai trận.
b) Giả sử vận động viên này thắng trận thứ hai, tính xác suất vận động viên thua trận thứ
nhất. (Đề thi Học kỳ 13.1A)

5
Ví dụ 9. Một người đi khám bệnh. Bác sỹ chấn đoán anh ta bị bệnh A với xác suất 0,7. Nếu
anh ta thật sự bị bệnh A thì khả năng bị bệnh B là 60%, nhưng nếu không bị bệnh A thì khả
năng bị bệnh B là 80%. Tìm xác suất người đó
a) bị cả hai bệnh; b) không bị bệnh nào;
c) bị ít nhất một bệnh; d) bị không quá một bệnh.
3. Công thức xác suất có điều kiện
Từ công thức (4) suy ra xác suất của biến A với điều kiện biến cố B đã xảy ra là:
P ( AB )
P (A / B )  (5)
P (B )
Ví dụ 10. Có hai sinh viên cùng thi môn XSTK. Cho biết xác suất thi đậu của từng sinh
viên lần lượt là 0,4 và 0,7.
a) Tính xác suất có đúng 1 sinh viên thi đậu.
b) Giả sử có đúng 1 sinh viên thi đậu, tìm xác suất đó là sinh viên thứ nhất. (Đề thi Học kỳ
15.1A)
Ví dụ 11. Có 3 xạ thủ cùng bắn vào một mục tiêu với xác suất bắn trúng lần lượt là 0,6; 0,7;
0,5.
a) Biết rằng có 2 người bắn trúng, tìm xác suất người thứ ba bắn trượt.
b) Giả sử có 1 người bắn trúng, tìm xác suất đó là người thứ hai. (Đề thi Học kỳ 15.1A)
4. Công thức xác suất đầy đủ
Cho hệ đầy đủ các biến cố A1, A2, ... , An và B là biến cố xảy ra khi một trong các biến cố
của hệ đó xảy ra. Khi đó xác suất của B được tính bởi công thức
P(B) = P(A1)P(B/A1) + P(A2)P(B/A2) + ... + P(An)P(B/An) (6)
Ví dụ 12. Cho 3 cái hộp đựng bút hình dáng giống nhau. Hộp thứ nhất có 2 bút đỏ, 8 bút
xanh. Hộp thứ hai có 4 bút đỏ, 6 bút xanh. Hộp thứ ba có 4 bút đỏ, 8 bút xanh. Lấy ngẫu
nhiên một hộp, từ đó lấy ngẫu nhiên 3 cái bút. Tìm xác suất lấy được
a) 1 bút đỏ; b) ít nhất một bút đỏ.
Ví dụ 13. Có 4 lô hàng, mỗi lô có 20 sản phẩm. Cho biết lô thứ nhất có 3 phế phẩm, lô thứ
hai có 2 phế phẩm, lô thứ ba có 4 phế phẩm và lô thứ tư có 1 phế phẩm. Chọn ngẫu nhiên 1
lô hàng, từ đó lấy ngẫu nhiên 6 sản phẩm. Tìm xác suất lấy được
a) 2 phế phẩm; b) ít nhất 1 phế phẩm.
Ví dụ 14. Cho biết tỉ lệ người uống bia rượu ở một vùng là 37%. Trong một cuộc nghiên
cứu người ta thấy tỉ lệ bị tai nạn giao thông trong vòng 1 năm ở nhóm người có sử dụng bia
rượu là 33%, còn ở nhóm người không sử dụng bia rượu là 9%. Chọn ngẫu nhiên một
người. Tìm xác suất người đó bị tai nạn giao thông trong vòng 1 năm. (Đề thi Học kỳ
14.1A)
Ví dụ 15. Một dây chuyền lắp ráp nhận được các chi tiết do 3 nhà máy sản xuất. Nhà máy
thứ nhất cung cấp 42%, nhà máy thứ hai cung cấp 36% tổng số chi tiết, còn lại là các chi
tiết do nhà máy thứ ba cung cấp. Biết tỷ lệ chi tiết đạt tiêu chuẩn của các nhà máy đó lần
lượt là 80%, 85% và 90%. Kiểm tra ngẫu nhiên 1 chi tiết từ dây chuyền.
a) Tính xác suất chi tiết đó đạt tiêu chuẩn. (Đề thi Học kỳ 15.2A)
b) Khả năng chi tiết đó không đạt tiêu chuẩn là bao nhiêu?

6
4. Công thức xác suất giả thiết
Cho hệ đầy đủ các biến cố A1, A2, ... , An và B là biến cố xảy ra khi một trong các
biến cố của hệ đó xảy ra. Ta còn nói các biến cố thuộc hệ đầy đủ là giả thiết để B xảy ra.
Bây giờ ta giả sử biến cố B đã xảy ra và đi tìm xác suất để B xảy ra là do giả thiết Ak , kí
hiệu P( Ak / B) . Ta có công thức:
P( Ak ) P( B / Ak )
P( Ak / B )  ( k = 1, 2, ... , n) (7)
P( B )
Công thức này còn được gọi là công thức Bayes.
Ví dụ 16. Trong kỳ thi sát hạch tay nghề, một công nhân phải bốc thăm chọn một trong ba
máy để thực hiện bài thi thực hành (có 3 lá thăm, trên mỗi lá ghi rõ máy phải sử dụng). Cho
biết xác suất người này thi đậu khi sử dụng máy thứ nhất, thứ hai, thứ ba lần lượt là 0,7;
0,65; 0,75.
a) Tính xác suất công nhân này thi đậu. (Đề thi Học kỳ 16.2A)
b) Giả sử công nhân này không thi đậu, tính xác suất người đó đã sử dụng máy thứ hai.
Ví dụ 17. Cho biết tỷ lệ mắc bệnh A trong một vùng dân cư là 25%. Để chuẩn đoán bệnh,
người ta thực hiện một xét nghiệm. Nếu một người bị bệnh A thì xét nghiệm sẽ cho kết quả
dương tính với xác suất 0,95. Nếu một người không bị bệnh A thì xét nghiệm vẫn có thể
cho kết quả dương tính với xác suất 0,12. Giả sử có một người được xét nghiệm.
a) Tìm xác suất kết quả xét nghiệm là dương tính.
b) Tìm xác suất người này bị bệnh A khi kết quả xét nghiệm là dương tính.
c) Nếu người đó có kết quả xét nghiệm âm tính thì xác suất người này bị bệnh A là bao
nhiêu? (Đề thi Học kỳ 14.1A)
Ví dụ 18. Một người đi khám bệnh do bị sốt. Theo kinh nghiệm của bác sĩ thì khả năng
người này bị cúm, bị sốt rét, bị thương hàn hoặc bị các bệnh khác lần lượt là 45%, 25%,
10% và 20%. Cho biết tỷ lệ bạch cầu tăng trong các trường hợp trên tương ứng là 0,5; 0,4;
0,1 và 0,8. Bác sĩ cho người này làm xét nghiệm máu thì thấy bạch cầu không tăng. Tính
xác suất người này bị thương hàn. (Đề thi Học kỳ 14.1A)
Ví dụ 19. Theo thống kê tại tỉnh A có 15% dân số nhiễm vi rút viêm gan B. Trong nhóm
những người nhiễm vi rút viêm gan B có 20% bị bệnh xơ gan; còn trong nhóm những người
không nhiễm vi rút viêm gan B chỉ có 6% bị bệnh xơ gan. Khám ngẫu nhiên một người ở
tỉnh A.
a) Tìm xác suất người này bị bệnh xơ gan.
b) Giả sử người được khám không bị bệnh xơ gan, tìm xác suất người đó bị nhiễm vi rút
viêm gan B.
c) Cần chọn tối thiểu bao nhiêu người ở tỉnh A để xác suất có ít nhất 1 người bị bệnh xơ
gan lớn hơn 95%? (Đề thi Học kỳ 16.1A)

PHƯƠNG PHÁP TÍNH XÁC SUẤT BẰNG CÔNG THỨC


Để tính xác suất của một biến cố bằng công thức, ta thực hiện các bước sau đây:
- Gọi tên biến cố cần tìm xác suất, phân tích nó thành phép toán đối với các biến cố khác
- Phân tích mối quan hệ giữa các biến cố tham gia vào phép toán: xung khắc hay không,
độc lập hay không, có tạo thành hệ đầy đủ hay không...
- Chọn công thức tính xác suất của biến cố ban đầu theo xác suất của các biến cố đó.
- Tính xác suất của các biến cố tham gia vào phép toán (nếu cần).
- Tính xác suất của biến cố ban đầu.
7
5. Công thức Bernoulli
Giả sử: - Phép thử T lặp lại n lần
- Biến cố A có thể xuất hiện trong mỗi lần thử với xác suất không đổi: P(A) = p.
Khi đó xác suất biến cố A xuất hiện k lần trong n lần thử là

Pn ( k, A )  Cnk pk (1  p)n  k (k = 0, 1, ... , n) (8)


Ví dụ 20. Một sinh viên thi 3 môn với xác suất đậu từng môn là 0,68. Tìm xác suất anh ta
a) đậu 3 môn; b) không đậu môn nào;
c) đậu ít nhất một môn; d) đậu từ 1 đến 3 môn.
Ví dụ 21. Một xạ thủ đã bắn 5 viên đạn. Cho biết xác suất bắn trúng mục tiêu của mỗi lần
bắn đều là 0,8. Tìm xác suất anh ta bắn trúng
a) 4 viên; b) không quá 2 viên; c) ít nhất một viên đạn.
Ví dụ 22. Một lô hàng có tỷ lệ phế phẩm là 5%.
a) Lấy ngẫu nhiên 6 sản phẩm từ lô hàng đó. Tìm xác suất lấy được không quá 2 phế
phẩm.
b) Cần lấy ra tối thiểu bao nhiêu sản phẩm để xác suất có ít nhất một phế phẩm không nhỏ
hơn 0,9? (Đề thi Học kỳ 13.1A)
Ví dụ 23. Một xí nghiệp nhập linh kiện được sản xuất từ ba công ty A, B, C với tỷ lệ tương
ứng là 36%, 38%, 26%. Biết tỷ lệ linh kiện đạt tiêu chuẩn của ba công ty đó lần lượt là
93%, 95%, 98%.
a) Chọn ngẫu nhiên một linh kiện trong kho hàng của xí nghiệp. Tìm xác suất linh kiện này
đạt tiêu chuẩn.
b) Giả sử chọn được linh kiện không đạt tiêu chuẩn, khả năng linh kiện này do công ty nào
cung cấp là nhiều nhất?
c) Chọn ngẫu nhiên 10 linh kiện trong kho hàng của xí nghiệp, tìm xác suất có ít nhất 9 linh
kiện đạt tiêu chuẩn. (Đề thi Học kỳ 16.2A)
6. Các công thức tính gần đúng xác suất
Trong công thức Bernoulli, nếu n và k tương đối lớn thì việc sử dụng công thức gặp khó
khăn nên người ta sử dụng các công thức gần đúng để thay thế. Muốn sai số chấp nhận
được thì tùy theo giá trị của n và k, cũng như tùy vào xác suất của biến cố trong mỗi lần
thử mà ta sử dụng công thức gần đúng cho thích hợp.
a) Trường hợp n khá lớn, P(A) = p không quá lớn, không quá bé. Khi đó ta sử dụng
công thức Gauss để tính Pn ( k, A ) và sử dụng công thức Laplace để tính xác suất A xuất
hiện từ k1 đến k1 lần trong n lần thử (ký hiệu là Pn ( k1  k2 , A ) ).
1  k  np 
Pn ( k, A )  f
 np(1  p) 
(9)
np(1  p)  
trong đó f(x) là hàm số Gauss có bảng giá trị cho trước.
 k  np   k  np 
Pn ( k1  k2 , A )    2 
 np(1  p) 
 1
 np(1  p) 
(10)
   
trong đó  ( x ) là hàm số Laplace có bảng giá trị cho trước.

8
Lưu ý. Khi tra bảng các hàm số trên đây, cần chú ý rằng: hàm số Gauss là hàm chẵn, hàm
số Laplace là hàm lẻ, nghĩa là:
f ( x )  f ( x ) ;   x     x 
Với những giá trị x nằm ngoài bảng, cần lấy số gần nhất trong bảng.
Ví dụ 24. Một đề thi trắc nghiệm có 100 câu hỏi, xác suất trả lời đúng mỗi câu của một sinh
viên là 0,4. Tìm xác suất sinh viên đó trả lời đúng
a) 50 câu hỏi; b) ít nhất 50 câu hỏi.
Ví dụ 25. Xác suất sinh một bé trai là 0,54. Tìm xác suất để trong 160 em bé, số bé trai ít
hơn số bé gái.
Ví dụ 26. Cho biết tỷ lệ phế phẩm của một nhà máy là 15%. Chọn ngẫu nhiên 150 sản
phẩm trong kho hàng của nhà máy. Tìm xác suất trong số đó có
a) 20 phế phẩm; b) từ 20 đến 30 phế phẩm.
b) Trường hợp n khá lớn, P(A) = p khá bé.
Khi đó ta sử dụng công thức Poisson để tính Pn ( k, A ) .Ta có
e np ( np)k
Pn ( k, A )  (11)
k!
Ví dụ 27. Một chung cư có 160 hộ gia đình. Xác suất để mỗi hộ có sự cố về điện vào buổi
tối là 0,02. Tìm xác suất để trong một buổi tối có
a) 4 gia đình gặp sự cố về điện;
b) từ 2 đến 5 gia đình gặp sự cố về điện.
Ví dụ 28. Xác suất để một hạt thóc giống bị lép là 0,006. Tìm xác suất trong 300 hạt thóc
giống có:
a) 2 hạt bị lép; b) từ 3 đến 7 hạt bị lép.
BÀI TẬP CHƯƠNG II
2.1. Lớp học môn xác suất có 64 sinh viên, trong đó có 15 sinh viên nữ. Chọn ngẫu nhiên
một nhóm gồm 10 sinh viên. Tìm xác suất trong nhóm chọn ra có
a) 4 sinh viên nữ; b) số sinh viên nam bằng số sinh viên nữ;
c) không quá 2 sinh viên nữ; d) ít nhất 1 sinh viên nữ.
2.2. Từ một lô hàng có 6 quả bóng đỏ, 9 quả bóng xanh và 5 quả bóng vàng người ta lấy ra
5 quả bóng. Tìm xác suất lấy được
a) 2 quả bóng đỏ; b) 2 quả bóng vàng, 3 quả bóng xanh;
c) ít nhất 1 quả bóng đỏ; d) không quá 1 quả bóng đỏ.
2.3. Cho A và B là hai biến cố bất kỳ. Biết P(A + B) = 0,7; P(A.B) = 0,22; P(A) = 0,5.
Tính P( A.B ) , P( AB  AB ) . (Đề thi Học kỳ 12.2A)
2.4. Có ba người, mỗi người bắn một viên đạn vào bia với xác suất bắn trúng lần lượt là
0,6; 0,7 ; 0,8. Tìm các xác suất sau đây:
a) Chỉ có người thứ hai bắn trúng; b) Có đúng một người bắn trúng;
c) Chỉ có người thứ ba bắn trượt; d) Có đúng hai người bắn trúng;
e) Cả ba người đều bắn trúng; f) Không có ai bắn trúng.
2.5. Có hai hộp, mỗi hộp chứa 5 bi. Hộp thứ nhất có 3 bi đỏ và 2 bi xanh. Hộp thứ hai có 4
bi đỏ và 1 bi xanh. Lấy ngẫu nhiên từ hộp thứ nhất ra 2 bi và từ hộp thứ hai ra 1 bi. Tìm xác
suất lấy được ít nhất 1 bi xanh. (Đề thi Học kỳ 14.1A)
9
2.6. Trong một thùng hàng có 6 sản phẩm tốt và 4 phế phẩm. Lần thứ nhất lấy ra 2 sản
phẩm, lần thứ hai cũng lấy ra 2 sản phẩm.
a) Tìm xác suất mỗi lần đều lấy được 1 sản phẩm tốt.
b) Tìm xác suất lần thứ hai lấy được 2 sản phẩm tốt.
c) Giả sử lần thứ hai lấy được 2 sản phẩm tốt, tìm xác suất lần thứ nhất lấy phải ít nhất 1
phế phẩm. (Đề thi Học kỳ 14.2A)
2.7. Trước khi đưa sản phẩm X ra bán trên thị trường, người ta phỏng vấn ngẫu nhiên một
số khách hàng thì thấy những người trả lời “sẽ mua”, “có thể sẽ mua” và “không mua”
chiếm tỷ lệ lần lượt là 17%, 48% và 35%. Cho biết tỷ lệ khách hàng thực sự mua sản phẩm
X tương ứng với những câu trả lời trên tương ứng là 40%, 20% và 4%.
a) Chọn ngẫu nhiên một khách hàng. Tìm xác suất khách hàng đó thực sự mua sản phẩm X.
b) Chọn ngẫu nhiên 1 khách hàng thì thấy người này đã mua sản phẩm X. Tìm xác suất
khách hàng này đã trả lời “không mua” khi được phỏng vấn.
c) Chọn ngẫu nhiên 10 khách hàng. Tìm xác suất có ít nhất 2 người đã mua sản phẩm X.
(Đề thi Học kỳ 14.2A)
2.8. Một xí nghiệp có 4 máy cùng sản xuất một loại sản phẩm. Cho biết máy thứ nhất sản
xuất 28% tổng số sản phẩm, máy thứ hai sản xuất 30%, còn máy thứ ba và thứ tư có năng
suất như nhau. Tỉ lệ sản phẩm đạt tiêu chuẩn của 4 máy lần lượt là 95%, 97%, 94% và 96%.
a) Chọn ngẫu nhiên một sản phẩm trong kho hàng của xí nghiệp. Tìm xác suất chọn được
sản phẩm đạt tiêu chuẩn.
b) Giả sử khi chọn một sản phẩm trong kho hàng của xí nghiệp thì thấy đó là phế phẩm.
Tìm xác suất phế phẩm này do máy thứ hai sản xuất.
c) Chọn ngẫu nhiên 10 sản phẩm trong kho. Tìm xác suất chọn được ít nhất 2 phế phẩm.
(Đề thi Học kỳ 14.2A)
2.9. Một công ty bảo hiểm chia đối tượng bảo hiểm làm 3 loại: ít rủi ro (chiếm 30%), rủi ro
trung bình (chiếm 45%) và rủi ro cao (chiếm 25%). Biết tỉ lệ khách hàng gặp tai nạn trong
vòng một năm tương ứng với các đối tượng trên là 0,04; 0,16 và 0,35.
a) Chọn ngẫu nhiên 1 khách hàng. Tính xác suất người này gặp tai nạn trong vòng một
năm.
b) Nếu khách hàng được chọn gặp tai nạn thì khả năng người này ở nhóm đối tượng nào là
nhiều nhất?
c) Cần chọn ít nhất bao nhiêu khách hàng để xác suất có ít nhất 1 người bị tai nạn trong
vòng một năm lớn hơn 0,97? (Đề thi Học kỳ 15.1A)
2.10. Giả sử xác suất sinh con trai là 0,53. Một gia đình có 4 người con. Tìm xác suất gia
đình đó có
a) một con trai; b) số con trai, con gái như nhau;
c) không quá một con trai; d) ít nhất 1 con trai.
2.11. Một xạ thủ có xác suất bắn trúng đích ở mỗi lần bắn là 0,7. Xạ thủ đó đã bắn 4 lần,
mỗi lần 1 viên đạn. Tìm xác suất có
a) 3 viên trúng đích; b) ít nhất 1 viên trúng;
c) không quá 3 viên trúng; d) ít nhất 2 viên trúng
2.12. Có một lô thuốc mà người giao hàng cho biết tỷ lệ lọ xấu là 15%.
a) Lấy ngẫu nhiên 5 lọ từ lô hàng đó. Tìm xác suất lấy được không quá 3 lọ xấu.
b) Cần lấy tối thiểu bao nhiêu lọ từ lô hàng để xác suất có ít nhất 1 lọ xấu không nhỏ hơn
0,96? (Đề thi Học kỳ 13.2A)
10
2.13. Người bán hàng đóng các sản phẩm thành hộp, mỗi hộp đựng 10 sản phẩm, trong đó
có 7 sản phẩm loại A. Người mua hàng kiểm tra bằng cách lấy ngẫu nhiên 1 sản phẩm từ
hộp, nếu thấy sản phẩm đó loại A thì mua hộp, ngược lại thì không mua.
a) Giả sử người mua hàng đã kiểm tra 10 hộp. Tìm xác suất người đó mua ít nhất 3 hộp.
b) Phải kiểm tra tối thiểu bao nhiêu hộp để xác suất có ít nhất 1 hộp được mua không
nhỏ hơn 0,95? (Đề thi Học kỳ 16.1B)
2.14. Cho biết tỷ lệ sản phẩm loại một của công ty là 70%, còn lại là sản phẩm loại hai.
a) Một khách hàng mua 5 sản phẩm của công ty. Tìm xác suất người này mua phải ít nhất
2 sản phẩm loại hai.
b) Tính xác suất trong 5000 sản phẩm của công ty được bán ra có ít nhất 1480 sản phẩm
loại hai.
2.15. Tỉ lệ phế phẩm ở một nhà máy là 0,002. Tìm xác suất trong 500 sản phẩm có
a) 3 phế phẩm; b) nhiều nhất 3 phế phẩm.
2.16. Một nhà máy có tỷ lệ phế phẩm là 0,3%. Chọn ngẫu nhiên 400 sản phẩm trong kho
hàng của nhà máy. Tìm xác suất có
a) 2 phế phẩm; b) từ 1 đến 4 phế phẩm;
c) không quá 2 phế phẩm; d) ít nhất 2 phế phẩm;
e) ít nhất 1 phế phẩm.

CHƯƠNG III. ĐẠI LƯỢNG NGẪU NHIÊN


VÀ CÁC PHÂN PHỐI XÁC SUẤT
III.1. ĐỊNH NGHĨA và PHÂN LOẠI ĐẠI LƯỢNG NGẪU NHIÊN
1. Khái niệm
Đại lượng cho tương ứng mỗi kết quả của phép thử với một số được gọi là đại lượng
ngẫu nhiên (hay biến ngẫu nhiên) trên các kết quả của phép thử đó. Nói một cách khác,
đại lượng ngẫu nhiên là đại lượng có giá trị thay đổi tuỳ theo phép thử.
Ví dụ 1. a) Số môn thi đậu của một sinh viên trong một học kì (khi phải thi 5 môn).
b) Nhiệt độ của phòng học trong một ngày đêm.
c) Số người đến giao dịch tại một ngân hàng trong một tháng.
d) Chiều cao của thanh niên Việt nam thường trong khoảng 155 cm đến 180 cm.
2. Các loại đại lượng ngẫu nhiên
Đại lượng ngẫu nhiên được chia thành hai loại: rời rạc và liên tục.
- Đại lượng ngẫu nhiên X có dạng
X   x1, x2 ,..., xn  hoặc X   x1 , x2 ,..., xn ,...
được gọi là đại lượng ngẫu nhiên rời rạc.
- Đại lượng ngẫu nhiên có giá trị lấp đầy một khoảng (a, b) hay đoạn [a, b] nào đó
được gọi là đại lượng ngẫu nhiên liên tục (a, b có thể hữu hạn hoặc vô hạn).
Ví dụ 2. Các đại lượng ngẫu nhiên cho ở ví dụ 1 là đại lượng gì?
3. Phân phối xác suất
Muốn nghiên cứu đại lượng ngẫu nhiên X, ta cần biết các giá trị có thể có của X và xác suất
để X nhận mỗi giá trị đó. Mối liên hệ giữa các giá trị có thể có của X và xác suất tương ứng
được gọi là phân phối xác suất của đại lượng ngẫu nhiên X.
11
Đối với đại lượng ngẫu nhiên rời rạc ta có bảng phân phối xác suất. Trường hợp đại lượng
ngẫu nhiên liên tục, ta có hàm mật độ phân phối xác suất.
a) Bảng phân phối xác suất
Cho X   x1 , x2 ,..., xn  là một đại lượng ngẫu nhiên rời rạc.
Đặt pi  P( X  xi ), i  1,2,..., n.
Khi đó bảng sau đây được gọi là bảng phân phối xác suất của X.
X x1 x2 … xn
P p1 p2 … pn
Bảng phân phối xác suất có các tính chất sau
n
(1) 0  pi 1 (2)  pi  1
i 1
Ví dụ 3. Gọi X là số môn thi đậu của một sinh viên trong học kì phải thi 5 môn. Khi đó X
nhận các giá trị: 0, 1, 2, 3, 4, 5. Giả sử X có bảng phân phối xác suất sau đây.
X 0 1 2 3 4 5
P 0,05 0,15 0,3 0,35 0,15 0
Từ bảng ta có xác suất thi đậu 4 môn của sinh viên đó là 0,15; xác suất đậu cả 5 môn là 0.
Trong các xác suất ta thấy P( X  3) lớn nhất nên khả năng anh ta đậu 3 môn là nhiều nhất.
Ví dụ 4. Một xạ thủ được phép bắn 3 viên đạn. Gọi X là số viên đạn anh ta bắn trúng bia.
Hãy lập bảng phân phối xác suất của X, biết xác suất bắn trúng mục tiêu của mỗi viên đạn
đều là 0,75.
b) Hàm mật độ phân phối xác suất
Cho X là đại lượng ngẫu nhiên liên tục nhận giá trị trong khoảng (a, b) (a, b là số hữu hạn
hoặc vô hạn). Hàm mật độ phân phối xác suất của X là hàm số f ( x ) xác định trên (a, b) sao

cho với mọi  ,   ( a, b) ta có P (  X   )   f ( x )dx .

Hàm mật độ phân phối xác suất có các tính chất sau đây:
(1) f ( x )  0 , x  ( a, b) ;
b
(2)  f ( x )dx  1 .
a

Ví dụ 5. Cho đại lượng ngẫu nhiên X có hàm mật độ phân phối xác suất
  
 a cos x khi  2  x  2
f ( x)  
 0   
khi x    , 
  2 2

a) Tìm hằng số a; b) Tính P (0  X  ).
4
4. Hàm phân phối xác suất
Cho X là đại lượng ngẫu nhiên (rời rạc hoặc liên tục). Khi đó hàm số có dạng:

12
F ( x )  P( X  x ) , x   ,
được gọi là hàm phân phối xác suất của X.
Hàm phân phối xác suất có các tính chất sau đây:
(1) F(x) là hàm không giảm;
(2) 0  F(x)  1,  x  R;
(3) xlim F ( x)  0 ; lim F ( x )  1 ;
  x  

(4) P(a  X < b) = F(b) – F(a), a, b   .


(5) Nếu X là đại lượng ngẫu nhiên liên tục thì F '( x )  f ( x ), x   .
Ngược lại, nếu F(x) là hàm số xác định trên R và có các tính chất (1) – (3) thì F(x) là hàm
phân phối xác suất của một đại lượng ngẫu nhiên nào đó.
a) Trường hợp X là đại lượng ngẫu nhiên rời rạc có bảng phân phối xác suất
X x1 x2 … xn
P p1 p2 … pn

với x1 < x2 < … < xn , thì hàm phân phối xác suất của X là
 0 , x  x1
 p1 , x1  x  x 2

F(x) =  ...................... ... ...............
 p  p  ....  p
 1 2 n 1 , x n 1  x  x n
 1 , x  xn
Ví dụ 6. Cho X là đại lượng ngẫu nhiên rời rạc có bảng phân phối xác suất như sau
X 1 2 4
P 0,25 0,45 0,3
Hàm phân phối xác suất của X có dạng
 0 khi x 1
0,25 khi 1  x  2

F( x)  
 0,7 khi 2  x  4
 1 khi x4

Ví dụ 7. Một sinh viên thi ba môn Toán, Lý, Hóa với xác suất đậu lần lượt là 0,6 ; 0,7 ;
0,8. Hãy tìm hàm phân phối xác suất của số môn anh ta đậu trong ba môn đó.
b) Trường hợp X là đại lượng ngẫu nhiên liên tục có hàm mật độ phân phối xác suất là
f ( x ) thì
x
F( x)   f ( t )dt


2 x khi x  [0,1]
Ví dụ 8. Cho hàm số f ( x )  
 0 khi x  [0,1]
a) Chứng tỏ f ( x ) là hàm mật độ xác suất của một đại lượng ngẫu nhiên X;
13
b) Tìm hàm phân phối xác suất F ( x ) của X;
1
c) Tính P (0  X  ) .
2
Ví dụ 9. Cho đại lượng ngẫu nhiên X có hàm mật độ phân phối xác suất như ở ví dụ 5.
a) Tìm hàm phân phối xác suất của X;
 
b) Tính P ( X  ).
6 3
III.2. ĐẠI LƯỢNG NGẪU NHIÊN RỜI RẠC
1. Các đặc trưng của đại lượng ngẫu nhiên rời rạc
a) Kì vọng
Cho X là đại lượng ngẫu nhiên rời rạc có bảng phân phối xác suất là :
X x1 x2 … xn
P p1 p2 … pn
n
Khi đó số E( X )   xi pi được gọi là kì vọng của X.
i 1
Kì vọng của đại lượng ngẫu nhiên là trung bình theo xác suất các giá trị có thể nhận
của đại lượng đó.
b) Phương sai
Số D( X )  E( X 2 )  E2 ( X ) ,
n
trong đó E( X ) là kì vọng của X , E( X ) 
2
 xi2 pi là kì vọng của X2 ,
i 1
được gọi là phương sai của đại lượng ngẫu nhiên X .
n
  xi  E( X )
2
Phương sai còn được tính bởi công thức: D( X )  pi
i 1
Phương sai là trung bình của bình phương sai số giữa X và trung bình theo xác suất
của X.
c) Độ lệch chuẩn Số (X) = D(X) được gọi là độ lệch chuẩn của đại lượng ngẫu
nhiên X.
Ví dụ 1. Tính kì vọng, phương sai và độ lệch chuẩn của đại lượng ngẫu nhiên X, biết bảng
phân phối xác suất của nó là
X 1 2 4
P 0,25 0,45 0,3
Giải. Ta có
E( X )  1.0,25  2.0,45  4.0,3  2,35 ; E( X 2 )  12.0,25  22.0,45  42.0,3  6,85;
D( X )  E( X 2 )  E2 ( X )  6,85  2,352  1,3275 ;  ( X )  D( X )  1,3275  1,1522.
Có thể tính phương sai bằng cách khác:
D( X )  (1  2,35)2 .0,25  (2  2,35)2 .0,45  (4  2,35)2.0,3  1,3275.
14
Ví dụ 2. Một sinh viên thi 4 môn, xác suất đậu từng môn là 0,6. Gọi X là số môn sinh viên
đó đậu. Hãy lập bảng phân phối xác suất, hàm phân phối xác suất và tính kì vọng, phương
sai, độ lệch chuẩn của X.
Lưu ý: E (cX )  cE ( X ) ; D (cX )  c 2 D ( X ) , trong đó c là hằng số và X là đại lượng
ngẫu nhiên (rời rạc hoặc liên tục).
2. Một số phân phối xác suất thông dụng
a) Phân phối nhị thức
Đại lượng ngẫu nhiên rời rạc X  0,1,2,.., n được gọi là có phân phối nhị thức nếu tồn tại
số p  (0,1) sao cho pk  P( X  k)  Cnk pkqn k , trong đó q  1  p ; k  0,1,2,.., n.
Khi đó ta kí hiệu X  B( n, p) .
Nếu X có phân phối nhị thức thì E( X )  np ; D( X )  npq .
Ví dụ 3 (Tiếp theo ví dụ 2). Số môn sinh viên đậu trong 4 môn là đại lượng ngẫu nhiên có
phân phối nhị thức với n  4 ; p  0,6 .
Vậy E( X )  np  4.0,6  2,4 ; D( X )  npq  4.0,6.0,4  0,96.
Ví dụ 4. Cho biết tỉ lệ phế phẩm của một nhà máy là 3%. Chọn ngẫu nhiên 15 sản phẩm
trong kho hàng của nhà máy. Gọi X là số phế phẩm có trong 15 sản phẩm đó. Tìm phân
phối xác suất của X và tính kì vọng, phương sai, độ lệch chuẩn của X.
Ví dụ 5. Tỉ lệ sinh viên thi đậu môn xác suất thống kê (XSTK) của một trường đại học là
65%. Trong một kì thi XSTK do nhà trường tổ chức có 200 sinh viên dự thi. Gọi X là số
sinh viên thi đậu.
a) Hãy tìm phân phối xác suất của X, tính kì vọng và độ lệch chuẩn của X.
b) Tìm xác suất có ít nhất 140 sinh viên thi đậu. (Đề thi Học kỳ 16.1A)
b) Phân phối siêu bội
Đại lượng ngẫu nhiên rời rạc X  0,1,2,.., n được gọi là có phân phối siêu bội nếu tồn tại
các số tự nhiên N, M sao cho 0  M  N và
k n k
CM CN M
pk  P ( X  k )  ; k  0,1,2,...,max( M , n ).
n
CN
Khi đó ta kí hiệu X  H ( N , M , n) .
Nn M
Nếu X có phân phối siêu bội thì E( X )  np ; D( X )  npq , trong đó p  ; q  1  p.
N 1 N
Ví dụ 6. Một lô hàng có 30 sản phẩm, trong đó có 10 phế phẩm. Chọn ngẫu nhiên 5 sản
phẩm. Gọi X là số phế phẩm trong 5 sản phẩm đó. Tìm phân phối xác suất của X và tính kì
vọng, phương sai của X.
Ví dụ 7. Một cái hộp đựng 6 viên bi đỏ và 14 viên bi xanh. Lấy ngẫu nhiên 8 viên bi. Gọi X
là số viên bi đỏ lấy được. Tìm phân phối xác suất của X và tính kì vọng, phương sai, độ
lệch chuẩn của X.
Ví dụ 8. Một thùng hàng có 6 sản phẩm tốt và 4 phế phẩm. Lấy ngẫu nhiên ra 3 sản phẩm.
Lập bảng phân phối xác suất, tính kỳ vọng, phương sai của số sản phẩm tốt có trong 3 sản
phẩm lấy ra. (Đề thi Học kỳ 16.2A)

15
c) Phân phối Poisson
Đại lượng ngẫu nhiên rời rạc X  0,1,2,.., n,... được gọi là có phân phối Poisson nếu tồn tại
e a a k
số a > 0 sao cho pk  P( X  k)  ; k  0,1,2,...
k!
Khi đó ta kí hiệu X  P( a) . Số a được gọi là tham số của phân phối Poisson.
Nếu X có phân phối Poisson thì E( X )  D( X )  a.
Chú ý:
(1) Nếu X là số lần biến cố A xuất hiện trong một khoảng thời gian hoặc trên một miền,
một vùng nào đó thì X  P( a) , với a là giá trị trung bình của số lần A xảy ra.
(2) Nếu X  B( n, p) , trong đó p khá nhỏ và n khá lớn thì có thể xấp xỉ X  P( a) với a = np.
Ví dụ 9. Số liệu của một hãng hàng không cho thấy trong 1000 chuyến bay thì có 18 trường
hợp hành khách bị mất hành lí do bỏ quên. Gọi X là số trường hợp hành khách bị mất hành
lí trong một chuyến bay. Tìm xác suất trong một chuyến bay:
a) không ai bị mất hành lí;
b) có 1 hành khách bị mất hành lí.
Ví dụ 10. Người ta đếm được 200 lỗi chính tả trong một cuốn sách có 500 trang. Chọn
ngẫu nhiên 1 trang trong cuốn sách đó. Tìm xác suất trang này có không quá 3 lỗi chính tả.
(Đề thi Học kỳ 13.1A)
Ví dụ 11. Người ta thống kê được trong 5 phút có 14 xe ôtô đi qua trạm thu phí giao thông.
Tìm xác suất trong 2 phút có ít nhất 4 xe ôtô đi qua trạm thu phí đó. (Đề thi Học kỳ 15.1A)
Ví dụ 12. Tại một điểm bán vé máy bay, trung bình 5 phút có 2 người đến mua vé. Tính
xác suất có 5 người đến mua vé trong 10 phút. (Đề thi Học kỳ 15.2A)

III.3. ĐẠI LƯỢNG NGẪU NHIÊN LIÊN TỤC


1. Các đặc trưng của đại lượng ngẫu nhiên liên tục
a) Kì vọng
Nếu X là đại lượng ngẫu nhiên liên tục có hàm mật độ xác suất f ( x ) thì số

E( X )   xf ( x )dx ( khi vế phải hội tụ) được gọi là kì vọng của X.

b) Phương sai
Phương sai của đại lượng ngẫu nhiên liên tục vẫn được tính bởi công thức
D( X )  E( X 2 )  E2 ( X )

trong đó kì vọng của X 2 là E( X 2 )   x2 f ( x )dx .



  x  E( X )
2
Ngoài ra, phương sai còn được tính bởi công thức: E( X )  f ( x )dx .

c) Độ lệch chuẩn
Độ lệch chuẩn của đại lượng ngẫu nhiên liên tục là (X) = D(X) .

16
Ví dụ 1. Cho đại lượng ngẫu nhiên X có hàm mật độ phân phối xác suất
2 x khi x  [0,1]
f ( x)  
 0 khi x  [0,1]
Tìm kì vọng, phương sai, độ lệch chuẩn của X.
Ví dụ 2. Cho đại lượng ngẫu nhiên X có hàm mật độ phân phối xác suất
3 x2 khi x  [0,1]
f ( x)  
 0 khi x  [0,1]
Tính kì vọng, phương sai, độ lệch chuẩn của X.
2. Một số phân phối xác suất thông dụng
a) Phân phối chuẩn
Đại lượng ngẫu nhiên X được gọi là có phân phối chuẩn với kì vọng  , phương sai  2 nếu
( x   )2
1 
hàm mật độ phân phối xác suất của X có dạng f ( x )  e 2 2 ,  0.
 2
Khi đó ta kí hiệu X  N (  ,  2 ) .
Nếu X có phân phối chuẩn thì E( X )   ; D( X )   2 .
b) Phân phối chuẩn tắc
Đại lượng ngẫu nhiên X được gọi là có phân phối chuẩn tắc nếu X  N (0;1) .
Khi đó ta có E( X )  0 ; D( X )  1 , hàm mật độ phân phối xác suất của X có dạng
x2
1 2
f ( x)  e và được gọi là hàm mật độ Gauss. Đây là hàm chẵn với giá trị lớn nhất
2
0 
1
max f ( x )  f (0) 
2
 0,3989 . Ta cũng có  f ( x )dx   f ( x )dx  0,5 .
 0

Lưu ý. Mọi phân phối chuẩn đều có thể chuẩn tắc hoá nhờ phép đổi biến, nghĩa là nếu
X 
X  N (  ,  2 ) thì Z   N (0;1) .

3. Tích phân Laplace và hàm phân phối Gauss
x2
1 2
Cho hàm mật độ phân phối xác suất Gauss: f ( x )  e . Khi đó ta có
2
u u x2
1 
- Hàm phân phối Gauss có dạng: F (u )   f ( x )dx 
2  e 2 dx .
 
u u x2
1 
- Tích phân Laplace có dạng:  (u)   f ( x )dx   e 2 dx .
2
0 0
Do đó F (u)  0,5   (u ) hay  (u)  F (u )  0,5 .
Ta nhận thấy  (u) là hàm số lẻ, nghĩa là  ( u)   (u) . Giá trị của tích phân này được
cho trong bảng. Người ta thường sử dụng hàm số  (u ) để tính xác suất.
Ta có các công thức sau đây:
a) Trường hợp X  N (0;1) thì P(  X   )   (  )   ( ) ; P( X   )  2 ( ) ,   0 .

17
     
b) Trường hợp X  N (  , 2 ) thì P(  X   )       (*)
     

và P( X   )  2   ,   0 .
 
Từ đó suy ra rằng với   k thì P( X  k )  2  k  ; P( X  3 )  2  3   0,9973 .
Công thức này có nghĩa là sai số giữa đại lượng ngẫu nhiên X và kì vọng  của nó
không quá 3 là gần như chắc chắn (xác suất gần bằng 1).
Lưu ý. Từ công thức (*) suy ra rằng: Nếu X  N (0;1) thì
P( X   )  P(  X   )   (  )   ( )  0,5   ( )
P( X   )  P(   X   )   (  )   (  )   (  )  0,5
Tương tự, nếu X  N ( , 2 ) thì
      
P( X   )  0,5    ; P( X   )  0,5    
     
Ví dụ 3. Một nhà máy cho biết thời gian công nhân lắp ráp các bộ phận của ôtô có phân
phối chuẩn với trung bình là 80 giây và độ lệch chuẩn là 10 giây. Giả sử thời gian lắp ráp từ
60 đến 70 giây được xem là nhanh.
a) Tìm tỷ lệ công nhân của nhà máy có thể lắp ráp nhanh.
b) Chọn ngẫu nhiên một nhóm 10 công nhân, tính xác suất trong nhóm này có từ 2 đến 3
công nhân lắp ráp nhanh. (Đề thi Học kỳ 15.1A)
Ví dụ 4. Tuổi thọ của một loại thiết bị (đơn vị: năm) là một biến ngẫu nhiên có phân phối
chuẩn, với tuổi thọ trung bình là 4,5 năm và độ lệch chuẩn là 1,5 năm. Thiết bị được coi là
chất lượng kém nếu tuổi thọ của nó dưới một năm.
a) Tính tỷ lệ thiết bị chất lượng kém.
b) Một công ty mua 500 thiết bị về sử dụng, tính xác suất trong 500 thiết bị này có ít nhất
hai thiết bị chất lượng kém. (Đề thi Học kỳ 15.2A)
Ví dụ 5. Giả sử chỉ số thông minh (IQ) của người Việt Nam là một biến ngẫu nhiên có
phân phối chuẩn với chỉ số trung bình là 96 và độ lệch chuẩn là 4. Một người được xem là
thông minh nếu có chỉ số từ 105 trở lên.
a) Tìm tỷ lệ người Việt Nam thông minh.
b) Chọn ngẫu nhiên 100 người ở Việt Nam, tìm xác suất có ít nhất 3 người thông minh.
4. Mối liên hệ giữa phân phối chuẩn và phân phối nhị thức
Cho X  B( n, p) . Nếu n lớn, p không quá gần 0 và 1, ta có thể xấp xỉ X  N ( np, npq) .
1  k  np 
Khi đó P( X  k )  f  , với f ( x ) là hàm mật độ phân phối xác suất Gauss.
npq  npq 
 k  np   k  np 
P( k1  X  k2 )    2   1 , trong đó  ( x ) là tích phân Laplace.
 npq   npq 
   
Ví dụ 6. Xác suất sinh được một bé trai là 0,53. Tìm xác suất trong 300 em bé sắp sinh có
a) 180 bé trai; b) từ 150 đến 175 bé trai; c) ít nhất 190 bé trai.
Ví dụ 7. Xác suất thi đậu môn XSTK của sinh viên một trường đại học là 0,7. Học kì này
có 1200 sinh viên thi môn này. Tìm xác suất có
a) 860 sinh viên đậu; b) Ít nhất 860 sinh viên đậu; c) từ 912 đến 1008 sinh viên đậu.

18
BÀI TẬP CHƯƠNG III
3.1. Một sinh viên thi 4 môn, xác suất đậu từng môn là 0,75. Gọi X là số môn anh ta đậu.
Hãy lập bảng phân phối xác suất và tính kì vọng, phương sai, độ lệch chuẩn của X.
3.2. Một hộp chứa 10 viên phấn trắng và 4 viên phấn màu. Chọn ngẫu nhiên ra 3 viên phấn.
Gọi X là số viên phấn màu lấy được. Hãy lập bảng phân phối xác suất, hàm phân phối xác
suất và tính kì vọng, phương sai, độ lệch chuẩn của X.
3.3. Một xạ thủ được phát 3 viên đạn và được phép bắn lần lượt từng viên cho đến khi trúng
mục tiêu thì dừng bắn. Biết xác suất bắn trúng mỗi viên đều là 0,8. Hãy lập bảng phân phối
xác suất và tính kì vọng, phương sai, độ lệch chuẩn của số viên đạn:
a) trúng mục tiêu; b) đã sử dụng.
3.4. Đề thi trắc nghiệm có 20 câu hỏi, mỗi câu có 4 phương án trả lời, trong đó chỉ có 1
phương án đúng. Một sinh viên không học bài nên khi đi thi đã chọn ngẫu nhiên một
phương án cho từng câu hỏi. Gọi X là số câu sinh viên đó trả lời đúng. Hãy tìm phân phối
xác suất của X và tính kì vọng, phương sai, độ lệch chuẩn của X.
3.5. Một công nhân nhà máy dệt phụ trách 20 máy hoạt động độc lập. Xác suất mỗi máy
hỏng trong 1 ca sản xuất là 0,16. Tìm xác suất trong 1 ca sản xuất có ít nhất 2 máy bị hỏng.
Tính kỳ vọng và phương sai của số máy hỏng trong 1 ca sản xuất. (Đề thi Học kỳ 13.1A)
3.6. Trong một hộp có 10 sản phẩm, trong đó có 2 phế phẩm. Lấy ngẫu nhiên 3 sản phẩm.
Gọi X là số phế phẩm trong các sản phẩm lấy ra. Hãy tìm phân phối xác suất và tính kỳ
vọng, phương sai, độ lệch chuẩn của X.
3.7. Tại một trạm kiểm soát giao thông người ta đếm được 42 ôtô đi qua trong 10 phút. Tìm
xác suất có
a) 5 ôtô đi qua trong 1 phút; b) ít nhất 1 ôtô đi qua trong 1 phút.
3.8. Cho đại lượng ngẫu nhiên X có hàm mật độ xác suất
 kx2 (1  x ) khi x  [0;1]
f ( x)  
 0 khi x  [0;1]
a) Tìm k; b) Tính kì vọng, phương sai, độ lệch chuẩn của X.
3.9. Cho đại lượng ngẫu nhiên X có hàm mật độ xác suất
6 x(1  x ) khi x  [0;1]
f ( x)  
 0 khi x  [0;1]
a) Tính kì vọng, phương sai, độ lệch chuẩn của x;

b) Tìm P(0  X  ).
4
3.10. Doanh số bán hàng (đơn vị tính: triệu đồng / ngày ) của một cửa hàng tạp hóa là một
biến ngẫu nhiên có phân phối chuẩn với doanh số bán trung bình là 15 triệu đồng / ngày và
độ lệch tiêu chuẩn là 5 triệu đồng/ ngày. Một ngày được coi là bán đắt hàng nếu doanh số
đạt trên 18 triệu đồng.
a) Tính tỷ lệ ngày bán đắt hàng.
b) Tính xác suất trong một năm (360 ngày) cửa hàng có ít nhất 90 ngày bán đắt hàng. (Đề
thi Học kỳ 15.1A)

19
3.11. Cho biết chiều cao của học sinh lớp một là biến ngẫu nhiên có phân phối chuẩn với kỳ
vọng là 100 cm và độ lệch chuẩn là 1,6 cm. Học sinh lớp một được xem là có chiều cao
bình thường nếu chiều cao đạt từ 98 đến 102 cm.
a) Tìm tỷ lệ học sinh lớp một có chiều cao bình thường.
b) Chọn ngẫu nhiên 100 học sinh lớp một, tìm xác suất chọn được trên 70 em có chiều
cao bình thường. (Đề thi Học kỳ 13.2A)
3.12. Cho biết chiều cao của một loại cây lấy gỗ là biến ngẫu nhiên có phân phối chuẩn với
chiều cao trung bình là 20 m và độ lệch tiêu chuẩn là 2,5 m. Cây đạt tiêu chuẩn khai thác
phải có chiều cao tối thiểu là 18 m. Giả sử mỗi cây đạt tiêu chuẩn khai thác sẽ lãi 100 ngàn
đồng, ngược lại sẽ lỗ 30 ngàn đồng.
a) Tính tỷ lệ cây đạt tiêu chuẩn khai thác.
b) Người ta khai thác ngẫu nhiên một vườn trồng 100 cây. Tính số tiền lãi trung bình và
độ lệch chuẩn của số tiền đó khi khai thác vườn cây này. (Đề thi Học kỳ 13.2A)

CHƯƠNG IV. LÝ THUYẾT MẪU


IV.1. MẪU VÀ PHƯƠNG PHÁP CHỌN MẪU
1. Tổng thể và mẫu
- Tập hợp tất cả các phần tử mà ta quan tâm nghiên cứu trong một vấn đề nào đó được gọi
là tổng thể. Số phần tử của tổng thể được gọi là kích thước của tổng thể.
- Tập con lấy ra từ tổng thể được gọi là mẫu. Số phần tử của mẫu được gọi là kích thước
mẫu hay cỡ mẫu.
Ví dụ 1. Khi nghiên cứu về số cá trong một hồ thì tổng thể là toàn bộ các con cá trong hồ
đó. Số cá có trong hồ chính là kích thước của tổng thể. Nếu ta bắt lên 20 con cá thì ta được
một mẫu với kích thước là 20.
Ví dụ 2. Nghiên cứu về tỉ lệ chất kích thích trong bia Sài Gòn thì tổng thể là toàn bộ số chai
bia và lon bia do nhà máy bia Sài Gòn sản xuất. Nếu ta lấy ra 50 chai để điều tra về chất
kích thích trong bia thì ta được một mẫu kích thước 50.
2. Cách chọn mẫu
Có hai cách chọn các phần tử của tổng thể để lấy làm mẫu:
a) Chọn không hoàn lại: phần tử đã chọn sẽ bị loại ra khỏi tổng thể rồi mới chọn phần tử
tiếp theo. Khi đó ta có mẫu không hoàn lại.
b) Chọn có hoàn lại: phần tử đã chọn được trả lại tổng thể rồi mới chọn phần tử tiếp theo.
Khi đó ta được mẫu có hoàn lại.
Ví dụ 3. Khi lấy chai bia ra điều tra thì người ta phải khui nó ra để phân tích thành phần
hoá học. Dĩ nhiên sau đó ta không thể trả nó về tổng thể. Vậy, ở ví dụ 2 ta có mẫu không
hoàn lại.
Ví dụ 4. Ở ví dụ 1 ta có hai cách bắt cá: bắt một lúc 20 con lên xem xét – đây cũng là mẫu
không hoàn lại. Nhưng nếu ta bắt lần lượt từng con, xem xét xong thì thả lại vào hồ rồi mới
bắt con tiếp theo (con bắt lần sau có thể trùng với con bắt lần trước). Làm như vậy 20 lần ta
được mẫu có hoàn lại kích thước 20.

20
Thông thường, khi tổng thể có ít phần tử thì người ta hay chọn mẫu có hoàn lại. Trường
hợp tổng thể có nhiều phần tử thì người ta xem hai cách chọn mẫu này như nhau, nghĩa là
không phân biệt có hoàn lại hay không hoàn lại.
3. Phân loại mẫu
a) Mẫu định tính: là mẫu mà ta quan tâm đến các phần tử trong mẫu có tính chất T nào đó
hay không. Khi đó mẫu được cho ở dạng:
- Kích thước mẫu: n
- Số phần tử có tính chất T của mẫu: k
Ví dụ 5. Trước ngày bầu cử người ta phỏng vấn 125 cử tri thì thấy 74 người ủng hộ ứng cử
viên A.
Đây là mẫu định tính lấy ra từ tổng thể tất cả cử tri. Kích thước mẫu n = 125, tính chất T là
“ủng hộ ứng cử viên A”, số phần tử có tính chất T của mẫu là k = 74.
b) Mẫu định lượng: là mẫu mà ta quan tâm đến giá trị của từng phần tử trong mẫu. Khi đó
mẫu được cho ở dạng :
- Kích thước mẫu: n
- Giá trị của các phần tử: x1, x2, ..., xn .
Ví dụ 6. Điểm thi môn Toán của 10 sinh viên như sau: 5, 6, 8, 4 , 2, 8, 9, 6, 5, 7.
Đây là mẫu định lượng với kích thước n = 10. Điểm thi của từng sinh viên chính là giá trị
của các phần tử trong mẫu.
Nếu trong mẫu có một số phần tử có giá trị giống nhau thì người ta thường cho mẫu ở dạng
thu gọn: giá trị x1 có tần số n1 (nghĩa là trong mẫu có n1 phần tử cùng có giá trị x1),
giá trị x2 có tần số n2 , ..., giá trị xm có tần số nm, trong đó n1 + n2 + ... + nm = n là tổng số
phần tử của mẫu. Khi đó người ta viết mẫu ở dạng bảng sau đây:
Giá trị x1 x2 … xm
Tần số n1 n2 … nm

Ví dụ 7. Điểm thi môn Anh văn của một số sinh viên Trường ĐH như sau:

Điểm thi 3 4 5 6 7 8 9
Số sinh viên 4 10 15 12 10 7 2
Đây là mẫu định lượng ở dạng thu gọn. Giá trị của các phần tử chính là điểm thi, tần số của
giá trị 3 là 4, tần số của giá trị 4 là 10, …, tần số của giá trị 9 là 2. Kích thước mẫu
n = 4 + 10 + 15 + 12 + 10 + 7 + 2 = 60.
Nếu ni là số phần tử của mẫu nhận giá trị trong khoảng (ai , bi) thì ta xem chúng nhận giá trị
ai  bi
chung là xi  .
2
Ví dụ 8. Chiều cao của một số thanh niên được cho trong bảng sau đây:
Chiều cao (cm) Số người có chiều cao tương ứng
154 – 158 10
158 – 162 14
162 – 166 26
166 – 170 28
170 – 174 12
21
174 – 178 8
178 - 182 2
Từ bảng này ta có bảng các giá trị đại diện như sau

Chiều cao (cm) 156 160 164 168 172 176 180
Số thanh niên 10 14 26 28 12 8 2

IV.2. CÁC ĐẶC TRƯNG CỦA MẪU


1. Các đặc trưng của mẫu định tính
k
Tần suất mẫu (còn gọi là tỷ lệ mẫu): f 
n
Ví dụ 1. Trước kỳ bầu cử, người ta phỏng vấn 1575 cử tri thì thấy có 1212 người trả lời là
ủng hộ ứng cử viên X. Tìm tần suất mẫu ủng hộ ứng cử viên X.
Ví dụ 2. Người ta bắt được 1200 con cá, đánh dấu rồi thả lại vào hồ nước. Sau một thời
gian bắt lại 250 con thì thấy có 32 con bị đánh dấu. Hãy tìm tỷ lệ mẫu bị đánh dấu.
2. Các đặc trưng của mẫu định lượng
m
a) Trung bình mẫu: X  1
n  xini
i 1
m
b) Trung bình mẫu bình phương: X 2
 1
n  xi2ni
i 1
^
c) Phương sai mẫu: S  X  (X )
2 2 2

^
2 n S2
d) Phương sai mẫu hiệu chỉnh: S 
n 1

e) Độ lệch mẫu hiệu chỉnh: S S 2

Ví dụ 3. Điều tra năng suất lúa của một vùng, ta có bảng số liệu sau
Năng suất lúa (tạ/ha) 41 44 45 46 48 52 54
Diện tích có năng suất lúa tương ứng (ha) 10 20 30 15 10 10 5
Hãy tính các đặc trưng mẫu.
Lưu ý: Muốn sử dụng máy tính Casio fx-570ES tìm các đặc trưng của mẫu định lượng, ta
thực hiện các bước sau:
a) Khởi động chương trình:
Lần lượt nhấn các phím:
1) SHIFT
2) MODE
3) Mũi tên đi xuống trên phím "REPLAY"
4) Chọn 4: STAT. Trên màn hình có dòng chữ: "Frequency?"
5) Chọn 1: on
22
6) MODE
7) Chọn 3: STAT
8) Chọn 1: 1 – VAR. Khi đó trên màn hình hiện ra hai cột: X và FREQ.
b) Nhập dữ liệu:
9) Ở cột "X": nhập các giá trị đại điện của mẫu theo từng dòng, cách nhau
bởi dấu "bằng"
10) Ở cột "FREQ": nhập tần số tương ứng với từng giá trị, cách nhau bởi
dấu "bằng"
11) Sau khi nhập xong tất cả các cột, nhấn phím "AC".
c) Gọi kết quả:
c1) Kích thước mẫu:
Lần lượt nhấn các phím:
12) SHIFT
13) Số 1
14) Chọn 5: Var (hoặc 4: Var)
15) Chọn 1: n
16) Nhấn "dấu bằng" và đọc kết quả ở góc dưới bên phải của màn hình.
c2) Trung bình mẫu:
Lặp lại bước 12 – 14 nhưng chọn 2: x , sau đó nhấn "dấu bằng", đọc kết
quả trên màn hình.
c3) Độ lệch mẫu hiệu chỉnh:
Lặp lại bước 12 – 14 nhưng chọn 4: x  n 1 (hoặc Sx ), sau đó nhấn "dấu
bằng", đọc kết quả trên màn hình.
Ví dụ 4. Để nghiên cứu nhu cầu mua gạo ở một thành phố, người ta tiến hành điều tra một
số gia đình và ghi kết quả ở bảng sau đây:
Nhu cầu Số gia đình Nhu cầu Số gia đình
(kg/tháng)
30 – 35 45 55 – 60 182
35 – 40 68 60 – 65 151
40 – 45 103 65 – 70 115
45 – 50 179 70 – 75 94
50 – 55 208 75 – 80 55
a) Hãy tính các đặc trưng mẫu định lượng.
b) Tính tỉ lệ mẫu có nhu cầu trên 60 kg/tháng.
BÀI TẬP CHƯƠNG IV
4.1. Điểm kiểm tra môn Toán của một số sinh viên được cho trong bảng sau:
Điểm 0 1 2 3 4 5 6 7 8 9 10
Số sinh viên 1 2 5 10 20 48 3 22 10 5 2
a) Tính điểm kiểm tra trung bình và phương sai mẫu hiệu chỉnh của mẫu đó.
b) Tìm tỉ lệ mẫu có điểm kiểm tra dưới 5.
4.2. Đo chiều cao của một số thanh niên ở tỉnh Tiền Giang, ta thu được bảng sau đây:
23
Chiều cao (cm) Số người có chiều cao tương ứng
154 – 158 5
158 – 162 12
162 – 166 16
166 – 170 22
170 – 174 25
174 – 178 16
178 – 182 4
a) Hãy tính các đặc trưng của mẫu định lượng.
b) Tính tỉ lệ mẫu có chiều cao trên 1,7m.
4.3. Để nghiên cứu tuổi thọ của một loại bóng đèn, người ta thắp thử 100 bóng và ghi lại
được số liệu sau đây:
Tuổi thọ (giờ) Số bóng tương ứng
1010 – 1030 2
1030 – 1050 3
1050 – 1070 8
1070 – 1090 13
1090 – 1110 25
1110 – 1130 20
1130 – 1150 12
1150 – 1170 10
1170 – 1190 6
1190 – 1210 1
Sau khi cải tiến kĩ thuật, người ta lại thắp thử 100 bóng, kết quả ghi nhận như sau:
Tuổi thọ (giờ) 1150 1160 1170 1180 1190 1200
Số bóng 10 15 20 30 15 10
Hãy so sánh tuổi thọ trung bình và độ lệch mẫu hiệu chỉnh của các bóng đèn trước và
sau khi cải tiến kĩ thuật.
CHƯƠNG V. ƯỚC LƯỢNG CÁC THAM SỐ
CỦA ĐẠI LƯỢNG NGẪU NHIÊN
V.1. KHÁI NIỆM
1. Ước lượng tham số
Giả sử một đại lượng ngẫu nhiên X có phân phối xác suất đã biết nhưng các đặc trưng
của nó phụ thuộc vào một (hoặc nhiều) tham số  chưa biết. Thông qua mẫu ngẫu
nhiên, ta cần xác định giá trị gần đúng để hay thế cho tham số chưa biết đó.
Ví dụ 1. Ta biết một đại lượng ngẫu nhiên nào đó có phân phối chuẩn X  N (  ,  2 ) ,
nhưng  và  2 nhận giá trị nào thì chưa biết. Do đó cần tìm giá trị gần đúng của  và
 2 , thông qua một mẫu ngẫu nhiên, lấy từ tổng thể các giá trị của đại lượng ngẫu nhiên
đó.
Muốn vậy, từ tổng thể ta lấy một mẫu ngẫu nhiên kích thước n, sau đó lập một đại lượng
thống kê ˆ để thay thế cho  . Khi đó ta gọi ˆ là ước lượng của  .

24
2. Ước lượng điểm
Giả sử X  ( x1, x2 ,..., xn ) là một mẫu ngẫu nhiên kích thước n lấy từ tổng thể có kì vọng 
và phương sai  2 . Ta dùng một hàm nào đó của mẫu này để ước lượng cho  , kí hiệu là
ˆ  F ( x1, x2 ,..., xn ) . Khi đó, với một mẫu cụ thể thì hàm số này sẽ nhận một giá trị cụ thể
biểu thị bởi một điểm trên trục số. Do đó ta gọi số ˆ là một ước lượng điểm của  và coi ˆ
là giá trị gần đúng của  .
3. Ước lượng không chệch
Ước lượng ˆ của  được gọi là ước lượng không chệnh nếu kì vọng của ˆ là  , nghĩa là
nếu E (ˆ)   .
Với mọi mẫu ta luôn có:
Tỉ lệ mẫu f là ước lượng không chệnh của tỉ lệ tổng thể P.

Trung bình mẫu X là ước lượng không chệnh của kì vọng của tổng thể  .
Phương sai mẫu hiệu chỉnh S2 là ước lượng không chệnh của phương sai của tổng thể  2 .
4. Ước lượng khoảng
Khoảng (c, d) được gọi là khoảng ước lượng của  nếu ta coi   (c, d ) .
Xác suất P   (c, d )  1   được gọi là độ tin cậy của ước lượng.
Nếu ˆ là một ước lượng không chệnh của  thì khoảng ước lượng của  có dạng
(ˆ   ,ˆ   ) , khoảng này được gọi là khoảng ước lượng đối xứng. Số   0 được gọi là độ
chính xác (hay sai số) của ước lượng.
Nếu (ˆ   ,ˆ   ) là khoảng ước lượng đối xứng của  với độ tin cậy 1   thì xác suất
 
P   (ˆ   , ˆ   )   P   ˆ    1   .

V.2. ƯỚC LƯỢNG GIÁ TRỊ TRUNG BÌNH CỦA TỔNG THỂ
1. Bài toán
Giả sử tổng thể có giá trị trung bình là  chưa biết. Ta cần ước lượng  với độ tin cậy
1   cho trước. Ta cũng giả thiết rằng ta đã có một mẫu gồm n quan sát được chọn từ tổng
thể đó và đã tính được trung bình mẫu X , độ lệch mẫu hiệu chỉnh S . Khi đó tuỳ từng
trường hợp cụ thể, ta có phương pháp tìm khoảng ước lượng như sau.
2. Trường hợp tổng thể có phân phối chuẩn, đã biết phương sai  2
Độ chính xác (còn được gọi là sai số) được tính bởi công thức:

  Z ,
n
2
1 
trong đó Z là biến ngẫu nhiên có phân phối chuẩn với  ( Z )   và  ( Z ) là hàm phân
2 2
2
phối xác suất Laplace (có bảng giá trị cho trước).
Khoảng ước lượng của  là ( X   , X   ) .
Ví dụ 1. Kết quả thu thập trong 15 ngày tại một công ty cho thấy trung bình một ngày có
267 trang tài liệu được chuyển đi bằng fax. Theo kinh nghiệm từ các văn phòng tương tự thì
độ lệch tiêu chuẩn là 32 trang. Giả sử rằng số trang tài liệu chuyển bằng fax trong một ngày
25
có phân phối chuẩn. Hãy ước lượng số trang tài liệu được chuyển trong một ngày của công
ty với độ tin cậy 95%.
Ví dụ 2. Một mẫu gồm 16 sản phẩm được chọn từ tổng thể có phân phối chuẩn với phương
sai là 25. Cho biết trung bình mẫu là 330 gam. Hãy xác định khoảng ước lượng cho trung
bình của tổng thể với độ tin cậy 99%.
3. Trường hợp chưa biết phương sai của tổng thể
a) Nếu cỡ mẫu n  30 và tổng thể có phân phối bất kì thì
S
  Z
2
n

Ví dụ 3. Khảo sát 100 sinh viên chọn ngẫu nhiên trong trường thì thấy điểm trung bình môn
Toán là 6,8 và phương sai mẫu hiệu chỉnh là 0,0676. Hãy ước lượng điểm trung bình môn
Toán của sinh viên toàn trường với độ tin cậy 97%.
Ví dụ 4. Chọn ngẫu nhiên 49 sản phẩm từ một lô hàng. Kết quả kiểm tra cho thấy tuổi thọ
trung bình của các sản phẩm đó là 485 giờ và độ lệch mẫu hiệu chỉnh là 36 giờ. Hãy ước
lượng tuổi thọ trung bình của cả lô hàng với độ tin cậy 98%.
b) Nếu cỡ mẫu n  30 và tổng thể có phân phối chuẩn thì
S
 T  ,
n 1, n
2
trong đó T  có phân phối Student với n – 1 bậc tự do (tra bảng phân phối Student dòng
n 1,
2

n – 1, cột ).
2
Ví dụ 5. Chiều dài của một loại sản phẩm có phân phối chuẩn. Đo ngẫu nhiên 10 sản phẩm
được chiều dài trung bình là 12,25 m, độ lệch mẫu hiệu chỉnh là 0,04 m. Tìm khoảng ước
lượng chiều dài trung bình của loại sản phẩm này với độ tin cậy 95%.
Ví dụ 6. Một mẫu ngẫu nhiên gồm 16 khách hàng sử dụng dịch vụ ATM thuộc hệ thống
của một ngân hàng được ghi nhận về thời gian (giây) thực hiện xong một dịch vụ: 65, 30,
40, 58, 26, 60, 75, 45, 50, 36, 76, 34, 38, 50, 44, 56. Giả sử thời gian thực hiện dịch vụ qua
ATM có phân phối chuẩn. Hãy tìm khoảng ước lượng cho thời gian trung bình thực hiện
dịch vụ qua ATM với độ tin cậy 99%.
Phương pháp ước lượng giá trị trung bình của tổng thể
Để giải bài toán này, ta cần thực hiện các bước sau đây:
- Gọi  là giá trị trung bình của tổng thể (giá trị mà ta cần ước lượng), tính giá trị trung
bình mẫu X và độ lệch mẫu hiệu chỉnh S (nếu cần).
- Tra bảng hàm số Laplace hoặc bảng phân phối Student (tùy vào trường hợp ở mục 2
hoặc 3a, 3b trên đây).
- Tính sai số 
- Kết luận:   X   hoặc   ( X   , X   )

26
V.3. ƯỚC LƯỢNG TỈ LỆ CỦA TỔNG THỂ
Giả sử tổng thể có hai loại phần tử, một trong hai loại có tính chất A nào đó. Ta cần ước
lượng tỉ lệ P các phần tử có tính chất A của tổng thể với độ tin cậy 1   cho trước. Giả sử
ta có một mẫu ngẫu nhiên gồm n phần tử của tổng thể ( n  30 ) và f là tỉ lệ các phần tử có
tính chất A trong mẫu.
Khi đó độ chính xác được tính bởi công thức:
f (1  f )
  Z
n
2
Khoảng ước lượng của P là ( f   , f   ) .
Ví dụ 1. Một nghiên cứu được thực hiện nhằm ước lượng tỉ lệ khách hàng sử dụng bánh
kẹo nội địa. Kết quả điều tra ngẫu nhiên 100 khách hàng cho thấy có 34 khách hàng dùng
bánh kẹo nội địa. Với độ tin cậy 95% hãy ước lượng tỉ lệ khách hàng sử dụng bánh kẹo nội
địa.
Ví dụ 2. Điểm danh ngẫu nhiên 50 sinh viên thấy có 6 sinh viên bỏ học. Hãy ước lượng tỉ
lệ sinh viên bỏ học với độ tin cậy 95,45%.
Ví dụ 3. Trước ngày bầu cử tổng thống, người ta phỏng vấn ngẫu nhiên 1800 cử tri thì thấy
có 1180 người ủng hộ ứng cử viên A. Với độ tin cậy 95%, hỏi ứng cử viên đó thu được bao
nhiêu phần trăm số phiếu bầu?
Ví dụ 4. Người ta bắt được 1500 con thú, đánh dấu rồi thả lại vào rừng. Sau một thời gian
bắt lại 360 con thì thấy có 27 con bị đánh dấu. Hãy ước lượng số thú có trong rừng với độ
tin cậy 99%.
Phương pháp ước lượng tỷ lệ của tổng thể
Để giải bài toán này, ta cần thực hiện các bước sau đây:
- Gọi P là tỷ lệ của tổng thể (giá trị mà ta cần ước lượng), tính tần suất mẫu f .
- Tra bảng hàm số Laplace
- Tính sai số 
- Kết luận: P  f   hoặc P  ( f   , f   )
V.4. XÁC ĐỊNH CỠ MẪU
1. Trường hợp ước lượng tỉ lệ
Từ công thức tính độ chính xác của bài toán ước lượng tỉ lệ, ta có
f (1  f )
n  Z2 .
2
2
Nếu kết quả tìm được không phải là số nguyên thì ta lấy phần nguyên của kết quả đó cộng
với 1.
Ví dụ 1. Lấy ngẫu nhiên 200 sản phẩm trong kho hàng thấy có 25 phế phẩm. Nếu muốn độ
chính xác là 0,01; độ tin cậy 95% thì cần kiểm tra thêm bao nhiêu sản phẩm nữa?
Ví dụ 2. Cần một mẫu kích thước bao nhiêu để tỉ lệ mẫu là 0,2; độ chính xác là 0,01 và độ
tin cậy là 95%?

27
2. Trường hợp ước lượng giá trị trung bình
Từ công thức tính độ chính xác của bài toán ước lượng giá trị trung bình ta có
Z2  2 Z2 S2
n 2
2
hoặc n 2 .
 2
Ví dụ 3. Đo đường kính của 100 chi tiết do một máy sản xuất, ta được các số liệu sau:
Đường kính (cm) 9,75 9,80 9,85 9,90
Số chi tiết 5 37 42 16
Muốn độ chính xác là 0,03; độ tin cậy 95% thì cần kiểm tra thêm bao nhiêu chi tiết?
Ví dụ 4. Khảo sát mức thu nhập (đơn vị tính là triệu đồng/tháng) của sinh viên sau khi ra
trường một năm ở trường đại học X, người ta thu được bảng số liệu sau:

Thu nhập 1–3 3–5 5–7 7–9 9 – 11 11 – 13 13 – 15

Số sinh viên 5 13 25 31 19 4 3

a) Với độ tin cậy 95%, hãy ước lượng thu nhập trung bình của sinh viên sau khi ra trường
một năm.
b) Những sinh viên có thu nhập từ 9 triệu đồng/tháng trở lên gọi là có thu nhập cao. Hãy
ước lượng tỉ lệ sinh viên ra trường một năm có thu nhập cao với độ tin cậy 97%.
c) Muốn ước lượng thu nhập trung bình của sinh viên sau khi ra trường một năm với độ tin
cậy 99% và độ chính xác không quá 500 nghìn đồng/tháng thì cần khảo sát ít nhất bao
nhiêu sinh viên? (Đề thi Học kỳ 16.1A)
BÀI TẬP CHƯƠNG V
5.1. Một trường đại học thực hiện nghiên cứu về số giờ tự học của sinh viên trong một tuần.
Chọn ngẫu nhiên 200 sinh viên cho thấy số giờ tự học trong tuần tính trung bình là 18,36
giờ. Với độ tin cậy 95%, hãy ước lượng số giờ tự học trung bình trong một tuần của sinh
viên toàn trường. Cho biết độ lệch tiêu chuẩn của số giờ tự học của sinh viên là 3,92 giờ.
5.2. Công ty điện thoại ở một thành phố muốn ước lượng thời gian trung bình của một cuộc
điện đàm đường dài vào những ngày cuối tuần. Mẫu ngẫu nhiên 20 cuộc gọi đường dài vào
những ngày cuối tuần cho thấy thời gian điện đàm trung bình là 14,8 phút, độ lệch mẫu hiệu
chỉnh là 5,6 phút. Với độ tin cậy 90% , hãy ước lượng thời gian điện đàm trung bình của
dân cư thành phố đó vào những ngày cuối tuần. Cho biết thời gian điện đàm là đại lượng
ngẫu nhiên có phân phối chuẩn.
5.3. Kiểm tra ngẫu nhiên 500 sản phẩm của một nhà máy thì thấy có 365 sản phẩm loại
một. Hãy ước lượng tỉ lệ sản phẩm loại một của cả nhà máy với độ tin cậy 95%.
5.4. Hãy ước lượng tỉ lệ sản phẩm tốt của một nhà máy với độ tin cậy 98%, biết rằng khi
kiểm tra 400 sản phẩm thì thấy có 25 phế phẩm.
5.5. Tại một khu rừng nguyên sinh, người ta đeo vòng vào chân của 1200 con chim. Sau
một thời gian bắt lại 250 con thì thấy 40 con có đeo vòng. Hãy ước lượng số chim trong
khu rừng đó với độ tin cậy 99%.
5.6. Muốn biết số cá có trong một hồ lớn, người ta bắt lên 2000 con, đánh dấu xong lại thả
chúng xuống hồ. Sau đó người ta bắt lên 400 con thì thấy có 55 con bị đánh dấu. Với độ tin
28
cậy 0,95 hãy ước lượng số cá trong hồ. Cho biết mỗi con cá có khối lượng trung bình 800
gam và mỗi kilôgam cá bán được 28000đ. Tính doanh thu khi bán hết số cá trong hồ.
5.7. Trước đây định mức tiêu thụ điện cho 1 hộ gia đình là 140 kw/tháng. Hiện nay, do đời
sống nâng cao, người ta cho rằng cần thay đổi định mức. Khảo sát 100 hộ gia đình, người ta
thu được các số liệu trong bảng sau đây:
Mức tiêu thụ 100 - 120 120 - 140 140 - 160 160 - 180 180 - 200
điện (kw/tháng)
Số hộ gia đình 14 25 30 20 11
a) Hãy ước lượng tỉ lệ hộ gia đình có mức tiêu thụ điện trên 140 kw/tháng với độ tin cậy
95%.
b) Hãy ước lượng mức tiêu thụ điện trung bình của mỗi hộ gia đình với độ tin cậy 97%.
c) Với độ tin cậy 98%, muốn sai số ở câu b không vượt quá 2 kw/tháng thì cần khảo sát
thêm tối thiểu bao nhiêu hộ gia đình nữa? (Đề thi Học kỳ 14.2A)
5.8. Trong một cuộc điều tra về chất lượng lốp xe ôtô của hãng A, người ta đo quãng đường
đi được của từng lốp xe (đơn vị tính: nghìn km). Kết quả được thống kê trong bảng sau:
Số nghìn 85 - 90 90 - 95 95 - 100 100 - 105 105 - 110 110 - 115 115 - 120
km đi được

Số lốp xe 7 4 6 12 8 9 3

a) Hãy ước lượng quãng đường trung bình mỗi lốp xe đi được với độ tin cậy 95%.
b) Muốn sai số ở câu a) không quá 2 nghìn km với độ tin cậy 98% thì cần điều tra tối thiểu
bao nhiêu lốp xe?
c) Những lốp xe đi được trên 110 nghìn km được xem là lốp xe loại một. Hãy ước lượng tỉ
lệ lốp xe loại một với độ tin cậy 99%. (Đề thi Học kỳ 14.2A)
5.9. Thăm dò ý kiến của 100 khách hàng về thời gian ngồi đợi được phục vụ (đơn vị tính:
phút) tại một tiệm ăn, người ta thu được số liệu sau:
Thời gian chờ đợi 5 - 10 10 - 15 15 - 20 20 - 25 25 - 30
Số khách hàng 16 24 36 16 8
a) Ước lượng thời gian chờ đợi trung bình của khách hàng với độ tin cậy 95%.
b) Ước lượng tỷ lệ khách phải chờ trên 20 phút với độ tin cậy 90,106%.
c) Muốn ước lượng tỷ lệ khách hàng phải chờ trên 20 phút với độ tin cậy 95% và độ chính
xác 6% thì cần phỏng vấn thêm bao nhiêu khách nữa? (Đề thi Học kỳ 15.1A)
5.10. Điều tra doanh thu (đơn vị tính: triệu đồng / tháng) của 100 hộ kinh doanh mặt hàng
A, người ta thu được bảng số liệu sau:
Doanh thu 21 - 23 23 - 25 25 - 27 27 - 29 29 - 31
Số hộ 10 18 32 28 12
a) Với độ tin cậy 95%, hãy ước lượng tỷ lệ hộ đạt doanh thu trên 27 triệu đồng/tháng.
b) Muốn sai số của câu a không quá 0,05 và độ tin cậy 99% thì phải điều tra thêm bao nhiêu
hộ?
c) Với độ tin cậy 95%, hãy ước lượng doanh thu trung bình của những hộ kinh doanh đạt
dưới 25 triệu đồng/tháng. (Đề thi Học kỳ 15.1A)
29
CHƯƠNG VI. KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
VI.1. BÀI TOÁN KIỂM ĐỊNH
1. Khái niệm
Các đặc trưng của mẫu ngoài việc sử dụng để ước lượng các đặc trưng của tổng thể còn
được dùng để đánh giá xem một giả thuyết nào đó của tổng thể là đúng hay sai. Việc tìm ra
kết luận để bác bỏ hay chấp nhận một giả thuyết được gọi là kiểm định giả thuyết.
Ví dụ 1. Một nhà sản xuất cho rằng khối lượng trung bình của một gói mì là 75 gam. Để
kiểm tra điều này đúng hay sai, chọn ngẫu nhiên một số gói mì để kiểm tra và tính toán.
Ví dụ 2. Một xí nghiệp cho rằng tỉ lệ phế phẩm trong kho hàng là 5%. Để kiểm tra điều này
đúng hay sai, chọn ngẫu nhiên một số sản phẩm để kiểm tra, tính toán.
2. Giả thuyết H0 và giả thuyết H1
Giả sử tổng thể có đặc trưng  chưa biết. Với giá trị cụ thể 0 cho trước nào đó, ta cần
kiểm định giả thuyết H0 :   0 .
Giả thuyết H1 là kết quả ngược lại của giả thuyết H0 . Nếu H0 đúng thì H1 sai và ngược
lại. H1 còn được gọi là giả thuyết đối.
Vậy cặp giả thuyết H0 và H1 được thể hiện trong trường hợp kiểm định sau đây
H0 :   0 ; H1 :   0 .

Ví dụ 3. Trong trường hợp ví dụ 1 ta có thể đặt giả thuyết: H0 :   75 ; H1 :   75 .


3. Sai lầm loại một, sai lầm loại hai
Vì chỉ dựa trên một mẫu để kết luận các giá trị của tổng thể nên ta có thể phạm sai lầm khi
đưa ra kết luận về giả thuyết H0 . Các sai lầm đó là:
a) Sai lầm loại một: Giả thuyết H0 đúng nhưng ta bác bỏ nó.
b) Sai lầm loại hai: Giả thuyết H0 sai nhưng ta chấp nhận nó.
Khi kiểm định, người ta mong muốn khả năng mắc sai lầm loại một không vượt quá một số
 cho trước, nghĩa là xác suất bác bỏ H0 khi nó đúng là  thì xác suất chấp nhận nó là
1   . Ta gọi  là mức ý nghĩa của kiểm định.
Ngược lại, đối với sai lầm loại hai, xác suất chấp nhận H0 khi nó sai được kí hiệu là  , suy
ra xác suất bác bỏ H0 là 1   . Ta gọi 1   là độ giá trị của kiểm định.
Trong một bài toán kiểm định, nếu khả năng phạm sai lầm loại một giảm thì khả năng phạm
sai lầm loại hai lại tăng lên. Do đó người ta thường chọn  trong khoảng từ 1% đến 10%.
Bảng tóm tắt hai loại sai lầm và xác suất phạm sai lầm khi kiểm định giả thuyết
Giả thuyết H0 đúng Giả thuyết H0 sai
Không bác bỏ Quyết định đúng, xác suất 1   Sai lầm loại hai, xác suất 
Bác bỏ Sai lầm loại một, xác suất  Quyết định đúng, xác suất 1  

4. Các bước cần thực hiện trong bài toán kiểm định giả thuyết
Một bài toán kiểm định giả thuyết thường bao gồm 5 bước sau đây.

30
- Bước 1. Thiết lập giả thuyết H0 và H1 .
- Bước 2. Tính giá trị kiểm định. (Mỗi loại kiểm định có công thức riêng nhằm đánh
giá giả thuyết).
- Bước 3. Chọn mức ý nghĩa  và xác định miền bác bỏ giả thuyết H0 (nếu giá trị
kiểm định nằm trong miền này thì H0 bị bác bỏ).
- Bước 4. Đưa ra kết luận về mặt thống kê, nghĩa là ở một mức ý nghĩa  nào đó ta sẽ
bác bỏ hay không thể bác bỏ giả thuyết H0 .
- Bước 5. Kết luận cuối cùng về nội dung bài toán nhằm trả lời một cách rõ ràng câu
hỏi mà bài toán đặt ra (không dùng thuật ngữ thống kê).
VI.2. KIỂM ĐỊNH GIẢ THUYẾT VỀ TRUNG BÌNH CỦA TỔNG THỂ
1. Bài toán
Giả sử ta có một mẫu gồm n quan sát được chọn từ tổng thể. Gọi  ,  2 , X , S2 lần lượt là
trung bình, phương sai của tổng thể; trung bình, phương sai mẫu hiệu chỉnh. Ta cần kiểm
định giả thuyết: H0 :   0 ; H1 :   0 ( 0 là một giá trị cụ thể) với mức ý nghĩa  cho
trước. Khi đó việc kiểm định được thực hiện như sau.
2. Trường hợp đã biết phương sai của tổng thể có phân phối chuẩn
Giá trị kiểm định được tính bởi công thức:
X  0
Z0  n.

Quy tắc quyết định: Bác bỏ H0 ở mức ý nghĩa  nếu Z 0  Z  .
2
Ta nhận thấy có sự liên hệ giữa ước lượng và kiểm định giả thuyết, cụ thể, giả thuyết
H0 bị bác bỏ với mức ý nghĩa  khi và chỉ khi khoảng tin cậy (với độ tin cậy 1   ) của
 không chứa trị số 0 .
3. Trường hợp chưa biết phương sai của tổng thể
- Với mẫu có kích thước n  30 và tổng thể có phân phối bất kỳ thì
X  0
Z0  n
S
Quy tắc quyết định như trường hợp 2 (đã biết phương sai của tổng thể).
- Với mẫu có kích thước n  30 và tổng thể có phân phối chuẩn thì giá trị kiểm định:
X  0
T  n.
S
Quy tắc quyết định: Bác bỏ H0 ở mức ý nghĩa  nếu T  T  , trong đó T  có phân
n 1, n 1,
2 2

phối Student với n – 1 bậc tự do (tra bảng phân phối Student dòng n – 1, cột ).
2
Chú ý. Trong tất cả các trường hợp trên, khi giả thuyết H0 :   0 đã bị bác bỏ (tức là
  0 ) thì cần so sánh trung bình mẫu X với 0 . Khi đó:
- Với X  0 ta kết luận   0 .
- Với X  0 ta kết luận   0 .

31
Ví dụ 1. Một máy đóng mì gói tự động quy định khối lượng trung bình là 75 gam, độ lệch
tiêu chuẩn là 15 gam. Sau một thời gian sản xuất, kiểm tra 80 gói ta có khối lượng trung
bình mỗi gói là 72 gam. Hãy kết luận về tình hình sản xuất với mức ý nghĩa 5%.
Ví dụ 2. Một nhà máy sản xuất đèn chụp hình cho biết tuổi thọ trung bình của sản phẩm là
100 giờ. Người ta chọn ngẫu nhiên 15 bóng thử nghiệm thấy tuổi thọ trung bình là 99,7 giờ,
phương sai mẫu hiệu chỉnh là 0,15. Giả sử tuổi thọ của đèn chụp hình có phân phối chuẩn.
Cho kết luận về tình hình sản xuất của nhà máy với mức ý nghĩa 1%.
Ví dụ 3. Một loại đèn chiếu được nhà sản xuất quảng cáo có tuổi thọ trung bình là 65 giờ.
Kết quả kiểm tra ngẫu nhiên 21 đèn cho thấy tuổi thọ trung bình là 62,5 giờ, độ lệch mẫu
hiệu chỉnh là 3 giờ. Với mức ý nghĩa 1% có thể kết luận gì về lời quảng cáo đó? Giả sử tuổi
thọ của đèn chiếu có phân phối chuẩn.
Ví dụ 4. Một hãng sản xuất lốp xe ôtô tuyên bố sản phẩm của hãng có thể sử dụng
100 000 km, độ lệch tiêu chuẩn bằng 12 000 km. Một công ty vận tải mua 64 lốp xe, sau
một thời gian sử dụng thấy độ bền trung bình là 98 500 km. Hãy kết luận về tuyên bố của
hãng sản xuất lốp xe với mức ý nghĩa 5%.
Ví dụ 5. Năng suất lúa trung bình ở vụ trước là 48 tạ/ha, năm nay người ta áp dụng một
biện pháp kỹ thuật mới cho toàn bộ diện tích trồng lúa trong vùng và ghi được các số liệu
sau đây:
Năng suất (tạ/ha) 44 - 46 46 - 48 48 - 50 50 - 52 52 - 54
Diện tích có năng suất 10 20 32 26 12
tương ứng (ha)
a) Ở mức ý nghĩa 5%, hãy đánh giá hiệu quả của biện pháp kỹ thuật mới đối với năng suất
lúa trung bình của vùng đó.
b) Hãy ước lượng tỷ lệ diện tích có năng suất trên 50 tạ/ha của cả vùng đó sau khi áp dụng
biện pháp kỹ thuật mới với độ tin cậy 98%.
c) Muốn sai số ở câu b giảm đi một nửa và độ tin cậy 99% thì cần điều tra thêm bao nhiêu
hecta nữa? (Đề thi Học kỳ 13.2A)
VI.3. KIỂM ĐỊNH GIẢ THUYẾT VỀ TỶ LỆ
1. Bài toán
Giả sử tổng thế gồm hai loại phần tử: có tính chất T và không có tính chất này.
Ta đưa ra giả thuyết:
H0 : Tỉ lệ P các phần tử có tính chất T của tổng thể là P  p
0
Ta cần kiểm định xem giả thuyết đó đúng hay sai với mức ý nghĩa  cho trước.
2. Phương pháp giải bài toán
- Lấy mẫu định tính gồm n phần tử của tổng thế, ta tính được tần suất mẫu f.
- Từ mức ý nghĩa  , tra bảng hàm số Laplace, ta tìm được số Z sao cho
2
1
 ( Z )   2 .
2
2

32
f  p0
- Tính giá trị kiểm định: Z 0  n
p0 (1 p0 )
- So sánh Z0 với Z : Nếu Z0  z  thì ta chấp nhận H0 .
2 2
Nếu Z0  z  thì ta bác bỏ H0 .
2
Chú ý. Nếu giả thuyết H 0 : P  p0 bị bác bỏ (tức là P  p0 ) thì cần so sánh tần suất mẫu
f với p0 . Khi đó:
- Với f  p0 ta kết luận P  p0 .
- Với f  p0 ta kết luận P  p0 .
Ví dụ 1. Theo báo cáo, tỉ lệ hàng phế phẩm trong kho là 10%. Kiểm tra ngẫu nhiên 100 sản
phẩm thấy có 8 phế phẩm. Hỏi báo cáo trên có đáng tin ở mức ý nghĩa 5% không?
Ví dụ 2. Trước đây tỉ lệ phế phẩm của một nhà máy là 5%. Năm nay người ta áp dụng một
biện pháp kĩ thuật mới để sản xuất. Sau một thời gian, kiểm tra 800 sản phẩm thì thấy có 24
phế phẩm. Với mức ý nghĩa 1%, hãy đánh giá hiệu quả của biện pháp kĩ thuật đó.
BÀI TẬP CHƯƠNG VI
6.1. Kiểm tra các gói đường loại 1 kg trong một siêu thị, ta có kết quả sau
Khối lượng (kg) 0,95 0,96 0,97 0,99 1,00 1,01 1,03
Số gói 19 30 32 8 6 3 2
Với mức ý nghĩa  = 0,05 có thể kết luận việc đóng gói đảm bảo yêu cầu hay không?
6.2. Thu nhập bình quân đầu người (kí hiệu X, đơn vị: triệu/năm) của một số hộ gia đình ở
một tỉnh trong năm 2012 được cho trong bảng sau:

X 5–7 7–9 9 – 11 11 – 13 13 – 15 15 – 17 17 – 19 19 – 21
Số hộ 3 4 8 10 11 17 6 5
Có ý kiến cho rằng thu nhập bình quân đầu người trung bình của các hộ gia đình ở tỉnh này
trong năm 2012 là 14,5 triệu/năm. Với mức ý nghĩa 1%, hãy kết luận về ý kiến đó. (Đề thi
Học kỳ 12.2A)
6.3. Khảo sát năng suất lao động (tính bằng số sản phẩm làm ra trong 1 ngày) của 100 công
nhân được chọn ngẫu nhiên trong xí nghiệp B, người ta có số liệu sau:
Năng suất lao động 70 – 75 75 – 80 80 – 85 85 – 90 90 – 95 95 – 100
Số công nhân 4 16 22 28 20 10
a) Hãy ước lượng năng suất trung bình của công nhân xí nghiệp B với độ tin cậy 95%.
b) Giả sử năng suất đạt trên 90 sản phẩm / ngày là cao, hãy ước lượng tỷ lệ công nhân đạt
năng suất cao của xí nghiệp B với độ tin cậy 98%.
c) Muốn ước lượng năng suất trung bình của công nhân với độ tin cậy 96,06% và sai số
không quá 1 sản phẩm / ngày thì cần khảo sát thêm ít nhất bao nhiêu công nhân?
d) Cho biết năm trước năng suất trung bình của công nhân xí nghiệp là 80 sản phẩm /
ngày, các số liệu trên được khảo sát sau khi xí nghiệp đã có những cải tiến kỹ thuật trong
sản xuất. Với mức ý nghĩa 1%, hãy đánh giá hiệu quả của việc cải tiến kỹ thuật. (Đề thi Học
kỳ 14.2A)
33
6.4. Khi điều trị bằng thuốc A, tỉ lệ bệnh nhân khỏi bệnh là 80%. Đổi sang thuốc B để điều
trị cho 1100 người thì thấy có 920 người khỏi bệnh. Với mức ý nghĩa  = 0,02 có thể cho
rằng thuốc B hiệu quả hơn thuốc A hay không?
6.5. Kiểm tra ngẫu nhiên 400 sản phẩm trong kho hàng thấy có 185 sản phẩm loại A. Cho
biết khối lượng trung bình của một sản phẩm loại A vừa kiểm tra là 120 gam, độ lệch mẫu
hiệu chỉnh là 25 gam.
a) Nếu cho rằng tỷ lệ sản phẩm loại A trong kho hàng là 50% thì có chấp nhận được không,
ở mức ý nghĩa 1%?
b) Hãy ước lượng khối lượng trung bình của các sản phẩm loại A trong kho hàng với độ tin
cậy 98%. (Đề thi Học kỳ 13.2A)
6.6. Theo dõi lượng xăng tiêu thụ (lít /100 km) của một số xe ôtô thuộc một công ty vận tải,
người ta thu được số liệu sau đây:
Lượng xăng 30 - 35 35 - 40 40 - 45 45 - 50 50 - 55 55 - 60
Số lượng xe 12 18 24 26 12 8
a) Hãy ước lượng lượng xăng tiêu thụ trung bình / 100 km với độ tin cậy 95%.
b) Muốn ước lượng lượng xăng tiêu thụ trung bình của xe với độ tin cậy 95% và độ chính
xác là 1,2 lít xăng/100 km thì cần kiểm tra thêm bao nhiêu xe nữa?
c) Xe cần đưa đi sửa chữa là xe có mức tiêu thụ trên 55 lít xăng / 100 km. Hãy ước lượng
tỷ lệ xe cần đưa đi sửa chữa với độ tin cậy 99%.
d) Bộ phận kỹ thuật báo cáo rằng: Tỷ lệ xe cần đưa đi sửa chữa là 5%. Với mức ý nghĩa
2%, hãy cho ý kiến về báo cáo đó. (Đề thi Học kỳ 14.1A)
6.7. Thời gian tự học trong ngày của một số sinh viên năm thứ nhất (được chọn ngẫu nhiên)
ở một trường đại học ghi nhận được như sau:
Thời gian tự học (giờ) 0–2 2–4 4–6 6–8 8 – 10
Số sinh viên 25 46 14 11 4

a) Với độ tin cậy 95%, hãy ước lượng tỉ lệ sinh viên của trường có thời gian tự học trong
ngày từ 4 giờ trở lên.
b) Ở mức ý nghĩa 2%, có thể cho rằng tỷ lệ sinh viên tự học trên 6 giờ / ngày là 20% được
không?
c) Phòng hỗ trợ công tác sinh viên của trường cho rằng sinh viên giành trung bình 4 giờ mỗi
ngày để tự học, bạn hãy nhận xét về tuyên bố này với mức ý nghĩa 5%.
d) Muốn sai số khi ước lượng số giờ tự học trung bình không vượt quá 0,5 giờ với độ tin
cậy 99% thì cần khảo sát thêm bao nhiêu sinh viên nữa? (Đề thi Học kỳ 14.1A)
6.8. Để nghiên cứu lượng sữa của một giống bò sữa mới nhập, người ta tiến hành đo lượng
sữa trên 100 con bò và ghi được kết quả như sau:
Lượng sữa (kg/ngày) 7-9 9 - 11 11 - 13 13 - 15 15 - 17
Số con bò 10 24 42 16 8
a) Hãy ước lượng lượng sữa trung bình của giống bò đó với độ tin cậy 95%.
b) Cho biết giống bò cũ có lượng sữa trung bình 11 kg/ngày. Với mức ý nghĩa 1%, hãy
kiểm định ý kiến cho rằng hai giống bò cho lượng sữa trung bình như nhau.
c) Hãy ước lượng tỷ lệ bò sữa mới nhập có lượng sữa trên 11 kg/ngày với độ tin cậy 99%.

34
d) Có ý kiến cho rằng tỷ lệ bò sữa mới nhập có lượng sữa trên 13 kg/ngày là 25% thì có
chấp nhận được không ở mức ý nghĩa 5%? (Đề thi Học kỳ 12.2A)
6.9. Theo dõi khối lượng kẹo X (kg) bán ra trong 1 tuần, người ta ghi được số liệu sau:
X 0 – 30 30 – 60 60 – 90 90 – 120 120 – 150 150 – 180
Số tuần 12 23 35 25 25 24
a) Hãy ước lượng khối lượng kẹo trung bình bán được mỗi tuần với độ tin cậy 99%.
b) Bằng cách thay đổi mẫu mã, người ta thấy khối lượng kẹo trung bình bán được mỗi
tuần là 110 kg. Việc thay đổi này có ảnh hưởng đến khối lượng kẹo trung bình bán được
hay không ở mức ý nghĩa 5%?
c) Những tuần bán được trên 120 kg là những tuần hiệu quả. Hãy ước lượng tỷ lệ những
tuần hiệu quả với độ tin cậy 90%.
d) Ước lượng khối lượng kẹo trung bình bán được trong những tuần hiệu quả với độ tin
cậy 98%. (Đề thi Học kỳ 16.1B)
6.10. Khảo sát năng suất lao động (kg/ ngày) của một số công nhân trong một công ty,
người ta ghi được số liệu sau:
Năng suất lao động 100 - 110 110 - 120 120 - 130 130 - 140 140 - 150
Số công nhân 8 16 36 28 12
Công nhân được coi là có năng suất cao nếu năng suất lao động đạt ít nhất 130 kg/ ngày.
a) Ước lượng năng suất trung bình của công nhân với độ tin cậy 95%.
b) Ước lượng tỷ lệ công nhân có năng suất cao với độ tin cậy 90,106%.
c) Trước đây năng suất trung bình của công nhân trong công ty là 112 kg/ ngày. Các số
liệu trên được lấy sau khi công ty đã áp dụng một số cải tiến kỹ thuật trong sản xuất. Với
mức ý nghĩa   5% , hãy cho biết các biện pháp cải tiến kỹ thuật của công ty có hiệu quả
hay không?
d) Muốn ước lượng tỷ lệ công nhân có năng suất cao với độ tin cậy 95% và sai số không
quá 8% thì cần khảo sát thêm tối thiểu bao nhiêu công nhân nữa? (Đề thi Học kỳ 16.2A)

CHƯƠNG VII. TƯƠNG QUAN VÀ HỒI QUY


1. Tương quan giữa các đại lượng ngẫu nhiên
Giả sử hai đại lượng ngẫu nhiên X và Y là hai dấu hiệu trên cùng một tổng thể. Để đo
mức độ tương quan giữa X và Y người ta xét số
E (XY )  E(X )E(Y )
RXY = ,
( X ) ( Y )
được gọi là hệ số tương quan giữa X và Y.
Với mọi đại lượng ngẫu nhiên, ta có -1  RXY  1.
Trường hợp RXY = 0 ta nói X và Y không tương quan với nhau.
Trường hợp RXY =  1 ta nói X và Y có tương quan tuyến tính.
2. Bảng tương quan mẫu
Cho một mẫu kích thước n. Quan sát đồng thời X và Y ta được bảng sau đây, được gọi
là bảng tương quan mẫu

35
Y y1 y2 ... yh ni
X
x1 n11 n12 ... n1h n1
x2 n21 n22 ... n2h n2
  ...  
xk nk1 nk2 ... nkh nk
mj m1 m2 ... mh =n
Trong bảng này
xi (i = 1, k ) là các giá trị của X,
y j (j = 1, h ) là các giá trị của Y,
ni (i = 1, k ) là số lần X nhận giá trị xi ,
m j (j = 1, h ) là số lần Y nhận giá trị y j ,
nij (i = 1, k , j = 1, h ) là số lần đồng thời X nhận giá trị xi , Y nhận giá trị y j .
k h h k
Ta có  n i   m j   n ij  n ;  n ij = ni ,  n ij = m j .
i 1 j1 i, j j1 i 1

Các đặc trưng của mẫu là


k k 
1 1
X
n
 xini , X 2  n
 x i2 n i , S2X  X 2  (X) 2 ;
i 1 i 1
h h 
1 1
Y
n
 yi m j , Y2 
n
 y 2j m j , S 2Y  Y 2  (Y) 2 ;
j1 j1
k h
1
XY 
n
  x i y j n ij .
i 1 j1

3. Hệ số tương quan mẫu


Ta gọi rXY = XY  X.Y là hệ số tương quan mẫu giữa X và Y.
 
S X .S Y

Như vậy, hệ số tương quan mẫu là một ước lượng của hệ số tương quan RXY .
Ta cũng có 1  rXY  1 .
4. Phương trình hồi quy tuyến tính mẫu
Phương trình hồi quy tuyến tính mẫu Y theo X là y = ax + b, trong đó
a= XY  X .Y , b = Y  aX .

2
S X

Phương trình này còn được viết ở dạng “đối xứng”


yY xX

 rXY 
.
SY SX
Đổi vai trò của X và Y ta có công thức tìm đường hồi quy tuyến tính mẫu X theo Y.

36
Ví dụ 1. Cho lượng nước mưa ở hai địa phương quan sát tại 10 thời điểm khác nhau, ta
được bảng số liệu sau đây:
xi 87 47 74 86 38 15 41 8 79 75
yj 86 56 84 72 47 17 43 19 88 78
Hãy tính các đặc trưng mẫu.
Ví dụ 2. Cho bảng số liệu sau đây:
Y 10 15 20 25 30 35
X
1 4 7
2 10 15
3 26 35 3
4 10 8 18 6
5 2 5 6 1
Hãy tính các đặc trưng mẫu của bộ số liệu đó.
Ví dụ 3. Đo chiều cao X và khối lượng Y của 5 học sinh, ta được kết quả cho ở bảng sau:
X(m) 1,45 1,60 1,50 1,65 1,55
Y(kg) 50 55 45 65 60
Tìm phương trình hồi quy tuyến tính mẫu Y theo X.
Ví dụ 4. Để nghiên cứu sự phát triển của một loại cây trồng, người ta tiến hành đo chiều
cao Y(m) và đường kính X(cm) của một số cây. Kết quả được ghi ở bảng sau đây:
Y 3 4 5 6 7 8
X
21 2 5
23 3 11
25 8 15 10
27 4 17 3
29 7 12
Tìm hệ số tương quan mẫu và phương trình hồi quy tuyến tính mẫu Y theo X và X theo Y.
Lưu ý. Muốn sử dụng máy tính Casio fx-570ES tìm hệ số tương quan mẫu R và các hệ số
hồi quy của phương trình Y = A + BX, ta thực hiện các bước sau đây:
a) Gọi chương trình:
Lần lượt nhấn các phím:
1) MODE
2) Chọn 3: STAT
3) Chọn 2: A + BX. Khi đó trên màn hình xuất hiện 2 cột X và Y (hoặc có thêm
cột FREQ)
b) Nhập dữ liệu:
4) Ở cột “X” nhập giá trị của biến X theo từng dòng, cách nhau bởi "dấu bằng"
5) Ở cột "Y" nhập giá trị tương ứng của biến Y theo từng dòng, cách nhau bởi
"dấu bằng"

37
6) Ở cột "FREQ" nhập tần số tương ứng của cặp giá trị (X,Y) theo từng dòng,
cách nhau bởi dấu bằng (nếu mẫu có tần số)
7) Sau khi nhập xong tất cả các cột, nhấn phím "AC".
c) Gọi kết quả:
c1) Hệ số A trong phương trình hồi quy:
Lần lượt nhấn các phím:
8) SHIFT
9) Số 1
10) Chọn 7: Reg (hoặc 5: Reg)
11) Chọn 1: A, nhấn "dấu bằng" và đọc kết quả trên màn hình.
c2) Hệ số B trong phương trình hồi quy:
12) Lặp lại bước 8 – 10, chọn 2: B, nhấn "dấu bằng", đọc kết quả trên màn hình.
c3) Hệ số tương quan R:
13) Lặp lại bước 8 – 10, chọn 3: r, nhấn "dấu bằng" và đọc kết quả trên màn hình.
BÀI TẬP CHƯƠNG VII
7.1. Theo dõi mối tương quan giữa tỉ lệ lạm phát X (%) và tỉ lệ thất nghiệp Y (%) của một
quốc gia, ta có bảng số liệu sau:
X (%) 0,5 1,0 1,3 1,7 2,0 2,4 3,0 3,6 5,0 6,2
Y (%) 8,0 7,3 7,0 7,2 6,8 6,0 5,5 5,1 3,4 3,0
a) Viết phương trình đường hồi quy tuyến tính mẫu của Y theo X.
b) Hãy dự báo tỉ lệ thất nghiệp trung bình ở mức lạm phát 7%. (Đề thi Học kỳ 15.1A)
7.2. Khảo sát điểm thi giữa kỳ (X) và cuối kỳ (Y) môn Anh văn (thang đo 100) của một số
sinh viên trong trường, người ta ghi được kết quả như sau:
X 90 77 50 64 60 72 80 84 65 95
Y 95 82 66 67 58 79 72 85 77 99
a) Tìm hệ số tương quan giữa X và Y.
b) Lập phương trình hồi quy tuyến tính mẫu của điểm thi cuối kỳ theo điểm giữa kỳ.
c) Dự báo điểm thi tiếng Anh cuối kỳ của một sinh viên, nếu điểm giữa kỳ của sinh viên đó
là 75. (Đề thi Học kỳ 15.1A)
7.3. Bảng dưới đây thống kê doanh thu của một công ty (Y- tỷ đồng/tháng) với chi phí
quảng cáo của tháng trước đó (X - trăm triệu đồng/tháng):
Y 25 30 42 40 47 32
X 3 4 7 6 8 5
a) Viết phương trình hồi quy tuyến tính mẫu của Y theo X.
b) Hãy dự báo doanh thu của công ty khi chi phí của tháng trước là 500 triệu đồng. (Đề thi
Học kỳ 15.2A)
7.4. Một nghiên cứu về chi phí quảng cáo X (triệu đồng/tuần) và doanh thu Y (triệu
đồng/tuần) của một mặt hàng cho kết quả như sau:
X 40 20 25 32 45 50 30 38 41 55
Y 385 182 216 367 474 579 272 305 379 638

38
a) Tính hệ số tương quan giữa chi phí quảng cáo và doanh thu.
b) Viết phương trình đường hồi quy tuyến tính mẫu của doanh thu theo chi phí quảng cáo.
c) Dự báo doanh thu khi chi phí quảng cáo là 35 triệu đồng/tuần. (Đề thi Học kỳ 13.2A)
7.5. Khảo sát về thu nhập (X - USD/tuần) và chi tiêu (Y - USD/tuần) của 10 người, người ta
thu được số liệu sau đây:
X 31 50 47 45 39 50 35 40 45 50
Y 29 42 38 30 29 41 23 36 42 48
Hãy viết phương trình đường hồi quy tuyến tính mẫu của Y theo X và dự báo chi tiêu trung
bình của một người có mức thu nhập 40 USD/tuần. (Đề thi Học kỳ 14.1A)
7.6. Thời gian sử dụng X (đơn vị tính: năm) và mức tiêu hao nhiên liệu Y (đơn vị tính: lít
xăng/100 km) của 10 chiếc xe du lịch (cùng nhãn hiệu) được cho ở bảng sau đây:
X 1 2 2 3 4 4 6 6 8 8
Y 7 7,5 8 8 9 8,5 10 9,5 12 11

a) Hãy viết phương trình hồi quy tuyến tính mẫu của Y theo X.
b) Dự báo mức tiêu hao nhiên liệu đối với các xe đã sử dụng 5 năm. (Đề thi Học kỳ 14.2A)
7.7. Có số liệu sau đây về thu nhập (X – triệu đồng) và chi tiêu (Y – triệu đồng) của một số
hộ gia đình:
X 20 24 28 22 32 28 32 36 41
Y 16 18 23 24 28 29 26 31 32
a) Tìm hệ số tương quan giữa X và Y.
b) Tìm phương trình hồi quy tuyến tính của Y theo X. (Đề thi Học kỳ 16.1B)
c) Hãy dự báo chi tiêu của một hộ gia đình có thu nhập 30 triệu đồng.
7.8. Khảo sát về tổng doanh thu (ký hiệu X, đơn vị: tỷ đồng/ tháng) và số tiền mua vật tư
cho sản xuất (ký hiệu Y, đơn vị: tỷ đồng/ tháng) của một công ty trong một số tháng, người
ta thu được số liệu như sau:
X 12 13 14 14 16 16 18 20
Y 6 7 8 7 8 10 10 12
a) Viết phương trình đường hồi quy tuyến tính mẫu của Y theo X.
b) Hãy dự báo số tiền mua vật tư cho sản xuất khi doanh thu đạt 15 tỷ đồng/ tháng. (Đề
thi Học kỳ 16.2A)

39

You might also like