Download as pdf or txt
Download as pdf or txt
You are on page 1of 262

TRƯỜNG ĐẠI HỌC NGÂN HÀNG TPHCM

BỘ MÔN TOÁN KINH TẾ

24
20

bộ
BÀI GIẢNG:

i
nộ
nh
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN HỌC


u


TS HỒ VŨ


.H
TS

BÀI GIẢNG LƯU HÀNH NỘI BỘ – 2024


TÀI LIỆU THAM KHẢO

24
1. Lê Sĩ Đồng, Xác suất thống kê, NXB Giáo dục.

20
2. Lê Sĩ Đồng, Bài tập Xác suất thống kê, NXB Giáo dục.


bộ
3. Giáo trình LT Xác suất thống kê, Lưu hành nội bộ.

i
nộ
4. Lê Sĩ Đồng, Toán cao cấp - phần Giải tích, NXB Giáo dục.

nh
5. Lê Sĩ Đồng, Bài tập Toán cao cấp - phần Giải tích, NXB Giáo dục.


u




.H
TS

Trang 2
ĐÁNH GIÁ MÔN HỌC

24
1) Điểm chuyên cần: 10% (Vắng 1 buổi TRỪ 3 điểm)

20
2) Điểm bài tập: 20% ⇐= Thực hiện 1 bài kiểm tra tự luận phần Xác suất


bộ
3) Điểm bài giữa kỳ: 20% ⇐= Thực hiện 1 bài kiểm tra tự luận phần Thống kê

i
nộ
4) Điểm cuối kỳ: 50% ⇐= Thi tự luận - Thời gian làm bài 75–90 phút

nh
Công thức tính điểm học phần (ĐHP)


u
ĐHP = (1) ∗ 30% + (2) ∗ 20% + (3) ∗ 50%

Lưu ý: SV làm bài tập do GV cung cấp trong giờ học và bài tập về nhà (nếu có) sẽ được cộng

điểm vào Mục 2 hoặc Mục 3.



.H
TS

Trang 3
TS
.H




u

nh
nộ
i bộ

20
24
24
20


Mục lục

IB

N
H
N
1 GIẢI TÍCH TỔ HỢP 11

À
1.1 Quy tắc cộng – Quy tắc nhân . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

H
U
1.1.1 Quy tắc cộng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.1.2 Quy tắc nhân . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

1.2 Hoán vị – Chỉnh hợp – Tổ hợp . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Ũ
V

1.2.1 Hoán vị không lặp . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15


1.2.2 Chỉnh hợp không lặp . . . . . . . . . . . . . . . . . . . . . . . . . . . 16


.H

1.2.3 Tổ hợp không lặp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18


TS

1.3 Bài tập tự luận . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19


5
MỤC LỤC

2 BIẾN CỐ – XÁC SUẤT 23


2.1 Biến cố . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

24
2.1.1 Các khái niệm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

20
2.1.2 Quan hệ giữa các biến cố . . . . . . . . . . . . . . . . . . . . . . . . . 27


bộ
2.2 Xác suất của một biến cố . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

i
2.3 Các công thức tính xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

nộ
2.3.1 Công thức xác suất có điều kiện . . . . . . . . . . . . . . . . . . . . . 36

nh
2.3.2 Công thức nhân và công thức cộng xác suất . . . . . . . . . . . . . . . 39


2.3.3 Công thức xác suất đầy đủ và Bayes . . . . . . . . . . . . . . . . . . . 42

u
2.3.4 Lư
Công thức xác suất Bernoulli . . . . . . . . . . . . . . . . . . . . . . . 48

2.4 Bài tập tự luận . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

3 BIẾN NGẪU NHIÊN 57



.H

3.1 Biến ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59


TS

3.1.1 Định nghĩa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59


3.1.2 Phân loại biến ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . . 60
Trang 6
MỤC LỤC

3.2 Các quy luật phân phối xác suất . . . . . . . . . . . . . . . . . . . . . . . . . 61


3.2.1 Bảng phân phối xác suất . . . . . . . . . . . . . . . . . . . . . . . . . 61

24
3.2.2 Hàm phân phối xác suất . . . . . . . . . . . . . . . . . . . . . . . . . 64

20
3.2.3 Hàm mật độ xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . . 67


bộ
3.3 Các tham số đặc trưng của biến ngẫu nhiên . . . . . . . . . . . . . . . . . . . 72
3.3.1 Kỳ vọng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

i
nộ
3.3.2 Phương sai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

nh
3.3.3 Trung vị . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82


3.3.4 Mode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

u
3.4
3.3.5

Giá trị tới hạn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
Các luật phân phối xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

3.4.1 Phân phối nhị thức . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88


3.4.2 Phân phối siêu bội . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

.H

3.4.3 Phân phối Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95


TS

3.4.4 Phân phối mũ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96


3.4.5 Phân phối chuẩn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
Trang 7
MỤC LỤC

3.4.6 Phân phối Chi bình phương . . . . . . . . . . . . . . . . . . . . . . . 104


3.4.7 Phân phối Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

24
3.4.8 Phân phối Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

20
3.5 Mối quan hệ giữa các phân phối xác suất . . . . . . . . . . . . . . . . . . . . . 108


bộ
3.6 Bài tập tự luận . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

i
nộ
4 ƯỚC LƯỢNG KHOẢNG TIN CẬY 125

nh
4.1 Thống kê mô tả . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127


4.1.1 Tầm quan trọng của thống kê mô tả trong nghiên cứu và thực tế . . . . 128

u
4.1.2 Các khái niệm cơ bản . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
4.1.3

Phân loại dữ liệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

4.1.4 Các đại lượng mô tả . . . . . . . . . . . . . . . . . . . . . . . . . . . 132


4.2 Bài toán ước lượng điểm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136

.H

4.3 Bài toán ước lượng khoảng . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136


TS

4.4 Khoảng tin cậy cho các tham số . . . . . . . . . . . . . . . . . . . . . . . . . 137


4.4.1 Khoảng tin cậy cho giá trị trung bình . . . . . . . . . . . . . . . . . . 137
Trang 8
MỤC LỤC

4.4.2 Khoảng tin cậy cho tỷ lệ . . . . . . . . . . . . . . . . . . . . . . . . . 145


4.4.3 Khoảng tin cậy cho phương sai . . . . . . . . . . . . . . . . . . . . . . 149

24
4.5 Bài tập tự luận . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155

20

5 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 167

bộ
5.1 Giả thuyết thống kê . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169

i
nộ
5.2 Quy tắc kiểm định giả thuyết thống kê . . . . . . . . . . . . . . . . . . . . . . 173

nh
5.3 Các loại sai lầm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175


5.3.1 Thủ tục kiểm định giả thuyết thống kê . . . . . . . . . . . . . . . . . . 176

u
5.3.2 Phương pháp p−value kiểm định giả thuyết thống kê . . . . . . . . . . 177
5.4

Kiểm định giả thuyết thống kê về tham số của một tổng thể . . . . . . . . . . . 178

5.4.1 Kiểm định giả thuyết thống kê về giá trị trung bình của một tổng thể . . 178
5.4.2 Kiểm định giả thuyết thống kê về Tỉ lệ của một tổng thể . . . . . . . . 193

.H

5.4.3 Kiểm định giả thuyết thống kê về Phương sai của một tổng thể . . . . . 197
TS

5.5 So sánh tham số của hai tổng thể . . . . . . . . . . . . . . . . . . . . . . . . . 205


5.5.1 So sánh giá trị trung bình của hai tổng thể . . . . . . . . . . . . . . . . 205
Trang 9
MỤC LỤC

5.5.2 So sánh Tỉ lệ của hai tổng thể . . . . . . . . . . . . . . . . . . . . . . 219


5.5.3 So sánh Phương sai của hai tổng thể . . . . . . . . . . . . . . . . . . . 226

24
5.6 Tính xác suất sai lầm loại II . . . . . . . . . . . . . . . . . . . . . . . . . . . 232

20
5.6.1 Khi Kiểm định giả thuyết về giá trị trung bình của tổng thể . . . . . . . 232


5.6.2 Khi Kiểm định giả thuyết về giá trị tỷ lệ của tổng thể . . . . . . . . . . 239

bộ
5.7 Xác định kích thước mẫu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243

i
nộ
5.7.1 Cho Kiểm định giả thuyết về giá trị trung bình của tổng thể . . . . . . . 243

nh
5.7.2 Cho kiểm định giả thuyết về giá trị tỷ lệ của tổng thể . . . . . . . . . . 248


5.8 Bài tập tự luận . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251

u




.H
TS

Trang 10
Chương
1

24
20

bộ
GIẢI TÍCH TỔ HỢP

i
nộ
nh

Không có bài toán nào không giải được. Chúng ta phải biết và sẽ biết – David Hilbert

u
1.1 Lư
Quy tắc cộng – Quy tắc nhân . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.1.1 Quy tắc cộng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.1.2 Quy tắc nhân . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14



.H

1.2 Hoán vị – Chỉnh hợp – Tổ hợp . . . . . . . . . . . . . . . . . . . . . . . . . . 15


TS

1.2.1 Hoán vị không lặp . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15


1.2.2 Chỉnh hợp không lặp . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
11
GIẢI TÍCH TỔ HỢP

1.2.3 Tổ hợp không lặp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18


1.3 Bài tập tự luận . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

24
20

Mục tiêu: Sau khi học xong chương này, sinh viên có khả năng giải quyết các vấn đề sau:

bộ
1) Hiểu được quy tắc cộng, quy tắc nhân.

i
nộ
2) Áp dụng được quy tắc cộng, quy tắc nhân để giải các bài toán liên quan.

nh

3) Hiểu định nghĩa tổ hợp không lặp, chỉnh hợp không lặp và hoán vị.

u

4) Áp dụng được công thức tổ hợp không lặp, chỉnh hợp không lặp và hoán vị để giải các bài
toán liên quan.

1.1 Quy tắc cộng – Quy tắc nhân



.H

1.1.1 Quy tắc cộng


TS

Để đếm số cách thực hiện một công việc nào đó. Ta giả sử rằng, công việc đó có thể có nhiều
trường hợp để thực hiện, cụ thể như sau:
Trang 12
GIẢI TÍCH TỔ HỢP

– Trường hợp 1 có n1 cách thực hiện.


– Trường hợp 2 có n2 cách thực hiện.

24
..
.

20
– Trường hợp k có nk cách thực hiện.


bộ
Khi đó, số cách thực hiện công việc này được tính như sau:

i
nộ
n = n1 + n2 + . . . + nk .

nh
Ví dụ 1.1. Trong một lớp có 15 sinh viên nam và 30 sinh viên nữ. Hỏi có bao nhiêu cách chọn


ra 1 sinh viên làm lớp trưởng?

u
Giải. Ta thấy Lư

• Trường hợp là Nam −→ n1 = 15 cách chọn;

• Trường hợp là Nữ −→ n2 = 30 cách chọn.


.H

Khi đó, số cách chọn 1 lớp trưởng là


TS

n = n1 + n2 = 15 + 30 = 45 cách.
Trang 13
GIẢI TÍCH TỔ HỢP

1.1.2 Quy tắc nhân

24
Tương tự như trên, nếu công việc đó được chia thành nhiều giai đoạn để thực hiện, cụ thể như

20
sau:


– Giai đoạn 1 có n1 cách thực hiện.

bộ
– Giai đoạn 2 có n2 cách thực hiện.
..

i
nộ
.
– Giai đoạn k có nk cách thực hiện.

nh

Khi đó, số cách thực hiện công việc này được tính như sau:

u

– n = n1 .n2 ...nk .

Ví dụ 1.2. Giả sử rằng để đi từ A đến B chỉ có thể đi từ A qua B rồi qua C mới đến được D.

Cho biết để đi từ điểm A đến điểm B có 3 cách đi; đi từ điểm B đến điểm C có 5 cách đi; đi từ

điểm C đến điểm D có 4 cách đi. Hỏi có bao nhiêu cách đi từ điểm A đến điểm D?
.H
TS

Giải. Ta thấy

• Từ A −→ B: n1 = 3 cách đi;
Trang 14
GIẢI TÍCH TỔ HỢP

• Từ B −→ C: n2 = 5 cách đi;

24
• Từ C −→ D: n3 = 4 cách đi.

20
Khi đó, số cách đi từ A −→ D là


bộ
n = n1 · n2 · n3 = 3.5.4 = 60 cách.

i
nộ
1.2 Hoán vị – Chỉnh hợp – Tổ hợp

nh

1.2.1 Hoán vị không lặp

u

Cho một tập hợp gồm n phần tử (n ≥ 1). Mỗi kết quả của sự sắp xếp thứ tự n phần tử của tập

hợp được gọi là một hoán vị của n phần tử đó.

Ký hiệu và công thức tính:


Pn = n! = n.(n − 1)...1
.H
TS

Quy ước: 0! = 1.
Ví dụ 1.3. Có bao nhiêu cách sắp xếp 4 sinh viên vào một cái bàn dài có 4 chỗ ngồi?
Trang 15
GIẢI TÍCH TỔ HỢP

Giải. Theo yêu cầu bài toán, ta có

24
P4 = 4! = 4.3.2.1 = 24 cách.

20
1.2.2 Chỉnh hợp không lặp


Cho một tập hợp gồm n phần tử (n ≥ 1). Chỉnh hợp chập k của n phần tử (1 ≤ k ≤ n) là một

bộ
nhóm k phần tử không lặp và có thứ tự lấy ra từ n phần tử đã cho. Ký hiệu và công thức tính:

i
nộ
n!
Akn = .

nh
(n − k)!


Trong trường hợp k = n, ta có

u
n! n!
Ann =

(n − n)!
=
0!
= n! = Pn .

Ví dụ 1.4. Trong một giải đấu bóng đá, có các đội: A, B, C và D tham dự. Hỏi có bao nhiêu

trận đấu diễn ra? Biết rằng trong giải đấu này, hai đội bất kỳ gặp nhau hai lần theo quy định

.H

sân nhà, sân khách; sau đó tổng kết để trao giải.


TS

Giải. Ta thấy:

• n = 4, k = 2;
Trang 16
GIẢI TÍCH TỔ HỢP

• Quan tâm đến thứ tự lấy ra.

24
Khi đó, số trận đấu diễn ra là:

20
4!
A24 = = 12 trận.


(4 − 2)!

bộ
Ví dụ 1.5. Trong một lớp học có 45 sinh viên, giảng viên chọn ngẫu nhiên lần lượt 3 sinh viên

i
nộ
để lập ra ban quản lý lớp bao gồm: lớp trưởng, lớp phó và thủ quỹ. Hỏi có bao nhiêu cách lập

nh
ban quản lý lớp như trên?


Giải. Ta thấy:

u
• n = 45, k = 3;


• Bài toán quan tâm đến thứ tự chọn.



.H

Khi đó, ta có số cách lập ban quản lý là:


TS

45!
A345 = = 85140 cách.
(45 − 3)!
Trang 17
GIẢI TÍCH TỔ HỢP

1.2.3 Tổ hợp không lặp

24
Cho một tập hợp gồm n phần tử (n ≥ 1). Tổ hợp chập k của n phần tử (1 ≤ k ≤ n) là một

20
nhóm k phần tử không lặp và không thứ tự lấy ra từ n phần tử đã cho. Ký hiệu và công thức


tính:

bộ
n!
Cnk = .
k!(n − k)!

i
nộ
Trong trường hợp k = n, ta có

nh
n!


Cnn = = 1.
n!(n − n)!

u

Ví dụ 1.6. Trong bộ đề thi có một chủ đề có 25 câu hỏi thi. Hỏi có bao nhiêu cách chọn ngẫu

nhiên ra 3 câu hỏi thi khác nhau của chủ đề này?

Giải. Ta thấy:

.H

• n = 25, k = 3;
TS

• Không quan tâm đến thứ tự chọn.


Trang 18
GIẢI TÍCH TỔ HỢP

Khi đó, ta có số cách lập đề thi thoả mãn yêu cầu bài toán:
3 25!

24
C25 = = 2300 cách.
3!(25 − 3)!

20
Ví dụ 1.7. Trong một lớp học có 45 sinh viên, giảng viên chọn ngẫu nhiên 3 sinh viên để lập


ra ban quản lý lớp. Hỏi có bao nhiêu cách lập ban quản lý lớp như thế?

i bộ
Giải. Ta thấy:

nộ
nh
• n = 45, k = 3;


• Bài toán không quan tâm đến thứ tự chọn.

u

Khi đó, ta có số cách lập ban quản lý thoả mãn yêu cầu bài toán:

3 45!
C45 = = 14190 cách.

3!(45 − 3)!

.H

1.3 Bài tập tự luận


TS

Bài 1. Trong tủ sách có tất cả 10 cuốn sách. Hỏi có bao nhiêu cách sắp xếp sao cho quyển thứ
nhất ở kề quyển thứ hai?
Trang 19
GIẢI TÍCH TỔ HỢP

Bài 2. Có bao nhiêu số tự nhiên gồm 6 chữ số khác nhau sao cho các chữ số đầu và chữ số
cuối đều làm số chẵn?

24
Bài 3. Một cuộc họp có 15 người, lúc ra về mỗi người đều bắt tay người khác một lần, riêng

20
chủ tọa chỉ bắt tay 4 người. Hỏi có bao nhiêu cái bắt tay?


bộ
Bài 4. Một lớp có 40 sinh viên. Giảng viên chủ nhiệm muốn chọn ra một ban cán sự lớp: 1 lớp

i
trưởng, 1 lớp phó, 1 thủ quỹ. Hỏi giảng viên chủ nhiệm có bao nhiêu cách chọn ban cán sự lớp?

nộ
Bài 5. Một giảng viên có 10 cuốn sách Toán cao cấp khác nhau, trong đó có 3 cuốn Đại số

nh
tuyến tính, 4 cuốn Giải tích và 3 cuốn Xác suất. Ông muốn lấy ra 5 cuốn và tặng cho 5 sinh


viên sao cho sau khi tặng mỗi loại sách còn lại ít nhất một cuốn. Hỏi giảng viên có bao nhiêu

u
cách chọn sách để tặng?


Bài 6. Một hộp đựng 5 viên bi trắng, 5 viên bi xanh. Lấy ngẫu nhiên 3 bi từ hộp. Hỏi

(1) Có bao nhiêu cách lấy được 3 bi trắng?



.H

(2) Có bao nhiêu cách lấy được ít nhất 1 bi trắng?


TS

(3) Có bao nhiêu cách lấy được 2 bi trắng, 1 bi xanh?


Trang 20
GIẢI TÍCH TỔ HỢP

Bài 7. Một hộp đựng 5 viên bi trắng, 4 viên bi xanh và 6 bi vàng. Lấy ngẫu nhiên lần lượt từng
bi từ hộp cho đến khi lấy được bi xanh thì dừng lại. Hỏi

24
20
(1) Có bao nhiêu cách lấy đến bi thứ 2 thì dừng?


(2) Có bao nhiêu cách lấy đến bi thứ 3 thì dừng?

bộ
(3) Có bao nhiêu cách lấy đến bi thứ 3 thì dừng và các bi đều khác màu?

i
nộ
Bài 8. Năm người A, B, C, D, E sẽ phát biểu trong một hội nghị. Có bao nhiêu cách sắp xếp

nh
để:


u
(1) Người B phát biểu sau người A.

(2) Người A phát biểu xong thì đến người B phát biểu.

Bài 9. Có 7 sinh viên được sắp xếp ngồi vào 7 chỗ đã ghi số thứ tự trên một bàn dài. Tìm số

cách xếp
.H
TS

(1) 7 sinh viên ngồi vào bàn này.

(2) 7 sinh viên ngồi vào bàn này sao cho 2 sinh viên A, B ngồi cạnh nhau.
Trang 21
GIẢI TÍCH TỔ HỢP

(3) 7 sinh viên ngồi vào bàn này sao cho 2 sinh viên A, B không ngồi cạnh nhau.

24
Bài 10. Một hộp có 10 bi đỏ, 8 bi trắng, 6 bi vàng. Người ta chọn ra ngẫu nhiên 6 bi từ hộp đó.

20
Hỏi có bao nhiêu cách chọn nếu:


(1) Có 2 bi vàng.

bộ
(2) Có 2 bi đỏ và tối đa 2 bi vàng.

i
nộ
(3) Có ít nhất 2 bi đỏ, ít nhất 1 bi trắng và ít nhất 1 bi vàng.

nh

u




.H
TS

Trang 22
Chương
2

24
20

bộ
BIẾN CỐ – XÁC SUẤT

i
nộ
nh
Quy luật của toán học càng liên hệ tới thực tế càng không chắc chắn, và càng chắc chắn thì
càng ít liên hệ tới thực tế – Albert Einstein


u
2.1

Biến cố . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.1.1 Các khái niệm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.1.2 Quan hệ giữa các biến cố . . . . . . . . . . . . . . . . . . . . . . . . . 27


2.2 Xác suất của một biến cố . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

.H

2.3 Các công thức tính xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36


TS

2.3.1 Công thức xác suất có điều kiện . . . . . . . . . . . . . . . . . . . . . 36


2.3.2 Công thức nhân và công thức cộng xác suất . . . . . . . . . . . . . . . 39
23
BIẾN CỐ – XÁC SUẤT

2.3.3 Công thức xác suất đầy đủ và Bayes . . . . . . . . . . . . . . . . . . . 42


2.3.4 Công thức xác suất Bernoulli . . . . . . . . . . . . . . . . . . . . . . . 48

24
2.4 Bài tập tự luận . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

20

bộ
Mục tiêu: Sau khi học xong chương này, sinh viên có khả năng giải quyết các vấn đề sau:

i
nộ
1) Hiểu và mô tả khái niệm không gian mẫu và các biến cố trong xác suất.

nh

2) Tính toán xác suất của các biến cố trong không gian mẫu rời rạc.

u

3) Hiểu và tính toán xác suất của các biến cố liên hợp và giao của các biến cố riêng lẻ.

4) Hiểu và tính toán xác suất có điều kiện của các biến cố.

5) Xác định tính độc lập của các biến cố và sử dụng tính độc lập để tính toán xác suất.
.H

6) Sử dụng định lý Bayes để tính toán xác suất có điều kiện.


TS

7) Vận dụng được công thức Bernoulli để tính xác suất.


Trang 24
BIẾN CỐ – XÁC SUẤT

2.1 Biến cố

24
2.1.1 Các khái niệm

20
1) Phép thử là một thí nghiệm hay một quan sát về hiện tượng nào đó trong cuộc sống tự nhiên


và xã hội, trong một số điều kiện nhất định.

i bộ
2) Một phép thử được gọi là phép thử ngẫu nhiên nếu thoả mãn:

nộ
nh
• Có thể xác định được tất cả các kết quả có thể xảy ra;


• Không biết trước kết quả nào sẽ xảy ra cụ thể.

u

3) Không gian mẫu Ω của một phép thử là tập hợp tất cả các kết quả có thể xảy ra sau khi thực

hiện phép thử.

4) Biến cố ngẫu nhiên (gọi tắt là biến cố) của phép thử là tập con của không gian mẫu Ω của

.H

phép thử này.


TS

Ví dụ 2.1. Tung một con xúc sắc cân đối lên một mặt phẳng và quan sát số chấm của mặt trên
cùng của con xúc sắc sau khi nó dừng lại. Ta thấy rằng:
Trang 25
BIẾN CỐ – XÁC SUẤT

• Hành động và quan sát trên là một phép thử ngẫu nhiên. Lưu ý: Một hành động chưa thể
hình thành một phép thử nếu chưa xác định được quan sát điều gì.

24
20
• Phép thử trên có không gian mẫu: Ω = {1, 2, 3, 4, 5, 6}.


• Một số tập biến cố đơn cử là: A = {1, 3, 5}, B = {2, 4, 6}, . . .

i bộ
Chú ý 2.1. Ta có thể phát biểu các tập biến cố theo dạng một mệnh đề, đặc biệt trong những

nộ
trường hợp các kết quả của phép thử "khó" có thể biểu diễn được theo hình thức liệt kê, hình

nh
học,. . ..


Theo ví dụ trên, ta thấy biến cố A, B có thể được phát biểu lại dưới dạng mệnh đề như sau:

u
• A: "biến cố xuất hiện mặt lẻ". Lư

• B: "biến cố xuất hiện mặt chẵn".



.H

Ví dụ 2.2. Gieo hai con xúc sắc cân đối một lần và quan sát số chấm của các mặt trên cùng
TS

của chúng.

1) Hãy xác định không gian mẫu của phép thử trên.
Trang 26
BIẾN CỐ – XÁC SUẤT

2) Phát biểu các biến cố sau dưới dạng mệnh đề:

24
A = {(6, 1), (1, 6), (3, 4), (4, 3), (2, 5), (5, 2)}.

20
Giải. Ta có


bộ
1) Không gian mẫu: Ω = {(i, j)|1 ≤ i, j ≤ 6}.

i
nộ
2) A: "biến cố tổng số chấm bằng 7".

nh

2.1.2 Quan hệ giữa các biến cố

u

◆ Biến cố tổng của A và B, ký hiệu A + B ≡ A ∪ B, xảy ra khi và chỉ khi có ít nhất 1 trong 2

biến cố A hoặc B xảy ra.



.H

A B
TS

A + B = {ω | ω ∈ A hoặc ω ∈ B}

Trang 27
BIẾN CỐ – XÁC SUẤT

◆ Biến cố tích của A và B, ký hiệu A.B ≡ A ∩ B, xảy ra khi và chỉ khi cả 2 biến cố A và B
cùng xảy ra.

24
20


A B

ibộ
nộ
AB = {ω | ω ∈ A và ω ∈ B}

nh
Ví dụ 2.3. Một người thợ săn bắn 2 viên đạn vào một con thú và con thú sẽ chết nếu nó bị trúng


cả 2 viên đạn. Gọi Ai : "viên đạn thứ i trúng con thú" (i = 1, 2). Hãy biểu diễn các biến cố

u
• A: "biến cố con thú bị trúng đạn";Lư

• B: "biến cố con thú bị chết" qua biến cố Ai .


Giải. Theo yêu cầu bài toán, ta thấy


.H
TS

• A = A1 + A2 : "biến cố con thú bị trúng đạn".

• A = A1 A2 : "biến cố con thú bị chết".


Trang 28
BIẾN CỐ – XÁC SUẤT

Ví dụ 2.4. Có 3 sinh viên thi hết môn Xác suất. Gọi

24
• Ai : "biến cố sinh viên thứ i thi đậu môn Xác suất";

20
• B: "biến cố cả 3 sinh viên đều thi đậu";


bộ
• C: "biến cố có ít nhất một sinh viên thi đậu".

i
nộ
Ta có thể biểu diễn các biến cố A, B như sau:

nh
• B = A1 A2 A3 .


• C = A1 + A2 + A3 .

u

◆ Biến cố A được gọi là kéo theo biến cố B, ký hiệu A ⊂ B hay A =⇒ B , nếu biến cố A xảy

ra kéo theo biến cố B xảy ra.

◆ Biến cố A được gọi là tương đương với biến cố B, ký hiệu A ⇐⇒ B hay A = B, nếu A ⊂ B

.H

và B ⊂ A.
TS

Ví dụ 2.5. Sinh viên An mua một tờ vé số. Gọi

• A: "biến cố sinh viên An trúng giải đặc biệt";


Trang 29
BIẾN CỐ – XÁC SUẤT

• B: "biến cố sinh viên An trúng số"

Dễ thấy rằng, A ⊂ B.

24
20
Ví dụ 2.6. Tung một con xúc sắc cân đối và quan sát số chấm của mặt trên của nó. Gọi


• A: "biến cố xuất hiện mặt lẻ";

bộ
• B: "biến cố xuất hiện mặt 1 chấm hoặc 3 chấm hoặc 5 chấm";

i
nộ
• C: "biến cố xuất hiện mặt 1 chấm hoặc 3 chấm".

nh

Ta thấy rằng, A = B và C ⊂ A, C ⊂ B.

u
◆ Hai biến cố A và B được gọi là độc lập với nhau, nếu việc xảy ra hay không xảy ra của biến

cố A không phụ thuộc vào việc biến cố B xảy ra hay không xảy ra và ngược lại.

◆ Hai biến cố A và B được gọi là xung khắc với nhau, nếu A, B không thể đồng thời xảy ra

trong cùng một phép thử.



.H

Ví dụ 2.7. Trong một hộp có 2 loại sản phẩm (loại 1 và loại 2). Lấy ngẫu nhiên một sản phẩm
TS

từ hộp. Gọi:

• A: "biến cố lấy được sản phẩm loại 1";


Trang 30
BIẾN CỐ – XÁC SUẤT

• B: "biến cố lấy được sản phẩm loại 2".

24
Khi đó, ta thấy rằng A và B là hai biến cố xung khắc vì không thể xảy ra đồng thời.

20
Ví dụ 2.8. Gieo riêng biệt 2 con xúc sắc cân đối và quan sát cố chấm của mặt trên của chúng.


Gọi

bộ
• A: "biến cố xuất hiện mặt 6 chấm ở con xúc sắc thứ 1";

i
nộ
• B: "biến cố xuất hiện mặt 6 chấm ở con xúc sắc thứ 2".

nh

Khi đó, ta thấy rằng A và B là hai biến cố không xung khắc vì có thể xảy ra đồng thời, nhưng

u

chúng độc lập nhau vì không ảnh hưởng đến nhau.
◆ Hai biến cố A và A được gọi là đối lập với nhau, nếu biến cố A xảy ra thì biến cố A không

xảy ra và ngược lại.


Ví dụ 2.9. Có 3 sinh viên thi hết môn Xác suất. Gọi:


.H
TS

• Ai : "biến cố sinh viên thứ i thi đậu môn Xác suất";

• B: "biến cố cả 3 sinh viên đều thi rớt môn Xác suất".


Trang 31
BIẾN CỐ – XÁC SUẤT

24
A

20

A=Ω\A

i bộ
• C: "biến cố có 2 sinh viên thi đậu môn Xác suất".

nộ
nh
Ta có thể biểu diễn các biến cố B, C như sau:


• B = A1 · A2 · A3 .

u

• C = A1 A2 A3 + A1 A2 A3 + A1 A2 A3 .

Tính chất 2.1. Cho A, B là các biến cố thuộc không gian mẫu Ω. Ta có,

1) A ∩ ∅ = ∅. 4) A ∩ A = ∅
.H
TS

2) A ∪ ∅ = A. 5) A ∪ A = Ω.

3) A = A. 6) A ∩ B = A ∪ B.
Trang 32
BIẾN CỐ – XÁC SUẤT

7) A ∪ B = A ∩ B. 9) Nếu A ⊂ B thì A ∪ B = B.

24
8) A = A ∩ (B ∪ B) = (A ∩ B) ∪ (A ∩ B). 10) Nếu A ⊂ B thì A ∩ B = A.

20
2.2 Xác suất của một biến cố


bộ
Xét 1 phép thử đồng khả năng1 , có không gian mẫu là:

i
nộ
Ω = {ω1 , ω2 , . . . , ωn }, |Ω| < +∞

nh
và A ⊂ Ω là 1 biến cố. Xác suất xảy ra biến cố A được xác định như sau:


Số kết quả xảy ra biến cố A |A|

u
P (A) = = .

Tổng số kết quả có thể xảy ra
Chú ý 2.2. Định nghĩa này được gọi là định nghĩa cổ điển của xác suất. Công thức tính xác
|Ω|

suất trên có ưu điểm là trực quan, nhưng phạm vi áp dụng chỉ cho các phép thử có hữu hạn kết
quả đồng khả năng.

.H

Ví dụ 2.10. Gieo đồng thời 2 con xúc sắc cân đối. Tính xác suất để tổng số chấm của các mặt
TS

trên của hai con xúc sắc bằng 6.


1 là một khái niệm chỉ đến tình huống mà tất cả các kết quả có khả năng xảy ra bằng nhau.

Trang 33
BIẾN CỐ – XÁC SUẤT

Giải. Gọi A: " biến cố tổng số chấm của các mặt trên của hai con xúc sắc bằng 6".

24
i) Số phần tử của không gian mẫu là: |Ω| = 6 × 6 = 36.

20
ii) Số kết quả xảy ra biến cố


bộ
A = {(1, 5), (5, 1), (2, 4), (4, 2), (3, 3)} =⇒ |A| = 5

i
nộ
|A| 5
Vậy ta có P (A) = = .

nh
|Ω| 36
Ví dụ 2.11. Một thùng có 5 hộp sữa cam, 4 hộp sữa dâu và 3 hộp sữa nho. Gia chủ chọn ngẫu


nhiên 3 hộp sữa để cho lũ trẻ. Tính xác suất 3 hộp sữa được chọn có cả 3 loại.

u

Giải. Gọi A: "biến cố 3 hộp sữa được chọn có cả 3 loại".

3
i) Số phần tử của không gian mẫu là: |Ω| = C12 = 220.

ii) Số kết quả xảy ra biến cố A là |A| = C51 C41 C31 = 60


.H

|A| 60 3
TS

Vậy ta có P (A) = = = .
|Ω| 220 11
◆ Khi sử dụng công thức tính xác suất, ta chú ý một số tính chất sau:
Trang 34
BIẾN CỐ – XÁC SUẤT

Tính chất 2.2. Cho A ⊂ Ω, ta có

24
1) 0 ≤ P (A) ≤ 1;

20

2) P (∅) = 0 và P (Ω) = 1;

i bộ
3) P (A) = 1 − P (A);

nộ
nh
4) Nếu A =⇒ B thì P (A) ≤ P (B).


u
5) Nếu A ⇐⇒ B thì P (A) = P (B).


Ví dụ 2.12. Có 6 học sinh nam và 4 học sinh nữ. Người ta chọn ra một cách ngẫu nhiên 4 học

sinh. Tính xác suất trong 4 học sinh được chọn có ít nhất 1 học sinh nữ.

.H

Lời giải. Gọi A: "biến cố trong 4 học sinh được chọn có ít nhất 1 học sinh nữ". Ta có
TS

C40 C64 1
P (A) = 1 − P (A) = 1 − 4 = .
C10 14
Trang 35
BIẾN CỐ – XÁC SUẤT

2.3 Các công thức tính xác suất

24
2.3.1 Công thức xác suất có điều kiện

20
Biến cố A xảy ra trong một số điều kiện nhất định của phép thử, nên mọi xác suất P (A) đều


bộ
là có điều kiện. Tuy nhiên, ngoài các điều kiện này, còn có thêm các điều kiện khác bằng việc

i
xuất hiện một biến cố B nào đó biết được đã xảy ra. Khi đó, xác suất có điều kiện của biến cố

nộ
A biết rằng biến cố B đã xảy ra, ký hiệu: P (A|B).

nh

Ví dụ 2.13. Trong một hộp gồm có 6 bi đỏ và 4 bi trắng. Lấy ngẫu nhiên lần lượt từng bi không
hoàn lại ra 2 bi, biết lần thứ nhất lấy được bi đỏ, tính xác xuất lần thứ hai cũng lấy được bi đỏ.

u

Giải. Gọi A: "biến cố lần thứ hai lấy được bi đỏ"; B: "biến cố lần thứ nhất lấy được bi đỏ". Ta


5 5

P (A|B) = P (bi đỏ lần 2|bi đỏ lần 1) = = .


.H

5+4 9
TS

Ví dụ 2.14. Gieo đồng thời 2 con xúc sắc cân đối. Biết rằng tổng số chấm của các mặt trên của
chúng là số chẵn, tính xác suất để tổng số chấm đó bằng 6.
Trang 36
BIẾN CỐ – XÁC SUẤT

Giải. Gọi A: "biến cố tổng số chấm của các mặt trên của chúng bằng 6"; B: "biến cố tổng số
chấm đó là số chẵn". Ta có

24
5

20
P (A|B) = P (tổng bằng 6|tổng là số chẵn) =
18


bộ
Công thức xác suất có điều kiện: Xét trường hợp P (B) > 0. Khi đó, ta có công thức tính xác
suất có điều kiện như sau:

i
nộ
P (A.B)
P (A|B) = .

nh
P (B)


Chú ý 2.3. Về cơ bản, xác xuất có điều kiện có mọi tính chất như xác suất thông thường, và

u
chú ý thêm là ngoại trừ một số trường hợp đặc biệt thì nhìn chung


P (A) ̸= P (A|B).

Ví dụ 2.15. An đã làm hai bài kiểm tra. Xác suất để An vượt qua cả hai bài kiểm tra là 0,6.

.H

Xác suất để An vượt qua bài kiểm tra đầu tiên là 0,8. Tính xác suất để cô ấy vượt qua bài kiểm
TS

tra thứ hai, biết rằng cô ấy đã vượt qua bài kiểm tra đầu tiên.

Giải. Gọi A: "biến cố An vượt qua bài kiểm tra thứ hai"; B: "biến cố An vượt qua bài kiểm tra
Trang 37
BIẾN CỐ – XÁC SUẤT

thứ nhất". Ta có

P (A.B) 0, 6

24
P (A|B) = = = 0, 75.
P (B) 0, 8

20

Hoặc ta có thể giải như sau:

i bộ
nộ
P (đậu lần 1 và đậu lần 2) 0, 6
P (đậu lần 2|đậu lần 1) = = = 0, 75.
P (đậu lần 1) 0, 8

nh

Ví dụ 2.16. Một túi đựng các viên bi màu đỏ và xanh đồng chất. Lấy ngẫu nhiên lần lượt từng

u

bi không hoàn lại ra 2 viên bi. Xác suất chọn được viên bi đỏ trước và sau đó là viên bi xanh là
0,28. Xác suất chọn được viên bi đỏ trong lần rút đầu tiên là 0,5. Tính xác suất chọn được một

viên bi xanh trong lần lấy thứ hai, biết rằng viên bi đầu tiên được lấy ra có màu đỏ.

.H

Giải. Ta có
TS

P (đỏ lần 1 và xanh lần 2) 0, 28


P (xanh lần 2|đỏ lần 1) = = = 0, 56.
P (đỏ lần 1) 0, 5
Trang 38
BIẾN CỐ – XÁC SUẤT

2.3.2 Công thức nhân và công thức cộng xác suất

24
Định nghĩa 2.1. Cho Ai , (i = 1, n) là n biến cố sao cho P (A1 A2 . . . An ) > 0. Xác suất n biến

20
cố cùng xảy ra là:


P (A1 A2 . . . An ) = P (A1 )P (A2 |A1 ) . . . P (An |A1 A2 . . . An−1 ).

i bộ
nộ
Chú ý 2.4. Trong trường hợp các biến cố A1 , A2 , . . . An độc lập với nhau, ta có

nh
P (A1 . . . An ) = P (A1 ) . . . P (An ).


Ví dụ 2.17. Trong một thùng hàng có 10 sản phẩm, trong đó có 7 chính phẩm và 3 phế phẩm.

u

Lấy ngẫu nhiên lần lượt không hoàn lại ra 2 sản phẩm từ thùng hàng. Tính xác suất 2 sản phẩm

lấy ra đều là chính phẩm.

Giải. Gọi A1 : "biến cố lấy được chính phẩm ở lần thứ nhất"; A2 : "biến cố lấy được chính phẩm

.H

ở lần thứ hai" và A: "biến cố lấy được chính phẩm ở cả hai lần lấy". Ta có
TS

7 6 7
A = A1 A2 =⇒ P (A) = P (A1 A2 ) = P (A1 )P (A2 |A1 ) = × = .
10 9 15

Trang 39
BIẾN CỐ – XÁC SUẤT

Ví dụ 2.18. Trong một thiết bị có 3 bộ phận. Sau một thời gian hoạt động, các bộ phận bị hỏng
độc lập với nhau và xác suất hỏng tương ứng là 0,1; 0,2; 0.3. Biết rằng: nếu một bộ phận bất

24
kỳ bị hỏng thì thiết bị sẽ ngừng hoạt động. Tính xác suất thiết bị hoạt động bình thường.

20
Giải. Gọi Ai : "biến cố bộ phận thứ i hư hỏng" (i = 1, 2, 3) và A: "biến cố thiết bị hoạt động


bộ
bình thường". Ta có

i
nộ
A = A1 · A2 · A3 =⇒ P (A) = P (A1 · A2 · A3 )

nh
= P (A1 )P (A2 )P (A3 )


= (1 − 0, 1) × (1 − 0, 2) × (1 − 0, 3) = 0, 504.

u

Định nghĩa 2.2. Cho các biến cố Ai , (i = 1, n). Xác suất xảy ra ít nhất 1 trong n biến cố là:

n
X X X
P (A1 + A2 + . . . + An ) = P (Ai ) − P (Ai Aj ) + P (Ai Aj Ak )

i=1 i<j i<j<k


+ . . . + (−1)n−1 P (A1 A2 . . . An ).
.H
TS

◆ Trường hợp 1. Cho 2 biến cố A và B. Xác suất xảy ra ít nhất 1 trong 2 biến cố là

P (A + B) = P (A) + P (B) − P (AB).


Trang 40
BIẾN CỐ – XÁC SUẤT

Nếu A và B xung khắc thì AB = ∅. Khi đó, ta có

24
P (A + B) = P (A) + P (B).

20

◆ Trường hợp 2. Cho 3 biến cố A, B và C. Xác suất xảy ra ít nhất 1 trong 3 biến cố là

bộ
P (A + B + C) = P (A) + P (B) + P (C)

i
nộ
− P (AB) − P (AC) − P (BC) + P (ABC).

nh

Nếu A, B và C từng đôi xung khắc thì

u

P (A + B + C) = P (A) + P (B) + P (C).

Ví dụ 2.19. Trong một lớp có 50 sinh viên, trong đó có 20 sinh viên giỏi tiếng Anh, 15 sinh

.H

viên giỏi tiếng Pháp, 7 sinh viên giỏi cả 2 thứ tiếng. Chọn ngẫu nhiên một sinh viên của lớp.
Tính xác xuất chọn được một sinh viên giỏi ít nhất 1 trong 2 thứ tiếng trên.
TS

Giải. Gọi T A: "biến cố chọn được sinh viên giỏi tiếng Anh"; T P : "biến cố chọn được sinh
Trang 41
BIẾN CỐ – XÁC SUẤT

viên giỏi tiếng Pháp". Ta có

24
P (T A + T P ) = P (T A) + P (T P ) − P (T A ∩ T P )

20
1 1
C20 C15 C71 28
= 1 + 1 − 1 = .
C50 C50 C50 50


bộ
Ví dụ 2.20. Trong một hộp có 10 cây viết bi, trong đó có 3 cây viết đỏ và 7 cây viết xanh. Lấy

i
nộ
ngẫu nhiên ra 2 cây từ hộp. Tính xác xuất có lấy được cây viết xanh.

nh
Giải. Gọi A: "biến cố lấy được 2 cây viết xanh"; B: "biến cố lấy được 1 cây viết đỏ và 1 cây


viết xanh". Do A và B là 2 biến cố xung khắc, nên

u
C72 C71 C31

P (A + B) = P (A) + P (B) = 2 +
C10 C102 =
14
15
.

2.3.3 Công thức xác suất đầy đủ và Bayes



.H

Định nghĩa 2.3. Hệ các biến cố Ai , (i = 1, n) gọi là hệ biến cố đầy đủ nếu hệ thỏa mãn 2 điều
TS

kiện sau:

• Xung khắc từng đôi, nghĩa là Ai Aj = ∅ với mọi i ̸= j.


Trang 42
BIẾN CỐ – XÁC SUẤT

• A1 + . . . + An = Ω.

24
Định lý 2.3.1. Xét biến cố B và một hệ biến cố đầy đủ Ai , (i = 1, n) với P (Ai ) > 0. Khi đó,

20
ta có
n


X
P (B) = P (Ai )P (B|Ai ).

bộ
i=1

Công thức này còn được gọi là công thức xác suất đầy đủ (CT XSĐĐ).

i
nộ
Chú ý 2.5. ◗ Các xác suất P (Ai ), (i = 1, n) thường được gọi là xác suất của các giả thuyết hay

nh
các xác suất tiên nghiệm.


◗ Có thể biểu diễn CT XSĐĐ dưới dạng biểu đồ cây (được gọi là cây xác suất) sau:

u
Lư P (B)

P (A1 ) P (Ai ) . . . P (An )



.H
TS

P (B|A1 ) P (B|Ai ) . . . P (B|An )

Trang 43
BIẾN CỐ – XÁC SUẤT

Khi đó, P (B) được tính theo nguyên tắc như sau:

24
1) Xác định hoặc tính các xác suất của các nốt.

20
2) Thực hiện phép nhân xác suất các nốt trên cùng một nhánh.


bộ
3) Cộng tất cả xác suất của các nhánh lại.

i
nộ
Ví dụ 2.21. Có 3 lô sản phẩm, tỷ lệ phế phẩm của từng lô tương ứng là: 5%, 6%, 7%. Chọn
ngẫu nhiên một lô, rồi lấy ngẫu nhiên ra một sản phẩm. Tính xác suất lấy được một phế phẩm?

nh

Giải. Gọi Ai : "biến cố chọn được lô thứ i" với i = 1, 2, 3; B: "biến cố lấy được phế phẩm". Ta

u

Lư P (B)

1 1 1
P (A1 ) = P (A2 ) = P (A3 ) =
3 3 3

.H
TS

P (B|A1 ) = 0, 05P (B|A2 ) = 0, 06P (B|A3 ) = 0, 07

Trang 44
BIẾN CỐ – XÁC SUẤT

Áp dụng CT XSĐĐ, ta được


1 1 1 3

24
P (B) = .0, 05 + .0, 06 + .0, 07 = .
3 3 3 50

20
Ví dụ 2.22. Có 2 hộp bút bi: hộp I có 10 cây bút bi trong đó có 1 cây bút hỏng và 9 cây bút tốt;


hộp II có 8 cây bút bi trong đó có 2 cây bút hỏng và 6 cây bút tốt. Lấy ngẫu nhiên 1 cây bút từ

bộ
hộp I bỏ sang hộp II, sau đó từ hộp II chọn ngẫu nhiên ra 2 cây bút. Tính xác suất cả 2 cây bút

i
nộ
lấy ra từ hộp II đều hỏng.

nh
Giải. Gọi A: "biến cố lấy được bút hỏng từ hộp I"; B: "biến cố lấy được 2 cây bút hỏng từ hộp


II". Ta có

u
Lư P (B)

1 9

P (A) = P (A) =
10 10

.H
TS

C32 C22
P (B|A) = P (B|A) =
C92 C92

Trang 45
BIẾN CỐ – XÁC SUẤT

Áp dụng CT XSĐĐ, ta được


1 C2 9 C2 1
× 32 + × 22 = .

24
P (B) =
10 C9 10 C9 30

20
Định lý 2.3.2. Giả sử biến cố B đã xảy ra, xét hệ biến cố đầy đủ Ai , (i = 1, n) với P (Ai ) > 0.


Khi đó, ta có

bộ
P (Ai )P (B|Ai )
P (Ai |B) = .

i
P (B)

nộ
Công thức này còn được gọi là công thức Bayes.

nh
Chú ý 2.6. ◗ Các xác suất P (Ai |B) được xác định sau khi biết được biến cố B đã xảy ra, nên


thường được gọi là các xác suất hậu nghiệm .

u

◗ Dựa vào cây xác suất trên, ta thấy rằng

Nhánh thứ i
P (Ai |B) =

Tổng các nhánh


Ví dụ 2.23. Có 3 hộp đựng sản phẩm, mỗi hộp có 10 sản phẩm, trong đó số sản phẩm loại I

.H

trong các hộp 1, 2, 3 lần lượt là 2, 3, 4. Chọn ngẫu nhiên một hộp, rồi từ hộp đã chọn, rút ngẫu
TS

nhiên ra 1 sản phẩm. Biết rằng sản phẩm được rút ra là sản phẩm loại I. Tính xác suất sản phẩm
đó được rút ra từ hộp 2?
Trang 46
BIẾN CỐ – XÁC SUẤT

Giải. Gọi Ai : "biến cố chọn được hộp i" với i = 1, 2, 3; B: "biến cố lấy được sản phẩm loại I".
Ta có

24
20
P (B)


1 1 1

bộ
P (A1 ) = P (A2 ) = P (A3 ) =
3 3 3

i
nộ
nh
2 3 4
P (B|A1 ) = P (B|A2 ) = P (B|A3 ) =


10 10 10

u
Áp dụng CT XSĐĐ, ta được Lư

1 2 3 4 3

P (B) = + + = .
3 10 10 10 10

Áp dụng CT Bayes, ta được


.H

1 2
TS

P (A2 )P (B|A2 ) × 2
P (A2 |B) = = 3 3 10 = .
P (B) 10 9
Trang 47
BIẾN CỐ – XÁC SUẤT

2.3.4 Công thức xác suất Bernoulli

◆ Giả sử tiến hành n phép thử thoả mãn:

24
20
• Các phép thử độc lập với nhau.


• Mỗi phép thử chỉ có 2 kết quả: Hoặc biến cố A xảy ra hoặc biến cố A xảy ra.

i bộ
• Xác suất biến cố A xảy ra trong mỗi phép thử đều bằng một hằng số P (A) = p.

nộ
◆ Khi đó, n phép thử trên được gọi là dãy phép thử Bernoulli và xác suất biến cố A xảy ra k

nh

lần trong n phép thử là
Pn (k) = Cnk pk q n−k , với q = 1 − p.

u

Ví dụ 2.24. Một sinh viên thi hết môn Xác suất- Thống kê. Trong đề thi có 25 câu hỏi trắc

nghiệm, mỗi câu hỏi có 4 phương án trả lời và chỉ có một phương án đúng. Tính xác suất sinh

trả lời đúng 12 câu hỏi trắc nghiệm, biết rằng sinh viên đó chọn trả lời một cách ngẫu nhiên

.H

cho từng câu hỏi trắc nghiệm?


TS

Giải. Gọi A: "biến cố sinh viên trả lời đúng 12 câu trắc nghiệm". Ta có
12
P (A) = P25 (12) = C25 × 0, 2512 × 0, 7525−12 ≈ 7, 36.10−3 .
Trang 48
BIẾN CỐ – XÁC SUẤT

Ví dụ 2.25. Một lô hàng có tỷ lệ phế phẩm là 5%. Lấy ngẫu nhiên từ lô hàng ra 5 sản phẩm
để kiểm tra (biết rằng số sản phẩm của lô hàng là rất lớn). Tìm xác xuất có ít nhất 1 phế phẩm

24
trong 5 sản phẩm lấy ra?

20
Giải. Gọi A: "biến cố có được ít nhất 1 phế phẩm trong 5 sản phẩm lấy ra". Ta có


bộ
P (A) = 1 − P5 (0) ≈ 1 − C50 × 0, 050 × 0, 955 ≈ 0, 2262.

i
nộ
Ví dụ 2.26. Trong một phân xưởng sản xuất có 5 máy hoạt động độc lập. Trong một ca sản

nh
xuất, xác suất bị hỏng của mỗi máy là như nhau và bằng 0,1. Giả sử rằng trong một ca sản xuất


có 2 máy hỏng. Tính xác xuất máy 1 không hỏng trong ca sản xuất đó?

u

Giải. Gọi Ai : "biến cố máy thứ i bị hỏng" (i = 1, 5); B: "biến cố có 2 máy hỏng". Áp dụng

công thức Bernoulli, ta được

P (B) = P5 (2) = C52 × 0, 12 × 0, 93 = 0, 0729.



.H

Áp dụng công thức Bayes, ta được


TS

P (A1 )P (B|A1 ) 0, 9 × (C42 × 0, 12 × 0, 92 )


P (A1 |B) = = = 0, 6.
P (B) 0, 0729
Trang 49
BIẾN CỐ – XÁC SUẤT

2.4 Bài tập tự luận

24
Bài 11. Một hộp chứa 4 cái thẻ được đánh số 1, 2, 3, 4, ta lấy ngẫu nhiên 2 thẻ từ hộp.

20
1) Xác định không gian mẫu của phép thử trên.


bộ
2) Liệt kê tất cả các phần tử của các biến cố sau: A: "Tổng các số trên hai thẻ là số chẵn"; B:

i
nộ
"Tích các số trên hai thẻ là số chẵn".

nh
Bài 12. Từ một hộp chứa 10 cái thẻ, trong đó các thẻ màu đỏ được đánh số 1, 2, 3, 4, 5, thẻ


màu xanh được đánh số 6 và các thẻ màu trắng được đánh số 7, 8, 9, 10. Lấy ngẫu nhiên một

u
thẻ từ hộp.


1) Xác định không gian mẫu.

2) Kí hiệu A, B, C là các biến cố sau: A: "Lấy được thẻ màu đỏ"; B: "Lấy được thẻ màu trắng";

.H

C: "Lấy được thẻ ghi số chẵn". Hãy biểu diễn các biến cố A, B, C theo các biến cố con khác
TS

rỗng nhỏ nhất của không gian mẫu.

Bài 13. Một hộp có 10 quả bóng bàn. Ngày thi đấu thứ nhất lấy ngẫu nhiên 3 quả ra sử dụng,
Trang 50
BIẾN CỐ – XÁC SUẤT

sau đó bỏ lại vào hộp. Ngày thi đấu thứ hai lấy ngẫu nhiên 3 quả ra sử dụng. Tính xác suất
trong 3 quả sử dụng ở ngày thứ hai có ít nhất 1 quả đã sử dụng ở ngày thứ nhất.

24
Bài 14. Có 2 hộp bi: Hộp 1 có 3 bi đỏ, 5 bi xanh và 6 bi vàng; hộp 2 có 5 bi đỏ, 4 bi xanh và 7

20
bi vàng. Lấy ngẫu nhiên từ mỗi hộp ra 1 bi. Giả sử lấy được 2 bi không cùng màu đỏ. Tính xác


suất 2 bi đó cùng màu vàng.

bộ
Bài 15. Một người bắn vào một mục tiêu 2 phát đạn, biết rằng khả năng bắn trúng mục tiêu ở

i
nộ
lần thứ nhất là 0,6 và lần thứ hai là 0,8. Biết rằng, nếu lần thứ nhất bắn trúng mục tiêu thì khả

nh
năng bắn trúng mục tiêu ở lần thứ hai là 0,9. Tính xác suất người này bắn trúng mục tiêu ở lần


thứ hai, biết rằng lần thứ nhất người đó không bắn trúng mục tiêu.

u

Bài 16. Một công ty đấu thầu 2 dự án A và B. Xác suất thắng thầu dự án A là 90%, xác suất
thắng thầu dự án B là 77%, xác suất thắng thầu cả 2 dự án là 72%.

1) Tính xác suất công ty thắng thầu ít nhất 1 dự án.



.H

2) Biết rằng công ty chỉ thắng thầu một dự án, tính xác suất công ty thắng thầu dự án A.
TS

Bài 17. Hai công ty cùng kinh doanh một loại mặt hàng. Xác suất để công ty A và B kinh
doanh có lãi lần lượt là 0,6 và 0,65. Xác suất để cả hai công ty có lãi là 0,45.
Trang 51
BIẾN CỐ – XÁC SUẤT

1) Tính xác suất có ít nhất một công ty có lãi.

24
2) Biết công ty A có lãi, tính xác suất công ty B không có lãi.

20
Bài 18. Một lô hàng có 4 sản phẩm tốt, 6 sản phẩm xấu. Nhân viên cửa hàng lấy ngẫu nhiên


từ lô hàng ra 1 sản phẩm, nếu được sản phẩm tốt thì đem đi trưng bày (không bỏ lại vào trong

bộ
lô), nếu được sản phẩm xấu thì nhân viên này lấy thêm một sản phẩm tốt khác ở ngoài rồi bỏ

i
nộ
2 sản phẩm này vào lô. Sau đó một khách hàng lấy từ lô hàng ra 2 sản phẩm để mua. Tính xác

nh
suất khách hàng mua được 2 sản phẩm tốt.


Bài 19. Một sinh viên muốn hoàn thành khóa học phải vượt qua 3 kỳ thi với nguyên tắc: đỗ kỳ

u
thi trước thì mới được thi kỳ thi sau. Xác suất để sinh viên đỗ kỳ thi thứ nhất, thứ hai, thứ ba
lần lượt là 0,9; 0,8; 0,7. Lư

1) Tính xác suất sinh viên đó không vượt qua được kỳ thi nào.

.H

2) Nếu sinh viên đó không vượt qua được tất cả 3 kỳ thi thì xác suất anh ta bị trượt ở kỳ thi thứ
TS

hai là bao nhiêu?

Bài 20. Hai người chơi trò bắn súng một cách độc lập, mỗi người bắn 10 phát đạn. Biết rằng
Trang 52
BIẾN CỐ – XÁC SUẤT

xác suất người thứ nhất bắn trúng mục tiêu ở mỗi phát bắn là 0,3 và xác suất người thứ hai bắn
trúng mục tiêu ở mỗi phát bắn là 0,2.

24
20
1) Tính xác suất có ít nhất một người bắn trúng mục tiêu.


bộ
2) Tính xác suất chỉ có một người bắn trúng mục tiêu, biết rằng có ít nhất 1 người bắn trúng
mục tiêu.

i
nộ
nh
Bài 21. Hai xạ thủ A và B, mỗi người bắn 2 viên đạn vào cùng một tấm bia một cách độc lập.


Xác suất bắn trúng hồng tâm của A, B ở mỗi lần bắn tương ứng là 0,6; 0,7. Tính xác suất xạ

u
thủ A bắn trúng hồng tâm nhiều hơn xạ thủ B.

Bài 22. Có 3 xạ thủ cùng nhắm bắn độc lập vào một mục tiêu ở xa, mỗi người bắn một phát

đạn. Xác suất bắn trúng mục tiêu của các xạ thủ 1, 2, 3 lần lượt là 0,6; 0,7 và 0,8. Biết rằng, nếu

cả 3 phát bắn đều trúng mục tiêu thì mục tiêu chắc chắn bị tiêu diệt, nếu có 2 phát bắn trúng

.H

mục tiêu thì xác suất mục tiêu bị tiêu diệt là 0,75, nếu chỉ có 1 phát bắn trúng mục tiêu thì xác
suất mục tiêu bị tiêu diệt là 0,6.
TS

1) Tính xác suất mục tiêu bị tiêu diệt.


Trang 53
BIẾN CỐ – XÁC SUẤT

2) Tính xác suất mục tiêu không bị tiêu diệt, biết rằng nó bị trúng đạn.
Bài 23. Có 5 xạ thủ cùng bắn mỗi người 1 viên đạn vào một mục tiêu với xác suất bắn trúng

24
20
mục tiêu của mỗi người đều là 0,6. Nếu mục tiêu bị trúng 1 viên đạn thì xác suất mục tiêu bị
phá hủy là 0,5; nếu mục tiêu bị trúng 2 viên thì xác suất mục tiêu bị phá hủy là 0,8 và nếu có


bộ
ít nhất 3 viên trúng mục tiêu thì chắc chắn mục tiêu bị phá hủy. Tính xác suất mục tiêu bị phá

i
hủy.

nộ
Bài 24. Một hộp bóng đèn gồm 8 bóng tốt và 2 bóng lỗi. Lấy đồng thời 3 bóng đèn ra để kiểm

nh
tra.


u
1) Tính xác suất lấy được đúng 3 bóng tốt.

2) Hộp bóng đèn sẽ không được phép xuất kho nếu trong 3 bóng đem kiểm tra có ít nhất 1

bóng lỗi. Tính xác suất hộp bóng đèn được xuất kho.
Bài 25. Có 3 hộp, mỗi hộp có 10 sản phẩm. Hộp thứ nhất có 7 sản phẩm loại A; hộp thứ hai

.H

có 8 sản phẩm loại A; hộp thứ ba có 9 sản phẩm loại A; các sản phẩm còn lại là loại B. Lấy
TS

ngẫu nhiên từ mỗi hộp ra 1 sản phẩm. Biết rằng có 1 sản phẩm loại A trong 3 sản phẩm lấy ra,
tính xác suất sản phẩm loại A này là của hộp thứ nhất.
Trang 54
BIẾN CỐ – XÁC SUẤT

Bài 26. Ba công nhân cùng sản xuất ra một loại sản phẩm. Ngưởi thứ nhất sản xuất 25 sản
phẩm, người thứ hai sản xuất 35 sản phẩm và người thứ ba sản xuất 40 sản phẩm. Đối với mỗi

24
sản phẩm được sản xuất, xác suất người thứ nhất, người thứ hai làm ra chính phẩm là 0,8, còn

20
người thứ ba là 0,85. Chọn ngẫu nhiên một sản phẩm trong số các sản phẩm được sản xuất thì


được phế phẩm, khả năng cao nhất phế phẩm này do công nhân nào sản xuất?

bộ
Bài 27. Một đề thi trắc nghiệm gồm 100 câu hỏi, mỗi câu hỏi có 4 phương án trả lời trong đó

i
nộ
chỉ có 1 phương án trả lời đúng. Mỗi câu trả lời đúng thí sinh sẽ được 0,1 điểm. Thí sinh A đi

nh
thi nhưng không học bài, thí sinh A chọn trả lời ngẫu nhiên cho tất cả các câu hỏi trong đề thi.


Tính xác suất thí sinh A làm bài được từ 5 điểm trở lên.

u

Bài 28. Giải thích tại sao biến cố "Tung 4 lần một con xúc sắc cân đối, có ít nhất 1 lần xuất
hiện mặt 6 chấm" có khả năng xảy ra cao hơn biến cố "Tung 24 lần một cặp xúc sắc cân đối,

có ít nhất 1 lần xuất hiện cặp 6 chấm".


Bài 29. Hai người cùng bắn độc lập, mỗi người 10 viên đạn vào một mục tiêu cố định. Ở mỗi

.H

lần bắn, xác suất người thứ nhất bắn trúng mục tiêu là 0,4 và xác suất người thứ hai bắn trúng
TS

mục tiêu là 0,35. Tính xác suất có ít nhất một người bắn trúng mục tiêu ít nhất 5 viên.
Bài 30. Một vận động viên bắn súng tập bắn vào một mục tiêu cố định trong phòng tập. Biết
Trang 55
BIẾN CỐ – XÁC SUẤT

rằng xác suất để vận động viên này bắn trúng mục tiêu ở mỗi lần bắn là 0,6. Người này phải
bắn tối thiểu bao nhiêu lần để xác suất có ít nhất một lần bắn trúng mục tiêu là lớn hơn 90%.

24
20

i bộ
nộ
nh

u




.H
TS

Trang 56
Chương
3

24
20

bộ
BIẾN NGẪU NHIÊN

i
nộ
nh
Đừng lo lắng về khó khăn của bạn trong toán học, tôi đảm bảo với bạn rằng những khó
khăn toán học của tôi còn gấp bội – Albert Einstein


u
3.1

Biến ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.1.1 Định nghĩa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

3.1.2 Phân loại biến ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . . 60


3.2 Các quy luật phân phối xác suất . . . . . . . . . . . . . . . . . . . . . . . . . 61

.H

3.2.1 Bảng phân phối xác suất . . . . . . . . . . . . . . . . . . . . . . . . . 61


TS

3.2.2 Hàm phân phối xác suất . . . . . . . . . . . . . . . . . . . . . . . . . 64


3.2.3 Hàm mật độ xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
57
BIẾN NGẪU NHIÊN

3.3 Các tham số đặc trưng của biến ngẫu nhiên . . . . . . . . . . . . . . . . . . . 72


3.3.1 Kỳ vọng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

24
3.3.2 Phương sai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

20
3.3.3 Trung vị . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82


bộ
3.3.4 Mode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
3.3.5 Giá trị tới hạn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

i
nộ
3.4 Các luật phân phối xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

nh
3.4.1 Phân phối nhị thức . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88


3.4.2 Phân phối siêu bội . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

u
3.4.3
3.4.4

Phân phối Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
Phân phối mũ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

3.4.5 Phân phối chuẩn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98


3.4.6 Phân phối Chi bình phương . . . . . . . . . . . . . . . . . . . . . . . 104

.H

3.4.7 Phân phối Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105


TS

3.4.8 Phân phối Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107


3.5 Mối quan hệ giữa các phân phối xác suất . . . . . . . . . . . . . . . . . . . . . 108
Trang 58
BIẾN NGẪU NHIÊN

3.6 Bài tập tự luận . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

24
20
Mục tiêu: Sau khi học xong chương này, sinh viên có khả năng giải quyết các vấn đề sau:


1) Hiểu và mô tả khái niệm biến ngẫu nhiên rời rạc và liên tục.

bộ
2) Hiểu và tính toán được các tham số đặc trưng của biến ngẫu nhiên.

i
nộ
3) Hiểu các quy luật phân phối xác suất của từng loại biến ngẫu nhiên.

nh

4) Tính xác suất từ hàm khối lượng xác suất và hàm mật độ xác suất.

u
5) Hiểu và vận dụng được mối liên hệ giữa các loại biến ngẫu nhiên.


3.1 Biến ngẫu nhiên

3.1.1 Định nghĩa



.H

Định nghĩa 3.1. Biến ngẫu nhiên (BNN) là một biến mà giá trị của nó được xác định bởi kết
TS

quả của một phép thử ngẫu nhiên hay một sự kiện không thể dự đoán trước được. Ta thường
dùng các kí hiệu X, Y, Z, . . . để biểu thị cho BNN.
Trang 59
BIẾN NGẪU NHIÊN

Ví dụ 3.1. Tung một con xúc sắc cân đối. Gọi X là số chấm xuất hiện ở mặt trên của con xúc
sắc. Ta thấy rằng X là BNN vì trong các kết quả của phép thử, X chỉ có thể nhận các giá trị

24
sau: 1, 2, 3, 4, 5, 6.

20
Ví dụ 3.2. Một xạ thủ bắn 1 viên đạn vào một tấm bia có đường kính 20 cm. Gọi Y là khoảng


bộ
cách từ tâm đến vị trí viên đạn trên tấm bia. Ta cũng dễ thấy rằng Y là BNN.

i
nộ
Chú ý 3.1. Mỗi giá trị của BNN có một xác suất tương ứng, và việc xác định xác suất này là
một phần quan trọng của mô tả biến ngẫu nhiên, kí hiệu P (X = x) = p.

nh

3.1.2 Phân loại biến ngẫu nhiên

u
◆ Biến ngẫu nhiên được gọi là rời rạc, nếu các giá trị của BNN có thể lập thành một tập hữu
hạn hoặc vô hạn đếm được. Lư

Ví dụ 3.3. Trong một lớp 40 sinh viên, trong đó có 30 nam và 10 nữ. Chọn ngẫu nhiên 3 sinh
viên để lập thành ban cán sự lớp. Gọi X là số sinh viên nữ được chọn. X là BNN rời rạc với

.H

các giá trị có thể nhận được hữu hạn là: 0, 1, 2, 3.


TS

◆ Biến ngẫu nhiên được gọi là liên tục, nếu các giá trị của BNN có thể lấp đầy một khoảng
hay nhiều khoảng trên trục số thực.
Trang 60
BIẾN NGẪU NHIÊN

Ví dụ 3.4. Một xạ thủ bắn 1 viên đạn vào một tấm bia có đường kính 20 cm. Gọi Y là khoảng
cách từ tâm đến vị trí viên đạn trên tấm bia. Ta cũng dễ thấy rằng Y là BNN liên tục vì không

24
thể liệt kê tất cả các giá trị của nó, mà ta chỉ có thể nói rằng giá trị của nó nằm trong khoảng

20
(0; 20) trong trường hợp xạ thủ không bắn trượt tấm bia trên.


bộ
3.2 Các quy luật phân phối xác suất

i
nộ
◆ Quy luật phân phối xác suất là hình thức biểu diễn mối quan hệ giữa các giá trị có thể có của

nh
BNN và xác suất tương ứng để BNN nhận các giá trị đó.


◆ Một số phương pháp mô tả quy luật phân phối xác suất của BNN:

u

1) Bảng phân phối xác suất (áp dụng cho biến ngẫu nhiên rời rạc).

2) Hàm phân phối xác suất (áp dụng cho cả BNN rời rạc và BNN liên tục).

3) Hàm mật độ xác suất (áp dụng cho biến ngẫu nhiên liên tục)

.H

3.2.1 Bảng phân phối xác suất


TS

Xét BNN rời rạc X nhận các giá trị có thể là x1 , x2 , . . . , xn (n ≥ 2) với xác suất tương ứng
pi = P (X = xi ). Bảng phân phối xác suất của BNN rời rạc X có dạng như sau:
Trang 61
BIẾN NGẪU NHIÊN

X x1 x2 . . . xi . . . xn

24
P p1 p2 . . . pi . . . pn

20

Trong đó, 0 < pi < 1, ∀i và p1 + p2 + . . . + pn = 1.

bộ
Ví dụ 3.5. Tung một con xúc sắc cân đối. Gọi X là số chấm xuất hiện ở mặt trên của con xúc

i
nộ
sắc. Ta thấy X chỉ có thể nhận các giá trị sau: 1, 2, 3, 4, 5, 6.

nh

Bảng phân phối xác suất của BNN X như sau:

u


X 1 2 3 4 5 6

1 1 1 1 1 1
P

6 6 6 6 6 6
.H
TS

Ví dụ 3.6. Một hộp có 10 viên bi, trong đó có 6 viên bi đỏ và 4 viên bi trắng. Lấy ngẫu nhiên
2 viên bi từ hộp. Lập bảng phân phối xác suất của số viên bi đỏ lấy được?
Trang 62
BIẾN NGẪU NHIÊN

Giải. Gọi X là số viên bi đỏ lấy được. X chỉ có thể nhận các giá trị sau: 0, 1, 2. Ta có

24
C60 C42 2
P (X = 0) = = ;

20
C102 15
C61 C41 8


P (X = 1) = = ;

bộ
C102 15
C 2C 0 1

i
P (X = 2) = 6 2 4 = .

nộ
C10 3

nh

Bảng phân phối xác suất của BNN X như sau:

u
LưX 0 1 2

2 8 1

P
15 15 3

.H

Ví dụ 3.7. Một xạ thủ có 3 viên đạn được yêu cầu bắn lần lượt từng viên cho đến khi trúng
TS

mục tiêu hoặc hết cả 3 viên thì thôi. Tìm bảng phân phối xác suất của số đạn đã bắn, biết rằng
xác suất bắn trúng đích của xạ thủ ở mỗi lần bắn là 0,85
Trang 63
BIẾN NGẪU NHIÊN

Giải. Gọi X là số viên đạn đã bắn. X chỉ có thể nhận các giá trị sau: 1, 2, 3. Ta có

24
P (X = 1) = 0, 85;

20
P (X = 2) = (1 − 0, 85) × 0, 85 = 0, 1275;


P (X = 3) = 1 − 0, 85 − 0, 1275 = 0, 0225.

i bộ
Bảng phân phối xác suất của BNN X như sau:

nộ
X 1 2 3

nh

P 0,85 0,1275 0,0225

u

3.2.2 Hàm phân phối xác suất –
Định nghĩa 3.2. Hàm phân phối xác suất của BNN X, ký hiệu là F (x), là xác suất để BNN X

nhận giá trị nhỏ hơn hoặc bằng x, với x là giá trị bất kỳ.

.H

F (x) = P (X ≤ x), ∀x.


TS

Chú ý 3.2. ◗ Từ định nghĩa, ta thấy rằng hàm phân phối xác suất phản ánh mức tập trung xác
suất từ số thực x bất kỳ về bên trái nó.
Trang 64
BIẾN NGẪU NHIÊN

◗ Trong trường hợp X là BNN rời rạc thì hàm phân phối xác suất còn được gọi làm hàm phân
phối tích luỹ.

24
20
Tính chất 3.1. Hàm phân phối xác suất F (x) có tính chất sau:


1) Hàm không giảm;

i bộ
2) Liên tục bên phải và có giới hạn tại mọi điểm;

nộ
nh
3) F (−∞) = lim P (X < x) = 0 và F (+∞) = lim P (X < x) = 1;
x→−∞ x→+∞


4) P (a < X ≤ b) = F (b) − F (a) với mọi a, b ∈ R, a < b.

u

Chú ý 3.3. ◗ Nếu X là BNN liên tục thì P (X = a) = 0 và

P (a < X < b) = P (a ≤ X < b) = P (a ≤ X ≤ b) = P (a < X ≤ b) = F (b) − F (a).



.H

◗ BNN rời rạc có tập giá trị là {x1 , . . . , xn }, thì ta có hàm phân phối xác suất
TS

X X
F (x) = P (X ≤ x) = P (X = xi ) = p(xi )
xi ≤x xi ≤x

Trang 65
BIẾN NGẪU NHIÊN

hay 
0 nếu x < x1


24






p1 nếu x1 ≤ x < x2

20








F (x) = p1 + p2


nếu x2 ≤ x < x3

bộ




.........



i

nộ



1 nếu xn ≤ x.

nh
Ví dụ 3.8. Túi hạt giống có 13 hạt trong đó có 10 hạt giống tốt. Lấy ngẫu nhiên từ túi ra 4 hạt


giống đem kiểm nghiệm. Gọi X là số hạt giống tốt có trong 4 hạt đã lấy ra. Lập bảng phân

u

phối xác suất của X và hàm phân phối xác suất của X.

Giải. Ta thấy X chỉ có thể nhận các giá trị sau: 1; 2; 3; 4.

1
C10 .C33 10 2
C10 .C32 135
P (X = 1) = = ; P (X = 2) = = ;

C134 715 C134 715


.H

3
C10 .C31 360 4
C10 .C30 210
P (X = 3) = = ; P (X = 4) = = .
TS

C134 715 C134 715


Bảng phân phối xác suất của BNN X:
Trang 66
BIẾN NGẪU NHIÊN

X 1 2 3 4
10 135 360 210

24
P
715 715 715 715

20
Hàm phân phối xác suất của X là:


bộ

0 khi x < 1,




i

nộ

10

khi 1 ≤ x < 2,





 715

nh


F (x) = 145
715 khi 2 ≤ x < 3,






505

khi 3 ≤ x < 4,



715

u






1 khi 4 ≤ x.
– 

3.2.3 Hàm mật độ xác suất


Định nghĩa 3.3. Hàm f (x) được gọi là hàm mật độ xác suất của BNN liên tục X nếu:
.H

i) f (x) ≥ 0, ∀x;
TS

Z +∞
ii) f (x)dx = 1;
−∞

Trang 67
BIẾN NGẪU NHIÊN

Z b
iii) P (a ≤ X ≤ b) = f (x)dx.
a

24
Nếu hàm phân phối xác suất F (x) khả vi thì f (x) được xác định như sau:

20
f (x) = F ′ (x).


bộ
Từ định nghĩa trên, ta có
Z x

i
nộ
F (x) = f (t)dt.
−∞

nh
Ví dụ 3.9. Cho X là BNN có hàm mật độ xác suất như sau:



kx3 nếu 0 ≤ x ≤ 1


u
f (x) = 
Lư 0

 còn lại

1) Tìm k để f (x) là hàm mật độ xác suất của BNN X.

2) Tìm hàm phân phối xác suất F (x).



.H

Giải. 1) f (x) là hàm mật độ xác suất của BNN X khi


TS

Z +∞ Z 1
f (x)dx = 1 ⇐⇒ k x3 dx = 1 ⇐⇒ k = 4.
−∞ 0

Trang 68
BIẾN NGẪU NHIÊN

2) Ta chia bài toán này làm 3 trường hợp:


✳ TH1: Nếu x < 0 thì

24
Z x
F (x) = f (t)dt = 0.

20
−∞

✳ TH2: Nếu x ∈ [0, 1] thì


bộ
Z x Z 0 Z x Z x
F (x) = f (t)dt = f (t)dt + f (t)dt = 4t3 dt = x4 .

i
−∞ −∞ 0 0

nộ
✳ TH3: Nếu x > 1 thì

nh
Z x Z 0 Z 1 Z x


F (x) = f (t)dt = f (t)dt + f (t)dt + f (t)dt
−∞ −∞ 0 1

u
Z 1
4t3 dt = 1.

=
0

Hàm phân phối xác suất của BNN X là


0 nếu x < 0,





.H




F (x) = x4 nếu 0 ≤ x ≤ 1,
TS





1 nếu x > 1.

Trang 69
BIẾN NGẪU NHIÊN

Chú ý 3.4. Nếu BNN X có hàm mật độ xác suất


24
nếu x ∈

0 / [a; b],


f (x) = 

20
ϕ(x)

 nếu x ∈ [a; b],


bộ
thì

i
nộ
0 nếu x < a,







Z x

nh
F (x) = ϕ(t)dt nếu a ≤ x ≤ b,

 a





1 nếu x > b.

u

Ví dụ 3.10. Cho a > 0 và X là BNN có hàm mật độ xác suất như sau:

−π π 
 
nếu x ∈

0 / ; ,



f (x) =   2 2
−π π 
nếu x ∈

a cos x ; .


.H

2 2
1) Tìm a để f (x) thỏa mãn các điều kiện của một hàm mật độ xác suất của BNN.
TS

2) Tính P (0, 25π < X < π).


Trang 70
BIẾN NGẪU NHIÊN

Giải. 1) f (x) là hàm mật độ xác suất của BNN X khi


π
Z +∞ Z
2 1
f (x)dx = 1 ⇐⇒ a cos xdx = 1 ⇐⇒ a =

24
−π
−∞ 2 2

20
2) Ta có


−π

0

bộ
nếu x < ,



2



−π π

Z x

i
F (x) =  π a cos tdt nếu ≤x≤ ,

nộ

 −2 2 2

 π

nh

1 nếu x > .


2


−π

0 nếu x < ,


u



 2
−π

1

π
=  (1 + sin x) nếu ≤x≤ ,
 2 2 2

π



1 nếu x > .



2
Khi đó, áp dụng tính chất của hàm phân phối xác suất dành cho BNN liên tục, ta được

.H

1
P (0, 25π < X < π) = F (π) − F (0, 25π) = 1 − (1 + sin(0, 25π))
TS

√ 2
1 2
= − .
2 4
Trang 71
BIẾN NGẪU NHIÊN

Chú ý 3.5. Ngoài ra, nếu đã biết hàm mật độ xác suất của BNN X liên tục, ta có thể sử dụng
tính chất

24
Z b
P (a ≤ X ≤ b) =

20
f (x)dx
a


để tính P (0, 25π < X < π). Khi đó, ta có

bộ
π

1 2

i
Z π Z

nộ
2
P (0, 25π < X < π) = f (x)dx = a cos xdx = − .
0,25π 0,25π 2 4

nh

3.3 Các tham số đặc trưng của biến ngẫu nhiên

u

Như đã biết, quy luật phân phối xác suất cho ta biết đầy đủ thông tin về BNN, nhưng trong thực

tế ta rất khó xác định được nó. Từ đó dẫn đến việc cần xác định các đặc trưng quan trọng của

BNN như: Kỳ vọng, phương sai, trung vị, mốt, giá trị tới hạn, . . ..

.H

3.3.1 Kỳ vọng
TS

Định nghĩa 3.4. Kỳ vọng của BNN X, được ký hiệu là E(X), là một số được xác định như
sau:
Trang 72
BIẾN NGẪU NHIÊN

1) Nếu X là BNN rời rạc có bảng phân phối xác suất như trên thì
n
X
E(X) = xi p i .

24
i=1

20
2) Nếu X là BNN liên tục có hàm mật độ xác suất là f (x) thì


Z +∞

bộ
E(X) = xf (x)dx.
−∞

i
nộ
Tính chất 3.2. 1) E(C) = C, với C là hằng số;

nh
2) E(CX) = CE(X);


3) E(X + Y ) = E(X) + E(Y );

u

4) Nếu X, Y độc lập thì E(XY ) = E(X)E(Y );

5) Cho Y = g(X). Nếu X là BNN rời rạc có bảng phân phối xác suất như trên thì
n
X

E(Y ) = g(xi )pi ;


.H

i=1

Nếu X là BNN liên tục có hàm mật độ xác suất là f (x) thì
TS

Z +∞
E(Y ) = g(x)f (x)dx.
−∞

Trang 73
BIẾN NGẪU NHIÊN

◗ Kỳ vọng của một BNN chính là trị trung bình của BNN đó về mặt xác suất. Trong thực tế,
nếu quan sát các giá trị của BNN X nhiều lần và lấy trung bình cộng của các giá trị thu được,

24
thì khi số quan sát càng lớn - số trung bình đó càng tiến gần tới E(X), nghĩa là E(X) ≈ X khi

20
n đủ lớn.


bộ
Ví dụ 3.11. Cho BNN X có bảng phân phối xác suất sau:

i
nộ
X 1 2 3 4 5

nh
P 0,5 0,1 0,2 0,1 0,1


u
Tính E(X), E(X 2 ) và E(2X − 3).


Giải. Ta có

E(X) = 1 × 0, 5 + 2 × 0, 1 + 3 × 0, 2 + 4 × 0, 1 + 5 × 0, 1 = 2, 2;

.H

E(X 2 ) = 12 × 0, 5 + 22 × 0, 1 + 32 × 0, 2 + 42 × 0, 1 + 52 × 0, 1 = 6, 8
TS

E(2X − 3) = 2E(X) − 3 = 1, 4.

Trang 74
BIẾN NGẪU NHIÊN

Ví dụ 3.12. Cho BNN liên tục X có hàm mật độ xác suất như sau:
3

(4x − x2 ) nếu x ∈ [0; 4],

24



f (x) =  32

20
0 nếu x ∈/ [0; 4].


Tính E(X), E(X 2 ) và E(3X + 10).

bộ
Giải. Ta có

i
nộ
Z −∞
3 
Z 4
x 4x − x2 dx = 2;

E(X) = xf (x)dx =

nh
−∞ 0 32
Z −∞ Z 4
3 2 24
E(X 2 ) = x2 f (x)dx = x 4x − x2 dx = ;



−∞ 0 32 5

u
E(3X + 10) = 3E(X) + 10 = 16.

Ví dụ 3.13. Một công ty bảo hiểm, thống kê rằng một người Châu Âu 25 tuổi ở một khu vực A

sẽ sống thêm trên một năm với xác suất là 0,992; còn xác suất để người đó chết trong vòng một
năm là 0,008. Công ty đưa ra một chương trình bảo hiểm như sau: một người mua bảo hiểm

.H

sinh mạng cho 1 năm với giá là 100$, nếu chết thì công ty bảo hiểm chi trả là 10000$. Hỏi lợi
TS

nhuận trung bình của công ty bảo hiểm nhận được là bao nhiêu, biết rằng chi phí cho một hợp
đồng bảo hiểm loại này là 5$?
Trang 75
BIẾN NGẪU NHIÊN

Giải. Gọi X là lợi nhuận ($) công ty bảo hiểm nhận được khi bán bảo hiểm sinh mạng 1 năm
cho một người Châu Âu 25 tuổi ở khu vực A (tính sau 1 năm từ khi bán).

24
Bảng phân phối xác suất của BNN X:

20
X −9905 95


bộ
P 0, 008 0, 992

i
nộ
Lợi nhuận trung bình của công ty bảo hiểm nhận được là:

nh
E(X) = −9905 × 0, 008 + 95 × 0, 992 = 15$.


Ví dụ 3.14. Một lô hàng có 10 sản phẩm và 2 phế phẩm. Lấy ngẫu nhiên 4 sản phẩm từ lô hàng

u

đó, gọi X là số chính phẩm có trong 4 sản phẩm lấy ra. Tính giá trị kỳ vọng của số chính phẩm
lấy được.

Giải. Do chỉ có 2 phế phẩm, nên X chỉ có thể nhận các giá trị sau: 2, 3, 4.

Bảng phân phối xác suất của BNN X là:


.H

X 2 3 4
TS

C22 C82 C21 C83 C20 C84


P 4 4 4
C10 C10 C10
Trang 76
BIẾN NGẪU NHIÊN

Trung bình số sản phẩm tốt lấy được là:


C22 C82 C21 C83 C20 C84 10

24
E(X) = 2 × 4 + 3 × 4 + 4 × 4 = .
C10 C10 C10 3

20
Ví dụ 3.15. Một trung tâm điện máy lãi 1,3 triệu đồng khi bán được 1 ti vi, nhưng nếu ti vi bị


bộ
hỏng trước thời hạn bảo hành thì trung tâm bị lỗ trung bình 3,5 triệu đồng. Biết rằng trung tâm

i
lãi trung bình 960 ngàn đồng khi bán được 1 ti vi. Tính xác suất một ti vi được mua phải bảo

nộ
hành?

nh

Giải. Gọi X là số tiền lãi (triệu đồng) khi trung tâm bán một 1 ti vi và p là xác suất ti vi phải

u
bảo hành.
Bảng phân phối xác suất của BNN X là: Lư

X −3, 5 1, 3

P p 1−p
.H

Theo yêu cầu bài toán, ta có


TS

E(X) = −3, 5p + 1, 3(1 − p) = 0, 96 ⇐⇒ p = 0, 071.


Trang 77
BIẾN NGẪU NHIÊN

3.3.2 Phương sai

24
Định nghĩa 3.5. Phương sai của BNN X, được ký hiệu là V ar(X), là một số được xác định

20
bởi:
V ar(X) = E(X − E(X))2 = E(X 2 ) − (E(X))2 .


bộ
Nếu X là BNN rời rạc có bảng phân phối xác suất như trên thì

i
nộ
n
(xi − E(X))2 pi .
X
V ar(X) =

nh
i=1


Nếu X là BNN liên tục có hàm mật độ xác suất f (x) thì

u

Z +∞
V ar(X) = (x − E(X))2 f (x)dx.
−∞

Tính chất 3.3. 1) V ar(C) = 0, với C hằng số;

2) V ar(CX) = C 2 V ar(X);
.H
TS

3) V ar(C + X) = V ar(X);

4) Nếu X, Y là hai BNN độc lập thì V ar(X ± Y ) = V ar(X) + V ar(Y ).


Trang 78
BIẾN NGẪU NHIÊN

◗ Phương sai chính là giá trị trung bình về mặt xác suất của các bình phương sai lệch giữa giá
trị X có thể nhận được so với giá trị trung bình nó. Nó phản ánh mức độ phân tán của các giá

24
trị của BNN xung quanh giá trị trung tâm là kỳ vọng của nó.

20
◗ Trong kỹ thuật, phương sai đặc trưng cho mức độ sai số của thiết bị. Trong kinh doanh,


bộ
phương sai đặc trưng cho mức độ rủi ro của đầu tư.

i
Ví dụ 3.16. Cho BNN X có bảng phân phối xác suất như sau:

nộ
nh
X 1 2 3 4 5


P 0,5 0,1 0,2 0,1 0,1

u
Tính V ar(X) và V ar(2X − 3). Lư

Giải. Ta có

V ar(X) = E(X 2 ) − E 2 (X) = 6, 8 − 2, 22 = 1, 96.



.H


TS

V ar(2X − 3) = 22 V ar(X) + V ar(3) = 4V ar(X) = 7, 84.

Trang 79
BIẾN NGẪU NHIÊN

Ví dụ 3.17. Cho BNN liên tục X có hàm mật độ xác suất:


3

24
(4x − x2 ) nếu x ∈ [0; 4],




f (x) =  32

20
0 nếu x ∈
/ [0; 4].


bộ
Tính V ar(X) và V ar(3X − 10).

i
nộ
Giải. Ta có

nh
V ar(X) = E(X 2 ) − E 2 (X)


   2
Z 4
3 2 Z 4
3  4
x 4x − x2 dx −  x 4x − x2 dx =
 
=

u
32 0 32 5

0



36
V ar(3X − 10) = 32 V ar(X) + V ar(10) = 9V ar(X) = .
5

.H

Ví dụ 3.18. Một nông dân đang cân nhắc mua một trong hai loại giống A hoặc B để trồng cho
TS

nông trại của mình. Khả năng tạo ra thành phẩm tính theo trọng lượng (đơn vị là gram) của
giống A, B lần lượt là các BNN có các bảng phân phối xác suất như sau:
Trang 80
BIẾN NGẪU NHIÊN

XA 62 63 64 67 68 70 71

24
P 0,08 0,22 0,15 0,15 0,2 0,1 0,1

20


bộ
XB 64 65 66 67 68 69 70

i
P 0,18 0,3 0,25 0,02 0,08 0,12 0,05

nộ
nh
Biết rằng số lượng thành phẩm của hai loại giống trên là gần như nhau. Bạn hãy tư vấn cho


nông dân đó là nên chọn loại giống nào để trồng cho nông trại của anh ấy?

u
Giải. Ta có


E(XA ) = 66, 17(g), V ar(XA ) = 8, 8811 (gram2 );

E(XB ) = 66, 08(g), V ar(XB ) = 3, 2336 (gram2 ).



.H

Từ kết quả trên, ta thấy nếu sử dụng giống A thì trọng lượng trung bình cao hơn so với giống B
TS

nhưng không đáng kể, trong khi đó phương sai lại nhiều hơn gần 3 lần cho thấy sự phân tán về
trọng lượng của giống A khá cao, thiếu sự ổn định. Vì vậy nên chọn giống B để trồng.
Trang 81
BIẾN NGẪU NHIÊN

Định nghĩa 3.6. Độ lệch chuẩn của BNN, được ký hiệu là σ(X), là số

24
q
σ(X) = V ar(X).

20
Ta thấy rằng đơn vị đo của phương sai bằng bình phương đơn vị đo của BNN. Vì vậy khi cần


bộ
phải đánh giá mức độ phân tán của BNN theo đơn vị đo của nó người ta thường sử dụng độ
lệch chuẩn chứ không phải là phương sai vì độ lệch chuẩn có cùng đơn vị đo với BNN đang

i
nộ
nghiên cứu.

nh
3.3.3 Trung vị


u
Định nghĩa 3.7. Trung vị của BNN X, được ký hiệu là M edian(X) hay M ed(X), là giá trị
m của BNN X sao cho Lư

≤ m) ≥ 0, 5;

P (X


≥ m) ≥ 0, 5.

P (X



.H

Nói cách khác, trung vị là giá trị nằm ở vị trí trung tâm của BNN, và thường được dùng khi
TS

BNN có các điểm dị biệt làm ảnh hưởng đến giá trị kỳ vọng của BNN. Các điểm dị biệt là các
điểm có giá trị quá lớn hoặc quá nhỏ so với các giá trị còn lại trong tập giá trị của BNN.
Trang 82
BIẾN NGẪU NHIÊN

◗ Từ định nghĩa, ta thấy để tìm trung vị m của BNN X liên tục, ta chỉ cần giải phương trình
F (m) = 0, 5 với F (x) là hàm phân bố xác suất của X.

24
Ví dụ 3.19. Tìm M ed(X) của BNN X rời rạc với bảng phân phối xác suất như sau:

20

X 1 2 3 5 6 7 8

bộ
P 0,08 0,22 0,15 0,15 0,2 0,1 0,1

i
nộ
Giải: Ta dễ thấy rằng M ed(X) = 5, vì

nh


≤ 5) = 0, 08 + 0, 22 + 0, 15 + 0, 15 = 0, 6 > 0, 5;

P (X

u

≥ 5) = 0, 1 + 0, 1 + 0, 2 + 0, 15 = 0, 55 > 0, 5.

P (X

 –
Ví dụ 3.20. Cho X là BNN liên tục với hàm mật độ xác suất

3

 x(2 − x), 0 ≤ x ≤ 2,


.H


f (x) =  4
TS

0, còn lại.



Tìm M ed(X) ?
Trang 83
BIẾN NGẪU NHIÊN

Giải: Ta có

0 nếu x ≤ 0,

24




Z x 3

20
F (x) =  t(2 − t)dt nếu 0 < x ≤ 2,

 0 4




1 nếu x > 2.

bộ

nếu x ≤ 0,

0

i

nộ



  
3 3
x


= x2 − nếu 0 < x ≤ 2,

nh



 4 3






1 nếu x > 2.

u
x3

Khi đó, M ed(X) là nghiệm của phương trình
 

1 3 1
F (x) = ⇐⇒ x2 −  = , 0<x≤2

2 4 3 2
Suy ra M ed(X) = 1.

.H

◗ Trung vị còn có tên gọi khác là phân vị 50% của phân phối. Trong trường hợp tổng quát, phân
TS

vị là một điểm (giá trị của X) sao cho xác suất để BNN X nhận giá trị từ giá trị đó trở xuống
bằng phần trăm cho trước của tổng phân phối xác suất.
Trang 84
BIẾN NGẪU NHIÊN

Ví dụ 3.21. Nếu F (3) = 75% thì ta nói 3 là phân vị 75% của BNN X.
3.3.4 Mode

24
20
Định nghĩa 3.8. Mode của BNN X, được ký hiệu là M ode(X) hay M od(X), là giá trị mà


BNN X nhận được với xác suất lớn nhất trong phân phối xác suất của nó.

bộ
Nếu X là BNN rời rạc thì

i
nộ
M od(X) = xi ⇐⇒ pi = P (X = xi ) = max{p1 , p2 , . . . , pn }.

nh

Nếu X là BNN liên tục có hàm mật độ xác suất f (x) thì

u

M od(X) = x0 ⇐⇒ x0 = max f (x), ∀x ∈ R.

Ví dụ 3.22. Tìm M od(X) với X là BNN rời rạc có bảng phân phối xác suất như sau:

X 1 2 3 5 6 7 8
.H
TS

P 0,18 0,3 0,25 0,02 0,08 0,12 0,05

Giải. Từ bảng phân phối xác suất ta thấy max pi = 0, 25 =⇒ M od(X) = 3.


Trang 85
BIẾN NGẪU NHIÊN

Ví dụ 3.23. Cho X là BNN liên tục có hàm mật độ xác suất



12x2 (1 − x), 0 ≤ x ≤ 1,

24


f (x) = 

20
0, còn lại.


Xác định M od(X).

bộ
Giải. Ta thực hiện các bước sau:

i
nộ
i) f (x) = 12x2 (1 − x) với mọi x ∈ [0, 1].

nh
2
ii) f ′ (x) = 0 ⇐⇒ 12(2x − 3x2 ) = 0 ⇐⇒ x = 0, x = .


3

u
2
 
16
iii) f (0) = 0, f
3
=
9
2

và f (1) = 0.
16 2

   
iv) max f (x) = max f (0), f , f (2) = =⇒ M od(X) = .

3 9 3
3.3.5 Giá trị tới hạn

.H

Định nghĩa 3.9. Giá trị tới hạn (critical value) a% của một phân phối xác suất là giá trị mà chỉ
TS

có a% xác suất nằm từ nó trở lên (giá trị tới hạn bên phải) hoặc từ nó trở xuống (giá trị tới bạn
bên trái).
Trang 86
BIẾN NGẪU NHIÊN

Giá trị tới hạn bên trái mức α chính là giá trị tới hạn bên phải mức 1 − α. Giá trị tới hạn bên
phải mức α của BNN X liên tục, ký hiệu là xα , thoả mãn

24
20
F (xα ) = P (X ≥ xα ) = α.


bộ
Ví dụ 3.24. Tìm giá trị tới hạn bên phải mức α = 5% của BNN X có hàm mật độ xác suất như

i
sau:

nộ

4x3 , 0 ≤ x ≤ 1,

nh


f (x) = 


0, còn lại.

u
Giải. Từ định nghĩa, ta có


Z +∞
P (X ≥ xα ) = α ⇐⇒ f (x)dx = 0, 05 ⇐⇒ xα ≈ 0, 9873.


Vậy ta có giá trị tới hạn bên phải mức α = 5% của BNN X là 0,9873.
.H

Cách khác, ta sử dụng hàm phân phối xác suất F (x) và giải phương trình
TS

F (xα ) = 1 − P (X ≥ xα ) = 1 − 0, 05 = 0, 95
Trang 87
BIẾN NGẪU NHIÊN

trong đó 
0 khi x < 0,


24





F (x) = x4 khi 0 ≤ x ≤ 1,

20




1 khi x > 1.

bộ
Khi đó, ta được

i
F (xα ) = 0, 95 ⇐⇒ x4α = 0, 95 =⇒ xα = 0, 9873.

nộ
nh
3.4 Các luật phân phối xác suất


3.4.1 Phân phối nhị thức

u

Thực hiện n phép thử độc lập, ở mỗi phép thử ta quan tâm đến việc biến cố A có xảy ra hay

không, giả sử P (A) = p là một hằng số. Gọi X là số phép thử mà biến cố A xảy ra trong n

phép thử đã thực hiện, khi đó X là BNN rời rạc tuân theo luật phân phối nhị thức với tham số

.H

n và p, được ký hiệu là X ∼ B(n; p). Tập giá trị của X là X(Ω) = {0, . . . , n} và công thức
TS

tính xác suất của X như sau:

P (X = k) = Cnk × pk × (1 − p)n−k , k ∈ X(Ω).


Trang 88
BIẾN NGẪU NHIÊN

Tính chất 3.4. Nếu X ∼ B(n, p) thì

24
i) E(X) = np ;

20
ii) V ar(X) = np(1 − p);


bộ
iii) (n + 1)p − 1 ≤ M od(X) ≤ (n + 1)p.

i
nộ
Ví dụ 3.25. Một máy sản xuất sản phẩm tự động với xác suất làm ra phế phẩm ở mỗi lần sản

nh
xuất là 0,02. Biết rằng máy trên sản xuất các sản phẩm độc lập nhau, gọi X là số phế phẩm có


trọng 100 sản phẩm do máy trên sản xuất ra. Tính xác suất

u
1) Có 10 phế phẩm trong số đó; Lư

2) Có từ 5 đến 11 phế phẩm trong số đó.


Giải. Ta thấy X ∼ B(100; 0, 02). Khi đó,


.H

1) Xác suất có 10 phế phẩm trong số đó là:


TS

10
P (X = 10) = C100 × (0, 02)10 × (0, 98)90 ≈ 2, 88.10−5 .
Trang 89
BIẾN NGẪU NHIÊN

2) Xác suất có từ 5 đến 11 phế phẩm trong số đó là:


11

24
i
× (0, 02)i × (0, 98)100−i ≈ 0, 0508.
X
P (5 ≤ X ≤ 11) = C100

20
i=5

Ví dụ 3.26. Tỷ lệ mắc một loại bệnh A ở một vùng là 10%. Trong đợt khám bệnh cho vùng đó


bộ
người ta đã khám ngẫu nhiên 100 người. Tìm

i
nộ
1) Số người bệnh trung bình và phương sai tương ứng.

nh
2) Số người bị bệnh A nhiều khả năng nhất là bao nhiêu? Tính xác suất tương ứng.


u
Giải. Gọi X là số người bệnh loại A có trong 100 người được khám. Ta có X ∼ B(100; 0, 1).

1) Số người bệnh trung bình E(X) = np = 10 và phương sai V ar(X) = np(1 − p) = 9.

2) Ta có

(n + 1)p − 1 ≤ M od(X) ≤ (n + 1)p ⇐⇒ 9, 1 ≤ M od(X) ≤ 10, 1



.H

=⇒ M od(X) = 10 và xác suất tương ứng là:


TS

10
P (X = 10) = C100 × (0, 1)10 × (0, 9)90 ≈ 0, 1319.
Trang 90
BIẾN NGẪU NHIÊN

Ví dụ 3.27. Đề thi trắc nghiệm một môn học có 25 câu hỏi, mỗi câu có 4 phương án và chỉ có
1 phương án đúng. Mỗi câu trả lời đúng thì được 4 điểm và nếu sai thì bị trừ 0,5 điểm. Một sinh

24
viên làm bài chắc chắn đúng được 10 câu và 15 câu còn lại chọn ngẫu nhiên 1 trong 4 phương

20
án ở mỗi câu hỏi. Tính số điểm mà sinh viên đó kỳ vọng sẽ đạt được?


bộ
Giải. Gọi X là số câu trả lời đúng của sinh viên, Y là số điểm sinh viên đạt được và Z là

i
số câu trả lời đúng của sinh viên trong số 15 câu mà sinh viên đó trả lời ngẫu nhiên. Ta có

nộ
X − 10 = Z ∼ B(15; 0, 25).

nh
Ta có


u
Y = 4X − 0, 5(25 − X) ⇐⇒ Y = 4, 5X − 12, 5
Lư = 4, 5(Z + 10) − 12, 5 = 4, 5Z + 32, 5.

Vậy

.H

E(Y ) = 4, 5E(Z) + 32, 5 = 4, 5 × 15 × 0, 25 + 32, 5 = 49, 375.


TS

Ví dụ 3.28. Một thùng có 10 hộp đựng các bi với màu sắc khác nhau, mỗi hộp chứa 20 viên bi.
Trong số đó có 3 hộp loại A: mỗi hộp có 12 viên bi đỏ; và 7 hộp loại B: mỗi hộp có 8 viên bi
Trang 91
BIẾN NGẪU NHIÊN

đỏ. Chọn ngẫu nhiên 1 hộp từ thùng và từ hộp đó lấy lần lượt ra 5 viên bi có hoàn lại. Tính xác
suất chọn được 3 viên bi đỏ?

24
20
Giải. Gọi X1 , X2 lần lượt là số viên bi đỏ lấy được từ hộp loại A, loại B. Do lấy ngẫu nhiên có


hoàn lại, nên xác suất chọn được 1 bi đỏ ở hộp loại A, loại B lần lượt là

bộ
1
C12 C81
pA = 1 = 0, 6; pB = 1 = 0, 4.

i
nộ
C20 C20

nh
Nếu chọn được hộp loại A thì ta có X1 ∼ B(5; 0, 6) và


P (X1 = 3) = C53 × 0, 63 × 0, 42 = 0, 3456.

u

Nếu chọn được hộp loại B thì ta có X2 ∼ B(5; 0, 4) và

P (X2 = 3) = C53 × 0, 43 × 0, 62 = 0, 2304.



.H

Áp dụng công thức XSĐĐ, ta được xác suất chọn được 3 bi đỏ là:
TS

p = 0, 3 × P (X1 = 3) + 0, 7 × P (X2 = 3) = 0, 265.


Trang 92
BIẾN NGẪU NHIÊN

3.4.2 Phân phối siêu bội

24
Cho tập hợp có N phần tử trong đó có NA phần tử có tính chất A. Lấy ngẫu nhiên n phần tử ra

20
từ N phần tử ban đầu, gọi X là số phần tử có tính chất A có trong n phần tử được lấy ra. Khi đó,
X được gọi là có phân phối siêu bội với tham số N, NA , n, được ký hiệu là X ∼ H(N, NA ; n).


bộ
Tập giá trị của X là X(Ω) = {max{0; n + NA − N }, . . . , min{n; NA }} và công thức tính xác

i
suất của X như sau:

nộ
CNk A CNn−k
−NA
P (X = k) = , k ∈ X(Ω)

nh
CNn


Tính chất 3.5. Nếu X ∼ H(N, NA , n) thì

u
i) E(X) = np với p =
NA
N
. Lư

N −n

ii) V ar(X) = np(1 − p) .


N −1

.H

Ví dụ 3.29. Trong một hộp gồm có 4 viên bi đỏ và 6 viên bi xanh. Lấy ngẫu nhiên ra 5 bi từ
TS

hộp. Gọi X là số viên bi đỏ có trong 5 viên bi đã lấy ra. Hãy

1) Lập bảng phân phối xác suất của X.


Trang 93
BIẾN NGẪU NHIÊN

2) Tính E(X) và V ar(X).

Giải. Ta có X ∼ H(10, 4; 5) và tập giá trị của X là X(Ω) = {0, 1, 2, 3, 4}.

24
20
1) Ta có
C40 C65 6 C41 C64 60


P (X = 0) = 5 = , P (X = 1) = 5 = ,

bộ
C10 252 C10 252
C42 C63 120 C43 C62 60

i
P (X = 2) = = , P (X = 3) = = ,

nộ
C105 252 C105 252
C44 C61

nh
6
P (X = 4) = 5 = .
C10 252


Bảng phân phối xác suất của X là

u
X 0Lư 1 2 3 4

6 60 120 60 6

P
252 252 252 252 252
2) Ta có

.H

NA 4
E(X) = np = n =5× = 2;
TS

N 10
N −n 4 
4  10 − 4 2
V ar(X) = np(1 − p) =5× × 1− × = .
N −1 10 10 10 − 1 3
Trang 94
BIẾN NGẪU NHIÊN

3.4.3 Phân phối Poisson

24
BNN X được gọi là có phân phối Poisson với tham số λ , được ký hiệu là X ∼ P (λ). Tập giá

20
trị của X là X(Ω) = {0, . . . , n} và công thức tính xác suất của X như sau


λk e−λ

bộ
P (X = k) = , k ∈ X(Ω).
k!

i
nộ
Tính chất 3.6. Nếu X ∼ P (λ) thì E(X) = V ar(X) = λ.

nh
Chú ý 3.6. Trong thực tế với một số giả thiết thích hợp thì các BNN đếm: số cuộc gọi đến một


tổng đài; số khách hàng đến một điểm phục vụ; số xe cộ qua một ngã tư; số tai nạn (xe cộ); số

u
các sự cố xảy ra ở một địa điểm, . . ., trong một khoảng thời gian xác định nào đó sẽ có phân
phối Poisson với tham số λ. Lư

Ví dụ 3.30. Ở một tổng đài điện thoại, các cuộc điện thoại gọi đến xuất hiện ngẫu nhiên, độc

lập với nhau với tốc độ trung bình là 2 cuộc gọi trong ba phút. Tính xác suất
.H

1) Có đúng 5 cuộc điện thoại trong vòng 6 phút;


TS

2) Không có cuộc điện thoại nào trong khoảng thời gian 90 giây.
Trang 95
BIẾN NGẪU NHIÊN

Giải. 1) Gọi X là số cuộc gọi điện thoại đến tổng đài điện thoại trên trong vòng 6 phút =⇒
X ∼ P (4). Ta có

24
5
−4 4
P (X = 5) = e = 0, 156.

20
5!


2) Gọi X là số cuộc gọi điện thoại trong vòng 90 giây =⇒ X ∼ P (1). Ta có

bộ
0
−1 1
= e−1 = 0, 3679.

i
P (X = 0) = e

nộ
0!

nh
3.4.4 Phân phối mũ


BNN X được gọi là có phân phân mũ với tham số λ > 0, được ký hiệu là X ∼ E(λ), nếu BNN

u
X có hàm mật độ xác suất có dạng:



λe−λx , nếu x ≥ 0,



f (x) = 
0, nếu x < 0.


.H

Tính chất 3.7. Nếu X ∼ E(λ), thì


TS

1
i) E(X) = ;
λ
Trang 96
BIẾN NGẪU NHIÊN

1
ii) V ar(X) = .
λ2

24
Chú ý 3.7. 1) Phân phối mũ có nhiều ứng dụng trong thực tiễn.

20

2) Nếu số lần xuất hiện của biến cố A trong một khoảng thời gian có phân phối Poisson, thì

bộ
thời gian giữa 2 lần xuất hiện biến cố A có phân phối mũ. Chẳng hạn: khoảng thời gian giữa

i
nộ
2 ca cấp cứu ở một bệnh viện, khoảng thời gian giữa 2 trận lụt hay động đất, . . .

nh
Ví dụ 3.31. Tuổi thọ (năm) của 1 một cái máy giặt là BNN có luật phân phối mũ với tuổi thọ


trung bình là 10 năm. Thời gian bảo hành của máy giặt này làm 3 năm. Tính xác suất máy giặt

u
phải bảo hành?

Giải. Gọi X là tuổi thọ của máy giặt (năm). Ta có X ∼ E(λ). Theo đề ta có

1 1
E(X) = = 10 ⇐⇒ λ = = 0, 1.
λ 10

.H

Xác suất máy giặt phải bảo hành là


TS

Z 3 Z 3
P (X ≤ 3) = f (x)dx = 0, 1e−0,1x dx ≈ 0, 2595.
−∞ 0

Trang 97
BIẾN NGẪU NHIÊN

3.4.5 Phân phối chuẩn

24
✭ BNN liên tục X nhận giá trị trong khoảng R được gọi là có phân phối chuẩn, được ký hiệu

20
là X ∼ N (µ; σ 2 ), nếu hàm mật độ xác suất của BNN X có dạng


bộ
(x − µ)2
1 −
f (x) = √ 2σ 2 .

i
e

nộ
σ 2π

nh
trong đó µ = E(X) và σ 2 = V ar(X).


Trong trường hợp µ = 0 và σ 2 = 1, ta có

u

✭ BNN liên tục X nhận giá trị trong khoảng R được gọi là có phân phối chuẩn tắc, được ký

hiệu là X ∼ N (0; 1), nếu hàm mật độ xác suất của BNN X có dạng

x2

.H

1 −
f (x) = √ e 2 .

TS

◗ Hàm f (x) trong trường hợp này còn được gọi là hàm Gauss.
Trang 98
BIẾN NGẪU NHIÊN

✭ Hàm phân phối xác suất của BNN X tuân theo phân phối chuẩn tắc có dạng:
Z z

24
P (X ≤ z) = f (x)dx
−∞

20
x2
Z z
1 −


= √ e 2 dx ≡ φ(z).
0 2π

bộ
◗ Hàm φ(z) được gọi là hàm Laplace, giá trị của hàm số này được tính ở phần Phụ lục.

i
nộ
Chú ý 3.8. Khi sử dụng hàm Laplace φ(z), ta cần chú ý

nh
1) Nếu z > 4, 42 thì φ(z) ≈ 0, 5;


u
2) φ(−z) = −φ(z), ∀z;

3) φ(−∞) = −0, 5; φ(+∞) = 0, 5;




4) Hàm φ là hàm đơn điệu tăng.


X −µ
.H

Định lý 3.4.1. Cho X ∼ N (µ; σ 2 ). Nếu ∼ N (0; 1) thì


σ
TS

   
b − µ a − µ
P (a ≤ X ≤ b) = φ − φ .
σ σ
Trang 99
BIẾN NGẪU NHIÊN

Từ tính chất của hàm φ, ta có


 
a − µ

24
P (a ≤ X) = P (a ≤ X < +∞) = 0, 5 − φ
σ

20


 
b − µ

bộ
P (X ≤ b) = P (−∞ < X ≤ b) = 0, 5 + φ .
σ

i
nộ
Ví dụ 3.32. Cho BNN X có luật phân phối chuẩn N (2; 9). Tính các xác suất sau:

nh
1) P (1 ≤ X < 2, 5);


2) P (X ≥ 3);

u
3) P (X ≤ 2). Lư

Giải. 1) Ta có µ = 2, σ = 3. Áp dụng định lý trên ta có



2, 5 − 2  
1 − 2

P (1 ≤ X < 2, 5) = φ −φ
.H

3 3
= φ(0, 17) − φ(−0, 33)
TS

= 0, 0675 + 0, 1293 = 0, 1968.

Trang 100
BIẾN NGẪU NHIÊN

2) Ta có

3 − 2

24
P (X ≥ 3) = 0, 5 − φ
3

20
= 0, 5 − 0, 1293 = 0, 3707.


bộ
3) Ta có
2 − 2

i


nộ
P (X ≤ 2) = 0, 5 + φ = 0, 5.
3

nh
Ví dụ 3.33. Cho BNN X có phân phối chuẩn với kỳ vọng µ = 10 và P (10 < X < 20) = 0, 4.


Tính xác suất P (X < 10).

u

Giải. Theo đề ta có X ∼ N (10; σ 2 ). Từ đó ta được

20 − 10 
 
10 − 10 
P (10 < X < 20) = 0, 4 ⇐⇒ φ −φ = 0, 4

σ σ

10 

⇐⇒ φ = 0, 4 = φ(1, 29)
.H

σ
⇐⇒ σ ≈ 7, 75.
TS

=⇒ X ∼ N (10; 7, 752 ).
Trang 101
BIẾN NGẪU NHIÊN

Từ đó ta tính được
10 − 10 

P (X < 10) = 0, 5 + φ = 0, 5.

24
7, 75

20
Ví dụ 3.34. Lãi suất đầu tư vào công ty A là biến ngẫu nhiên có phân phối chuẩn, biết xác suất


để đạt được lãi suất trên 20%/năm là 0,2 và dưới 10%/năm là 0,1. Tính xác suất để khi đầu tư

bộ
vào công ty A được lãi suất ít nhất 14%/năm.

i
nộ
Giải. Gọi X là lãi suất (%/năm) khi đầu tư vào công ty A. Theo đề, ta có X ∼ N (µ; σ 2 ) và

nh
20 − µ 
 

0, 5 − φ = 0, 2

P (X > 20) = 0, 2
 


σ 
 
⇐⇒  
10 − µ

 P (X < 10) = 0, 1 
0, 5 + φ = 0, 1

u


σ
Lư 


 φ

20 − µ 
= 0, 3 = φ(0, 85)

σ 

⇐⇒  
10 − µ



 φ = −0, 4 = φ(−1, 29)
σ

Theo tính chất đơn điệu tăng của hàm φ, ta được


.H


TS


 µ + 0, 85σ = 20
⇐⇒ µ = 16, 03; σ = 4, 67.

 µ − 1, 29σ = 10

Trang 102
BIẾN NGẪU NHIÊN

=⇒ X ∼ N (16, 03; 4, 672 ).


Từ đó ta tính được

24
20

14 − 16, 03 
P (X ≥ 14) = 0, 5 − φ = 0, 5 + 0, 1664 = 0, 6664.


4, 67

i bộ
Định lý 3.4.2. Nếu BNN X có phân phối chuẩn với kỳ vọng µ, phương sai σ 2 và nếu Y =

nộ
aX + b, (a, b là hằng số và a ̸= 0), thì BNN Y cũng có phân phối chuẩn với kỳ vọng là aµ + b

nh
và phương sai là a2 σ 2 .


u
Ví dụ 3.35. Cho X ∼ N (2; 4) và Y = 2X − 3. Thì Y ∼ N (2 × 2 − 3; 22 × 4) = N (1; 16).


Định lý 3.4.3. Nếu các BNN X1 , . . . , Xn độc lập với nhau và nếu Xi có phân phối chuẩn với

kỳ vọng µi và phương sai σi2 , (i = 1, 2, . . . , n) thì tổng X1 + . . . + Xn cũng có phân phối chuẩn

với kỳ vọng là µ1 + . . . + µn và phương sai là σ12 + . . . + σn2 .


.H
TS

Ví dụ 3.36. Cho X ∼ N (2; 4), Y ∼ N (0; 1), X và Y độc lập với nhau. Thì X + Y ∼ N (2 +
0; 4 + 1) = N (2; 5).
Trang 103
BIẾN NGẪU NHIÊN

3.4.6 Phân phối Chi bình phương

Cho X là BNN có phân phối Chi bình phương với bậc tự do k, được ký hiệu là X ∼ χ2 (k),

24
20
nếu BNN X có hàm mật độ xác suất như sau



1
xk/2−1 e−x/2

khi x > 0,

bộ


 k/2
fk (x) = 2 Γ(k/2)

i

khi x ≤ 0,

0

nộ

nh
trong đó


Z +∞
Γ(x) = tx−1 e−t dt, x > 0.
0

u
Tính chất 3.8. Nếu X ∼ χ2 (k) thì



2 3
i) M ed(X) ≈ k 1 − ;

9k
ii) M od(X) = max{k − 2; 0};

.H

iii) E(X) = k;
TS

iv) V ar(X) = 2k.


Trang 104
BIẾN NGẪU NHIÊN

Định lý 3.4.4. Nếu BNN Xi , (i = 1, . . . , n), độc lập và Xi ∼ N (0; 1) thì


n
Xi2 ∼ χ2 (n).
X

24
X=
i=1

20
3.4.7 Phân phối Student


bộ
BNN X được gọi là có phân phối Student với k bậc tự do, được ký hiệu là X ∼ t(n), nếu BNN

i
X có hàm mật độ xác suất như sau

nộ
n + 1

n+1

nh
Γ 
x 2 −
f (x) = √ 2 1+ 2 ,


nπΓ(n/2) n

u
trong đó
Γ(x) =Lư Z +∞

0
tx−1 e−t dt, x > 0.

Tính chất 3.9. Nếu X ∼ t(n) thì


i) M ed(X) = M od(X) = 0;
.H

ii) E(X) = 0 khi n > 1;


TS

n
iii) V ar(X) = khi n > 2.
n−2
Trang 105
BIẾN NGẪU NHIÊN

Định lý 3.4.5. Nếu BNN X ∼ N (0; 1), Y ∼ χ2 (n) và X, Y độc lập thì

24
X
∼ t(n).

20
q
Y /n


bộ
Chú ý 3.9. i) Một trong những đặc điểm chính của phân phối Student là có đuôi "dày" hơn

i
nộ
so với phân phối chuẩn. Khi nói đến đuôi "dày," có nghĩa là phân phối Student có khả năng

nh
tạo ra giá trị cách xa giá trị trung bình (mean) hơn so với phân phối chuẩn trong trường


hợp mẫu nhỏ. Điều này xuất phát từ tính chất của phân phối Student, được thiết kế để xử

u
lý khi chúng ta không biết đến độ lệch chuẩn của tổng thể và khi mẫu nhỏ.


ii) Khi kích thước mẫu tăng lên, phân phối Student hội tụ về phân phối chuẩn, và đuôi của

nó trở nên ít dày hơn. Do đó, khi làm việc với kích thước mẫu lớn, ta thường chuyển từ
.H

sử dụng phân phối Student sang phân phối chuẩn trong các phân tích thống kê. Nói cách
TS

khác, khi bậc tự do n tăng lên (n ≥ 30) thì phân phối Student tiến nhanh về phân phối
chuẩn. Vì vậy, khi n ≥ 30 ta có thể dùng phân phối chuẩn xấp xỉ cho phân phối Student.
Trang 106
BIẾN NGẪU NHIÊN

3.4.8 Phân phối Fisher

24
BNN X được gọi là có phân phối Fisher với các bậc tự do tương ứng là m và n, được ký hiệu

20
là X ∼ F (m; n), nếu BNN X có hàm mật độ xác suất như sau


xm/2−1


k , nếu x > 0,

bộ


f (x) =  (mx + n)(m+n)/2

i

nếu x ≤ 0,

nộ
0,

nh
trong đó
m + n m/2 n/2


Γ( )m n Z +∞
k= 2 ; Γ(x) = tx−1 e−t dt, x > 0.

u
Γ(m/2)Γ(n/2) 0

Tính chất 3.10. Nếu X ∼ F (m; n) thì Lư



m−2

n
i) M od(X) = · , m > 2;
m n+2

n
.H

ii) E(X) = , n > 2;


n−2
TS

2n2 (m + n − 2)
iii) V ar(X) = , n > 4.
m(n − 2)2 (n − 4)
Trang 107
BIẾN NGẪU NHIÊN

Định lý 3.4.6. Nếu BNN X ∼ χ2 (n), Y ∼ χ2 (m) và X, Y độc lập thì


X/n
∼ F (m; n).

24
Y /m

20
3.5 Mối quan hệ giữa các phân phối xác suất


bộ
Định lý 3.5.1. Giả sử BNN X có phân phối siêu bội H(N, NA ; n) và n khá nhỏ so với N thì
NA

i
khi đó X sẽ xấp xỉ tuân theo luật phân phối nhị thức X ∼ B(n; p) với p = .

nộ
N
Chú ý 3.10. Thông thường, nếu N > 20n thì X ∼ H(N, NA ; n) xấp xỉ về X ∼ B(n; p).

nh

Ví dụ 3.37. Một ao cá được thả 1000 cá da trơn, trong đó có 200 con cá tra, giả sử trong quá

u
trình nuôi không xuất hiện cá chết nào. Tính xác suất bắt ngẫu nhiên 20 con từ ao thì được 5
con cá tra. Lư

Giải. Gọi X là số cá tra có trong 20 con bắt được. Theo đề, ta có X ∼ H(1000, 200; 20) và

C 5 C 15
P (X = 5) = 20020 800 = 0, 176.

.H

C1000
Do N = 1000 > 20.n = 400 =⇒ X xấp xỉ tốt theo phân phối nhị thức: X ∼ B(20; 0, 2)
TS

5
P (X = 5) = C20 × 0, 25 × 0, 815 = 0, 175

Trang 108
BIẾN NGẪU NHIÊN

Ta thấy rằng giá trị xấp xỉ 0,175 gần với giá trị thực 0,176 và sẽ còn tốt hơn nữa nếu N rất lớn
so với n.

24
20
Ví dụ 3.38. Một nhà sản xuất linh kiện điện tử cho rằng trong 20000 linh kiện sản xuất ra có
100 linh kiện bị lỗi. Tiến hành kiểm tra ngẫu nhiên 10 linh kiện điện tử. Tính xác suất có 3 linh


bộ
kiện điện tử bị lỗi trong 10 linh kiện lấy ra.

i
nộ
Giải. Gọi X là số linh kiện điện tử bị lỗi có trong 10 linh kiện được kiểm tra. Theo đề, ta có

nh
X ∼ H(20000, 100; 10). Do N = 20000 > 20n = 200, nên ta có thể xấp xỉ tốt X về phân


phối nhị thức

u
NA 100

X ∼ B(10; 0, 005), với p =
N
=
20000
= 0, 005.

Từ đó ta có

3
P (X = 3) ≈ C10 × 0, 0053 × 0, 9957 = 1, 45 × 10−5 .
.H
TS

Định lý 3.5.2. (Định lý De Moivre - Laplace) Giả sử BNN X có luật phân phối nhị thức
B(n; p), với p = P (A) là xác xuất biến cố A xuất hiện trong một phép thử của dãy n phép
Trang 109
BIẾN NGẪU NHIÊN

thử Bernoulli và 0 < p < 1 với q = 1 − p. Khi đó, ta có


 
1 n − np 

24
P (X = k) = Cnk pk q n−p ≈√ × f √ → 0, khi n → +∞,
npq npq

20

trong đó

bộ
x2
1 −

i
f (x) = √ ×e 2 .

nộ

nh
Chú ý 3.11. Với np > 5 và nq > 5, ta có công thức xấp xỉ


 
1 n − np 

u
P (X = k) ≈ √ × f √ .
Lư npq npq

Ví dụ 3.39. Trong một đợt thi tuyển công chức ở một thành phố có 1000 người dự thi, biết rằng

tỉ lệ thi không đạt của các đợt thi trước đây là 20%. Tính xác suất để có 172 người không đạt

.H

trong đợt thi này.


TS

Giải. Gọi X là số người thi không đạt trong đợt thi này. Ta thấy np = 1000 × 0, 2 = 200 > 5,
nq = 1000 × 0, 8 = 800 > 5 thỏa mãn điều kiện xấp xỉ tốt với npq = 1000 × 0, 2 × 0, 8 = 160.
Trang 110
BIẾN NGẪU NHIÊN

Khi đó, X ∼ N (200; 160) và


(−2, 21)2

24
 
1 172 − 200  1 1 −
P (X = 172) ≈ √ f √ =√ ×√ e 2 = 0, 00247.

20
160 160 160 2π


Định lý 3.5.3. Giả sử BNN X có luật phân phối nhị thức B(n; p), với p = P (A) là xác xuất

bộ
biến cố A xuất hiện trong một phép thử của dãy n phép thử Bernoulli và 0 < p < 1, q = 1 − p.

i
nộ
Khi đó, ta có  

nh
X − np
lim P  √ ≤ x = φ(x),


n→+∞ npq

u
trong đó

φ(x) = √
1 Z x −
t2
e 2 dt.

2π −∞

Chú ý 3.12. ◗ Với n khá lớn và np > 5 và nq > 5, ta có công thức xấp xỉ

.H

   
b − np  a − np 
P (a < X ≤ b) ≈ φ √ − φ √ .
TS

npq npq

◗ Thông thường, để đạt độ chính xác cao trong việc tính toán xấp xỉ, ta thường dùng công thức
Trang 111
BIẾN NGẪU NHIÊN

có sự hiệu chỉnh như sau:


   
b − np − 0, 5  a − np − 0, 5 

24
P (a < X ≤ b) = φ √ − φ √ .
npq npq

20
Ví dụ 3.40. Một dây chuyền sản xuất sản phẩm tự động với tỉ lệ sản phẩm loại A được đánh


bộ
giá là 80%, còn lại là sản phẩm loại B, mỗi kiện hàng được đóng gói gồm có 20 sản phẩm, và
một người thực hiện quy trình kiểm tra như sau: Từ mỗi kiện hàng được kiểm tra, người đó lấy

i
nộ
ngẫu nhiên ra 3 sản phẩm, nếu thấy cả 3 sản phẩm đều là loại A thì kiện hàng đó được thông

nh
qua. Cho biết người đó kiểm tra 100 kiện hàng trong rất nhiều kiện hàng giao. Tính xác suất có


trên 45 kiện hàng được thông qua.

u

Giải. Xác suất 3 sản phẩm lấy ra kiểm tra đều là loại A:

p = 0, 83 = 0, 512.

Gọi X là số kiện hàng được thông qua trong số 100 kiện hàng được kiểm tra. Ta thấy rằng X ∼

.H

B(100; 0, 512). Do np = 51, 2 > 5, nq = 48, 8 > 5 và npq = 100 × 0, 512 × 0, 488 = 24, 986
TS

nên
X ∼ N (51, 2; 24, 986).
Trang 112
BIẾN NGẪU NHIÊN

Theo yêu cầu bài toán, ta có


45 − 51, 2 

P (X > 45) ≈ 0, 5 − φ √

24
= 0, 8926.
24, 986

20
Trong trường hợp tính chính xác theo phân phối nhị thức là


100

bộ
k
× 0, 512k × 0, 488100−k = 0, 8729.
X
P (X > 45) = C100
k=46

i
nộ
Trong trường hợp giá trị n càng lớn thỏa mãn np, nq > 5 thì xấp xỉ sẽ càng chính xác.

nh
Định lý 3.5.4. (Bất đẳng thức Markov) Nếu BNN X chỉ nhận các giá trị không âm thì với


mọi ϵ > 0, ta có

u
E(X)

P (X ≥ ϵ) ≤
ϵ
.

Định lý 3.5.5. (Bất đẳng thức Tchebyshev) Áp dụng bất đẳng thức Markov nêu trên. Xét BNN

X có E(X) = µ và V ar(X) = σ 2 , thì với mọi ϵ > 0 ta có


V ar(X)
.H

P (|X − µ| < ϵ) ≤ 1 −
ϵ2
TS

Ví dụ 3.41. Thu nhập bình quân đầu người hàng năm của một vùng dân cư năm 2020 là 3700$
và độ lệch chuẩn là 250$. Sử dụng bất đẳng thức Tchebyshev xác định khoảng thu nhập bình
Trang 113
BIẾN NGẪU NHIÊN

quân hằng năm của cư dân vùng này quanh giá trị trung bình của nó, mà có ít nhất 95% cư dân
vùng này thuộc về.

24
20
Giải. Gọi X là thu nhập bình quân đầu người hàng năm ở dân cư trên. Ta thấy E(X) = 3700,


V ar(X) = 2502 . Áp dụng bất đẳng thức Tchebyshev, ta được

i bộ
nộ
V ar(X) 2502
P (|X − µ| < ϵ) ≥ 1 − ⇐⇒ P (|X − 3700| < ϵ) ≥ 1 − 2 .
ϵ2 ϵ

nh

Theo đề, ta có

u
1−

2502
= 0, 95 =⇒ ϵ ≈ 1118.

ϵ2

Như vậy, khoảng thu nhập bình quân hàng năm thỏa mãn yêu cầu bài toán là
.H
TS

X ∈ (3700 − ϵ; 3700 + ϵ) = (2582; 4818)$.

Trang 114
BIẾN NGẪU NHIÊN

3.6 Bài tập tự luận

24
Bài 31. Cho BNN X có hàm mật độ xác suất

20

0 khi x < 0,






bộ

f (x) = kx(2 − x) khi 0 ≤ x ≤ 2,

i

nộ

0 khi x > 2.

nh
1) Xác định k và hàm phân phối xác suất F (x) của X.


2) Tìm kỳ vọng và phương sai của X.

u

Bài 32. Cho BNN X có hàm mật độ xác suất


mx2 (3 − x) khi x ∈ [0; 3],





f (x) = 

0

khi x ∈
/ [0; 3].
.H


TS

1) Xác định m và hàm phân phối xác suất F (x) của X.

2) Tính P (|X − EX|) < 1.


Trang 115
BIẾN NGẪU NHIÊN

Bài 33. Cho BNN X có hàm mật độ xác suất



ax2 khi x ∈ (0; 1),

+ bx

24


f (x) = 

20
0

 khi x ∈
/ (0; 1).


1) Xác định a, b.

bộ
2) Tìm M od(X) và V ar(X).

i
nộ
Bài 34. Cho BNN X có hàm mật độ xác suất

nh

ke−3x ,


khi x ≥ 0,



f (x) = 

u
0, khi x < 0.

1) Tìm k và M ed(X). Lư

2) Tính E(X) và P (X < 3).


Bài 35. Tuổi thọ (năm) của một loại bóng đèn là BNN có hàm mật độ xác suất
.H


TS

0 khi x < 1,



f (x) =  k

 khi x ≥ 1.
x4

Trang 116
BIẾN NGẪU NHIÊN

1) Hãy xác định k và tính tỉ lệ bóng đèn có tuổi thọ không quá 30 tháng.

24
2) Tính tuổi thọ trung bình và phương sai tuổi thọ của loại bóng đèn trên. Nếu muốn tỉ lệ bóng

20
phải bảo hành là 10% thì phải qui định thời gian bảo hành là bao nhiêu năm?


Bài 36. Cho BNN liên tục X có hàm mật độ xác suất là

bộ

i
− x) khi x ∈ [0; 2],

kx(2

nộ

f (x) = 
0 khi x ∈
/ [0; 2].

nh


1) Xác định k và hàm phân phối xác suất F (x) của X.

u
2) Tính E(X 2 ).


Bài 37. Thời gian phục vụ (phút) cho một khách hàng tại ngân hàng A là BNN X có hàm mật

độ xác suất


5e−5x khi x ≥ 0,

.H



f (x) = 
TS

0 khi x < 0.

1) Tính xác suất thời gian phục vụ một khách hàng nằm trong khoảng từ 0,4 phút đến 1 phút.
Trang 117
BIẾN NGẪU NHIÊN

2) Tính thời gian trung bình phục vụ một khách hàng.

Bài 38. Tuổi thọ X (giờ) của một loại van điện lắp trong một loại thiết bị là BNN liên tục có

24
hàm mật độ xác suất

20

0 khi x ≤ 100,



f (x) =  100

bộ

 khi x > 100.
x2

i
nộ
1) Tính xác suất một van điện bị thay thế trong 150 giờ đầu tiên.

nh
2) Xác định giá trị trung vị của X.


Bài 39. Trong một chiếc hộp có 5 bóng đèn trong đó có 2 bóng đèn mới và 3 bóng đèn cũ. Ta

u

chọn ngẫu nhiên từng bóng đèn không hoàn lại cho đến khi thu được 2 bóng đèn mới. Gọi X

là số bóng đèn đã lấy ra.

1) Lập bảng phân phối xác suất của X.



.H

2) Trung bình cần lấy bao nhiêu bóng đèn mới thu được 2 bóng đèn mới.
TS

Bài 40. Một giảng viên gọi độc lập từng sinh viên trong một nhóm có 4 sinh viên lên bảng làm
bài tập cho đến khi có sinh viên làm được bài tập hoặc cả nhóm không làm được thì thôi. Gọi
Trang 118
BIẾN NGẪU NHIÊN

X là số sinh viên lên bảng. Lập bảng phân phối xác suất của X biết rằng khả năng giải được
bài tập của mỗi sinh viên là 0,6 .

24
Bài 41. Một đề thi trắc nghiệm gồm 100 câu hỏi, mỗi câu hỏi có 4 phương án trả lời trong đó

20
chỉ có 1 phương án trả lời đúng. Thí sinh A đi thi nhưng không học bài, thí sinh này chọn ngẫu


bộ
nhiên một phương án cho mỗi câu. Tính xác suất thí sinh A trả lời đúng được từ 20 câu đến 45
câu.

i
nộ
Bài 42. Sản phẩm sản xuất xong được đóng thành hộp. Mỗi hộp có 12 sản phẩm trong đó có

nh
7 sản phẩm tốt. Người mua hàng tiến hành kiểm tra như sau: Từ hộp lấy ngẫu nhiên ra 2 sản


phẩm để kiểm tra, nếu được cả 2 sản phẩm tốt thì mua hộp đó, ngược lại thì không mua.

u

1) Tính xác suất hộp sản phẩm được mua.

2) Phải kiểm tra ít nhất bao nhiêu hộp để xác suất khách hàng mua được ít nhất 1 hộp không

nhỏ hơn.

.H

Bài 43. Sinh viên A đi từ nhà đến trường phải qua 3 ngã tư, xác suất để người đó gặp đèn đỏ
TS

ở các ngã tư lần lượt là 0,2 ;0,3 ;0,4. Gọi X là số đèn đỏ mà sinh viên A gặp phải khi đi từ nhà
đến trường.
Trang 119
BIẾN NGẪU NHIÊN

1) Lập bảng phân phối xác suất của X.

24
2) Tính E(X) và V ar(X).

20
Bài 44. Cho BNN X chỉ có thể nhận 3 giá trị trong đó có 0 và 1. Biết rằng P (X > 1, 5) =


0, 1; E(X 2 ) = 0, 8 và E(X) = 0, 6. Hãy lập bảng phân phối xác suất của X.

bộ
Bài 45. Trọng lượng của một loại sản phẩm là BNN có phân phối chuẩn với kỳ vọng là 250

i
nộ
gram và độ lệch chuẩn là 25 gram. Sản phẩm là loại I nếu trọng lượng của nó từ 240 gram trở

nh
lên.


1) Tính tỉ lệ sản phẩm loại I.

u

2) Chọn ngẫu nhiên 100 sản phẩm loại này. Tìm số sản phẩm loại I tin chắc nhất có trong 100

sản phẩm này.

Bài 46. Tỉ lệ sản phẩm loại I của một máy là 80%. Cho máy này sản xuất 200 sản phẩm. Tính

.H

xác suất trong 200 sản phẩm này có tối thiểu 150 sản phẩm loại I.
TS

Bài 47. Lãi suất khi đầu tư vào công ty A là BNN có phân phối chuẩn. Biết rằng xác suất đạt
lãi suất trên 20% / năm là 0,1977 và dưới 10%/ năm là 0,0968.
Trang 120
BIẾN NGẪU NHIÊN

1) Tính lãi suất trung bình và độ lệch chuẩn của lãi suất này.

24
2) Tính xác suất khi đầu tư vào công ty A được lãi suất ít nhất 15% /năm.

20
Bài 48. Doanh thu hàng tháng mà doanh nghiệp A đạt được là một BNN có phân phối chuẩn


với doanh thu trung bình là 15,8 triệu USD/tháng. Biết rằng khả năng đạt được doanh thu lớn

bộ
hơn 18 triệu USD/tháng là 0,2912.

i
nộ
1) Xác định độ lệch chuẩn của doanh thu hàng tháng của doanh nghiệp.

nh

2) Tính xác suất doanh nghiệp đạt được doanh thu ít nhất là 2/3 doanh thu trung bình.

u

Bài 49. Thu nhập hàng tháng (triệu đồng) của các nhân viên tại ngân hàng A là BNN có phân

phối chuẩn. Biết rằng có 2,27% nhân viên có thu nhập cao hơn 9,5 triệu và 30,85% nhân viên

có thu nhập thấp hơn 7 triệu.



.H

1) Xác định thu nhập trung bình và độ lệch chuẩn của thu nhập.
TS

2) Nhân viên có thu nhập từ 9 triệu đồng/tháng trở lên thì phải đóng thuế thu nhập cá nhân.
Hãy tính tỉ lệ nhân viên ngân hàng A phải đóng thuế thu nhập cá nhân.
Trang 121
BIẾN NGẪU NHIÊN

Bài 50. Trọng lượng X (đơn vị gram) của một sản phẩm do một máy tự động sản xuất là BNN
có phân phối chuẩn với trọng lượng trung bình là 100 gram và độ lệch chuẩn là 1 gram. Sản

24
phẩm được gọi là đạt tiêu chuẩn nếu trọng lượng của sản phẩm từ 98,04 gram đến 101,96 gram.

20
1) Tính tỉ lệ sản phẩm đạt tiêu chuẩn do máy này sản xuất.


bộ
2) Lấy ngẫu nhiên 500 sản phẩm do máy này sản xuất. Tính xác suất có ít nhất 460 sản phẩm

i
nộ
đạt tiêu chuẩn.

nh
Bài 51. Trọng lượng trẻ sơ sinh là BNN X có phân phối chuẩn với trọng lượng trung bình là


3kg và độ lệch chuẩn 0,2 kg.

u

1) Tính tỷ lệ trẻ sơ sinh cân nặng từ 3 kg đến 3,4 kg.

2) Trẻ sơ sinh thiếu cân nếu có trọng lượng nhỏ hơn 2,5 kg. Tính tỷ lệ trẻ thiếu cân.

3) Người ta muốn có chế độ chăm sóc đặc biệt cho 10% tổng số trẻ thiếu cân. Tính trọng lượng

.H

tối đa cho những đứa trẻ được chăm sóc đặc biệt.
TS

Bài 52. Tuổi thọ sử dụng của một loại linh kiện điện tử là BNN có phân phối chuẩn với
µ = 1000 giờ và σ = 10 giờ.
Trang 122
BIẾN NGẪU NHIÊN

1) Thời gian bảo hành là 980 giờ. Tính tỉ lệ linh kiện phải bảo hành.

24
2) Khi bán 1 linh kiện tiền lãi thu được là 50000 VNĐ. Với thời gian bảo hành 980 giờ và chi

20
phí bảo hành trung bình cho 1 linh kiện là 500000 VNĐ. Hỏi tiền lãi trung bình cho mỗi


linh kiện bán ra là bao nhiêu?

bộ
Bài 53. Có 3 hộp sản phẩm mỗi hộp có 10 sản phẩm. Số sản phẩm loại A có trong các hộp 1,

i
nộ
2, 3 tương ứng là 8, 7, 6; các sản phẩm còn lại trong mỗi hộp là loại B. Chọn ngẫu nhiên 2 hộp,

nh
từ đó lấy ngẫu nhiên từ mỗi hộp đã chọn ra 1 sản phẩm để bán. Tìm phân phối xác suất của số


tiền có được khi bán 2 sản phẩm này. Biết mỗi sản phẩm loại A giá 15000 VNĐ, mỗi sản phẩm

u
loại B giá 10000 VNĐ.

Bài 54. Đường kính của một chi tiết máy mm được sản xuất từ một dây chuyền là BNN có

phân phối chuẩn X ∼ N (25; 0, 0144). Chi tiết máy được coi là đạt tiêu chuẩn kỹ thuật về
đường kính nếu có đường kính từ 24,6 mm đến 25,4 mm. Theo yêu cầu của nhà sản xuất, tỉ lệ

.H

chi tiết máy đạt tiêu chuẩn kỹ thuật về đường kính, phải không dưới 99%. Cho biết dây chuyền
TS

trên có đạt yêu cầu của nhà sản xuất hay không? Giải thích.
Bài 55. Sản phẩm của một nhà máy khi sản xuất xong được đóng thành hộp, mỗi hộp 10 sản
Trang 123
BIẾN NGẪU NHIÊN

phẩm. phân phối của số phế phẩm trong mỗi hộp như sau:
Số phế phẩm 0 1 2

24
20
P 0,6 0,3 0,1


1) Lấy ngẫu nhiên một sản phẩm từ một hộp do nhà máy sản xuất. Tính xác suất lấy được phế

bộ
phẩm.

i
nộ
2) Một khách hàng lấy lần lượt 2 sản phẩm để kiểm tra. Nếu có không quá 1 phế phẩm thì sẽ

nh
mua. Tính xác suất trong 15 hộp kiểm tra khách sẽ mua ít nhất 14 hộp.


u




.H
TS

Trang 124
Chương
4

24
20

bộ
ƯỚC LƯỢNG KHOẢNG TIN CẬY

i
nộ
nh
Số hoàn hảo giống như người hoàn hảo, rất hiếm có – René Descartes


u
4.1 Thống kê mô tả . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
4.1.1

Tầm quan trọng của thống kê mô tả trong nghiên cứu và thực tế . . . . 128

4.1.2 Các khái niệm cơ bản . . . . . . . . . . . . . . . . . . . . . . . . . . . 129


4.1.3 Phân loại dữ liệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

.H

4.1.4 Các đại lượng mô tả . . . . . . . . . . . . . . . . . . . . . . . . . . . 132


TS

4.2 Bài toán ước lượng điểm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136


4.3 Bài toán ước lượng khoảng . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
125
ƯỚC LƯỢNG KHOẢNG TIN CẬY

4.4 Khoảng tin cậy cho các tham số . . . . . . . . . . . . . . . . . . . . . . . . . 137


4.4.1 Khoảng tin cậy cho giá trị trung bình . . . . . . . . . . . . . . . . . . 137

24
4.4.2 Khoảng tin cậy cho tỷ lệ . . . . . . . . . . . . . . . . . . . . . . . . . 145

20
4.4.3 Khoảng tin cậy cho phương sai . . . . . . . . . . . . . . . . . . . . . . 149


bộ
4.5 Bài tập tự luận . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155

i
nộ
nh
Mục tiêu: Sau khi học xong chương này, sinh viên có khả năng giải quyết các vấn đề sau:


1) Nhắc lại một số khái niệm, định nghĩa trong thống kê mô tả.

u

2) Xây dựng khoảng tin cậy cho giá trị trung bình của tổng thể.

3) Xây dựng khoảng tin cậy cho một tỉ lệ của tổng thể.

4) Xây dựng khoảng tin cậy cho phương sai và độ lệch chuẩn của tổng thể.
.H
TS

5) Xác định đươc kích thước mẫu khi tiến hành quan sát tổng thể.

6) Xác định được độ tin cậy của khoảng ước lượng.


Trang 126
ƯỚC LƯỢNG KHOẢNG TIN CẬY

4.1 Thống kê mô tả

24
20
Định nghĩa 4.1. Thống kê mô tả là một phạm vi quan trọng của khoa học thống kê dùng để


mô tả và tổng hợp thông tin từ một tập hợp dữ liệu. Nó nhằm cung cấp cái nhìn tổng quan về

bộ
dữ liệu, giúp ta hiểu sâu hơn về tính chất của tập dữ liệu mà không cần đến các giả định phức

i
nộ
tạp.

nh

Thống kê mô tả giúp ta trả lời các câu hỏi cơ bản về dữ liệu như "Dữ liệu có tính chất gì?", "Dữ

u

liệu phân phối ra sao?", và "Có sự biến đổi nào trong dữ liệu không?"

Các phần quan trọng của thống kê mô tả bao gồm việc mô tả đặc điểm trung tâm (như trung
bình), đặc điểm phân tán (như phương sai), và các biểu đồ và biểu đồ thống kê để hình dung

.H

dữ liệu. Thống kê mô tả thường là bước đầu tiên trong quá trình phân tích dữ liệu và có vai trò
TS

quan trọng trong việc làm sáng tỏ dữ liệu trước khi tiến hành các phân tích thống kê phức tạp
hơn.
Trang 127
ƯỚC LƯỢNG KHOẢNG TIN CẬY

4.1.1 Tầm quan trọng của thống kê mô tả trong nghiên cứu và thực tế

24
Thống kê mô tả đóng một vai trò quan trọng và không thể thiếu trong nghiên cứu và thực tế vì

20
nó cung cấp nhiều lợi ích quan trọng sau đây:


(i) Hiểu dữ liệu ban đầu: Thống kê mô tả giúp chúng ta hiểu rõ dữ liệu ban đầu mà chúng ta

bộ
đang làm việc. Nó cho phép ta xác định tính chất cơ bản của dữ liệu, như độ biến đổi, độ

i
nộ
tập trung, sự phân bố, và các giá trị ngoại lai.

nh
(ii) Hình dung dữ liệu: Bằng cách sử dụng biểu đồ và biểu đồ thống kê, thống kê mô tả giúp


tạo ra hình ảnh hóa dữ liệu, làm cho dữ liệu dễ dàng hiểu hơn cho cả những người không

u
chuyên về thống kê.


(iii) So sánh và tổng hợp: Nó cho phép so sánh giữa các tập dữ liệu khác nhau và tổng hợp

thông tin từ chúng. Điều này hữu ích trong việc so sánh hiệu suất, phân tích xu hướng, và

.H

đưa ra quyết định.


TS

(iv) Phát hiện các biến đổi và điểm quan trọng: Thống kê mô tả có thể giúp phát hiện sự biến
đổi, xu hướng, hoặc sự thay đổi quan trọng trong dữ liệu. Điều này có thể dẫn đến những
Trang 128
ƯỚC LƯỢNG KHOẢNG TIN CẬY

phát hiện quan trọng trong nghiên cứu và thực tế.

24
(v) Xác định cơ sở cho phân tích thống kê tiếp theo: Trước khi tiến hành các phân tích thống

20
kê phức tạp hơn, thống kê mô tả giúp ta kiểm tra các giả định cơ bản và xác định liệu dữ


liệu có đáp ứng các điều kiện cần thiết cho các phân tích này hay không.

bộ
(vi) Hỗ trợ quyết định trong thực tế: Trong các lĩnh vực như kinh doanh, y tế, và chính trị,

i
nộ
thống kê mô tả là công cụ quan trọng để hỗ trợ quyết định. Chúng giúp cung cấp thông

nh
tin cơ bản để đưa ra quyết định hợp lý và có cơ sở.


Tóm lại, thống kê mô tả không chỉ là một phần quan trọng trong quá trình phân tích dữ liệu

u

mà còn đóng một vai trò quan trọng trong việc giúp chúng ta hiểu và sử dụng dữ liệu hiệu quả

trong nghiên cứu và cuộc sống hàng ngày.

4.1.2 Các khái niệm cơ bản



.H

Khái niệm 4.1.1. Dữ liệu (data) là thông tin hoặc sự thu thập các dấu hiệu, số liệu, hoặc tài
TS

liệu mà chúng ta sử dụng để thể hiện, mô tả, hoặc phân tích một phần của thực tế hoặc hiện
tượng. Dữ liệu có thể là các số, văn bản, hình ảnh, âm thanh hoặc bất kỳ hình thức nào của
Trang 129
ƯỚC LƯỢNG KHOẢNG TIN CẬY

thông tin có thể được thu thập và lưu trữ.


Khái niệm 4.1.2. Tổng thể (population) là tập hợp toàn bộ các cá thể hoặc sự kiện mà ta quan

24
tâm trong một nghiên cứu hoặc phân tích thống kê. Đây là tập hợp rộng và toàn diện, thường

20
rất lớn và không thể nghiên cứu hoặc thu thập dữ liệu từ toàn bộ tổng thể.


bộ
Ví dụ 4.1. Nếu ta quan tâm đến điểm số Toán của tất cả học sinh trường trung học A, thì tổng

i
nộ
thể của ta sẽ bao gồm tất cả học sinh của trường đó trong một năm học cụ thể.

nh
Khái niệm 4.1.3. Mẫu (sample) là một tập hợp con nhỏ hơn của tổng thể, được chọn ra một


cách ngẫu nhiên hoặc theo cách khác để đại diện cho tổng thể một cách hợp lý. Mẫu được sử

u
dụng để đánh giá và rút ra những kết luận về tổng thể mà không cần nghiên cứu toàn bộ tổng
thể. Lư

Ví dụ 4.2. Nếu ta không thể nghiên cứu tất cả học sinh của trường trung học A, ta có thể chọn
ra một mẫu ngẫu nhiên, ví dụ như 100 học sinh từ trường đó, để nghiên cứu và đánh giá điểm

.H

số Toán của học sinh. Mẫu này được xem là đại diện cho tổng thể toàn bộ học sinh của trường.
TS

Khái niệm về tổng thể và mẫu quan trọng trong thống kê vì chúng giúp ta thực hiện nghiên cứu
hoặc phân tích dữ liệu một cách hiệu quả. Khi ta có một mẫu đại diện, ta có thể sử dụng kết
Trang 130
ƯỚC LƯỢNG KHOẢNG TIN CẬY

quả từ mẫu để đưa ra những kết luận hoặc dự đoán về tổng thể mà không cần tiêu tốn quá nhiều
thời gian và tài nguyên để nghiên cứu toàn bộ tổng thể.

24
20
4.1.3 Phân loại dữ liệu


bộ
Định nghĩa 4.2. 1) Dữ liệu định tính là loại dữ liệu mà các giá trị của nó được phân thành các

i
nhóm hoặc danh mục. Các giá trị định tính không thể đo bằng các con số và thường được

nộ
biểu thị bằng các nhãn, ký hiệu hoặc chữ cái.

nh

2) Dữ liệu định lượng là loại dữ liệu có giá trị có thể đo lường bằng con số. Dữ liệu này thường

u

biểu thị các đặc điểm hoặc thuộc tính có mức độ hay số lượng. Dữ liệu định lượng có thể
được chia thành hai loại chính: Dữ liệu rời rạc và dữ liệu liên tục.

Ví dụ 4.3. i) Dữ liệu định tính: Giới tính (nam/nữ), màu sắc (đỏ/xanh/lục), hoặc loại sản

phẩm (điện thoại di động/máy tính bảng), . . .


.H
TS

ii) Dữ liệu định lượng: Tuổi của người dùng, giá cả của sản phẩm, hoặc số lượng sản phẩm
bán ra trong một tháng, . . .
Trang 131
ƯỚC LƯỢNG KHOẢNG TIN CẬY

4.1.4 Các đại lượng mô tả

24
Định nghĩa 4.3. Tần suất (Frequency) là số lượng lần xuất hiện của một giá trị cụ thể trong tập

20
dữ liệu. Nó cho biết mức độ phổ biến của giá trị đó trong dữ liệu.


Định nghĩa 4.4. Phần trăm (Percentage) là tần suất của một giá trị so với tổng số quan sát. Nó

bộ
được tính bằng cách chia tần suất của giá trị đó cho tổng số quan sát và nhân với 100% để biểu

i
nộ
thị dưới dạng phần trăm.

nh
Công thức tính:


Tần suất

u
Phần trăm = × 100%.
Lư Tổng số quan sát

Ví dụ 4.4. Nếu một giá trị xuất hiện 20 lần trong một tập dữ liệu có tổng cộng 100 quan sát,

thì phần trăm của giá trị đó là 20



.H

Định nghĩa 4.5. Trung bình của dữ liệu (mean), ký hiệu x, tính bằng cách lấy tổng của tất cả
TS

các giá trị và chia cho tổng số quan sát. Trung bình thường được sử dụng để mô tả giá trị trung
tâm của dữ liệu.
Trang 132
ƯỚC LƯỢNG KHOẢNG TIN CẬY

Công thức tính:


x1 + x2 + . . . + xn
x= ,

24
n
trong đó xi , (i = 1, . . . , n), là các giá trị thứ i trong dữ liệu và n là tổng số quan sát.

20
Ví dụ 4.5. Giả sử ta muốn tính điểm trung bình của một lớp học gồm 5 học sinh trong môn


bộ
Toán. Số điểm của từng học sinh như sau: 95; 88; 72; 90; 78. Khi đó, điểm trung bình môn

i
Toán của lớp là:

nộ
95 + 88 + 72 + 90 + 78
x= = 84, 6 (điểm).

nh
5
Định nghĩa 4.6. Trung vị (median) là giá trị ở vị trí giữa của dữ liệu sau khi được sắp xếp theo


thứ tự. Nó không bị ảnh hưởng bởi các giá trị ngoại lai và thường được sử dụng khi dữ liệu có

u
sự biến đổi lớn. Lư

Để tính trung vị, ta cần sắp xếp tập dữ liệu theo thứ tự tăng dần hoặc giảm dần và sau đó chọn

n+1
giá trị ở vị trí giữa của dãy số. Nếu có số lẻ quan sát, trung vị sẽ là giá trị ở vị trí ; nếu có
2

n n
.H

số chẵn quan sát, trung vị sẽ là trung bình của hai giá trị ở vị trí và + 1.
2 2
TS

Ví dụ 4.6. Giả sử ta có một tập hợp điểm số của 9 học sinh trong một bài kiểm tra như sau:

84; 78; 92; 88; 76; 90; 85; 89; 81.


Trang 133
ƯỚC LƯỢNG KHOẢNG TIN CẬY

Để tính trung vị, ta cần sắp xếp các điểm số này theo thứ tự tăng dần hoặc giảm dần:

24
76; 78; 81; 84; 85; 88; 89; 90; 92.

20
Vì có tổng cộng 9 điểm số, vị trí giữa là 5. Trung vị chính là giá trị ở vị trí thứ 5 trong danh


sách sắp xếp, tức là 85.

bộ
Định nghĩa 4.7. Mode là giá trị xuất hiện nhiều nhất trong dữ liệu. Nó thường được sử dụng

i
nộ
trong trường hợp đếm tần suất của các giá trị duy nhất trong dữ liệu.

nh
Để tính mode, ta đếm tần suất xuất hiện của mỗi giá trị và chọn giá trị có tần suất cao nhất.


Ví dụ 4.7. Giả sử ta có một tập hợp điểm số của 10 học sinh trong một bài kiểm tra:

u

85; 78; 92; 88; 78; 90; 85; 89; 85; 81.

Để tìm mode, ta xác định giá trị xuất hiện nhiều nhất trong tập dữ liệu này. Trong trường hợp
này, giá trị 85 xuất hiện 3 lần, trong khi các giá trị khác chỉ xuất hiện 1 hoặc 2 lần. Vậy mode

.H

của tập hợp điểm số này là 85.


TS

Định nghĩa 4.8. Phương sai (variance), ký hiệu σ 2 , đo lường mức độ biến đổi trong dữ liệu.
Nó tính bằng cách lấy trung bình bình phương của sự sai khác giữa mỗi giá trị và trung bình
Trang 134
ƯỚC LƯỢNG KHOẢNG TIN CẬY

của dữ liệu. Phương sai lớn hơn cho thấy dữ liệu có sự biến đổi lớn hơn.
Công thức tính phương sai của tổng thể:

24
1 N 

20
2
σ2 =
X
xi − µ .
N i=1


Công thức tính phương sai của mẫu:

bộ
1 X n  2
s2 =

i
xi − x .

nộ
n − 1 i=1

nh
Ví dụ 4.8. Sử dụng dữ liệu của Ví dụ 4.5. Ta có phương sai điểm môn Toán của lớp là:


2 (95 − 85, 8)2 + (88 − 85, 8)2 + (72 − 85, 8)2 + (90 − 85, 8)2 + (78 − 85, 8)2
s =
5−1

u
2
= 87, 8 (điểm ). Lư

Định nghĩa 4.9. Độ lệch chuẩn (standard deviation) là căn bậc hai của phương sai. Nó đo độ

lệch của các giá trị so với trung bình của dữ liệu. Độ lệch chuẩn thường được sử dụng để hiểu

.H

sự phân tán của dữ liệu. Nếu độ lệch chuẩn lớn, có nghĩa dữ liệu có sự phân tán lớn hơn.
TS

Công thức tính độ lệch chuẩn của tổng thể:



σ= σ2.
Trang 135
ƯỚC LƯỢNG KHOẢNG TIN CẬY

Công thức tính độ lệch chuẩn của mẫu:


24
s= s2 .

20
Ví dụ 4.9. Sử dụng dữ liệu của Ví dụ 4.8. Ta có độ lệch chuẩn của điểm môn Toán là:


√ √

bộ
s = s2 = 87, 8 ≈ 9, 3702 (điểm).

i
nộ
4.2 Bài toán ước lượng điểm

nh

Sinh viên có thể tìm chi tiết trong [1].

u
4.3 Bài toán ước lượng khoảng Lư

Cho BNN X có hàm phân bố xác suất F (x, θ), với θ ∈ Θ tham số chưa biết. Tìm các thống kê
θ1 , θ2 sao cho θ ∈ (θ1 , θ2 ) với xác suất 1 − α cho trước, với α ∈ [0; 1]. Nói cách khác,

.H

P (θ1 < θ < θ2 ) = 1 − α.


TS

Ta gọi:
Trang 136
ƯỚC LƯỢNG KHOẢNG TIN CẬY

i) 1 − α: độ tin cậy của ước lượng,

ii) (θ1 , θ2 ): khoảng tin cậy của ước lượng,

24
20
iii) ϵ: độ chính xác hoặc sai số hoặc bán kính của ước lượng.


4.4 Khoảng tin cậy cho các tham số

bộ
4.4.1 Khoảng tin cậy cho giá trị trung bình

i
nộ
A. Bài toán 1

nh
Cho tổng thể X có phân phối chuẩn X ∼ N (µ, σ 2 ) với giá trị trung bình µ chưa biết. Với độ


tin cậy 1 − α, tìm khoảng tin cậy cho µ.

u

Chú ý 4.1. Nếu không dùng bảng tra Laplace ngược để tìm zα/2 hay zα thì có thể sử dụng bảng

tra giá trị tới hạn của phân phối Chuẩn tắc.

Quy tắc thực hành: Ta chia bài toán thành các trường hợp sau:

◆ Trường hợp 1: σ 2 đã biết


.H

★ Khoảng tin cậy đối xứng


TS

1−α σ
φ(z α2 ) = → z α2 =⇒ ε = z α2 . √ =⇒ µ ∈ (x̄ − ε; x̄ + ε).
2 n
Trang 137
ƯỚC LƯỢNG KHOẢNG TIN CẬY

★ Khoảng tin cậy tối đa


σ

24
φ(zα ) = 0, 5 − α → zα =⇒ ε = zα . √ =⇒ µ ∈ (−∞; x̄ + ε).
n

20
★ Khoảng tin cậy tối thiểu


bộ
σ
φ(zα ) = 0, 5 − α → zα =⇒ ε = zα . √ =⇒ µ ∈ (x̄ − ε; +∞).
n

i
nộ
◆ Trường hợp 2: n ≥ 30 và σ 2 chưa biết

nh
★ Khoảng tin cậy đối xứng


1−α s

u
φ(z α2 ) = → z α2 =⇒ ε = z α2 . √ =⇒ µ ∈ (x̄ − ε; x̄ + ε).
2
Lư n

★ Khoảng tin cậy tối đa

s
φ(zα ) = 0, 5 − α → zα =⇒ ε = zα . √ =⇒ µ ∈ (−∞; x̄ + ε).

n
.H

★ Khoảng tin cậy tối thiểu


TS

s
φ(zα ) = 0, 5 − α → zα =⇒ ε = zα . √ =⇒ µ ∈ (x̄ − ε; +∞).
n
Trang 138
ƯỚC LƯỢNG KHOẢNG TIN CẬY

◆ Trường hợp 3: n < 30 và σ 2 chưa biết


★ Khoảng tin cậy đối xứng

24
α s

20
1−α→ → t(n−1; α2 ) =⇒ ε = t(n−1; α2 ) . √ =⇒ µ ∈ (x̄ − ε; x̄ + ε).
2 n


bộ
★ Khoảng tin cậy tối đa
s

i
1 − α → α → t(n−1;α) =⇒ ε = t(n−1;α) . √ =⇒ µ ∈ (−∞; x̄ + ε).

nộ
n

nh
★ Khoảng tin cậy tối thiểu


s
1 − α → α → t(n−1;α) =⇒ ε = t(n−1;α) . √ =⇒ µ ∈ (x̄ − ε; +∞).

u
n
B. Bài toán 2 Lư

★ Xác định kích thước mẫu dựa vào điều kiện đối với bán kính của khoảng ước lượng đối xứng
cho giá trị trung bình (trường hợp chưa biết σ 2 )

.H

 2
s zα × s
ε = z α2 √ ≤ ε0 =⇒ nnew ≥  2  ,
TS

nnew ε0
trong đó ε0 , s và 1 − α cho trước.
Trang 139
ƯỚC LƯỢNG KHOẢNG TIN CẬY

★ Kích thước mẫu cần đều tra thêm là nnew − nold .


C. Bài toán 3

24
★ Xác định độ tin cậy của ước lượng dựa vào giá trị bán kính của khoảng ước lượng đối xứng

20
cho giá trị trung bình (trường hợp n ≥ 30 và chưa biết σ 2 )


 √ 

bộ
s   ε0 n 
ε = z α2 √ = ε0 =⇒ 1 − α = 2φ z α2 = 2φ ,
n s

i
nộ
trong đó ε0 , s và n cho trước.

nh
Ví dụ 4.10. Lượng xăng hao phí của một ô tô đi từ A đến B sau 150 lần chạy khảo sát có giá


trị trung bình là 10,56 lít và độ lệch chuẩn là 0,587 lít. Hãy ước lượng lượng xăng hao phí trung

u

bình của ô tô này khi đi từ A đến B với độ tin cậy 95%.

Giải. Gọi µ là lượng xăng hao phí trung bình của ô tô này khi đi từ A đến B (lít). Ta có

1−α
1) Độ tin cậy: 1 − α = 0, 95 =⇒ φ(z α2 ) = = 0, 475 =⇒ z α2 = 1, 96;

2
.H

s 0, 587
2) Độ chính xác: ε = z α2 . √ = 1, 96 × √ = 0, 0939;
TS

n 150
   
3) Khoảng tin cậy đối xứng : µ ∈ x − ε; x + ε = 10, 4661; 10, 6539 .
Trang 140
ƯỚC LƯỢNG KHOẢNG TIN CẬY

Vậy lượng xăng hao phí trung bình của ô tô này khi đi từ A đến B là từ 10,4661 lít đến 10,6539
lít, với độ tin cậy 95%.

24
Ví dụ 4.11. Khảo sát trọng lượng của 25 sản phẩm tính được trung bình mẫu 50 gram, độ lệch

20
tiêu chuẩn điều chỉnh 8,25 gram. Hãy uớc lượng trọng lượng trung bình của sản phẩm với độ


bộ
tin cậy 95%.

i
Giải. Gọi µ là trọng lượng trung bình của sản phẩm. Ta có

nộ
nh
1) Độ tin cậy: 1 − α = 0, 95 =⇒ α = 0, 05 =⇒ t(n−1;α/2) = t(24;0,025) = 2, 064;


s 8, 25
2) Độ chính xác: ε = t(n−1;α/2) √ = 2, 64 × √ = 3, 4056;

u
n 25

Lư  
3) Khoảng tin cậy đối xứng : µ ∈ x − ε; x + ε = 46, 5944; 53, 4056 .


Vậy trọng lượng trung bình của sản phẩm là từ 46,5944 gram đến 53,4056 gram, với độ tin cậy
95%.

.H

Ví dụ 4.12. Lượng xăng hao phí của một ô tô đi từ A đến B sau 150 lần chạy được khảo sát có
TS

giá trị trung bình là 10,56 lít và độ lệch chuẩn là 0,587 lít. Hãy ước lượng lượng xăng hao phí
trung bình tối thiểu của ô tô này khi đi từ A đến B với độ tin cậy 96%.
Trang 141
ƯỚC LƯỢNG KHOẢNG TIN CẬY

Giải. Gọi µ là lượng xăng hao phí trung bình của ô tô này khi đi từ A đến B. Ta có

1) Độ tin cậy: 1 − α = 0, 96 =⇒ φ(zα ) = 0, 5 − α = 0, 46 =⇒ zα = 1, 75;

24
20
s 0, 587
2) Sai số của ước lượng: ε = zα . √ = 1, 75 × √ = 0, 0839;
n 150


bộ
   
3) Khoảng tin cậy tối thiểu : µ ∈ x − ε; +∞ = 10, 4761; +∞ .

i
nộ
Vậy lượng xăng hao phí trung bình tối thiểu của ô tô này khi đi từ A đến B là từ 10,4761 lít, với

nh
độ tin cậy 96%.


Ví dụ 4.13. Khảo sát trọng lượng của 25 sản phẩm tính được trung bình mẫu 50 gram, độ lệch

u
tiêu chuẩn là 8,25 gram. Hãy ước lượng trọng lượng trung bình tối đa của sản phẩm với độ tin
cậy 95%. Lư

Giải. Gọi µ là trọng lượng trung bình của sản phẩm. Ta có

1) Độ tin cậy: 1 − α = 0, 95 =⇒ α = 0, 05 =⇒ t(n−1;α) = t(24;0,05) = 2, 711;



.H

s 8, 25
2) Sai số của ước lượng: ε = t(n−1;α) √ = 2, 711 × √ = 4, 473;
TS

n 25
   
3) Khoảng tin cậy tối đa : µ ∈ − ∞; x + ε = − ∞; 54, 473 .
Trang 142
ƯỚC LƯỢNG KHOẢNG TIN CẬY

Vậy trọng lượng trung bình tối đa của sản phẩm là 54,473 gram, với độ tin cậy 95%.
Ví dụ 4.14. Lượng xăng hao phí của một ô tô đi từ A đến B sau 150 lần chạy khảo sát có giá

24
trị trung bình là 10,56 lít và độ lệch chuẩn là 0,587 lít. Để phép ước lượng lượng xăng hao phí

20
trung bình của ô tô này khi đi từ A đến B đảm bảo độ chính xác 0,08 lít với độ tin cậy 97% thì


bộ
cần khảo sát ít nhất bao nhiêu lần chạy từ A đến B của ô tô này?

i
Giải. Từ đề bài, ta có

nộ
1−α
1) Độ tin cậy: 1 − α = 0, 97 =⇒ φ(z α2 ) = = 0, 485 =⇒ z α2 = 2, 17;

nh
2


2) Độ chính xác:

u
 2  2
zα × s 2, 17 × 0, 587 

s
ε = z α2 √ ≤ ε0 =⇒ nnew ≥  2  = ≈ 253, 5.
nnew ε0 0, 08

Vậy cần khảo sát ít nhất 254 lần chạy từ A đến B của ô tô này.
Ví dụ 4.15. Lượng xăng hao phí của một ô tô đi từ A đến B sau 150 lần chạy được khảo sát có

.H

giá trị trung bình là 10,56 lít và độ lệch chuẩn là 0,587 lít. Để phép ước lượng lượng xăng hao
TS

phí trung bình của ô tô này khi đi từ A đến B đảm bảo độ chính xác 0,08 lít với độ tin cậy 98%
thì cần khảo sát thêm ít nhất bao nhiêu lần chạy từ A đến B nữa của ô tô này?
Trang 143
ƯỚC LƯỢNG KHOẢNG TIN CẬY

Giải. Từ đề bài, ta có
1−α
1) Độ tin cậy: 1 − α = 0, 98 =⇒ φ(z α2 ) = = 0, 49 =⇒ z α2 = 2, 33;

24
2

20
2) Độ chính xác:


 2  2
s zα × s 2, 33 × 0, 587 

bộ
ε = z α2 √ ≤ ε0 =⇒ nnew ≥  2  = ≈ 292, 3.
nnew ε 0, 08

i
nộ
Vậy cần khảo sát thêm nnew − nold = 293 − 150 = 143 lần chạy từ A đến B của ô tô này.

nh
Ví dụ 4.16. Lượng xăng hao phí của một ô tô đi từ A đến B sau 150 lần chạy khảo sát có giá


trị trung bình là 10,56 lít và độ lệch chuẩn là 0,587 lít. Biết rằng phép ước lượng lượng xăng

u
hao phí trung bình của ô tô này khi đi từ A đến B đạt độ chính xác là 0,1 lít. Hỏi độ tin cậy của
phép ước lượng đó là bao nhiêu?


Giải. Từ đề bài, ta có
 √   √ 

s ε 0 n 0, 1 150
ε = z α2 √ = ε0 =⇒ 1 − α = 2φ  = 2φ  ≈ 96, 31%,
.H

n s 0, 587
TS

Vậy độ tin cậy của phép ước lượng để ượng xăng hao phí trung bình của ô tô này khi đi từ A
đến B đạt độ chính xác 0,1 lít là 96,31%.
Trang 144
ƯỚC LƯỢNG KHOẢNG TIN CẬY

4.4.2 Khoảng tin cậy cho tỷ lệ

24
A. Bài toán 1

20
Giả sử p tỷ lệ các phần tử có tính chất A của tổng thể của BNN X có X ∼ N (µ, σ 2 ). Với độ
tin cậy 1 − α, hãy xác định khoảng tin cậy cho p.


bộ
Quy tắc thực hành:
m

i
nộ
★ Tỷ lệ mẫu: f = .
n
★ Khoảng tin cậy đối xứng

nh

q
1−α f (1 − f )
φ(z α2 ) = → z α2 =⇒ ε = z α2 . √ =⇒ p ∈ (f − ε; f + ε).

u
2 n
★ Khoảng tin cậy tối đa Lư

q
f (1 − f )
φ(zα ) = 0, 5 − α → zα =⇒ ε = zα . √ =⇒ p ∈ (0; f + ε).
n

.H

★ Khoảng tin cậy tối thiểu


TS

q
f (1 − f )
φ(zα ) = 0, 5 − α → zα =⇒ ε = zα . √ =⇒ p ∈ (f − ε; 1).
n
Trang 145
ƯỚC LƯỢNG KHOẢNG TIN CẬY

B. Bài toán 2
★ Xác định kích thước mẫu dựa vào khoảng ước lượng đối xứng cho tỷ lệ

24
q  q 2
f (1 − f ) z × f (1 − f )

20
α
ε = z α2 √ ≤ ε0 =⇒ nnew ≥  2  ,
nnew ε0


bộ
trong đó ε0 , f và 1 − α cho trước.

i
★ Kích thước mẫu cần đều tra thêm: nnew − nold .

nộ
C. Bài toán 3

nh
★ Xác định độ tin cậy của ước lượng dựa vào khoảng ước lượng đối xứng cho tỷ lệ


q  √ 

u
f (1 − f ) ε 0 n

 
ε = z α2 √ = ε0 =⇒ 1 − α = 2φ z α2 = 2φq ,

n f (1 − f )

trong đó ε0 , f và n cho trước.

Ví dụ 4.17. Khảo sát ngẫu nhiên 300 sản phẩm của một loại mặt hàng A do một công ty sản

.H

xuất, ta nhận thấy có 24 thứ phẩm. Với độ tin cậy 95%, hãy ước lượng tỉ lệ thứ phẩm của mặt
TS

hàng A trên thị trường.


Giải. Gọi p là tỷ lệ thứ phẩm của mặt hàng A trên thị trường. Ta có
Trang 146
ƯỚC LƯỢNG KHOẢNG TIN CẬY

24
1) f = = 0, 08;
300

24
1−α
2) Độ tin cậy: 1 − α = 0, 95 =⇒ φ(z α2 ) = = 0, 475 =⇒ z α2 = 1, 96;

20
2
q q
f (1 − f ) 0, 08(1 − 0, 08)


3) Độ chính xác: ε = z α2 . √ = 1, 96 × √ = 0, 0307;

bộ
n 300
   

i
4) Khoảng tin cậy đối xứng : p ∈ f − ε; f + ε = 0, 0493; 0, 1107 .

nộ
Vậy tỷ lệ thứ phẩm của mặt hàng A trên thị trường là từ 4,93% đến 11,07%, với độ tin cậy 95%.

nh

Ví dụ 4.18. Khảo sát ngẫu nhiên 300 sản phẩm của một loại mặt hàng A do một công ty sản

u
xuất, ta nhận thấy có 24 thứ phẩm. Với độ tin cậy 99%, hãy ước lượng tối thiểu tỉ lệ thứ phẩm
của mặt hàng A trên thị trường. Lư

Giải. Gọi p là tỷ lệ thứ phẩm của mặt hàng A trên thị trường. Ta có

24
1) f = = 0, 08;

300
.H

2) Độ tin cậy: 1 − α = 0, 95 =⇒ φ(zα ) = 0, 5 − α = 0, 45 =⇒ zα = 1, 65;


TS

q q
f (1 − f ) 0, 08(1 − 0, 08)
3) Sai số của ước lượng: ε = zα . √ = 1, 65 × √ = 0, 0258;
n 300
Trang 147
ƯỚC LƯỢNG KHOẢNG TIN CẬY

   
4) Khoảng tin cậy tối thiểu: p ∈ f − ε; 1 = 0, 0542; 1 .

24
Vậy tỷ lệ thứ phẩm tối thiểu của mặt hàng A trên thị trường là 5,42%, với độ tin cậy 99%.

20
Ví dụ 4.19. Khảo sát ngẫu nhiên 300 sản phẩm của một loại mặt hàng A do một công ty sản


xuất, ta nhận thấy có 24 thứ phẩm. Với độ tin cậy 96%, để đảm bảo độ chính xác 3% cho phép

bộ
ước lượng tỉ lệ thứ phẩm của mặt hàng A của công ty trên thì cần khảo sát ít nhất bao nhiêu sản

i
nộ
phẩm?

nh
Giải. Theo đề bài, ta có


24
1) f = = 0, 08;

u
300

2) Độ tin cậy: 1 − α = 0, 96 =⇒ φ(z α2 ) =
1−α
= 0, 48 =⇒ z α2 = 2, 05;

2

3) Độ chính xác:

2
.H

q  q
f (1 − f ) 2, 05 × 0, 08(1 − 0, 08) 
ε = z α2 √ ≤ ε0 =⇒ nnew ≥  ≈ 343, 7.
nnew 0, 03
TS

Vậy cần khảo sát ít nhất 344 sản phẩm.


Trang 148
ƯỚC LƯỢNG KHOẢNG TIN CẬY

Ví dụ 4.20. Khảo sát ngẫu nhiên 300 sản phẩm của một loại mặt hàng A do một công ty sản
xuất, ta nhận thấy có 24 thứ phẩm. Cho biết độ chính xác của phép ước lượng tỉ lệ thứ phẩm

24
của mặt hàng A của công ty trên là 4%, hỏi độ tin cậy của phép ước lượng trên là bao nhiêu?

20
Giải. Theo đề bài, ta có


bộ
24
1) f = = 0, 08;
300

i
nộ
2) Độ chính xác:

nh
q  √ 
f (1 − f ) ε n


0
ε = z α2 √ = ε0 =⇒ 1 − α = 2φ q 
n f (1 − f )

u


 
0, 04 300  ≈ 98, 93%.
= 2φ q
0, 08(1 − 0, 08)

Vậy độ tin cậy của phép ước lượng trên là 98,93%.



.H

4.4.3 Khoảng tin cậy cho phương sai


TS

Bài toán. Cho tổng thể X có phân phối chuẩn X ∼ N (µ, σ 2 ) với σ 2 chưa biết. Với độ tin cậy
1 − α, tìm khoảng tin cậy cho σ 2 .
Trang 149
ƯỚC LƯỢNG KHOẢNG TIN CẬY

Quy tắc thực hành: Ta chia bài toán thành các trường hợp sau:
◆ Trường hợp 1: µ đã biết

24
★ Tính

20
k
(n − 1)s2 = ni .(xi − µ)2 .
X


i=1

bộ
★ Khoảng tin cậy đối xứng

i
nộ
(n − 1)s2 2 (n − 1)s2
≤σ ≤ 2 .

nh
χ2(n;α/2) χ(n;1−α/2)


★ Khoảng tin cậy tối đa

u
Lư (n − 1)s2
2
0≤σ ≤ 2 .

χ(n;1−α)

★ Khoảng tin cậy tối thiểu



.H

(n − 1)s2
≤ σ 2 < +∞.
χ2(n;α)
TS

◆ Trường hợp 2: µ chưa biết


Trang 150
ƯỚC LƯỢNG KHOẢNG TIN CẬY

★ Khoảng tin cậy đối xứng


(n − 1)s2 2 (n − 1)s2

24
≤σ ≤ 2 .
χ2(n−1;α/2) χ(n−1;1−α/2)

20
★ Khoảng tin cậy tối đa


(n − 1)s2

bộ
0 ≤ σ2 ≤ .
χ2(n−1;1−α)

i
nộ
★ Khoảng tin cậy tối thiểu

nh
(n − 1)s2
≤ σ 2 < +∞.


2
χ(n−1;α)

u
Ví dụ 4.21. Trọng lượng của các sản phẩm do công ty A sản xuất thức ăn gia súc đóng gói là

BNN X có luật phân phối chuẩn. Kiểm tra 25 sản phẩm của công ty A sản xuất ta được kết quả

sau:

Trọng lượng (gram) 195 200 205



.H

Số sản phẩm 5 18 2
TS

Biết trọng lượng trung bình một sản phẩm của toàn công ty A là 200 gram. Hãy ước lượng
phương sai trọng lượng một sản phẩm của công ty A với độ tin cậy 90%.
Trang 151
ƯỚC LƯỢNG KHOẢNG TIN CẬY

Giải. Gọi σ 2 là phương sai trọng lượng của một sản phẩm do công ty A sản xuất (gram2 ). Ta

24
20
Trọng lượng 195 200 205


Số sản phẩm 5 18 2

bộ
k
(n − 1)s2 = ni .(xi − µ)2
X

i
nộ
i=1

= (195 − 200)2 × 5 + (200 − 200)2 × 18 + (205 − 200)2 × 2 = 175.

nh

Khoảng tin cậy đối xứng

u
(n − 1)s2 (n − 1)s2
χ2(n;α/2)
≤ σ 2
≤ Lư
χ2(n;1−α/2)
⇐⇒
175
χ2(25;0,05)
≤ σ 2

175
χ2(25;0,95)

175 175

⇐⇒ ≤ σ2 ≤
40, 6465 13, 1197

⇐⇒ 4, 3054 ≤ σ 2 ≤ 13, 3387.


.H
TS

Vậy phương sai trọng lượng của một sản phẩm của công ty A là từ 4,3054 (gram2 ) đến 13,3387
(gram2 ), với độ tin cậy 90%.
Trang 152
ƯỚC LƯỢNG KHOẢNG TIN CẬY

Ví dụ 4.22. Trọng lượng của các sản phẩm do công ty A sản xuất thức ăn gia súc đóng gói là
BNN X có luật phân phối chuẩn. Kiểm tra 25 sản phẩm của công ty A sản xuất ta được kết quả

24
sau:

20
Trọng lượng (gram) 195 200 205


bộ
Số sản phẩm 5 18 2

i
nộ
Hãy ước lượng phương sai trọng lượng của một sản phẩm do công ty A sản xuất, với độ tin cậy

nh
90%.


Giải. Gọi σ 2 là phương sai trọng lượng của một sản phẩm do công ty A sản xuất (gram2 ). Ta

u
có s2 = 6, 9167.
Khoảng tin cậy đối xứng


(n − 1)s2 2 (n − 1)s2 24 × 6, 9167 24 × 6, 9167


2 ≤ σ ≤ 2 ⇐⇒ 2 ≤ σ2 ≤
χ(n−1;α/2) χ(n−1;1−α/2) χ(24;0,05) χ2(24;0,95)

.H

166, 0008 166, 0008


, ⇐⇒ ≤ σ2 ≤
TS

36, 415 13, 8484


⇐⇒ 4, 5586 ≤ σ 2 ≤ 11, 987.

Trang 153
ƯỚC LƯỢNG KHOẢNG TIN CẬY

Vậy phương sai trọng lượng của một sản phẩm do công ty A sản xuất là từ 4,5586 (gram2 ) đến
11,987 (gram2 ), với độ tin cậy 90%.

24
20
Ví dụ 4.23. Mức hao phí nguyên liệu cho một đơn vị sản phẩm X là BNN có phân phối chuẩn.


Khảo sát ngẫu nhiên 25 sản phẩm loại này ta được mức hao phí nguyên liệu như sau:

i bộ
nộ
nh
Mức hao phí (gram) 19,25-19,75 19,75-20,25 20,25-20,75


u
Số sản phẩm 6 15 4


Với độ tin cậy 90%, hãy tìm khoảng tin cậy cho độ lệch chuẩn của mức hao phí nguyên liệu

.H

trên.
TS

Giải. Gọi σ là độ lệch chuẩn của mức hao phí nguyên liệu trên. Ta có s2 = 0, 1025. Khoảng tin
Trang 154
ƯỚC LƯỢNG KHOẢNG TIN CẬY

cậy phương sai đối xứng


(n − 1)s2 (n − 1)s2 24 × 0, 1025 24 × 0, 1025

24
2
2 ≤σ ≤ 2 ⇐⇒ 2 ≤ σ2 ≤
χ(n−1;α/2) χ(n−1;1−α/2) χ(24;0,05) χ2(24;0,95)

20
2, 46 2, 46
⇐⇒ ≤ σ2 ≤


36, 415 13, 8484

bộ
⇐⇒ 0, 0676 ≤ σ 2 ≤ 0, 1776

i
nộ
⇐⇒ 0, 2600 ≤ σ ≤ 0, 4214.

nh
Vậy độ lệch chuẩn của mức hao phí nguyên liệu trên là từ 0,2600 gram đến 0,4214 gram, với


độ tin cậy 90%.

u
4.5 Bài tập tự luận


Bài 1. Khảo sát thu nhập X (triệu đồng/tháng) của một số người được chọn ngẫu nhiên từ công

ty A, ta thu được số liệu sau:


.H
TS

X 6,5–7 7–7,5 7,5–8 8–8,5 8,5–9 9–9,5 9,5–10 10–10,5


Số người 23 33 55 73 45 22 18 15
Trang 155
ƯỚC LƯỢNG KHOẢNG TIN CẬY

1) Tìm khoảng tin cậy 98% cho thu nhập trung bình của một người ở công ty A.

2) Người có thu nhập trên 9 triệu đồng/tháng là người có thu nhập cao. Với độ tin cậy 95%,

24
20
hãy ước lượng tối đa tỉ lệ người có thu nhập cao ở công ty A.


Bài 2. Để thăm dò nhu cầu về một loại hàng ở một thành phố A, người ta tiến hành phỏng vấn

bộ
500 hộ gia đình ở đây thì thấy có 200 hộ có nhu cầu về loại hàng này.

i
nộ
1) Hãy ước lượng số hộ gia đình có nhu cầu về loại mặt hàng này ở thành phố A với độ tin cậy

nh
96%, biết thành phố A có 300.000 hộ gia đình.


2) Nếu ước lượng tỉ lệ hộ gia đình có nhu cầu về mặt hàng này ở thành phố A đạt độ chính xác

u

4% thì độ tin cậy của phép ước lượng là bao nhiêu?

3) Nếu muốn ước lượng tỉ lệ hộ gia đình có nhu cầu về mặt hàng này ở thành phố A đảm bảo

độ chính xác 5% với độ tin cậy là 99% thì cần điều tra ít nhất bao nhiêu hộ gia đình?

.H

Bài 3. Để đánh giá tác động của việc giảm lãi suất huy động vốn của ngân hàng H, ngân hàng
TS

này tiến hành điều tra lượng tiền mặt X huy động được trong một tháng (chục tỉ đồng/tháng) ở
một số chi nhánh của ngân hàng được chọn ngẫu nhiên và thu được bảng số liệu sau:
Trang 156
ƯỚC LƯỢNG KHOẢNG TIN CẬY

X 25–26 26–27 27–28 28–29 29–30 30–31 31–32 32–33

24
Số CN 21 37 69 87 85 53 42 31

20
1) Giám đốc ngân hàng H muốn ước lượng trung bình lượng tiền mặt huy động được trong một


tháng sau khi giảm lãi suất huy động vốn của một chi nhánh đạt độ chính xác 2 tỉ đồng/tháng

bộ
thì độ tin cậy của ước lượng là bao nhiêu?

i
nộ
2) Giám đốc ngân hàng H quyết định khen thưởng 150 triệu đồng cho mỗi chi nhánh có lượng

nh
tiền mặt huy động được trên 320 tỉ đồng/tháng. Với độ tin cậy 95%, hãy ước lượng lượng


tiền thưởng mà ngân hàng H phải chi cho những chi nhánh này. Biết rằng ngân hàng H có

u
1500 chi nhánh.


Bài 4. Sản suất 100 sản phẩm bằng một dây chuyền tự động ta thấy có 60 sản phẩm đạt tiêu

chuẩn.

.H

1) Hãy ước lượng tối đa tỉ lệ sản phẩm không đạt tiêu chuẩn của dây chuyền này với độ tin cậy
TS

95%.

2) Hãy ước lượng tối thiểu số sản phẩm không đạt tiêu chuẩn trong 5000 sản phẩm do dây
Trang 157
ƯỚC LƯỢNG KHOẢNG TIN CẬY

chuyền này sản xuất với độ tin cậy 95%.


Bài 5. Một mẫu khảo sát về trọng lượng của một loại trái cây (đơn vị: gram) ở vùng A năm

24
nay được kết quả như sau:

20
Trọng lượng Số trái


bộ
100– 200 5

i
nộ
200–300 45

nh
300–400 150


400–500 48

u

500–600 36

600–700 13

700– 800 3

.H

Cho biết trọng lượng của trái cây loại này ở vùng A năm nay là BNN có phân phối chuẩn.
TS

1) Hãy ước lượng trung bình trọng lượng của một trái cây loại này ở vùng A năm nay, với độ
tin cậy 95%.
Trang 158
ƯỚC LƯỢNG KHOẢNG TIN CẬY

2) Nếu muốn ước lượng trung bình trọng lượng của một trái cây loại này ở vùng A năm nay
đảm bảo độ chính xác 10 gram với độ tin cậy 96%, thì cần khảo sát thêm ít nhất bao nhiêu

24
trái nữa.

20

3) Những trái cây loại này có trọng lượng lớn hơn 400 gram là xuất khẩu được. Hãy ước lượng

bộ
tỉ lệ trái cây loại này ở vùng A năm nay xuất khẩu được với độ tin cậy 95%.

i
nộ
Bài 6. Tiến hành khảo sát lượng tiền mặt X (đơn vị: chục tỉ đồng/tháng) huy động được trong

nh
một tháng ở một số chi nhánh được chọn ngẫu nhiên của ngân hàng N, ta thu được bảng số liệu


sau

u
X

[25;26] (26;27] (27;28] (28;29] (29;30] (30;31] (31;32]

Số CN 35 43 59 67 69 53 30

1) Hãy ước lượng trung bình tối đa lượng tiền mặt huy động được trong một tháng của một chi

.H

nhánh của ngân hàng N, với độ tin cậy 98%.


TS

2) Giám đốc ngân hàng N muốn ước lượng tỉ lệ chi nhánh có lượng tiền huy động được trên
310 tỉ đồng/tháng đảm bảo độ chính xác 0,035 với độ tin cậy 95% thì có cần khảo sát thêm
Trang 159
ƯỚC LƯỢNG KHOẢNG TIN CẬY

một số chi nhánh nữa hay không? Nếu có thì cần khảo sát thêm ít nhất bao nhiêu chi nhánh
nữa?

24
20
Bài 7. Một mẫu khảo sát về doanh thu X (đơn vị: chục triệu đồng/tháng) của các hộ kinh doanh


mặt hàng C trong một vùng kết quả cho trong bảng sau:

bộ
X [0;1] (1;2] (2;3] (3;4] (4;5] (5;6] (6;7]

i
nộ
Số hộ 3 14 32 41 36 20 4

nh
Cho biết X là BNN có phân phối chuẩn.


1) Hãy ước lượng lợi nhuận trung bình của một hộ kinh doanh mặt hàng này của vùng trên

u

trong một tháng với độ tin cậy 95%. Biết rằng mức lợi nhuận khi kinh doanh mặt hàng này

khoảng 15% doanh thu.

2) Những hộ kinh doanh mặt hàng C của vùng này có doanh thu trên 480 triệu đồng/năm là

.H

những hộ có doanh thu cao. Với độ tin cậy 96%, nếu muốn ước lượng tỉ lệ hộ có doanh thu
TS

cao của vùng này đảm bảo độ chính xác 7% thì cần điều tra thêm bao nhiêu hộ nữa?

Bài 8. Người ta muốn biết trong hồ có bao nhiêu cá, để làm điều đó người ta bắt lên 2000 con
Trang 160
ƯỚC LƯỢNG KHOẢNG TIN CẬY

đánh dấu xong rồi thả xuống hồ và đảm bảo không ảnh hưởng đến sức khoẻ của chúng. Sau
một thời gian bắt lên 400 con ngẫu nhiên thì thấy có 80 con được đánh dấu. Hãy ước lượng số

24
cá trong hồ với độ tin cậy 99%.

20
Bài 9. Khảo sát về mức độ ô nhiễm ở một khu vực, người ta đo X (đơn vị là gram) là khối


lượng chất A có trong mỗi mẫu nước (1 lít) được khảo sát ở khu vực này, kết quả được như sau:

bộ
X [8;10] (10;12] (12;14] (14;16] (16;18] (18;20] (20;25]

i
nộ
Số mẫu 7 36 65 57 20 10 5

nh
Cho biết X là BNN có phân phối chuẩn.


u
1) Với độ tin cậy 95%, dựa vào số liệu trên hãy ước lượng trung bình khối lượng chất A có

trong một mẫu nước (1 lít) ở khu vực trên.

2) Nếu muốn ước lượng trung bình khối lượng chất A có trong một mẫu nước (1 lít) ở khu vực
trên đảm bảo độ chính xác 0,5 gram với độ tin cậy 95% thì cần khảo sát thêm ít nhất bao

.H

nhiêu mẫu nước nữa?


TS

Bài 10. Khảo sát về nhu cầu vay vốn X (đơn vị: triệu đồng) của một số hộ gia đình để thực
hiện một dự án ở địa phương A, ta được kết quả sau:
Trang 161
ƯỚC LƯỢNG KHOẢNG TIN CẬY

X [0;2] (2;4] (4;6] (6;8] (8;10] (10;12] (12;14]

24
Số hộ 7 20 68 105 36 15 5

20
Cho biết X là BNN có phân phối chuẩn.


bộ
1) Với độ tin cậy 95%, dựa vào khảo sát trên hãy ước lượng khoảng tin cậy cho nhu cầu vay

i
vốn bình quân của một hộ gia đình ở địa phương A đối với dự án nói trên.

nộ
nh
2) Nếu muốn ước lượng tỉ lệ hộ gia đình có nhu cầu vay vốn không quá 6 triệu đồng đối với dự


án nói trên ở địa phương A đạt độ chính xác 6,55% thì độ tin cậy đạt được là bao nhiêu?

u

Bài 11. Để đánh giá tác động của phân bón A đối với một loại trái cây. Một mẫu số liệu về

trọng lượng của các trái cây loại này được khảo sát sau khi sử dụng phân bón A như sau:

Trọng lượng 20-40 40-60 60-80 80-100 100-120 120-140 140-180



.H

Số trái 18 24 37 59 45 31 16
TS

Cho biết trọng lượng của trái cây loại này sau khi sử dụng phân bón A là BNN có phân phối
chuẩn.
Trang 162
ƯỚC LƯỢNG KHOẢNG TIN CẬY

1) Cho biết những trái cây có trọng lượng trên 80 (g) là những trái cây đạt chuẩn. Hãy ước
lượng số trái cây không đạt chuẩn có trong 1000 trái cây loại này sau khi sử dụng phân bón

24
A, với độ tin cậy 95%.

20

2) Với độ tin cậy 95%, để ước lượng trọng lượng trung bình của một trái cây loại này sau khi

bộ
sử dụng phân bón A đảm bảo độ chính xác là 3,8 (g), thì cần khảo sát thêm ít nhất bao nhiêu

i
nộ
trái nữa?

nh
3) Hãy ước lượng phương sai trọng lượng của trái cây loại này sau khi sử dụng phân bón A, với


độ tin cậy 95%.

u

Bài 12. Mẫu điều tra giá bán X (đơn vị là ngàn đồng/kg) của một loại nông sản trên thị trường

trong một số ngày gần đây được cho ở bảng sau:

X 11-13 13-15 15-17 17-19 19-21 21-23 23-25


.H

Số ngày 5 17 23 33 25 16 2
TS

Cho biết X tuân theo luật phân phối chuẩn.


Trang 163
ƯỚC LƯỢNG KHOẢNG TIN CẬY

1) Hãy ước lượng giá bán trung bình của loại nông sản này trên thị trường trong những ngày
gần đây, với độ tin cậy 98%.

24
20
2) Nếu muốn ước lượng giá bán trung bình của loại nông sản này trên thị trường trong những


ngày gần đây đảm bảo độ chính xác là 500 đồng với độ tin cậy 98% thì cần điều tra thêm

bộ
bao nhiêu ngày nữa?

i
nộ
Bài 13. Giả sử chỉ số thông minh (IQ) của học sinh lứa tuổi 12 – 15 có phân phối chuẩn. Đo

nh
IQ của 50 học sinh trường A, có số liệu như sau:


IQ 75 – 78 78 – 81 81 – 84 84 – 87 87 – 90 90 – 93

u
Số học sinh 3 Lư8 9 12 10 8

1) Với độ tin cậy 95%, chỉ số IQ trung bình thấp nhất của học sinh trường A là bao nhiêu?

2) Với độ tin cậy 95%, hãy ước lượng phương sai của chỉ số IQ của học sinh trường A?
.H
TS

Bài 14. Khảo sát chỉ tiêu X (cm) của một loại sản phẩm, người ta quan sát một mẫu và có kết
quả như sau:
Trang 164
ƯỚC LƯỢNG KHOẢNG TIN CẬY

X 11-15 15-19 19-23 23-27 27-31 31-35 35-39

24
Số sp 8 9 20 16 16 13 18

20
Giả sử X có phân phối chuẩn. Hãy


1) Ước lượng phương sai tối thiểu của X với độ tin cậy 95%, khi đã biết trung bình của tổng

bộ
thể µ = 25 cm;

i
nộ
2) Uớc lượng phương sai tối đa của X với độ tin cậy 95%, khi chưa biết trung bình của tổng

nh
thể µ.


u
Bài 15. Lãi suất trái phiếu hàng năm của một doanh nghiệp trong 5 năm qua là 12%; 10%;

15%; 13%; 14%. Biết rằng lãi suất trái phiếu của doanh nghiệp này là BNN có phân phối

chuẩn, với độ tin cậy 90% hãy ước lượng:

1) Phương sai lãi suất trái phiếu hàng năm của doanh nghiệp trên.

.H

2) Phương sai tối đa của lãi suất trái phiếu hàng năm của doanh nghiệp trên.
TS

Trang 165
TS
.H




u

nh
nộ
i bộ

20
24
Chương
5

24
20

bộ
KIỂM ĐỊNH GIẢ THUYẾT THỐNG

i
nộ
nh


u

Give me a lever long enough and a fulcrum on which to place it, and I shall move the world.
– Archimedes

5.1 Giả thuyết thống kê . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169



.H

5.2 Quy tắc kiểm định giả thuyết thống kê . . . . . . . . . . . . . . . . . . . . . . 173


TS

5.3 Các loại sai lầm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175


5.3.1 Thủ tục kiểm định giả thuyết thống kê . . . . . . . . . . . . . . . . . . 176
167
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

5.3.2 Phương pháp p−value kiểm định giả thuyết thống kê . . . . . . . . . . 177
5.4 Kiểm định giả thuyết thống kê về tham số của một tổng thể . . . . . . . . . . . 178

24
5.4.1 Kiểm định giả thuyết thống kê về giá trị trung bình của một tổng thể . . 178

20
5.4.2 Kiểm định giả thuyết thống kê về Tỉ lệ của một tổng thể . . . . . . . . 193


bộ
5.4.3 Kiểm định giả thuyết thống kê về Phương sai của một tổng thể . . . . . 197
5.5 So sánh tham số của hai tổng thể . . . . . . . . . . . . . . . . . . . . . . . . . 205

i
nộ
5.5.1 So sánh giá trị trung bình của hai tổng thể . . . . . . . . . . . . . . . . 205

nh
5.5.2 So sánh Tỉ lệ của hai tổng thể . . . . . . . . . . . . . . . . . . . . . . 219


5.5.3 So sánh Phương sai của hai tổng thể . . . . . . . . . . . . . . . . . . . 226

u
5.6
5.6.1

Tính xác suất sai lầm loại II . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
Khi Kiểm định giả thuyết về giá trị trung bình của tổng thể . . . . . . . 232

5.6.2 Khi Kiểm định giả thuyết về giá trị tỷ lệ của tổng thể . . . . . . . . . . 239
5.7 Xác định kích thước mẫu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243

.H

5.7.1 Cho Kiểm định giả thuyết về giá trị trung bình của tổng thể . . . . . . . 243
TS

5.7.2 Cho kiểm định giả thuyết về giá trị tỷ lệ của tổng thể . . . . . . . . . . 248
5.8 Bài tập tự luận . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251
Trang 168
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

24
Mục tiêu: Sau khi học xong chương này, sinh viên có khả năng giải quyết các vấn đề sau:

20
1) Hiểu và nắm rõ thủ tục kiểm định giả thuyết thống kê.


bộ
2) Thực hiện kiểm định các giả thuyết về giá trị trung bình, tỷ lệ và phương sai của một tổng

i
nộ
thể.

nh
3) Tính toán xác suất lỗi loại II và đưa ra quyết định chọn cỡ mẫu cho các thử nghiệm trên


trung bình, phương sai và tỷ lệ của tổng thể.

u

4) Thực hiện kiểm định các giả thuyết về giá trị trung bình, tỷ lệ và phương sai của hai tổng

thể.


.H

5.1 Giả thuyết thống kê


TS

Định nghĩa 5.1. Giả thuyết thống kê là giả thuyết về dạng phân phối xác suất của BNN hoặc
giả thuyết về các tham số đặc trưng của BNN, hoặc giả thuyết về tính độc lập của các BNN.
Trang 169
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

◆ Giả thuyết đưa ra được ký hiệu H0 được gọi là giả thuyết gốc hay giả thuyết không, và H1
được gọi là giả thuyết thay thế, giả thuyết đối lập, hay còn được gọi tắt là đối thuyết.

24
◆ H0 , H1 được gọi là cặp giả thuyết thống kê.

20
Ví dụ 5.1. Khi nghiên cứu về nhu cầu tiêu dùng điện hàng tháng của các hộ dân trên địa bàn


bộ
A. Ta có thể đưa ra các cặp giả thuyết thống kê như sau

i
nộ
i) H0 : Nhu cầu tiêu dùng điện hàng tháng của một hộ dân trên địa bàn A tuân theo phân phối

nh
chuẩn; H1 : Nhu cầu tiêu dùng điện hàng tháng của một hộ dân trên địa bàn A không tuân


theo phân phối chuẩn.

u

ii) H0 : Nhu cầu tiêu dùng điện trung bình hàng tháng của một hộ dân trên địa bàn A là 100

kw; H1 : Nhu cầu tiêu dùng điện trung bình hàng tháng của một hộ dân trên địa bàn A

không phải là 100 kw.



.H

iii) H0 : Nhu cầu tiêu dùng điện trung bình hàng tháng của một hộ dân trên địa bàn A là không
TS

quá 120 kw; H1 : Nhu cầu tiêu dùng điện trung bình hàng tháng của một hộ dân trên địa
bàn A là trên 120 kw.
Trang 170
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

◆ Do các giả thuyết thống kê có thể đúng hoặc có thể sai, nên cần tìm ra cơ sở cho việc thừa
nhận hoặc bác bỏ các giả thuyết đó. Việc này được gọi là kiểm định giả thuyết thống kê.

24
◆ Trong tổng quát, cho biến ngẫu nhiên X có hàm phân bố xác suất F (x, θ), trong đó θ là

20
tham số chưa biết. Giả sử ta cần kiểm định cặp giả thuyết H0 : θ ∈ Θ0 , H1 : θ ∈ Θ1 , trong đó


bộ
Θ0 và Θ1 là các tập con không giao nhau của Θ (là tập hợp tất cả các giá trị của tham số θ) và

i
Θ0 ∪ Θ1 = Θ. Một quy trình nhằm kiểm định θ ∈ Θ0 hoặc θ ∈ Θ1 dựa trên mẫu quan sát được

nộ
từ tổng thể của X được gọi là kiểm định giả thuyết về tham số của tổng thể.

nh
◆ Trong trường hợp cần nghiên cứu tham số θ của một tổng thể của biến X, thì ta có các loại


kiểm định như sau

u


1) Kiểm định cặp giả thuyết có dạng



H0

 : θ = θ0 ;
.H

: θ ̸= θ0 .

H1

TS

được gọi là kiểm định hai phía.


Trang 171
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

2) Kiểm định cặp giả thuyết có dạng


24
H0 : θ ≤ θ0 ;

H0

 : θ = θ0 hoặc

20

H1

 : θ > θ0 .


hoặc

bộ

H0 : θ ≥ θ0 ;

H0 : θ = θ0 hoặc

i

nộ

H1

: θ < θ0 .

nh


được gọi là kiểm định một phía.

u
Chú ý 5.1. Trong một số bài toán, cách thiết lập giả thuyết không và giả thuyết đối có thể

không hiển nhiên. Để thiết lập cặp giả thuyết đúng đắn, ta cần phải thực hành và cẩn trọng khi

thiết lập cặp giả thuyết một cách phù hợp sao cho kết luận thu được của kiểm định cung cấp
thông tin mà người nghiên cứu hoặc người ra quyết định yêu cầu.

.H

Ví dụ 5.2. Một mẫu ô tô của hãng X tiêu thụ trung bình 6,8 lít xăng trên 100 km. Nhóm nghiên
TS

cứu của hãng X đã nghiên cứu và phát triển thành công một hệ thống phun xăng mới cho mẫu
ô tô này để tăng số km trên 6,8 lít xăng. Để đánh giá hệ thống này, họ cho lắp đặt và vận hành
Trang 172
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

thử hệ thống này trên một số xe. Ở đây, mục tiêu của nhóm nghiên cứu sản phẩm là tìm bằng
chứng để kết luận rằng hệ thống phun xăng mới làm tăng số km trên 6,8 lít xăng. Trong trường

24
hợp này, giả thuyết nghiên cứu là hệ thống phun xăng mới sẽ cho số km trung bình (µ) trên 6,8

20
lít xăng lớn hơn 100 km; nghĩa là µ > 100. Như vậy, giả thuyết không và giả thuyết đối phù


bộ
hợp với nghiên cứu này là:

i
: µ ≤ 100;

H0

nộ

nh

H1

 : µ > 100.


Nếu kết quả từ mẫu quan sát cho thấy chưa đủ cơ sở để bác bỏ H0 , thì nhóm nghiên cứu không

u
thể kết luận rằng hệ thông phun xăng mới tốt hơn. Do đó, nhóm nghiên cứu cần nâng cấp hệ

thống và kiểm tra thêm. Ngược lại, nếu có đủ cơ sở để bác bỏ giả thuyết H0 với kích thước mẫu

đủ lớn, thì hãng nên xem xét sản xuất hệ thống phun xăng mới này rộng rãi.

5.2 Quy tắc kiểm định giả thuyết thống kê


.H
TS

◆ Quy tắc chung để thực hiện một quá trình kiểm định giả thuyết thống kê là
i) Giả sử H0 đúng;
Trang 173
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

ii) Dựa vào thông tin của mẫu được chọn ngẫu nhiên từ tổng thể, ta tìm được biến cố A phù
hợp với cặp giả thuyết đang kiểm định sao cho P (A) = α , α đủ nhỏ để có thể coi biến cố

24
A không xảy ra trong 1 phép thử của biến cố này;

20
iii) Thực hiện một phép thử trên mẫu quan sát, nếu biến cố A xảy ra thì chứng tỏ H0 sai và bác


bộ
bỏ nó; trong trường hợp ngược lại thì ta chưa có đủ cơ sở để bác bỏ H0 .

i
nộ
◆ Các bước thực hiện quy trình kiểm định giả thuyết thống kê tổng quát:

nh
★ Bước 1. Lập mẫu ngẫu nhiên WX = (X1 , X2 , . . . , Xn ) cỡ n từ tổng thể của X và chọn thống


kê Z (được là tiêu chuẩn kiểm định) phụ thuộc vào tham số θ :

u

Z(X, θ) = f (X1 , X2 , . . . , Xn , θ)

sao cho nếu H0 đúng thì quy luật phân phối xác suất của Z hoàn toàn xác định.

★ Bước 2. Tìm miền Wα sao cho P (Z ∈ Wα ) = α nếu giả thuyết H0 đúng, tức là

.H

P (Z ∈ Wα | H0 ) = α.
TS

Vì α nhỏ, nên theo nguyên lý xác suất nhỏ có thể coi Z không nhận giá trị trong miền Wα đối
với một phép thử.
Trang 174
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

★ Bước 3. Thực hiện một phép thử đối với mẫu ngẫu nhiên WX ta thu được mẫu quan sát cụ
thể

24
Wx = (x1 , x2 , . . . , xn )

20
và tính được giá trị cụ thể của tiêu chuẩn kiểm định Z trong Bước 1, gọi là giá trị quan sát, ký


bộ
hiệu là z hay zqs .

i
★ Bước 4. Xét xem giá trị quan sát z có thuộc miền Wα hay không để kết luận.

nộ
1) Nếu z ∈ Wα thì có cơ sở để bác bỏ giả thuyết H0 , tức là thừa nhận H1 .

nh

2) Nếu z ∈
/ Wα thì chưa có cơ sở để bác bỏ giả thuyết H0 .

u
5.3 Các loại sai lầm Lư

◆ Sai lầm loại 1: bác bỏ H0 khi H0 đúng. Xác suất xảy ra sai lầm loại 1

P (Z ∈ Wα | H0 ) = α.
.H
TS

◆ Sai lầm loại 2: chấp nhận H0 khi H0 sai

P (Z ∈
/ Wα | H1 ) = β,
Trang 175
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

suy ra
P (Z ∈ Wα | H1 ) = 1 − β,

24
20
nghĩa là xác suất bác bỏ H0 khi nó sai là 1 − β, ta còn gọi 1 − β là lực kiểm định.
✼ Để xác định được miền tiêu chuẩn kiểm định Wα (hay còn được gọi là miền bác bỏ) ta phải


bộ
đồng thời hạn chế tối đa việc mắc phải 2 sai lầm trên, nghĩa là cực tiểu hoá các xác suất mắc

i
sai lầm loại 1 và sai lầm loại 2. Trong thực tế, việc này khó thực hiện, nên người ta thường cho

nộ
phép được mắc sai lầm loại 1 ở một mức xác suất α nào đó (còn được gọi là mức ý nghĩa α) và

nh
sau đó cực tiểu hoá mức xác suất xảy ra sai lầm loại 2.


✼ Việc xác định mức xác suất xảy ra sai lầm loại 1, dựa nhiều vào kinh nghiệm của các chuyên

u
gia và nhu cầu của nhà nghiên cứu. Lư

5.3.1 Thủ tục kiểm định giả thuyết thống kê


1) Phát biểu giả thuyết H0 và đối thuyết H1 .


.H
TS

2) Chọn tiêu chuẩn kiểm định Z.

3) Định rõ mức ý nghĩa α (xác suất mắc sai lầm loại I) và xác định miền bác bỏ giả thuyết H0
Trang 176
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

là Wα .

4) Tính giá trị quan sát Z của tiêu chuẩn kiểm định từ mẫu quan sát được.

24
20
5) Kết luận có cơ sở để bác bỏ H0 hay chưa có cơ sở để bác bỏ H0 dựa vào việc Z có thuộc Wα


hay không.

bộ
5.3.2 Phương pháp p−value kiểm định giả thuyết thống kê

i
nộ
Định nghĩa 5.2. p−value của thống kê Z là mức xác suất nhỏ nhất có thể bác bỏ được giả

nh
thuyết H0 khi sử dụng tiểu chuẩn kiểm định Z, dựa trên mẫu quan sát đã cho.


Khi p−value của tiêu chuẩn kiểm định Z được xác định, với mức ý nghĩa α cho trước, thì ta có

u
thể kết luận như sau: Lư

i) p − value ≤ α =⇒ có cơ sở để bác bỏ H0 .

ii) p − value > α =⇒ chưa có cơ sở để bác bỏ H0 .



.H

Ví dụ 5.3. Cho thống kê Z có phân phối xác suất xác định. Giá trị của Z được tính dựa trên
TS

mẫu quan sát Wx = (x1 , x2 , . . . , xn ) của tổng thể của biến X là z = Z(x1 , x2 , . . . , xn ). Thì
p−value của thống kê Z được xác định như sau:
Trang 177
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

i) Với H1 : θ > θ0 , ta có p−value = P (Z ≥ z);

ii) Với H1 : θ < θ0 , ta có p−value = P (Z ≤ z);

24
20
iii) Với H1 : θ ̸= θ0 , ta có


bộ
≥ z), khi P (Z ≥ z) < 0, 5,

2P (Z


p − value = 

i
2P (Z

≤ z), khi P (Z ≤ z) > 0, 5.

nộ

nh
Trong trường hợp thống kê Z có phân phối chuẩn tắc hoặc Student thì với H1 : θ ̸= θ0 , ta có


p−value = 2P (Z ≥ |z|).

u
5.4 Lư
Kiểm định giả thuyết thống kê về tham số của một tổng thể

5.4.1 Kiểm định giả thuyết thống kê về giá trị trung bình của một tổng thể

◆ Bài toán: Giả sử tổng thể của X có phân phối chuẩn với µ = E(X) chưa biết. Với mức ý

.H

nghĩa α, hãy tiến hành kiểm định các cặp giả thuyết so sánh µ với µ0 trong các trường hợp sau,
TS

trong đó µ0 là giá trị trung bình của tổng thể đã được cho trước.
◆ Các bước thực hiện kiểm định
Trang 178
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

★ Trường hợp 1. Đã biết phương sai σ 2

24
1) Xác định cặp giả thuyết H0 , H1 .

20
2) Tìm (các) giá trị tới hạn tương ứng.


x − µ0 √

bộ
3) Tính giá trị thống kê kiểm định: z = n.
σ

i
nộ
4) Kết luận
Giả thuyết không Giả thuyết đối Tiêu chuẩn bác bỏ H0

nh
H1 : µ ̸= µ0 |z| > zα/2


H0 : µ = µ 0
H0 : µ ≤ µ 0 H1 : µ > µ0 z > zα

u
H0 : µ ≥ µ 0 Lư H1 : µ < µ0 z < −zα

★ Trường hợp 2. Chưa biết phương sai σ 2 và n ≥ 30

1) Xác định cặp giả thuyết H0 , H1 .


.H

2) Tìm (các) giá trị tới hạn tương ứng.


TS

x − µ0 √
3) Tính giá trị thống kê kiểm định: z = n.
s
Trang 179
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

4) Kết luận

24
Giả thuyết không Giả thuyết đối Tiêu chuẩn bác bỏ H0

20
H0 : µ = µ 0 H1 : µ ̸= µ0 |z| > zα/2


H0 : µ ≤ µ 0 H1 : µ > µ0 z > zα

bộ
H0 : µ ≥ µ 0 H1 : µ < µ0 z < −zα

i
nộ
nh
❀ Các hình bên dưới biểu diễn các miền bác bỏ của các trường hợp trên.


u
H1 : µ ̸= µ0


α α

2 2

.H

−zα/2 zα/2
TS

z
Miền bác bỏ Miền bác bỏ

Trang 180
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

H1 : µ > µ0

24
20
α


bộ

i
z

nộ
Miền bác bỏ

nh

H1 : µ < µ0

u
α Lư

−zα

.H

z
Miền bác bỏ
TS

★ Trường hợp 3. Chưa biết phương sai σ 2 và n < 30


Trang 181
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

1) Xác định cặp giả thuyết H0 , H1 .

24
20
2) Tìm (các) giá trị tới hạn tương ứng.


bộ
x − µ0 √
3) Tính giá trị thống kê kiểm định: t = n.

i
nộ
s

nh

4) Kết luận

u
Giả thuyết không
Lư Giả thuyết đối Tiêu chuẩn bác bỏ H0

H0 : µ = µ 0 H1 : µ ̸= µ0 |t| > t(n−1;α/2)

H0 : µ ≤ µ 0 H1 : µ > µ0 t > t(n−1;α)


H0 : µ ≥ µ 0 H1 : µ < µ0 t < −t(n−1;α)


.H
TS

❀ Các hình bên dưới biểu diễn các miền bác bỏ của các trường hợp trên.
Trang 182
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

H1 : µ ̸= µ0

24
α α

20
2 2


bộ
−t(n−1,α/2) t(n−1,α/2)

i
z

nộ
Miền bác bỏ Miền bác bỏ

nh

u
H1 : µ > µ0


α

.H

t(n−1,α)
TS

z
Miền bác bỏ

Trang 183
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

H1 : µ < µ0

24
20
α


bộ
−t(n−1,α)

i
z

nộ
Miền bác bỏ

nh

Ví dụ 5.4. Một loại nước ngọt đóng chai, trên nhãn ghi thể tích thực là 2 lít. Người ta tiến hành

u

khảo sát ngẫu nhiên 200 chai nước ngọt loại này, thì nhận thấy thể tích thực trung bình của một
chai là 1,98 lít với độ lệch tiêu chuẩn là 0,06 lít. Với mức ý nghĩa 5%, hãy cho kết luận về ý

kiến cho rằng thể tích thực trung bình của một chai nước ngọt loại này không phải là 2 lít.

Giải. Ta có n = 200, x = 1, 98 và s = 0, 06. Gọi µ là thể tích thực trung bình của một chai
.H

nước ngọt loại này (lít).


TS

1) Xét cặp giả thuyết sau: H0 : µ = 2 và H1 : µ ̸= 2;


Trang 184
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

1−α
2) Tìm giá trị tới hạn: α = 0, 05 =⇒ φ(zα/2 ) = = 0, 457 =⇒ zα/2 = 1, 96;
2

24
3) Tính giá trị thống kê kiểm định:

20
x − µ0 √ 1, 98 − 2 √
z= n= 200 = −4, 71.


s 0, 06

bộ
4) Ta thấy rằng

i
nộ
H1 : µ ̸= 2

nh

α α

u
= 0, 025 = 0, 025
2
Lư 2

−zα/2 = −1, 96 zα/2 = 1, 96


z

Miền bác bỏ Miền bác bỏ


.H
TS

Kết luận: Có cơ sở để bác bỏ H0 với mức ý nghĩa 5%; nghĩa là có cơ sở để cho rằng thể tích
thực trung bình của một chai nước ngọt loại này không phải là 2 lít với mức ý nghĩa 5%.
Trang 185
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Ví dụ 5.5. Một loại nước ngọt đóng chai, trên nhãn ghi thể tích thực là 2 lít. Chủ hãng trên
tuyên bố rằng thể tích thực trung bình trong một chai nước ngọt loại này còn cao hơn giá trị

24
ghi trên nhãn, người ta tiến hành khảo sát ngẫu nhiên 200 chai thì nhận thấy thể tích thực trung

20
bình của một chai là 2,005 lít với độ lệch tiêu chuẩn là 0,04 lít. Với mức ý nghĩa 3%, hãy cho


kết luận về tuyên bố của chủ hãng.

i bộ
Giải. Ta có n = 200, x = 2, 005 và s = 0, 04. Gọi µ là thể tích thực của một chai nước ngọt

nộ
loại này (lít).

nh

1) Xét cặp giả thuyết sau: H0 : µ ≤ 2 và H1 : µ > 2;

u

2) Tìm giá trị tới hạn: α = 0, 03 =⇒ φ(zα ) = 0, 5 − α = 0, 47 =⇒ zα = 1, 88;

3) Tính giá trị thống kê kiểm định:


x − µ0 √ 2, 005 − 2 √
.H

z= n= 200 = 1, 77.
s 0, 04
TS

4) Ta thấy rằng
Trang 186
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

H1 : µ > 2

24
20
α = 0, 03


bộ
zα = 1, 88

i
z

nộ
Miền bác bỏ

nh

Kết luận: Chưa có cơ sở để bác bỏ H0 với mức ý nghĩa 3%; nghĩa là thể tích thực của chai

u
nước ngọt không cao hơn 2 lít với mức ý nghĩa 3%.

Ví dụ 5.6. Một loại nước ngọt đóng chai, trên nhãn ghi thể tích thực là 2 lít. Nghi ngờ thể tích

thực trong một chai nước ngọt loại này thấp hơn so với giá trị ghi trên nhãn, người ta tiến hành

khảo sát ngẫu nhiên 200 chai thì nhận thấy thể tích thực trung bình của một chai là 1,98 lít với

.H

độ lệch tiêu chuẩn là 0,04 lít. Với mức ý nghĩa 1%, hãy cho kết luận về nghi ngờ trên.
TS

Giải. Ta có n = 200, x = 1, 98 và s = 0, 04. Gọi µ là thể tích thực của chai nước ngọt.
1) Xét cặp giả thuyết: H0 : µ ≥ 2 và H1 : µ < 2;
Trang 187
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

2) Tìm giá trị tới hạn: α = 0, 01 =⇒ φ(zα ) = 0, 5 − α = 0, 49 =⇒ zα = 2, 33;

24
3) Tính giá trị thống kê kiểm định:

20
x − µ0 √ 1, 98 − 2 √
z= n= 200 = −7, 07.


s 0, 04

bộ
4) Ta thấy rằng

i
nộ
H1 : µ < 2

nh

u
α = 0, 01


−zα = −2, 33
z

Miền bác bỏ
.H
TS

Kết luận: Có cơ sở để bác bỏ H0 với mức ý nghĩa 1%; nghĩa là có cơ sở để cho rằng thể tích
thực trung bình của một chai nước ngọt loại này là dưới 2 lít với mức ý nghĩa 1%.
Trang 188
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Ví dụ 5.7. Năng suất lúa trung bình của tỉnh A năm nay ước tính đạt 51 tạ/ha. Có ý kiến cho
rằng, năng suất lúa trung bình ở xã B (thuộc tỉnh A) không phải là 51 tạ/ha. Để kiểm tra, người

24
ta tiến hành khảo sát ngẫu nhiên 15 ha ruộng lúa ở xã B và thấy rằng năng suất lúa trung bình

20
là 50,5 tạ/ha và độ lệch chuẩn là 2 tạ/ha. Biết năng suất lúa ở tỉnh A có phân phối chuẩn. Với


mức ý nghĩa 5%, hãy cho kết luận về ý kiến trên.

i bộ
nộ
Giải. Ta có n = 15, x = 50, 5 và s = 2. Gọi µ là năng suất lúa trung bình ở xã B (tạ/ha).

nh
1) Xét cặp giả thuyết: H0 : µ = 51 và H1 : µ ̸= 51;


u

2) Tìm giá trị tới hạn: α = 0, 05 =⇒ t(n−1;α/2) = t(14;0,025) = 2, 145;

3) Tính giá trị thống kê kiểm định:


x − µ0 √ 50, 5 − 51 √
.H

t= n= 15 = −0, 97.
s 2
TS

4) Ta thấy rằng
Trang 189
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

H1 : µ ̸= 51

24
α α

20
= 0, 025 = 0, 025
2 2


bộ
−t(n−1,α/2) = −2, 145 t(n−1,α/2) = 2, 145

i
nộ
t
Miền bác bỏ Miền bác bỏ

nh

Kết luận: Chưa có cơ sở để bác bỏ H0 với mức ý nghĩa 5%; nghĩa là chưa có cơ sở để cho rằng

u
năng suất lúa trung bình ở xã B (thuộc tỉnh A) là khác 51 tạ/ha với mức ý nghĩa 5%.

Ví dụ 5.8. Năng suất lúa trung bình của tỉnh A năm nay ước tính đạt 51 tạ/ha. Có ý kiến cho

rằng, năng suất lúa trung bình ở xã B (thuộc tỉnh A) cao hơn năng suất lúa trung bình của tỉnh.
Để kiểm tra, người ta tiến hành khảo sát ngẫu nhiên 15 ha ruộng lúa ở xã B và thấy rằng năng

.H

suất lúa trung bình là 52 tạ/ha và độ lệch chuẩn là 4 tạ/ha. Biết năng suất lúa ở tỉnh A có phân
TS

phối chuẩn. Với mức ý nghĩa 3%, hãy cho kết luận về ý kiến trên.
Giải. Ta có n = 15, x = 52 và s = 4. Gọi µ là năng suất lúa trung bình ở xã B (tạ/ha).
Trang 190
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

1) Xét cặp giả thuyết: H0 : µ ≤ 51 và H1 : µ > 51;

2) Tìm giá trị tới hạn: α = 0, 03 =⇒ t(n−1;α) = t(14;0,03) = 2, 046;

24
20
3) Tính giá trị thống kê kiểm định:


x − µ0 √ 52 − 51 √
t= n= 15 = 0, 97.

bộ
s 4

i
nộ
4) Ta thấy rằng

nh
H1 : µ > 51


u
Lư α = 0, 03

t(n−1,α) = 2, 046
t

.H

Miền bác bỏ
TS

Kết luận: Chưa có cơ sở để bác bỏ H0 với mức ý nghĩa 3%; nghĩa là chưa có cơ sở để cho rằng
năng suất lúa trung bình ở xã B (thuộc tỉnh A) cao hơn 51 tạ/ha với mức ý nghĩa 3%.
Trang 191
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Ví dụ 5.9. Năng suất lúa trung bình của tỉnh A năm nay ước tính đạt 51 tạ/ha. Có ý kiến cho
rằng, năng suất lúa trung bình ở xã B (thuộc tỉnh A) thấp hơn năng suất lúa trung bình của tỉnh.

24
Để kiểm tra, người ta tiến hành khảo sát ngẫu nhiên 15 ha ruộng lúa ở xã B và thấy rằng năng

20
suất lúa trung bình là 50,5 tạ/ha và độ lệch chuẩn là 4 tạ/ha. Biết năng suất lúa ở tỉnh A có phân


phối chuẩn. Với mức ý nghĩa 1%, hãy cho kết luận về ý kiến trên.

i bộ
nộ
Giải. Ta có n = 15, x = 50, 5 và s = 4. Gọi µ là năng suất lúa trung bình ở xã B.

nh
1) Xét cặp giả thuyết: H0 : µ ≥ 51 và H1 : µ < 51;


u

2) Tìm giá trị tới hạn: α = 0, 01 =⇒ t(n−1;α) = t(14;0,01) = 2, 624;

3) Tính giá trị thống kê kiểm định:


x − µ0 √ 50, 5 − 51 √
.H

t= n= 15 = −0, 48.
s 4
TS

4) Ta thấy rằng
Trang 192
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

H1 : µ < 51

24
20
α = 0, 01


bộ
−t(n−1,α) = −2, 624

i
nộ
t
Miền bác bỏ

nh

Kết luận: Chưa có cơ sở để bác bỏ H0 với mức ý nghĩa 1%; nghĩa là chưa có cơ sở để cho rằng

u

năng suất lúa trung bình ở xã B (thuộc tỉnh A) thấp hơn 51 tạ/ha với mức ý nghĩa 1%.

5.4.2 Kiểm định giả thuyết thống kê về Tỉ lệ của một tổng thể

◆ Bài toán: Giả sử p là tỉ lệ các phần tử có tính chất A nào đó của tổng thể của X có phân phối

.H

chuẩn. Với mức ý nghĩa α, hãy thực hiện kiểm định các cặp giả thuyết so sánh p với p0 trong
TS

các trường hợp sau, trong đó p0 là tỉ lệ tổng thể đã được cho trước.
Lưu ý: Các trường hợp kiểm định so sánh tỉ lệ của một tổng thể với tỉ lệ hằng p0 chỉ đáng tin
Trang 193
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

cậy khi kích thước mẫu được khảo sát là khá lớn.
◆ Các bước thực hiện kiểm định

24
20
1) Xác định cặp giả thuyết H0 , H1 .


bộ
2) Tìm (các) giá trị tới hạn tương ứng.

i
f − p0 √ m

nộ
3) Tính giá trị thống kê kiểm định: z = q n, trong đó f = là tỉ lệ phần tử có
p0 (1 − p0 ) n

nh
tính chất A của mẫu.


u
4) Kết luận
Giả thuyết không Lư Giả thuyết đối Tiêu chuẩn bác bỏ H0

H0 : p = p0 H1 : p ̸= p0 |z| > zα/2

H0 : p ≤ p0 H1 : p > p0 z > zα

H0 : p ≥ p0 H1 : p < p0 z < −zα


.H
TS

Ví dụ 5.10. Có ý kiến cho rằng tỉ lệ phế phẩm của một lô hàng là 3%. Khảo sát ngẫu nhiên
400 sản phẩm của lô hàng này thì thấy có 14 phế phẩm. Với mức ý nghĩa 5%, hãy cho nhận xét
Trang 194
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

về ý kiến trên. Biết rằng chỉ tiêu đánh giá chất lượng sản phẩm của lô hàng trên có phân phối
chuẩn.

24
14

20
Giải. Ta có f = = 0, 035. Gọi p là tỉ lệ phế phẩm của lô hàng trên.
400


1) Xét cặp giả thuyết: H0 : p = 0, 03 và H1 : p ̸= 0, 03;

bộ
1−α
2) Tìm giá trị tới hạn: α = 0, 05 =⇒ φ(zα/2 ) = = 0, 457 =⇒ zα/2 = 1, 96;

i
2

nộ
3) Tính giá trị thống kê kiểm định:

nh
f − p0 √ 0, 035 − 0, 03 √


z=q n= q 400 = 0, 5862;
f (1 − f ) 0, 035(1 − 0, 035)

u

4) Ta thấy rằng |z| = 0, 5862 < zα/2 = 1, 96.

Kết luận: Chưa có cơ sở để bác bỏ H0 với mức ý nghĩa 5%; nghĩa là chưa có cơ sở để cho rằng
tỉ lệ phế phẩm của lô hàng trên là khác 3% với mức ý nghĩa 5%.

.H

Ví dụ 5.11. Có ý kiến cho rằng tỉ lệ phế phẩm của một lô hàng cao hơn 2%. Khảo sát ngẫu
TS

nhiên 400 sản phẩm của lô hàng này thì thấy có 14 phế phẩm. Với mức ý nghĩa 5%, hãy cho
nhận xét về ý kiến trên.
Trang 195
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

14
Giải. Ta có f = = 0, 035. Gọi p là tỉ lệ phế phẩm của lô hàng trên.
400

24
1) Xét cặp giả thuyết: H0 : p ≤ 0, 02 và H1 : p > 0, 02;

20
2) Tìm giá trị tới hạn: α = 0, 05 =⇒ φ(zα ) = 0, 5 − α = 0, 45 =⇒ zα = 1, 65;


bộ
3) Tính giá trị thống kê kiểm định:

i
nộ
f − p0 √ 0, 035 − 0, 02 √
z= q n= q 400 = 2, 1429;

nh
f (1 − f ) 0, 035(1 − 0, 035)


4) Ta thấy rằng z = 2, 1429 > zα = 1, 65.

u

Kết luận: Có cơ sở để bác bỏ H0 với mức ý nghĩa 5%; nghĩa là có cơ sở để cho rằng tỉ lệ phế

phẩm của lô hàng trên là cao hơn 2% với mức ý nghĩa 5%.

Ví dụ 5.12. Có ý kiến cho rằng tỉ lệ phế phẩm của một lô hàng thấp hơn 4%. Khảo sát ngẫu

.H

nhiên 400 sản phẩm của lô hàng này thì thấy có 14 phế phẩm. Với mức ý nghĩa 5%, hãy cho
nhận xét về ý kiến trên.
TS

14
Giải. Ta có f = = 0, 035. Gọi p là tỉ lệ phế phẩm của lô hàng.
400
Trang 196
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

1) Xét cặp giả thuyết: H0 : p ≥ 0, 04 và H1 : p < 0, 04;

2) Tìm giá trị tới hạn: α = 0, 05 =⇒ φ(zα ) = 0, 5 − α = 0, 45 =⇒ zα = 1, 65;

24
20
3) Tính giá trị thống kê kiểm định:


f − p0 √ 0, 035 − 0, 04 √

bộ
z= q n= q 400 = −0, 5103;
f (1 − f ) 0, 035(1 − 0, 035)

i
nộ
4) Ta thấy rằng z = −0, 5103 > −zα = −1, 65.

nh
Kết luận: Chưa có cơ sở để bác bỏ H0 với mức ý nghĩa 5%; nghĩa là chưa có cơ sở để cho rằng


tỉ lệ phế phẩm của lô hàng trên thấp hơn 4% với mức ý nghĩa 5%.

u
5.4.3 Lư
Kiểm định giả thuyết thống kê về Phương sai của một tổng thể

◆ Bài toán: Giả sử tổng thể của X có phân phối chuẩn với σ 2 = V ar(X) chưa biết. Với mức
ý nghĩa α, hãy thực hiện kiểm định các cặp giả thuyết so sánh σ 2 với σ02 trong các trường hợp

.H

sau, trong đó σ02 là phương sai của tổng thể đã được cho trước.
TS

◆ Các bước thực hiện kiểm định


★ Trường hợp: µ chưa biết
Trang 197
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

1) Xác định cặp giả thuyết H0 , H1 .

24
2) Tìm (các) giá trị tới hạn tương ứng.

20
2(n − 1)s2
3) Tính giá trị thống kê kiểm định: χ = .
σ02


bộ
4) Kết luận

i
nộ
Giả thuyết không Giả thuyết đối Tiêu chuẩn bác bỏ H0
H0 : σ 2 = σ02 H1 : σ 2 ̸= σ02 χ2 > χ2(n−1;α/2) hoặc χ2 < χ2(n−1;1−α/2)

nh
H0 : σ 2 ≤ σ02 H1 : σ 2 > σ02 χ2 > χ2(n−1;α)


H0 : σ 2 ≥ σ02 H1 : σ 2 < σ02 χ2 < χ2(n−1;1−α)

u
★ Trường hợp: µ đã biết


1) Xác định cặp giả thuyết H0 , H1 .



.H

2) Tìm (các) giá trị tới hạn tương ứng.


n
TS

ni (xi − µ)2
X

i=1
3) Tính giá trị thống kê kiểm định: χ2 = .
σ02
Trang 198
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

4) Kết luận

24
Giả thuyết không Giả thuyết đối Tiêu chuẩn bác bỏ H0

20
H0 : σ 2 = σ02 H1 : σ 2 ̸= σ02 χ2 > χ2(n;α/2) hoặc χ2 < χ2(n;1−α/2)


H0 : σ 2 ≤ σ02 H1 : σ 2 > σ02 χ2 > χ2(n;α)

bộ
H0 : σ 2 ≥ σ02 H1 : σ 2 < σ02 χ2 < χ2(n;1−α)

i
nộ
nh
❀ Các hình bên dưới biểu diễn các miền bác bỏ của trường hợp µ chưa biết; đối trường


hợp khác thì biễu diễn hình tương tự.

u
LưH1 : σ 2 ̸= σ02

α α
2 2

.H

χ2(n−1;1−α/2) χ2(n−1;α/2)
TS

χ2
Miền bác bỏ Miền bác bỏ

Trang 199
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

H1 : σ 2 > σ02

24
α
2

20

bộ
χ2(n−1;α)
χ2

i
nộ
Miền bác bỏ

nh
H1 : σ 2 < σ02


α

u
2



χ2(n−1;1−α)
χ2

Miền bác bỏ
.H
TS

Ví dụ 5.13. Một dây chuyền được thiết kế với độ lệch chuẩn đường kính sản phẩm là 0,2 cm.
Khảo sát ngẫu nhiên 45 sản phẩm của dây chuyền thì nhận thấy độ lệch chuẩn đường kính là
Trang 200
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

0,3 cm. Với mức ý nghĩa 5%, có thể cho rằng độ lệch chuẩn đường kính sản phẩm đã thay đổi
so với thiết kế hay không?

24
20
Giải. Gọi σ là độ lệch chuẩn đường kính sản phẩm (cm).


bộ
1) Xét cặp giả thuyết: H0 : σ 2 = 0, 22 và H1 : σ 2 ̸= 0, 22 ;

i
nộ
2) Tìm các giá trị tới hạn:

nh

χ21 = χ2(n−1;1−α/2) = χ2(44;0,975) = 27, 575;

u
χ22 = χ2(n−1;α/2) = χ2(44;0,025) = 64, 201;


3) Tính giá trị thống kê kiểm định:


(n − 1)s2 (45 − 1)0, 32


.H

2
χ = = = 99;
σ02 0, 22
TS

4) Ta thấy rằng χ2 > χ22 = 64, 201.


Trang 201
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

H1 : σ 2 ̸= 0, 22

24
α α
2 = 0, 025 2 = 0, 025

20

bộ
χ21 = 27, 575 χ22 = 64, 201
χ2

i
nộ
Miền bác bỏ Miền bác bỏ

nh
Kết luận: Có cơ sở để bác bỏ H0 với mức ý nghĩa 5%; nghĩa là có cơ sở để cho rằng độ lệch


chuẩn đường kính sản phẩm đã thay đổi so với thiết kế với mức ý nghĩa 5%.

u

Ví dụ 5.14. Một dây chuyền được thiết kế với độ lệch chuẩn đường kính sản phẩm là 0,2 cm.

Khảo sát ngẫu nhiên 45 sản phẩm của dây chuyền thì nhận thấy độ lệch chuẩn đường kính là

0,3 cm. Với mức ý nghĩa 5%, có thể cho rằng độ đồng đều về đường kính sản phẩm đã giảm so

với lúc thiết kế hay không?


.H
TS

Giải. Gọi σ là độ lệch chuẩn đường kính sản phẩm (cm).

1) Xét cặp giả thuyết: H0 : σ 2 ≤ 0, 22 và H1 : σ 2 > 0, 22 ;


Trang 202
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

2) Tìm giá trị tới hạn: χ21 = χ2(n−1;α) = χ2(44;0,05) = 60, 481;

3) Tính giá trị thống kê kiểm định:

24
(n − 1)s2 (45 − 1)0, 32

20
2
χ = = = 99;
σ02 0, 22


bộ
4) Ta thấy rằng χ21 = 60, 481 < χ2 = 99 .

i
nộ
H1 : σ 2 > 0, 22
α = 0, 05

nh

u

χ21 = 64, 481
χ2

Miền bác bỏ

Kết luận: Có cơ sở để bác bỏ H0 với mức ý nghĩa 5%; nghĩa là có cơ sở để cho rằng độ đồng

.H

đều về đường kính sản phẩm đã giảm so với lúc thiết kế với mức ý nghĩa 5%.
TS

Ví dụ 5.15. Một dây chuyền được thiết kế với độ lệch chuẩn đường kính sản phẩm là 0,2 cm.
Khảo sát ngẫu nhiên 45 sản phẩm của dây chuyền thì nhận thấy độ lệch chuẩn đường kính là
Trang 203
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

0,18 cm. Với mức ý nghĩa 5%, có thể cho rằng độ phân tán của đường kính sản phẩm đã giảm
đi so với lúc thiết kế hay không?

24
20
Giải. Gọi σ là độ lệch chuẩn đường kính sản phẩm (cm).


bộ
1) Xét cặp giả thuyết: H0 : σ 2 ≥ 0, 22 và H1 : σ 2 < 0, 22 ;

i
nộ
nh

2) Tìm giá trị tới hạn: χ22 = χ2(n−1;1−α) = χ2(44;0,95) = 29, 787

u
3) Tính giá trị thống kê kiểm định:


(n − 1)s2 (45 − 1)0, 32


χ2 =

= = 99;
σ02 0, 22
.H
TS

4) Ta thấy rằng χ22 = 29, 787 < χ2 = 99 .


Trang 204
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

H1 : σ 2 < 0, 22

24
α = 0, 05

20

bộ
χ22 = 29, 787
χ2

i
nộ
Miền bác bỏ

nh
Kết luận: Chưa có cơ sở để bác bỏ H0 với mức ý nghĩa 5%; nghĩa là chưa có cơ sở để cho rằng


độ lệch chuẩn đường kính sản phẩm đã giảm đi so với thiết kế với mức ý nghĩa 5%.

u


5.5 So sánh tham số của hai tổng thể

5.5.1 So sánh giá trị trung bình của hai tổng thể

.H

◆ Bài toán: Giả sử tổng thể I có trung bình µ1 ; tổng thể II có trung bình µ2 . Từ tổng thể I ta
TS

lấy ra mẫu có kích thước n1 ; tính được giá trị trung bình mẫu là x1 và phương sai mẫu là s21 . Từ
tổng thể II ta lấy ra mẫu có kích thước n2 ; tính được giá trị trung bình mẫu là x1 và phương sai
Trang 205
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

mẫu là s22 . Hãy tiến hành kiểm định các cặp giả thuyết so sánh các tham số µ1 với µ2 trong các
trường hợp sau, với mức ý nghĩa α cho trước. Biết rằng tổng thể I và II đều có phân phối chuẩn

24
và độc lập nhau.

20
◆ Các bước thực hiện kiểm định


★ Trường hợp: đã biết σ12 , σ22

ibộ
nộ
1) Xác định cặp giả thuyết H0 , H1 .

nh
2) Tìm (các) giá trị tới hạn tương ứng.


x1 − x2

u
3) Tính giá trị thống kê kiểm định: z = v .

u 2 2
u σ1 σ
t + 2
n1 n2

4)
Giả thuyết không Giả thuyết đối Tiêu chuẩn bác bỏ H0

.H

H0 : µ 1 = µ 2 H1 : µ1 ̸= µ2 |z| > zα/2


TS

H0 : µ1 ≤ µ2 H1 : µ1 > µ2 z > zα
H0 : µ1 ≥ µ2 H1 : µ1 < µ2 z < −zα
Trang 206
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

★ Trường hợp: chưa biết σ12 , σ22 và n1 , n2 ≥ 30

24
1) Xác định cặp giả thuyết H0 , H1 .

20
2) Tìm (các) giá trị tới hạn tương ứng.


x1 − x2

bộ
3) Tính giá trị thống kê kiểm định: z = v
u 2 .
u s1 s22

i
+

nộ
t
n1 n2

nh
4)


Giả thuyết không Giả thuyết đối Tiêu chuẩn bác bỏ H0

u
H0 : µ 1 = µ 2 H1 : µ1 ̸= µ2 |z| > zα/2
H0 : µ1 ≤ µ2 Lư H1 : µ1 > µ2 z > zα

H0 : µ1 ≥ µ2 H1 : µ1 < µ2 z < −zα

★ Trường hợp: chưa biết σ12 , σ22 và n1 , n2 < 30


.H

1) Xác định cặp giả thuyết H0 , H1 .


TS

2) Tìm (các) giá trị tới hạn tương ứng.


Trang 207
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

x1 − x2
3) Tính giá trị thống kê kiểm định: t = v 
u .
u
u 2 1 1
ts + 

24
n1 n2

20
với


(n1 − 1)s21 + (n2 − 1)s22
2

bộ
s = .
n1 + n2 − 2

i
nộ
4) Kết luận

nh
Giả thuyết không Giả thuyết đối Tiêu chuẩn bác bỏ H0


H1 : µ1 ̸= µ2 H1 : µ1 ̸= µ2 |t| > t(n1 +n2 −2;α/2)

u
H1 : µ1 ≤ µ2
H1 : µ1 ≥ µ2

H1 : µ1 > µ2
H1 : µ1 < µ2
t > t(n1 +n2 −2;α)
t < −t(n1 +n2 −2;α)

Ví dụ 5.16. Khảo sát doanh thu bán hàng theo ngày của hai chi nhánh A và B tại hai vùng khác

nhau ta được kết quả như sau:


.H
TS

i) Chi nhánh A: Khảo sát 156 ngày, doanh thu trung bình theo ngày là 124,5 triệu đồng, độ
lệch chuẩn doanh thu theo ngày là 20,1 triệu đồng.
Trang 208
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

ii) Chi nhánh B: Khảo sát 178 ngày, doanh thu trung bình theo ngày là 118,6 triệu đồng, độ
lệch chuẩn doanh thu theo ngày là 14,2 triệu đồng.

24
20
Với mức ý nghĩa 5%, hãy cho nhận xét về ý kiến cho rằng doanh thu trung bình theo ngày của 2


chi nhánh này là như nhau. Biết rằng doanh thu bán hàng theo ngày của chi nhánh A, chi nhánh

bộ
B tại các vùng tương ứng là các biến ngẫu nhiên có phân phối chuẩn và độc lập nhau.

i
nộ
Giải. Ta có

nh

n1 = 156; x1 = 124, 5; s1 = 20, 1;

u
n2 = 178; x2 = 118, 6; s2 = 14, 2.


Gọi µ1 , µ2 lần lượt là doanh thu trung bình theo ngày của chi nhánh A, chi nhánh B (triệu

đồng).

.H

1) Xét cặp giả thuyết: H0 : µ1 = µ2 và H1 : µ1 ̸= µ2 ;


TS

1−α
2) Tìm giá trị tới hạn: α = 0, 05 =⇒ φ(zα/2 ) = = 0, 457 =⇒ zα/2 = 1, 96;
2
Trang 209
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

3) Tính giá trị thống kê kiểm định:


x1 − x2 124, 5 − 118, 6
z=v = = 3, 0579.

24
v
u 2 2
u s1 s u 14, 22 14, 2 2
u
2

20
t + t
+
n1 n2 156 178


4) Ta thấy rằng |z| = 3, 0579 > zα/2 = 1, 96.

i bộ
Kết luận: Có cơ sở để bác bỏ H0 với mức ý nghĩa 5%; nghĩa là có cơ sở để cho rằng doanh thu

nộ
trung bình theo ngày của 2 chi nhánh này là khác nhau, với mức ý nghĩa 5%.

nh
Ví dụ 5.17. Khảo sát doanh thu bán hàng theo ngày của hai chi nhánh A và B tại hai vùng khác


nhau ta được kết quả như sau:

u

i) Chi nhánh A: Khảo sát 156 ngày, doanh thu trung bình theo ngày là 124,5 triệu đồng, độ

lệch chuẩn doanh thu theo ngày là 20,1 triệu đồng.

ii) Chi nhánh B: Khảo sát 178 ngày, doanh thu trung bình theo ngày là 118,6 triệu đồng, độ

.H

lệch chuẩn doanh thu theo ngày là 14,2 triệu đồng.


TS

Với mức ý nghĩa 5%, hãy cho nhận xét về ý kiến cho rằng doanh thu trung bình theo ngày của
chi nhánh A cao hơn so với chi nhánh B. Biết rằng doanh thu bán hàng theo ngày của chi nhánh
Trang 210
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

A, chi nhánh B tại các vùng tương ứng là các biến ngẫu nhiên có phân phối chuẩn và độc lập
nhau.

24
Giải. Ta có

20

n1 = 156; x1 = 124, 5; s1 = 20, 1;

bộ
n2 = 178; x2 = 118, 6; s2 = 14, 2.

i
nộ
Gọi µ1 , µ2 lần lượt là doanh thu trung bình theo ngày của chi nhánh A, chi nhánh B (triệu

nh
đồng).


1) Xét cặp giả thuyết: H0 : µ1 ≤ µ2 và H1 : µ1 > µ2 ;

u

2) Tìm giá trị tới hạn: α = 0, 05 =⇒ φ(zα ) = 0, 5 − α = 0, 45 =⇒ zα = 1, 65;

3) Tính giá trị thống kê kiểm định:


x1 − x2 124, 5 − 118, 6

z= = = 3, 0579.
.H

v v
u 2
u s1 s22 u 14, 22 14, 22
u
t + t
+
TS

n1 n2 156 178
4) Ta thấy rằng z = 3, 0579 > zα = 1, 65.
Trang 211
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Kết luận: Có cơ sở để bác bỏ H0 với mức ý nghĩa 5%; nghĩa là có cơ sở để cho rằng doanh thu
trung bình theo ngày của chi nhánh A cao hơn chi nhánh B, với mức ý nghĩa 5%.

24
20
Ví dụ 5.18. Khảo sát doanh thu bán hàng theo ngày của hai chi nhánh A và B tại hai vùng khác


nhau ta được kết quả như sau:

i bộ
nộ
i) Chi nhánh A: Khảo sát 156 ngày, doanh thu trung bình theo ngày là 124,5 triệu đồng, độ

nh
lệch chuẩn doanh thu theo ngày là 20,1 triệu đồng.


u

ii) Chi nhánh B: Khảo sát 178 ngày, doanh thu trung bình theo ngày là 118,6 triệu đồng, độ
lệch chuẩn doanh thu theo ngày là 14,2 triệu đồng.

Với mức ý nghĩa 5%, hãy cho nhận xét về ý kiến cho rằng doanh thu trung bình theo ngày của

.H

chi nhánh A thấp hơn so với chi nhánh B. Biết rằng doanh thu bán hàng theo ngày của chi
TS

nhánh A, chi nhánh B tại các vùng tương ứng là các biến ngẫu nhiên có phân phối chuẩn và
độc lập nhau.
Trang 212
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Giải. Ta có

n1 = 156; x1 = 124, 5; s1 = 20, 1;

24
20
n2 = 178; x2 = 118, 6; s2 = 14, 2.


Gọi µ1 , µ2 lần lượt là doanh thu trung bình theo ngày của chi nhánh A, chi nhánh B (triệu

bộ
đồng).

i
nộ
1) Xét cặp giả thuyết: H0 : µ1 ≥ µ2 và H1 : µ1 < µ2 ;

nh

2) Tìm giá trị tới hạn: α = 0, 05 =⇒ φ(zα ) = 0, 5 − α = 0, 45 =⇒ zα = 1, 65;

u
3) Tính giá trị thống kê kiểm định:

z=v

x1 − x2
=
124, 5 − 118, 6
= 3, 0579.

v
u 2 2 2 2
u s1 s 14, 2 14, 2
u

+ 2
u
t t
+
n1 n2 156 178

.H

4) Ta thấy rằng −zα = 1, 65 < z = 3, 0579.


TS

Kết luận: Chưa có cơ sở để bác bỏ H0 với mức ý nghĩa 5%; nghĩa là chưa có cơ sở để cho rằng
doanh thu trung bình theo ngày của chi nhánh A thấp hơn chi nhánh B, với mức ý nghĩa 5%.
Trang 213
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Ví dụ 5.19. Người ta ghi lại sản lượng lúa mì của một vùng (tạ/ha) của các mảnh ruộng sau
khi đã bón lót 50 đơn vị đạm và 100 đơn vị đạm trên một héc-ta, kết quả thu được như sau:

24
i) Bón lót 50 đơn vị đạm: 47,2; 43,1; 35,7; 47,0; 45,7; 42,6; 46,7; 42,3.

20

ii) Bón lót 100 đơn vị đạm: 47,9; 48,9; 43,5; 53,1; 50,8; 46,1; 41,1; 43,0; 41,0; 48,5; 47,7.

bộ
Với mức ý nghĩa 5%, có thể kết luận rằng bón lót 50 đơn vị đạm và 100 đơn vị đạm trên một

i
nộ
héc-ta cho năng suất như nhau hay không? Biết rằng sản lượng lúa mì của các mảnh ruộng sau

nh
khi đã bón lót 50 đơn vị đạm, 100 đơn vị đạm ở vùng trên là các biến ngẫu nhiên có phân phối


chuẩn và độc lập nhau.

u
Giải. Ta có


n1 = 8; x1 = 43, 7875; s1 = 3, 8472;

n2 = 11; x2 = 46, 5091; s2 = 3, 9501.



.H

Gọi µ1 , µ2 lần lượt là sản lượng lúa mì trung bình (tạ/ha) khi bón lót 50 đơn vị đạm, bón lót
TS

100 đơn vị đạm trên một héc-ta.

1) Xét cặp giả thuyết: H0 : µ1 = µ2 và H1 : µ1 ̸= µ2 ;


Trang 214
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

2) Tìm giá trị tới hạn: α = 0, 05 =⇒ t(n1 +n2 −2;α/2) = t(17;0,025) = 2, 1098;

3) Tính giá trị thống kê kiểm định:

24
20
x1 − x2 43, 7875 − 46, 5091
t= v   = v   = −1, 499;


u u
u
u 2 1 1 u 2 1
u 1
ts +  ts + 

bộ
n1 n2 8 11

i
nộ
trong đó
(n1 − 1)s21 + (n2 − 1)s22
s2 = = 3, 90812 .

nh
n1 + n2 − 2


4) Ta thấy rằng |t| = 1, 499 < t(17;0,025) = 2, 1098.

u

Kết luận: Chưa có cơ sở để bác bỏ H0 với mức ý nghĩa 5%; nghĩa là chưa có cơ sở để cho rằng

bón lót 50 đơn vị đạm và bón lót 100 đơn vị đạm trên một héc-ta cho năng suất lúa mì trung

bình khác nhau ở vùng nêu trên, với mức ý nghĩa 5%.

.H

Ví dụ 5.20. Người ta ghi lại sản lượng lúa mì của một vùng (tạ/ha) của các mảnh ruộng sau
TS

khi đã bón lót 50 đơn vị đạm và 100 đơn vị đạm trên một héc-ta, kết quả thu được như sau:

i) Bón lót 50 đơn vị đạm: 47,2; 43,1; 35,7; 47,0; 45,7; 42,6; 46,7; 42,3.
Trang 215
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

ii) Bón lót 100 đơn vị đạm: 47,9; 48,9; 43,5; 53,1; 50,8; 46,1; 41,1; 43,0; 41,0; 48,5; 47,7.

24
Với mức ý nghĩa 5%, có thể kết luận rằng bón lót 50 đơn vị đạm cho sản lượng lúa mì trung

20
bình cao hơn so với bón lót 100 đơn vị đạm trên một héc-ta ở vùng trên hay không? Biết rằng


sản lượng lúa mì của các mảnh ruộng sau khi đã bón lót 50 đơn vị đạm, 100 đơn vị đạm ở vùng

bộ
trên là các biến ngẫu nhiên có phân phối chuẩn và độc lập nhau.

i
nộ
Giải. Ta có

nh

n1 = 8; x1 = 43, 7875; s1 = 3, 8472;

u
n2 = 11; x2 = 46, 5091; s2 = 3, 9501.


Gọi µ1 , µ2 lần lượt là sản lượng lúa mì trung bình (tạ/ha) khi bón lót 50 đơn vị đạm, bón lót

100 đơn vị đạm trên một héc-ta.



.H

1) Xét cặp giả thuyết: H0 : µ1 ≤ µ2 và H1 : µ1 > µ2 ;


TS

2) Tìm giá trị tới hạn: α = 0, 05 =⇒ t(n1 +n2 −2;α) = t(17;0,05) = 1, 740;
Trang 216
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

3) Tính giá trị thống kê kiểm định:


x1 − x2 43, 7875 − 46, 5091

24
t= v 
u  = v 
u  = −1, 499;
u 2 1 1 u 2 1 1

20
u u
ts + ts +
n1 n2 8 11


bộ
trong đó
(n1 − 1)s21 + (n2 − 1)s22

i
2
s = = 3, 90812 .

nộ
n1 + n2 − 2

nh
4) Ta thấy rằng t = −1, 499 < t(17;0,05) = 1, 740.


Kết luận: Chưa có cơ sở để bác bỏ H0 với mức ý nghĩa 5%; nghĩa là chưa có cơ sở để cho rằng

u

bón lót 50 đơn vị đạm cho sản lượng lúa mì trung bình cao hơn so với bón lót 100 đơn vị đạm

trên một héc-ta ở vùng trên, với mức ý nghĩa 5%.

Ví dụ 5.21. Người ta ghi lại sản lượng lúa mì của một vùng (tạ/ha) của các mảnh ruộng sau

khi đã bón lót 50 đơn vị đạm và 100 đơn vị đạm trên một héc-ta, kết quả thu được như sau:
.H
TS

i) Bón lót 50 đơn vị đạm: 47,2; 43,1; 35,7; 47,0; 45,7; 42,6; 46,7; 42,3.

ii) Bón lót 100 đơn vị đạm: 47,9; 48,9; 43,5; 53,1; 50,8; 46,1; 41,1; 43,0; 41,0; 48,5; 47,7.
Trang 217
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Với mức ý nghĩa 5%, có thể kết luận rằng bón lót 50 đơn vị đạm cho sản lượng lúa mì trung
bình thấp hơn so với bón lót 100 đơn vị đạm trên một héc-ta ở vùng trên hay không? Biết rằng

24
sản lượng lúa mì của các mảnh ruộng sau khi đã bón lót 50 đơn vị đạm, 100 đơn vị đạm ở vùng

20
trên là các biến ngẫu nhiên có phân phối chuẩn và độc lập nhau.


bộ
Giải. Ta có

i
nộ
nh
n1 = 8; x1 = 43, 7875; s1 = 3, 8472;


n2 = 11; x2 = 46, 5091; s2 = 3, 9501.

u

Gọi µ1 , µ2 lần lượt là sản lượng lúa mì trung bình (tạ/ha) khi bón lót 50 đơn vị đạm, bón lót

100 đơn vị đạm trên một héc-ta.


.H

1) Xét cặp giả thuyết: H0 : µ1 ≥ µ2 và H1 : µ1 < µ2 ;


TS

2) Tìm giá trị tới hạn: α = 0, 05 =⇒ t(n1 +n2 −2;α) = t(17;0,05) = 1, 740;
Trang 218
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

3) Tính giá trị thống kê kiểm định:


x1 − x2 43, 7875 − 46, 5091

24
t= v 
u  = v 
u  = −1, 499;
u 2 1 1 u 2 1 1

20
u u
ts + ts +
n1 n2 8 11


bộ
trong đó
(n1 − 1)s21 + (n2 − 1)s22

i
2
s = = 3, 90812 .

nộ
n1 + n2 − 2

nh
4) Ta thấy rằng t = −1, 499 > −t(17;0,05) = −1, 740.


Kết luận: Chưa có cơ sở để bác bỏ H0 với mức ý nghĩa 5%; nghĩa là chưa có cơ sở để cho rằng

u

bón lót 50 đơn vị đạm cho sản lượng lúa mì trung bình thấp hơn so với bón lót 100 đơn vị đạm

trên một héc-ta ở vùng trên, với mức ý nghĩa 5%.

5.5.2 So sánh Tỉ lệ của hai tổng thể



.H

◆ Bài toán: Giả sử tổng thể I có tỉ lệ phần tử có tính chất A là p1 ; tổng thể II có tỉ lệ phần tử có
TS

tính chất A là p2 . Từ tổng thể I ta lấy ra mẫu có kích thước mẫu n1 và tính được tỉ lệ phần tử có
tính chất A của mẫu này là f1 . Từ tổng thể II ta lấy ra mẫu có kích thước mẫu n2 và tính được
Trang 219
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

tỉ lệ phần tử có tính chất A của mẫu này là f2 . Hãy thực hiện kiểm định các cặp giả thuyết so
sánh p1 và p2 trong các trường hợp, với mức ý nghĩa α cho trước. Biết rằng chỉ tiêu đang đánh

24
giá của tổng thể I, tổng thể II đều tuân theo luật phân phối chuẩn và độc lập nhau.

20
Lưu ý: Các trường hợp kiểm định so sánh tỉ lệ của hai tổng thể chỉ đáng tin cậy khi các kích


bộ
thước mẫu được khảo sát là khá lớn.

i
◆ Các bước thực hiện kiểm định

nộ
nh
1) Tính


m1 m2 m1 + m2
f1 = , f2 = , f=

u
n1 n2 n1 + n2


2) Xác định cặp giả thuyết H0 , H1 .

3) Tìm (các) giá trị tới hạn tương ứng.



.H

f1 − f2
TS

4) Tính giá trị thống kê kiểm định: z = v .


u
1 1
− f ).( + )
u
tf (1
n1 n2
Trang 220
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

5) Kết luận

Giả thuyết không Giả thuyết đối Tiêu chuẩn bác bỏ H0

24
20
H0 : p1 = p2 H1 : p1 ̸= p2 |z| > zα/2
H0 : p1 ≤ p2 H1 : p1 > p2 z > zα


bộ
H0 : p1 ≥ p2 H1 : p1 < p2 z < −zα

i
nộ
Ví dụ 5.22. Để so sánh chất lượng sản phẩm của 2 dây chuyền sản xuất, người ta tiến hành các

nh
khảo sát như sau:


u
Lư Số sản phẩm Số phế phẩm

Dây chuyền 1 174 14

Dây chuyền 2 165 12



.H

Với mức ý nghĩa 5%, có thể cho rằng tỉ lệ phế phẩm của 2 dây chuyền này là như nhau hay
TS

không? Biết rằng chỉ tiêu đánh giá chất lượng sản phẩm của hai dây chuyền đều có phân phối
chuẩn và độc lập nhau.
Trang 221
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Giải. Ta có
14 12 14 + 12

24
f1 = = 0, 0805; f2 = = 0, 0727 và f = = 0, 0767.
174 165 174 + 165

20
Gọi p1 , p2 lần lượt là tỉ lệ phế phẩm của dây chuyền 1, dây chuyền 2.


bộ
1) Xét cặp giả thuyết: H0 : p1 = p2 và H1 : p1 ̸= p2 ;

i
1−α

nộ
2) Tìm giá trị tới hạn: α = 0, 05 =⇒ φ(zα/2 ) = = 0, 457 =⇒ zα/2 = 1, 96;
2

nh
3) Tính giá trị thống kê kiểm định:


f1 − f2 0, 0805 − 0, 0727
z= =

u
v   v  


u u
u 1 1 u 1 1 
tf (1
u
− f ) +  t0, 0767(1
u
− 0, 0767) +
n1 n2 174 165

= 0, 2674

.H

4) Ta thấy rằng |z| = 0, 2674 < zα/2 = 1, 96.


TS

Kết luận: Chưa có cơ sở để bác bỏ H0 với mức ý nghĩa 5%; nghĩa là chưa có cơ sở để cho rằng
tỉ lệ phế phẩm của 2 dây chuyền này là khác nhau với mức ý nghĩa 5%.
Trang 222
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Ví dụ 5.23. Để so sánh chất lượng sản phẩm của 2 dây chuyền sản xuất, người ta tiến hành các
khảo sát như sau:

24
Số sản phẩm Số phế phẩm

20

Dây chuyền 1 174 14

bộ
Dây chuyền 2 169 12

i
nộ
Với mức ý nghĩa 5%, có thể cho rằng tỉ lệ phế phẩm của dây chuyền 1 cao hơn so với dây

nh
chuyền 2 hay không? Biết rằng chỉ tiêu đánh giá chất lượng sản phẩm của hai dây chuyền đều


có phân phối chuẩn và độc lập nhau.

u
Giải. Ta có


14 12 14 + 12
f1 = = 0, 0805; f2 = = 0, 0710 và f = = 0, 0758.

174 169 174 + 169


Gọi p1 , p2 lần lượt là tỉ lệ phế phẩm của dây chuyền 1, dây chuyền 2.
.H

1) Xét cặp giả thuyết: H0 : p1 ≤ p2 và H1 : p1 > p2 ;


TS

2) Tìm giá trị tới hạn: α = 0, 05 =⇒ φ(zα ) = 0, 5 − α = 0, 45 =⇒ zα = 1, 65;


Trang 223
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

3) Tính giá trị thống kê kiểm định:


f1 − f2 0, 0805 − 0, 0710

24
z= v
u   = v
u  
1 1 1 1 

20
u u
tf (1
u
− f ) +  t0, 0758(1
u
− 0, 0758) +
n1 n2 174 169


bộ
= 0, 3307;

i
nộ
4) Ta thấy rằng z = 0, 3307 < zα = 1, 65.

nh
Kết luận: Chưa có cơ sở để bác bỏ H0 với mức ý nghĩa 5%; nghĩa là chưa có cơ sở để cho rằng


tỉ lệ phế phẩm của dây chuyền 1 cao hơn so với dây chuyền 2 với mức ý nghĩa 5%.

u

Ví dụ 5.24. Để so sánh chất lượng sản phẩm của 2 dây chuyền sản xuất, người ta tiến hành các

khảo sát như sau:

Số sản phẩm Số phế phẩm



.H

Dây chuyền 1 174 14


TS

Dây chuyền 2 170 24


Với mức ý nghĩa 5%, có thể cho rằng tỉ lệ phế phẩm của dây chuyền 1 thấp hơn so với dây
Trang 224
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

chuyền 2 hay không? Biết rằng chỉ tiêu đánh giá chất lượng sản phẩm của hai dây chuyền đều
có phân phối chuẩn và độc lập nhau.

24
20
Giải. Ta có
14 24 14 + 24


f1 = = 0, 0805; f2 = = 0, 1412 và f = = 0, 1105.

bộ
174 170 174 + 170

i
Gọi p1 , p2 lần lượt là tỉ lệ phế phẩm của 2 dây chuyền 1, dây chuyền 2.

nộ
nh
1) Xét cặp giả thuyết: H0 : p1 ≥ p2 và H1 : p1 < p2 ;


2) Tính giá trị tới hạn: α = 0, 05 =⇒ φ(zα ) = 0, 5 − α = 0, 45 =⇒ zα = 1, 65;

u
3) Tính giá trị thống kê kiểm định: Lư

f1 − f2 0, 0805 − 0, 1412
z= =

v   v  
u u
u 1 1 u 1 1 
tf (1
u
− f ) +  t0, 1105(1
u
− 0, 1105) +

n1 n2 174 170
.H

= −1, 7961;
TS

4) Ta thấy rằng z = −1, 7961 > −zα = −1, 65.


Trang 225
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Kết luận: Có cơ sở để bác bỏ H0 với mức ý nghĩa 5%; nghĩa là có cơ sở để cho rằng tỉ lệ phế
phẩm của dây chuyền 1 thấp hơn so với dây chuyền 2 với mức ý nghĩa 5%.

24
20
5.5.3 So sánh Phương sai của hai tổng thể


◆ Bài toán: Giả sử tổng thể I có phương sai σ12 ; tổng thể II có phương sai σ22 . Từ tổng thể I ta

bộ
lấy ra mẫu có kích thước n1 và tính được phương sai mẫu là s21 . Từ tổng thể II ta lấy ra mẫu có

i
nộ
kích thước n2 và tính được phương sai mẫu là s22 . Hãy thực hiện kiểm định các cặp giả thuyết

nh
so sánh σ12 và σ22 trong các trường hợp, với mức ý nghĩa α cho trước. Biết rằng các đại lượng


được khảo sát để tính toán phương sai của tổng thể I, tổng thể II đều tuân theo phân phối chuẩn

u
và độc lập nhau.
◆ Các bước thực hiện kiểm định


1) Xác định cặp giả thuyết H0 , H1 .



.H

2) Tìm (các) giá trị tới hạn tương ứng.


TS

s21
3) Tính giá trị thống kê kiểm định: F = 2 .
s2
Trang 226
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

4) Kết luận

24
Giả thuyết không Giả thuyết đối Tiêu chuẩn bác bỏ H0

20
H1 : σ12 = σ22 H1 : σ12 ̸= σ22 F > F(n1 −1;n2 −1;α/2) hoặc F < F(n1 −1;n2 −1;1−α/2)
H1 : σ12 ≤ σ22 H1 : σ12 > σ22


F > F(n1 −1;n2 −1;α)

bộ
H1 : σ12 ≥ σ22 H1 : σ12 < σ22 F < F(n1 −1;n2 −1;1−α)

i
nộ
trong đó

nh
1
F(n1 −1;n2 −1;1−α/2) = ,


F(n2 −1;n1 −1;α/2)
1

u
F(n1 −1;n2 −1;1−α) =
Lư F(n2 −1;n1 −1;α)

Chú ý 5.2. Do µ1 , µ2 chưa biết nên ta tính s1 và s2 từ mẫu (sử dụng máy tính) nếu đề bài chưa

cho.

.H

Ví dụ 5.25. Để so sánh mức độ biến động giá của hai cổ phiếu A và B trong một giai đoạn,
TS

người ta so sánh độ lệch chuẩn giá niêm yết của 2 cổ phiểu này. Biết rằng giá niêm yết của cố
phiếu A, cố phiếu B là các biến ngẫu nhiên có phân phối chuẩn và độc lập nhau.
Trang 227
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Số phiên giao dịch Độ lệch chuẩn giá niêm yết (USD)

24
Cổ phiếu A 31 3,62

20
Cổ phiếu B 32 2,84


Với mức ý nghĩa 5%, có thể cho rằng cổ phiếu A và B có mức độ biến động giá niêm yết như

bộ
nhau trong giai đoạn trên hay không?

i
nộ
Giải. Gọi σ1 , σ2 lần lượt là độ lệch chuẩn giá niêm yết (USD) của cổ phiếu A, cổ phiếu B trong

nh
giai đoạn trên.


1) Xét cặp giả thuyết: H0 : σ12 = σ22 và H1 : σ12 ̸= σ22 ;

u
2) Tìm giá trị tới hạn: Lư

F(n1 −1;n2 −1;α/2) = F(30;31;0,025) = 2, 06;


1 1
F(n1 −1;n2 −1;1−α/2) = F(30;31;0,975) = = = 0, 483;
.H

F(31;30;0,025) 2, 07
TS

s21 3, 622
3) Tính giá trị thống kê kiểm định: F = 2 = = 1, 625;
s2 2, 842
Trang 228
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

4) Ta thấy rằng F(30;31;0,975) = 0, 483 < F = 1, 625 < F(30;31;0,025) = 2, 06.

24
Kết luận: Chưa có cơ sở để bác bỏ H0 với mức ý nghĩa 5%; nghĩa là chưa có cơ sở để cho rằng

20
cổ phiếu A và B có mức độ biến động giá khác nhau với mức ý nghĩa 5%.


Ví dụ 5.26. Để so sánh mức độ biến động giá của hai cổ phiếu A và B trong một giai đoạn,

bộ
người ta so sánh độ lệch chuẩn giá niêm yết của 2 cổ phiểu này. Biết rằng giá niêm yết của cố

i
nộ
phiếu A, cố phiếu B là các biến ngẫu nhiên có phân phối chuẩn và độc lập nhau.

nh
Số phiên giao dịch Độ lệch chuẩn giá niêm yết (USD)


Cổ phiếu A 25 2,3

u
Cổ phiếu B 27
Lư 2,5

Với mức ý nghĩa 5%, có thể cho rằng cổ phiếu A có mức độ biến động giá niêm yết cao hơn so

với cổ phiếu B trong giai đoạn trên hay không?



.H

Giải. Gọi σ1 , σ2 lần lượt là độ lệch chuẩn giá niêm yết (USD) của cổ phiếu A, cổ phiếu B trong
TS

giai đoạn trên.

1) Xét cặp giả thuyết: H0 : σ12 ≤ σ22 và H1 : σ12 > σ22 ;


Trang 229
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

2) Tìm giá trị tới hạn: F(n1 −1;n2 −1;α) = F(24;26;0,05) = 1, 95;
s21 2, 32

24
3) Tính giá trị thống kê kiểm định: F = = = 0, 8464;
s22 2, 52

20
4) Ta thấy rằng F = 0, 8464 < F(24;26;0,05) = 1, 95.


bộ
Kết luận: Chưa có cơ sở để bác bỏ H0 với mức ý nghĩa 5%; nghĩa là chưa có cơ sở để cho rằng

i
giá niêm yếu của cổ phiếu A có mức độ biến động cao hơn cổ phiếu B trong giai đoạn trên với

nộ
mức ý nghĩa 5%.

nh
Ví dụ 5.27. Để so sánh mức độ biến động giá của hai cổ phiếu A và B trong một giai đoạn,


người ta so sánh độ lệch chuẩn giá niêm yết của 2 cổ phiểu này. Biết rằng giá niêm yết của cố

u

phiếu A, cố phiếu B là các biến ngẫu nhiên có phân phối chuẩn và độc lập nhau.

Số phiên giao dịch Độ lệch chuẩn giá niêm yết (USD)

Cổ phiếu A 28 2,5

.H

Cổ phiếu B 26 3,5
TS

Với mức ý nghĩa 5%, có thể cho rằng giá niêm yết của cổ phiếu A có mức độ biến động thấp
hơn giá niêm yết của cổ phiếu B trong giai đoạn trên hay không?
Trang 230
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Giải. Gọi σ1 , σ2 lần lượt là độ lệch chuẩn giá niêm yết (USD) của cổ phiếu A, cổ phiếu B trong
giai đoạn trên.

24
20
1) Xét cặp giả thuyết : H0 : σ12 ≥ σ22 và H1 : σ12 < σ22 ;


bộ
1

i
nộ
2) Tìm giá trị tới hạn: F(n1 −1;n2 −1;1−α) = F(27;25;0,95) = = 0, 524;
F(25;27;0,05)

nh

s21 2, 52
3) Tính giá trị thống kê kiểm định: F = 2 = = 0, 51;

u
s2 3, 52


4) Ta thấy rằng F = 0, 51 < F(27;25;0,95) = 0, 524.


.H

Kết luận: Có cơ sở để bác bỏ H0 với mức ý nghĩa 5%; nghĩa là có cơ sở để cho rằng giá niêm
TS

yết của cổ phiếu A có mức độ biến động thấp hơn giá niêm yết của cổ phiếu B trong giai đoạn
trên với mức ý nghĩa 5%.
Trang 231
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

5.6 Tính xác suất sai lầm loại II

24
5.6.1 Khi Kiểm định giả thuyết về giá trị trung bình của tổng thể

20
◆ Xét cặp giả thuyết


bộ

H0

 : µ = µ0 ,

i
nộ
: µ ̸= µ0 .

H1

nh
Giả sử rằng giả thuyết H0 là sai, nghĩa là


µ = µ0 + δ,

u
với δ > 0. Lư

◆ Thống kê kiểm định z là

x − µ0 √ x − (µ0 + δ) √ δ√
z= n= n+ n

σ σ σ
.H

Do đó, phân phối của z khi biết H1 đúng là


TS


δ√ 
z∼N n, 1 .
σ
Trang 232
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Phân phối của z dưới giả thuyết không H0 và giả thuyết đối H1 như hình bên dưới.

24
20
H0 : µ = µ0 H1 : µ ̸= µ0


bộ
N (0, 1) δ√ 

i
N n, 1

nộ
σ
β

nh

−zα/2 0 zα/2 δ√ z
n
σ

u


Từ hình vẽ, xác suất chưa bác bỏ được H0 khi nó sai là:

.H
TS

  
δ√ 
β = P − zα/2 < z < zα/2 , với z ∼ N n, 1 ,
σ
Trang 233
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

hay
 
β = P − zα/2 < z < zα/2

24
δ√  δ√ 

20
zα/2 − −zα/2 −
 
n n
= φ σ  − φ σ


  
 
1 1

bộ

δ√  
δ√ 
= φ zα/2 − n − φ − zα/2 − n .

i
nộ
σ σ
Chú ý 5.3. Phương trình trên vẫn thoả trong trường hợp δ < 0 do tính đối xứng của phân phối

nh

chuẩn.

u
◆ Tương tự, nếu xét cặp giả thuyết:
Lư

H0

: µ ≤ µ0 ,



H1

 : µ > µ0 ,

thì xác suất chưa bác bỏ được H0 khi nó sai là:


.H


δ√ 
TS

β = 0, 5 + φ zα − n .
σ
Với µ = µ0 + δ, δ > 0.
Trang 234
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

◆ Nếu xét cặp giả thuyết:


24
: µ ≥ µ0 ,

H0

20

H1

 : µ < µ0 ,


bộ
thì xác suất chưa bác bỏ được H0 khi nó sai là:

i
nộ

δ√  
δ√ 
β = 0, 5 − φ − zα − n = 0, 5 + φ zα + n .
σ σ

nh

Với µ = µ0 + δ, δ < 0.

u
Ví dụ 5.28. Giả sử chiều dài của một bộ phận máy có phân phối chuẩn với độ lệch chuẩn 0,05

cm và chiều dài trung bình là 2 cm. Xét cặp giả thuyết sau:



H0

 : µ = 2,

: µ ̸= 2,

.H

H1


TS

trên cơ sở giá trị trung bình của một mẫu ngẫu nhiên có kích thước 30. Nếu xác xuất xảy ra sai
lầm loại I là α = 0, 05 thì xác suất xảy ra sai lầm loại II β là bao nhiêu với µ = 2, 01 cm.
Trang 235
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Giải. Theo đề, ta có


1−α

24
α = 0, 05 =⇒ φ(zα /2) = = 0, 475 =⇒ zα/2 = 1, 96.
2

20
µ = µ0 + δ ⇐⇒ δ = µ − µ0 = 2, 01 − 2 = 0, 01.


bộ
Xác suất xảy ra sai lầm loại II là

i
δ√  δ√ 

nộ
 
β = φ zα/2 − n − φ − zα/2 − n
σ σ

nh

0, 01 √  
0, 01 √ 
= φ 1, 96 − 30 − φ − 1, 96 − 30


0, 05 0, 05

u
= φ(0, 87) − φ(−3, 06) = 0, 30511 + 0, 4989 = 0, 804.

Ví dụ 5.29. Người tiêu dùng muốn khiếu nại về cường độ âm thanh trung bình của một số máy

hút bụi. Giả sử rằng cường độ âm thanh là một biến ngẫu nhiên có phân phối chuẩn với độ lệch
chuẩn là 3,6 dB. Xét cặp giả thuyết sau:

.H


: µ ≤ 75, 2;

H0

TS


H1

 : µ > 75, 2.

Trang 236
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Nếu xác xuất xảy ra sai lầm loại I là α = 0, 05 thì xác suất xảy ra sai lầm loại II β là bao nhiêu
với µ = 77 dB, biết rằng số máy hút bụi được khảo sát là 15.

24
20
Giải. Theo đề, ta có


bộ
α = 0, 05 =⇒ φ(zα ) = 0, 5 − α = 0, 45 =⇒ zα = 1, 65.

i
nộ
µ = µ0 + δ ⇐⇒ δ = µ − µ0 = 77 − 75, 2 = 1, 8.

nh

Xác suất xảy ra sai lầm loại II là

u

β = 0, 5 + φ zα − Lư
δ√ 
n

σ

 

1, 8
= 0, 5 + φ1, 65 − 15
3, 6

.H

= 0, 5 + φ(−0, 29) = 0, 5 − 0, 1141 = 0, 3859.


TS

Ví dụ 5.30. Khảo sát tuổi thọ trung bình của một loại bóng đèn. Giả sử tuổi thọ có bóng đèn là
Trang 237
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

biến ngẫu nhiên có phân phối chuẩn với độ lệch chuẩn là 5 giờ. Người ta xét cặp giả thuyết sau

24
: µ ≥ 370;

H0

20

H1

 : µ < 370.


bộ
Nếu xác xuất xảy ra sai lầm loại I là α = 0, 05 thì xác suất xảy ra sai lầm loại II β là bao nhiêu
với µ = 369 giờ, biết rằng số bóng đèn được khảo sát ngẫu nhiên là 35.

i
nộ
Giải. Theo đề, ta có

nh

α = 0, 05 =⇒ φ(zα ) = 0, 5 − α = 0, 45 =⇒ zα = 1, 65.

u
µ = µ0 + δ ⇐⇒ δ = µ − µ0 = 369 − 370 = −1.


Xác suất xảy ra sai lầm loại II là


δ√ 
β = 0, 5 + φ zα + n

σ
.H


 
−1
= 0, 5 − φ1, 65 + 35
TS

5
= 0, 5 − φ(0, 47) = 0, 5 − 0, 1808 = 0, 3192.
Trang 238
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

5.6.2 Khi Kiểm định giả thuyết về giá trị tỷ lệ của tổng thể

Sử dụng các kỹ thuật tính toán tương tự mục trên, ta được các kết quả sau:

24
20
◆ Nếu xét cặp giả thuyết



H0

 : p = p0 ,

bộ
: p ̸= p0 ,

H1

i
nộ
thì

nh
 q   q 
p0 − p + zα/2 p0 (1 − p0 )/n  p0 − p − zα/2 p0 (1 − p0 )/n 


β = φ
 q  − φ
 q .
p(1 − p)/n p(1 − p)/n

u
◆ Nếu xét cặp giả thuyết
Lư

: p ≤ p0 ,

H0



H1

 : p > p0 ,

.H

thì
TS

 q 
p0 − p + zα p0 (1 − p0 )/n 
β = φ
 q .
p(1 − p)/n

Trang 239
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

◆ Nếu xét cặp giả thuyết


24
: p ≥ p0 ,

H0

20

H1

 : p < p0 ,


thì

bộ
 q 
p0 − p − zα p0 (1 − p0 )/n 

i
β = 1 − φ

nộ
 q .
p(1 − p)/n

nh
Ví dụ 5.31. Xét cặp kiểm định giả thuyết sau:


u

H0

 : p = 0, 5;


H1

 : p ̸= 0, 5.

Quan sát 100 mẫu và sử dụng α = 0, 05, tính xác suất sai lầm loại II khi tỷ lệ tổng thể thực sự
là p = 0, 6.

.H

Giải. Theo đề, ta có


TS

1−α
α = 0, 05 =⇒ φ(zα/2 ) = = 0, 475 =⇒ zα/2 = 1, 96.
2
Trang 240
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Xác suất xảy ra sai lầm loại II là

24
 q 
p0 − p + zα/2 p0 (1 − p0 )/n 
β = φ

20
 q 
p(1 − p)/n


 q 
p0 − p − zα/2 p0 (1 − p0 )/n 

bộ
− φ
 q 
p(1 − p)/n

i
nộ
 q 
0, 5 − 0, 6 + 1, 96 0, 5(1 − 0, 5)/100 
= φ

nh
 q 
0, 6(1 − 0, 6)/100


 q 
0, 5 − 0, 6 − 1, 96 0, 5(1 − 0, 5)/100 
− φ

u
 q 
0, 6(1 − 0, 6)/100
 Lư  
= φ − 0, 04 − φ − 4, 04 = 0, 4837.

Ví dụ 5.32. Một nhà sản xuất bán dẫn sản xuất bộ điều khiển được sử dụng trong các ứng dụng

.H

động cơ ô tô. Khách hàng yêu cầu rằng tỷ lệ sản phẩm bị loại bỏ hoặc tỷ lệ sản phẩm bị lỗi
TS

ở một bước sản xuất quan trọng không vượt quá 0,05. Tính xác suất xảy ra sai lầm β cho một
kiểm tra khả năng quy trình sử dụng n = 200 và α = 0, 05.
Trang 241
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Giải. Xét cặp kiểm định giả thuyết sau:

24

: p ≥ 0, 05;

H0

20


H1

: p < 0, 05.


bộ
Theo đề, ta có

i
nộ
nh
α = 0, 05 =⇒ φ(zα ) = 0, 5 − α = 0, 45 =⇒ zα = 1, 65.


u
Xác suất xảy ra sai lầm loại II là


 q 
p0 − p − zα p0 (1 − p0 )/n 

β = 1 − φ
 q 
p(1 − p)/n

.H

 q 
0, 05 − 0, 03 − 1, 65 0, 05(1 − 0, 05)/200 
= 1 − φ
TS

 q 
0, 03(1 − 0, 03)/200
 
= 1 − φ − 0, 45 ≈ 0, 67.
Trang 242
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

5.7 Xác định kích thước mẫu

24
5.7.1 Cho Kiểm định giả thuyết về giá trị trung bình của tổng thể

20

Như đã trình bày ở phần trên, khi xét cặp giả thuyết

i bộ

nộ

H0

 : µ = µ0 ,

nh
: µ ̸= µ0 ,

H1


u
thì ta có
Lưδ√  δ√ 

 
β = φ zα/2 − n − φ − zα/2 − n .

σ σ


δ√ 
.H

◆ Nếu δ > 0 thì φ − zα/2 − n ≈ 0. Từ phương trình trên, suy ra


σ
TS


δ√ 
β ≈ φ zα/2 + n
σ
Trang 243
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

H0 : µ = µ0 H1 : µ ̸= µ0

24
20
β


bộ
−zα/2 µ0 zα/2 µ0 + δ

i
−zβ

nộ
nh
Từ hình vẽ, ta có



δ√ 
β = φ(−zβ ) ≈ φ zα/2 + n .

u
σ
Từ đây, suy ra Lư (zα/2 + zβ )2 σ 2

n≈ ,

δ2
trong đó δ = µ − µ0 .

δ√ 
.H


◆ Nếu δ < 0 thì φ zα/2 − n ≈ 1. Từ phương trình trên, suy ra
σ
TS


δ√ 
β = 1 − φ − zα/2 − n .
σ
Trang 244
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Từ hình vẽ, ta cũng có điều tương tự như sau



δ√ 

24
β = 1 − φ(zβ ) ≈ 1 − φ − zα/2 − n .
σ

20
Từ đây, suy ra


(zα/2 + zβ )2 σ 2

bộ
n≈ ,
δ2

i
nộ
trong đó δ = µ − µ0 .
Do đó, kích thước mẫu cho Kiểm định giả thuyết về giá trị trung bình của tổng thể được xác

nh

định bởi công thức như sau:
(zα/2 + zβ )2 σ 2

u
n≈ ,

trong đó δ = µ − µ0 .
Lư δ2

Trong trường hợp xét cặp giả thuyết


 

: µ ≤ µ0 , : µ ≥ µ0 ,
 
H0 H0
.H


 

hoặc
TS

 
H1

 : µ > µ0 , H1

 : µ < µ0 .

Thì kích thước mẫu cho Kiểm định giả thuyết về giá trị trung bình của tổng thể được xác định
Trang 245
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

bởi công thức như sau:

(zα + zβ )2 σ 2

24
n≈ ,
δ2

20

trong đó δ = µ − µ0 .

bộ
Ví dụ 5.33. Người ta muốn kiểm định giả thuyết H0 : µ = 370, H1 : µ ̸= 370 để kiểm tra một

i
nộ
kết luận trong một tài liệu cho rằng: "tuổi thọ trung bình của loại bóng đèn X là 370 giờ với độ

nh
lệch tiêu chuẩn 20 giờ", biết tuổi thọ trung bình của bóng đèn không quá 380 giờ. Nếu muốn


mức ý nghĩa của kiểm định α = 0, 01 và xác suất sai lầm loại 2 là β không vượt quá 0, 05, thì

u
cần điều tra tối thiểu bao nhiêu bóng đèn X ?


Giải. Theo đề, ta có

β = 0, 05 =⇒ φ(zβ ) = 0, 5 − β = 0, 45 =⇒ zβ = 1, 65
.H

1−α
α = 0, 01 =⇒ φ(zα/2 ) = = 0, 495 =⇒ zα/2 = 2, 58
TS

2
δ = µ − µ0 = 380 − 370 = 10.

Trang 246
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Khi đó, kích thước mẫu thoả yêu cầu bài toán là:
(zα/2 + zβ )σ 2 (2, 58 + 1, 65)2 × 202

24
n≈ = = 72.
δ2 102

20
Ví dụ 5.34. Người ta muốn kiểm định giả thuyết H0 : µ ≥ 370, H1 : µ < 370 để kiểm tra một


kết luận trong một tài liệu cho rằng: "tuổi thọ trung bình của loại bóng đèn X là 370 giờ với độ

bộ
lệch tiêu chuẩn 20 giờ", biết tuổi thọ trung bình của bóng đèn không quá 380 giờ. Nếu muốn

i
nộ
mức ý nghĩa của kiểm định α = 0, 01 và xác suất sai lầm loại 2 là β không vượt quá 0, 05, thì

nh
cần điều tra tối thiểu bao nhiêu bóng đèn X ?


Giải. Theo đề, ta có

u

β = 0, 05 =⇒ φ(zβ ) = 0, 5 − β = 0, 45 =⇒ zβ = 1, 65

α = 0, 01 =⇒ φ(zα ) = 0, 5 − α = 0, 49 =⇒ zα = 2, 33

δ = µ − µ0 = 380 − 370 = 10.



.H

Khi đó, kích thước mẫu thoả yêu cầu bài toán là:
TS

(zα + zβ )σ 2 (2, 33 + 1, 65)2 × 202


n≈ = = 64.
δ2 102
Trang 247
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

5.7.2 Cho kiểm định giả thuyết về giá trị tỷ lệ của tổng thể

Thực hiện các kỹ thuật tính toán, tương tự như mục trên ta được

24
20
◆ Nếu xét cặp giả thuyết



H0

 : p = p0 ,

bộ
: p ̸= p0 ,

H1

i
nộ
thì kích thước mẫu được xác định như sau:

nh
 q q 2
zα/2 p0 (1 − p0 ) + zβ p(1 − p) 


n ≈ 
p − p0

u
◆ Nếu xét cặp giả thuyết
 Lư 

: p ≤ p0 , : p ≥ p0 ,
 
H0 H0

 


hoặc 
H1

 : p > p0 , H1

 : p < p0 ,

.H

thì kích thước mẫu được xác định như sau:


TS

 q q 2
zα p0 (1 − p0 ) + zβ p(1 − p) 
n ≈   .
p − p0

Trang 248
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Ví dụ 5.35. Xét cặp kiểm định giả thuyết sau:


24

H0

 : p = 0, 5;

20
: p ̸= 0, 5.

H1


bộ
Giả sử rằng xác suất sai lầm loại II là β = 0, 05 khi tỷ lệ tổng thể thực sự là p = 0, 6. Nếu
α = 0, 05 thì kích thước mẫu là bao nhiêu ?

i
nộ
Giải. Theo đề, ta có

nh

β = 0, 05 =⇒ φ(zβ ) = 0, 5 − β = 0, 45 =⇒ zβ = 1, 65

u
1−α
α = 0, 05 =⇒ φ(zα/2 ) =
Lư2
= 0, 475 =⇒ zα/2 = 1, 96.

Khi đó, kích thước mẫu thoả yêu cầu bài toán là:

 q q 2
zα/2 p0 (1 − p0 ) + zβ p(1 − p) 

n ≈ 
.H

p − p0

TS

 q q 2
1, 96 0, 5(1 − 0, 5) + 1, 65 0, 6(1 − 0, 6) 
=  = 320.
0, 6 − 0, 5

Trang 249
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Ví dụ 5.36. Một nhà sản xuất bán dẫn sản xuất bộ điều khiển được sử dụng trong các ứng dụng
động cơ ô tô. Khách hàng yêu cầu rằng tỷ lệ sản phẩm bị loại bỏ hoặc tỷ lệ sản phẩm bị lỗi ở

24
một bước sản xuất quan trọng không vượt quá 0,05. Giả sử nhà sản xuất bán dẫn sẵn sàng chấp

20
nhận một lỗi β lớn đến 0,10 nếu giá trị thực sự của tỷ lệ sản phẩm bị lỗi là p = 0, 03. Nếu nhà


sản xuất sử dụng α = 0, 05, kích thước mẫu yêu cầu là bao nhiêu?

i bộ
nộ
Giải. Xét cặp kiểm định giả thuyết sau:

nh


: p ≥ 0, 05;

H0

u


H1

 : p < 0, 05.

Theo đề, ta có

.H

β = 0, 1 =⇒ φ(zβ ) = 0, 5 − β = 0, 4 =⇒ zβ = 1, 28
TS

α = 0, 05 =⇒ φ(zα ) = 0, 5 − α = 0, 45 =⇒ zα = 1, 65.

Trang 250
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Khi đó, kích thước mẫu thoả yêu cầu bài toán là:
 q q 2

24
zα p0 (1 − p0 ) + zβ p(1 − p) 
n ≈ 

20
p − p0

2


 q q
1, 65 0, 05(1 − 0, 05) + 1, 28 0, 03(1 − 0, 03) 
=   = 832.

bộ
0, 03 − 0, 05

i
nộ
5.8 Bài tập tự luận

nh

Bài 1. Khảo sát thu nhập X (triệu đồng/tháng) của một số người được chọn ngẫu nhiên từ công

u
ty A, ta thu được số liệu sau

X

6,5-7 7-7,5 7,5-8 8-8,5 8,5-9 9-9,5 9,5-10 10-10,5

Số người 23 33 55 73 45 22 18 15

.H

1) Công ty A tuyên bố thu nhập trung bình của một người ở công ty này là 8,5 triệu đồng/tháng.
TS

Dựa vào số liệu thu được, hãy kết luận về tuyên bố này với mức ý nghĩa 1%.

2) Với mức ý nghĩa 3%, có thể kết luận tỉ lệ người có thu nhập dưới 8,5 triệu đồng/tháng và tỉ
Trang 251
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

lệ người có thu nhập không dưới 8,5 triệu đồng/tháng bằng nhau hay không? Biết rằng thu
nhập của một người ở công ty A là biến ngẫu nhiên tuân theo luật phân phối chuẩn.

24
20
Bài 2. Để đánh giá tác động của việc giảm lãi suất huy động vốn của ngân hàng H, ngân hàng
này tiến hành điều tra lượng tiền mặt X (chục tỉ đồng) huy động được trong một tháng ở một


bộ
số chi nhánh của ngân hàng H được chọn ngẫu nhiên và thu được bảng số liệu sau

i
nộ
X 25-26 26-27 27-28 28-29 29-30 30-31 31-32 32-33

nh
Số CN 21 37 69 87 85 53 42 31


1) Với mức ý nghĩa 5%, hãy cho biết việc giảm lãi suất huy động vốn có ảnh hưởng đến việc

u
huy động vốn hay không, biết lượng tiền mặt huy động được trung bình trong một tháng của

một chi nhánh trước khi giảm lãi suất huy động vốn là 293 tỷ đồng/tháng.

2) Giám đốc ngân hàng H cho rằng, sau khi giảm lãi suất huy động vốn, tỉ lệ chi nhánh có
lượng tiền mặt huy động được dưới 310 tỉ đồng/tháng gấp 4 lần tỉ lệ chi nhánh có lượng tiền

.H

mặt huy động được trên 310 tỉ đồng/tháng. Có thể bác bỏ ý kiến của giám đốc ngân hàng H
TS

với mức ý nghĩa 5% hay không? Biết rằng lượng tiền mặt huy động được trong một tháng ở
các chi nhánh của ngân hàng H là biến ngẫu nhiên tuân theo luật phân phối chuẩn.
Trang 252
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Bài 3. Giám đốc một công ty nghi ngờ có sự khác nhau về năng suất giữa ca ngày và ca tối.
Một mẫu ngẫu nhiên 240 công nhân ca ngày thu được năng suất trung bình của một công nhân

24
trong một giờ là 85,6 sản phẩm với độ lệch chuẩn mẫu là 12,5 sản phẩm. Một mẫu ngẫu nhiên

20
220 công nhân ca tối thu được năng suất trung bình của một công nhân trong một giờ là 81,3


sản phẩm với độ lệch chuẩn mẫu là 13,6 sản phẩm. Biết năng suất của công nhân ca ngày, ca

bộ
tối đều có phân phối chuẩn. Với mức ý nghĩa 2%, hãy kết luận về nghi ngờ của giám đốc công

i
nộ
ty.

nh
Bài 4. Mẫu khảo sát về trọng lượng của một loại trái cây (đơn vị: gram) trong vùng A năm nay


được kết quả như sau

u

Trọng lượng Số trái Trọng lượng Số trái

100-200 5 500-600 36

200-300 45 600-700 13

.H

300-400 150 700-800 3


TS

500-600 48
Cho biết trọng lượng của trái cây loại này trong vùng A năm nay là biến ngẫu nhiên có phân
Trang 253
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

phối chuẩn. Năm trước trọng lượng trung bình của trái cây loại này là 350 gram. Có ý kiến cho
rằng trọng lượng trung bình của trái cây năm nay tăng hơn năm trước. Cho nhận xét về ý kiến

24
đó với mức ý nghĩa 1%.

20
Bài 5. Tiến hành khảo sát lượng tiền mặt X (đơn vị: chục tỉ đồng/tháng) huy động được trong


một tháng ở một số chi nhánh được chọn ngẫu nhiên của ngân hàng N, ta thu được bảng số liệu

bộ
sau

i
nộ
X Số CN X Số CN

nh
25-26 25 29-30 69


u
26-27 32 30-31 53
27-28 Lư59 31-32 30

28-29 67 32-33 21
Giám đốc ngân hàng N cho rằng tỉ lệ chi nhánh có lượng tiền mặt huy động được trên 290

.H

tỉ đồng/tháng thấp hơn tỉ lệ chi nhánh có lượng tiền mặt huy động được không quá 290 tỉ
TS

đồng/tháng. Với mức ý nghĩa 5% có thể chấp nhận ý kiến của giám đốc ngân hàng N hay
không? Biết rằng lượng tiền mặt huy động được trong một tháng ở các chi nhánh của ngân
Trang 254
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

hàng N là biến ngẫu nhiên tuân theo luật phân phối chuẩn.
Bài 6. Mẫu điều tra về doanh thu X (đơn vị: chục triệu đồng/tháng) của các hộ kinh doanh

24
mặt hàng C trong một vùng kết quả cho trong bảng sau

20

X [0;1] (1;2] (2;3] (3;4] (4;5] (5;6] (6;7]

bộ
Số hộ 3 14 32 41 36 20 4

i
nộ
Biết rằng X là biến ngẫu nhiên có phân phối chuẩn. Có báo cáo cho rằng doanh thu trung bình

nh
của một hộ kinh doanh mặt hàng C mỗi tháng là 39 triệu đồng. Nếu bác bỏ được báo cáo đó thì


mức ý nghĩa tối thiểu là bao nhiêu?

u

Bài 7. Khảo sát về mức lãi suất tiền gửi tiết kiệm X (đơn vị là %) của các ngân hàng trong
một vùng, kết quả cho trong bảng sau

X [8;10] (10;12] (12;14] (14;16] (16;18] (18;20] (20;25]



.H

Số NH 7 36 65 57 20 10 5
TS

Cho biết X là biến ngẫu nhiên có phân phối chuẩn. Mức lãi suất tiền gửi tiết kiệm trên 16%
là mức lãi suất cao. Có báo cáo cho rằng tỉ lệ ngân hàng của vùng có mức lãi suất cao là 25%.
Trang 255
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Với mức ý nghĩa 5% hãy xem tỉ lệ ngân hàng có mức lãi suất cao của vùng này có cao tới mức
như trong báo cáo đó không?

24
20
Bài 8. Khảo sát về nhu cầu vay vốn X (đơn vị: triệu đồng) của một số hộ gia đình để thực hiện
một dự án ở địa phương A, ta được kết quả sau:


i bộ
nộ
X [0;2] (2;4] (4;6] (6;8] (8;10] (10;12] (12;14]

nh
Số hộ 7 20 68 105 36 15 5


u
Cho biết X là biến ngẫu nhiên có phân phối chuẩn. Có ý kiến cho rằng tỉ lệ hộ có nhu cầu vay

vốn không quá 6 triệu đồng đối với dự án nói trên ở địa phương A là 28%. Với mức ý nghĩa

2%, hãy xem tỉ lệ trong ý kiến đó có thấp hơn so thực tế không?

Bài 9. Doanh số (triệu đồng/tháng) trung bình một tháng của một đại lý của một công ty M

.H

trước nay là 35 triệu đồng. Để nghiên cứu tác dụng của phương pháp tiếp thị mới, đã được áp
TS

dụng cho toàn bộ 3000 đại lý của công ty, công ty M tiến hành khảo sát ngẫu nhiên các đại lý
của mình được số liệu như sau
Trang 256
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Doanh số Số đại lý Doanh số Số đại lý

24
20-25 7 40-45 22

20
25-30 12 45-50 17


30-35 18 50-55 13

bộ
35-40 27 55-60 4

i
nộ
Cho biết doanh số hàng tháng của các đại lý của công ty M sau khi áp dụng phương pháp tiếp

nh
thị mới là biến ngẫu nhiên có phân phối chuẩn.


u
1) Hãy cho biết hiệu quả của phương pháp tiếp thị mới trong việc làm tăng doanh số trung bình

hàng tháng của các đại lý của công ty M với mức ý nghĩa 1%.

2) Có ý kiến cho rằng, sau khi áp dụng phương pháp tiếp thị mới, tỉ lệ đại lý có doanh số cao

của công ty M bằng một phần ba tỉ lệ đại lý có doanh số còn lại. Cho nhận xét về ý kiến đó

.H

với mức ý nghĩa 5%. Cho biết những đại lý có doanh số trên 45 triệu đồng/tháng là những
TS

đại lý có doanh số cao.

Bài 10. Mẫu khảo sát doanh thu (đơn vị: chục triệu đồng/tháng) của các hộ kinh doanh mặt
Trang 257
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

hàng M trong một vùng cho kết quả trong bảng sau
X 0-1 1-2 2-3 3-4 4-5 5-6 6-7

24
20
Số hộ 3 14 22 31 16 10 4


Có ý kiến cho rằng trước đây doanh thu trung bình của một hộ kinh doanh mặt hàng M là 37

bộ
triệu đồng/tháng, nhưng nay do tác động của lạm phát nên mức doanh thu này đã giảm. Cho

i
nhận xét về ý kiến đó với mức ý nghĩa 2%. Biết rằng doanh thu hàng tháng của các hộ kinh

nộ
doanh mặt hàng M trong vùng trên là biến ngẫu nhiên có phân phối chuẩn.

nh
Bài 11. Mẫu điều tra giá bán X (đơn vị là ngàn đồng) của cổ phiếu A trên thị trường chứng


khoán trong các phiên giao dịch ở một giao đoạn được cho ở bảng sau

u
X Lư
11-13 13-15 15-17 17-19 19-21 21-23 23-25

Số phiên 5 17 23 33 25 16 2

1) Có người cho rằng do có các nhà đầu tư nước ngoài nên giá bán trung bình của cổ phiếu A

.H

đã tăng lên mức 19.000 đồng. Cho nhận xét về ý kiến đó với mức ý nghĩa 1
TS

2) Có thể cho rằng độ đồng đều về giá bán của loại cổ phiếu này có xu hướng tăng lên hơn
trước đây không, với mức ý nghĩa 5%? Biết rằng trước đây phương sai giá bán của loại cổ
Trang 258
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

phiếu này là 11. Cho biết giá bán của cổ phiếu A trong giao đoạn trên là biến ngẫu nhiễn có
phân phối chuẩn.

24
20

Bài 12. Hai nhà máy A và B cùng sản xuất một loại sản phẩm. Mẫu điều tra chất lượng sản

bộ
phẩm do hai nhà máy sản xuất ra cho kết quả như sau

i
nộ
Nhà máy Số sản phẩm điều tra Số phế phẩm

nh

A 500 50

u

B – 450 40

Có báo cáo cho rằng chất lượng sản phẩm của B là hơn A. Dựa vào kết quả điều tra nói trên,
với mức ý nghĩa 5% hãy cho nhận xét về báo cáo này. Biết rằng chỉ tiêu đánh giá chất lượng sản

.H

phẩm của nhà máy A, nhà máy B là các biến ngẫu nhiên có phân phối chuẩn và độc lập nhau.
TS

Bài 13. Để so sánh năng suất của hai loại máy H1 và H2, người ta điều tra thời gian (tính bằng
phút) cần để sản xuất ra một sản phẩm cùng loại của 2 loại máy này, kết quả cho như sau
Trang 259
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Loại máy Số sản phẩm Trung bình mẫu Độ lệch chuẩn mẫu

24
H1 100 57 13,59

20
H2 100 52 14,46


Dựa vào kết quả điều tra nói trên, với mức ý nghĩa 5% hãy cho biết loại máy H2 có cho năng

bộ
suất cao hơn loại máy H1 hay không? Biết rằng thời gian cần để sản xuất ra một sản phẩm cùng

i
nộ
loại của máy H1, máy H2 đều tuân theo luật phân phối chuẩn và độc lập nhau.

nh
Bài 14. Hai xưởng K, M cùng sản xuất một loại sản phẩm trong cùng một ca. Để đánh giá hiệu


quả sản xuất của 2 xưởng, một mẫu số liệu được khảo sát từ 2 xưởng sản xuất này cho kết quả

u
như sau


Số sản phẩm Số phế phẩm

Xưởng K 800 20

.H

Xưởng M 1000 30
TS

Với mức ý nghĩa 5%, có thể bác bỏ ý kiến cho rằng phân xưởng M làm việc kém hơn so với
phân xưởng K hay không? Biết rằng chỉ tiêu đánh giá chất lượng sản phẩm của xưởng K, xưởng
Trang 260
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

M là các biến ngẫu nhiên tuân theo luật phân phối chuẩn và độc lập nhau.
Bài 15. Nếu máy móc hoạt động bình thường thì chiều dài của một loại sản phẩm là BNN có

24
phân phối chuẩn với phương sai 3 cm. Nghi ngờ máy hoạt động không bình thường người ta đo

20
thử một số sản phẩm và được số liệu như sau:


bộ
Chiều dài 105 107 109 111

i
nộ
n 2 4 5 2

nh
Với mức ý nghĩa 5%, có kết luận gì về nghi ngờ nói trên. Biết rằng chiều dài của loại sản phẩm


trên là biến ngẫu nhiên tuân theo luật phân phối chuẩn.

u

Bài 16. Lấy ngẫu nhiên 20 chai nước do một máy đóng chai tự động đóng ta thu được độ lệch
chuẩn mẫu là s = 0, 02 lít. Máy được gọi là đạt chuẩn nếu phương sai không vượt quá 0,01.

Với mức ý nghĩa 5% hãy kiểm định xem máy đóng chai có đạt chuẩn hay không, biết rằng thể
tích nước trong chai được đóng tự động là biến ngẫu nhiên có phân phối chuẩn.

.H

Bài 17. Sổ sách theo dõi hoạt động sản xuất của một xí nghiệp cho thấy độ lệch chuẩn của
TS

năng suất của thiết bị A trong 30 ngày làm việc là 40 sản phẩm/ngày, trong khi đó số liệu này
của thiết bị B trong 25 ngày làm việc là 32 sản phẩm/ngày. Hãy so sánh mức độ ổn định của
Trang 261
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

hai thiết bị này với độ tin cậy 95%? Biết rằng số sản phẩm làm ra mỗi ngày của thiết bị A, thiết
bị B là các biến ngẫu nhiên có phân phối chuẩn và độc lập nhau.

24
Bài 18. Hai máy A và B cùng gia công một loại chi tiết. Người ta muốn kiểm tra xem hai máy

20
có độ chính xác như nhau hay không, biết rằng kích thước trung bình của loại chi tiết này của


bộ
máy A và máy B là bằng nhau. Để làm điều đó người ta tiến hành lấy mẫu và thu được kết quả
sau:

i
nộ
i) Máy A: 135; 138; 136; 140; 138; 135; 139.

nh

ii) Máy B: 140; 135; 140; 138; 135; 138; 140.

u

Với mức ý nghĩa 5% hãy kiểm tra xem hai máy có độ chính xác như nhau hay không, biết kích
thước của các chi tiết do máy A, máy B sản xuất là các biến ngẫu nhiên có phân phối chuẩn và

độc lập nhau.



.H
TS

Trang 262

You might also like