Download as pdf or txt
Download as pdf or txt
You are on page 1of 244

HỌC VIỆN NGOẠI GIAO

KHOA KINH TẾ QUỐC TẾ

Bài giảng
THỐNG KÊ KINH DOANH

1
TKKD
Thông tin học phần
▪ Tiếng Anh: Statistics for Business
▪ Số tín chỉ: 3 Thời lượng: 45 tiết
▪ Đánh giá:
• Điểm do giảng viên đánh giá: 15% điểm học phần
• Điểm kiểm tra: 25% điểm học phần
• Điểm thi cuối kỳ: 60% điểm học phần
▪ Không tham gia quá 20% số tiết không được thi

TKKD 2
Thông tin giảng viên
▪ TS. Phạm Ngọc Hưng
▪ Email: pnhung75@gmail.com

TKKD 3
Tài liệu tham khảo
▪ [1] Lind, Marchal, Wathen. Chủ
biên dịch PGS. TS. Trần Thị Bích
chủ biên dịch (2022), Thống kê
trong Kinh tế & Kinh doanh, tái
bản lần thứ 18, NXB ĐHKTQD.
▪ [2] Paul Newbold, William L.
Carlson, Betty Thorne (2013),
Statistics for Business and
Economics, 8th edition, Pearson.
▪ [3] Anderson, Sweeney, Willams,
Camm, Cochran (2017), Statistics
for Business and Economics, 12th
edition, South-Western.

TKKD 4
NỘI DUNG
▪ Bài 1 : MỞ ĐẦU
▪ Bài 2 : BIẾN CỐ VÀ XÁC SUẤT
▪ Bài 3 : BIẾN NGẪU NHIÊN RỜI RẠC VÀ PHÂN PHỐI
XÁC SUẤT
▪ Bài 4 : BIẾN NGẪU NHIÊN LIÊN TỤC VÀ PHÂN PHỐI
XÁC SUẤT
▪ Bài 5 : BIẾN NGẪU NHIÊN HAI CHIỀU
▪ Bài 6 : LUẬT SỐ LỚN
▪ Bài 7 : MẪU NGẪU NHIÊN
▪ Bài 8 : ƯỚC LƯỢNG THAM SỐ
▪ Bài 9 : KIỂM ĐỊNH GIẢ THUYẾT

TKKD 5
BÀI 1 – MỞ ĐẦU
▪ 1.1. Các khái niệm cơ bản
• Thống kê – Xác suất
• Tổng thể, mẫu, quan sát, biến
▪ 1.2. Bảng biểu – Đồ thị
• Bảng tần số, tần suất
• Đồ thị tròn, cột, phân phối giá trị
▪ 1.3. Thống kê mô tả
• Nhóm xu thế trung tâm
• Nhóm đo độ phân tán
• Nhóm hình dáng phân phối, mối quan hệ

TKKD 6
1.1. CÁC KHÁI NIỆM CƠ BẢN
THỐNG KÊ (STATISTICS)
▪ Thu thập dữ liệu
▪ Xử lý dữ liệu
▪ Trình bày, biểu diễn dữ liệu
▪ Phân tích dữ liệu để có được thông tin ở mức cao hơn
▪ Suy diễn về thông tin

Thông tin Thông tin


ban đầu Thống kê cao cấp hơn
(Dữ liệu) (Kết quả)

TKKD 7
Thống kê và Xác suất
▪ Thống kê có hai nhánh chính
▪ Thống kê mô tả (Descriptive Statistics): sắp xếp, tổng
hợp, trình bày dữ liệu theo những cách hợp lý, thuận
tiện nhất.
▪ Thống kê suy diễn (Inferential Statistics): dự đoán,
kiểm chứng, phân tích dữ liệu để có các kết luận tổng
quát.
▪ Kết nối là Lý thuyết xác suất
▪ Thống kê mô tả là thông tin cơ bản cho thống kê suy
diễn

TKKD 8
Tổng thể và Mẫu

▪ Tổng thể (Population): tất cả các phần tử cần quan


tâm
• Kích thước tổng thể: N, có thể vô hạn
• Giá trị tính từ tổng thể: Tham số (parameter)
▪ Mẫu (Sample): tập con rút ra từ tổng thể
• Kích thước mẫu: n, hữu hạn
• Giá trị tính được: Thống kê (statistic)

TKKD 9
Cấu trúc dữ liệu truyền thống
▪ Gồm: Quan sát / bản ghi – Biến / trường – Giá trị
▪ (Observation / record – Variable / field – Value)
Biến
Điểm Điểm
TT Họ tên Giới Tuổi …
T.Anh Toán
1 Nguyễn A M 19 A 8 …
Quan sát

2 Trần T. F 20 C 9 …

3 Lê …. M 20 B 7

… … … … … …. ….

TKKD 10
Phân loại biến
▪ Định tính (Qualitative) và Định lượng (Quantitative)
▪ Biến định tính: Định danh và Thứ bậc
• Định danh (Nominal): VD: Tên, địa chỉ, ngành học
• Thứ bậc (Ordinal): VD: Thứ hạng, cỡ giày,…
• Nhị phân (binary): Đúng / Sai, Nam / Nữ…
▪ Biến Định lượng (Quantitative): có đơn vị đo lường
• Rời rạc (Discrete): VD: tuổi, số buổi học,…
• Liên tục (Continuous): VD: thời gian, cân nặng
• Biến định lượng có thể sử dụng để xác định biến
định tính

TKKD 11
Phân loại biến

Định tính Định lượng

Định danh Thứ bậc Rời rạc Liên tục


Liệt kê Liệt kê, nhóm Liệt kê, nhóm, gộp
Nhóm, gộp Sắp xếp thứ Sắp xếp thứ tự, so sánh
tự, so sánh Tính toán, +, -, × , ÷ ,…

Mã hóa bởi con số Sử dụng để xếp hạng

TKKD 12
Thang đo Likert
▪ Sử dụng trong các bảng hỏi đánh giá, nhận xét
▪ Thang Likert 5 bậc, 7 bậc
Rất không Không Không Đồng ý Rất đồng ý
đồng ý đồng ý ý kiến
1 2 3 4 5

Hoàn Rất Không Không Đồng ý Rất Hoàn


toàn không đồng ý ý kiến đồng ý toàn
không đồng ý đồng ý
đồng ý
1 2 3 4 5 6 7
TKKD 13
1.2. BẢNG BIỂU & ĐỒ THỊ
▪ Bảng tần số, tần suất, tần suất tích lũy
▪ Đồ thị tròn (pie chart), cột (column chart, bar chart)
▪ Đồ thị phân phối giá trị (histogram)
▪ Đồ thị rải điểm (scatter plot)

▪ [2] Chapter 1, pp. 8 – 38.


▪ [3] Chapter 2, pp. 33 – 98.

TKKD 14
Ví dụ: Dữ liệu VHLSS 2012
▪ Dữ liệu hộ gia đình ở Hà Nội, n = 420 quan sát

Thứ Khu vực Số Thu nhập So với toàn


tự người (triệu VND) quốc
1 Thành thị 3 130,8 Cao
2 Thành thị 5 133,1 TB cao
3 Nông thôn 4 104,3 TB thấp
… … … … …
420 Nông thôn 7 25,7 Thấp

TKKD 15
Tần số & Tần suất (tỷ lệ)
▪ Bảng tần số (frequency table) của biến Khu vực
Khu vực Thành thị Nông thôn
Tần số 183 237
▪ Bảng tần suất (relative frequency) hay tỷ lệ
(proportion)
Tần số
Tần suất =
Tổng số phần tử

Khu vực Thành thị Nông thôn


Tần suất 0,436 0,564
Tỷ lệ, phần trăm 43,6 % 56,4 %

TKKD 16
Đồ thị tròn (pie chart)
Khu vực
Khu Thành Nông Thành
vực thị thôn thị
Nông 43,6
Tần số 183 237 56,4
thôn
Tỷ lệ 43,6% 56,4%
So sánh với toàn quốc
So với Cao
TB TB
toàn Cao Thấp TB cao 8
cao thấp
quốc TB thấp 19
Thấp 49
Tần số 205 104 78 33
25
% 49% 25% 19% 8%

TKKD 17
Đồ thị cột (column chart)
So với toàn quốc
So với 250
Tần số %
toàn quốc 205
200
Cao 205 49%
TB cao 104 25% 150

TB thấp 78 19% 104


100
Thấp 33 8% 78

Tổng 420 100% 50


33

0
Cao TB cao TB thấp Thấp

TKKD 18
Đồ thị cột: phân phối giá trị (histogram)
SN 1 2 3 4 5 6 7 8 9 Tổng
Tần số 22 54 78 139 74 33 12 4 4 420
% 5% 13% 19% 33% 18% 8% 3% 1% 1% 100%

Quy mô hộ gia đình


33%

19% 18%

13%

8%
5% 3% 1% 1%

1 2 3 4 5 6 7 8 9

TKKD 19
Hình dạng của phân phối giá trị
▪ Phân phối đối xứng và bất đối xứng

Lệch trái (lệch âm) Đối xứng, Lệch phải (lệch dương)
Negatively skewed dạng chuông Positively skewed
Left skewed Right skewed
(Symmertrical)
Bất đối xứng / phân phối lệch

TKKD 20
Đồ thị rải điểm (scatter plot)
▪ Sử dụng với số liệu hai chiều

Labor Output Labor Output Output – Labor relationship


300
11 80 15 250
250
11 130 16 220
200
12 150 17 210
Output
150
13 110 18 240
100
13 150 18 200
50
13 200 17 260
0
15 170 19 240 10 12 14 16 18 20
Labor
14 180 19 280
TKKD 21
Tương quan giữa hai biến định lượng
▪ Dạng cơ bản của đồ thị điểm hai biến định lượng
r = 0,5 Tương quan
Dương
Yếu
Mạnh r = 0,8

Tương quan r=0


Âm
Không
r = – 0,5 Tương quan

TKKD 22
1.3. THỐNG KÊ MÔ TẢ
▪ Xu thế trung tâm: Trung bình, trung vị, mốt
▪ Các vị trí: tứ phân vị, các phân vị
▪ Đo độ phân tán: Phương sai, độ lệch chuẩn, hệ số biến
thiên, khoảng biến thiên, khoảng tứ phân vị
▪ Hình dáng phân phối: Hệ số bất đối xứng, hệ số nhọn
▪ Đo độ liên hệ: Hiệp phương sai, hệ số tương quan

TKKD 23
Nhóm xu thế trung tâm
▪ Dùng một giá trị đại diện cho bộ số liệu
▪ Ba thống kê xu thế trung tâm thường sử dụng:
• Trung bình (mean)
• Trung vị (median)
• Mốt (mode)

TKKD 24
Trung bình (mean)
▪ Trung bình =

Tổng thể Mẫu


Dữ liệu: {𝑥1 , 𝑥2 , … , 𝑥𝑁 } Dữ liệu: {𝑥1 , 𝑥2 , … , 𝑥𝑛 }
𝒙𝟏 + 𝒙𝟐 + ⋯ + 𝒙𝑵 𝒙𝟏 + 𝒙𝟐 + ⋯ + 𝒙𝒏
𝝁= ഥ=
𝒙
𝑵 𝒏

▪ Áp dụng cho biến định lượng


▪ Có cùng đơn vị với biến ngẫu nhiên được mô tả trong
bộ dữ liệu

TKKD 25
Trung bình có trọng số
▪ Nếu số liệu dạng có trọng số (weighted data)
▪ Giá trị 𝑥𝑖 có trọng số là 𝑤𝑖
▪ Trung bình có trọng số (weighted mean):
𝒘𝟏 𝒙𝟏 +𝒘𝟐 𝒙𝟐 +⋯+𝒘𝒌 𝒙𝒌 ∑𝒘𝒊 𝒙𝒊
▪ 𝒙
ഥ= =
𝒘𝟏 +𝒘𝟐 +⋯+𝒘𝒌 ∑𝒘𝒊
▪ Ví dụ:

Giá bán (triệu / kg) 10 12 14 16


Số lượng (kg) 3 10 5 2

TKKD 26
Trung vị (median)
▪ Là giá trị trung tâm của bộ dữ liệu khi dữ liệu được
sắp xếp từ nhỏ nhất đến lớn nhất
▪ Sử dụng số liệu về số lần mua hàng: 5, 2, 7, 4, 2
• Sắp xếp theo thứ tự tăng dần: 2,2,4,5,7 → 𝑚𝑑 = 4
𝑛+1
▪ Khi n lẻ, 𝑚𝑑 nhận giá trị tại quan sát thứ
2
▪ Khi n chẵn, 𝑚𝑑 nhận giá trị là trung bình cộng của 2
giá trị đứng giữa.
▪ Ví dụ với dữ liệu: 3, 8, 12, 14

TKKD 27
Mốt (mode)
▪ Là giá trị xuất hiện ít nhất 2 lần và xuất hiện thường
xuyên nhất trong bộ dữ liệu
▪ Sử dụng số liệu về số lần mua hàng:
• Dữ liệu : 2, 5, 7, 4, 2 → 𝑚0 = 𝟐
▪ Ví dụ với dữ liệu: 4, 8, 7, 6, 9, 8, 10, 5, 8

TKKD 28
Nhóm thống kê đo độ phân tán
Đo độ phân tán hoặc mức độ “đồng đều” (homogeneity)
của bộ dữ liệu
▪ Khoảng biến thiên (Range)
▪ Phương sai (Variance)
▪ Độ lệch chuẩn (Standard Deviation)
▪ Hệ số biến thiên (Coefficient of Variation)
▪ Khoảng tứ phân vị (Interquartile Range)

TKKD 29
Khoảng biến thiên
▪ Thống kê đơn giản nhất đo độ biến động của bộ dữ
liệu là khoảng biến thiên:
▪ Range = Giá trị lớn nhất – Giá trị nhỏ nhất
▪ Ví dụ:
Khoảng biến thiên thu nhập 5 lao động:
12, 10, 8, 20, 21

TKKD 30
Phương sai và độ lệch chuẩn
Tổng thể Mẫu
Số liệu {𝑥1 , 𝑥2 , … , 𝑥𝑁 } {𝑥1 , 𝑥2 , … , 𝑥𝑛 }
∑𝒙𝒊 ∑𝒙𝒊
Trung bình 𝝁= ഥ=
𝒙
𝑵 𝒏
Tổng bình 𝑆𝑆 = ∑ 𝑥𝑖 − 𝜇 2 𝑆𝑆 = ∑ 𝑥𝑖 − 𝑥ҧ 2
phương
Phương 𝑆𝑆 𝑆𝑆
𝝈𝟐 = 𝒔𝟐 =
sai 𝑵 𝒏−𝟏
Độ lệch 𝜎= 𝜎2 𝑠= 𝑠2
chuẩn
TKKD 31
Phương sai và độ lệch chuẩn
▪ Ví dụ: Tính các thống kê phương sai, độ lệch chuẩn

Tổng thể Mẫu


Số liệu 10, 12, 15, 10, 12, 10, 12, 14, 15,
13, 18, 19, 14, 15 19
Trung bình 𝜇= x=
Tổng bình phương 𝑆𝑆 = 𝑆𝑆 =
Phương sai 𝜎2 = 𝑠2 =
Độ lệch chuẩn 𝜎= 𝑠=
TKKD 32
Phương sai và độ lệch chuẩn
▪ Phương sai và độ lệch chuẩn đo mức độ phân tán,
biến động, dao động, đồng đều, ổn định của số liệu
▪ Phương sai lớn hơn → phân tán hơn, biến động hơn
Phương sai nhỏ hơn → đồng đều hơn, ổn định hơn
▪ Phương sai có đơn vị là bình phương đơn vị của biến
▪ Độ lệch chuẩn có đơn vị giống đơn vị của biến

TKKD 33
Hệ số biến thiên
▪ Phương sai, độ lệch chuẩn đo độ biến động tuyệt đối
▪ Hệ số biến thiên đo độ biến động tương đối

𝜎 𝑠
CVtổng thể = × 100% CVmẫu = × 100%
𝜇 𝑥ҧ

▪ Ví dụ: Tính hệ số biến thiên của hai số liệu trong ví dụ


trước

TKKD 34
Tứ phân vị (Quartile)
▪ 𝑄1 , 𝑄2 , 𝑄3 chia bộ dữ liệu thành 4 phần với số lượng
phần tử bằng nhau
▪ Tứ phân vị thứ hai chính là trung vị
▪ Khoảng tứ phân vị:
𝐼𝑄𝑅 = 𝑄3 − 𝑄1
▪ IQR cũng dùng để đánh giá độ phân tán của bộ dữ liệu
▪ Sử dụng khoảng (𝑄1 − 1,5 ⋅ 𝐼𝑄𝑅; 𝑄3 +1,5 ⋅ 𝐼𝑄𝑅) là
một tiêu chuẩn để xác định giá trị ngoại lai (outlier)

TKKD 35
Thống kê mô tả hình dạng phân phối
▪ Tính cho mẫu
▪ Hệ số bất đối xứng (Skewness) 𝑎3 :

∑ 𝑥𝑖 − 𝑥ҧ 3 /𝑛
𝑎3 =
𝑠3
▪ Hệ số nhọn 𝑎4 :

∑ 𝑥𝑖 − 𝑥ҧ 4 /𝑛
𝑎4 =
𝑠4
▪ Lưu ý: trong một số phần mềm như Excel, hệ số nhọn
Kurtosis = 𝑎4 − 3

TKKD 36
Thống kê mô tả mức độ liên hệ
▪ Hai biến 𝑋 và 𝑌 là số liệu theo cặp (𝑥𝑖 , 𝑦𝑖 )

Tổng thể Mẫu


Hiệp 𝐶𝑜𝑣 𝑋, 𝑌 𝑐𝑜𝑣 𝑋, 𝑌
phương sai ∑ 𝑥𝑖 − 𝜇𝑋 𝑦𝑖 − 𝜇𝑌 ∑ 𝑥𝑖 − 𝑥ҧ 𝑦𝑖 − 𝑦ത
= =
Covariance 𝑁 𝑛−1

Hệ số 𝐶𝑜𝑣 𝑋, 𝑌 𝐶𝑜𝑣 𝑋, 𝑌
tương quan 𝜌𝑋,𝑌 = 𝑟𝑋,𝑌 =
𝜎𝑋 𝜎𝑌 𝑠𝑋 𝑠𝑌
Correlation

TKKD 37
Hiệp phương sai - hệ số tương quan
▪ Hệ số tương quan nằm trong đoạn [−1; 1]
▪ Hệ số tương quan càng gần 0: càng yếu, lỏng
▪ Hệ số tương quan càng gần ±1: càng mạnh, chặt
▪ Ví dụ: Tính hiệp phương sai và hệ số tương quan của
mẫu sau
𝒙𝒊 𝒚𝒊
2 4
5 5
8 7
7 8
9 10
TKKD 38
BÀI 2 – BIẾN CỐ VÀ XÁC SUẤT
2.1. Phép thử và biến cố
2.2. Xác suất của biến cố
2.3. Các công thức xác suất

[2] Chapter 3, pp. 73-125


[3] Chapter 4, pp.170-214

TKKD 39
2.1. PHÉP THỬ VÀ BIẾN CỐ
▪ Việc thực hiện một nhóm các điều kiện cơ bản để
quan sát một hiện tượng nào đó có thể xảy ra hay
không xảy ra được gọi là một phép thử (experiment)
▪ Hiện tượng có thể xảy ra → biến cố (event)
▪ Phân loại biến cố:
• Biến cố chắc chắn (certain): 
• Biến cố không thể có (impossible): 
• Biến cố ngẫu nhiên (random): 𝐴, 𝐵, … hay 𝐴1 , 𝐴2 , …

TKKD 40
Phép thử và biến cố
Phép thử Kết cục (kết quả) Biến cố
Tung đồng xu Sấp, ngửa ‘sấp’, ‘ngửa’
Tung xúc xắc 1,2,3,4,5,6 chấm ‘lớn hơn 3’
Tham gia 1 kỳ thi Điểm = 0, 1, 2,…, ‘đỗ’;
10 ‘đạt điểm giỏi’
Đầu tư 1 dự án Lợi nhuận: (+), ‘không âm’
(-), 0 ‘có lãi’
Ứng tuyển 1 vị trí Đạt; Bị loại
Làm 1 công việc Lương = …

TKKD 41
2.2. XÁC SUẤT CỦA BIẾN CỐ
▪ Khái niệm xác suất
▪ Định nghĩa cổ điển về xác suất
▪ Định nghĩa thống kê về xác suất
▪ Nguyên lý xác suất lớn và nguyên lý xác suất nhỏ

[2] Chapter 3, pp. 81-90


[3] Chapter 4, pp.181-185

TKKD 42
Xác suất của biến cố
▪ Xác suất (probability) của một biến cố là một con số
đặc trưng khả năng khách quan xuất hiện biến cố đó
khi thực hiện một phép thử.
▪ 𝑷 𝑨 : Xác suất xảy ra biến cố 𝐴
▪ Các tính chất của xác suất:
• 0 ≤ 𝑃 Biến cố ≤ 1
• Ω là biến cố chắc chắn, 𝑃 Ω = 1
• ∅ là biến cố không thể, 𝑃 ∅ = 0
• 𝐴 là biến cố ngẫu nhiên, 0 < 𝑃 𝐴 < 1
TKKD 43
Định nghĩa cổ điển về xác suất
▪ Định nghĩa cổ điển về xác suất
• Số kết cục duy nhất đồng khả năng: 𝑁
• Số kết cục thuận lợi cho biến cố 𝐴: 𝑁𝐴
• Xác suất xảy ra biến cố 𝐴:

𝑁𝐴
𝑃 𝐴 =
𝑁

TKKD 44
Ví dụ

Ví dụ 2.1. Tung một đồng xu hai lần liên tiếp. Hãy tính xác
suất:
a) “Hai lần xuất hiện mặt sấp”
b) “Xuất hiện 1 lần mặt sấp, 1 lần mặt ngửa”
c) “Hai lần xuất hiện mặt ngửa”

TKKD 45
Ví dụ (tiếp)
Ví dụ 2.2. Một hộp chứa 6 quả bóng trắng và 4 quả bóng
đen. Tính xác suất lấy được 2 quả bóng trắng từ hộp khi
lấy theo các cách sau
a) Lấy có hoàn lại (với 2 lần lấy bóng)
b) Lấy không hoàn lại (với 2 lần lấy bóng)
c) Lấy đồng thời 2 quả bóng.

TKKD 46
Định nghĩa thống kê về xác suất
▪ Định nghĩa thống kê về xác suất
• Thực hiện 𝑛 phép thử
• Số lần xuất hiện biến cố 𝐴: 𝑛𝐴
𝑛𝐴
• Tần suất xuất hiện biến cố 𝐴:
𝑛
𝑛𝐴
• Khi số phép thử 𝑛 đủ lớn: 𝑃 𝐴 ≈
𝑛
▪ Ví dụ:
• Trong 100.000 trẻ mới sinh, có 51.000 bé trai. Xác
suất “sinh bé trai” là khoảng 0,51.
• Trong 4.000 sinh viên thi hết môn A, có 3.600
người thi qua, xác suất “thi qua môn học A” là
khoảng 0,9.

TKKD 47
Nguyên lý xác suất lớn và nhỏ

▪ Nguyên lý xác suất lớn: Nếu biến cố ngẫu nhiên có xác


suất rất lớn thì thực tế có thể cho rằng trong một
phép thử biến cố đó sẽ xảy ra.
▪ Nguyên lý xác suất nhỏ: Nếu một biến cố có xác suất
rất nhỏ thì thực tế có thể cho rằng trong một phép
thử, biến cố đó sẽ không xảy ra.

TKKD 48
2.3. CÁC CÔNG THỨC XÁC SUẤT
▪ Xác suất của biến cố tích
▪ Xác suất của biến cố tổng
▪ Công thức Bernoulli
▪ Công thức xác suất đầy đủ - Bayes

[2] Chapter 3, pp. 91-118


[3] Chapter 4, pp. 185-204

TKKD 49
Biến cố tích (hay tích các biến cố)
▪ Biến cố C là tích (intersection) của hai biến cố A và B
nếu C xảy ra khi và chỉ khi cả hai biến cố A và B cùng
đồng thời xảy ra.
▪ Ký hiệu: C = 𝐴 ∩ 𝐵
𝐴 𝐴∩𝐵 𝐵
▪ Ví dụ. Lấy lần lượt 2 quả
bóng từ trong hộp gồm bóng Ω
trắng và bóng đen. Ký hiệu:
𝐴 = “Lần 1 lấy được bóng trắng”
B = “Lần 2 lấy được bóng trắng”.
𝐴 ∩ 𝐵 = “Cả hai lần đều lấy được bóng trắng”

TKKD 50
Xác suất của biến cố tích
▪ Xác suất có điều kiện: Xác suất của biến cố 𝐴 được tính
với điều kiện biến cố 𝐵 đã xảy ra được gọi là xác suất có
điều kiện của 𝐴, hay xác suất của 𝐴 trong điều kiện 𝐵
▪ Ký hiệu: 𝑷(𝑨|𝑩)
▪ Hai biến cố 𝐴 và 𝐵 là độc lập (independent) với nhau
nếu việc xảy ra hay không xảy ra của biến cố 𝐴 không
làm thay đổi xác suất xảy ra của biến cố 𝐵 và ngược lại.
▪ Nếu 𝐴 và 𝐵 là hai biến cố độc lập thì
𝑃 𝐵𝐴 =𝑃 𝐵
và 𝑃 𝐴 𝐵 = 𝑃(𝐴)

TKKD 51
Xác suất của biến cố tích
Ví dụ 2.3. Lấy lần lượt 2 quả bóng từ trong hộp gồm 6
quả bóng trắng và 4 quả bóng đen.
𝐵 = “Lần 1 lấy được bóng trắng”
𝐴 = “Lần 2 lấy được bóng trắng”
a) Tìm 𝑃(𝐴|𝐵) trong các trường hợp:
✓ Lấy có hoàn lại
✓ Lấy không hoàn lại
b) Trong hai trường hợp đã nêu ở câu (a), trường hợp
nào hai biến cố 𝐴 và 𝐵 là hai biến cố độc lập.

TKKD 52
Xác suất của biến cố tích
Công thức xác suất của tích hai biến cố
• 𝐴 và 𝐵 là hai biến cố phụ thuộc ta có
𝑃 𝐴∩𝐵 =𝑃 𝐴 ∗𝑃 𝐵 𝐴 =𝑃 𝐵 ∗𝑃 𝐴 𝐵
• 𝐴 và 𝐵 là hai biến cố độc lập ta có
𝑃 𝐴 ∩ 𝐵 = 𝑃 𝐴 ∗ 𝑃(𝐵)
• Công thức tính xác suất có điều kiện
𝑃 𝐴∩𝐵
𝑃 𝐴𝐵 =
𝑃 𝐵

TKKD 53
Xác suất của biến cố tích
Ví dụ 2.4. Xác suất một sinh viên thi qua hai môn 𝐴
và 𝐵 lần lượt là 0,6 và 0,8. Nếu sinh viên đó thi qua môn 𝐴
thì xác suất để anh ta thi qua môn 𝐵 là 0,9.

a) Các biến cố “Thi qua môn 𝐴” và “Thi qua môn 𝐵” có


phải là các biến cố độc lập.
b) Tính xác suất thi qua cả hai môn.
c) Hãy tính xác suất sinh viên đó thi qua môn 𝐴, biết
rằng anh ta đã thi qua môn 𝐵.

TKKD 54
Xác suất của biến cố tích
Ví dụ 2.4. Giải
Đặt 𝐴 là biến cố qua môn 𝐴, 𝐵 là biến cố qua môn 𝐵, theo
bài cho thì 𝑃(𝐴) = 0,6; 𝑃(𝐵) = 0,8; 𝑃(𝐵|𝐴) = 0,9

a) Các biến cố “Thi qua môn A” và “Thi qua môn B” là các


biến cố không độc lập vì 𝑃 𝐵 𝐴 = 0,9 ≠ 0,8 = 𝑃 𝐵 .

b) P 𝐴 ∩ 𝐵 = 𝑃 𝐴 ∗ 𝑃 𝐵 𝐴 = 0,6 ∗ 0,9 = 0,54.

𝑃 𝐴∩𝐵 0,54
c) 𝑃 𝐴𝐵 = = = 0,675.
𝑃 𝐵 0,8

TKKD 55
Xác suất của biến cố tích
▪ Biến cố 𝐴 là tích của 𝒏 biến cố 𝐴1 , 𝐴2 , … , 𝐴𝑛 nếu 𝐴 xảy
ra khi và chỉ khi cả 𝑛 biến cố trên đồng thời xảy ra.
▪ Ký hiệu 𝐴 = 𝐴1 ∩ 𝐴2 ∩ ⋯ ∩ 𝐴𝑛 = ‫=𝑖𝑛ځ‬1 𝐴𝑖
▪ Ví dụ. Lấy lần lượt 5 quả bóng từ trong hộp gồm 6
bóng trắng và 4 bóng đen.
𝐴𝑖 = “Lấy được bóng trắng ở lần lấy thứ 𝑖”,
𝑖 = 1,2, … , 5
𝐴 = “Cả 5 lần đều lấy được bóng trắng”
𝐴 = 𝐴1 ∩ 𝐴2 ∩ 𝐴3 ∩ 𝐴4 ∩ 𝐴5

TKKD 56
Xác suất của biến cố tích
▪ Các biến cố 𝐴1, 𝐴2, … , 𝐴𝑛 gọi là độc lập từng đôi với
nhau nếu mỗi cặp hai trong n biến cố đó độc lập nhau.

▪ Các biến cố 𝐴1, 𝐴2, … , 𝐴𝑛 gọi là độc lập toàn phần nếu
mỗi biến cố độc lập với mọi tổ hợp bất kỳ của các biến
cố còn lại.

TKKD 57
Xác suất của biến cố tích
▪ Nếu 𝐴1 , 𝐴2 , … , 𝐴𝑛 là các biến cố độc lập thì
𝑃 𝐴1 ∩ 𝐴2 ∩ ⋯ ∩ 𝐴𝑛 = 𝑃 𝐴1 ∗ 𝑃 𝐴2 ∗ … ∗ 𝑃 𝐴𝑛

▪ Ví dụ. Lấy lần lượt 5 quả bóng từ hộp gồm 6 bóng


trắng và 4 bóng đen theo phương thức lấy có hoàn lại.
Xác suất để 5 quả bóng lấy ra đều có màu trắng là:
6 6 6 6 6
∙ ∙ ∙ ∙ = 0.65
10 10 10 10 10

TKKD 58
Xác suất của biến cố tích
Nếu 𝐴1 , 𝐴2 , … , 𝐴𝑛 là các biến cố phụ thuộc thì
𝑃 𝐴1 ∩ 𝐴2 ∩ ⋯ ∩ 𝐴𝑛 = 𝑃 𝐴1 ∗ 𝑃 𝐴2 |𝐴1 ∗ ⋯ ∗ 𝑃 𝐴𝑛 |𝐴1 ∩ 𝐴2 ∩ ⋯ ∩ 𝐴𝑛−1

Ví dụ. Lấy lần lượt không hoàn lại 3 quả bóng từ hộp có 6 bóng trắng
và 4 bóng đen. Tính xác suất lấy được 3 bóng trắng.

Đặt 𝐴1 , 𝐴2 , 𝐴3 lần lượt là lấy được bóng trắng ở lần 1, 2, 3


Khi đó

6 5 4 1
𝑃 𝐴1 ∩ 𝐴2 ∩ 𝐴3 = 𝑃 𝐴1 ∗ 𝑃 𝐴2 |𝐴1 ∗ 𝑃 𝐴3 |𝐴1 ∩ 𝐴2 = ∗ ∗ =
10 9 8 6

TKKD 59
4.4. cố
Biến Mốitổng
quan hệ giữa
(tổng các biến
các biến cố) cố
▪ Biến cố 𝐶 được gọi là tổng (union) của hai biến cố 𝐴
và 𝐵, nếu 𝐶 chỉ xảy ra khi có ít nhất một trong hai biến
cố 𝐴 và 𝐵 xảy ra.
▪ Ký hiệu: 𝐶 = 𝐴 ∪ 𝐵

𝐴 𝐵

TKKD 60
Xác suất của biến cố tổng
▪ Ví dụ. Lấy lần lượt 2 quả bóng từ hộp 6 bóng trắng và
4 bóng đen
𝐴 = “Lần 1 lấy được bóng trắng”,
𝐵 = “Lần 2 lấy được bóng trắng”
𝐴 ∪ 𝐵 = “Có ít nhất 1 lần lấy được bóng trắng”

▪ Biến cố 𝐴 được gọi là tổng của n biến cố


𝐴1 , 𝐴2 , … , 𝐴𝑛 nếu 𝐴 xảy ra khi có ít nhất một trong 𝑛
biến cố ấy xảy ra.
▪ Ký hiệu: 𝐴 = 𝐴1 ∪ 𝐴2 ∪ ⋯ ∪ 𝐴𝑛 = ‫=𝑖𝑛ڂ‬1 𝐴𝑖

TKKD 61
Xác suất của biến cố tổng
▪ Hai biến cố xung khắc: Hai biến cố 𝐴 và 𝐵 được gọi là
xung khắc (mutually exclusive) với nhau nếu chúng
không cùng xảy ra trong một phép thử.
▪ 𝐴∩𝐵 =∅
▪ Ví dụ. Lấy ngẫu nhiên hai quả
bóng từ trong hộp (6tr, 4đ). A B
𝐴 = “Hai trắng”, 𝐵 = “Hai đen”
Ω
𝐶 = “Có ít nhất một quả trắng”
Nhận xét về tính xung khắc của các biến cố 𝐴, 𝐵 và 𝐶.

TKKD 62
Xác suất của biến cố tổng
▪ Nhóm n biến cố 𝐴1, 𝐴2, … , 𝐴𝑛 được gọi là xung khắc
từng đôi nếu bất kỳ hai biến cố nào trong nhóm này
cũng xung khắc với nhau.

▪ Nhóm đầy đủ các biến cố: Các biến cố 𝐻1, 𝐻2, … , 𝐻𝑛


được gọi là một nhóm đầy đủ (universal set,
partitions) các biến cố nếu trong kết quả của một
phép thử sẽ xảy ra một và chỉ một trong các biến cố
đó

▪ Nhóm đầy đủ ⇒ Nhóm xung khắc từng đôi


TKKD 63
Xác suất của biến cố tổng
Hay nói khác đi, các biến cố 𝐻1, 𝐻2, … , 𝐻𝑛 được gọi là một
nhóm đầy đủ các biến cố nếu đồng thời thỏa mãn 2 điều
kiện sau:

𝐻𝑖 ∩ 𝐻𝑗 = ∅ ∀𝑖 ≠ 𝑗
𝑛

ራ 𝐻𝑖 = Ω
𝑖=1

TKKD 64
Xác suất của biến cố tổng
▪ Biến cố đối lập: Hai biến cố 𝐴 và 𝐴ҧ là hai biến cố đối lập
với nhau nếu chúng tạo thành một nhóm đầy đủ các biến
cố.
▪ Ký hiệu: 𝐴ҧ là biến cố đối lập
với biến cố 𝐴.
▪ 𝐴 ∩ 𝐴ҧ = ∅
𝐴
▪ 𝑃 𝐴 = 1 − 𝑃 𝐴ҧ 𝐴 ҧ
Ω

▪ Ví dụ. Tìm biến cố đối lập của các biến cố sau:


• 𝐴 = “hai lần tung đồng xu đều xuất hiện mặt sấp”
• 𝐵 = “cả hai quả bóng lấy ra đều màu trắng”
• 𝐶 = “tất cả các sinh viên đều thi qua môn xác suất”
TKKD 65
Xác suất của biến cố tổng

Ví dụ. Tung một đồng xu 2 lần.


𝐴 = “Có ít nhất 1 lần xuất hiện mặt sấp”
Biến cố đối lập với biến cố 𝐴:
𝐴ҧ = “Không lần nào xuất hiện mặt sấp” hoặc “Cả hai
lần đều xuất hiện mặt ngửa”
1 3
𝑃 𝐴 = 1 − 𝑃 𝐴ҧ = 1 − =
4 4

TKKD 66
Xác suất của biến cố tổng
Công thức xác suất của biến cố tổng
▪ A và B là hai biến cố không xung khắc thì

𝑃 𝐴∪𝐵 =𝑃 𝐴 +𝑃 𝐵 −𝑃 𝐴∩𝐵

▪ 𝐴 và 𝐵 là hai biến cố xung khắc thì

𝑃 𝐴 ∪ 𝐵 = 𝑃 𝐴 + 𝑃(𝐵)

TKKD 67
Xác suất của biến cố tổng
Ví dụ 2.5. Tiếp ví dụ 2.4
Xác suất một sinh viên thi qua hai môn A và B lần lượt là
0,6 và 0,8. Nếu sinh viên đó thi qua môn A thì xác suất để
anh ta thi qua môn B là 0,9.
Viết biến cố và tính xác suất để sinh viên đó:
a) Qua ít nhất một môn
b) Trượt cả hai môn
c) Trượt ít nhất một môn

TKKD 68
Xác suất của biến cố tổng
Ví dụ 2.5. Giải (biểu diễn biến cố)
Gọi A, B lần lượt là biến cố qua môn A, B tương ứng

a) Qua ít nhất một môn = 𝐴 ∪ 𝐵


b) Trượt cả hai môn = 𝐴ҧ ∩ 𝐵ത = Ω\(𝐴 ∪ 𝐵) = 𝐴 ∪ 𝐵
c) Trượt ít nhất một môn = 𝐴ҧ ∪ 𝐵ത = Ω\(𝐴 ∩ 𝐵) = 𝐴 ∩ 𝐵

TKKD 69
Xác suất của biến cố tổng
Ví dụ 2.5. Giải tiếp (tính xác suất)

a) P 𝐴 ∪ 𝐵 = 𝑃 𝐴 + 𝑃 𝐵 − 𝑃 𝐴 ∩ 𝐵 = 0,6 + 0,8 − 0,54 = 0,86


b) P 𝐴ҧ ∩ 𝐵ത = 𝑃 𝐴 ∪ 𝐵 = 1 − 𝑃 𝐴 ∪ 𝐵 = 1 − 0,86 = 0,14
c) P 𝐴ҧ ∪ 𝐵ത = 𝑃 𝐴 ∩ 𝐵 = 1 − 𝑃 𝐴 ∩ 𝐵 = 1 − 0,54 = 0,46

TKKD 70
Xác suất của biến cố tổng
Từ dữ kiện trong Ví dụ 2.4, lập bảng xác suất đồng thời

Bảng phân phối xác Môn B


suất đồng thời
Đạt Không đạt Tổng
B B
Môn A Đạt A 0,54 0,06 0,6
Không đạt A 0,26 0,14 0,4
Tổng 0,8 0,2 1

TKKD 71
Xác suất của biến cố tổng
Với 𝐴 và 𝐵 là hai biến cố ngẫu nhiên, khi đó ta có một số
công thức sau:
ത ∪ (𝐴ҧ ∩ 𝐵) ∪ (𝐴ҧ ∩ 𝐵)
(𝐴 ∩ 𝐵) ∪ (𝐴 ∩ 𝐵) ത = Ω

ത ∪ (𝐴ҧ ∩ 𝐵)
𝐴 ∪ 𝐵 = (𝐴 ∩ 𝐵) ∪ (𝐴 ∩ 𝐵)

𝐴ҧ ∪ 𝐵ത = (𝐴 ∩ 𝐵)
ത ∪ (𝐴ҧ ∩ 𝐵) ∪ (𝐴ҧ ∩ 𝐵)

𝐴 ∪ 𝐵 = 𝐴ҧ ∩ 𝐵ത
𝐴 ∩ 𝐵 = 𝐴ҧ ∪ 𝐵ത

TKKD 72
Xác suất của biến cố tổng
Bài tập 1 (làm tại lớp)
Một người đi bán hàng ở hai nơi độc lập nhau. Xác suất
bán được hàng lần lượt là 0,6 và 0,8.
Đặt A1 và A2 tương ứng với biến cố bán được hàng ở nơi
1 và 2.
Viết biến cố và tính xác suất người đó
(a) Bán được hàng ở cả hai nơi
(b) Bán được hàng ở ít nhất một nơi
(c) Bán được hàng ở đúng một nơi
(d) Không bán được hàng

TKKD 73
Xác suất của biến cố tổng
▪ Bảng xác suất của các biến cố

A2 Ā2 
A1 P(A1∩A2) = 0,48 P(A1∩Ā2) = 0,12 P(A1) = 0,6
Ā1 P(Ā1∩A2) = 0,32 P(Ā1∩Ā2) = 0,08 P(Ā1) = 0,4
 P(A2) = 0,8 P(Ā2) = 0,2 1

▪ 𝑃(𝐴1 ∪ 𝐴2) = 𝑃 𝐴1 + 𝑃 𝐴2 − 𝑃 𝐴1 ∩ 𝐴2
= 0,6 + 0,8 – 0,48
cũng = 0,32 + 0,48 + 0,12

TKKD 74
Xác suất của biến cố tổng
Bài tập 2
Một người đấu thầu hai dự án. Xác suất trúng thầu dự án
thứ nhất và thứ hai lần lượt là 0,5 và 0,4; xác suất trúng
thầu cả hai là 0,1.
Viết biến cố, lập bảng, và tính xác suất:
(a) Trúng thầu ở ít nhất một dự án
(b) Trúng thầu ở đúng một dự án
(c) Trúng thầu dự án thứ hai, biết rằng trúng thầu dự án
thứ nhất
(d) Trúng thầu dự án thứ hai, biết rằng không trúng thầu
ở dự án thứ nhất

TKKD 75
Bài tập 2 (Giải)
0,2

0,4 0,1 0,3


𝐴1 ∩ 𝐴2
𝐴1 ∩ 𝐴ҧ2 𝐴1ҧ ∩ 𝐴2

Ω
Đặt 𝐴1 , 𝐴2 lần lượt là các biến cố trúng thầu ở dự án 1, 2.
(a) 𝑃 𝐴1 ∪ 𝐴2 = 0,8
(b) 𝑃 (𝐴1 ∩ 𝐴ҧ2 ) ∪ (𝐴1ҧ ∩ 𝐴2 ) = 0,7
0,1
(c) 𝑃 𝐴2 𝐴1 = = 0,2
0,5
0,3
(d) 𝑃 𝐴2 𝐴1ҧ = = 0,6
0,5

TKKD 76
Xác suất của biến cố tổng
Bài tập 3
Một người làm hai bài tập kế tiếp. Xác suất làm đúng bài
thứ nhất là 0,6. Nếu làm đúng bài thứ nhất thì khả năng
làm đúng bài thứ hai là 0,9 nhưng nếu làm sai bài thứ
nhất thì khả năng đúng bài thứ hai còn 0,3. Tính xác suất:
(a) Làm đúng ít nhất một bài
(b) Làm đúng chỉ 1 bài
(c) Làm đúng bài 1 biết rằng làm đúng bài 2
(d) Làm đúng cả hai, biết rằng có làm đúng ít nhất một
bài

TKKD 77
Bài tập 3 (Giải)
Đặt 𝐴1 , 𝐴2 lần lượt là biến cố
0,28
làm được bài 1, 2. Ta có
0,06 0,54 0,12
𝑃 𝐴1 ∩ 𝐴2 = 𝑃 𝐴1 . 𝑃 𝐴2 𝐴1
𝐴1 ∩ 𝐴2
𝐴1 ∩ 𝐴ҧ2 𝐴1ҧ ∩ 𝐴2
= 0,6*0,9 = 0,54
𝑃 𝐴1ҧ ∩ 𝐴2 = 𝑃 𝐴1ҧ . 𝑃 𝐴2 𝐴1ҧ
Ω
= 0,4*0,3 = 0,12
→ 𝑃 𝐴2 = 0,54 + 0,12 = 0,66
(a) 𝑃 𝐴1 ∪ 𝐴2 = 0,72
(b) 𝑃 (𝐴1 ∩ 𝐴ҧ2 ) ∪ (𝐴1ҧ ∩ 𝐴2 ) = 0,18
0,54
(c) 𝑃 𝐴1 𝐴2 = = 0,818
0,66
0,54
(d) 𝑃[ 𝐴1 ∩ 𝐴2 ) (𝐴1 ∪ 𝐴2 ] = = 0,75
0,72
TKKD 78
Xác suất của biến cố tổng
▪ Nếu nhóm 𝐴1, 𝐴2, … , 𝐴𝑛 là nhóm các biến cố xung
khắc từng đôi thì
𝑃 𝐴1 ∪ 𝐴2 ∪ ⋯ ∪ 𝐴𝑛 = 𝑃 𝐴1 + 𝑃 𝐴2 + ⋯ + 𝑃 𝐴𝑛
▪ Nếu nhóm 𝐻1, 𝐻2, … , 𝐻𝑛 là một nhóm đầy đủ thì
𝑃 𝐻1 ∪ ⋯ ∪ 𝐻𝑛 = 𝑃 𝐻1 + ⋯ + 𝑃 𝐻𝑛 = 1
▪ Hai biến cố 𝐴 và 𝐴ҧ luôn lập thành một nhóm đầy đủ
▪ Ví dụ. Tung một đồng xu 2 lần, Đặt 𝐴1 = “2 lần sấp”,
𝐴2 = “2 lần ngửa”, 𝐴3 = “1 lần sấp, 1 lần ngửa”, 𝐴4 =
“có ít nhất 1 lần sấp”. Hãy tìm các nhóm đầy đủ.

TKKD 79
Công thức Bernoulii
▪ Giả sử có 𝑛 phép thử độc lập
▪ Trong mỗi phép thử, xác suất xảy ra biến cố 𝐴 là như
nhau và là 𝑝, xác suất không xảy ra 𝐴 là 1 − 𝑝
⟹ Lược đồ Bernoulli
▪ Xác suất để trong 𝑛 phép thử đó, biến cố 𝐴 xảy ra
đúng 𝑥 lần được ký hiệu 𝑃 𝑥 𝑛, 𝑝
▪ Công thức Bernoulli
𝑃 𝑥 𝑛, 𝑝 = 𝐶𝑛𝑥 𝑝 𝑥 1 − 𝑝 𝑛−𝑥

TKKD 80
Công thức Bernoulli
Ví dụ 2.6. Một người đi bán hàng ở 3 nơi độc lập, xác
suất bán được ở mỗi nơi đều bằng 0,8. Tính xác suất
người đó:
a) Bán được ở đúng 1 nơi
b) Bán được ở đúng 2 nơi
c) Bán được ở ít nhất 1 nơi

TKKD 81
Công thức xác suất đầy đủ - Bayes
▪ 𝐻1, 𝐻2, … , 𝐻𝑛 : nhóm đầy đủ các biến cố.
▪ Biến cố A xảy ra đồng thời với một trong các biến cố
𝐻1, 𝐻2, … , 𝐻𝑛
▪ Công thức xác suất đầy đủ:
n
P( A) =  P( Hi ).P( A | Hi )
▪ Công thức Bayes i =1

P( Hi ).P( A | Hi )
P( Hi | A) = n
 P( Hi ).P( A | Hi )
i =1
TKKD 82
Công thức xác suất đầy đủ - Bayes
Ví dụ 2.7. Có hai hộp giống nhau: hộp loại I chứa 6
chính phẩm và 4 phế phẩm; hộp loại II chứa 8 chính
phẩm và 2 phế phẩm.
a) Chọn ngẫu nhiên một hộp và từ đó chọn 1 sản
phẩm. Tính xác suất để đó là chính phẩm.
b) Nếu chọn được chính phẩm, xác suất để hộp được
chọn là hộp loại I bằng bao nhiêu?

TKKD 83
Công thức xác suất đầy đủ - Bayes
𝐴1 = “lấy được hộp loại I”, 𝐴2 = “lấy được hộp loại II”
𝐵 = “lấy được chính phẩm”, 𝐵 = 𝐵 ∩ 𝐴1 ) ∪ (𝐵 ∩ 𝐴2
Lập bảng tính cho câu (a), (b)
𝑃(𝐴𝑖 ) 𝑃(𝐵|𝐴𝑖 ) 𝑃(𝐵 ∩ 𝐴𝑖 ) 𝑃(𝐴𝑖 |𝐵)
𝑨𝟏 0,5 0,6 0,5×0,6 = 0,3 0,3 / 0,7
𝑨𝟐 0,5 0,8 0,5×0,8 = 0,4 0,4 / 0,7
 1 0,7 1

a) 𝑃 𝐵 = 𝑃 𝐵 ∩ 𝐴1 ∪ 𝐵 ∩ 𝐴2
= 𝑃 𝐵 ∩ 𝐴1 + 𝑃 𝐵 ∩ 𝐴2 = 0,7
b) 𝑃 𝐴1 𝐵 = 0,3/0,7
TKKD 84
Công thức xác suất đầy đủ - Bayes
Tiếp Ví dụ 2.7. Nếu có 5 hộp, trong đó có 2 hộp loại I (gồm
6 chính phẩm và 4 phế phẩm) và 3 hộp loại II (gồm 8 chính
phẩm và 2 phế phẩm), thì các câu (a), (b) trong Ví dụ 2.7 sẽ
có kết quả bao nhiêu?

TKKD 85
BÀI 3 – BIẾN NGẪU NHIÊN RỜI RẠC VÀ
PHÂN PHỐI XÁC SUẤT

3.1. Khái niệm biến ngẫu nhiên


3.2. Bảng phân phối xác suất
3.3. Hàm phân phối xác suất
3.4. Các tham số đặc trưng
3.5. Phân phối Không-Một
3.6. Phân phối Nhị thức

TKKD 86
3.1. KHÁI NIỆM BIẾN NGẪU NHIÊN
▪ Một biến số được gọi là ngẫu nhiên nếu trong kết quả
của phép thử nó sẽ nhận 1 và chỉ 1 giá trị trong số các
giá trị có thể có của nó, tùy thuộc vào sự tác động của
các nhân tố ngẫu nhiên.

• Kí hiệu biến ngẫu nhiên: 𝑋, 𝑌, 𝑍, … hay 𝑋1, 𝑋2, …

• Giá trị có thể có của 𝑋 ký hiệu: 𝑥1 , 𝑥2 , … , 𝑥𝑛

• (𝑋 = 𝑥𝑖 ) là các biến cố 𝑋 nhận giá trị 𝑥𝑖


• 𝑃(𝑋 = 𝑥𝑖 ) là xác suất 𝑋 nhận giá trị 𝑥𝑖

TKKD 87
3.1. KHÁI NIỆM BIẾN NGẪU NHIÊN
▪ Ví dụ. Tung 1 xúc xắc.
Nếu đặt 𝑋 là số chấm xuất hiện thì 𝑋 là một biến ngẫu nhiên
𝑋 có thể nhận 1, 2, 3, 4, 5, 6.
→ 𝑋 chưa biết nhận giá trị nào, nhưng chắc chắn nhận 1 trong
các giá trị đó
(𝑋 = 2) là biến cố xuất hiện mặt 2 chấm
𝑃(𝑋 = 2) là xác suất xuất hiện mặt 2 chấm
▪ Ví dụ. Đặt 𝑌 là điểm kiểm tra môn xác suất thống kê
𝑌 nhận các giá trị 0, 1, 2, … , 10
▪ Ví dụ. Gọi 𝑍 là năng suất lúa
𝑍 nhận các giá trị trong khoảng (0; 60)

TKKD 88
Phân loại biến ngẫu nhiên
+ Biến ngẫu nhiên rời rạc:
Nếu các giá trị có thể có của nó lập nên một tập hợp hữu
hạn hoặc đếm được.

+ Biến ngẫu nhiên liên tục:


Nếu các giá trị có thể có của nó lấp đầy một khoảng trên
trục số.

TKKD 89
3.2. PHÂN PHỐI XÁC SUẤT
Phân phối xác suất của một biến ngẫu nhiên là sự tương
ứng giữa các giá trị có thể có của nó với các xác suất
tương ứng để biến ngẫu nhiên nhận các giá trị đó.

Các phương pháp mô tả phân phối xác suất:

▪ Bảng phân phối xác suất


▪ Hàm phân phối xác suất
▪ Hàm mật độ xác suất

TKKD 90
BẢNG PHÂN PHỐI XÁC SUẤT
Cho biến ngẫu nhiên rời rạc 𝑋 nhận các giá trị 𝑥1 , 𝑥2 , … , 𝑥𝑛
với xác suất tương ứng 𝑝1 , 𝑝2 , … , 𝑝𝑛

𝑋 𝑥1 𝑥2 … 𝑥𝑘 … 𝑥𝑛
𝑃 𝑝1 𝑝2 … 𝑝𝑘 … 𝑝𝑛
n
0  pi  1, p
i =1
i =1

Bảng trên gọi là bảng phân phối xác suất của biến ngẫu
nhiên rời rạc 𝑋

TKKD 91
Bảng phân phối xác suất
Ví dụ 3.1. Một hộp có 6 sản phẩm tốt và 4 sản phẩm xấu.
Lấy đồng thời 2 sản phẩm. Đặt 𝑋 số sản phẩm tốt lấy
được.
Lập bảng phân phối xác suất của 𝑋
Do 𝑋 là số sản phẩm tốt lấy được nên các giá trị có thể có
của 𝑋 là 0, 1, 2

𝑋 0 1 2
𝑃 ? ? ?

TKKD 92
3.3. HÀM PHÂN PHỐI XÁC SUẤT
Hàm phân phối xác suất của biến ngẫu nhiên, kí hiệu
𝐹(𝑥), là xác suất để biến ngẫu nhiên 𝑋 nhận giá trị nhỏ
hơn 𝑥, với 𝑥 là số thực bất kì

𝐹(𝑥) = 𝑃(𝑋 < 𝑥)

Ý nghĩa: Hàm phân phối xác suất 𝐹(𝑥) phản ánh mức
độ tập trung xác suất ở bên trái điểm 𝑥.

TKKD 93
Tính chất hàm phân phối xác suất

▪ Tính chất 1: 0 ≤ 𝐹 𝑥 ≤ 1

▪ Tính chất 2: 𝐹 + ∞ = 1, 𝐹 −∞ = 0

▪ Tính chất 3: 𝐹(𝑥) là hàm không giảm

Hệ quả : 𝑃(𝑎 ≤ 𝑋 < 𝑏) = 𝐹(𝑏) – 𝐹(𝑎)

TKKD 94
3.4. CÁC THAM SỐ ĐẶC TRƯNG
▪ Kì vọng (Expected value)
▪ Phương sai (Variance)
▪ Độ lệch chuẩn (Standard Deviation)
▪ Ví dụ 3.1. Với 𝑋 là tỉ suất lợi nhuận cổ phiếu A
Điểm 7 8 9
Số SV 40 20 40
Tỷ lệ 40% 20% 40%
Xác suất 0,4 0,2 0,4

- Tính tỉ suất lợi nhuận trung bình, nêu ý nghĩa

TKKD 95
Kì vọng của BNN rời rạc
▪ Cho biến ngẫu nhiên rời rạc 𝑋

▪ Kì vọng của biến ngẫu nhiên 𝑋, kí hiệu 𝐸(𝑋)

𝑬 𝑿 = ∑𝒊 𝒙𝒊 𝒑𝒊 = 𝒙𝟏 𝒑𝟏 + 𝒙𝟐 𝒑𝟐 + ⋯ + 𝒙𝒏 𝒑𝒏

▪ Ví dụ 3.2. Tính kỳ vọng của biến ngẫu nhiên 𝑋 có bảng phân phối
xác suất sau:

𝑿 1 2 3 4 5
𝑷 0,1 0,4 0,25 0,2 0,05

TKKD 96
Kì vọng
▪ Kì vọng phản ánh giá trị trung bình của biến ngẫu
nhiên.
▪ 𝐸(𝑋) đơn vị trùng với đơn vị của 𝑋
▪ Tính chất:
𝐸 𝐶 =𝐶, 𝐶: hằng số
𝐸 𝐶 + 𝑋 = 𝐶 + 𝐸(𝑋)
𝐸 𝐶. 𝑋 = 𝐶. 𝐸(𝑋)
𝐸 𝑋 ± 𝑌 = 𝐸(𝑋) ± 𝐸(𝑌)
𝐸 𝑋. 𝑌 = 𝐸 𝑋 . 𝐸 𝑌 nếu 𝑋, 𝑌 độc lập

TKKD 97
Kì vọng
Ví dụ 3.3. Mua một vé số loại 2 chữ số hết 10.000 đồng,
nếu trúng thì được 70 lần tiền mua vé.
Tính kì vọng tiền lãi
Đặt 𝑋 là tiền lãi (nghìn đồng)
𝑋 +690 -10
𝑃 0,01 0,99

Kì vọng lợi nhuận: 𝐸(𝑋) =

TKKD 98
Kì vọng
Ví dụ 3.4. Giả sử 𝑋 là số sản phẩm bán được trong 1 ngày
𝑋 1 2 3 4 5
𝑃 0,1 0,4 0,25 0,2 0,05

a. Mỗi sp bán được lãi 800 ngàn, tiền thuê cửa hàng mỗi tháng là 5
triệu. Tính trung bình tiền lãi mỗi tháng (với tháng có 30 ngày)
b. Nếu mỗi ngày nhân viên bán được trên 4 sp thì được thưởng
300 ngàn, từ 2 đến 4 sp được 100 ngàn, 1 sp được 50 ngàn.
Nhân viên có 2 phương thức để lựa chọn lương tháng:
1- nhận cứng 7 triệu, 2- nhận cứng 4 triệu + thưởng.
Nhân viên nên chọn phương thức nào?

TKKD 99
Kì vọng
Ví dụ 3.4. Giải ý b: Đặt 𝑌 là số tiền thưởng nhận được
trong 1 ngày nếu nhân viên chọn phương thức 2 (đv ngàn
đồng)
𝒀 50 100 300
𝑷 0,1 0,85 0,05
Suy ra
𝐸 𝑌 = 50 ∗ 0,1 + 100 ∗ 0,85 + 300 ∗ 0,05
= 105 ngàn đồng
Tiền thưởng 1 tháng nhân viên nhận được nếu chọn phương thức
2 là 30 ∗ 105 = 3.150 (ngàn đồng)

TKKD 100
Phương sai
▪ Ví dụ 3.5: Tỉ suất lợi nhuận 2 cổ phiếu (%) có bảng sau

Cổ phiếu A 6 7 8
Xác suất 0,4 0,2 0,4

Cổ phiếu B 5 7 9
Xác suất 0,4 0,2 0,4
▪ So sánh tỉ suất lợi nhuận trung bình
▪ Cổ phiếu nào rủi ro hơn?

TKKD 101
Phương sai

𝑉 𝑋 = 𝐸 𝑋– 𝐸 𝑋 2

Biến đổi ta có: 𝑉(𝑋) = 𝐸(𝑋2) – 𝐸 𝑋 2

n
Trong đó: E ( X 2 ) =  xi2 pi
i =1

Chú ý: 𝑉(𝑋) ≥ 0

TKKD 102
Phương sai
Tính chất

𝑉 𝐶 =0, 𝐶: hằng số
𝑉 𝑋+𝐶 =𝑉 𝑋
𝑉 𝐶. 𝑋 = 𝐶 2 . 𝑉 𝑋
𝑉 𝑋 ± 𝑌 = 𝑉 𝑋 + 𝑉 𝑌 Với 𝑋 và 𝑌 độc lập

TKKD 103
Phương sai
▪ Ví dụ 3.6. Tỷ suất lợi nhuận nếu đầu tư vào 2 ngành A và
B có bảng phân phối xác suất như sau

𝑋𝐴 30 40 42
𝑃 0,2 0,6 0,2

𝑋𝐵 -10 40 120
𝑃 0,2 0,6 0,2
▪ So sánh kì vọng tỷ suất lợi nhuận, so sánh phương sai
▪ Nếu chọn 1 ngành, Nhà đầu tư nên đầu tư vào ngành
nào?

TKKD 104
Phương sai
▪ Ý nghĩa: Phương sai phản ánh độ phân tán của biến
ngẫu nhiên. Phương sai lớn thì độ phân tán lớn.
Phương sai phản ánh độ rủi ro, độ ổn định, độ đồng
đều

▪ Đơn vị của phương sai?

TKKD 105
Độ lệch chuẩn
Độ lệch chuẩn của biến ngẫu nhiên 𝑋, kí hiệu 𝜎(𝑋),
được định nghĩa là căn bậc hai của phương sai

 X =  (X ) = V (X )

Ý nghĩa: Phương sai và độ lệch chuẩn đều phản ánh độ


phân tán của biến ngẫu nhiên, tuy nhiên
▪ Đơn vị của phương sai là bình phương đơn vị của bnn
▪ Đơn vị của độ lệch chuẩn là đơn vị của bnn

TKKD 106
3.5. PHÂN PHỐI KHÔNG – MỘT
Định nghĩa: Biến ngẫu nhiên rời rạc 𝑋 chỉ nhận một trong hai giá trị 0 hoặc 1 với xác
suất được tính bởi công thức

P( X = x) = p x (1 − p )1− x x = 0, 1

Được gọi là có phân phối 0 – 1 với tham số 𝑝


Kí hiệu: 𝑋 ~ 𝐴(𝑝)

𝑋 có bảng phân phối xác suất

𝑋 0 1
𝑃 1−𝑝 𝑝
Tham số đặc trưng: 𝐸(𝑋) = 𝑝; 𝑉(𝑋) = 𝑝(1 − 𝑝)

TKKD 107
3.6. PHÂN PHỐI NHỊ THỨC
Định nghĩa:
+ Xét 𝑛 phép thử độc lập
+ Xác suất xảy ra biến cố 𝐴 trong mỗi phép thử là 𝑝
Gọi 𝑋 là số lần xảy ra 𝐴 trong 𝑛 lần thử
𝑋 có thể nhận các giá trị 0, 1, 2, … , 𝑛 với các xác suất tương
ứng được tính theo công thức

𝑃 𝑋 = 𝑥 = 𝐶𝑛𝑥 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥 𝑥 = 0, 1, 2, … , 𝑛

𝑋 gọi là có phân phối Nhị thức với tham số 𝑛 và 𝑝.


Kí hiệu: 𝑋 ~ 𝐵(𝑛, 𝑝)

TKKD 108
Phân phối nhị thức
Các tham số đặc trưng:
▪ Kì vọng 𝐸(𝑋) = 𝑛𝑝
▪ Phương sai 𝑉(𝑋) = 𝑛𝑝(1 − 𝑝)
▪ Mốt 𝑚0 là giá trị thỏa mãn 𝑃(𝑋 = 𝑚0 ) → 𝑚𝑎𝑥
Với 𝑋 ~ 𝐵(𝑛, 𝑝) thì mốt 𝑚0 thỏa mãn

𝑛𝑝 + 𝑝 – 1 ≤ 𝑚0 ≤ 𝑛𝑝 + 𝑝

𝑚0 ∈ ℤ

TKKD 109
Phân phối nhị thức
Ví dụ 3.8. Một người đi chào hàng ở 10 địa điểm. Xác
suất bán được hàng ở mỗi địa điểm đều bằng 0,2.
a) Tính xác suất bán được hàng ở đúng 3 địa điểm.
b) Tính xác suất bán được hàng ở ít nhất 2 địa điểm.
c) Tính kì vọng, phương sai và mốt của số địa điểm bán
được hàng.

TKKD 110
Phân phối nhị thức
Ví dụ 3.8. Giải
Đặt 𝑋 là số địa điểm bán được hàng
Khi đó 𝑋~𝐵(𝑛 = 10; 𝑝 = 0,2)
3
a) 𝑃 𝑋 = 3 = 𝐶10 0,23 0,87 = 0,2013.
b) 𝑃 𝑋 ≥ 2 = 1 − 𝑃 𝑋 < 2 = 1 − 𝑃 𝑋 = 0 − 𝑃 𝑋 = 1
= 1 − 0,810 − 10 ∗ 0,2 ∗ 0,89 = 0,6242.

c) 𝐸 𝑋 = 10 ∗ 0,2 = 2
𝑉 𝑋 = 10 ∗ 0,2 ∗ 0,8 = 1,6
10 ∗ 0,2 + 0,2 − 1 ≤ 𝑚0 ≤ 10 ∗ 0,2 + 0,2
Do 𝑚0 là số nguyên nên 𝑚0 = 2.

TKKD 111
Phân phối nhị thức
Phân phối nhị thức tỉ lệ
Cho 𝑋 ~ 𝐵(𝑛, 𝑝)
𝑋
Đặt 𝑝Ƹ =
𝑛
Khi đó 𝑝Ƹ có phân phối Nhị thức tỉ lệ
▪ Kì vọng 𝐸(𝑝)Ƹ = 𝑝
𝑝(1−𝑝)
▪ Phương sai 𝑉(𝑝)Ƹ =
𝑛

TKKD 112
BÀI 4 – BIẾN NGẪU NHIÊN LIÊN TỤC VÀ
PHÂN PHỐI XÁC SUẤT
4.1. Biến ngẫu nhiên liên tục
4.2. Hàm phân phối xác suất
4.3. Hàm mật độ xác suất
4.4. Các tham số đặc trưng
4.5. Phân phối Chuẩn
4.6. Phân phối khác

TKKD 113
4.1. BIẾN NGẪU NHIÊN LIÊN TỤC
Định nghĩa
Biến ngẫu nhiên liên tục (Continuous Random Variable) là
biến ngẫu nhiên có thể nhận mọi giá trị trong một khoảng
𝑎; 𝑏 , 𝑎, 𝑏 ∈ ℝ.
Ví dụ
▪ Thời gian đi từ nhà đến trường của sinh viên
▪ Lợi nhuận của nhà đầu tư cổ phiếu sau một năm
▪ Cân nặng của trẻ sơ sinh ở Việt Nam

TKKD 114
4.2. HÀM PHÂN PHỐI XÁC SUẤT
Định nghĩa
Hàm phân phối xác suất (hàm tích lũy xác suất -
Cumulative Distribution Function) của biến ngẫu nhiên 𝑋
là: 𝐹 𝑥 =𝑃 𝑋<𝑥 , 𝑥∈ℝ

TKKD 115
Tính chất hàm phân phối xác suất
▪ 𝑃 𝑎 < 𝑋 <𝑏 =𝐹 𝑏 −𝐹 𝑎

▪ Nếu 𝑋 là biến ngẫu nhiên liên tục thì: 𝑃 𝑋 = 𝑥𝑜 = 0


⇒𝑃 𝑎 <𝑋 <𝑏 =𝑃 𝑎 ≤𝑋 ≤𝑏 =𝐹 𝑏 −𝐹 𝑎
TKKD 116
Ví dụ
Ví dụ 4.1. Tuổi thọ (𝑋) của một loại sản phẩm là biến ngẫu
nhiên liên tục (đơn vị: năm) có hàm phân phối xác suất:

0 nếu 𝑥 < 0
1 2
𝐹 𝑥 = ൞ 4 𝑥 nếu 0 ≤ 𝑥 ≤ 2
1 nếu 𝑥 > 2

Lấy ngẫu nhiên một sản phẩm.


Tính xác suất để:
a) Sản phẩm có tuổi thọ nhỏ hơn 1 năm.
b) Sản phẩm có tuổi thọ từ 1 đến 2 năm.
TKKD 117
Hàm mật độ xác suất
Cho 𝑋 là biến ngẫu nhiên liên tục, hàm mật độ xác suất
(Density Function) của 𝑋, ký hiệu 𝑓 𝑥 , là:

𝑓 𝑥 = 𝐹′(𝑥)

Ví dụ 4.2. Tìm hàm mật độ xác suất của biến ngẫu nhiên
trong ví dụ 4.1
0 nếu 𝑥 < 0
1 2
𝐹 𝑥 = 𝑥 nếu 0 ≤ 𝑥 ≤ 2
4
1 nếu 𝑥 > 2

TKKD 118
Hàm mật độ xác suất
Ví dụ 4.2. Giải
Hàm mật độ xác suất có dạng

1
𝑥 với 𝑥 ∈ 0; 2
𝑓 𝑥 =ቐ 2
0 với 𝑥 ∉ 0; 2

TKKD 119
Tính chất của hàm mật độ xác suất
▪ 𝑓 𝑥 ≥ 0 ∀𝑥

𝑥
▪ 𝐹 𝑥 = ‫׬‬−∞ 𝑓(𝑡) 𝑑𝑡

+∞
▪ ‫׬‬−∞ 𝑓 𝑥 𝑑𝑥 = 1

𝑏
▪ 𝑃 𝑎<𝑋<𝑏 = ‫𝑓 𝑎׬‬ 𝑥 𝑑𝑥
TKKD 120
Ví dụ
Ví dụ 4.3. Thời gian (𝑋) để công nhân hoàn thành một
sản phẩm là biến ngẫu nhiên liên tục (đơn vị: phút) có
hàm mật độ xác suất:
1
𝑥 nếu 𝑥 ∈ 2; 6
𝑓 𝑥 = ቐ 16
0 nếu 𝑥 ∉ 2; 6
a) Tìm tỷ lệ sản phẩm có thời gian hoàn thành từ 3 phút
đến 5 phút.
b) Tính xác suất để trong 5 sản phẩm có đúng 2 sản
phẩm có thời gian hoàn thành nhiều hơn 4 phút.

TKKD 121
4.4. CÁC THAM SỐ ĐẶC TRƯNG
▪ Kỳ vọng:
+∞
𝐸 𝑋 =න 𝑥. 𝑓 𝑥 𝑑𝑥
−∞
▪ Phương sai:
𝑉 𝑋 = 𝐸 𝑋2 − 𝐸 𝑋 2
+∞
𝐸 𝑋2 = න 𝑥 2 . 𝑓 𝑥 𝑑𝑥
−∞
▪ Độ lệch chuẩn:
𝜎𝑋 = 𝑉 𝑋

TKKD 122
Ví dụ
Tính thời gian hoàn thành sản phẩm trung bình và độ lệch
chuẩn trong ví dụ 4.3

1
𝑥 nếu 𝑥 ∈ 2; 6
𝑓 𝑥 = ቐ 16
0 nếu 𝑥 ∉ 2; 6

TKKD 123
Các tham số
Trung vị
Trung vị, ký hiệu 𝑚𝑑 , là giá trị chia phân phối xác suất của
biến ngẫu nhiên thành hai phần bằng nhau.
𝑚𝑑
න 𝑓(𝑥) 𝑑𝑥 = 0,5
−∞

TKKD 124
Các tham số
▪ Mốt
Mốt, ký hiệu 𝑚𝑜 , là giá trị mà tại đó hàm mật độ xác suất
𝑓 𝑥 đạt giá trị cực đại.

TKKD 125
Giá trị tới hạn

Giá trị tới hạn mức xác suất 𝛼 của biến ngẫu nhiên 𝑋, ký
hiệu 𝑥𝛼 , là giá trị của 𝑋 thỏa mãn:
𝑃 𝑋 > 𝑥𝛼 = 𝛼

TKKD 126
4.5. PHÂN PHỐI CHUẨN
▪ 𝐵 (𝑛; 𝑝 = 0,5) với 𝑛 = 10; 20; 100
0.25 0.25
0.2 0.2
0.15 0.15
0.1 0.1
0.05 0.05
0 0
1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

0.025 0.025
0.02 0.02
0.015 0.015
0.01 0.01
0.005 0.005
0 0
1 7 131925313743495561677379859197 0 20 40 60 80 100

▪ Khi 𝑛 → ∞, phân phối nhị thức xấp xỉ phân phối Chuẩn


TKKD 127
Định nghĩa
Biến ngẫu nhiên liên tục 𝑋 có phân phối Chuẩn (Normal
Distribution) nếu hàm mật độ xác suất của 𝑋 có dạng:
1 𝑥−𝜇 2

𝑓 𝑥 = 𝑒 2𝜎2
𝜎 2𝜋
Đồ thị của 𝑓 𝑥 có dạng
quả chuông và đối xứng
qua đường thẳng 𝑥 = 𝜇
Ký hiệu: 𝑋 ∼ 𝑁 𝜇, 𝜎 2

TKKD 128
Các tham số
𝑋 ∼ 𝑁 𝜇, 𝜎 2
▪ 𝐸 𝑋 =𝜇
▪ 𝑉 𝑋 = 𝜎2

Khi  tăng thì đồ thị của Khi 𝜎 tăng thì đồ thị của 𝑓(𝑥)
𝑓(𝑥) dịch sang phải thấp xuống và rộng ra
TKKD 129
Phân phối Chuẩn hóa
Biến ngẫu nhiên liên tục 𝑍 được gọi là có phân phối
Chuẩn hóa (Standard Normal Distribution), nếu 𝑍 có
phân phối Chuẩn với 𝜇 = 0 và 𝜎 2 = 1.
𝑍 ∼ 𝑁 0; 1
Hàm mật độ xác suất của 𝑍 có dạng:
𝑧2
1 −
𝜑 𝑧 = 𝑒 2
2𝜋
Đồ thị hàm mật độ có dạng hình
quả chuông đối xứng qua trục tung.

TKKD 130
Hàm phân phối xác suất
𝑧 𝑧
1 𝑡2
Φ 𝑧 = 𝑃 𝑍 < 𝑧 = න 𝜑 𝑡 𝑑𝑡 = න 𝑒 − 2 𝑑𝑡
2𝜋
−∞ −∞

Tính chất: Φ −𝑧 + Φ 𝑧 = 1
TKKD 131
Xác suất của biến ngẫu nhiên phân phối chuẩn hóa
Cho 𝑍 ∼ 𝑁 0; 1 , khi đó ta có:
• 𝑃 𝑍<𝑏 =Φ 𝑏
• 𝑃 𝑍 >𝑎 =1−𝑃 𝑍 <𝑎 =1−Φ 𝑎
• 𝑃 𝑍 > −𝑎 = 𝑃 𝑍 < 𝑎 = Φ 𝑎
• 𝑃 𝑎 < 𝑍 < 𝑏 = Φ 𝑏 − Φ(𝑎)
Ví dụ 4.4. Tính
• 𝑃 𝑍 > 1,96 = 1 – 𝑃(𝑍 < 1,96) = 1 – Φ(1,96)
= 1 – 0,975 = 0,025

• 𝑃 −2 ≤ 𝑍 ≤ 2 = Φ 2 − Φ(−2) = 2 ∗ Φ 2 − 1
= 2 ∗ 0,9772 − 1 = 0,9544

TKKD 132
Biến ngẫu nhiên phân phối chuẩn – chuẩn hóa

Mối liên hệ giữa 𝑋 ∼ 𝑁 𝜇; 𝜎 2 với 𝑍 ∼ 𝑁 0; 1

Cho 𝑋 ∼ 𝑁 𝜇; 𝜎 2
𝑋−𝜇
Đặt 𝑍 =
𝜎

Khi đó: 𝐸 𝑍 = 0, 𝑉 𝑍 = 1
⇒ 𝑍 ∼ 𝑁 0; 1

TKKD 133
Xác suất của biến ngẫu nhiên phân phối chuẩn
Cho 𝑋 ∼ 𝑁 𝜇; 𝜎 2 khi đó ta có các công thức sau
𝑋−𝜇 𝑏−𝜇
• 𝑃 𝑋<𝑏 =𝑃 <
𝜎 𝜎
𝑏−𝜇 𝑏−𝜇
=𝑃 𝑍< =Φ
𝜎 𝜎

𝑎−𝜇
• 𝑃 𝑋 >𝑎 =1−𝑃 𝑋 <𝑎 =1−Φ
𝜎

𝑏−𝜇 𝑎−𝜇
• 𝑃 𝑎<𝑋<𝑏 =Φ −Φ
𝜎 𝜎

TKKD 134
Ví dụ
Ví dụ 4.5. Lợi nhuận (đv: triệu đồng) của một dự án là
biến ngẫu nhiên có phân phối Chuẩn, với trung bình
bằng 500, phương sai bằng 400.
Tính xác suất để:
a) Lợi nhuận cao hơn 520.
b) Lợi nhuận thấp hơn 530.
c) Lợi nhuận từ 480 đến 540.

TKKD 135
Xác suất biến ngẫu nhiên sai lệch so với kì vọng
Cho 𝑋 ∼ 𝑁 𝜇; 𝜎 2 và 𝜀 là một số dương cho trước, khi đó
𝜀
𝑃 𝑋–  <  = 2∗Φ −1
𝜎
Ba trường hợp riêng:
• Quy tắc 1-sigma:
𝑃(|𝑋 –  | < 𝜎) = 0,6826
• Quy tắc 2-sigma:
𝑃 𝑋 –  < 2𝜎 = 0,9544
• Quy tắc 3-sigma:
𝑃 𝑋 –  < 3𝜎 = 0,9974

TKKD 136
Ví dụ
Ví dụ 4.7. Chi tiêu hàng tháng của sinh viên là biến ngẫu
nhiên có phân phối Chuẩn, chi tiêu trung bình là 5 triệu
đồng. Tỷ lệ sinh viên có mức chi tiêu hàng tháng từ 3,5
đến 6,5 triệu đồng là 95,44%. Một sinh viên có mức chi
tiêu bình thường nếu chênh lệch so với chi tiêu trung
bình không quá 750 ngàn đồng. Tìm tỷ lệ sinh viên có
mức chi tiêu bình thường.

TKKD 137
Tổ hợp của các BNN độc lập cùng có phân phối
chuẩn
Nếu 𝑋1 , 𝑋2 , … , 𝑋𝑛 độc lập và 𝑋𝑖 ∼ 𝑁 𝜇𝑖 , 𝜎𝑖2 , 𝑖 = 1,2, … , 𝑛.

Khi đó với 𝑎𝑖 là số thực bất kỳ khác 0, ta có:

𝑌 = ෍ 𝑎𝑖 𝑋𝑖 ∼ 𝑁 𝜇𝑌 , 𝜎𝑌2
𝑖=1
Trong đó: 𝑛

𝜇𝑌 = ෍ 𝑎𝑖 𝜇𝑖
𝑖=1

𝜎𝑌2 = ∑𝑛𝑖=1 𝑎𝑖2 𝜎𝑖2

TKKD 138
Ví dụ
Ví dụ 4.8. Giả sử 𝑋1 , 𝑋2 là tỷ suất lợi nhuận (%) trong
một năm của cổ phiếu 𝐴, 𝐵.
𝑋1 ∼ 𝑁 𝜇1 = 8; 𝜎12 = 9 , 𝑋2 ∼ 𝑁 𝜇2 = 12; 𝜎22 = 16
Giả sử 𝑋1 , 𝑋2 độc lập.

a) Tính xác suất để tỷ suất lợi nhuận cổ phiếu 𝐴 cao hơn


cổ phiếu 𝐵.
b) Một người đầu tư 60 triệu vào cổ phiếu 𝐴 và 80 triệu
vào cổ phiếu 𝐵. Tính xác suất để sau một năm người đó
thu được ít nhất 8,4 triệu tiền lãi.

TKKD 139
Hội tụ của phân phối 𝐵(𝑛, 𝑝) về phân phối Chuẩn
Cho 𝑋 ~ 𝐵 𝑛, 𝑝
▪ Khi 𝑛 ≥ 100 thì 𝑋 ~ 𝑁 , 𝜎2
▪ Với  = 𝑛𝑝 và 𝜎 2 = 𝑛𝑝 1 – 𝑝
Ví dụ 4.9
Xác suất để một khách hàng vào siêu thị mua sản
phẩm của hãng 𝐴 là 0,3.
Tính xác suất để trong 100 khách vào siêu thị có:
a) Nhiều hơn 35 khách mua hàng của hãng 𝐴.
b) Từ 25 đến 40 khách mua hàng của hãng 𝐴.

TKKD 140
Giá trị tới hạn chuẩn
Giá trị tới hạn Chuẩn mức 𝛼, ký kiệu là 𝑧𝛼 , được xác
định bởi:
𝑃 𝑍 > 𝑧𝛼 = 𝛼
Ví dụ. Từ ví dụ 4.4 ta có
𝑃 𝑍 > 1,96 = 0,025 (1)
Theo đn giá trị tới hạn
𝑃 𝑍 > 𝑧0,025 = 0,025 (2)
Từ 1 &(2) ⇒ 𝑧0,025 = 1,96
Tính chất:
𝑧1−𝛼 = −𝑧𝛼

TKKD 141
4.6. PHÂN PHỐI KHI BÌNH PHƯƠNG
▪ BNN liên tục 𝜒 2 có phân phối Khi bình phương với n bậc
tự do (degree of freedom: df)
▪ Ký hiệu: 𝜒 2 ~𝜒 2 (𝑛)
▪ Tham số: 𝐸(𝜒 2 ) = 𝑛; 𝑉 𝜒 2 = 2𝑛
2(𝑛)
▪ Giá trị tới hạn mức 𝛼, kí hiệu 𝜒𝛼
2 2(𝑛)
𝑃 𝜒 (𝑛) > 𝜒𝛼 =𝛼

TKKD 142
Giá trị tới hạn
▪ Bảng đầy đủ: phụ lục 7 giáo trình
▪ Bảng giản lược

α α
0.975 0.95 0.05 0.025 0.975 0.95 0.05 0.025
n n
1 0.001 0.004 3.841 5.024 20 9.591 10.85 31.41 34.17
2 0.051 0.103 5.991 7.378 24 12.40 13.85 36.42 39.36
3 0.216 0.352 7.815 9.348 30 16.79 18.49 43.77 46.98
4 0.484 0.711 9.488 11.14 39 23.65 25.70 54.57 58.12
5 0.831 1.145 11.07 12.83 50 32.36 34.76 67.50 71.42
10 3.247 3.940 18.31 20.48 99 73.36 77.05 123.2 128.4
15 6.262 7.261 25.00 27.49 120 91.57 95.70 146.6 152.2

TKKD 143
PHÂN PHỐI STUDENT
▪ BNN liên tục T có phân phối Student với 𝑛 bậc tự do, ký
hiệu: 𝑇 ~ 𝑇(𝑛)
𝑛
▪ Tham số: 𝐸(𝑇) = 0; 𝑉 𝑇 =
𝑛−2
(𝑛)
▪ Giá trị tới hạn mức , kí hiệu: 𝑡𝛼
(𝑛)
𝑃 𝑇(𝑛) > 𝑡𝛼 =𝛼
▪ Tính chất:
𝑛 (𝑛)
• 𝑡1−𝛼 = −𝑡𝛼
• Với 𝑛 > 30
(𝑛)
thì 𝑡𝛼 ≈ 𝑧𝛼

TKKD 144
Giá trị tới hạn
▪ Bảng đầy đủ: phụ lục 8 giáo trình
▪ Bảng giản lược
α α
0.1 0.05 0.025 0.1 0.05 0.025
n n
10 1.372 1.812 2.228 17 1.333 1.740 2.110
11 1.363 1.796 2.201 18 1.330 1.734 2.101
12 1.356 1.782 2.179 19 1.328 1.729 2.093
13 1.350 1.771 2.160 20 1.325 1.725 2.086
14 1.345 1.761 2.145 24 1.318 1.711 2.064
15 1.341 1.753 2.131 30 1.310 1.697 2.042
16 1.337 1.746 2.120  1.282 1.645 1.960

TKKD 145
PHÂN PHỐI FISHER
▪ BNN liên tục F có phân phối Fisher-Snedecor (gọi tắt là
Fisher) với hai bậc tự do n1 và n2 ký hiệu 𝐹 ~ 𝐹(𝑛1, 𝑛2)
(𝑛1 , 𝑛2 )
▪ Giá trị tới hạn mức 𝛼, kí hiệu: 𝑓𝛼
(𝑛1 , 𝑛2 )
𝑃 𝐹 𝑛1 , 𝑛2 > 𝑓𝛼 =𝛼
▪ Tính chất:
(𝑛 , 𝑛 ) 1
𝑓1−𝛼1 2 = (𝑛 , 𝑛 )
𝑓𝛼 2 1

TKKD 146
Giá trị tới hạn phân phối Fisher
▪ Bảng đầy đủ: phụ lục 9 giáo trình; Bảng giản lược:
n1
n2 24 39 59 99 120
α
0.025 2.27 2.15 2.08 2.03 2.01
24
0.05 1.98 1.90 1.84 1.80 1.79
0.025 2.02 1.89 1.82 1.75 1.74
39
0.05 1.80 1.70 1.6 1.60 1.58
0.025 1.94 1.81 1.73 1.66 1.65
49
0.05 1.74 1.64 1.58 1.53 1.52
0.025 1.89 1.75 1.67 1.60 1.59
59
0.05 1.70 1.65 1.54 1.49 1.47
0.025 1.79 1.65 1.56 1.49 1.46
99
0.05 1.63 1.52 1.45 1.39 1.38
TKKD 147
BÀI 5 – BIẾN NGẪU NHIÊN HAI CHIỀU
5.1. Khái niệm biến ngẫu nhiên nhiều chiều
5.2. Bảng phân phối xác suất hai chiều
5.3. Tham số đặc trưng

TKKD 148
5.1. KHÁI NIỆM BNN NHIỀU CHIỀU
Ví dụ
▪ Chiều cao nữ sinh viên VN (m): 𝑋 là biến ngẫu nhiên 1
chiều
𝑃 𝑋 = 1,5 = 0,25
▪ Điểm 10%, 40%, 50% môn LT Xác suất và TKT là biến ngẫu
nhiên 3 chiều (𝑋, 𝑌, 𝑍)
𝑃 𝑋 = 9, 𝑌 = 9, 𝑍 = 9 = 0,01
𝑃 𝑋 = 9 = 0,3
Hệ 𝑛 biến ngẫu nhiên 1 chiều được xét một cách đồng
thời tạo nên biến ngẫu nhiên 𝑛 chiều.
Kí hiệu: (𝑋1, 𝑋2, … , 𝑋𝑛)

TKKD 149
Biến ngẫu nhiên hai chiều
▪ Định nghĩa
Hệ hai biến ngẫu nhiên 1 chiều được xét một cách đồng
thời tạo nên biến ngẫu nhiên 2 chiều.
Kí hiệu: (𝑋, 𝑌)
Ví dụ: + Thu nhập và tiêu dùng của 1 người.
+ Số đo hình chữ nhât: chiều dài và chiều rộng của
1 sản phẩm.
▪ Phân loại
+ Biến ngẫu nhiên 2 chiều rời rạc: nếu 𝑋, 𝑌 đều rời rạc
+ Biến ngẫu nhiên 2 chiều liên tục: nếu 𝑋, 𝑌 đều liên tục
TKKD 150
5.2. BẢNG PHÂN PHỐI XÁC SUẤT
Y
y1 y2 … ym
X
x1 p11 p12 … p1m
x2 p21 p22 … p2m
… … … … …
xn pn1 pn2 … pnm
1

𝑝11 = 𝑃 𝑋 = 𝑥1 , 𝑌 = 𝑦1 , … , 𝑝𝑖𝑗 = 𝑃 𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗

TKKD 151
Bảng phân phối xác suất đồng thời

Y
y1 y2 … ym PX
X
x1 p11 p12 … p1m P(x1)
x2 p21 p22 … p2m P(x2)
… … … … … …
xn pn1 pn2 … pnm P(xn)
PY P(y1) P(y2) … P(ym) 1

TKKD 152
Bảng phân phối xác suất biên
▪ Bảng phân phối xác suất biên thành phần 𝑋

𝑋 𝑥1 … 𝑥𝑖 … 𝑥𝑛
𝑃 𝑃(𝑥1) … 𝑃(𝑥𝑖 ) … 𝑃(𝑥𝑛)
▪ Bảng phân phối xác suất biên thành phần 𝑌

𝑌 𝑦1 … 𝑦𝑗 … 𝑦𝑚
𝑃 𝑃(𝑦1) … 𝑃(𝑦𝑗) … 𝑃(𝑦𝑚)

TKKD 153
Bảng phân phối xác suất có điều kiện
▪ Bảng phân phối của (𝑋 | 𝑌 = 𝑦𝑗):
P ( xi , y j )
P ( xi | y j ) =
P( y j )
(𝑋 | 𝑌 = 𝑦𝑗) 𝑥1 𝑥2 … 𝑥𝑛
𝑃 𝑃(𝑥1 | 𝑦𝑗 ) 𝑃(𝑥2| 𝑦𝑗) … 𝑃(𝑥𝑛 | 𝑦𝑗)
▪ Bảng phân phối của (𝑌 | 𝑋 = 𝑥𝑖 )

(𝑌 | 𝑋 = 𝑥𝑖 ) 𝑦1 𝑦2 … 𝑦𝑚
𝑃 𝑃(𝑦1 | 𝑥𝑖 ) 𝑃(𝑦2| 𝑥𝑖 ) … 𝑃(𝑦𝑚 | 𝑥𝑖 )

TKKD 154
Ví dụ
Ví dụ 5.1. Cho các biến ngẫu nhiên:
𝑋: Doanh thu (triệu), 𝑌: Chi quảng cáo (triệu)

𝑌 3 6 9
𝑋
100 0,1 0,02 0,01
200 0,16 0,12 0,08
300 0,2 0,17 ?
a) 𝑃 𝑋 = 200, 𝑌 = 6 = ⋯ ; ? = 𝑃 𝑋 = 300, 𝑌 = 9 = ⋯
b) 𝑃 𝑋 = 300 𝑌 = 9) = ⋯

TKKD 155
Ví dụ (tiếp)
Ví dụ 5.1. Cho các biến ngẫu nhiên:
𝑋: Doanh thu (triệu), 𝑌: Chi quảng cáo (triệu)

𝑌 3 6 9
𝑋
100 0,1 0,02 0,01
200 0,16 0,12 0,08
300 0,2 0,17 0,14

c) Lập bảng phân phối xác suất của doanh thu


d) Tính xác suất để doanh thu trên 100 triệu
TKKD 156
5.3. THAM SỐ ĐẶC TRƯNG
▪ 5.3.1. Kì vọng
n n m
E ( X ) =  xi P ( xi ) =  xi P ( xi , y j )
i =1 i =1 j =1
m m n
E (Y ) =  y j P ( y j ) =  y j P ( xi , y j )
j =1 j =1 i =1

▪ 5.3.2. Phương sai


n m
V ( X ) =  xi2 P( xi , y j ) − [E ( X )]2
i =1 j =1
m n
V (Y ) =  y 2j P ( xi , y j ) − [E (Y )]2
j =1 i =1
TKKD 157
Ví dụ (tiếp)
Ví dụ 5.1. Cho các biến ngẫu nhiên:
𝑋: Doanh thu (triệu), 𝑌: Chi cho quảng cáo (triệu)

𝑌 3 6 9
𝑋
100 0,1 0,02 0,01
200 0,16 0,12 0,08
300 0,2 0,17 0,14

e) Tính doanh thu trung bình độ lệch chuẩn của doanh thu
f) Tính độ lệch chuẩn của chi cho quảng cáo
TKKD 158
Kì vọng có điều kiện và tính độc lập BNN
▪ Từ bảng phân phối có điều kiện, ta có

E (Y / X = xi ) =  y j P( y j / xi )
j

E ( X / Y = y j ) =  xi P( xi / y j )
i

▪ Tính độc lập: 𝑋, 𝑌 độc lập nếu


𝑃(𝑌 = 𝑦𝑗 |𝑋 = 𝑥𝑖 ) = 𝑃 𝑌 = 𝑦𝑗 ∀𝑖, 𝑗

𝑃(𝑋 = 𝑥𝑖 , 𝑌 = 𝑦𝑗 ) = 𝑃(𝑋 = 𝑥𝑖 ). 𝑃(𝑌 = 𝑦𝑗 ) ∀𝑖, 𝑗

TKKD 159
Ví dụ (tiếp)
𝑌 3 6 9
𝑋
100 0,1 0,02 0,01
200 0,16 0,12 0,08
300 0,2 0,17 0,14
g) Tính xác suất doanh thu là 200 triệu biết quảng cáo hết 9 triệu.
h) Lập bảng phân phối xác suất của doanh thu biết chi cho quảng cáo
hết 9 triệu.
i) Tính trung bình doanh thu biết quảng cáo hết 9 triệu.
j) Doanh thu và chi cho quảng cáo có độc lập nhau không?

TKKD 160
Hiệp phương sai và hệ số tương quan
▪ Hiệp phương sai (covariance): 𝐶𝑜𝑣(𝑋, 𝑌)
𝐶𝑜𝑣(𝑋, 𝑌) = 𝐸(𝑋 ∗ 𝑌) – 𝐸(𝑋) ∗ 𝐸(𝑌)
Cov ( X ,Y ) = E ( X − E ( X ) Y − E (Y ) )
n m
=  xi y j P ( xi , y j ) − E ( X ).E (Y )
i =1 j =1

▪ Hệ số tương quan (correlation) của 𝑋 và 𝑌: X,Y


Cov ( X ,Y )
ρX ,Y =
σ X . σY

TKKD 161
Ví dụ (tiếp)
𝑌 3 6 9
𝑋
100 0,1 0,02 0,01
200 0,16 0,12 0,08
300 0,2 0,17 0,14

k) Tính hiệp phương sai giữa Doanh thu và Chi cho quảng
cáo.
l) Tính hệ số tương quan của Doanh thu và Chi cho quảng
cáo. Hệ số này cho biết mối quan hệ như thế nào giữa
Doanh thu và Chi cho quảng cáo.

TKKD 162
Hiệp phương sai
▪ Tính chất của hiệp phương sai
• 𝐶𝑜𝑣 𝑋, 𝑌 = 𝐶𝑜𝑣 𝑌, 𝑋 ; 𝐶𝑜𝑣 𝑋, 𝑋 = 𝑉(𝑋)
• 𝑋, 𝑌 độc lập  𝐶𝑜𝑣(𝑋, 𝑌) = 0
• 𝐶𝑜𝑣(𝑋, 𝑌) > 0 thì 𝑋, 𝑌 có “tương quan dương”
• 𝐶𝑜𝑣(𝑋, 𝑌) < 0 thì 𝑋, 𝑌 có “tương quan âm”

▪ Phương sai của tổ hợp hai biến ngẫu nhiên 𝑋 và 𝑌

𝑉(𝑎𝑋  𝑏𝑌) = 𝑎2 𝑉(𝑋) + 𝑏2 𝑉(𝑌)  2𝑎𝑏𝐶𝑜𝑣(𝑋, 𝑌)

TKKD 163
Hệ số tương quan
Tính chất của hệ số tương quan
▪ X,Y = Y,X
▪ –1  X,Y  1; X,X = 1
▪ X,Y > 0: tương quan cùng chiều, X,Y < 0: ngược chiều
▪ X,Y = 0: không tương quan
▪ 𝑋, 𝑌 độc lập  X,Y = 0
▪ X,Y =  1: 𝑋, 𝑌 có quan hệ hàm số bậc 1 với nhau

TKKD 164
BÀI 6. CÁC ĐỊNH LÝ GIỚI HẠN
▪ Tập trung Định lý giới hạn trung tâm
▪ Bất đẳng thức Trebusep (Chebyshev)
▪ Định lý Trebusep
▪ Định lý Bernoulli
▪ Định lý giới hạn trung tâm

TKKD 165
Định lý giới hạn trung tâm
▪ Xét X1, X2,…, Xn là các BNN độc lập có cùng quy luật
phân phối xác suất, kỳ vọng và phương sai hữu hạn
n
Y − E (Y )
▪ Đặt Y =  X i và U =
i =1 V (Y )
▪ Thì U sẽ hội tụ về quy luật N(0, 1) khi n → 
▪ Trong ứng dụng, n ≥ 30 được coi là đủ lớn để áp dụng
quy luật Chuẩn (dù biến ngẫu nhiên gốc không phân
phối chuẩn)

TKKD 166
BÀI 7 – MẪU NGẪU NHIÊN
7.1. Các khái niệm
7.2. Trung bình mẫu
7.3. Phương sai mẫu
7.4. Tần suất mẫu

[2] Chapter 7, pp.298 – 306, 310 – 328, 337 – 339

TKKD 167
7.1. CÁC KHÁI NIỆM
▪ Tổng thể
▪ Tham số đặc trưng của tổng thể
▪ Mẫu ngẫu nhiên
▪ Mẫu cụ thể
▪ Thống kê (hay thống kê đặc trưng mẫu)

TKKD 168
Tổng thể
▪ Tập hợp toàn bộ các phần tử đồng nhất theo một dấu
hiệu nghiên cứu định tính hay định lượng nào đó được
gọi là tổng thể (population)
▪ Kích thước tổng thể (population size): là số phần tử của
tổng thể, ký hiệu là 𝑵
▪ Dấu hiệu lượng hóa được: 𝑿- Biến ngẫu nhiên gốc
▪ 𝑋 = {𝑥1, 𝑥2, … , 𝑥𝑁 }
▪ Các tham số đặc trưng của 𝑋 là tham số đặc trưng của
tổng thể

TKKD 169
Mô tả tổng thể
▪ Nếu 𝑋 chỉ gồm k giá trị khác nhau: 𝑥1, 𝑥2, … , 𝑥𝑘
▪ Số lượng tương ứng là 𝑁1, 𝑁2, … , 𝑁𝑘
▪ 𝑁𝑖 gọi là tần số tổng thể của 𝑥𝑖
▪ Đặt 𝑝𝑖 = 𝑁𝑖 / 𝑁 gọi là tần suất tổng thể


0  N i  N
Giá trị 𝑥1 𝑥2 … 𝑥𝑘  k
Tần số 𝑁1 𝑁2 … 𝑁𝑘  i =1 Ni = N


0  p i  1
Tần suất 𝑝1 𝑝2 … 𝑝𝑘
 k
 i =1 pi = 1

TKKD 170
Tham số đặc trưng của tổng thể
▪ Trung bình tổng thể (population mean): m
1 N
m =  xi
N i =1
• Chứng minh được: 𝑚 = 𝐸(𝑋)
▪ Phương sai tổng thể (population variance): σ2

1 N
σ =  ( xi − m)2
2
N i =1
• Chứng minh được: 𝜎2 = 𝑉(𝑋)

TKKD 171
Tham số đặc trưng của tổng thể
▪ Độ lệch chuẩn tổng thể: σ

σ= σ 2

▪ Tần suất tổng thể (population proportion): p


• Số phần tử chứa dấu hiệu (hay biến cố) A là MA
MA
p=
N

• Dễ thấy: 𝑝 = 𝑃(𝐴)

TKKD 172
Nhận xét
▪ Nghiên cứu Tổng thể → nghiên cứu về tham số đặc
trưng tổng thể → nghiên cứu toàn bộ các phần tử →
gặp nhiều khó khăn:
• Chi phí lớn, có thể không khả thi
• Sai sót khi thu thập, có thể phá hủy tập hợp
▪ Do đó nghiên cứu một số phần tử đại diện → Mẫu
• Từ tổng thể rút ra 𝒏 phần tử (mẫu kích thước 𝒏)
• Xác định các thống kê đặc trưng mẫu
• Rút ra kết luận liên quan đến tổng thể

TKKD 173
Mẫu ngẫu nhiên
▪ Mẫu ngẫu nhiên kích thước 𝑛 là tập hợp của 𝑛 biến
ngẫu nhiên độc lập 𝑋1, 𝑋2, … , 𝑋𝑛 được thành lập từ
biến ngẫu nhiên gốc 𝑋 và có cùng phân phối xác suất
với 𝑋.
▪ Ký hiệu: 𝑊 = (𝑋1, 𝑋2, … , 𝑋𝑛)
▪ 𝐸(𝑋𝑖 ) = 𝐸(𝑋) = 𝑚
▪ 𝑉(𝑋𝑖 ) = 𝑉(𝑋) = 𝜎2 𝑖 = 1, 2, … , 𝑛

TKKD 174
Mẫu cụ thể
▪ Gồm 𝑛 quan sát (𝑛 con số): 𝑤 = (𝑥1, 𝑥2, … , 𝑥𝑛)
▪ Nếu chỉ gồm 𝑘 giá trị khác nhau: 𝑥1, 𝑥2, … , 𝑥𝑘 với số lần
xuất hiện tương ứng : 𝑛1, 𝑛2, … , 𝑛𝑘
▪ 𝑛𝑖 là tần số mẫu của 𝑥𝑖 (frequency)
▪ Đặt 𝑝Ƹ i = 𝑛𝑖 / 𝑛 là tần suất mẫu (sample proportion)

Giá trị …
 i =1 ni = n
𝑥1 𝑥2 𝑥𝑘 k

Tần số 𝑛1 𝑛2 … 𝑛𝑘
𝑘
Tần suất 𝑝Ƹ 1 𝑝Ƹ 2 … 𝑝Ƹ k ෍ 𝑝Ƹ 𝑖 = 1
𝑖=1

TKKD 175
Ví dụ
▪ Nghiên cứu về khối lượng sản phẩm (𝑋)
▪ Mẫu ngẫu nhiên kích thước 𝑛 = 10
▪ 𝑊 = (𝑋1, 𝑋2, … , 𝑋10)
• 𝐸(𝑋1) = 𝐸(𝑋2) = ⋯ = 𝐸(𝑋10) = 𝐸(𝑋)
• 𝑉(𝑋1) = 𝑉(𝑋2) = ⋯ = 𝑉(𝑋10) = 𝑉(𝑋)
▪ Mẫu cụ thể 𝑤 = ( 20,21,20,23,23,24,22,24,22,22)
Khối lượng (g) 20 21 22 23 24
Số sản phẩm 2 1 3 2 2

TKKD 176
Thống kê mẫu
▪ Một hàm của các biến ngẫu nhiên 𝑋𝑖 trong mẫu là một
thống kê (statistic)
𝐺 = 𝑓(𝑋1, 𝑋2, … , 𝑋𝑛)
▪ Vì mẫu ngẫu nhiên nên 𝐺 là ngẫu nhiên với qui luật
phân phối xác suất xác định
▪ Mẫu cụ thể → thống kê là số cụ thể, giá trị quan sát
𝐺𝑞𝑠 = 𝑔 = 𝑓(𝑥1, 𝑥2, … , 𝑥𝑛)
▪ Thống kê trong mẫu thường tương ứng với một tham
số trong tổng thể

TKKD 177
7.2. TRUNG BÌNH MẪU
▪ Trung bình mẫu ngẫu nhiên (sample mean)
1 n
X =  Xi
n i =1
▪ 𝑋ത là biến ngẫu nhiên:
σ2 σ
E (X ) = m; V (X ) = ; σX =
n n
𝜎2
▪ Nếu 𝑋 ~ 𝑁(𝜇, 𝜎2) thì: ത
𝑋~𝑁 𝜇;
𝑛
(𝑋ሜ − 𝜇) 𝑛
𝑍= ~𝑁(0,1)
𝜎
TKKD 178
Ví dụ
Ví dụ 7.1. Chiều dài của một loại sản phẩm là một biến
ngẫu nhiên phân phối chuẩn với trung bình là 100cm và
phương sai là 16cm2.
Kiểm tra ngẫu nhiên 25 sản phẩm.
a) Tính xác suất để chiều dài trung bình của 25 sản phẩm
này lớn hơn 101cm.
b) Với xác suất là 0,95 thì chiều dài trung bình của 25 sản
phẩm trên tối đa là bao nhiêu ?

TKKD 179
7.3. PHƯƠNG SAI MẪU
▪ Độ lệch bình phương trung bình (mean of squares)
𝑛
1
ሜ 2
𝑀𝑆 = ෍(𝑋𝑖 − 𝑋)
𝑛
𝑖=1
▪ Phương sai mẫu (sample variance): S2
𝑛
1 n
𝑆2 = ሜ 2
෍(𝑋𝑖 − 𝑋) Hay S =
2
MS
𝑛−1
𝑖=1
n−1
▪ Độ lệch chuẩn mẫu: 𝑺 = 𝑺𝟐

n−1 2
▪ Ta có : 𝐸(𝑆2) = 2 và E ( MS ) = σ
n
TKKD 180
Phương sai mẫu
▪ Với mẫu cụ thể:
1 n
• Trung bình mẫu x =  xi
n i =1

• Phương sai s2 1 n
s =
2

n − 1 i =1
( x i − x ) 2

• Độ lệch chuẩn mẫu cụ thể: : 𝑠 = 𝑠 2

TKKD 181
Phương sai mẫu
Nếu mẫu phân thành 𝑘 nhóm
1 k
x =  ni x i
n i =1

1 k
s =
2

n − 1 i =1
ni ( xi − x ) 2

Hoặc: s =
2 n
n−1
(
x 2 − ( x )2 )

TKKD 182
7.4. TẦN SUẤT MẪU

▪ Trong mẫu kích thước 𝑛 có 𝑋𝐴 phần tử có dấu hiệu


(biến cố) 𝐴
▪ Tần suất mẫu: 𝑋𝐴
𝑝Ƹ =
𝑛
▪ Nếu 𝑃(𝐴) = 𝑝 thì:

𝑝(1 − 𝑝)
𝐸 𝑝Ƹ = 𝑝 𝑉(𝑝)Ƹ =
𝑛

TKKD 183
7.4. TẦN SUẤT MẪU
Nếu 𝑋𝐴 ~ 𝐵(𝑛, 𝑝) và với mẫu kích thước 𝑛 ≥ 100 thì ta

𝑋𝐴 ~𝑁 𝜇 = 𝑛𝑝; 𝜎 2 = 𝑛𝑝 1 − 𝑝

𝑝(1 − 𝑝)
𝑝Ƹ ~𝑁 𝜇𝑝ො = 𝑝; 𝜎𝑝2ො =
𝑛

(𝑝ො − 𝑝) 𝑛
𝑍 = ~𝑁(0,1)
𝑝(1 − 𝑝)

TKKD 184
Ví dụ
Ví dụ 7.2. Tỉ lệ phế phẩm của nhà máy 𝐴 là 10%. Lấy
ngẫu nhiên 100 sản phẩm của nhà máy này.
a) Tính xác suất để trong số sản phẩm lấy ra có ít nhất là
13% phế phẩm.
b) Với xác suất là 0,95 thì trong mẫu trên có tối đa là bao
nhiêu phế phẩm?

TKKD 185
BÀI 8 - ƯỚC LƯỢNG THAM SỐ
8.1. Ước lượng tham số tổng thể
8.2. Ước lượng điểm
8.3. Ước lượng bằng khoảng tin cậy

▪ [2] Chapter 7, pp. 306 – 309, 328 – 330


▪ [3] Chapter 8, pp. 342 – 365

TKKD 186
8.1. ƯỚC LƯỢNG THAM SỐ TỔNG THỂ
▪ Xét tổng thể, giả sử 𝑋 đã biết phân phối xác suất
nhưng tham số  (tham số tổng thể ) là chưa biết.
▪ Sử dụng thông tin từ mẫu → ước lượng tham số 
(parameter estimate) → ước lượng tham số tổng thể
▪ Mẫu ngẫu nhiên: xây dựng ước lượng ngẫu nhiên
(estimator)
▪ Mẫu cụ thể: tính được ước lượng cụ thể (estimate),
hay giá trị quan sát (observed value)

TKKD 187
8.2. ƯỚC LƯỢNG ĐIỂM
▪ Khái niệm
▪ Tính chất của ước lượng điểm

TKKD 188
Khái niệm
▪ Tham số tổng thể  là chưa biết → cần ước lượng
▪ Sử dụng mẫu 𝑊 = (𝑋1, 𝑋2, … , 𝑋𝑛 ) → xác định thống
kê 𝜃መ trên mẫu
▪ Dùng một giá trị của thống kê 𝜃መ để thay thế cho tham
số  → 𝜃መ là ước lượng điểm của 

TKKD 189
Tính chất của ước lượng điểm
▪ Tính không chệch (unbiased)
• 𝜃መ là ước lượng không chệch của   𝐸(𝜃) መ =
• Nếu 𝐸(𝜃) መ   : ước lượng chệch
▪ Tính hiệu quả (efficient)
• 𝜃መ1 , 𝜃መ2 là ước lượng không chệch
• 𝑉(𝜃መ1 ) < 𝑉(𝜃መ2 ) thì 𝜃መ1 là ước lượng hiệu quả hơn 𝜃መ2
• Nếu 𝑉(𝜃መ1 ) là nhỏ nhất thì 𝜃መ1 là ước lượng hiệu quả
▪ Ước lượng không chệch, hiệu quả → ước lượng tốt nhất
▪ Tính vững (consistent): khi 𝑛 tiến đến 𝑁 thì ước lượng
hội tụ đến tham số (theo nghĩa xác suất)

TKKD 190
Ví dụ
Ví dụ 8.1.
Cho tổng thể 𝑋 có trung bình là 𝑚, phương sai là 2
Với mẫu kích thước 𝑛 = 3, trong các thống kê sau, đâu
là ước lượng không chệch, hiệu quả cho 𝑚:
1 1 1 1 1 1
G1 = X 1 + X 2 + X 3 ; G2 = X 1 + X 2 + X 3
2 2 2 2 3 6
1 1 1 1 1 1
G3 = X 1 + X 2 + X 3 ; G4 = X 1 + X 2 + X 3
2 4 4 3 3 3

TKKD 191
Một số kết luận
▪ Nếu biến ngẫu nhiên gốc 𝑋~𝑁(𝜇, 𝜎2) thì
• 𝑋ത là ước lượng không chệch, hiệu quả cho 
• 𝑆2 là ước lượng không chệch cho σ2
• 𝑀𝑆 là ước lượng chệch cho σ2
▪ Khi 𝑋 ~ 𝐴(𝑝) thì 𝑝Ƹ là ước lượng không chệch, hiệu
quả cho 𝑝.
▪ Cách thay thế tham số tổng thể (, p, σ2) bởi các thống
ത 𝑝,Ƹ S2) tương ứng như trên là tìm ước
kê mẫu (𝑋,
lượng điểm theo hàm ước lượng.

TKKD 192
8.3. ƯỚC LƯỢNG BẰNG KHOẢNG TIN CẬY
▪ Các khái niệm
▪ Ước lượng trung bình tổng thể
▪ Ước lượng phương sai tổng thể
▪ Ước lượng tần suất (hay tỉ lệ) tổng thể

TKKD 193
Các khái niệm
▪ Với mẫu ngẫu nhiên, tìm khoảng ngẫu nhiên (𝐺1, 𝐺2) để
khoảng đó chứa tham số  bằng một mức xác suất cho
trước:
𝑃(𝐺1 <  < 𝐺2) = 1 – 
▪ Mức xác suất (1 – ) là độ tin cậy (confidence level)
▪ (𝐺1, 𝐺2) là khoảng tin cậy (confidence interval)
▪ 𝐼 = 𝐺2 – 𝐺1 là độ dài khoảng tin cậy
𝐼
▪ 𝜀= là sai số của ước lượng.
2

TKKD 194
Xây dựng khoảng tin cậy
▪ Xét thống kê 𝐺 liên kết giữa tham số và thống kê trong
mẫu, 𝐺 có phân phối xác suất xác định.
▪ Với 1 − 𝛼 cho trước ta xác định 𝛼1 và 𝛼2 : 𝛼1 + 𝛼2 = 𝛼
▪ Xác định giá trị tới hạn 𝑔1−𝛼1 và 𝑔𝛼2 sao cho:
𝑃 𝑔1−𝛼1 < 𝐺 < 𝑔𝛼2 = 1 − 𝛼
▪ Biến đổi sẽ thu được khoảng 𝐺1 , 𝐺2 thỏa mãn:
𝑃(𝐺1 <  < 𝐺2) = 1 – 

TKKD 195
Ước lượng trung bình tổng thể
▪ 𝑋~𝑁(𝜇, 𝜎2) với  chưa biết
▪ Ước lượng khoảng cho  với độ tin cậy (1 − 𝛼)
▪ Ước lượng  cũng là ước lượng trung bình tổng thể
với BNN gốc có phân phối chuẩn.
▪ Mẫu 𝑊 = (𝑋1, 𝑋2, … , 𝑋𝑛)
▪ Chia hai trường hợp:
• Khi 𝜎 là đã biết → dùng thống kê 𝑍
• Khi 𝜎 là chưa biết → Sử dụng 𝑆 để thay cho 𝜎, và
dùng thống kê
( X − μ) n
T= ~ T (n − 1)
S
TKKD 196
Ước lượng  khi chưa biết σ2
▪ Dùng thống kê:
( X − μ) n
T= ~ T (n − 1)
S
▪ Với 𝛼1 + 𝛼2 = 𝛼
(𝑛−1) (𝑛−1)
𝑃 𝑡1−𝛼1 < 𝑇 < 𝑡𝛼2 =1−α

(𝑛−1) ത
(𝑋−𝜇) 𝑛 (𝑛−1)
Hay 𝑃 𝑡1−𝛼 < < 𝑡𝛼 =1−𝛼
1 𝑆 2

▪ Do phân phối T (hay phân phối Student) là phân phối


đối xứng nên ta có
(𝑛−1) (𝑛−1)
𝑡1−𝛼 = −𝑡𝛼1
1
TKKD 197
Ước lượng  khi chưa biết σ2
(𝑛−1) (𝑛−1) 𝑆
▪ Thay 𝑡1−𝛼 = −𝑡𝛼1 và nhân 3 vế với ta có
1 𝑛
(𝑛−1) 𝑆 (𝑛−1) 𝑆
𝑃 −𝑡𝛼 < 𝑋ത − 𝜇 < 𝑡𝛼 =1−𝛼
1 𝑛 2 𝑛
▪ Chuyển 𝑋ത sang 2 vế ta có
(𝑛−1) 𝑆 (𝑛−1) 𝑆

𝑃 −𝑋 − 𝑡𝛼 ത
< −𝜇 < −𝑋 + 𝑡𝛼 =1−𝛼
1 𝑛 2 𝑛

▪ Nhân 3 vế với -1 ta có
(𝑛−1) 𝑆 (𝑛−1) 𝑆

𝑃 𝑋 − 𝑡𝛼2 ത
< 𝜇 < 𝑋 + 𝑡𝛼1 =1−𝛼
𝑛 𝑛

TKKD 198
Ước lượng  khi không biết σ2

▪ Khoảng tin cậy tối đa


(𝑛−1) 𝑆
𝜇 < 𝑋ത + 𝑡𝛼
𝑛

▪ Khoảng tin cậy tối thiểu


S
X − t α(n−1) μ
n
▪ Khoảng tin cậy hai phía (đối xứng)
S ( n−1) S
X − t α(n/2−1)  μ  X + t α /2
n n
TKKD 199
Ước lượng  khi không biết σ2
▪ Khoảng tin cậy đối xứng: 𝑋ത ± 𝜀 hay : 𝑋ത ± 𝑀𝐸
(𝑛−1)
▪ Với 𝜀 = 𝑀𝐸 = 𝑡𝛼/2 𝑆/ 𝑛
(𝑛−1)
▪ Độ dài khoảng tin cậy: I = 2𝜀 = 2𝑡𝛼/2 𝑆/ 𝑛
▪ Xác định kích thước mẫu 𝑛0 (đáp ứng yêu cầu về sai số
hoặc độ dài khoảng tin cậy) dựa vào mẫu sơ bộ 𝑛
quan sát cho trước 2 ( n−1) 2
S (t α / 2 )
ε  ε0  n0 
ε02
4S 2 (t α(n/−21) )2
I  I0  n0 
I02
TKKD 200
Ví dụ
Ví dụ 8.3. Cân ngẫu nhiên 25 sản phẩm thu được khối
lượng trung bình là 25,32g và phương sai là 5,28g2. Giả
sử khối lượng phân phối chuẩn. Với độ tin cậy 95%
a) Ước lượng khối lượng trung bình của tất cả các sản
phẩm bằng khoảng tin cậy tối đa.
b) Tìm khoảng tin cậy đối xứng cho khối lượng trung bình.
c) Muốn sai số trong câu (b) còn không quá 0,5g thì cần
cân thử thêm ít nhất bao nhiêu sản phẩm?

TKKD 201
Ước lượng phương sai tổng thể
▪ 𝑋 ~ 𝑁(𝜇, 𝜎2), với tham số σ2 là chưa biết
▪ Ước lượng khoảng cho σ2 với độ tin cậy (1 − 𝛼)
▪ Ước lượng σ2 cũng là ước lượng phương sai tổng thể,
độ phân tán trong qui luật chuẩn.
▪ Sử dụng thống kê Khi bình phương
(n − 1 ) S 2
χ2 = 2
~ χ 2
(n − 1)
σ
▪ Với 𝛼1 + 𝛼2 = 𝛼
 2(n−1) (n − 1) S 2 2( n−1) 
P  χ1−α1  2
 χ α2  =1−α
 σ 
TKKD 202
Ước lượng phương sai tổng thể
Nghịch đảo 3 vế ta có

1 𝜎2 1
𝑃 2 (𝑛−1)
< 2
< 2 (𝑛−1) =1−𝛼
𝜒𝛼2 (𝑛 − 1)𝑆 𝜒1−𝛼1

Nhân 3 vế với (𝑛 − 1)𝑆 2 ta có

(𝑛 − 1)𝑆 2 (𝑛 − 1)𝑆 2
𝑃 2 (𝑛−1)
< 𝜎2 < 2 (𝑛−1)
=1−𝛼
𝜒𝛼2 𝜒1−𝛼1

TKKD 203
Ước lượng tham số σ2
▪ Khoảng tin cậy tối đa
(n − 1 ) S 2
σ2  2( n−1)
χ1−α
▪ Khoảng tin cậy tối thiểu
(n − 1)S 2
 σ 2
χ α2(n−1)
▪ Khoảng tin cậy hai phía
(n − 1)S 2 (n − 1 ) S 2

2( n−1)
 σ 2

χ α /2 χ12−(nα−/21)
TKKD 204
Ví dụ
Ví dụ 8.4. Cân ngẫu nhiên 25 sản phẩm thu được khối
lượng trung bình là 25,32g và phương sai là 5,28g2. Giả
sử khối lượng của sản phẩm phân phối chuẩn. Với độ tin
cậy 95%
a) Độ dao động (hay độ biến động) của khối lượng đo bởi
phương sai tối đa là bao nhiêu?
b) Tìm khoảng tin cậy cho độ lệch chuẩn của khối lượng
sản phẩm.

TKKD 205
Ước lượng tần suất tổng thể
▪ 𝑋 ~ 𝐴(𝑝) với p chưa biết
▪ Ước lượng khoảng cho 𝑝 với độ tin cậy (1 − 𝛼)
▪ Ước lượng 𝒑 cũng là ước lượng tần suất tổng thể.
▪ Sử dụng thống kê (𝑝Ƹ − 𝑝) 𝑛
𝑍= ~𝑁(0,1)
𝑝(1 − 𝑝)
▪ Với 𝛼1 + 𝛼2 = 𝛼
(𝑝ො − 𝑝) 𝑛
𝑃 𝑧1−𝛼1 < < 𝑧𝛼2 = 1−𝛼
𝑝(1 − 𝑝)
▪ Với 𝑛 đủ lớn, chẳng hạn 𝑛 ≥ 100 ta có

TKKD 206
Ước lượng tham số 𝑝

▪ Khoảng tin cậy tối đa


𝑝(1
Ƹ − 𝑝)Ƹ
𝑝 < 𝑝Ƹ + 𝑧𝛼
𝑛
▪ Khoảng tin cậy tối thiểu
𝑝(1
Ƹ − 𝑝)Ƹ
𝑝Ƹ − 𝑧𝛼 <𝑝
𝑛
▪ Khoảng tin cậy hai phía (đối xứng)

𝑝(1
Ƹ − 𝑝)Ƹ 𝑝(1
Ƹ − 𝑝)Ƹ
𝑝Ƹ − 𝑧𝛼/2 < 𝑝 < 𝑝Ƹ + 𝑧𝛼/2
𝑛 𝑛

TKKD 207
Ước lượng tham số p
▪ Khoảng tin cậy đối xứng: 𝑝Ƹ  ME hay 𝑝Ƹ  
𝑀𝐸 = 𝜀 = 𝑧𝛼/2 𝑝(1 Ƹ − 𝑝)/ Ƹ 𝑛
▪ Độ dài khoảng tin cậy:
𝐼 = 2𝑀𝐸 = 2𝜀 = 2𝑧𝛼/2 𝑝(1
Ƹ − 𝑝)/
Ƹ 𝑛
▪ Xác định kích thước mẫu n0 thỏa mãn yêu cầu về sai
số hoặc độ dài KTC:
2
𝑝(1
Ƹ − 𝑝)𝑧
Ƹ 𝛼/2
𝜀 ≤ 𝜀0 ⇔ 𝑛0 ≥
𝜀02
2
4𝑝(1
Ƹ − 𝑝)𝑧Ƹ 𝛼/2
𝐼 ≤ 𝐼0 ⇔ 𝑛0 ≥
𝐼02
TKKD 208
Ví dụ
Ví dụ 8.5. Đợt giảm giá đặc biệt của 1 siêu thị người ta
quan sát ngẫu nhiên 400 người vào siêu thị đó thì thấy có
360 người mua hàng. Với độ tin cậy 95%
(a) Ước lượng tỉ lệ khách mua hàng bằng khoảng tin cậy
đối xứng
(b) Muốn độ dài khoảng tin cậy trong câu (a) giảm xuống
còn một nửa thì cần quan sát tối thiểu bao nhiêu người?
(c) Nếu trong một ngày có 5000 người vào cửa hàng thì
có tối đa bao nhiêu người mua hàng?

TKKD 209
BÀI 9 - KIỂM ĐỊNH GIẢ THUYẾT

▪ 9.1. Khái niệm


▪ 9.2. Kiểm định tham số một tổng thể
▪ 9.3. Kiểm định tham số hai tổng thể
▪ 9.4. Kiểm định phi tham số

TKKD 210
9.1. KHÁI NIỆM
▪ Cặp giả thuyết, tiêu chuẩn kiểm định
▪ Các loại sai lầm
▪ Mức ý nghĩa và miền bác bỏ

▪ [2] Chapter 9, pp.346-352, 354-355


▪ [3] Chapter 9, pp.382-389; 392-394

TKKD 211
Cặp giả thuyết, tiêu chuẩn kiểm định
▪ Giả thuyết thống kê: Mệnh đề về một vấn đề thống kê
nào đó của tổng thể.
▪ Kiểm định tham số: Kết luận về tính đúng / sai của một
giả thuyết thống kê đối với tham số tổng thể dựa vào
các bằng chứng thực nghiệm.
▪ Ví dụ:
➢ Thu nhập trung bình của người lao động là trên
2000 USD/năm
➢ Tỷ lệ khách quay lại mua hàng lần hai là 50%
➢ Độ dao động của giá vàng trên thị trường tư nhân
trong năm qua là chưa đến 30 USD

TKKD 212
Cặp giả thuyết, tiêu chuẩn kiểm định
▪ Bài toán kiểm định giả thuyết thống kê so sánh giá trị
tham số  (của tổng thể) và giá trị thực 0 cho trước:
H0 : θ = θ0 H0 : θ = θ0 H0 : θ = θ0
ቊ ቊ ቊ
H1 : θ > θ 0 H1 : θ < θ 0 H1 : θ ≠ θ 0

▪ Với mỗi cặp giả thuyết ta có một tiêu chuẩn kiểm định,
ký hiệu là 𝐺.
▪ Giá trị của tiêu chuẩn kiểm định G tính trên mẫu cụ thể
ký hiệu là 𝐺𝑞𝑠

TKKD 213
Ví dụ
Viết cặp giả thuyết phù hợp cho các bài toán kiểm định
giả thuyết thống kê đối với các nhận định sau:
a) Thu nhập trung bình của người lao động là trên
2000 USD/năm.
b) Tỷ lệ khách quay lại mua hàng lần hai là 50%.
c) Độ dao động của giá vàng trên thị trường trong năm
qua là chưa đến 30 USD phải không?
d) Tỷ lệ nữ khách hàng trong ngày của một cửa hàng là
ít hơn nam.
e) Mức độ biến động của giá vàng là quá 500 USD2.
TKKD 214
Các loại sai lầm
▪ Sai lầm loại I: bác bỏ một điều đúng (type I error)
▪ Sai lầm loại II: chấp nhận một điều sai (type II error)
Quyết định Tình trạng trên tổng thể
𝐻0 đúng 𝐻0 sai
Chấp nhận 𝐻0 Đúng Sai lầm loại II
Xác suất = 1 - α Xác suất = β
Bác bỏ 𝐻0 Sai lầm loại I Đúng
Xác suất = α Xác suất = 1 - β

TKKD 215
Mức ý nghĩa và miền bác bỏ H0
▪ Xác định một miền 𝑊 sao cho nếu 𝐻0 đúng thì xác suất 𝐺
thuộc miền đó là một mức  đủ nhỏ:
𝑃(𝐺  𝑊 | 𝐻0 đúng) = 
▪ 𝑊 gọi là miền bác bỏ giả thuyết H0 (reject area)
▪ 𝑊 được xác định bởi các giá trị tới hạn (critical value)
▪  gọi là mức ý nghĩa (significant level)
▪ Mức  hay dùng là  = 0,01; 0,05; 0,1

TKKD 216
Quy tắc kiểm định
▪ Cặp giả thuyết 𝐻0 và 𝐻1
▪ Mẫu cụ thể thì tiêu chuẩn 𝐺 nhận giá trị cụ thể: 𝐺𝑞𝑠
▪ Mức ý nghĩa  cho trước, tìm được miền bác bỏ 𝑊
❖ Nếu 𝐺𝑞𝑠  𝑊: bác bỏ giả thuyết 𝐻0 (reject 𝐻0)
❖ Nếu 𝐺𝑞𝑠  𝑊: chưa có cơ sở bác bỏ 𝐻0 (not reject 𝐻0)
▪ Kết luận về mệnh đề đã nêu ra.

TKKD 217
9.2. KIỂM ĐỊNH THAM SỐ MỘT TỔNG THỂ
▪ Kiểm định trung bình tổng thể
▪ Kiểm định phương sai tổng thể
▪ Kiểm định tần suất tổng thể

▪ [2] Chapter 9, pp. 353-384


▪ [3] Chapter 9, pp. 390-440; 481-493

TKKD 218
Kiểm định trung bình tổng thể
▪ Tổng thể phân phối chuẩn 𝑋 ~ 𝑁 (  , 𝜎 2 )
▪ Tham số  chưa biết nhưng muốn so sánh  với 0
(0 đã biết), khi đó ta có 3 cặp giả thuyết sau:

H0 : μ = μ0 H0 : μ = μ0 H0 : μ = μ0
(1) ቊ (2) ൜ 3 ቊ
H1 : μ > μ 0 H1 : μ < μ 0 H1 : μ ≠ μ 0

Xét hai trường hợp:


❖ Phương sai tổng thể σ2 đã biết (lý thuyết)
❖ Phương sai tổng thể σ2 chưa biết (thực tế)

TKKD 219
Kiểm định  khi biết σ2 (tự đọc)
ഥ −μ
X n
Tiêu chuẩn chung 𝑍= ~ N 0,1
σ

H0 : μ = μ0
(1) ቊ
H1 : μ > μ 0

Nếu 𝐻0 đúng thì


ഥ −μ 0 ) n
(X
𝑍= ~ N 0,1
σ
𝑃(𝑍 > 𝑧 𝛼 ) = 𝛼

Miền bác bỏ Wα = Z: Z > z α

TKKD 220
Kiểm định  khi biết σ2 (tự đọc)
ഥ −μ
X n
Tiêu chuẩn chung 𝑍= ~ N 0,1
σ

H0 : μ = μ0
(2) ቊ
H1 : μ < μ 0

Tiêu chuẩn kiểm định


ഥ −μ 0 ) n
(X
𝑍= ~ N 0,1
σ
𝑃(𝑍 < −𝑧 𝛼 ) = 𝛼

Miền bác bỏ Wα = Z: Z < −z α

TKKD 221
Kiểm định  khi biết σ2 (tự đọc)
ഥ −μ
X n
Tiêu chuẩn chung 𝑍= ~ N 0,1
σ

H0 : μ = μ0
(3) ቊ
H1 : μ ≠ μ 0

ഥ −μ 0 ) n
(X
𝑍= ~N 0,1
σ
𝑃( Z > z α/2 )=

Miền bác bỏ Wα = Z: Z > z α/2

TKKD 222
Kiểm định  khi chưa biết σ2
𝑋 ~ 𝑁( , 𝜎2) Cặp Miền bác bỏ
Tiêu chuẩn giả thuyết 𝑊
𝐻0:  = 0
𝐻1:  > 0

𝐻0:  = 0
𝐻1:  < 0

𝐻0:  = 0
𝐻1:   0

TKKD 223
Ví dụ
Ví dụ 9.2. Cân ngẫu nhiên 25 sản phẩm thu được khối
lượng trung bình là 25,32g và phương sai là 5,28g2.
Giả sử khối lượng phân phối chuẩn. Với mức ý nghĩa 5%
a) Kiểm định giả thuyết khối lượng trung bình tổng thể
lớn hơn 24g
b) Có thể nói khối lượng trung bình tổng thể là chưa đến
26g hay không? Nếu mức ý nghĩa là 10% thì sao?
c) Nhận xét ý kiến cho rằng khối lượng trung bình tổng thể
là khác 25g

TKKD 224
Kiểm định phương sai tổng thể
𝑋 ~ 𝑁( , 𝜎2) Cặp Miền bác bỏ
Tiêu chuẩn giả thuyết 𝑊

TKKD 225
Ví dụ
Ví dụ 9.3. Tiêu chuẩn cho độ dao động của khối
lượng một loại quả đóng hộp là không được
vượt quá 5g. Kiểm tra ngẫu nhiên 50 quả thu
hoạch tại một vườn thấy phương sai mẫu của
khối lượng quả là 30g2.
Với mức ý nghĩa 5%, cho biết mức dao động của
khối lượng loại quả tại vườn này là đạt tiêu
chuẩn hay không? Giả thiết rằng khối lượng quả
là biến ngẫu nhiên phân phối chuẩn.

TKKD 226
Kiểm định tần suất tổng thể
Tiêu chuẩn Cặp Miền bác bỏ
kiểm định giả thuyết 𝑊

𝐻 0: 𝑝 = 𝑝 0
𝑝ො − p 0 n 𝐻 1: 𝑝 > 𝑝 0 Z: Z > z α
Z=
p0 1 − p0 𝐻 0: 𝑝 = 𝑝 0
𝑍~N 0,1 , 𝐻 1: 𝑝 < 𝑝 0 Z: Z < −z α
n ≥100 𝐻 0: 𝑝 = 𝑝 0
𝐻 1: 𝑝 ≠ 𝑝 0 Z: Z > z α/2

TKKD 227
Ví dụ

Ví dụ 9.4. Trong số 400 người vào cửa hàng thì có 224 nữ và


176 nam.
Với mức ý nghĩa 5% có thể nói tỷ lệ nữ chiếm trên một nửa
số người vào cửa hàng hay không?

TKKD 228
9.3. KIỂM ĐỊNH THAM SỐ HAI TỔNG THỂ
▪ Khái niệm mẫu độc lập và mẫu phụ thuộc
▪ Kiểm định trung bình hai tổng thể
▪ Kiểm định phương sai hai tổng thể
▪ Kiểm định tần suất hai tổng thể

▪ [2] Chapter 10
▪ [3] Chapter 10, 11, 12

TKKD 229
Kiểm định về trung bình hai tổng thể

▪ Hai tổng thể phân phối chuẩn:


𝑋1 ~𝑁 𝜇1 , 𝜎12 ; 𝑋2 ~𝑁(𝜇2 , 𝜎22 )
▪ Các tham số đều chưa biết
▪ Với X1, lấy mẫu W1, kích thước n1, có 𝑋ത1 và 𝑆12
▪ Với X2, lấy mẫu W2, kích thước n2, có 𝑋ത2 và 𝑆22
▪ Với mức ý nghĩa , kiểm định so sánh 1 và 2

TKKD 230
Kiểm định trung bình hai tổng thể

Tiêu chuẩn Cặp Miền bác bỏ


kiểm định giả thuyết W
H0: 1 = 2 𝑇: 𝑇 > 𝑧𝛼
𝑋ത1 − 𝑋ത2 H1: 1 > 2
𝑇=
𝑆12 𝑆22 H0: 1 = 2 𝑇: 𝑇 < −𝑧𝛼
+
𝑛1 𝑛2 H1: 1 < 2
H0: 1 = 2 𝑇: |𝑇| > 𝑧𝛼/2
n1, n2 > 30 thì H1: 1  2
(𝑑𝑓)
𝑡𝛼 = 𝑧𝛼

TKKD 231
Ví dụ
Ví dụ 9.5. Khảo sát ngẫu nhiên 40 khách hàng nam và
40 khách hàng nữ thấy khách nam chi trung bình là 230
nghìn đồng và độ lệch chuẩn là 50 nghìn đồng; khách
nữ chi trung bình là 205 nghìn đồng và độ lệch chuẩn là
60 nghìn đồng. Giả sử chi tiêu phân phối chuẩn.
(a) Với mức ý nghĩa 5%, kiểm định giả thuyết mức chi
trung bình của nam nhiều hơn nữ.

TKKD 232
Kiểm định phương sai hai tổng thể

Tiêu chuẩn Cặp Miền bác bỏ


kiểm định giả thuyết W
H0: 𝜎12 = 𝜎22 𝐹: 𝐹 > 𝑓𝛼
(𝑛1 −1,𝑛2 −1)

𝑆12 H1: 𝜎12 > 𝜎22


𝐹= 2
𝑆2 H0: 𝜎12 = 𝜎22 𝐹: 𝐹 <
(𝑛1 −1,𝑛2 −1)
𝑓1−𝛼
H1: 𝜎12 < 𝜎22
(𝑛1 , 𝑛2 )
𝑓1−𝛼 H0: 𝜎12 = 𝜎22 𝐹>
(𝑛1 −1,𝑛2 −1)
𝑓𝛼/2
1 H1: 𝜎12 ≠ 𝜎22 𝐹: [
= (𝑛2 , 𝑛1 ) 𝐹<
(𝑛1 −1,𝑛2 −1)
𝑓1−𝛼/2
𝑓𝛼

TKKD 233
Ví dụ
Ví dụ 9.5 (tiếp). Khảo sát ngẫu nhiên 40 khách hàng nam
và 40 khách hàng nữ thấy khách nam chi trung bình là 230
nghìn đồng và độ lệch chuẩn là 50 nghìn đồng; khách nữ
chi trung bình là 205 nghìn đồng và độ lệch chuẩn là 60
nghìn đồng. Giả sử chi tiêu phân phối chuẩn.
(b) Với mức ý nghĩa 5%, kiểm định giả thuyết mức chi của
nam đồng đều hơn nữ.

TKKD 234
Kiểm định phương sai hai tổng thể
▪ Giả thuyết 𝜎12 < 𝜎22 hoán vị thành 𝜎22 > 𝜎12
▪ Chỉ xét với 𝑆12 > 𝑆22 thì bảng quyết định:
𝑋1 ~𝑁 𝜇1 , 𝜎12 Cặp Miền bác bỏ
𝑋2 ~𝑁(𝜇2 , 𝜎22 ) giả thuyết W

𝑺𝟐𝟏 > 𝑺𝟐𝟐 H0: 𝜎12 = 𝜎22 (𝑛1 −1,𝑛2 −1)


𝐹: 𝐹 > 𝑓𝛼
𝑆12 H1: 𝜎12 > 𝜎22
𝐹= 2
𝑆2
H0: 𝜎12 = 𝜎22 (𝑛 −1, 𝑛2 −1)
𝐹 > 𝑓𝛼ൗ 1
H1: 𝜎12 ≠ 𝜎22 𝐹:
2
(𝑛 −1, 𝑛2 −1)
0<𝐹 < 𝑓 𝛼1
1−
2

Ví dụ 9.5 (tiếp): (b) Mức chi của nam có đồng đều hơn nữ không?

TKKD 235
Kiểm định tần suất hai tổng thể

Tiêu chuẩn kiểm định Cặp Miền bác bỏ


𝑛1 , 𝑛2 ≥ 100 giả thuyết W
𝐻0: 𝑝1 = 𝑝2 𝑍: 𝑧 > 𝑧𝛼
𝑝Ƹ1 − 𝑝Ƹ 2 𝐻1: 𝑝1 > 𝑝2
z=
1 1 𝐻0: 𝑝1 = 𝑝2 𝑍: 𝑧 < −𝑧𝛼
𝑝(1
ҧ − 𝑝)ҧ +
𝑛1 𝑛2
𝐻1: 𝑝1 < 𝑝2
𝑛1 𝑝Ƹ1 + 𝑛2 𝑝Ƹ 2 𝐻0: 𝑝1 = 𝑝2 𝑍: |𝑧| > 𝑧𝛼/2
𝑝ҧ =
𝑛1 + 𝑛2 𝐻1: 𝑝1 ≠ 𝑝2

TKKD 236
Ví dụ
Ví dụ 9.4 (tiếp). Trong số 400 người vào cửa hàng thì có 224
nữ và 176 nam.
Trong 224 nữ có 108 người mua hàng; trong 176 nam có 94
người mua hàng. Với mức ý nghĩa 5%:

b) Có thể cho rằng tỷ lệ mua hàng của nữ là ít hơn của nam


hay không?

TKKD 237
Ví dụ
▪ Ví dụ 9.6. Quan sát số khách hàng vào ba cửa hàng
A, B, C
A B C
Nữ 55 115 85
Nam 45 55 35
Tổng 100 170 120

a) Với mức ý nghĩa 5%, kiểm định giả thuyết “tỷ lệ khách
hàng là nữ ở hai cửa hàng A và B là như nhau”
b) Với mức ý nghĩa là 1% thì tỷ lệ khách hàng là nữ ở cửa
hàng B nhỏ hơn tỷ lệ khách hàng là nữ ở cửa hàng C?

TKKD 238
9.4. KIỂM ĐỊNH PHI THAM SỐ
Kiểm định phi tham số được sử dụng trong những
trường hợp dữ liệu không có phân phối chuẩn hoặc
cho các mẫu nhỏ có ít quan sát.
▪ Kiểm định Jarques Berra (JB) về dạng phân phối
chuẩn của một biến số
▪ Kiểm định tính độc lập của hai dấu hiệu định tính

Tham khảo
▪ [3] Chapter 12

TKKD 239
KIỂM ĐỊNH JARQUES – BERRA (JB)
𝐻0: Biến 𝑋 phân phối chuẩn
𝐻1: Biến 𝑋 không phân phối chuẩn
n
▪ Hệ số bất đối xứng: a3 =
 i =1
( X i − X )3
/n
S3
n
▪ Hệ số nhọn: a4 =
 i =1
( X i − X ) 4
/n
4
S
 a32 (a4 − 3)2 
▪ Tiêu chuẩn: JB = n  + 
 6 24 

▪ Miền bác bỏ: 


Wα = JB : JB  χ α2(2) 
TKKD 240
Ví dụ
▪ Ví dụ 9.7. Với số liệu sau:

▪ Tính được: 𝑥ҧ = 25,32 và 𝑠 = 2,286


▪ ∑ 𝑥𝑖 − 𝑥ҧ 3 = −38,56; ∑ 𝑥𝑖 − 𝑥ഥ 4 = 568,63
▪ Với mức ý nghĩa 5%, kiểm định giả thuyết khối lượng
sản phẩm là biến ngẫu nhiên phân phối chuẩn.

TKKD 241
KIỂM ĐỊNH TÍNH ĐỘC LẬP
▪ Hai dấu hiệu định tính A và B và bảng tiếp liên
• A gồm h phạm trù: 𝐴1, 𝐴2, … , 𝐴ℎ
• B gồm k phạm trù: 𝐵1, 𝐵2, … , 𝐵𝑘

TKKD 242
Kiểm định tính độc lập
▪ Kiểm định cặp giả thuyết
• 𝐻0: A và B độc lập
• 𝐻1: A và B không độc lập
 h k n 2

▪ Tiêu chuẩn χ = n  
2 ij
− 1
 i =1 j =1 ni m j 
 
2 (ℎ−1)×(𝑘−1)
▪ Miền bác bỏ: 𝑊𝛼 = 2 : 2 > 𝛼

TKKD 243
Ví dụ
▪ Ví dụ 9.8. Với mức ý nghĩa 5%, kiểm định tính độc lập
giới tính và loại tốt nghiệp của các cử nhân

Loại
Trung
TN Khá Giỏi ∑
bình
Giới
Nữ 90 150 40
Nam 100 100 20

TKKD 244

You might also like