Download as pdf or txt
Download as pdf or txt
You are on page 1of 18

TÀI LIỆU ÔN TẬP XÁC SUẤT THỐNG KÊ BIÊN SOẠN: TRƯƠNG ĐỨC AN

NHỮNG LƯU Ý THI CUỐI KỲ


MÔN HỌC XÁC SUẤT THỐNG KÊ HK202 – HK203
1. Các khái niệm trong thống kê cơ bản:
Tên gọi Kí hiệu Công thức Tên gọi Kí hiệu Công thức
Kích Kích thước
thước N mẫu n
tổng thể
Trung Trung bình x1 + x2 + …+ xn
x! =
bình tổng a hay μ mẫu x! n
x1 .n1 + x2 .n2 + …+ xk .nk
thể x! =
n
Tỷ lệ tổng M Tỷ lệ mẫu m
p p= f hay p# f=
thể N n
Phương Phương sai 2 ∑ (xi - x! )2 ∑ x2i - n.x! 2
ŝ = =
sai tổng mẫu ŝ 2 n n
thể σ2
Phương sai 2
∑ (xi - x! )2 ∑ x2i - n.x! 2
s2 s = =
mẫu hiệu chỉnh n-1 n-1

n 2
Mối liên hệ giữa s2 và ŝ 2 s2 = ŝ
n - 1
Độ lệch Độ lệch chuẩn ŝ = 'ŝ 2

chuẩn mẫu
σ
tổng thể Độ lệch chuẩn s ='s2
s
mẫu hiệu chỉnh
Mức ý Độ tin cậy
α 1-α
nghĩa
Các khái niệm khác:
+ Yếu vị (mode): là giá trị của phần tử có số lần xuất hiện lớn nhất trong mẫu.
+ Hệ số biến thiên (Coefficient of variation – CV):
σ s
CV (của tổng thể) = ´ 100% CV (của mẫu) = ´ 100%
a x!
+ Sai số chuẩn:
s
SE =
√n
+ Trung vị mẫu:
Giả sử X có n quan sát x1 , x2 , x3 , …xn . Xếp các quan sát này theo thứ tự tăng dần.
Trung vị mẫu (Median) là giá trị nằm chính giữa dãy số này và chia nó thành 2 phần bằng nhau. Cụ
thể, nếu mẫu có dạng x1<…<x2k+1 thì trung vị mẫu là xk+1; nếu mẫu có dạng x1<…<x2k thì trung vị
mẫu là trung bình cộng (xk + xk+1)/2.

FB: Nhóm học tập XSTK Trang 1


TÀI LIỆU ÔN TẬP XÁC SUẤT THỐNG KÊ BIÊN SOẠN: TRƯƠNG ĐỨC AN
+ Phân vị:
Điểm tứ phân vị dưới (Q1) là trung vị của nửa mẫu nhỏ, là giá trị chia mẫu thành 2 phần sao cho phía
trái chiếm 25% của mẫu.
Điểm tứ phân vị dưới (Q3) là trung vị của nửa mẫu lớn, là giá trị chia mẫu thành 2 phần sao cho phía
trái chiếm 75% của mẫu.
Hiệu IQR = Q3 – Q1 được gọi là khoảng tứ phân vị
+ Điểm outlier: còn gọi là điểm dị biệt, điểm ngoại lệ, điểm ngoại lai.... Đó là các phần tử của mẫu có
giá trị nằm ngoài khoảng (Q1 – 1,5 ´ IQR; Q3 + 1,5 ´ IQR).

2. Hướng dẫn tra bảng:


Tìm giá trị Zα : F(Zα ) = (1 - α)/2 : tra ngược bảng tích phân Laplace (bảng II).
Tìm giá trị Zα : F(Z2α ) = (1 - 2α)/2 : tra ngược bảng tích phân Laplace (bảng II).
Tìm giá trị χ2 α/2(n - 1) : tra bảng Khi bình phương (bảng VI), cột (α/2); dòng (n – 1).
Tìm giá trị χ2 1 - α/2(n - 1) : tra bảng Khi bình phương (bảng VI), cột (1 - α/2); dòng (n – 1).
Tìm giá trị χ2 α(n - 1) : tra bảng Khi bình phương (bảng VI), cột (α); dòng (n – 1).
Tìm giá trị χ2 1 - α(n - 1) : tra bảng Khi bình phương (bảng VI), cột (1 – α); dòng (n – 1).
Tìm giá trị tα/2(n - 1) : tra bảng Student (bảng VII) cột (α/2); dòng (n – 1).
Tìm giá trị tα(n - 1) : tra bảng Student (bảng VII) cột (α); dòng (n – 1).
Tìm giá trị Fα(k - 1; n - k) : tra bảng Fisher (bảng tra giáo viên gửi trên BKEL), mức ý nghĩa tương ứng,
cột (k – 1) , dòng (n – k)

3. Ước lượng:
Tìm khoảng tin cậy (khoảng ước lượng):
Dạng ước lượng Độ chính xác Khoảng ước lượng
1. Tỷ lệ: 'f.(1 - f)
ε = Zα (f - ε ;f + ε)
√n
2. Trung bình (kỳ vọng):

s
v Mẫu bé (n <30) chưa biết σ # ε = tα/2(n-1) (x! - ε; x! + ε)
√n
s
v Mẫu lớn (n ≥ 30), chưa biết σ # ε = Zα (x! - ε; x! + ε)
√n
σ
v Đã biết σ# ε = Zα (x! - ε; x! + ε)
√n
3. Phương sai:
(n - 1).s2 (n - 1).s2
. ; /
χ2α (n - 1) χ2 α (n - 1)
1 -
2 2

FB: Nhóm học tập XSTK Trang 2


TÀI LIỆU ÔN TẬP XÁC SUẤT THỐNG KÊ BIÊN SOẠN: TRƯƠNG ĐỨC AN
Lưu ý 1:
Đề bài cho độ tin cậy 1 – α thì đây là dạng toán ước lượng. Đề sẽ yêu cầu tìm khoảng tin cậy, tìm
khoảng ước lượng cho …

Lưu ý 2:
Khi làm phần ước lượng, nếu đề có chữ “tỷ lệ” thì thường sẽ là dạng bài ước lượng tỷ lệ, nếu đề có chữ
“trung bình” thì thường sẽ là dạng bài ước lượng trung bình, có chữ “phương sai, độ lệch chuẩn, độ
phân tán, độ chính xác, độ đồng đều” thì thường sẽ là dạng bài là ước lượng phương sai.
Trong trường hợp đề không có chữ “trung bình”, “tỷ lệ” hay “phương sai” thì ta cần đọc hiểu xem
cần phải ước lượng bài toán thông qua dạng bài ước lượng cơ bản nào đó.

Ví dụ 1: Hãy ước lượng số chi tiết đạt loại 1 trong 6900 sản phẩm chứa trong kho với độ tin cậy 95%.
Hướng dẫn: Đây là dạng bài Ước lượng tỷ lệ.
Ta cần giải qua 2 bước:
Bước 1: Tìm ước lượng cho tỷ lệ chi tiết đạt loại 1 trong kho: (f - ε ;f + ε)
Bước 2: Tìm khoảng ước lượng cho số chi tiết trong kho bằng cách lấy 6900 nhân với 2 cận của khoảng
ước lượng: 6900.(f - ε ;f + ε)
(làm tròn số nguyên theo nguyên tắc quá bán)

Ví dụ 2: Hãy ước lượng khối lượng thực phẩm của 200 hộ đã sử dụng, với độ tin cậy 95%.
Hướng dẫn: Đây là dạng bài Ước lượng trung bình.
Ta cần giải qua 2 bước:
Bước 1: Tìm khoảng ước lượng của khối lượng thực phẩm trung bình cho 1 hộ
Bước 2: Tìm khoảng ước lượng của khối lượng thực phẩm trung bình cho 200 hộ bằng cách lấy 200
nhân với 2 cận của khoảng ước lượng: 200.(x! - ε; x! + ε)
(Không cần thiết làm tròn số nguyên, chỉ làm tròn nếu đề yêu cầu)

Ví dụ 3: Đánh bắt 450 con đánh dấu thả xuống hồ. Lần sau đánh bánh 500 con thì thấy 80 con được
đánh dấu. Từ dữ liệu mẫu, hãy dự đoán số cá trong hồ với độ tin cậy 95%.
Hướng dẫn: Đây là dạng bài Ước lượng tỷ lệ.
Ta cần giải qua 2 bước:
Bước 1: Tìm ước lượng cho tỷ lệ cá được đánh dấu trong hồ: (f - ε ;f + ε)
Bước 2: Tìm khoảng ước lượng cho số cá trong hồ bằng cách lấy 450 chia cho 2 cận khoảng ước lượng:
450 450
! ; #
f+ε f-ε
(làm tròn số nguyên theo nguyên tắc quá bán)

Chú ý phân biệt Ví dụ 1 và 3:


Ví dụ 1 ước lượng cho M (số phần tử mang dấu hiệu A trong tổng thể) khi biết tổng thể N.
Ví dụ 3 là ước lượng cho tổng thể N khi biết M (số phần tử mang dấu hiệu A của tổng thể).
FB: Nhóm học tập XSTK Trang 3
TÀI LIỆU ÔN TẬP XÁC SUẤT THỐNG KÊ BIÊN SOẠN: TRƯƠNG ĐỨC AN
Lưu ý 3:
Khi gặp bài toán cho bảng tần số 2 chiều, tuy nhiên chỉ ước lượng cho trung bình của biến X hoặc Y.
Ví dụ 3: Ta có bảng Y (chiều cao), X (cân nặng). Hãy ước lượng chiều cao trung bình của cây với độ
tin cậy 95%
Y (m) X (kg)
3 5 7
1,8 3 3
2,0 15 10
2,2 20 4
Hướng dẫn: Đây là dạng bài Ước lượng trung bình cho biến Y:
Y 1,8 2,0 2,2
n 6 25 24
Ta đưa về bảng 1 chiều theo biến Y rồi xác định khoảng ước lượng có dạng: (y! - ε; y! + ε)
Lưu ý 4:
Trong trường hợp đề cho toàn bộ bảng, tuy nhiên chỉ ước lượng trung bình cho một số cá thể mang
dấu hiệu A thôi.
Ví dụ 4: Bảng dưới đây thể hiện trọng lượng các gói mì được khảo sát trên dây chuyển sản xuất X.
Những gói mỳ có trọng lượng dưới 980 được coi là không đạt tiêu chuẩn. Hãy ước lượng trọng lượng
trung bình những gói mì không đạt tiêu chuẩn.
Trọng lượng 960 – 970 970 – 980 980 – 990 990 – 1000 1000 – 1010 1010 - 1020
Số gói mì 3 10 17 20 25 10
Hướng dẫn: Đây là dạng bài Ước lượng trung bình cho trọng lượng của những gói mì không đạt chuẩn.
Do đó để thực hiện ước lượng, ta cần khảo sát những gói mì không đạt chuẩn. Như vậy ở đây, khi xác
định các đặc trưng mẫu, ta chỉ sử dụng bảng số liệu ở 2 cột đầu tiên thôi.
Trọng lượng 960 – 970 970 – 980
Số gói mì 3 10
Ví dụ 5: Ta có bảng Y (chiều cao), X (cân nặng). Hãy ước lượng chiều cao trung bình của cây loại I
với độ tin cậy 95%. Biết rằng những cây loại I có chiều cao từ 2m trở lên và có cân nặng từ 4,5kg trở
lên.
Y (m) X (kg)
3 5 7
1,8 3 3
2,0 15 10
2,2 20 4
Hướng dẫn: Đây là dạng bài Ước lượng trung bình cho chiều cao của những cây loại I. Do đó để thực
hiện ước lượng, ta cần khảo sát những cây loại I, và lập lại bảng 1 chiều theo biến chiều cao.
Y 2,0 2,2
n 25 24
Ta sử dụng bảng số liệu trên và xác định khoảng ước lượng có dạng: (y! - ε; y! + ε)
FB: Nhóm học tập XSTK Trang 4
TÀI LIỆU ÔN TẬP XÁC SUẤT THỐNG KÊ BIÊN SOẠN: TRƯƠNG ĐỨC AN
Lưu ý 5:
Cách phân biệt các bài ước lượng trung bình: Để xác định chính xác dạng bài, đọc kỹ đề xem đề đã
cho độ lệch chuẩn σ (tổng thể) hay phương sai σ# (tổng thể) hay chưa. Nếu đề cho sẵn độ lệch chuẩn,
phương sai tổng thể, tức là đã biết σ# , đây bài toán trung bình thuộc dạng 3 (theo công thức bên trên).
Nếu đề chưa cho biết độ lệch chuẩn σ hay phương sai σ# tổng thể, tức là chưa biết σ# . Ta xét tiếp xem
kích thước mẫu để ước lượng cho bài toán < 30 hay ≥ 30.
Tránh nhầm lẫn giữa việc độ lệch chuẩn (phương sai) của tổng thể hay của mẫu. Nếu chỉ cho bảng số
liệu và đề không nhắc gì tới độ lệch chuẩn (phương sai) thì đây thuộc dạng chưa biết phương sai tổng
thể tức là chưa biết σ# (vì bảng số liệu chỉ cho ta độ lệch chuẩn mẫu hiệu chỉnh hay phương sai mẫu
hiệu chỉnh)
Xác định kích thước mẫu:
Dạng ước lượng Kích thước mẫu:
2
Zα 'f.(1 - f) Zα 2
n' = 1 2 hoặc n = 3 4 ×0,25
1. Tỷ lệ: (nếu không biết f dùng CT 2) ε' ε'
(làm tròn lên số nguyên)
2. Trung bình (kỳ vọng):

s 2
v Chưa biết σ# : n' = 5Zα ε'6 (làm tròn lên số nguyên)
σ 2
v Đã biết σ# : n' = 5Zα ε'6 (làm tròn lên số nguyên)

Lưu ý 6:
Đối với dạng bài xác định kích thước mẫu (bài toán ngược) của ước lượng, nếu đề có chữ “tỷ lệ” thì
ta dùng công thức tìm n’ của dạng ước lượng tỷ lệ. Nếu nếu đề có chữ “trung bình” thì ta dùng công
thức tìm n’ của dạng ước lượng trung bình (chú ý xem thuộc dạng bài đã biết hay chưa biết σ# .
Lưu ý 7:
Đối với dạng bài xác định kích thước mẫu (bài toán ngược) của ước lượng, đề sẽ cho trước độ chính
xác (sai số) của ước lượng ε' hoặc là độ dài (chiều dài) khoảng ước lượng 2ε'. Cần đọc kỹ đề đang cho
mình ε' hay 2ε'.
Lưu ý 8:
Đối với dạng bài xác định kích thước mẫu (bài toán ngược) của ước lượng, hãy lưu ý đề hỏi kích thước
mẫu n’ cần khảo sát hoặc hỏi kích thước mẫu cần khảo sát thêm Δn = n’ – n.

FB: Nhóm học tập XSTK Trang 5


TÀI LIỆU ÔN TẬP XÁC SUẤT THỐNG KÊ BIÊN SOẠN: TRƯƠNG ĐỨC AN
4. Hồi quy
Viết phương trình đường hồi quy:
Phương trình hồi quy tuyến tính mẫu của Y theo X: y = a + bx, với:
a = y! - bx!
xy x! .y!
9b = !!! -
s:x 2
Phương trình hồi quy tuyến tính mẫu của X theo Y: x = c + dy, với:
c = x! - dy!
xy ! .y!
9d = !!! - x
s:y 2
Hệ số tương quan mẫu:
xy
!!! - x! .y!
rXY =
s:x .s:y
Nhận xét mối quan hệ tuyến tính giữa X và Y:
|rXY | < 0,7: nghèo nàn
0,7 ≤ |rXY | < 0,8: khá
0,8 ≤ |rXY | < 0,9: tốt
|rXY | ≥ 0,9: xuất sắc (xấp xỉ tuyến tính)
Lưu ý 9:
Cần đọc kỹ đề xem đề yêu cầu viết phương trình hồi quy Y theo X hoặc X theo Y.
Ta nên sử dụng máy tính bỏ túi để tính toán chứ không nên áp dụng công thức (vì tốn thời gian và cơ
bản là đang thi trắc nghiệm).
Khi viết phương trình hồi quy tuyến tính mẫu của Y theo X, ta nhập X (bảng số liệu) vào cột X (trong
máy tính), ta nhập cột Y (bảng số liệu) vào cột Y (trong máy tính).
Khi viết phương trình hồi quy tuyến tính mẫu của X theo Y, ta nhập Y (bảng số liệu) vào cột X (trong
máy tính), ta nhập cột X (bảng số liệu) vào cột Y (trong máy tính).
Lưu ý 10:
Khi có phương trình hồi quy mẫu Y theo X. Nếu dự đoán y0 khi biết x0, ta chỉ cần thế x0 vào biến x
của phương trình hồi quy y = a + b.x (a, b là các hệ số hồi quy được lấy từ máy tính).
Khi có phương trình hồi quy mẫu Y theo X. Tuy nhiên cần dự đoán dự đoán x0 khi biết y0. Ta KHÔNG
ĐƯỢC thế y0 vào biến y của phương trình hồi quy y = a + b.x (a, b là các hệ số hồi quy được lấy từ
máy tính), rồi shift solve tìm x0. Đối với trường hợp này, ta cần xây dựng lại phương trình hồi quy
tuyến tính mẫu X theo Y: x = c + d.y. Sau đó thế y0 vào phương tình để tìm được x0.

FB: Nhóm học tập XSTK Trang 6


TÀI LIỆU ÔN TẬP XÁC SUẤT THỐNG KÊ BIÊN SOẠN: TRƯƠNG ĐỨC AN

FB: Nhóm học tập XSTK Trang 7


TÀI LIỆU ÔN TẬP XÁC SUẤT THỐNG KÊ BIÊN SOẠN: TRƯƠNG ĐỨC AN

FB: Nhóm học tập XSTK Trang 8


TÀI LIỆU ÔN TẬP XÁC SUẤT THỐNG KÊ BIÊN SOẠN: TRƯƠNG ĐỨC AN
5. Phân tích phương sai 1 yếu tố (trường hợp các mẫu bằng nhau):
(K18 KHÔNG THI DẠNG NÀY)
Phát biểu giả thiết:
H0 : a1 = a2 = a3 = .. . = ak
Trung bình của các tổng thể bằng nhau bằng nhau (không có sự khác biệt về trung bình giữa các tổng
thể)
H1 : ∃ai ≠ aj
Có ít nhất 2 trung bình ở các tổng thể khác nhau (có sự khác biệt về trung bình giữa các tổng thể)

Miền bác bỏ: Wα = (Fα (k - 1; N - k);+∞)


(N: tổng số quan sát ở toàn bộ bảng, k: số nhóm so sánh)

Tính các trung bình:


x1 ..., !!!! =
!!!! = x2 ..., !!!! = ...,
x3 xk
!!!! = ..., x =
!!!
(!!!: trung
xi bình mẫu của từng nhóm so sánh. !!!:
x trung bình mẫu chung của toàn bộ bảng)
Tính các tổng bình phương:
Tính SST: Nhập toàn bộ bảng vào máy tính bỏ túi, SST = n.ŝ 2 .
(n, ŝ tính từ máy tính bỏ túi)
Tính SSG:
k
2 2 2
xi - x!)2 = n.[(!!!!
SSG = n. @(!!!! x1 - x! ) +(!!!!
x2 - x! ) +...+(!!!!
xk - x! ) ]
i=1
(n: số quan sát trong 1 nhóm)
Tính SSW: SSW = SST - SSG

Trung bình bình phương giữa các nhóm:


SSG
MSG =
k-1
Trung bình bình phương trong từng nhóm:
SSW
MSW=
N-k
Trung bình bình phương toàn phần:
SST
MST =
N-1
Tính tiêu chuẩn kiểm định:
MSG
F=
MSW

Kết luận:
Nếu F ∉ Wα → chưa bác bỏ được H0 (hay còn gọi là chấp nhận H0).
Nếu F ∈ Wα → bác bỏ H0, chấp nhận H1.

FB: Nhóm học tập XSTK Trang 9


TÀI LIỆU ÔN TẬP XÁC SUẤT THỐNG KÊ BIÊN SOẠN: TRƯƠNG ĐỨC AN
Bảng tóm tắt phân tích phương sai:
Tổng bình Phương sai
Nguồn biến thiên Bậc tự do F
phương (Trung bình bình phương)
SSG MSG
Giữa các nhóm SSG k-1 MSG = F =
k - 1 MSW
SSW
Trong nội bộ các nhóm SSW N-k MSW =
N - k
Toàn bộ SST N-1
Lưu ý 11:
Ta dùng phân tích phương sai để so sánh trung bình của nhiều tổng thể với nhau để luận sự bằng nhau
hay khác nhau giữa các tổng thể (từ 3 tổng thể trở lên).
Lưu ý 12:
Phân biệt n ở công thức tính STT và n ở công thức SSG, Phân biệt n ở công thức SSG và N ở bậc tự
do.
Lưu ý 13: Nếu đề yêu cầu đánh giá sự ảnh hưởng của một yếu tố định tính lên 1 yếu tố định lượng
(được mô tả bằng số liệu ở các nhóm so sánh). Ta thực hiện phân tích phương sai. Nếu đưa ra kết luận
trung bình của các tổng thể bằng nhau, tức có nghĩa là yếu tố định tính đó không ảnh hưởng đến yếu
tố định lượng. Ngước lại, ta kết luận có ít nhất hai tổng thể có trung bình khác nhau, tức có nghĩa
yếu tố định tính đó có ảnh hưởng đến yếu tố định lượng.
Ví dụ 6: Người ta tin rằng có sự liên quan giữa màu tóc tự nhiên và sức chịu đau của phụ nữ. Do đó,
12 phụ nữ đã được chọn ngẫu nhiên để thực hiện một cuộc khảo sát; trong đó,nmàu tóc và sức chịu
đau (theo thang điểm 100) của các tình nguyện viên được ghi nhận. Bảng bên là số liệu thu được. Với
mức ý nghĩa 5%, có thể kết luận rằng màu tóc ảnh hưởng đến sức chịu đau của phụ nữ hay không?
Màu sáng 63 72 52 60
Màu trung bình 60 48 44 53
Màu tối 45 33 57 40
Hướng dẫn: trong bài toán này, ta cần thực hiện đánh giá sự ảnh hưởng của yếu tố định tính (màu
tóc) đến yếu tố định lượng (sức chịu đau của phụ nữ). Ta thực hiện phân tích phương sai cho bài toán
này (so sánh trung bình sức chịu đau ở các nhóm có màu tóc khác nhau).
Kết quả bài toán cho ta F ∈ Wα → bác bỏ H0, chấp nhận H1. Vậy có nghĩa là có ít nhất 2 màu tóc có
sức chịu đau trung bình khác nhau, tức màu tóc có ảnh hưởng đến sức chịu đau của phụ nữ.

FB: Nhóm học tập XSTK Trang 10


TÀI LIỆU ÔN TẬP XÁC SUẤT THỐNG KÊ BIÊN SOẠN: TRƯƠNG ĐỨC AN
6. Kiểm định trung bình, tỷ lệ và phương sai
Kiểm định tỷ lệ 1 mẫu:
1. Phát biểu giả thiết và xác định miền bác bỏ tương ứng:
Giả thiết Miền bác bỏ P - value
H0 : p = p0
Wα = (- ∞, - Zα ) ∪ (Zα , + ∞) p = 2[1 – Φ(|Zqs |)] (Dùng P)
H1 : p ≠ p0
H0 : p = p0
Wα = (- ∞, - Z2α ) p = Φ(Zqs ) (Dùng P)
H1 : p < p0
H0 : p = p0
Wα = (Z2α , + ∞) p = 1 – Φ(Zqs ) (Dùng P)
H1 : p > p0
2. Tính tiêu chuẩn kiểm định:
f – p0
Zqs = √n
Fp0 (1 - p0 )
3. Quy tắc kiểm định:
Zqs ∈ Wα thì ta sẽ bác bỏ H0, chấp nhận H1.
Zqs ∉ Wα thì ta chưa bác bỏ được H0 (chấp nhận H0)

Kiểm định trung bình (kỳ vọng) 1 mẫu trường hợp biết phương sai σ2
1. Phát biểu giả thiết và xác định miền bác bỏ tương ứng:
Giả thiết Miền bác bỏ P - value
H0 : a = a0
Wα = (- ∞, - Zα ) ∪ (Zα , + ∞) p = 2[1 – Φ(|Zqs |)] (Dùng P)
H1 : a ≠ a0
H0 : a = a0
Wα = (- ∞, - Z2α ) p = Φ(Zqs ) (Dùng P)
H1 : a < a0
H0 : a = a0
Wα = (Z2α , + ∞) p = 1 – Φ(Zqs ) (Dùng P)
H1 : a > a0
2. Tính tiêu chuẩn kiểm định:
x! - a0
Zqs = .√n
σ
3. Quy tắc kiểm định:
Zqs ∈ Wα thì ta sẽ bác bỏ H0, chấp nhận H1.
Zqs ∉ Wα thì ta chưa bác bỏ được H0 (chấp nhận H0)

FB: Nhóm học tập XSTK Trang 11


TÀI LIỆU ÔN TẬP XÁC SUẤT THỐNG KÊ BIÊN SOẠN: TRƯƠNG ĐỨC AN
Kiểm định trung bình (kỳ vọng) 1 mẫu trường hợp chưa biết phương sai σ2 , mẫu lớn (n ≥ 30)
1. Phát biểu giả thiết và xác định miền bác bỏ tương ứng:
Giả thiết Miền bác bỏ P - value
H0 : a = a0
Wα = (- ∞, - Zα ) ∪ (Zα , + ∞) p = 2[1 – Φ(|Zqs |)] (Dùng P)
H1 : a ≠ a0
H0 : a = a0
Wα = (- ∞, - Z2α ) p = Φ(Zqs ) (Dùng P)
H1 : a < a0
H0 : a = a0
Wα = (Z2α , + ∞) p = 1 – Φ(Zqs ) (Dùng P)
H1 : a > a0
2. Tính tiêu chuẩn kiểm định:
x! - a0
Zqs = .√n
s
3. Quy tắc kiểm định:
Zqs ∈ Wα thì ta sẽ bác bỏ H0, chấp nhận H1.
Zqs ∉ Wα thì ta chưa bác bỏ được H0 (chấp nhận H0)

Kiểm định trung bình (kỳ vọng) 1 mẫu trường hợp chưa biết phương sai σ2 , mẫu bé (n < 30)
1. Phát biểu giả thiết và xác định miền bác bỏ tương ứng:
Giả thiết Miền bác bỏ
H0 : a = a0
Wα = (- ∞, - t%/2(n - 1) ) ∪ (t%/2(n - 1) , + ∞)
H1 : a ≠ a0
H0 : a = a0
Wα =(- ∞, - t%(n - 1) )
H1 : a < a0
H0 : a = a0
Wα =(t%(n - 1) ,+∞)
H1 : a > a0
2. Tính tiêu chuẩn kiểm định:
x! - a0
Tqs = .√n
s
3. Quy tắc kiểm định:
Tqs ∈ Wα thì ta sẽ bác bỏ H0, chấp nhận H1.
Tqs ∉ Wα thì ta chưa bác bỏ được H0 (chấp nhận H0)

Kiểm định phương sai 1 mẫu (K18 THƯỜNG KHÔNG THI DẠNG NÀY)
1. Phát biểu giả thiết và xác định miền bác bỏ tương tứng:
Giả thiết Miền bác bỏ
2 2
H0 : σ = σ0 Wα = (0, χ2& ' %/2(n - 1) ) ∪ (χ2 %/2(n - 1) , + ∞)
2 2
H1 : σ ≠ σ0
H0 : σ2 = σ20
2 2 Wα = (0, χ2 1 - α(n - 1) )
H1 : σ < σ0
H0 : σ2 = σ20
Wα = (χ2 %(n - 1) , + ∞)
H1 : σ2 > σ20
FB: Nhóm học tập XSTK Trang 12
TÀI LIỆU ÔN TẬP XÁC SUẤT THỐNG KÊ BIÊN SOẠN: TRƯƠNG ĐỨC AN
2. Tính tiêu chuẩn kiểm định:
(n – 1)s2
χ2qs =
σ20
3. Quy tắc kiểm định:
χ2qs ∈ Wα thì ta sẽ bác bỏ H0, chấp nhận H1.
χ2qs ∉ Wα thì ta chưa bác bỏ được H0 (chấp nhận H0)

Lưu ý 14:
Đề bài cho mức ý nghĩa α thì đây là dạng toán kiểm định.
Lưu ý 15:
Các bước thực hiện kiện điểm chung:
+ Xác định dạng bài (từ các dữ kiện đề cho)
+ Xác định giả thiết và miền bác bỏ của bài toán
+ Tính tiêu chuẩn kiểm định cho bài toán
+ So sánh tiêu chuẩn kiểm định có rơi vào miền bác bỏ hay không, đưa ra kết luận.
Lưu ý 16:
Khi làm phần kiểm định, chú ý nếu trong câu hỏi có chữ “tỷ lệ” thì thường sẽ là dạng bài kiểm định
tỷ lệ, nếu đề có chữ “trung bình” thì thường sẽ là dạng bài kiểm định trung bình, có chữ “phương sai,
độ lệch chuẩn, độ phân tán, độ chính xác, độ đồng đều” thì thường sẽ là dạng bài là kiểm định
phương sai.
Trong trường hợp đề không có chữ “trung bình”, “tỷ lệ” hay “phương sai” thì ta cần đọc thật kỹ để
xem cần phải thực hiện so sánh trung bình hay so sánh tỷ lệ hoặc so sánh phương sai tổng thể để đưa
ra kết luận cho bài toán.
Nếu ta chỉ cần thực hiện so sánh tỷ lệ tổng thể p với giá trị cho trước gọi là p0 thì bài toán này được
gọi là kiểm định tỷ lệ 1 mẫu (Có nghĩa là dựa vào mẫu thu được, thực hiện kiểm định để so sánh tỷ lệ
tổng thể p với p0 cho trước).
Nếu ta chỉ cần thực hiện so sánh trung bình tổng thể a với giá trị cho trước gọi là a0 thì bài toán này
được gọi là kiểm định trung bình 1 mẫu (Có nghĩa là dựa vào mẫu thu được, thực hiện kiểm định để
so sánh trung bình tổng thể a với a0 cho trước).
Nếu ta chỉ cần thực hiện so sánh phương sai tổng thể σ2 (hay độ lệch chuẩn σ) với giá trị cho trước
gọi là σ20 thì bài toán này được gọi là kiểm định phương sai 1 mẫu (Có nghĩa là dựa vào mẫu thu được,
thực hiện kiểm định để so sánh phương sai tổng thể σ2 với σ20 cho trước).
Lưu ý 17:
Các xác định giả thiết:
Giả thiết H0: luôn cố định ở mọi bài toán (p = p0 hay a = a0 hay σ2 = σ20 ).
Giả thiết H1: Dựa vào yêu cầu đề bài để đưa ra xu hướng kiểm định cho bài toán.

FB: Nhóm học tập XSTK Trang 13


TÀI LIỆU ÔN TẬP XÁC SUẤT THỐNG KÊ BIÊN SOẠN: TRƯƠNG ĐỨC AN
Ví dụ 7: Có ý kiến cho rằng tỷ lệ sinh viên rớt môn học XSTK ở học kỳ 202 là 30%. Hãy kết luận xem
ý kiến trên có đáng tin cậy hay không?
Hướng dẫn: Ta phân tích yêu cầu, và cần thực hiện so sánh tỷ lệ sinh viên rớt môn XSTK ở học kỳ
202 thực tế, kí hiệu là p và so sánh với 1 giá trị đề bài cho trước p0 = 30%. Như vậy đây thuộc dạng
toán kiểm định tỷ lệ 1 mẫu.
Giả thiết H0: p = p0 = 30%
Giả thiết H1: Từ câu hỏi, ta chỉ nhận thấy tác giả chỉ đang quan tâm việc tỷ lệ sinh viên rớt môn học
XSTK thực tế (gọi là p) có bằng với 30% hay là khác 30% thôi. Do đó giả thiết H1 của bài toán là
p ≠ p0 .
Ví dụ 8: Có ý kiến cho rằng tỷ lệ sinh viên rớt môn học XSTK ở học kỳ 202 là 30%. Hãy kết luận xem
tỷ lệ mà ý kiến đưa ra có cao hơn so với thực tế hay không?
Hướng dẫn: Ta phân tích yêu cầu, và cần thực hiện so sánh tỷ lệ sinh viên rớt môn XSTK ở học kỳ
202 thực tế, kí hiệu là p và so sánh với 1 giá trị đề bài cho trước p0 = 30%. Như vậy đây thuộc dạng
toán kiểm định tỷ lệ 1 mẫu.
Giả thiết H0: p = p0 = 30%
Giả thiết H1: Từ câu hỏi, ta nhận thấy tác giả đang muốn biết liệu rằng tỷ lệ ý kiến đưa ra (tức là
30%) có cao hơn so với tỷ lệ tổng thực tế p hay không. Như vậy giả thiết H1 của bài toán là p < p0 (p0
> p, đồng nghĩa với p < p0).
Ví dụ 9: Trước đây, tỷ lệ sản phẩm đạt loại A của nhà máy là 80%. Hãy kết luận xem liệu rằng sau
khi cải tiến kỹ thuật có mang lại hiệu quả cho dây chuyền sản xuất hay không.
Hướng dẫn: Ta phân tích yêu cầu, và cần thực hiện so sánh tỷ lệ sản phẩm loại A sau khi cải tiến của
tổng thể, kí hiệu là p và so sánh với 1 giá trị đề bài cho trước p0 = 80%. Như vậy đây thuộc dạng toán
kiểm định tỷ lệ 1 mẫu.
Giả thiết H0: p = p0 = 80%
Giả thiết H1: Từ câu hỏi, ta nhận thấy tác giả đang muốn biết việc cải tiến có mang lại hiệu quả đối
với dây chuyền sản xuất (tức đang muốn biết sau cải tiến, tỷ lệ sản phẩm loại A có tăng lên hay
không). Như vậy giả thiết H1 của bài toán là p > p0.
Lưu ý 18:
Cách phân biệt các bài kiểm định trung bình: Để xác định chính xác dạng bài, đọc kỹ đề xem đề đã
cho độ lệch chuẩn σ (tổng thể) hay phương sai σ# (tổng thể) hay chưa. Nếu đề cho sẵn độ lệch chuẩn,
phương sai tổng thể, tức là đã biết σ# , đây bài toán trung bình thuộc dạng 1 (theo công thức bên trên).
Nếu đề chưa cho biết độ lệch chuẩn σ hay phương sai σ# tổng thể, tức là chưa biết σ# . Ta xét tiếp xem
kích thước mẫu khi kiểm định là < 30 hay ≥ 30.
Tránh nhầm lẫn giữa việc độ lệch chuẩn (phương sai) của tổng thể hay của mẫu. Nếu chỉ cho bảng số
liệu và đề không nhắc gì tới độ lệch chuẩn (phương sai) thì đây thuộc dạng chưa biết phương sai tổng
thể tức là chưa biết σ# (vì bảng số liệu chỉ cho ta độ lệch chuẩn mẫu hiệu chỉnh hay phương sai mẫu
hiệu chỉnh)

FB: Nhóm học tập XSTK Trang 14


TÀI LIỆU ÔN TẬP XÁC SUẤT THỐNG KÊ BIÊN SOẠN: TRƯƠNG ĐỨC AN
Kiểm định tỷ lệ 2 mẫu:
1. Phát biểu giả thiết và xác định miền bác bỏ tương ứng:
Giả thiết Miền bác bỏ P - value
H0 : p1 = p2
Wα = (- ∞, - Zα ) ∪ (Zα , + ∞) p = 2[1 – Φ(|Zqs |)] (Dùng P)
H1 : p1 ≠ p2
H0 : p1 = p2
Wα = (- ∞, - Z2α ) p = Φ(Zqs ) (Dùng P)
H1 : p1 < p2
H0 : p1 = p2
Wα = (Z2α , + ∞) p = 1 – Φ(Zqs ) (Dùng P)
H1 : p1 > p2
2. Tính tiêu chuẩn kiểm định:
f1 - f2
Zqs =
̅ ̅
Ff(1 - f)
n!
m1 m2 n1 .n2 m1 +m2
Trong đó: f1 = ; f2 = ; n! = ̅
; f =
n1 n2 n1 +n2 n1 +n2
3. Quy tắc kiểm định:
Zqs ∈ Wα thì ta sẽ bác bỏ H0, chấp nhận H1.
Zqs ∉ Wα thì ta chưa bác bỏ được H0 (chấp nhận H0)

Kiểm định trung bình (kỳ vọng) 2 mẫu độc lập, đã biết phương sai σ21 , σ22
1. Phát biểu giả thiết và xác định miền bác bỏ tương ứng:
Giả thiết Miền bác bỏ P - value
H0 : a& = a#
Wα = (- ∞, - Zα ) ∪ (Zα , + ∞) p = 2[1 – Φ(|Zqs |)]
H1 : a& ≠ a#
H0 : a& = a#
Wα = (- ∞, - Z2α ) p = Φ(Zqs )
H1 : a& < a#
H0 : a& = a#
Wα = (Z2α , + ∞) p = 1 – Φ(Zqs )
H1 : a& > a#
2. Tính tiêu chuẩn kiểm định:
x! – y!
Zqs =
σ2 σ2
J 1+ 2
n1 n2
3. Quy tắc kiểm định:
Zqs ∈ Wα thì ta sẽ bác bỏ H0, chấp nhận H1.
Zqs ∉ Wα thì ta chưa bác bỏ được H0 (chấp nhận H0)

FB: Nhóm học tập XSTK Trang 15


TÀI LIỆU ÔN TẬP XÁC SUẤT THỐNG KÊ BIÊN SOẠN: TRƯƠNG ĐỨC AN
Kiểm định trung bình (kỳ vọng) 2 mẫu lớn độc lập, chưa biết phương sai σ21 , σ22 và σ21 ≠ σ22 .
1. Phát biểu giả thiết và xác định miền bác bỏ tương ứng:
Giả thiết Miền bác bỏ P - value
H0 : a& = a#
Wα = (- ∞, - Zα ) ∪ (Zα , + ∞) p = 2[1 – Φ(|Zqs |)]
H1 : a& ≠ a#
H0 : a& = a#
Wα = (- ∞, - Z2α ) p = Φ(Zqs )
H1 : a& < a#
H0 : a& = a#
Wα = (Z2α , + ∞) p = 1 – Φ(Zqs )
H1 : a& > a#
2. Tính tiêu chuẩn kiểm định:
x! – y!
Zqs =
s21 s22
n1 + n2
J

3. Quy tắc kiểm định:


Zqs ∈ Wα thì ta sẽ bác bỏ H0, chấp nhận H1.
Zqs ∉ Wα thì ta chưa bác bỏ được H0 (chấp nhận H0)

Kiểm định trung bình (kỳ vọng) 2 mẫu nhỏ độc lập, chưa biết phương sai σ21 , σ22 và σ21 ≠ σ22 :
1. Phát biểu giả thiết và xác định miền bác bỏ tương ứng:
Giả thiết Miền bác bỏ
H0 : a& = a#
Wα = (- ∞, - t%/2(df) ) ∪ (t%/2(df) , + ∞)
H1 : a& ≠ a#
H0 : a& = a#
Wα = (- ∞, - t%(df) )
H1 : a& < a#
H0 : a& = a#
Wα = (t%(df) ,+ ∞)
H1 : a& > a#
2. Tính tiêu chuẩn kiểm định:
2
x! – y! [(s21 /n1 ) + (s22 /n2 )]
Tqs = với df = 2 2
s2 s22 (s21 /n1 ) (s2 /n )
J 1 + 2 2
n1 + n2 n1 - 1 n2 - 1

3. Quy tắc kiểm định:


Tqs ∈ Wα thì ta sẽ bác bỏ H0, chấp nhận H1.
Tqs ∉ Wα thì ta chưa bác bỏ được H0 (chấp nhận H0)

FB: Nhóm học tập XSTK Trang 16


TÀI LIỆU ÔN TẬP XÁC SUẤT THỐNG KÊ BIÊN SOẠN: TRƯƠNG ĐỨC AN
Kiểm định trung bình (kỳ vọng) 2 mẫu độc lập, chưa biết phương sai σ21 , σ22 và 𝛔𝟐𝟏 = 𝛔𝟐𝟐
(K18 LỚP DT202 – 203 THƯỜNG KHÔNG THI DẠNG NÀY)
1. Phát biểu giả thiết và xác định miền bác bỏ tương ứng:
Giả thiết Miền bác bỏ
H0 : a& = a#
Wα = (- ∞, - t%/2(df) ) ∪ (t%/2(df) , + ∞)
H1 : a& ≠ a#
H0 : a& = a#
Wα = (- ∞, - t%(df) )
H1 : a& < a#
H0 : a& = a#
Wα = (t%(df) ,+ ∞)
H1 : a& > a#
2. Tính tiêu chuẩn kiểm định:
x! – y! (n1 - 1).s21 + (n2 - 1).s22
Tqs = với sp 2 = , df = n1 + n2 - 2
1 1 n1 + n2 - 2
sp Fn + n
1 2
3. Quy tắc kiểm định:
Tqs ∈ Wα thì ta sẽ bác bỏ H0, chấp nhận H1.
Tqs ∉ Wα thì ta chưa bác bỏ được H0 (chấp nhận H0)
Lưu ý 19:
Đối với bài toán so sánh tỷ lệ (hay trung bình) của 2 tổng thể khác nhau (dự trên mẫu từ 2 tổng thể
để thực hiện kiểm định và đưa ra kết luận cho việc so sánh) thì đây là dạng bài kiểm định tỷ lệ (hay
trung bình) 2 mẫu.
Lưu ý 20:
Cách đặt giả thiết giống đối với dạng bài 1 mẫu. Giả thiết H1 là xu hướng kiểm định cho bài toán,
được lấy từ câu hỏi đề bài đưa ra.
Trong trường hợp nếu đều không nêu rõ xu hướng kiểm định cho bài toán. Ví dụ: Hãy so sánh tỷ lệ
sinh viên thi rớt ở 2 học kỳ. Ta sẽ dựa trên số liệu tính toán từ mẫu để đặt giả thiết H1. Ta sẽ tính f1,
f2 là tỷ lệ sinh viên thi rớt trong mẫu. Nếu f1 > f2 thì giả thiết H1 của bài toán là p1 > p2
Ví dụ 10: Dưới đây là kết quả khảo sát chi phí ăn ở mỗi ngày khi du lịch tại Singapore và Malaysia.
Giả sử dữ liệu có phân phối chuẩn.
Quốc gia Kích thước mẫu Trung bình mẫu Độ lệch chuẩn
Singapore n = 15 x! = $102 σ x = $14
Malaysia m = 25 y! = $93 σ y = $9
Hãy so sánh chi phí trung bình ăn ở mỗi khi ngày khi du lịch tại hai quốc gia trên, với mức ý nghĩa
5%.
Hướng dẫn: Trong câu hỏi có chữ “trung bình” nên ta đoán đây là dạng bài kiểm định trung bình. Cần
so sánh trung bình của 2 tổng thể nên đây là kiểm định 2 mẫu. Đề cho trước được độ lệch chuẩn của
2 tổng thể nên đây thuộc bài toán kiểm định trung 2 mẫu đã biết phương sai tổng thể. Câu hỏi đề bài
là “hãy so sánh chi phí trung bình”, chưa nêu rõ xu hướng cần kiểm định. Ta tiến hành dựa vào số
liệu mẫu là x! = $102 > y! = $93 nên giả thiết H1 của bài toán là a1 > a2.

FB: Nhóm học tập XSTK Trang 17
TÀI LIỆU ÔN TẬP XÁC SUẤT THỐNG KÊ BIÊN SOẠN: TRƯƠNG ĐỨC AN
Lưu ý 21:
Đối với dạng bài kiểm định trung bình 2 mẫu chưa biết phương sai, nều đề cho phương sai 2 tổng thể
bằng nhau hoặc phương sai tổng thể đồng nhất thì mới là dạng σ&# = σ## . Nếu đề không nhắc gì tới
phương sai hay độ lệch chuẩn tổng thể thì σ21 ≠ σ22 .
Kiểm định tính độc lập (CHỈ DÀNH RIÊNG CHO K18, K19 KHÔNG THI)
1. Phát biểu giả thiết:
H0 : X, Y độc lập
H1 : X, Y phụ thuộc
2. Miền bác bỏ: (Wα = χ2 α(k - 1).(h - 1) ; + ∞) (h là số giá trị hàng, k là số giá trị cột)
3. Lập bảng tần số thực nghiệm:
Tổng hàng
n11 n12 … n1h n1
… … … … …
nk1 nk2 … nkh nk
Tổng cột m1 m2 … mh ∑ ni = n

4. Tính giá trị quan sát:

2
nij 2
χ qs = N@ - 1O × n
ni .mj
i,j
5. Quy tắc kiểm định:
χ2qs ∈ Wα thì ta sẽ bác bỏ H0, chấp nhận H1.
χ2qs ∉ Wα thì ta chưa bác bỏ được H0 (chấp nhận H0)

Kiểm định Poisson (CHỈ DÀNH RIÊNG CHO K18 DT202, DT203)
1. Phát biểu giả thiết:
H0 : X phù hợp với phân phối Poisson
H1 : X không phù hợp với phân phối Poisson
2. Miền bác bỏ: Wα = (χ2 α(k-2) ; +∞)
3. Kẻ bảng:
2
e-a .ai (ni - n.pi )
i ni pi = (a ≈ x! = … (bấm máy) n.pi
i! n.pi
4. Tính giá trị quan sát:
2
2
(ni - n.pi )
χ qs = @
n.pi
i
5. Quy tắc kiểm định:
χ2qs ∈ Wα thì ta sẽ bác bỏ H0, chấp nhận H1.
χ2qs ∉ Wα thì ta chưa bác bỏ được H0 (chấp nhận H0

FB: Nhóm học tập XSTK Trang 18

You might also like