Download as pdf or txt
Download as pdf or txt
You are on page 1of 24

CHƯƠNG 6

Kiểm định giả thiết


cho tham số một tổng thể

Hồ Phi Tứ

KHOA TOÁN CƠ TIN HỌC


TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

Hồ Phi Tứ CHƯƠNG 6. Ngày 8 tháng 12 năm 2023 1 / 16


6.1 Các Khái niệm mở đầu
Giả thuyết thống kê là giả thuyết về quy luật phân bố xác suất, về
các tham số đặc trưng và về sự độc lập của các biến ngẫu nhiên.

Hồ Phi Tứ CHƯƠNG 6. Ngày 8 tháng 12 năm 2023 2 / 16


6.1 Các Khái niệm mở đầu
Giả thuyết thống kê là giả thuyết về quy luật phân bố xác suất, về
các tham số đặc trưng và về sự độc lập của các biến ngẫu nhiên.
Kiểm định giả thuyết thống kê là việc đưa ra quyết định về tính
thừa nhận hay không thừa nhận giả thuyết thống kê dựa trên thông
tin của một mẫu.

Hồ Phi Tứ CHƯƠNG 6. Ngày 8 tháng 12 năm 2023 2 / 16


6.1 Các Khái niệm mở đầu
Giả thuyết thống kê là giả thuyết về quy luật phân bố xác suất, về
các tham số đặc trưng và về sự độc lập của các biến ngẫu nhiên.
Kiểm định giả thuyết thống kê là việc đưa ra quyết định về tính
thừa nhận hay không thừa nhận giả thuyết thống kê dựa trên thông
tin của một mẫu.
Cặp giả thuyết thống kê gồm hai giả thuyết H0 và H1 , trong đó:
H0 gọi là giả thuyết gốc, là giả thuyết ta đang nghi ngờ, cần
bác bỏ.
H1 gọi là đối thuyết, là giả thuyết khác với giả thuyết gốc.

Hồ Phi Tứ CHƯƠNG 6. Ngày 8 tháng 12 năm 2023 2 / 16


6.1 Các Khái niệm mở đầu
Giả thuyết thống kê là giả thuyết về quy luật phân bố xác suất, về
các tham số đặc trưng và về sự độc lập của các biến ngẫu nhiên.
Kiểm định giả thuyết thống kê là việc đưa ra quyết định về tính
thừa nhận hay không thừa nhận giả thuyết thống kê dựa trên thông
tin của một mẫu.
Cặp giả thuyết thống kê gồm hai giả thuyết H0 và H1 , trong đó:
H0 gọi là giả thuyết gốc, là giả thuyết ta đang nghi ngờ, cần
bác bỏ.
H1 gọi là đối thuyết, là giả thuyết khác với giả thuyết gốc.
Tiêu chuẩn kiểm định là thống kê G được xây dựng từ mẫu
W = (X1 , . . . , Xn ) sao cho G có phân bố hoàn toàn xác định dưới giả
thuyết gốc H0 .

Hồ Phi Tứ CHƯƠNG 6. Ngày 8 tháng 12 năm 2023 2 / 16


6.1 Các Khái niệm mở đầu
Giả thuyết thống kê là giả thuyết về quy luật phân bố xác suất, về
các tham số đặc trưng và về sự độc lập của các biến ngẫu nhiên.
Kiểm định giả thuyết thống kê là việc đưa ra quyết định về tính
thừa nhận hay không thừa nhận giả thuyết thống kê dựa trên thông
tin của một mẫu.
Cặp giả thuyết thống kê gồm hai giả thuyết H0 và H1 , trong đó:
H0 gọi là giả thuyết gốc, là giả thuyết ta đang nghi ngờ, cần
bác bỏ.
H1 gọi là đối thuyết, là giả thuyết khác với giả thuyết gốc.
Tiêu chuẩn kiểm định là thống kê G được xây dựng từ mẫu
W = (X1 , . . . , Xn ) sao cho G có phân bố hoàn toàn xác định dưới giả
thuyết gốc H0 .
Giá trị quan sát của tiêu chuẩn kiểm định tương ứng với giá trị quan
sát của mẫu, kí hiệu: gqs , còn được gọi là giá trị thông tin mẫu.
Hồ Phi Tứ CHƯƠNG 6. Ngày 8 tháng 12 năm 2023 2 / 16
6.1 Khái niệm chung

Miền tiêu chuẩn W (Còn gọi là miền bác bỏ W ) là tập hợp các giá
trị của thông tin mẫu cho phép bác bỏ giả thuyết H0 .

Hồ Phi Tứ CHƯƠNG 6. Ngày 8 tháng 12 năm 2023 3 / 16


6.1 Khái niệm chung

Miền tiêu chuẩn W (Còn gọi là miền bác bỏ W ) là tập hợp các giá
trị của thông tin mẫu cho phép bác bỏ giả thuyết H0 .
Khi tiến hành kiểm định giả thuyết thống kê, ta sẽ mắc hai loại sai
lầm sau:

Hồ Phi Tứ CHƯƠNG 6. Ngày 8 tháng 12 năm 2023 3 / 16


6.1 Khái niệm chung

Miền tiêu chuẩn W (Còn gọi là miền bác bỏ W ) là tập hợp các giá
trị của thông tin mẫu cho phép bác bỏ giả thuyết H0 .
Khi tiến hành kiểm định giả thuyết thống kê, ta sẽ mắc hai loại sai
lầm sau:
+) sai lầm loại I: giả thuyết H0 đúng nhưng ta bác bỏ, xác
suất mắc sai lầm loại I là P(W /H0 ).
+) sai lầm loại II: giả thuyết H0 sai nhưng ta chấp nhận, xác
suất mắc sai lầm loại I là P(W /H1 ).

Hồ Phi Tứ CHƯƠNG 6. Ngày 8 tháng 12 năm 2023 3 / 16


6.1 Khái niệm chung

Nguyên lý của kiểm định:


Trong quá trình kiểm định giả thuyết, ta phải chọn miền tiêu chuẩn
W sao cho cực tiểu được cả hai loại sai lầm trên. Tuy nhiên người ta nhận
thấy rằng nếu giảm xác suất mắc sai lầm loại I thì xác suất mắc sai lầm
loại II lại tăng lên, và ngược lại. Hơn nữa, sai lầm loại II nghiêm trọng hơn
sai lầm loại I nên khi kiểm định, người ta cho phép mắc sai lầm loại I ở
một mức α nào đó, sau đó làm cực tiểu sai lầm loại II. Khi đó, α được gọi
là mức ý nghĩa.

Hồ Phi Tứ CHƯƠNG 6. Ngày 8 tháng 12 năm 2023 4 / 16


6.1 Khái niệm chung

Nguyên lý của kiểm định:


Trong quá trình kiểm định giả thuyết, ta phải chọn miền tiêu chuẩn
W sao cho cực tiểu được cả hai loại sai lầm trên. Tuy nhiên người ta nhận
thấy rằng nếu giảm xác suất mắc sai lầm loại I thì xác suất mắc sai lầm
loại II lại tăng lên, và ngược lại. Hơn nữa, sai lầm loại II nghiêm trọng hơn
sai lầm loại I nên khi kiểm định, người ta cho phép mắc sai lầm loại I ở
một mức α nào đó, sau đó làm cực tiểu sai lầm loại II. Khi đó, α được gọi
là mức ý nghĩa.

Từ đó, miền bác bỏ giả thuyết gốc là W được xác định tương ứng
với mức ý nghĩa α cho trước P(G ∈ W /H0 ) = α. Khi đó W được gọi là
miền chấp nhận giả thuyết, điểm phân chia miền bác bỏ và miền chấp
nhận được gọi là giá trị tới hạn.

Hồ Phi Tứ CHƯƠNG 6. Ngày 8 tháng 12 năm 2023 4 / 16


6.1 Khái niệm chung

Các bước tiến hành:


Bước 1. Viết cặp giả thuyết.
Bước 2. Chọn tiêu chuẩn kiểm định G , từ đó tính giá trị gqs tương
ứng.
Bước 3. Xác định miền bác bỏ W .
Bước 4. Kết luận: nếu gqs ∈ W : bác bỏ giả thuyết H0 , và ngược lại.

Hồ Phi Tứ CHƯƠNG 6. Ngày 8 tháng 12 năm 2023 5 / 16


6.2 Kiểm định giả thiết về giá trị trung bình

Giả sử X ∼ N(µ, σ 2 ), ta cần kiểm định giá trị µ với giả thuyết gốc
H0 : µ = µ0 .

Hồ Phi Tứ CHƯƠNG 6. Ngày 8 tháng 12 năm 2023 6 / 16


6.2 Kiểm định giả thiết về giá trị trung bình

Giả sử X ∼ N(µ, σ 2 ), ta cần kiểm định giá trị µ với giả thuyết gốc
H0 : µ = µ0 .
a. Trường hợp đã biết phương sai σ 2
X − µ0 √ H0
Tiêu chuẩn kiểm định: G = n ∼ N(0, 1).
σ
x − µ0 √
Giá trị quan sát tương ứng là gqs = n.
σ
Miền bác bỏ tương ứng với đối thuyết H1 như sau:

H1 Miền bác bỏ Wα
µ ̸= µ0 (−∞, −uα/2 ) ∪ (uα/2 , +∞)
µ > µ0 (uα , +∞)
µ < µ0 (−∞, −uα )

ở đó uα là giá trị tới hạn chuẩn tắc

Hồ Phi Tứ CHƯƠNG 6. Ngày 8 tháng 12 năm 2023 6 / 16


6.2 Kiểm định giả thiết về giá trị trung bình

Example
Ví dụ 1. Mì chính được đóng gói 453 gam một gói trên máy tự động. Có
thể coi trọng lượng các gói mì chính tuân theo quy luật phân bố chuẩn với
độ lệch chuẩn 36 gam. Kiểm tra ngẫu nhiên 81 gói thấy trọng lượng trung
bình là 448 gam. Với mức ý nghĩa 0,05, có thể kết luận trọng lượng các
gói mì chính có xu hướng bị đóng thiếu không?

Hồ Phi Tứ CHƯƠNG 6. Ngày 8 tháng 12 năm 2023 7 / 16


6.2 Kiểm định giả thiết về giá trị trung bình

Giải. Gọi X là trọng 2


( lượng gói mì chính, X ∼ N(µ, σ ) với σ = 36.
H0 : µ = 453
Cặp giả thuyết:
H1 : µ < 453
Miền bác bỏ Wα = (−∞, −uα ) = (−∞, −u0,05 ) = (−∞, −1, 64).
Có n = 81, x = 448, σ = 36
448 − 453 √
, gqs = 81 = −1, 25 ∈
/ Wα .
36
Vậy chưa đủ cơ sở để bác bỏ H0 , hay: Mì chính không bị đóng thiếu.

Hồ Phi Tứ CHƯƠNG 6. Ngày 8 tháng 12 năm 2023 8 / 16


6.2 Kiểm định giả thiết về giá trị trung bình

b. Trường hợp chưa biết phương sai σ 2


X − µ0 √ H0
Tiêu chuẩn kiểm định: G = n ∼ T (n − 1).
s
x − µ0 √
Giá trị quan sát tương ứng là gqs = n.
s
Khi đó ta có bảng sau thể hiện tương ứng giữa đối thuyết H1 và
miền bác bỏ W :
H1 Miền bác bỏ Wα
(n−1) (n−1)
µ ̸= µ0 (−∞, −tα/2 ) ∪ (tα/2 , +∞)
(n−1)
µ > µ0 (tα , +∞)
(n−1)
µ < µ0 (−∞, −tα )
(n)
ở đó tα là giá trị tới hạn

Hồ Phi Tứ CHƯƠNG 6. Ngày 8 tháng 12 năm 2023 9 / 16


6.2 Kiểm định giả thiết về giá trị trung bình

Chú ý
Như ở Chương 5 đã nói, khi bậc tự do n lớn, ngay cả khi không có giả
thiết phân bố chuẩn của X , người ta đã chỉ ra được rằng thống kê G ở
trên cũng hội tụ theo phân bố về phân bố chuẩn hóa. Vì vậy, trong thực
hành, với n > 30 (không cần giả thiết phân bố chuẩn của X ) ta sẽ tiến
hành kiểm định giá trị trung bình tổng thể E (X ) = µ thông qua bảng sau:

H1 Miền bác bỏ Wα
µ ̸= µ0 (−∞, −uα/2 ) ∪ (uα/2 , +∞)
µ > µ0 (uα , +∞)
µ < µ0 (−∞, −uα )

Hồ Phi Tứ CHƯƠNG 6. Ngày 8 tháng 12 năm 2023 10 / 16


6.2 Kiểm định giả thiết về giá trị trung bình

Example
Ví dụ 2. Năng suất trung bình của một giống cây trồng là 47 tạ/ha. Sau
thời gian dài canh tác, người ta nghi ngờ giống lúa đó bị thoái hóa, năng
suất giảm. Dựa vào mẫu kích thước bằng 25, tìm được năng suất trung
bình là 45,5 tạ/ha và độ lệch chuẩn là 4 tạ/ha. Hãy kết luận về điều nghi
ngờ nói trên với mức ý nghĩa 0,05, cho biết năng suất của giống cây đó là
biến ngẫu nhiên tuân theo quy luật chuẩn.

Hồ Phi Tứ CHƯƠNG 6. Ngày 8 tháng 12 năm 2023 11 / 16


6.2 Kiểm định giả thiết về giá trị trung bình

Giải. Gọi X là năng 2


( suất của giống cây trồng trên, thì X ∼ N(µ, σ ).
H0 : µ = 47
Cặp giả thuyết:
H1 : µ < 47.
Miền bác bỏ
(25−1)
Wα = (−∞, −tα(n−1) ) = (−∞, −t0,05 ) = (−∞, −1, 711).

Có n = 25, x = 45, 5, s = 4 nên


45, 5 − 47 √
gqs = 25 = −1, 875.
4

Vì gqs ∈ Wα nên ta bác bỏ H0 . Kết luận: Năng suất giảm.

Hồ Phi Tứ CHƯƠNG 6. Ngày 8 tháng 12 năm 2023 12 / 16


6.3 Kiểm định giả thiết về tỷ lệ

Giả sử tổng thể có tỷ lệ phần tử mang dấu hiệu A là p, ta cần kiểm


định giả thuyết H0 : p = p0 .
Với một số điều kiện dễ thỏa mãn,
Tiêu chuẩn kiểm định:

f − p0 √ H0
G=p n ≈ N(0, 1),
p0 (1 − p0 )

f − p0 √
Giá trị quan sát là gqs = p n.
p0 (1 − p0 )
Đối thuyết và miền bác bỏ tương ứng là:

Hồ Phi Tứ CHƯƠNG 6. Ngày 8 tháng 12 năm 2023 13 / 16


6.3 Kiểm định giả thiết về tỷ lệ

Example
Ví dụ 3. Lô hàng đủ tiêu chuẩn xuất khẩu nếu tỷ lệ phế phẩm không vượt
quá 3%. Kiểm tra ngẫu nhiên 400 sản phẩm của lô hàng thấy có 14 phế
phẩm. Với mức ý nghĩa 0,05 có cho phép lô hàng xuất khẩu được không?

Hồ Phi Tứ CHƯƠNG 6. Ngày 8 tháng 12 năm 2023 14 / 16


6.3 Kiểm định giả thiết về tỷ lệ

(
H0 : p = 0, 03
Giải. Ta có cặp giả thuyết:
H1 : p > 0, 03.
Miền bác bỏ Wα = (uα , +∞) = (u0,05 , +∞) = (1, 64, +∞).
Với n = 400, f = 14/400, nên

f − 0, 03 √
gqs = p . 400 = 0, 5862 ∈
/ Wα .
0, 03(1 − 0, 03)

Vậy, ta chấp nhận H1 hay lô hàng được phép xuất khẩu.

Hồ Phi Tứ CHƯƠNG 6. Ngày 8 tháng 12 năm 2023 15 / 16


THE END

Hồ Phi Tứ CHƯƠNG 6. Ngày 8 tháng 12 năm 2023 16 / 16

You might also like