Professional Documents
Culture Documents
Chương 7. Lý thuyết kiểm định222
Chương 7. Lý thuyết kiểm định222
Chương 7. Lý thuyết kiểm định222
1. Sai lầm loại 1: Là sai lầm mắc phải nếu ta bác bỏ H trong khi
H đúng. Ta ký hiệu xác suất để mắc sai lầm loại này là và
gọi là mức ý nghĩa.
2. Sai lầm loại 2: Là sai lầm mắc phải nếu ta công nhận H trong
khi H sai. Ta ký hiệu xác suất để mắc sai lầm loại này là
và gọi 1- là lực kiểm định.
Trong các bài toán kiểm định ta sẽ xét sau này mức ý nghĩa
là cho trước. 1
Quy trình kiểm định :
1. Tiêu chuẩn kiểm định : xét mẫu W X 1 , X 2 ,.., X n
Chọn thống kê G G X 1 , X 2 ,.., X n
Điều kiện đặt ra đối với thống kê G là nếu H đúng thì quy luật phân phối xác
suất của G phải hoàn toàn xác định . Thống kê G được gọi là tiêu chuẩn
kiểm định. Thực hiện phép thử G sẽ nhận giá trị thực hành g còn được gọi
là giá trị quan sát hay giá trị kiểm định thống kê .
2. Miền bác bỏ giả thuyết RR : Cho trước , miền bác bỏ RR là miền W thỏa
P(G W / H )
Có vô số miền W như vậy . Trong số đó ta sẽ chọn miền bác bỏ W sao cho
xác suất mắc sai lầm loại hai nhỏ nhất , nghĩa là sao cho
P(G W / H ) 1 max
Các miền bác bỏ được xây dựng sau đây đều thỏa mãn điều kiện nêu trên ! Phần
bù của miền bác bỏ được gọi là miền chấp nhận giả thuyết và ký hiệu là AR .
3. Quy tắc kiểm định ( kết luận ): Nếu giá trị quan sát g thuộc miền bác
bỏ RR thì ta bác bỏ H . Ngược lại nếu g thuộc miền chấp nhận AR thì ta
chấp nhận H .
Chú ý: Ta có quy tắc kiểm định ( kết luận ) sử dụng P-value như sau :
Pvalue g W H
Pvalue g W H
2
Giả thuyết : 0
0 (thiếu-miền bác bỏ bên trái)
Giả thuyết đối lập: 0 (thừa-miền bác bỏ bên phải)
0 ( đối xứng - two tails)
Chú ý: Giả thuyết không H được xây dựng từ lý thuyết ,
không phải là nghi ngờ của đề bài . Giả thuyết đối lập được
suy ra từ ý nghĩa bài toán đặt ra .
Khi làm bài phải nêu rõ các giả thuyết không H và giả
thuyết đối lập là gì , nếu không sẽ bị điểm 0 bài này !
§2: Kiểm định giả thuyết về tỉ lệ
1. Bài toán 1 mẫu:
Bài toán: Ký hiệu tỉ lệ của 1 tổng thể là P(chưa biết). Từ tổng
thể lấy 1 mẫu kích thước n đủ lớn ( n ≥ 30 ), có tỉ lệ mẫu f.
Với mức ý nghĩa hãy kiểm định giả thiết: : 0
3
Giải: H : 0 ( đối xứng-two tails test)
Bước 1: Tra giá trị ngưỡng (critical value ): c
Miền bác bỏ: W (, Z ) ( Z , )
Bước 2: Tính giá trị quan sát hay giá tri kiểm định ( test
value ) :
Z U qs
f 0 n
0 1 0
Bước 2: Tính giá trị quan sát hay giá tri kiểm định ( test
value ) f 0 n
Z U qs
0 1 0
Bước 3: Kết luận: U qs 2 U qs W H dúng P = P0
U qs 2 U qs W H sai P < P0
0 2 P = P0
Miền bác bỏ Miền chấp nhận
Chú ý: Pvalue U U qs (U qs ) U qs z Z 2 H
5
Giải: H : 0 ( right-tailed test)
P = P0 2 0
Miền chấp nhận Miền bác bỏ
Chú ý: Pvalue U U qs (U qs ) U qs z Z 2 H 6
2. Bài toán 2 mẫu
Bài toán: kí hiệu tỉ lệ của tổng thể 1, 2 là 1 , 2 (cả 2 chưa
biết).Từ các tổng thể lấy các mẫu kích thước n1 , n2 đủ lớn,
có tỉ lệ mẫu f1 m1 , f 2 m2 .Với mức ý nghĩa , hãy kiểm
n1 n2
U qs 1 2
1 2
U qs 1 2
1 2 P1 = P2 1 2
f1 f 2 SE.Z p1 p2 f1 f 2 SE.Z
f1 f 2 SE.Z 2 p1 p2
p1 p2 f1 f 2 SE.Z 2
9
Ví dụ 2.1: Nếu áp dụng phương pháp I thì tỉ lệ phế phẩm là
6%, còn nếu áp dụng phương pháp II thì trong 100 sản
phẩm có 5 phế phẩm. Vậy có thể kết luận áp dụng
phương pháp thứ II thì tỉ lệ phế phẩm ít hơn phương
pháp thứ I không? Hãy kết luận với mức ý nghĩa 0,05.
Giải: Ký hiệu 0 0,06 là tỉ lệ phế phẩm của phương pháp I ;
P là tỉ lệ phế phẩm của phương pháp II ( chưa biết)
: 0 0, 06
: 0 0, 06
Với mức ý nghĩa 0.05 , hãy kiểm tra tỷ lệ phế phẩm có phụ
thuộc vào từng nhà máy hay không ?
11
1 - tỷ lệ phế phẩm của nhà máy I
2 - tỷ lệ phế phẩm của nhà máy II
H : 1 2 , H : P1 P2
Bước 1 0, 05 Z 1,96
W (, 1,96) (1,96, )
Bước 2 20 60
Uqs 1200 1400 3,855
20 60 80
1
Bước 3 1200.1400 2600
Bài tập 2:
13
§ 3.Kiểm định giả thiết về giá trị trung bình
1.Bài toán 1 mẫu:
Ký hiệu trung bình của 1 tổng thể là a (chưa
biết).Từ tổng thể lấy 1 mẫu kích thước n có
trung bình mẫu x và phương sai điều chỉnh
mẫu S . Với mức ý nghĩa , hãy kiểm định
2
giả thiết : H : a a0
Chú ý : Sai số chuẩn ( tổng thể ) cho giá trị trung bình là SE n
S
Chú ý : Sai số chuẩn ( mẫu ) cho giá trị trung bình là se
n
Giải:
Ta xét bài toán đối xứng : H : a a0
14
Trường hợp 1: Tổng thể có phân phối chuẩn , đã biết phương sai
tổng thể 2
B1: Tra ngưỡng c Z ( z test ) W (, Z ) ( Z , )
a a0 a a0 a a0
Chú ý: Miền bác bỏ bên trái : W (, Z 2 )
Miền bác bỏ bên phải : W ( Z 2 , )
15
Trường hợp 2: Tổng thể có phân phối chuẩn , chưa
biết phương sai tổng thể 2
n 1
B1. Tra ngưỡng (t test )
x a0 n
T
x a0
B2: Tính giá trị kiểm định Tqs
S se
Tqs T
n 1
B3:Kết luận H dúng : a=a 0
Tqs T
n 1
H sai : a a 0
Tqs T
n 1
a a0
a a0
Tqs T
n 1
a a0
W (, T2
n 1
Chú ý: Miền bác bỏ bên trái : )
Miền bác bỏ bên phải : W (T2 n 1 , )
Chú ý : Lời giải của TH2 này hoàn toàn tương tự TH1 , chỉ
thay σ bằng S và thay Z bằng T n 1 .
16
Trường hợp 3: Tổng thể có phân phối bất kỳ , mẫu lớn .
a) Đã biết phương sai tổng thể
2
17
U qs
xa
0 n
x a0
S se
.Ví dụ 3.1. Trọng lượng (X) của một loại sản phẩm do nhà
máy sản xuất ra là đại lượng ngẫu nhiên có phân phối
chuẩn với độ lệch chuẩn là 1 kg , trọng lượng trung bình
là 50kg. Nghi ngờ máy hoạt động không bình thường
làm thay đổi trọng lượng trung bình của sản phẩm ,
người ta cân thử 100 sản phẩm và thu được kết quả
sau:
Trọng lượng sản 48 49 50 51 52
phẩm(kg)
Số lượng sản phẩm 10 60 20 5 5
Với mức ý nghĩa 0.05,hãy kết luận về nghi ngờ nói trên.
18
. Giải. Ký hiệu a là trọng lượng trung bình của sản phẩm.
Ta kiểm định giả thiết : H : a a0 50
H : a a0 50
Vì 1 nên đây là trường hợp 1
x 49,35
U qs
xa
0 n
49,35 50 100
6,5 Z 0,05 1,96
1
a a0 50
Vậy máy đã hoạt động không bình thường làm giảm trọng
lượng trung bình của sản phẩm.
19
Ví dụ 3.2.
Mức hao phí xăng (X) cho một loại xe ô tô chạy trên đoạn
đường AB là một đại lượng ngẫu nhiên có kỳ vọng là 50
lít. Nay do đường được tu sửa lại, người ta cho rằng hao
phí trung bình đã giảm xuống. Quan sát 36 chuyến xe
chạy trên đường AB ta thu được bảng số liệu sau :
Mức hao phí(lít) 48,5-49,0 49,0-49,5 49,5-50,0 50,0-50,5 50,5-51,0
Số chuyến xe ni 10 11 10 3 2
20
a mức hao phí xăng sau khi sửa lại đường
a0 mức hao phí xăng khi chưa sửa lại đường
H : a a0 50
H : a a0 50
Tổng thể có phân phối bất kỳ , chưa biết và n=36 > 30
nên đây là trường hợp 3b
Z 0,1 1, 645 W (, 1, 645)
x 49, 4167; S 0,573
U qs
xa
0 n
49, 4167 50 36
S 0, 573
6,1 Z 2 Z 0,1 1, 645 a a0
22
. Giải H : a a0 14,5
H : a a0 14,5
a0 14,5 là định mức cũ , a là năng suất trung bình mới
Tổng thể có phân phối chuẩn , chưa biết nên đây là
trường hợp 2
TH 2 T0.05
(24)
t24;0,025 2, 064;
x 15; S 2, 236
Tqs
xa
0 n
15 14,5 25
1,118
S 2, 236
Tqs 1,118 2, 064 a a0
Vậy không nên thay đổi định mức.
23
Bài tập 1:
Bài tập 2: Một công ty tuyên bố rằng độ pH trung bình của nước
sông gần đó là 6.8 . Ta lấy ngẫu nhiên 21 mẫu nước sông và đo
độ pH của chúng . Ta nhận được kết quả : 6.6 7.3 6.7 6.6
6.8 6.9 6.4 6.6 7.1 6.6 6.8 7.0 6.4 6.1 6.7 6.8
6.7 6.2 6.7 6.2 6.8 . Giả sử rằng độ pH của nước sông có
phân phối chuẩn . Ta có thể bác bỏ tuyên bố trên của công ty với
mức ý nghĩa 0.05 hay không ?
24
2. Bài toán 2 mẫu:
Kí hiệu trung bình của tổng thể 1,2 là a1 , a2 (cả hai chưa
biết).Từ các tổng thể lấy các mẫu kích thước n1 , n2 có
trung bình mẫu x1 , x2 và phương sai hiệu chỉnh mẫu S12 , S22
Với mức ý nghĩa ,hãy kiểm định giả thiết:
H : a1 a2
Ta xét bài toán đối xứng :
H : a1 a2
Chú ý : Sai số chuẩn ( tổng thể ) cho hai giá trị trung bình là
12 22
SE
n1 n2
Chú ý : Sai số chuẩn ( mẫu ) cho hai giá trị trung bình là
S12 S22
se
n1 n2
25
Trường hợp 1: Hai mẫu độc lập ,hai tổng thể có phân phối
chuẩn , đã biết các phương sai tổng thể 12 , 2 2
B1: Tra ngưỡng Z
x1 x2 x1 x2
B2: Tính giá trị kiểm định U qs
12 22 SE
n1 n2
Chú ý:
Miền bác bỏ bên trái : W (, Z 2 )
Miền bác bỏ bên phải : W ( Z 2 , )
26
Trường hợp 1: Hai mẫu độc lập ,hai tổng thể có phân phối
chuẩn , đã biết các phương sai tổng thể 12 , 2 2
x 1 x 2 S E .Z a 1 a 2 x 1 x 2 S E .Z
x1 x2 SE.Z 2 a1 a2
a1 a2 x1 x2 SE.Z 2
Chú ý: 12 22
SE
n1 n2
27
Trường hợp 2: Hai mẫu độc lập ,hai tổng thể có phân phối chuẩn ,
chưa biết các phương sai tổng thể 1 , 2
2 2
S1
a) Hai phương sai khác nhau ( khi 0.5, 2 )
S2
2
S 2
S 2
T ,
1n n2
2 2
1 S12
1 2
S2
n1 1 n1 n2 1 n2
Chú ý: Bậc tự do ν được làm tròn theo quy tắc làm tròn thông thường,
nghĩa là nếu phần thập phân của v < 0,5 thì làm tròn xuống ; ngược lại
làm lên.
B2.Tính giá trị kiểm định x1 x2
Tqs
S12 S22
n1 n2
28
Trường hợp 2: Hai mẫu độc lập ,hai tổng thể có phân phối chuẩn ,
chưa biết các phương sai tổng thể 1 , 2
2 2
S1
a) Hai phương sai khác nhau ( khi 0.5, 2 )
S2
Tqs T a1 a2
a1 a 2
Tqs T a1 a2
W (, T2 )
Chú ý: Miền bác bỏ bên trái :
W (T2 , )
Miền bác bỏ bên phải :
2
Ghi chú : Lời giải trường hợp 2a này tương tự trường hợp 1 , thay 1 2, 2
29
Trường hợp 2: Hai mẫu độc lập ,hai tổng thể có phân phối chuẩn ,
chưa biết các phương sai tổng thể 1 , 2
2 2
S1
a) Hai phương sai khác nhau ( khi 0.5, 2 )
S2
x1 x2 se.T a1 a2 x1 x2 se.T
x1 x2 se.T2 a1 a2
a1 a2 x1 x2 se.T2
Chú ý: S² được gọi là phương sai chung , S được gọi là độ lệch chung
W (, T2 1
n n2 2
Miền bác bỏ bên trái : )
W (T2 1
n n2 2
Miền bác bỏ bên phải : , )
31
Trường hợp 2: Hai mẫu độc lập ,hai tổng thể có phân phối chuẩn ,
chưa biết các phương sai tổng thể 1 , 2
2 2
S1
b) Hai phương sai bằng nhau ( khi 0.5, 2 )
S2
x1 x2 se.T 1
n n2 2
a1 a2 x1 x2 se.T 1
n n2 2
x1 x2 se.T2 1
n n2 2
a1 a2
a1 a2 x1 x2 se.T2 1
n n2 2
Chú ý: 1 1
se S .
n1 n2
32
Trường hợp 3: Hai mẫu độc lập , hai tổng thể có phân phối
bất kỳ , mẫu lớn ( n1 và n2 30)
a) Biết hai phương sai tổng thể 1 , 2
2 2
33
Trường hợp 3: Hai mẫu độc lập , hai tổng thể có phân phối
bất kỳ , mẫu lớn ( n1 và n2 30)
b) Không biết hai phương sai tổng thể 1 , 2
2 2
x1 x2
B2: Tính giá trị kiểm định U qs
S12 S 22
n1 n2
B3: Kết luận
U qs H dúng a 1 = a 2
U qs H sai a1 a 2
U qs Z a1 a2
a1 a2
U qs Z a1 a2
Ghi chú : Lời giải trường hợp 3b này tương tự trường hợp 1 , thay 1 ,
2 2
2
bằng S12 , S22 .
Chú ý: Miền bác bỏ bên trái : W (, Z 2 )
Miền bác bỏ bên phải : W ( Z 2 , ) 34
Trường hợp 3: Hai mẫu độc lập , hai tổng thể có phân phối
bất kỳ , mẫu lớn
b) Không biết hai phương sai tổng thể 1 , 2
2 2
x1 x2 se.Z a1 a2 x1 x2 se.Z
x1 x2 se.Z 2 a1 a2
a1 a2 x1 x2 se.Z 2
Chú ý: S12 S22
se
n1 n2
35
Trường hợp 4: Hai mẫu không độc lập ,hai tổng thể có
phân phối chuẩn ( hai mẫu cặp đôi )
Xét hai mẫu kích thước n : X ( X 1 , X 2 ,..., X n ), Y (Y1 , Y2 ,..., Yn )
Đặt D = X - Y
x1 x2 SE.Z 2 a1 a2
a1 a2 x1 x2 SE.Z 2
D
Chú ý: SE
n
37
Trường hợp 4: Hai mẫu không độc lập ,hai tổng thể có
phân phối chuẩn ( hai mẫu cặp đôi )
Xét hai mẫu kích thước n : X ( X 1 , X 2 ,..., X n ), Y (Y1 , Y2 ,..., Yn )
Đặt D = X - Y
x y se.T a1 a2 x y se.T
n n
x y se.T2 a1 a2
n
a1 a2 x y se.T2
n
Chú ý: SD
se
n
39
Trường hợp 5: Hai mẫu không độc lập ,hai tổng thể có
phân bất kỳ , mẫu lớn ( hai mẫu cặp đôi )
Xét hai mẫu kích thước n : X ( X 1 , X 2 ,..., X n ), Y (Y1 , Y2 ,..., Yn ), n 30
Ghi chú : Lời giải trường hợp 5a này giống trường hợp 4a .
Ghi chú : Lời giải trường hợp 5b này giống trường hợp 4b .
40
Ví dụ 3.4: Người ta thí nghiệm 2 phương pháp chăn nuôi gà
khác nhau, sau 1 tháng kết quả tăng trọng như sau:
Với mức ý nghĩa 0.05 có thể kết luận phương pháp II hiệu
quả hơn phương pháp I không , giả thiết rằng mức tăng
trọng là đại lượng ngẫu nhiên có phân phối chuẩn ?
41
Giải: Đây là trường hợp 1 , bên trái
n1 100, n2 150, 1 0, 2, 2 0,3, x1 1, 2, x2 1,3
a1 - Mức tăng trọng trung bình của phương pháp I
a2 - Mức tăng trọng trung bình của phương pháp II
H : a1 a2
H : a1 a2
1, 2 1,3
U qs 3,16 Z 2 Z 0,1 1, 645 a1 a2
0, 04 0, 09
100 150
42
Ví dụ 3.5: Người ta thí nghiệm 2 phương pháp chăn nuôi gà
khác nhau, sau 1 tháng kết quả tăng trọng như sau:
Với mức ý nghĩa 0.05 có thể kết luận phương pháp II hiệu
quả hơn phương pháp I không ?
43
Giải: Đây là trường hợp 3 a) , lời giải hoàn toàn giống
trường hợp 1
Với mức ý nghĩa 0.05 có thể kết luận phương pháp II hiệu
quả hơn phương pháp I không ?
44
Giải: Đây là trường hợp 3 b) , lời giải tương tự trường hợp 1,
chỉ khác công thức tính giá trị kiểm định
x1 x2 1, 2 1,3
U qs 3,16 Z 2 Z 0,1 1, 645 a1 a2
S12 S 22 0, 04 0, 09
n1 n2 100 150
Với mức ý nghĩa 0.05 có thể kết luận phương pháp II hiệu
quả hơn phương pháp I không , giả thiết rằng mức tăng
trọng là đại lượng ngẫu nhiên có phân phối chuẩn ?
45
Giải: Đây là trường hợp 2a),phương sai khác nhau
n1 10; n2 15; S1 0,1; S 2 0, 3;
S1 / S2 1 / 3 0.5, 2 ; x1 1, 2 ; x2 1, 3
H : a1 a2
H : a1 a2
2 2
S12 S 22 0,12 0,32
n1 n2
10 15
18, 2663 18
2 2 2 2 2 2
1 S1 2
1 S2
2
1 0,1 1 0,3
n1 1 n1 n2 1 n2 9 10 14 15
1, 2 1,3
Tqs 1,1952
2 2
0,1 0,3
10 15
Tqs T0,118 1, 7341 a1 a2
Với mức ý nghĩa 0.05 có thể kết luận phương pháp II hiệu
quả hơn phương pháp I không , giả thiết rằng mức tăng
trọng là đại lượng ngẫu nhiên có phân phối chuẩn ?
47
Giải: Đây là trường hợp 2b),phương sai bằng nhau
n1 10; n2 15; S1 0, 2; S2 0, 3;
S1 / S2 2 / 3 0.5, 2 ; x1 1, 2 ; x2 1, 3
H : a1 a2
H : a1 a2
48
Ví dụ 3.9 :
49
Giải: Đây là trường hợp 4 ( hai mẫu cặp đôi )
H : a1 a2
H : a1 a2
d
Tqs 2, 7386
SD / n
Tqs T0,1 2, 015 a1 a2
5
50
Bài tập 1:
Bài tập 2:
51
Bài tập 3:
Bài tập 4:
52
Bài tập 5:
53