Professional Documents
Culture Documents
Chuong 7 Kiem Dinh
Chuong 7 Kiem Dinh
Chuong 7 Kiem Dinh
Kiểm định giả thiết thống kê là dựa vào 1 mẫu cụ thể và các quy
tắc để dẫn đến bác bỏ hoặc chấp nhận giả thiết về tổng thể.
Giả thiết thống kê: giả thiết về dạng phân bố xác suất của BNN
gốc của tổng thể, hoặc giả thiết về các tham số đặc trưng cho
BNN gốc đó, ví dụ: giá trị trung bình, tỷ lệ, phương sai…
Bài toán có 2 dấu hiệu nghiên cứu, thì giả thiết thống kê có thể là
giả thiết về sự độc lập của chúng, hoặc so sánh các tham số đặc
trưng của chúng.
𝐻0 : giả thiết cần kiểm định, bảo vệ hoặc nghi ngờ bác bỏ.
𝐻1 : đối thiết, sẽ được chấp nhận khi 𝐻0 bị bác bỏ.
P T W H 0 .
Mặt khác: T
X
0 n
N 0,1
c n c n t 2
Do đó: P T P T c
2 n
X 0 n
Vậy miền bác bỏ: W T t 2
TS. Nguyễn Văn Quang
12/4/2021 6
Đại học Công nghệ - ĐHQGHN
Kiểm định so sánh trung bình với một số
t 2 t 2
T
X n
N 0,1
Mà 𝐻0 đúng nên: T
X
0 n
N 0,1
Miền bác bỏ 𝐻0 : W T
X 0 n
: T t /2
X 0 n
P T W H 0 P t /2
Đây gọi là bài toán kiểm định 2 phía.
TS. Nguyễn Văn Quang
12/4/2021 8
Đại học Công nghệ - ĐHQGHN
Kiểm định so sánh trung bình với một số
Xác định xác suất mắc sai lầm loại 2:
P T W H1 P t 2
X 0 n
t 2
Mà 𝐻1 đúng nên: T
X n
N 0,1
n X 0 n n
Do đó: P t 2 t 2
0 n 0 n
P t 2 T t 2
0 n 0 n
0 t 2 0 t 2
TS. Nguyễn Văn Quang
12/4/2021 9
Đại học Công nghệ - ĐHQGHN
Kiểm định so sánh trung bình với một số
Tương tự, ta có miền bác bỏ 𝐻0 của bài toán kiểm định 1 phía với
đối thiết 𝐻1 : 𝜇 > 𝜇0 hoặc 𝐻1 : 𝜇 < 𝜇0 .
t t
t
x 0 n x 0 n
t
Biết 𝜎
t , t /2 : tra bang t , t /2 : tra bang
x 0 n
t
x 0 n
t
Chưa biết 𝜎 s s
t , t /2 : tra bang t ,n 1 , t /2,n 1 : tra bang
x 0 390 380
t n 50 2.01
35.2
0 t 0.5 0.01 0.49
tra bang
t 2.33
0 n
0.5 0 t 0.5 0 0.68
0.5 0 0.68 0.5 0.2517 0.2483
x 0 49.27 50
t n 25 36.5
0.1
0 t 0.5 0.45
tra bang
t 1.65
x 0 49.4167 50
t n 36
s 0.573
6.1 t
Bác bỏ giả thiết 𝐻0 , mức hao phí xăng trung bình đã giảm.
TS. Nguyễn Văn Quang
12/4/2021 26
Đại học Công nghệ - ĐHQGHN
Kiểm định so sánh trung bình với một số
Định mức để hoàn thành 1 sản phẩm là 14,5 phút. Có nên thay
đổi định mức không, nếu theo dõi thời gian hoàn thành của 25
công nhân, ta có bảng số liệu sau:
Thời gian sản
xuất một sản 10-12 12-14 14-16 16-18 18-20
phẩm (phút)
Số công nhân
2 6 10 4 3
tương ứng 𝑛𝑖
Hãy kết luận với mức ý nghĩa 0.05 biết rằng thời gian hoàn thành
một sản phẩm (X) là ĐLNN có phân bố chuẩn.
Chấp nhận giả thiết 𝐻0 , do đó không nên thay đổi định mức.
TS. Nguyễn Văn Quang
12/4/2021 28
Đại học Công nghệ - ĐHQGHN
Kiểm định so sánh trung bình với một số
Sở điện lực A báo cáo rằng: trung bình 1 hộ hàng tháng phải trả
250 nghìn đồng tiền điện, với độ lệch chuẩn là 20 nghìn. Khảo sát
ngẫu nhiên 500 hộ thì tính được trung bình hàng tháng 1 hộ trả
252 nghìn đồng tiền điện.
Trong kiểm định giả thiết H: “trung bình 1 hộ phải trả hàng tháng
là 250 nghìn đồng tiền điện”, với mức ý nghĩa 𝛼 = 1% hãy cho
biết kết luận?
Nhà giáo dục học B muốn nghiên cứu xem số giờ tự học trung
bình hàng ngày của sinh viên có thay đổi không so với mức 1
giờ/ngày cách đây 10 năm.
Ông B khảo sát ngẫu nhiên 120 SV và tính được trung bình là
0.82 giờ/ngày với 𝑠 = 0.75 giờ/ngày. Với mức ý nghĩa 3% hãy
cho biết kết luận của ông B?
TS. Nguyễn Văn Quang
12/4/2021 29
Đại học Công nghệ - ĐHQGHN
Kiểm định so sánh trung bình với một số
Một công ty cho biết mức lương trung bình của một kỹ sư ở công
ty là 7.5 triệu/tháng, với độ lệch chuẩn là 0.5 triệu/tháng. Kỹ sư A
định xin vào làm ở công ty này và đã thăm dò 18 kỹ sư thì thấy
lương trung bình là 5.45 triệu/tháng.
Kỹ sư A quyết định rằng: nếu mức lương trung bình bằng với
mức công ty đưa ra thì nộp đơn xin làm.
Với mức ý nghĩa 2%, hãy cho biết kết luận của kỹ sư A?
Với mức ý nghĩa 5%, hãy kiểm định lời nói trên?
T
F p n
N 0,1 khi np 5, n(1 p) 5
p(1 p)
Mà 𝐻0 đúng nên: T
F p0 n
N 0,1 ; np0 5, n(1 p0 ) 5
p0 (1 p0 )
F p0 n
P T W H 0 P W
p (1 p )
0 0
TS. Nguyễn Văn Quang
12/4/2021 34
Đại học Công nghệ - ĐHQGHN
Kiểm định so sánh tỷ lệ với một số
• Đối thiết 𝐻1 : 𝑝 ≠ 𝑝0 , miền bác bỏ 𝐻0 :
W T
F p0 n
: T t /2
p (1 p )
0 0
• Đối thiết 𝐻1 : 𝑝 > 𝑝0 , miền bác bỏ 𝐻0 :
W T
F p0 n
: T t
p (1 p )
0 0
• Đối thiết 𝐻1 : 𝑝 < 𝑝0 , miền bác bỏ 𝐻0 :
W T
F p0 n
: T t
p (1 p )
0 0
TS. Nguyễn Văn Quang
12/4/2021 35
Đại học Công nghệ - ĐHQGHN
Kiểm định so sánh tỷ lệ với một số
1 tra bang
0 t /2 t /2
Từ mức ý nghĩa 𝛼: 2
0 t 0.5
tra bang
t
m
Từ mẫu cụ thể, tính tỷ lệ (tần suất) mẫu: f
n
t
f p0 n
Tính giá trị quan sát:
p0 (1 p0 )
So sánh 𝑡 với giá trị tới hạn 𝑡𝛼 hoặc 𝑡𝛼/2 và kết luận.
TS. Nguyễn Văn Quang
12/4/2021 36
Đại học Công nghệ - ĐHQGHN
Kiểm định so sánh tỷ lệ với một số
• Đối thiết 𝐻1 : 𝑝 ≠ 𝑝0
Bác bỏ 𝐻0 khi: t t /2
Chấp nhận giả thiết 𝐻0 khi: ngược lại
t
f p0 n
0.0833 0.08 156
0.152
Giá trị quan sát:
p0 (1 p0 ) 0.08 0.92
t
f p0 n
0.54 0.7 1000
11.04
p0 (1 p0 ) 0.7 0.3
t
f p0 n
0.16 0.4 800
13.871
p0 (1 p0 ) 0.4 (1 0.4)
t
f p0 n
0.944 0.98 500
5.75
p0 1 p0 0.98 0.02
t
f p0 n
0.05 0.06 100
0.42
p0 1 p0 0.06 0.94
t
f p0 n
0.462 0.45 2000
1.08
p0 1 p0 0.45 0.55
Khảo sát ngẫu nhiên 400 SV về mức độ nghiêm túc trong giờ học
thì thấy 13 SV thừa nhận có ngủ trong giờ học. Trong kiểm định
giả thiết H: “có 2% SV ngủ trong giờ học”, mức ý nghĩa tối đa là
bao nhiêu để H được chấp nhận?
T
X 1
X 2 1 2
N 0,1
2
2
1
2
n1 n2
• Giả thiết 𝐻0 : 𝜇1 = 𝜇2
X1 X 2
Mà 𝐻0 đúng nên: T N 0,1
n1 n2
2
1
2
2
X1 X 2
P T W H 0 P W
2 n 2 n
1 1 2 2
TS. Nguyễn Văn Quang
12/4/2021 51
Đại học Công nghệ - ĐHQGHN
So sánh 2 trung bình của 2 tổng thể X, Y
• Đối thiết 𝐻1 : 𝜇1 ≠ 𝜇2 , miền bác bỏ 𝐻0 :
X1 X 2
W T : T t /2
2
n 2
n
1 1 2 2
• Đối thiết 𝐻1 : 𝜇1 > 𝜇2 , miền bác bỏ 𝐻0 :
X1 X 2
W T : T t
2
n 2
n
1 1 2 2
• Đối thiết 𝐻1 : 𝜇1 < 𝜇2 , miền bác bỏ 𝐻0 :
X1 X 2
W T : T t
2
n 2
n
1 1 2 2
TS. Nguyễn Văn Quang
12/4/2021 52
Đại học Công nghệ - ĐHQGHN
𝑛1 < 30, 𝑋1 ~𝑁 𝜇1 , 𝜎12
Cỡ mẫu 𝑛1 ≥ 30, 𝑛2 ≥ 30
𝑛2 < 30, 𝑋2 ~𝑁(𝜇2 , 𝜎22 )
x1 x2 x1 x2
t t
12 22 12 22
Biết 𝜎12 , 𝜎22
n1 n2 n1 n2
t , t /2 : tra bang t , t /2 : tra bang
x1 x2 x1 x2
t t
Chưa biết 2 2 s2 s2
𝜎12 , 𝜎22
s s
1
2
n1 n2 n1 n2
𝜎12 = 𝜎22 n1 n2 2 n1 n2 2
t , t /2 : tra bang t , t /2 : tra bang
Chú ý: Vì giới hạn của bảng tra cho trong SGK nên nếu:
n1 n2 2 30 thì ta lấy tn1/2 n2 2 t /2
TS. Nguyễn Văn Quang
12/4/2021 53
Đại học Công nghệ - ĐHQGHN
So sánh 2 trung bình của 2 tổng thể X, Y
Trong đó: s 2 1
n 1 s1
2
n2 1 s 2
2
gọi là phương sai gộp.
n1 n2 2
n1 2
x1 x1
2
s
2
n1 1
1
n2 2
x2 x2
2
s
2
n2 1
2
Với số liệu mẫu cụ thể, ta tính giá trị quan sát 𝑡, rồi so sánh với
n1 n2 2 n1 n2 2
giá trị tới hạn t , t /2 , t , t /2 và kết luận:
Sau khi cải tiến kỹ thuật, ta lại thắp thử 100 bóng và có số liệu:
Tuổi thọ Y (giờ) 1150 1160 1170 1180 1190 1200
Số bóng 10 15 20 30 15 10
Giả sử X và Y đều tuân theo luật phân bố chuẩn. Hãy kiểm định
giả thiết EX=EY với đối thiết EX<EY, 𝛼 = 0.05.
TS. Nguyễn Văn Quang
12/4/2021 56
Đại học Công nghệ - ĐHQGHN
So sánh 2 trung bình của 2 tổng thể X, Y
Tính giá trị quan sát t:
x1 x2 1111.4 1175.5
t 15.991
2 2
s1 s2 1402.04 204.75
n1 n2 100 100
t 1.65
x1 x2101.2 66.39
t 14.4549
s12 s22 571.7 29.72
n1 n2 100 361
t t : Bác bỏ giả thiết H0, chấp nhận đối thiết H1. Do đó, cân
nặng trung bình của trái cây ở nông trường I lớn hơn ở
nông trường II.
1.2 1.3
Tính các giá trị: t 3.16 , t 1.65
0.04 0.09
100 150
t t : Bác bỏ giả thiết H0, chấp nhận đối thiết H1. Do đó,
phương pháp II hiệu quả hơn phương pháp I.
TS. Nguyễn Văn Quang
12/4/2021 61
Đại học Công nghệ - ĐHQGHN
So sánh 2 trung bình của 2 tổng thể X, Y
Ví dụ: Tương tự ví dụ trên nhưng thay bảng số liệu sau:
n1 10; n2 15; s1 0.2; s2 0.3
x1 1.2; x2 1.3
T
F1 F2 p1 p2 N 0,1 khi n1 30, n2 30
p1 (1 p1 ) p2 (1 p2 )
n1 n2
F1 F2
Mà 𝐻0 đúng nên: T N 0,1 ; n1 , n2 30
1 1
p 1 p
n1 n2
TS. Nguyễn Văn Quang
12/4/2021 63
Đại học Công nghệ - ĐHQGHN
So sánh 2 tỷ lệ của 2 tổng thể X, Y
F1 F2
P T W H 0 P W
p 1 p 1 n1 1 n2
Thông thường p chưa biết, nên được thay bằng ước lượng trung
bình cộng của nó là:
n1 f1 n2 f 2
f
n1 n2
F1 F2
Tiêu chuẩn kiểm định: T
1 1
f 1 f
n1 n2
TS. Nguyễn Văn Quang
12/4/2021 64
Đại học Công nghệ - ĐHQGHN
So sánh 2 tỷ lệ của 2 tổng thể X, Y
• Đối thiết 𝐻1 : 𝑝1 ≠ 𝑝2 , miền bác bỏ 𝐻0 :
F1 F2
W T : T t /2
f 1 f 1 n 1 n
1 2
• Đối thiết 𝐻1 : 𝑝1 > 𝑝2 , miền bác bỏ 𝐻0 :
F1 F2
W T : T t
f 1 f 1 n 1 n
1 2
• Đối thiết 𝐻1 : 𝑝1 < 𝑝2 , miền bác bỏ 𝐻0 :
F1 F2
W T : T t
f 1 f 1 n 1 n
1 2
TS. Nguyễn Văn Quang
12/4/2021 65
Đại học Công nghệ - ĐHQGHN
So sánh 2 tỷ lệ của 2 tổng thể X, Y
1 tra bang
0 t /2 t /2
Từ mức ý nghĩa 𝛼: 2
0 t 0.5
tra bang
t
Từ mẫu cụ thể, tính tỷ lệ (tần suất) mẫu:
m1 m2 m1 m2
f1 , f 2 , f
n1 n2 n1 n2
f1 f 2
Tính giá trị quan sát: t
1 1
f 1 f
n1 n2
So sánh 𝑡 với giá trị tới hạn 𝑡𝛼 hoặc 𝑡𝛼/2 và kết luận.
TS. Nguyễn Văn Quang
12/4/2021 66
Đại học Công nghệ - ĐHQGHN
So sánh 2 tỷ lệ của 2 tổng thể X, Y
• Đối thiết 𝐻1 : 𝑝1 ≠ 𝑝2
Bác bỏ 𝐻0 khi: t t /2
Chấp nhận giả thiết 𝐻0 khi: ngược lại
f1 f 2 0.2 0.3
t 1.695
1 1 1 1
f (1 f ) 0.255 0.745
n1 n2 100 120
1
0 t /2 0.495
tra bang
t /2 2.58
2
t t : Bác bỏ giả thiết H0. Do đó, tỷ lệ phế phẩm của nhà
máy I thấp hơn nhà máy II.