Professional Documents
Culture Documents
08 NEU TXTOKT02 Bai7 v1.0014109205
08 NEU TXTOKT02 Bai7 v1.0014109205
08 NEU TXTOKT02 Bai7 v1.0014109205
128 TXTOKT02_Bai7_v1.0014109205
Bài 7: Kiểm định giả thuyết thống kê
Tất cả các câu hỏi trên sẽ hoàn toàn được giải đáp nếu như ta đã thu hoạch toàn
bộ các điểm trồng lúa ở tỉnh đó, đã đi điều tra về tình trạng đói nghèo của tất cả
các hộ gia đình ở quốc gia kia. Nhưng sẽ làm thế nào nếu như chúng ta không
làm được việc đó, vì những hạn chế về nguồn lực con người, tài chính, về thời
gian, về kỹ thuật?
Trong thực tiễn kinh tế xã hội, có những bài toán đặt ra yêu cầu kiểm tra tính đúng sai của một
mệnh đề/một tình huống giả định, khi chưa có đầy đủ thông tin chính xác. Vì các mệnh đề này có
thể đúng hoặc không đúng nên cần kiểm định, để kết luận về tính thừa nhận hay không thừa nhận
được của mệnh đề đó. Khi đó phải thực hiện kiểm tra, kiểm định dựa trên thông tin có từ một
mẫu, bằng những phương pháp thống kê cụ thể. Bài toán kiểm định được áp dụng rất nhiều trong
các công việc nghiên cứu liên quan đến số liệu, kết quả của nó có mặt rộng rãi trong mọi lĩnh
vực, mọi cấp độ, của đời sống kinh tế xã hội.
TXTOKT02_Bai7_v1.0014109205 129
Bài 7: Kiểm định giả thuyết thống kê
130 TXTOKT02_Bai7_v1.0014109205
Bài 7: Kiểm định giả thuyết thống kê
Ở đây 2 là phương sai tổng thể, phương sai của biến ngẫu nhiên X – “Giá 1 ounce
vàng”. Giả thuyết H0 thể hiện điều khẳng định của quan chức là sai, độ dao động của
giá vàng chỉ ở mức 20 USD2, H1 thể hiện điều khẳng định là đúng, độ dao động của
giá vàng đã vượt quá mức 20 USD2.
Ví dụ 7.3. Báo cáo của phòng chăm sóc khách hàng nói rằng tỷ lệ khách không hài
lòng là chưa đến 10%, cặp giả thuyết có dạng:
H 0 : p p0 0,1
H 1 : p p0
Trong đó p là tỷ lệ khách không hài lòng trong tổng thể. Giả thuyết H0 thể hiện báo
cáo của phòng chăm sóc khách hàng là sai, tỷ lệ khách không hài lòng đến 10%, giả
thuyết H1 thể hiện báo cáo là đúng, tỷ lệ khách không hài lòng chưa đến 2%.
Để kiểm tra một giả thuyết là đúng hay không, cần phải kiểm định, chúng ta sử dụng
phương pháp thống kê, dựa trên một mẫu thực nghiệm để kết luận, với phương pháp
suy luận như sau:
Giả sử H0 đúng;
Khi H0 đúng, với một mẫu, biến cố A sẽ xảy ra với xác suất rất nhỏ;
Theo nguyên lý xác suất nhỏ, có thể nói với một phép thử, A sẽ không xảy ra;
Với mẫu cụ thể nếu A xảy ra thì có thể bác bỏ H0, nếu A không xảy ra thì chưa có
cơ sở bác bỏ H0.
TXTOKT02_Bai7_v1.0014109205 131
Bài 7: Kiểm định giả thuyết thống kê
H 0 : 0
H1 : 0
132 TXTOKT02_Bai7_v1.0014109205
Bài 7: Kiểm định giả thuyết thống kê
Trong đó μ0 là một con số được đưa ra trong giả thuyết cần kiểm định. Khi đó sử dụng
thống kê chứa tham số cần kiểm định và có quy luật phân phối xác suất xác định (tiêu
chuẩn kiểm định) như sau:
( X 0 ) n
T
S
Nếu H0 đúng, chứng minh được rằng khi đó xác suất để T t( n/21) là bằng α đủ nhỏ,
như vậy theo nguyên lý xác suất nhỏ, có thể nói biến cố đó không xảy ra khi thực hiện
một phép thử.
Khi thực hiện một phép thử, nghĩa là với số liệu mẫu cụ thể, tính được:
( x 0 ) n
Tqs
s
Nếu Tqs t( n/21) thì tức là biến cố “không xảy ra” đã xảy ra, từ đó cho rằng H0 là sai.
Trình tự thực hiện bài kiểm định như sau:
H : 0
Với cặp giả thuyết: 0
H1 : 0
( X 0 ) n
Tiêu chuẩn kiểm định: T
S
Với mức ý nghĩa α cho trước, miền bác bỏ H0 là:
( x 0 ) n
Giá trị quan sát là: Tqs
s
Nếu Tqs Wα hay Tqs t( n/21) thì bác bỏ H0
Nếu TqsWα hay Tqs < t( n-1) thì chưa bác bỏ H0
Sự khác biệt so với cặp giả thuyết trên là thay vì trị tuyệt đối |T| thì ở đây không có trị
tuyệt đối, và giá trị tới hạn không phải là mức α/2 mà là α: t( n-1) thay cho t( n/-21)
H 0 : 0
Loại cặp giả thuyết
H1 : 0
Miền bác bỏ H0 : W = {T : T < -t( n-1) }
TXTOKT02_Bai7_v1.0014109205 133
Bài 7: Kiểm định giả thuyết thống kê
Nếu TqsWα hay Tqs > -t( n-1) thì chưa bác bỏ H0
Như vậy ở đây sử dụng T không có trị tuyệt đối, và giá trị tới hạn ở mức α và có dấu
âm: -t( n-1) , quy cách bác bỏ cũng khác các cặp giả thuyết trên.
Có thể tóm tắt ba cặp giả thuyết trong bảng sau:
Tiêu chuẩn Cặp giả thuyết Miền bác bỏ H0 Bác bỏ H0 khi
( X 0 ) n H 0 : 0
T
S W T : T t( n/ 21) Tqs t( n/21)
H1 : 0
Giá trị quan sát
( x 0 ) n H 0 : 0
Tqs W T : T t( n 1) Tqs t( n 1)
s H1 : 0
H 0 : 0
W T : T t( n 1) Tqs t( n 1)
H1 : 0
Để đơn giản, từ phần này về sau, các cặp giả thuyết, tiêu chuẩn kiểm định và miền bác
bỏ sẽ được tóm tắt trong các bảng.
Ví dụ 7.4. Xem xét về trọng lượng một loại quả (tính bằng gam), người ta tiến hành
cân thử một số quả lấy ngẫu nhiên, đựợc số liệu cho trong bảng dưới đây.
Trọng lượng (gam) 25 – 27 27 – 29 29 – 31 31 – 33 33 – 35 35 – 37
Số quả tương ứng 3 5 7 5 3 2
Biết rằng trọng lượng quả là đại lượng có phân phối chuẩn.
(a) Tiêu chuẩn đặt ra cho trọng lượng trung bình của quả là 30g. Với mức ý nghĩa 5%,
có thể nói loại quả trên đạt tiêu chuẩn hay không?
(b) Mùa vụ trước trọng lượng trung bình của loại quả này là 29g. Với mức ý nghĩa 5%
có thể nói trọng lượng trung bình đã tăng lên không?
Giải:
Đặt X là trọng lượng của loại quả này, theo giả thiết, X ~ N(μ ; 2), trong đó µ là trọng
lượng trung bình,2 là phương sai của trọng lượng, cả hai đại lượng này đều chưa
biết. Ta có thông tin của một mẫu cụ thể kích thước n = 25.
Với bộ số liệu này, tính các thống kê đặc trưng mẫu được kết quả:
x 30, 48(g) ; s 2 8, 4267(g 2 ) ; s 2,903(g)
(a) Câu hỏi yêu cầu kiểm định xem trọng lượng trung bình có bằng 30 hay không, hay
µ có bằng 30 hay không, với α = 0,05. Cặp giả thuyết là:
H 0 : 30
H 1 : 30
Trong đó giả thuyết H0 nghĩa là loại quả này đạt tiêu chuẩn, H1 là loại quả không
đạt tiêu chuẩn.
134 TXTOKT02_Bai7_v1.0014109205
Bài 7: Kiểm định giả thuyết thống kê
Lưu ý rằng ta không được sử dụng ngay giá trị trung bình mẫu là 30,48 để kết luận
trung bình tổng thể khác 30, vì con số 30,48 chỉ là của một mẫu. Phải thực hiện
kiểm định chi tiết.
( X 0 ) n
Tiêu chuẩn kiểm định T ; miền bác bỏ H0: W T : T t( n/21)
S
( x 0 ) n (30, 48 30) 25
Với mẫu cụ thể trên, Tqs 0,8267
s 2,903
Do đó |Tqs| < 2,064, chưa có cơ sở bác bỏ H0, hay có thể hiểu H0 được coi là đúng,
có thể nói loại quả này đạt tiêu chuẩn.
Như vậy dù trung bình mẫu không bằng 30 nhưng vẫn có thể coi trung bình tổng
thể là bằng 30, vẫn coi quả là đạt tiêu chuẩn. Chính xác hơn là chưa thấy bằng
chứng cho thấy quả không đạt tiêu chuẩn.
(b) Câu hỏi yêu cầu kiểm định xem trọng lượng trung bình có lớn hơn 29 hay không,
với α = 0,05. Cặp giả thuyết là:
H 0 : 29
H 1 : 29
Trong đó giả thuyết H0 nghĩa là trọng lượng trung bình không tăng, H1 là trọng
lượng trung bình có tăng lên
( X 0 ) n
Tiêu chuẩn kiểm định T ; miền bác bỏ H0:
S
W T : T t( n 1)
Với mẫu cụ thể trên,
( x 0 ) n (30, 48 29) 25
Tqs 2,5491
s 2,903
Do đó Tqs > 1,711 bác bỏ H0, có thể nói trọng lượng trung bình đã tăng lên so với
mùa vụ trước.
TXTOKT02_Bai7_v1.0014109205 135
Bài 7: Kiểm định giả thuyết thống kê
Ta thiết lập thủ tục kiểm định dựa trên quy luật phân phối xác suất của thống kê sau:
(n 1) S 2
2 ~ 2 (n 1)
2
Từ đó xây dựng được tiêu chuẩn kiểm định, công thức tính giá trị quan sát ứng với
một mẫu cụ thể kích thước n (phương sai mẫu s2, độ lệch chuẩn mẫu s) và miền bác
bỏ ứng với các cặp giả thuyết như sau:
Tiêu chuẩn Cặp giả thuyết Miền bác bỏ H0 Bác bỏ H0 khi
H 0 : 2 02
W 2 12(n/ 12) qs
2
12(n /21)
2 2(/n21)
(n 1) S 2 H 1 : 2 02
2 hoặc hoặc 2qs 2(/2n 1)
2
0
H 0 : 2 02
Giá trị quan sát
H 1 : 2 02
W 2 2( n 1) 2qs 2( n 1)
(n 1) s 2
qs2 H 0 : 2 02
02
H 1 : 2 02
W 2 12(n 1) qs
2
12(n 1)
Ví dụ 7.5. Với số liệu của ví dụ 7.4 trong phần trên, cân thử 25 quả thấy trọng lượng
trung bình mẫu là 30,48 gam, phương sai mẫu 8,4267 gam2, độ lệch chuẩn mẫu 2,903
gam. Biết trọng lượng quả là đại lượng phân phối chuẩn.
(a) Với mức ý nghĩa 5%, kiểm định ý kiến cho rằng phương sai trọng lượng quả là
bằng 5 gam2. Nếu mức ý nghĩa là 2% thì kết luận có thay đổi không?
(b) Mùa vụ trước trọng lượng quả có độ phân tán bằng 4 gam, với mức ý nghĩa 5% thì
có thể nói mùa vụ này trọng lượng quả đã đồng đều hơn không?
Giải:
Đặt X là trọng lượng của loại quả này, theo giả thiết, X ~ N( , 2), trong 2 là phương
sai, đo độ đồng đều của trọng lượng, là chưa biết. Thông tin có được chỉ là một mẫu
cụ thể kích thước n = 25, ta tính được các thống kê đặc trưng mẫu:
x 30, 48( g ) ; s 2 8, 4267( g 2 ) ; s 2,903( g )
(a) Câu hỏi kiểm định giả thuyết 2 bằng 5, với α = 0,05. Cặp giả thuyết là
H 0 : 2 5
H 1 : 2 5
Trong đó giả thuyết H0 nghĩa là ý kiến đúng, H1 là ý kiến sai.
(n 1) S 2
Tiêu chuẩn kiểm định 2 ;
02
Miền bác bỏ H0: W 2 12(n /21) hoặc 2 2(/2n 1)
Với mẫu cụ thể trên ta tính được:
(n 1) s 2 24 8, 4267
2qs 40, 448
02 5
Ta xác định được các giá trị tới hạn:
12(n / 1)2 0,975
2(24)
12, 4 ; 2(/2n 1) 0,025
2(24)
39,36
136 TXTOKT02_Bai7_v1.0014109205
Bài 7: Kiểm định giả thuyết thống kê
Như vậy bác bỏ H0 khi 2qs < 12,4 hoặc 2qs > 39,36.
Như vậy 2qs > 39,36: bác bỏ giả thuyết H0, ý kiến cho rằng phương sai trọng
lượng bằng 5 gam2 là sai.
Nếu mức ý nghĩa α = 0,02 thì:
12(n / 1)2 0,99
2(24)
10,86 ; 2(/2n 1) 0,01
2(24)
42,98
Khi đó 10,86 < 2qs < 42,98: chưa có cơ sở bác bỏ H0, ý kiến cho rằng phương sai
trọng lượng bằng 5 gam2 là đúng.
(b) Độ đồng đều mùa vụ trước bằng 4 gam, tức là độ lệch chuẩn trọng lượng vụ trước
bằng 4, và phương sai mùa vụ trước là 42 = 16 gam2. Độ đồng đều tăng lên tức là
phương sai của trọng lượng nhỏ hơn so với ở mùa vụ trước. Câu hỏi kiểm định giả
thuyết 2 nhỏ hơn 16, với α = 0,05. Cặp giả thuyết là:
H 0 : 2 16
H 1 : 2 16
(n 1)s 2 24 8, 4267
Với mẫu cụ thể trên ta tính được: qs
2
12, 64
02 16
Do đó 2qs < 14,61: bác bỏ H0, có thể nói ý kiến cho rằng trọng lượng quả đồng
đều hơn mùa vụ trước là đúng.
( f p) n
U ~ N (0;1)
p (1 p )
( f p0 ) n
Nếu p = p0 (giả thuyết H0 đúng) thì U ~ N (0;1)
p0 (1 p0 )
TXTOKT02_Bai7_v1.0014109205 137
Bài 7: Kiểm định giả thuyết thống kê
Dựa trên lý thuyết chung về kiểm định giả thuyết, ta xây dựng được tiêu chuẩn
kiểm định và xác định được miền bác bỏ tương ứng cho các cặp giả thuyết trong bảng
dưới đây:
Tiêu chuẩn Cặp giả thuyết Miền bác bỏ H0 Bác bỏ H0 khi
H 0 : p p 0
W U : U u /2 |Uqs| > u/2
H1 : p p 0
( f p0 ) n H 0 : p p 0
U W U : U u Uqs > u
p0 (1 p0 ) H1 : p p 0
H 0 : p p 0
W U : U u Uqs < –u
H1 : p p 0
Ví dụ 7.6. Tổng điều tra trên một khu vực 5 năm trước cho thấy có 10% dân số ở
độ tuổi trưởng thành không biết chữ. Năm nay điều tra ngẫu nhiên 400 người thì có
22 người ở độ tuổi trưởng thành không biết chữ. Với mức ý nghĩa 5%:
(a) Nhận xét ý kiến cho rằng tỷ lệ mù chữ không giảm đi so với 5 năm trước.
(b) Phải chăng tỷ lệ mù chữ vẫn còn trên 3%?
(c) Có thể cho rằng tỷ lệ mù chữ đã giảm đi còn 5% hay không?
Giải:
Đặt p là tỷ lệ mù chữ của khu vực. Tỷ lệ này 5 năm trước là 10% = 0,1. Với mức ý
nghĩa α = 0,05, ta thực hiện kiểm định các giả thuyết theo yêu cầu đề bài.
(a) Đề bài yêu cầu kiểm định p có nhỏ hơn 0,1 hay không, cặp giả thuyết là:
H 0 : p 0,1 ( f p0 ) n
Tiêu chuẩn U
H 1 : p 0,1 p0 (1 p0 )
Miền bác bỏ W U : U u
k 22
Tỷ lệ mù chữ trong mẫu f 0, 055
n 400
Từ đó ta tính được giá trị quan sát của tiêu chuẩn kiểm định:
(0,055 0,1) 400
U qs 3
0,1(1 0,1)
Với mức ý nghĩa cụ thể: u u0,05 1, 645 W U : U 1, 645
U qs W , bác bỏ H0, chấp nhận H1 . Như vậy có thể nói tỷ lệ mù chữ đã giảm đi, ý
kiến đưa ra ở trên là sai.
(b) Yêu cầu kiểm định p có lớn hơn 0,03 hay không, cặp giả thuyết là:
H 0 : p 0,03 ( f p0 ) n
Tiêu chuẩn U
H 1 : p 0,03 p0 (1 p0 )
Miền bác bỏ W U : U u
138 TXTOKT02_Bai7_v1.0014109205
Bài 7: Kiểm định giả thuyết thống kê
Miền bác bỏ W U : U u /2
(a) Tính trung bình mẫu và độ lệch chuẩn của mẫu này.
(b) Với mức ý nghĩa 5% có thể nói tuổi thọ trung bình của sản phẩm là dưới 400 giờ?
(c) Trước đây độ phân tán của tuổi thọ sản phẩm (đo bằng độ lệch chuẩn) là 25 giờ.
Với mức ý nghĩa 5%, có thể nói độ phân tán của tuổi thọ sản phẩm đã tăng lên?
(d) Phải chăng tỷ lệ sản phẩm tuổi thọ trên 400 giờ là dưới 10%. Kết luận với mức ý
nghĩa 5%.
Giải:
Gọi X là “Tuổi thọ của sản phẩm”. Theo giả thiết X có phân phối chuẩn, X ~ N(µ ; 2)
Trong đó µ là kỳ vọng của X và là tuổi thọ trung bình của sản phẩm; 2 là phương sai,
đo độ phân tán của tuổi thọ sản phẩm. Ở đây cả µ và 2 đều chưa biết.
(a) Từ số liệu của mẫu cụ thể ta tính được:
k k
n = 100, ni xi 37840 ,
i 1
n x
i 1
2
i i 14434800
1 k 37840
x
n i 1
ni xi
100
378, 4
14434800
ms x 2 ( x ) 2 378, 42 1164, 44
100
n 100 1164, 44
s2 ms 1173,172
n 1 99
s s 2 1173,172 34, 2515
Như vậy trung bình mẫu là 378,4 (giờ), độ lệch chuẩn mẫu là 34,2515 (giờ).
TXTOKT02_Bai7_v1.0014109205 139
Bài 7: Kiểm định giả thuyết thống kê
(b) Theo yêu cầu đề bài ta kiểm định xem tuổi thọ trung bình có nhỏ hơn 400 giờ hay
không, với α = 0,05. Cặp giả thuyết là:
H 0 : 400
H 1 : 400
Trong đó giả thuyết H1 thể hiện nhận định ở đề bài là đúng.
( X 0 ) n
Tiêu chuẩn kiểm định T ; miền bác bỏ H0: W T : T t( n 1)
S
( x 0 ) n (3780, 4 400) 100
Với mẫu cụ thể trên, Tqs 6,306
s 34, 2515
Ta xác định giá trị tới hạn:
t( n 1) t0,05
99
u0,05 1, 645 W T : T 1, 645
Do đó Tqs < – 1,645: bác bỏ H0. Như vậy có thể nói tuổi thọ trung bình của sản
phẩm là dưới 400 giờ.
(c) Độ phân tán của tuổi thọ sản phẩm tăng lên tức là phương sai của tuổi thọ sản
phẩm lớn hơn so với trước. Câu hỏi kiểm định giả thuyết 2 lớn hơn 252, với α = 0,05.
Cặp giả thuyết là:
(n 1) s 2 99 1173,172
Với mẫu cụ thể trên ta tính được: qs
2
185,83
02 625
Tìm được giá trị tới hạn: 2( n 1) 0,05
2(99)
124,34 W 2 : 2 124,34
Do đó 2qs > 124,34: bác bỏ H0, có thể nói ý kiến cho rằng tuổi thọ sản phẩm có độ
phân tán tăng hơn trước đây là đúng.
(d) Đặt p là tỷ lệ sản phẩm tuổi thọ trên 400 giờ. Đề bài yêu cầu kiểm định p có nhỏ
hơn 0,1 hay không, cặp giả thuyết là:
H 0 : p 0,1 ( f p0 ) n
Tiêu chuẩn U
H 1 : p 0,1 p0 (1 p0 )
Miền bác bỏ W U : U u
k 8
Tỷ lệ sản phẩm tuổi thọ trên 400 giờ trong mẫu f 0, 08
n 100
Từ đó ta tính được giá trị quan sát của tiêu chuẩn kiểm định:
(0, 08 0,1) 100
U qs 0, 667
0,1(1 0,1)
Với mức ý nghĩa cụ thể: u u0,05 1, 645 W U : U 1, 645
Do đó Uqs > –1,645 chưa đủ cơ sở bác bỏ H0 . Như vậy chưa thể nói tỷ lệ sản phẩm
tuổi thọ trên 400 giờ là dưới 10%.
140 TXTOKT02_Bai7_v1.0014109205
Bài 7: Kiểm định giả thuyết thống kê
TXTOKT02_Bai7_v1.0014109205 141
Bài 7: Kiểm định giả thuyết thống kê
4. Dấu hiệu nào để nhận biết là Bài toán kiểm định µ; 2 hay p.
5. Cách chọn đúng cặp giả thuyết kiểm định trong 3 dạng cặp giả thuyết.
6. Quy trình thực hiện một bài toán kiểm định gồm các bước nào?
142 TXTOKT02_Bai7_v1.0014109205