Download as pdf or txt
Download as pdf or txt
You are on page 1of 8

Chương 5: KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

TÓM TẮT LÝ THUYẾT

I. Kiểm định dùng một mẫu. (So sánh các tham số với một giá trị cụ thể)

1. Bài toán kiểm định giả thuyết cho kì vọng


Cho X là biến ngẫu nhiên có phân phối chuẩn 𝑋~𝑁(𝜇, 𝜎 2 )
(𝑋1 , 𝑋2 , … , 𝑋𝑛 ) là mẫu ngẫu nhiên của X. Cỡ mẫu n, trung bình mẫu x , phương sai mẫu s 2 .
Bài toán kiểm định: Với mức ý nghĩa 𝛼 cho trước, kiểm định các giả thuyết sau:
Bài toán 1: Giả thuyết 𝐻0 : µ = 𝜇0 . Đối thuyết 𝐻1 : µ ≠ 𝜇0 .
Bài toán 2: Giả thuyết 𝐻0 : µ = 𝜇0 .Đối thuyết 𝐻1 : µ > 𝜇0 .
Bài toán 3: Giả thuyết 𝐻0 : µ = 𝜇0 . Đối thuyết 𝐻1 : µ < 𝜇0 .

a. Trường hợp 1: Phương sai tổng thể 𝜎 2 đã biết.


Cách giải:
- Lập cặp giả thuyết (Thuộc một trong 3 bài toán trên).
𝑋̅ −𝜇0
- Chọn thống kê (tiêu chuẩn kiểm định): 𝑈 = √𝑛
𝜎
- Với mức ý nghĩa α. Ta có miền bác bỏ của từng bài toán:
 
Bài toán 1: W = U ; U  u  . Bài toán 2: W = U ; U  u  .
 2
Bài toán 3: W = U ; U  −u  .
𝑥̅ −𝜇0
- Từ mẫu cụ thể ta tính được giá trị quan sát của tiêu chuẩn kiểm định: 𝑈𝑞𝑠 = √𝑛
𝜎
- So sánh Uqs với Wα để kết luận:
Nếu U qs  W thì bác bỏ giả thuyết H0 thừa nhận đối thuyết H1.
Nếu U qs  W thì chưa có cơ sở để bác bỏ giả thuyết H0 nên thừa nhận giả thuyết H0.

b. Trường hợp 2: Phương sai tổng thể 𝜎 2 chưa biết.


Cách giải:
- Lập cặp giả thuyết (Thuộc một trong 3 bài toán trên).
𝑋̅ −𝜇0
- Chọn thống kê (tiêu chuẩn kiểm định): 𝑇 = √𝑛
𝑠
- Với mức ý nghĩa α. Ta có miền bác bỏ của từng bài toán:
 
Bài toán 1: W = T ; T  t( n −1)  .
 

Bài toán 2: W = T ; T  t( n −1) .
2

 
Bài toán 3: W = T ; T  −t( n −1) .
𝑥̅ −𝜇0
- Từ mẫu cụ thể ta tính được giá trị quan sát của tiêu chuẩn kiểm định: 𝑇𝑞𝑠 = √𝑛
𝑠

1|Cô gửi lớp.


- So sánh Tqs với Wα để kết luận:
Nếu Tqs  W thì bác bỏ giả thuyết H0 thừa nhận đối thuyết H1.
Nếu Tqs  W thì chưa có cơ sở để bác bỏ giả thuyết H0 nên thừa nhận giả thuyết H0.
2. Kiểm định cho xác suất hay tỉ lệ
Bài toán: Giả sử, tỉ lệ cá thể mang đặc tính A trong tổng thể đang quan tâm là p (chưa biết). Khi
quan sát n cá thể trong tổng thể này thì thấy rằng có m cá thể mang đặc tính A→ Tỷ lệ cá thể mang
đặc tính A trong tổng thể là f = m/n. Từ dữ liệu có được và với mức ý nghĩa 𝛼 cho trước, hãy kiểm
định ba bài toán sau:
Bài toán 1: Giả thuyết 𝐻0 : 𝑝 = 𝑝0 ; Đối thuyết 𝐻1 : 𝑝 ≠ 𝑝0
Bài toán 2: Giả thuyết 𝐻0 : 𝑝 = 𝑝0 ; Đối thuyết 𝐻1 : 𝑝 > 𝑝0
Bài toán 3: Giả thuyết 𝐻0 : 𝑝 = 𝑝0 ; Đối thuyết 𝐻1 : 𝑝 < 𝑝0 .

Cách giải:
- Lập cặp giả thuyết (Thuộc một trong 3 bài toán trên).
- Chọn thống kê (tiêu chuẩn kiểm định):
f − p0
U= n
p0 (1 − p0 )
- Với mức ý nghĩa α. Ta có miền bác bỏ của từng bài toán:
 
Bài toán 1: W = U ; U  u  . Bài toán 2: W = U ; U  u  .
 2
Bài toán 3: W = U ; U  −u  .
- Từ mẫu cụ thể ta tính được giá trị quan sát của tiêu chuẩn kiểm định:
f − p0 m
U qs = n , thay f = .
p0 (1 − p0 ) n
- So sánh Uqs với Wα để kết luận:
Nếu U qs  W thì bác bỏ giả thuyết H0 thừa nhận đối thuyết H1.
Nếu U qs  W thì chưa có cơ sở để bác bỏ giả thuyết H0 nên thừa nhận giả thuyết H0.
II. Bài toán so sánh các tham số. (Kiểm định dùng hai mẫu)

1. So sánh hai giá trị trung bình

Cho X và Y là hai biến ngẫu nhiên, (𝑋1 , 𝑋2 , … , 𝑋𝑛 )và (𝑌1 , 𝑌2 , … , 𝑌𝑚 ) là hai mẫu về X và Y.

Bài toán đặt ra như sau: Với mức ý nghĩa 𝛼 cho trước, kiểm định giả thuyết sau:

Bài toán 1: Giả thuyết H 0 :  X = Y ; Đối thuyết H 0 :  X  Y

Bài toán 2: Giả thuyết H 0 :  X = Y ; Đối thuyết H 0 :  X  Y

2|Cô gửi lớp.


Bài toán 3: Giả thuyết H 0 :  X = Y ; Đối thuyết H 0 :  X  Y

Ta giải ba bài toán trên trong các trường hợp sau:

a. Trường hợp 1:

Các biến ngẫu nhiên được giả thiết có phân phối chuẩn và phương sai tổng thể đã biết, tức là
𝑋~𝑁(𝜇𝑋 ; 𝜎𝑋2 ) và 𝑌~𝑁(𝜇𝑌 ; 𝜎𝑌2 ) với 𝜎𝑋2 ; 𝜎𝑌2 đã biết.

Cách giải:

- Lập cặp giả thuyết (Thuộc một trong 3 bài toán trên)
𝑋̅ −𝑌̅
-Tiêu chuẩn (thống kê) kiểm định là: U = 2 2
√𝜎𝑋 +𝜎𝑌
𝑛 𝑚

- Với mức ý nghĩa α. Ta có miền bác bỏ của từng bài toán:

Bài toán 1: W𝛼 = {U; |U|>uα/2 }; Bài toán 2: W𝛼 = {U; U>uα }

Bài toán 3: W𝛼 = {U; U< - uα }

- Từ hai mẫu cụ thể của X và Y ta tính được giá trị quan sát của tiêu chuẩn kiểm định:
𝑥̅ − 𝑦̅
Uqs =
2 2
√𝜎𝑋 + 𝜎𝑌
𝑛 𝑚
- So sánh Uqs với Wα để kết luận:

Nếu Uqs thuộc Wα thì bác bỏ giả thuyết H0 thừa nhận đối thuyết H1.

Nếu Uqs không thuộc Wα thì chưa có cơ sở để bác bỏ giả thuyết H0 nên thừa nhận giả thuyết
H0.

b. Trường hợp 2:

Các biến ngẫu nhiên được giả thiết có phân phối chuẩn và phương sai tổng thể chưa biết, tức
là 𝑋~𝑁(𝜇𝑋 ; 𝜎𝑋2 ) và 𝑌~𝑁(𝜇𝑌 ; 𝜎𝑌2 ) với 𝜎𝑋2 ; 𝜎𝑌2 chưa biết, cỡ mẫu nhỏ, Giả sử 𝜎𝑋2 = 𝜎𝑌2

Cách giải:

- Lập cặp giả thuyết (Thuộc một trong 3 bài toán trên)

3|Cô gửi lớp.


𝑋̅ −𝑌̅
-Tiêu chuẩn (thống kê) kiểm định là: T = 1 1
; trong đó:
𝑆𝑝√ +
𝑛 𝑚

(n − 1) S X 2 + (m − 1) SY 2
Sp =
n+m−2

T có phân phối student với n + m -2 bậc tự do (nếu H0 đúng)

- Với mức ý nghĩa α.Ta có miền bác bỏ của từng bài toán:

 
 ( n + m − 2) 
Bài toán 1: W = T ; T  t




Bài toán 2: W = T ; T  t( n + m − 2) 
2


Bài toán 3: W = T ; T  −t( n + m − 2) 
- Từ hai mẫu cụ thể của X và Y ta tính được giá trị quan sát của tiêu chuẩn kiểm định:
𝑥̅ − 𝑦̅
Tqs =
1 1
𝑠𝑝√ +
𝑛 𝑚

- So sánh Uqs với Wα để kết luận:

Nếu Uqs thuộc Wα thì bác bỏ giả thuyết H0 thừa nhận đối thuyết H1.

Nếu Uqs không thuộc Wα thì chưa có cơ sở để bác bỏ giả thuyết H0 nên thừa nhận giả thuyết
H0.

b. Trường hợp 3:

Các biến ngẫu nhiên được giả thiết có phân phối chuẩn và phương sai tổng thể chưa biết, tức
là 𝑋~𝑁(𝜇𝑋 ; 𝜎𝑋2 ) và 𝑌~𝑁(𝜇𝑌 ; 𝜎𝑌2 ) với 𝜎𝑋2 ; 𝜎𝑌2 chưa biết, cỡ mẫu lớn m > 30 ; n > 30

Cách giải:

- Lập cặp giả thuyết (Thuộc một trong 3 bài toán trên)

-Tiêu chuẩn (thống kê) kiểm định là:

X−Y
T= .
S X 2 SY 2
+
n m

4|Cô gửi lớp.


- Với mức ý nghĩa α.Ta có miền bác bỏ của từng bài toán:

 
Bài toán 1: W = T ; T  u  Bài toán 2: W = T ; T  u 
 2 

Bài toán 3: W = T ; T  −u  .

- Từ hai mẫu cụ thể của X và Y ta tính được giá trị quan sát của tiêu chuẩn kiểm định:

x− y
Tqs = .
2 2
sX s
+ Y
n m

- So sánh Uqs với Wα để kết luận:

Nếu Uqs thuộc Wα thì bác bỏ giả thuyết H0 thừa nhận đối thuyết H1.

Nếu Uqs không thuộc Wα thì chưa có cơ sở để bác bỏ giả thuyết H0 nên thừa nhận giả thuyết
H0.

2. Bài toán so sánh hai tỉ lệ (xác suất)

Giả sử, ta quan tâm tới tỉ lệ cá thể mang đặc tính A nào đó ở hai tổng thể. Trong tổng thể 1, tỉ
lệ cá thể mang đặc tính A là 𝑝1 (chưa biết). Tỉ lệ này ở tổng thể 2 là 𝑝2 (chưa biết). Khi điều tra
𝑛1 cá thể ở tổng thể 1 thấy rằng có 𝑘1 cá thể mang đặc tính A. Điều tra 𝑛2 cá thể ở tổng thể 2
có 𝑘2 cá thế mang đặc tính A.

Bài toán đặt ra: Với mức 𝛼 cho trước, hãy kiểm định giả thuyết:

Bài toán 1: Giả thuyết 𝐻0 : 𝑝1 = 𝑝2 / đối thuyết 𝐻1 : 𝑝1 ≠ 𝑝2 .

Bài toán 2: Giả thuyết 𝐻0 : 𝑝1 = 𝑝2 / đối thuyết 𝐻1 : 𝑝1 > 𝑝2 .

Bài toán 3: Giả thuyết 𝐻0 : 𝑝1 = 𝑝2 / đối thuyết 𝐻1 : 𝑝1 < 𝑝2 .

(Với n1 và n2 đều lớn hơn 30)

Cách giải :

- Lập cặp giả thuyết (Thuộc một trong 3 bài toán trên)
𝑓1 −𝑓2
-Tiêu chuẩn kiểm định là thống kê: U = 1 1
√𝑓 (1−𝑓)(𝑛 +𝑛 )
1 2

5|Cô gửi lớp.


𝑘1 𝑘2
Trong đó: 𝑓1 = ; 𝑓2 =
𝑛1 𝑛2

f là tần suất chung (tần suất bắt gặp cá thể mang đặc tính A ở cả tổng thể 1 và tổng thể 2):
𝑘1 +𝑘2 𝑛1 𝑓1 +𝑛2 𝑓2
𝑓= hay 𝑓 = .
𝑛1 +𝑛2 𝑛1 +𝑛2

Với mức ý nghĩa α. Ta có miền bác bỏ của từng bài toán:

Bài toán 1: W𝛼 = {U ; |U| > uα/2}.

Bài toán 2::W𝛼 = {U ; U > uα}.

Bài toán 3::W𝛼 = {U ; U < -uα}.

-Từ các mẫu cũ thể ta tính được giá trị quan sát của tiêu chuẩn kiểm định:Uqs

- So sánh Uqs với Wα để kết luận:

Nếu Uqs thuộc Wα thì bác bỏ giả thuyết H0 thừa nhận đối thuyết H1.

Nếu Uqs không thuộc Wα thì chưa có cơ sở để bác bỏ giả thuyết H0 nên thừa nhận giả thuyết
H0.

BÀI TẬP:

Bài 1: Một xí nghiệp khai thác than được gọi là hoàn thành kế hoạch nếu năng suất trung bình
của xí nghiệp lớn hơn 600 tấn/ngày. Khi kiểm tra sản lượng khai thác trong 100 ngày thì thấy
rằng năng suất trung bình 620 tấn/ngày. Giả sử, năng suất khai thác than có phân phối chuẩn
với phương sai là 400 tấn. Với mức ý nghĩa 10%, khẳng định xí nghiệp khai thác than hoàn
thành kế hoạch có đúng không?

Bài 2: Đo độ chịu lực X(kg/cm2) của 250 mẫu bê tông ta có kết quả sau:
xi 180-190 190-200 200-210 210-220 220-230 230-240 240-250
mi 12 20 30 58 70 35 25
Biết X là biến ngẫu nhiên có phân phối chuẩn. Với mức ý nghĩa 1% có thể khẳng định độ chịu
lực của các mẫu bê tông là 235kg / cm2 không ?

Bài 3: Mì chính được đóng gói 453 gam trên một máy tự động. Biết rằng trọng lượng các gói mì
chính là biến ngẫu nhiên có phân phối chuẩn với độ lệch chuẩn là 36 gam. Kiểm tra ngẫu nhiên
81 gói ta thấy trọng lượng trung bình là 448 gam. Với mức ý nghĩa 5%, có thể cho rằng trọng
lượng các gói mì chính có xu hướng bị đóng thiếu hay không ?

6|Cô gửi lớp.


Bài 4: Chiều cao của 121 sinh viên trường THPT A được cho ở bảng sau:
Chiều cao (m) 1,40-1,50 1,50-1,55 1,55-1,60 1,60-1,65 1,65-1,70 1,70-1,80
Số sinh viên 7 25 30 31 18 10
Với mức ý nghĩa α = 2%, có thể khẳng định chiều cao trung bình của sinh viên là 1,58 m được
không?

Bài 5: Thông qua một mẫu gồm 100 gia đình người ta thu được kết quả chi tiêu trung bình
hàng tháng của các gia đình đó là 19,5 triệu đồng và độ lệch chuẩn là 2 triệu đồng. Với mức ý
nghĩa 0,05 có thể cho rằng chi tiêu trung bình hàng tháng của các gia đình nhiều hơn 19 triệu
không? Giả thiết mức chi tiêu có phân phối chuẩn.

Bài 6: Một đơn vị cung cấp cây giống khẳng định tỉ lệ cây sống sau khi trồng trong điều kiện
bình thường là 90%. Công ty A mua 500 cây của đơn vị này đem trồng và thấy rằng có 430
cây sống. Với mức ý nghĩa 2%, tuyên bố của đơn vị cung cấp cây giống có đáng tin không?

Bài 7: Tỉnh A báo cáo rằng tỷ lệ học sinh đỗ tốt nghiệp THPT của họ là 95%. Một mẫu ngẫu
nhiên 150 em học sinh được chọn thấy có 142 em đỗ. Với mức ý nghĩa 2% , hãy kiểm định
xem báo cáo của Tỉnh về tỷ lệ học sinh đỗ tốt nghiệp có đúng không?

Bài 8: Lô hàng đủ điều kiện xuất khẩu nếu tỷ lệ phế phẩm không vượt quá 3%. Kiểm tra ngẫu
nhiên 400 sản phẩm của lô hàng này thấy có 14 phế phẩm. Với mức ý nghĩa 0,05 có cho phép
lô hàng xuất khẩu được không?

Bài 9: Tỷ lệ bệnh nhân khỏi bệnh viêm phổi khi điều trị bằng thuốc A là 85%. Thí nghiệm
dùng loại thuốc B để chữa bệnh thì trong số 900 người mắc bệnh viêm phổi có 810 người được
chữa khỏi. Với mức ý nghĩa 5% có thể kết luận thuốc B hiệu quả hơn thuốc A không?

Bài 10: Kiểm tra hàm lượng nicotin trong hai loại thuốc lá A và B ta được kết quả như sau:
loại A: 24; 21; 26; 27; 20; 22; 28 và loại B: 22; 25; 21; 21; 20. (Đơn vị miligam). Với mức ý
nghĩa 5%, có thể khẳng định hàm lượng nicotin trong hai loại thuốc trên là như nhau hay
không? Giả sử, hàm lượng nicotin có phân phối chuẩn.

Bài 11: Sinh viên hai cùng học môn XSTK, Lấy mẫu điều tra kết quả thi hết môn như sau:
Trường A Trường B
Số sinh viên nA = 64 nB =68
Trung bình mẫu x A = 7,32 xB = 7, 42
Độ lệch chuẩn của mẫu sA = 1,09 sB = 1,12
Với mức ý nghĩa 0,02 có thể khẳng định kết quả thi trung bình của trường B cao hơn trường A không?

7|Cô gửi lớp.


Bài 12: Lấy hai mẫu độc lập từ hai tổng thể X và Y có phân phối chuẩn ta được:
𝑛1 = 32; 𝑥̅ = 31,2; 𝑠𝑋2 = 0,84
𝑛2 = 48; 𝑦̅ = 29,2; 𝑠𝑌2 = 0,4
Với mức ý nghĩa 10%, có thể khẳng định giá trị trung bình của biến X và Y là bằng nhau được
không?

Bài 13: Hai máy tự động dùng để cắt những thanh kim loại do cùng một kỹ thuật viên phụ
trách. Chiều dài của các sản phẩm do máy 1 và máy 2 sản xuất ra là biến ngẫu nhiên có phân
phối chuẩn với phương sai lần lượt là σ12 = 1cm và σ22 = 4cm . Từ máy 1 lấy 36 sản phẩm để
kiểm tra và thu được chiều dài trung bình của sản phẩm là 15cm, Từ máy 2 lấy 16 sản phẩm để
kiểm tra và thu được chiều dài trung bình của sản phẩm là 15,5 cm. Với mức ý nghĩa 1% có
thể cho rằng chiều dài của thanh kim loại do máy 1 sản xuất nhỏ hơn máy 2 không.

Bài 14: Để đánh giá một phương pháp điều trị mới, người ta điều trị 46 người theo phương
pháp mới thấy khỏi 38 người, điều trị 45 người theo phương pháp cũ thấy khỏi 31 người. Có
thể coi phương pháp mới đã có tác dụng rõ rệt không? Với ý nghĩa  = 5% .

Bài 15: Trong cụm dân cư A kiểm tra 805 người có 80 người mắc bệnh đau mắt đỏ. Trong
cụm dân cư B kiểm tra 2756 người có 357 người mắc bệnh đau mắt đỏ. Có thể coi tỷ lệ mắc
bệnh đau mắt đỏ ở cả hai cụm dân cư là như nhau không? Với mức ý nghĩa  = 5% .

Bài 16: Để so sánh tỷ lệ sinh viên đi làm thêm của hai trường Đại học A và B, người ta phỏng
vấn ngẫu nhiên 500 sinh viên trường A thấy có 300 em đi làm thêm, phỏng vấn ngẫu nhiên
600 sinh viên trường B thấy có 370 em đi làm thêm. Với mức ý nghĩa 2% có thể khẳng định tỷ
lệ sinh viên đi làm thêm của hai trường Đại học trên là như nhau không?
Bài 17: Để nghiên cứu xem quy mô của công ty có ảnh hưởng đến hiẹu quả quảng cáo đối với
khách hàng hay không, người ta điều tra ý kiến của 356 khách hàng và thu được kết quả:
Hiệu quả quảng cáo Mạnh Vừa phải Yếu
Quy mô công ty
Nhỏ 20 52 32
Vừa 53 47 28
Lớn 67 32 35
Với mức ý nghĩa α = 0,1 có thể cho rằng quy mô của công ty có ảnh hưởng tới hiệu quả của
quảng cáo đối với khách hàng hay không?

8|Cô gửi lớp.

You might also like