Testing

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 139

KIỂM ĐỊNH GIẢ THUYẾT

THỐNG KÊ
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
• Kiểm định giả thuyết thống kê
• Kiểm định giả thuyết cho trung bình tổng thể
• Kiểm định giả thuyết cho phương sai tổng thể
• Kiểm định giả thuyết cho tần số tổng thể
• Kiểm định giả thuyết về hiệu hai trung bình tổng thể
• Kiểm định giả thuyết phương sai hai tổng thể
• Kiểm định giả thuyết tần suất hai tổng thể
1. Kiểm định giả thuyết thống kê
• Xác định giả thuyết gốc (giả thuyết) và giả thuyết đối (đối thuyết).
• Giải thích sai lầm loại I và sai lầm loại II
• Kết luận trong việc làm kiểm định
• Giả thuyết là một nhận định liên quan tới đặc trưng của một hay nhiều
tổng thể.
• Trong chương này, ta sẽ tập trung nghiên cứu về giả thuyết liên quan
tới một hoặc hai tham số của tổng thể.
Ví dụ:
• Năm 2008, 62% người Mỹ trưởng thành thường xuyên tình nguyện
dành thời gian của họ cho công việc từ thiện. Một nhà nghiên cứu tin
rằng tỷ lệ phần trăm này ngày nay đã khác.
• Theo một nghiên cứu được công bố vào tháng 3 năm 2006, thời lượng
trung bình của một cuộc gọi điện thoại di động là 3,25 phút. Một nhà
nghiên cứu tin rằng thời lượng trung bình của một cuộc gọi đã tăng lên
kể từ đó.
• Sử dụng quy trình sản xuất cũ, độ lệch tiêu chuẩn của lượng rượu được
cho vào chai là 0,23 ounce. Với thiết bị mới, giám đốc kiểm tra chất
lượng tin rằng độ lệch tiêu chuẩn đã giảm xuống.
• Kiểm định giả thuyết là một phương pháp dựa trên bằng chứng mẫu và
xác suất, sử dụng để kiểm tra các nhận định liên quan đến một đặc tính
của một hoặc nhiều quần thể.
Những bước thực hiện kiểm định
1. Một nhận định được đưa ra liên quan đến đặc trưng của quần thể.
2. Bằng chứng (dữ liệu mẫu) được thu thập để kiểm tra nhận định.
3. Dữ liệu được phân tích để đánh giá mức độ hợp lý của nhận định.
• Giả thuyết gốc, ký hiệu là 𝐻𝐻0 , là một phát biểu cần được kiểm tra. Giả
thuyết gốc là một nhận định không thay đổi, không ảnh hưởng hoặc
không có sự khác biệt. Giả thuyết gốc được giả định là đúng cho đến
khi bằng chứng chỉ ra khác.
• Giả thuyết đối, được ký hiệu là 𝐻𝐻1 , là một phát biểu mà đang cố gắng
tìm bằng chứng để chứng minh nó là đúng.
Thiết lập cặp giả thuyết
• Cặp giả thuyết thống kê về tham số 𝜃𝜃 có thể quy về ba dạng sau:
𝐻𝐻0 : 𝜃𝜃 = 𝜃𝜃0
• Kiểm định hai phía: �
𝐻𝐻0 : 𝜃𝜃 ≠ 𝜃𝜃0
𝐻𝐻0 : 𝜃𝜃 = 𝜃𝜃0
• Kiểm định phía trái: �
𝐻𝐻0 : 𝜃𝜃 < 𝜃𝜃0
𝐻𝐻0 : 𝜃𝜃 = 𝜃𝜃0
• Kiểm định phía phải: �
𝐻𝐻0 : 𝜃𝜃 > 𝜃𝜃0
Ví dụ: Đối với mỗi phát biểu sau, hãy xác định giả thuyết gốc
và giả thuyết đối. Kiểm định ở mỗi câu là kiểm định hai phía,
phía trái hay phía phải.
• Năm 2008, 62% người Mỹ trưởng thành thường xuyên tình nguyện dành
thời gian của họ cho công việc từ thiện. Một nhà nghiên cứu tin rằng tỷ
lệ phần trăm này ngày nay đã khác.
• Theo một nghiên cứu được công bố vào tháng 3 năm 2006, thời lượng
trung bình của một cuộc gọi điện thoại di động là 3,25 phút. Một nhà
nghiên cứu tin rằng thời lượng trung bình của một cuộc gọi đã tăng lên
kể từ đó.
• Sử dụng quy trình sản xuất cũ, độ lệch chuẩn của lượng rượu được cho
vào chai là 0,23 ounce. Với thiết bị mới, giám đốc kiểm tra chất lượng
tin rằng độ lệch chuẩn đã giảm xuống.
Ví dụ: Đối với mỗi phát biểu sau, hãy xác định giả thuyết gốc
và giả thuyết đối. Kiểm định ở mỗi câu là kiểm định hai phía,
phía trái hay phía phải.
• Năm 2008, 62% người Mỹ trưởng thành thường xuyên tình nguyện dành
thời gian của họ cho công việc từ thiện. Một nhà nghiên cứu tin rằng tỷ
lệ phần trăm này ngày nay đã khác.

𝐻𝐻0 : 𝑝𝑝 = 0.62

𝐻𝐻0 : 𝑝𝑝 ≠ 0.62
⇒ kiểm định hai phía
Ví dụ: Đối với mỗi phát biểu sau, hãy xác định giả thuyết gốc
và giả thuyết đối. Kiểm định ở mỗi câu là kiểm định hai phía,
phía trái hay phía phải.
• Theo một nghiên cứu được công bố vào tháng 3 năm 2006, thời lượng
trung bình của một cuộc gọi điện thoại di động là 3.25 phút. Một nhà
nghiên cứu tin rằng thời lượng trung bình của một cuộc gọi đã tăng lên
kể từ đó.

𝐻𝐻0 : 𝜇𝜇 = 3.25

𝐻𝐻0 : 𝜇𝜇 > 3.25
⇒ kiểm định phía phải
Ví dụ: Đối với mỗi phát biểu sau, hãy xác định giả thuyết gốc
và giả thuyết đối. Kiểm định ở mỗi câu là kiểm định hai phía,
phía trái hay phía phải.
• Sử dụng quy trình sản xuất cũ, độ lệch chuẩn của lượng rượu được cho
vào chai là 0.23 ounce. Với thiết bị mới, giám đốc kiểm tra chất lượng
tin rằng độ lệch chuẩn đã giảm xuống.

𝐻𝐻0 : 𝜎𝜎 = 0.23

𝐻𝐻0 : 𝜎𝜎 < 0.23
⇒ kiểm định phía trái
Sai lầm loại I và sai lầm loại II

Quyết định
Không bác bỏ 𝐻𝐻0 Bác bỏ 𝐻𝐻0
Thực tế

𝐻𝐻0 đúng ĐÚNG SAI LẦM LOẠI I

𝐻𝐻0 sai SAI LẦM LOẠI II ĐÚNG


Ví dụ: Giải thích ý nghĩa của sai lầm loại I và sai lầm loại II.

• Năm 2008, 62% người Mỹ trưởng thành thường xuyên tình nguyện dành
thời gian của họ cho công việc từ thiện. Một nhà nghiên cứu tin rằng tỷ
lệ phần trăm này ngày nay đã khác.
• Theo một nghiên cứu được công bố vào tháng 3 năm 2006, thời lượng
trung bình của một cuộc gọi điện thoại di động là 3.25 phút. Một nhà
nghiên cứu tin rằng thời lượng trung bình của một cuộc gọi đã tăng lên
kể từ đó.
• Sử dụng quy trình sản xuất cũ, độ lệch chuẩn của lượng rượu được cho
vào chai là 0.23 ounce. Với thiết bị mới, giám đốc kiểm tra chất lượng
tin rằng độ lệch chuẩn đã giảm xuống.
Ví dụ: Giải thích ý nghĩa của sai lầm loại I và sai lầm loại II.

• Năm 2008, 62% người Mỹ trưởng thành thường xuyên tình nguyện dành
thời gian của họ cho công việc từ thiện. Một nhà nghiên cứu tin rằng tỷ
lệ phần trăm này ngày nay đã khác.
Sai lầm loại I: Nhà nghiên cứu kết luận rằng 𝑝𝑝 ≠ 0.62 khi tỷ lệ thực sự
của người Mỹ từ 18 tuổi trở lên tham gia vào một số hình thức làm việc
từ thiện là 62%.
Sai lầm loại II: Bằng chứng mẫu khiến nhà nghiên cứu tin rằng tỷ lệ
hiện tại của người Mỹ từ 18 tuổi trở lên tham gia một số hình thức làm
từ thiện vẫn là 62% trong khi trên thực tế, tỷ lệ này khác với 62%.
Ví dụ: Giải thích ý nghĩa của sai lầm loại I và sai lầm loại II.

• Theo một nghiên cứu được công bố vào tháng 3 năm 2006, thời lượng
trung bình của một cuộc gọi điện thoại di động là 3.25 phút. Một nhà
nghiên cứu tin rằng thời lượng trung bình của một cuộc gọi đã tăng lên
kể từ đó.
Sai lầm loại I: Bằng chứng mẫu khiến nhà nghiên cứu kết luận rằng 𝜇𝜇 >
3.25 nhưng thời lượng cuộc gọi trung bình thực tế trên điện thoại di
động vẫn là 3.25 phút.
Sai lầm loại II: Bằng chứng mẫu khiến nhà nghiên cứu không bác bỏ giả
thuyết rằng thời lượng trung bình của một cuộc gọi điện thoại di động là
3.25 phút trong khi thực tế, nó dài hơn 3.25 phút.
Ví dụ: Giải thích ý nghĩa của sai lầm loại I và sai lầm loại II.

• Sử dụng quy trình sản xuất cũ, độ lệch chuẩn của lượng rượu được cho
vào chai là 0.23 ounce. Với thiết bị mới, giám đốc kiểm tra chất lượng
tin rằng độ lệch chuẩn đã giảm xuống.
Sai lầm loại I: Bằng chứng mẫu khiến giám đốc kết luận rằng 𝜎𝜎 < 0.23
nhưng trong thực tế, thời lượng cuộc gọi trung bình thực tế trên điện
thoại di động vẫn là 3.25 phút.
Sai lầm loại II: Bằng chứng mẫu khiến giám đốc không bác bỏ giả
thuyết rằng độ lệch chuẩn của loại rượu này khi được đóng vào chai là
0.23 ounce trong khi thực tế, nó đã giảm xuống dưới 0.23 ounce.
Sai lầm loại I và sai lầm loại II
Quyết định
Không bác bỏ 𝐻𝐻0 Bác bỏ 𝐻𝐻0
Thực tế
𝐻𝐻0 đúng ĐÚNG SAI LẦM LOẠI I

𝐻𝐻0 sai SAI LẦM LOẠI II ĐÚNG

𝛼𝛼 = P(Sai lầm loại I) = P(Bác bỏ 𝐻𝐻0 khi 𝐻𝐻0 đúng)


𝛽𝛽 = P(Sai lầm loại II) = P(Không bác bỏ 𝐻𝐻0 khi 𝐻𝐻1 đúng)
Sai lầm loại I và sai lầm loại II
Quyết định
Không bác bỏ 𝐻𝐻0 Bác bỏ 𝐻𝐻0
Thực tế
𝐻𝐻0 đúng ĐÚNG SAI LẦM LOẠI I

𝐻𝐻0 sai SAI LẦM LOẠI II ĐÚNG

• Khi xác suất sai lầm loại I tăng lên thì xác suất sai lầm loại II lại giảm đi
và ngược lại.
• Ta muốn xác suất sai lầm phải càng nhỏ càng tốt, ta nên chọn kiểm soát
sai lầm nào?
Sai lầm loại I và sai lầm loại II
• Xác suất của sai lầm loại I (𝛼𝛼) được đưa ra bởi các nhà nghiên cứu trước
khi thực hiện lấy mẫu.
• Xác suất của sai lầm loại I (𝛼𝛼) còn được gọi là mức ý nghĩa.
Kết luận khi làm bài kiểm định
• Không bao giờ được kết luận “chấp nhận” giả thuyết 𝐻𝐻0 bởi vì ta không
toàn bộ thông tin của tổng thể và cũng không biết giá trị chính xác của
tham số được đề cập trong giả thuyết 𝐻𝐻0 . Ta nên nói “không bác bỏ giả
thuyết 𝐻𝐻0 ”. Điều này cũng giống như trong tòa án, ta không bao giờ
tuyên bố bị cáo “vô tội” mà nên nói rằng bị cáo “không có tội”.
Ví dụ: Nêu kết luận trong từng tình huống

• Theo một nghiên cứu được công bố vào tháng 3 năm 2006, thời lượng
trung bình của một cuộc gọi điện thoại di động là 3.25 phút. Một nhà
nghiên cứu tin rằng thời lượng trung bình của một cuộc gọi đã tăng lên
kể từ đó.
a. Giả sử bằng chứng mẫu chỉ ra rằng giả thuyết 𝐻𝐻0 nên bác bỏ.
b. Giả sử bằng chứng mẫu chỉ ra rằng giả thuyết 𝐻𝐻0 không nên bác bỏ.
Ví dụ: Nêu kết luận trong từng tình huống

• Theo một nghiên cứu được công bố vào tháng 3 năm 2006, thời lượng
trung bình của một cuộc gọi điện thoại di động là 3.25 phút. Một nhà
nghiên cứu tin rằng thời lượng trung bình của một cuộc gọi đã tăng lên
kể từ đó.
a. Giả sử bằng chứng mẫu chỉ ra rằng giả thuyết 𝐻𝐻0 nên bác bỏ.
b. Giả sử bằng chứng mẫu chỉ ra rằng giả thuyết 𝐻𝐻0 không nên bác bỏ.
Giải
a. Giả thuyết đối là thời lượng cuộc gọi trung bình lớn hơn 3.25 phút. Vì
giả thuyết 𝐻𝐻0 : 𝜇𝜇 = 3.25 bị bác bỏ nên ta kết luận rằng có đủ bằng chứng
để kết luận rằng thời lượng trung bình của một cuộc gọi trên điện thoại di
động lớn hơn 3.25 phút.
Ví dụ: Nêu kết luận trong từng tình huống

• Theo một nghiên cứu được công bố vào tháng 3 năm 2006, thời lượng
trung bình của một cuộc gọi điện thoại di động là 3.25 phút. Một nhà
nghiên cứu tin rằng thời lượng trung bình của một cuộc gọi đã tăng lên
kể từ đó.
a. Giả sử bằng chứng mẫu chỉ ra rằng giả thuyết 𝐻𝐻0 nên bác bỏ.
b. Giả sử bằng chứng mẫu chỉ ra rằng giả thuyết 𝐻𝐻0 không nên bác bỏ.
Giải
b. Vì không bác bỏ giả thuyết 𝐻𝐻0 : 𝜇𝜇 = 3.25, ta kết luận rằng không có đủ
bằng chứng để kết luận rằng thời lượng trung bình của một cuộc điện
thoại trên điện thoại di động lớn hơn 3.25 phút. Nói cách khác, bằng
chứng mẫu phù hợp với thời lượng cuộc gọi trung bình là 3.25 phút.
2. Kiểm định giả thuyết trung bình tổng thể
• Trường hợp biết phương sai tổng thể (𝜎𝜎 2 )
• Trường hợp không biết phương sai tổng thể (𝜎𝜎 2 )
Trường hợp biết phương sai tổng thể 2
(𝜎𝜎 )
• Kiểm định giả thuyết về trung bình tổng thể khi biết phương sai tổng
thể (𝜎𝜎 2 ) bằng phương pháp cổ điển.
• Kiểm định giả thuyết về trung bình tổng thể khi biết phương sai tổng
thể (𝜎𝜎 2 ) bằng phương pháp sử dụng p-value.
• Kiểm định giả thuyết về trung bình tổng thể khi biết phương sai tổng
thể (𝜎𝜎 2 ) bằng phương pháp sử dụng khoảng tin cậy.
• Để kiểm định cho trung bình tổng thể khi phương sai tổng thể đã biết
phải thoả mãn hai yêu cầu:
Xác định được mẫu ngẫu nhiên.
Tổng thể: phân phối chuẩn hoặc là có cỡ mẫu lớn (𝑛𝑛 ≥ 30).
𝜎𝜎
• Khi đó, 𝑥𝑥~𝑁𝑁(𝜇𝜇,
̅ )
𝑛𝑛
Kiểm định giả thuyết về trung bình tổng thể khi biết phương sai tổng thể
(𝜎𝜎 2 ) bằng phương pháp cổ điển.

• Bước 1: Xác định giả thuyết gốc và đối thuyết. (𝝁𝝁𝟎𝟎 : giá trị trung
bình tổng thể)
𝐻𝐻0 : 𝜇𝜇 = 𝜇𝜇0 𝐻𝐻0 : 𝜇𝜇 = 𝜇𝜇0 𝐻𝐻0 : 𝜇𝜇 = 𝜇𝜇0
� � �
𝐻𝐻1 : 𝜇𝜇 ≠ 𝜇𝜇0 𝐻𝐻1 : 𝜇𝜇 < 𝜇𝜇0 𝐻𝐻1 : 𝜇𝜇 > 𝜇𝜇0
(hai đuôi) (đuôi trái) (đuôi phải)
• Bước 2: Xác định mức ý nghĩa hay khả năng cho phép mắc sai lầm
loại I (𝜶𝜶) (level of significance).
• Bước 3: Tính tiêu chuẩn kiểm định (Z) (test statistic)
𝑥𝑥̅ − 𝜇𝜇0
𝑧𝑧0 = 𝜎𝜎
𝑛𝑛
Kiểm định giả thuyết về trung bình tổng thể khi biết phương sai tổng thể
(𝜎𝜎 2 ) bằng phương pháp cổ điển.

• Bước 4: Xác định giá trị tới hạn hoặc giá trị kiểm định (critical
value): Vùng giới hạn hay vùng bác bỏ là tập hợp tất cả các giá trị bác
bỏ 𝐻𝐻0 .
Kiểm định giả thuyết về trung bình tổng thể khi biết phương sai tổng thể
(𝜎𝜎 2 ) bằng phương pháp cổ điển.

• Bước 5: So sánh giá trị kiểm định với tiêu chuẩn kiểm định:
Hai đuôi: Bác bỏ 𝐻𝐻0 nếu 𝑧𝑧0 < −𝑧𝑧𝛼𝛼/2 hoặc 𝑧𝑧0 > 𝑧𝑧𝛼𝛼/2
Đuôi trái: Bác bỏ 𝐻𝐻0 nếu 𝑧𝑧0 < −𝑧𝑧𝛼𝛼
Đuôi phải: Bác bỏ 𝐻𝐻0 nếu 𝑧𝑧0 > −𝑧𝑧𝛼𝛼
• Bước 6: Kết luận.
Ví dụ:
• Yêu cầu đặt ra đối với sản phẩm của một chiếc máy chế tạo sản phẩm có trọng
lượng trung bình của tất cả các sản phẩm là 100g, nặng hay nhẹ hơn đều không
đạt. Biết rằng sản phẩm do máy sản xuất ra có trọng lượng là biến ngẫu nhiên có
phân phối chuẩn và phương sai (tổng thể) là 1.44 𝑔𝑔𝑟𝑟 2 . Một người kiểm tra thứ
nhất lấy thử 16 sản phẩm ra để cân, thì thấy tổng trọng lượng của 16 sản phẩm này
là 1612 gr.
a. Kiểm định xem sản phẩm sản xuất ra có đạt yêu cầu hay không, với mức ý nghĩa
(hay khả năng cho phép mắc sai lầm loại I) là 5%.
b. Nếu mức ý nghĩa giảm xuống còn 1% thì kết luận trong câu hỏi trên có thay đổi
hay không?
c. Nếu người đó lấy thêm 9 sản phẩm nữa bỏ thêm vào 16 sản phẩm kia nữa để
kiểm tra và tổng trọng lượng của 25 sản phẩm bằng 2510 gr, khi đó kết luận cho
câu a có thay đổi không?
Giải
1 1
a. 𝜇𝜇0 = 100, 𝛼𝛼 = 0.05, 𝜎𝜎 = 1.2, 𝑛𝑛 = 16, 𝑥𝑥̅ = ∑16
𝑖𝑖=1 𝑋𝑋𝑖𝑖 = × 1612 = 100.75
16 16
𝐻𝐻0 : 𝜇𝜇 = 100
• Bước 1: Xác định cặp giả thuyết.: �
𝐻𝐻1 : 𝜇𝜇 ≠ 100
• Bước 2: Xác định mức ý nghĩa 𝛼𝛼 = 0.05
• Bước 3: Tính tiêu chuẩn kiểm định:
𝑥𝑥̅ − 𝜇𝜇0 100.75 − 100
𝑧𝑧0 = 𝜎𝜎 = = 2.5
1.2/ 16
𝑛𝑛
• Bước 4: Xác định giá trị kiểm định:
Do kiểm định này là hai đuôi nên 𝑧𝑧𝛼𝛼/2 = 𝑧𝑧0.05/2 = 𝑧𝑧0.025 = 1.96
• Bước 5: So sánh: 𝑧𝑧0 > 𝑧𝑧𝛼𝛼/2 ⇒ bác bỏ 𝐻𝐻0 , chấp nhận 𝐻𝐻1 .
• Bước 6: Có đủ bằng chứng để kết luận rằng sản phẩm sản xuất ra không đạt yêu
cầu.
Giải
1 1
b. 𝜇𝜇0 = 100, 𝛼𝛼 = 0.01, 𝜎𝜎 = 1.2, 𝑛𝑛 = 16, 𝑥𝑥̅ = ∑16
𝑖𝑖=1 𝑋𝑋𝑖𝑖 = × 1612 = 100.75
16 16
𝐻𝐻0 : 𝜇𝜇 = 100
• Bước 1: Xác định cặp giả thuyết.: �
𝐻𝐻1 : 𝜇𝜇 ≠ 100
• Bước 2: Xác định mức ý nghĩa 𝛼𝛼 = 0.01
• Bước 3: Tính tiêu chuẩn kiểm định:
𝑥𝑥̅ − 𝜇𝜇0 100.75 − 100
𝑧𝑧0 = 𝜎𝜎 = = 2.5
1.2/ 16
𝑛𝑛
• Bước 4: Xác định giá trị kiểm định:
Do kiểm định này là hai đuôi nên 𝑧𝑧𝛼𝛼/2 = 𝑧𝑧0.01/2 = 𝑧𝑧0.005 = 2.576
• Bước 5: So sánh: 𝑧𝑧0 < 𝑧𝑧𝛼𝛼/2 ⇒ không bác bỏ 𝐻𝐻0 .
• Bước 6: Không có đủ bằng chứng để kết luận rằng sản phẩm sản xuất ra không đạt
yêu cầu. (Bằng chứng mẫu phù hợp với kết luận sản phẩm đạt yêu cầu).
Giải
c. 𝜇𝜇0 = 100, 𝛼𝛼 = 0.05, 𝜎𝜎 = 1.2, 𝑛𝑛′ = 16 + 9 = 25,
� 1 25 1
𝑥𝑥′ = ∑ 𝑋𝑋𝑖𝑖 = × 2510 = 100.4
𝑖𝑖=1
25 25
𝐻𝐻0 : 𝜇𝜇 = 100
• Bước 1: Xác định cặp giả thuyết.: �
𝐻𝐻1 : 𝜇𝜇 ≠ 100
• Bước 2: Xác định mức ý nghĩa 𝛼𝛼 = 0.01
̅ 0
𝑥𝑥−𝜇𝜇 100.4−100
• Bước 3: Tính tiêu chuẩn kiểm định: 𝑧𝑧0 = 𝜎𝜎 = = 1.667
1.2/ 25
𝑛𝑛

• Bước 4: Xác định giá trị kiểm định:


Do kiểm định này là hai đuôi nên 𝑧𝑧𝛼𝛼/2 = 𝑧𝑧0.05/2 = 𝑧𝑧0.025 = 1.96
• Bước 5: So sánh: 𝑧𝑧0 < 𝑧𝑧𝛼𝛼/2 ⇒ không bác bỏ 𝐻𝐻0 .
• Bước 6: Không có đủ bằng chứng để kết luận rằng sản phẩm sản xuất ra không đạt
yêu cầu. (Bằng chứng mẫu phù hợp với kết luận sản phẩm đạt yêu cầu). Như vậy,
kết luận có thay đổi so với trường hợp chỉ kiểm tra 16 sản phẩm.
Kiểm định giả thuyết về trung bình tổng thể khi biết phương sai tổng thể
(𝜎𝜎 2 ) bằng phương pháp sử dụng p-value.

• P-value đây là trị giá xác suất và là một đại lượng giúp các nhà khoa học
hay các chuyên gia quyết định giả thuyết của họ đúng hay sai.
Kiểm định giả thuyết về trung bình tổng thể khi biết phương sai tổng thể
(𝜎𝜎 2 ) bằng phương pháp sử dụng p-value.

• Bước 1: Xác định giả thuyết gốc và đối thuyết. (𝝁𝝁𝟎𝟎 : giá trị trung
bình tổng thể)
𝐻𝐻0 : 𝜇𝜇 = 𝜇𝜇0 𝐻𝐻0 : 𝜇𝜇 = 𝜇𝜇0 𝐻𝐻0 : 𝜇𝜇 = 𝜇𝜇0
� � �
𝐻𝐻1 : 𝜇𝜇 ≠ 𝜇𝜇0 𝐻𝐻1 : 𝜇𝜇 < 𝜇𝜇0 𝐻𝐻1 : 𝜇𝜇 > 𝜇𝜇0
(hai đuôi) (đuôi trái) (đuôi phải)
• Bước 2: Xác định mức ý nghĩa hay khả năng cho phép mắc sai lầm
loại I (𝜶𝜶) (level of significance).
• Bước 3: Tính tiêu chuẩn kiểm định (Z) (test statistic)
𝑥𝑥̅ − 𝜇𝜇0
𝑧𝑧0 = 𝜎𝜎
𝑛𝑛
Kiểm định giả thuyết về trung bình tổng thể khi biết phương sai tổng thể
(𝜎𝜎 2 ) bằng phương pháp sử dụng p-value.

• Bước 4: Xác định giá trị p-value


Kiểm định giả thuyết về trung bình tổng thể khi biết phương sai tổng thể
(𝜎𝜎 2 ) bằng phương pháp sử dụng p-value.

• Bước 5: So sánh giá trị kiểm định với tiêu chuẩn kiểm định:
Bác bỏ 𝐻𝐻0 nếu 𝑝𝑝 − 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 < 𝛼𝛼.
• Bước 6: Kết luận.
Ví dụ:
• Khối lượng của một cổ phiếu là số lượng cổ phiếu được giao dịch trong một
ngày. Khối lượng trung bình của cổ phiếu Apple trong năm 2007 là 35.14
triệu cổ phiếu với độ lệch chuẩn là 15.07 triệu cổ phiếu. Một nhà phân tích
chứng khoán tin rằng khối lượng cổ phiếu Apple đã tăng lên. Anh ta chọn
ngẫu nhiên 40 ngày giao dịch trong năm 2008 và xác định khối lượng trung
bình mẫu là 41.06 triệu cổ phiếu. Kiểm tra tuyên bố của nhà phân tích ở mức
ý nghĩa 𝛼𝛼 = 0.1 bằng cách sử dụng p-value.
Giải
𝜇𝜇0 = 35.14, 𝛼𝛼 = 0.1, 𝜎𝜎 = 15.07, 𝑛𝑛 = 40, 𝑥𝑥̅ = 41.06
𝐻𝐻0 : 𝜇𝜇 = 35.14
• Bước 1: Xác định cặp giả thuyết.: �
𝐻𝐻1 : 𝜇𝜇 > 35.14
• Bước 2: Xác định mức ý nghĩa 𝛼𝛼 = 0.1
• Bước 3: Tính tiêu chuẩn kiểm định:
𝑥𝑥̅ − 𝜇𝜇0 41.06 − 35.14
𝑧𝑧0 = 𝜎𝜎 = = 2.484
15.07/ 40
𝑛𝑛
• Bước 4: Xác định p-value:
Do kiểm định này là đuôi phải nên
𝑝𝑝 − 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 = 𝑃𝑃 𝑍𝑍 > 𝑧𝑧0 = 𝑃𝑃 𝑍𝑍 > 2.484 = 0.006
• Bước 5: So sánh: 𝑝𝑝 − 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 < 𝛼𝛼 ⇒ bác bỏ 𝐻𝐻0 , chấp nhận 𝐻𝐻1 .
• Bước 6: Có đủ bằng chứng để kết luận rằng khối lượng cổ phiếu Apple đã tăng
lên.
Ví dụ:
Một lon 7-Up có thể tích là 355ml. Một kỹ sư kiểm tra chất lượng lo lắng
rằng máy chiết rót đã được hiệu chuẩn sai. Nói cách khác, cô ấy muốn đảm bảo
rằng máy đổ quá ít hoặc quá đầy vào các lon. Cô tiến hành chọn ngẫu nhiên 9
lon 7-Up và đo thể tích của nó. Trung bình thể tích của 9 lon cô nhận được là
356.7ml. Sử dụng phương pháp p-value, với mức ý nghĩa 5%, hãy kiểm tra nhận
định của cô kỹ sư là đúng hay sai. Biết rằng thể tích của lon 7-Up tuân theo phân
phối chuẩn và độ lệch chuẩn là 3.2ml.
Giải
𝜇𝜇0 = 355, 𝛼𝛼 = 0.05, 𝜎𝜎 = 3.2, 𝑛𝑛 = 9, 𝑥𝑥̅ = 356.7
𝐻𝐻0 : 𝜇𝜇 = 355
• Bước 1: Xác định cặp giả thuyết.: �
𝐻𝐻1 : 𝜇𝜇 ≠ 355
• Bước 2: Xác định mức ý nghĩa 𝛼𝛼 = 0.05
• Bước 3: Tính tiêu chuẩn kiểm định:
𝑥𝑥̅ − 𝜇𝜇0 356.7 − 355
𝑧𝑧0 = 𝜎𝜎 = = 1.594
3.2/ 9
𝑛𝑛
• Bước 4: Xác định p-value:
Do kiểm định này là hai đuôi nên
𝑝𝑝 − 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 = 2𝑃𝑃 𝑍𝑍 > 𝑧𝑧0 = 2𝑃𝑃 𝑍𝑍 > 2.484 = 0.111
• Bước 5: So sánh: 𝑝𝑝 − 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 > 𝛼𝛼 ⇒ không bác bỏ 𝐻𝐻0
• Bước 6: Không có đủ bằng chứng để kết luận rằng máy chiết rót hiệu chỉnh sai.
Kiểm định giả thuyết về trung bình tổng thể khi biết phương sai tổng thể
(𝜎𝜎 2 ) bằng phương pháp sử dụng p-value.

• Một ưu điểm của việc sử dụng p-value so với cách tiếp cận cổ điển trong
kiểm định giả thuyết là p-value cung cấp thông tin liên quan đến độ
mạnh của bằng chứng. Một cách khác, quy tắc dựa trên p-value để bác
bỏ 𝐻𝐻0 là giống nhau ở ba cách kiểm định. P-value càng thấp thì bằng
chứng chống lại giả thuyết 𝐻𝐻0 càng mạnh.
Kiểm định giả thuyết về trung bình tổng thể khi biết phương sai tổng thể
(𝜎𝜎 2 ) bằng phương pháp sử dụng khoảng tin cậy.

𝐻𝐻0 : 𝜇𝜇 = 𝜇𝜇0
• Khi kiểm định với cặp giả thuyết � , nếu khoảng tin cậy
𝐻𝐻1 : 𝜇𝜇 ≠ 𝜇𝜇0
1 − 𝛼𝛼 . 100% chứa giá trị 𝜇𝜇0 , khi đó không bác bỏ giả thuyết gốc.
• Ngược lại, nếu khoảng tin cậy 1 − 𝛼𝛼 . 100% không chứa giá trị 𝜇𝜇0 , khi
đó ta có đủ bằng chứng để ủng hộ đối thuyết.
Ví dụ:
Một lon 7-Up có thể tích là 355ml. Một kỹ sư kiểm tra chất lượng lo lắng
rằng máy chiết rót đã được hiệu chuẩn sai. Nói cách khác, cô ấy muốn đảm bảo
rằng máy đổ quá ít hoặc quá đầy vào các lon. Cô tiến hành chọn ngẫu nhiên 9
lon 7-Up và đo thể tích của nó. Trung bình thể tích của 9 lon cô nhận được là
356.7ml. Sử dụng phương pháp khoảng tin cậy, với mức ý nghĩa 5%, hãy kiểm
tra nhận định của cô kỹ sư là đúng hay sai. Biết rằng thể tích của lon 7-Up tuân
theo phân phối chuẩn và độ lệch chuẩn là 3.2ml.
Giải
𝜇𝜇0 = 355, 𝛼𝛼 = 0.05, 𝜎𝜎 = 3.2, 𝑛𝑛 = 9, 𝑥𝑥̅ = 356.7
𝐻𝐻0 : 𝜇𝜇 = 355
• Bước 1: Xác định cặp giả thuyết.: �
𝐻𝐻1 : 𝜇𝜇 ≠ 355
• Bước 2: Xác định mức ý nghĩa 𝛼𝛼 = 0.05
• Bước 3: Xây dựng khoảng tin cậy 95%: 𝑧𝑧𝛼𝛼 = z0.05/2 = z0.025 = 1.96
𝜎𝜎 𝜎𝜎 2
𝑥𝑥̅ − 𝑧𝑧𝛼𝛼 < 𝜇𝜇 < 𝑥𝑥̅ + 𝑧𝑧𝛼𝛼 ⟺ 354.58 < 𝜇𝜇 < 358.76
2 𝑛𝑛 2 𝑛𝑛
• Bước 4: Vì 𝜇𝜇0 thuộc khoảng tin cậy 95% ⇒ không bác bỏ 𝐻𝐻0
• Bước 5: Không có đủ bằng chứng để kết luận rằng máy chiết rót hiệu chỉnh sai.
Trường hợp biết chưa phương sai tổng thể
2)
(𝜎𝜎
• Kiểm định giả thuyết về trung bình tổng thể khi chưa biết phương sai
tổng thể (𝜎𝜎 2 ) bằng phương pháp cổ điển.
• Kiểm định giả thuyết về trung bình tổng thể khi chưa biết phương sai
tổng thể (𝜎𝜎 2 ) bằng phương pháp sử dụng p-value.
• Kiểm định giả thuyết về trung bình tổng thể khi chưa biết phương sai
tổng thể (𝜎𝜎 2 ) bằng phương pháp sử dụng khoảng tin cậy.
• Để kiểm định cho trung bình tổng thể khi chưa phương sai tổng thể đã
biết phải thoả mãn hai yêu cầu:
Xác định được mẫu ngẫu nhiên.
Tổng thể: phân phối chuẩn hoặc là có cỡ mẫu lớn (𝑛𝑛 ≥ 30).
̅
𝑥𝑥−𝜇𝜇
• Khi đó, có phân phối T với độ tự do n – 1.
𝑠𝑠/ 𝑛𝑛
Kiểm định giả thuyết về trung bình tổng thể khi chưa biết phương sai
tổng thể (𝜎𝜎 2 ) bằng phương pháp cổ điển.

• Bước 1: Xác định giả thuyết gốc và đối thuyết. (𝝁𝝁𝟎𝟎 : giá trị trung
bình tổng thể)
𝐻𝐻0 : 𝜇𝜇 = 𝜇𝜇0 𝐻𝐻0 : 𝜇𝜇 = 𝜇𝜇0 𝐻𝐻0 : 𝜇𝜇 = 𝜇𝜇0
� � �
𝐻𝐻1 : 𝜇𝜇 ≠ 𝜇𝜇0 𝐻𝐻1 : 𝜇𝜇 < 𝜇𝜇0 𝐻𝐻1 : 𝜇𝜇 > 𝜇𝜇0
(hai đuôi) (đuôi trái) (đuôi phải)
• Bước 2: Xác định mức ý nghĩa hay khả năng cho phép mắc sai lầm
loại I (𝜶𝜶) (level of significance).
• Bước 3: Tính tiêu chuẩn kiểm định (T) (test statistic)
𝑥𝑥̅ − 𝜇𝜇0
𝑡𝑡0 = 𝑠𝑠
𝑛𝑛
Kiểm định giả thuyết về trung bình tổng thể khi chưa biết phương sai
tổng thể (𝜎𝜎 2 ) bằng phương pháp cổ điển.

• Bước 4: Xác định giá trị tới hạn hoặc giá trị kiểm định (critical
value): Vùng giới hạn hay vùng bác bỏ là tập hợp tất cả các giá trị bác
bỏ 𝐻𝐻0 .
Kiểm định giả thuyết về trung bình tổng thể khi chưa biết phương sai
tổng thể (𝜎𝜎 2 ) bằng phương pháp cổ điển.

• Bước 5: So sánh giá trị kiểm định với tiêu chuẩn kiểm định:
Hai đuôi: Bác bỏ 𝐻𝐻0 nếu 𝑡𝑡0 < −𝑡𝑡𝛼𝛼/2 hoặc 𝑡𝑡0 > 𝑡𝑡𝛼𝛼/2
Đuôi trái: Bác bỏ 𝐻𝐻0 nếu 𝑡𝑡0 < −𝑡𝑡𝛼𝛼
Đuôi phải: Bác bỏ 𝐻𝐻0 nếu 𝑡𝑡0 > −𝑡𝑡𝛼𝛼
• Bước 6: Kết luận.
Kiểm định giả thuyết về trung bình tổng thể khi chưa biết phương sai
tổng thể (𝜎𝜎 2 ) bằng phương pháp sử dụng p-value.

• Bước 4: Xác định giá trị p-value (sử dụng bang tra phân phối t với
độ tự do là n-1)
Kiểm định giả thuyết về trung bình tổng thể khi chưa biết phương sai
tổng thể (𝜎𝜎 2 ) bằng phương pháp p-value.

• Bước 5: So sánh giá trị kiểm định với tiêu chuẩn kiểm định:
Bác bỏ 𝐻𝐻0 nếu 𝑝𝑝 − 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 < 𝛼𝛼.
• Bước 6: Kết luận.
Ví dụ:
• Cân thử trọng lượng một loại quả (tính bằng gam), người ta tiến hành cân
thử một số quả lấy ngẫu nhiên, được số liệu cho trong bảng dưới đây:
Trọng lượng (g) 25 – 27 27 – 29 29 – 31 31 – 33 33 – 35 35 – 37
Số quả tương
3 5 7 5 3 2
ứng
Biết rằng trọng lượng quả tuân theo phân phối chuẩn.
a. Tiêu chuẩn đạt ra cho trọng lượng trung bình của quả là 30 gr. Với mức ý
nghĩa 5% có thể nói loại quả trên đạt tiêu chuẩn hay không?
b. Mùa vụ trước trọng lượng trung bình của loại quả này là 29 gr. Với mức ý
nghĩa 5% có thể nới trọng lượng trung bình đã tăng lên không?
Giải
a. 𝜇𝜇0 = 30, 𝛼𝛼 = 0.05, 𝑠𝑠 2 = 8.4267 , 𝑛𝑛 = 25, 𝑥𝑥̅ = 30.48
𝐻𝐻0 : 𝜇𝜇 = 30
• Bước 1: Xác định cặp giả thuyết.: �
𝐻𝐻1 : 𝜇𝜇 ≠ 30
• Bước 2: Xác định mức ý nghĩa 𝛼𝛼 = 0.05
• Bước 3: Tính tiêu chuẩn kiểm định:
𝑥𝑥̅ − 𝜇𝜇0 30.48 − 30
𝑡𝑡0 = 𝑠𝑠 = = 0.8267
2.903/ 25
𝑛𝑛
• Bước 4: Xác định giá trị kiểm định:
Do kiểm định này là hai đuôi nên 𝑡𝑡𝛼𝛼𝑛𝑛−1 = 𝑡𝑡0.05
25−1 24
= 𝑡𝑡0.025 = 2.064
2 2
• Bước 5: So sánh: 𝑡𝑡0 < 𝑡𝑡𝛼𝛼/2 ⇒ chưa có cơ sở bác bỏ 𝐻𝐻0 .
• Bước 6: Không có đủ bằng chứng để kết luận rằng trọng lượng trung bình không
đạt tiêu chuẩn.
Giải
b. 𝜇𝜇0 = 29, 𝛼𝛼 = 0.05, 𝑠𝑠 2 = 8.4267 , 𝑛𝑛 = 26, 𝑥𝑥̅ = 30.48
𝐻𝐻0 : 𝜇𝜇 = 29
• Bước 1: Xác định cặp giả thuyết.: �
𝐻𝐻1 : 𝜇𝜇 > 29
• Bước 2: Xác định mức ý nghĩa 𝛼𝛼 = 0.05
• Bước 3: Tính tiêu chuẩn kiểm định:
𝑥𝑥̅ − 𝜇𝜇0 30.48 − 29
𝑡𝑡0 = 𝑠𝑠 = = 2.5491
2.903/ 25
𝑛𝑛
• Bước 4: Xác định giá trị kiểm định:
25−1 24
Do kiểm định này là hai đuôi nên 𝑡𝑡𝛼𝛼𝑛𝑛−1 = 𝑡𝑡0.05 = 𝑡𝑡0.05 = 1.711
• Bước 5: So sánh: 𝑡𝑡0 > 𝑡𝑡𝛼𝛼 ⇒ bác bỏ 𝐻𝐻0 .
• Bước 6: Có đủ bằng chứng để kết luận rằng trọng lượng trung bình mùa này đang
tăng so với mùa trước.
3. Kiểm định giả thuyết cho phương sai tổng
thể
• Kiểm định giả thuyết cho phương sai tổng thể khi chưa biết trung bình
tổng thể.
• Để kiểm định cho phương sai tổng thể khi chưa trung bình tổng thể đã
biết phải thoả mãn hai yêu cầu:
Xác định được mẫu ngẫu nhiên.
Tổng thể: phân phối chuẩn hoặc là có cỡ mẫu lớn (𝑛𝑛 ≥ 30).
𝑛𝑛−1 𝑠𝑠 2
• Khi đó, có phân phối 𝜒𝜒 2 với độ tự do n – 1.
𝜎𝜎02
Kiểm định giả thuyết phương sai tổng thể (𝜎𝜎 2 ) bằng phương pháp cổ
điển.

• Bước 1: Xác định giả thuyết gốc và đối thuyết. (𝝈𝝈𝟎𝟎 : giá trị phương
sai tổng thể)
𝐻𝐻0 : 𝝈𝝈𝟐𝟐 = 𝝈𝝈𝟐𝟐0 𝐻𝐻0 : 𝝈𝝈𝟐𝟐 = 𝝈𝝈20 𝐻𝐻0 : 𝝈𝝈𝟐𝟐 = 𝝈𝝈20
� � �
𝐻𝐻1 : 𝝈𝝈2 ≠ 𝝈𝝈𝟐𝟐0 𝐻𝐻1 : 𝝈𝝈𝟐𝟐 < 𝝈𝝈20 𝐻𝐻1 : 𝝈𝝈2 > 𝝈𝝈20
(hai đuôi) (đuôi trái) (đuôi phải)
• Bước 2: Xác định mức ý nghĩa hay khả năng cho phép mắc sai lầm
loại I (𝜶𝜶) (level of significance).
• Bước 3: Tính tiêu chuẩn kiểm định (Z) (test statistic)
2
𝑛𝑛 − 1 𝑠𝑠
𝜒𝜒02 =
𝜎𝜎02
Kiểm định giả thuyết phương sai tổng thể (𝜎𝜎 2 ) bằng phương pháp cổ
điển.

• Bước 4: Xác định giá trị tới hạn hoặc giá trị kiểm định (critical
value): Vùng giới hạn hay vùng bác bỏ là tập hợp tất cả các giá trị bác
bỏ 𝐻𝐻0 .
Kiểm định giả thuyết phương sai tổng thể (𝜎𝜎 2 ) bằng phương pháp cổ
điển.

• Bước 5: So sánh giá trị kiểm định với tiêu chuẩn kiểm định:
2(𝑛𝑛−1) 2(𝑛𝑛−1)
Hai đuôi: Bác bỏ 𝐻𝐻0 nếu 𝜒𝜒02< 𝜒𝜒1−𝛼𝛼/2 hoặc 𝜒𝜒02 > 𝜒𝜒𝛼𝛼/2
2 2(𝑛𝑛−1)
Đuôi trái: Bác bỏ 𝐻𝐻0 nếu 𝜒𝜒0 < 𝜒𝜒1−𝛼𝛼
2 2(𝑛𝑛−1)
Đuôi phải: Bác bỏ 𝐻𝐻0 nếu𝜒𝜒0 > 𝜒𝜒𝛼𝛼
• Bước 6: Kết luận.
Kiểm định giả thuyết phương sai tổng thể (𝜎𝜎 2 ) bằng phương pháp p-
value
• Bước 4: Xác định giá trị p-value (sử dụng bang tra phân phối 𝝌𝝌𝟐𝟐 với độ tự do
là n-1)

• Đối với trường hợp hai phía, ta nên sử dụng phần mềm để tính p-value hoặc dùng
khoảng tin cậy để đưa ra quyết định.
Kiểm định giả thuyết phương sai tổng thể (𝜎𝜎 2 ) bằng phương pháp p-
value

• Bước 5: So sánh giá trị kiểm định với tiêu chuẩn kiểm định:
Bác bỏ 𝐻𝐻0 nếu 𝑝𝑝 − 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 < 𝛼𝛼.
• Bước 6: Kết luận.
Ví dụ:
• Cân thử trọng lượng một loại quả (tính bằng gam), người ta tiến hành cân
thử một số quả lấy ngẫu nhiên, được số lieu cho trong bảng dưới đây:
Trọng lượng (g) 25 – 27 27 – 29 29 – 31 31 – 33 33 – 35 35 – 37
Số quả tương
3 5 7 5 3 2
ứng
Biết rằng trọng lượng quả tuân theo phân phối chuẩn.
a. Với mức ý nghĩa 5%, kiểm định ý kiến cho rằng phương sai trọng lượng
quả là bằng 5 𝑔𝑔𝑟𝑟 2 . Nếu mức ý nghĩa 2% thì kết luận có thay đổi không?
b. Mùa vụ trước trọng lượng quả có độ phân tán bằng 4gr, với mức ý nghĩa
5% thì có thể nói mùa vụ này trọng lượng quả đã đồng đều hơn không?
Giải
a. 𝜎𝜎02 = 5, 𝛼𝛼 = 0.05, 𝑠𝑠 2 = 8.4267 , 𝑛𝑛 = 25, 𝑥𝑥̅ = 30.48
𝐻𝐻0 : 𝜎𝜎02 = 5
• Bước 1: Xác định cặp giả thuyết.: �
𝐻𝐻1 : 𝜎𝜎02 ≠ 5
• Bước 2: Xác định mức ý nghĩa 𝛼𝛼 = 0.05
• Bước 3: Tính tiêu chuẩn kiểm định:
2
2
𝑛𝑛 − 1 𝑠𝑠 25 − 1 × 8.4267
𝜒𝜒0 = 2 = = 40.448
𝜎𝜎0 5
• Bước 4: Xác định giá trị kiểm định:
Do kiểm định này là hai đuôi nên
2(𝑛𝑛−1) 2(25−1) 2(24) 2(24)
𝜒𝜒1−𝛼𝛼/2 = 𝜒𝜒1−0.05/2 = 𝜒𝜒0.975 = 12.4, 𝜒𝜒0.025 = 39.36
2(𝑛𝑛−1)
• Bước 5: So sánh: 𝜒𝜒02 > 𝜒𝜒𝛼𝛼/2 ⇒ bác bỏ 𝐻𝐻0 .
• Bước 6: Có đủ bằng chứng để kết luận rằng phương sai trọng lượng khác 5 𝑔𝑔𝑟𝑟 2 .
Giải
a. (Ý 2) 𝜎𝜎02 = 5, 𝛼𝛼 = 0.02, 𝑠𝑠 2 = 8.4267 , 𝑛𝑛 = 25, 𝑥𝑥̅ = 30.48
𝐻𝐻0 : 𝜎𝜎02 = 5
• Bước 1: Xác định cặp giả thuyết.: �
𝐻𝐻1 : 𝜎𝜎02 ≠ 5
• Bước 2: Xác định mức ý nghĩa 𝛼𝛼 = 0.05
• Bước 3: Tính tiêu chuẩn kiểm định:
2
2
𝑛𝑛 − 1 𝑠𝑠 25 − 1 × 8.4267
𝜒𝜒0 = 2 = = 40.448
𝜎𝜎0 5
• Bước 4: Xác định giá trị kiểm định:
Do kiểm định này là hai đuôi nên
2(𝑛𝑛−1) 2(25−1) 2(24) 2(24)
𝜒𝜒1−𝛼𝛼/2 = 𝜒𝜒1−0.02/2 = 𝜒𝜒0.99 = 42.98, 𝜒𝜒0.01 = 42.98
2(𝑛𝑛−1) 2 2(𝑛𝑛−1)
• Bước 5: So sánh:𝜒𝜒1−𝛼𝛼/2 < 𝜒𝜒0 < 𝜒𝜒𝛼𝛼/2 ⇒ Không bác bỏ 𝐻𝐻0 .
• Bước 6: Không có đủ bằng chứng để kết luận rằng phương sai trọng lượng khác 5
𝑔𝑔𝑟𝑟 2 . Ý kiến cho rằng phương sai trọng lượng bằng 5 𝑔𝑔𝑟𝑟 2 là đúng.
Giải
b. 𝜎𝜎02 = 16, 𝛼𝛼 = 0.05, 𝑠𝑠 2 = 8.4267 , 𝑛𝑛 = 25, 𝑥𝑥̅ = 30.48
𝐻𝐻0 : 𝜎𝜎02 = 16
• Bước 1: Xác định cặp giả thuyết.: �
𝐻𝐻1 : 𝜎𝜎02 < 16
• Bước 2: Xác định mức ý nghĩa 𝛼𝛼 = 0.05
• Bước 3: Tính tiêu chuẩn kiểm định:
2
2
𝑛𝑛 − 1 𝑠𝑠 25 − 1 × 8.4267
𝜒𝜒0 = 2 = = 12.64
𝜎𝜎0 16
• Bước 4: Xác định giá trị kiểm định:
Do kiểm định này phía trái là nên
2(𝑛𝑛−1) 2(25−1) 2(24)
𝜒𝜒1−𝛼𝛼 = 𝜒𝜒1−0.05 = 𝜒𝜒0.95 = 14.61
2(𝑛𝑛−1)
• Bước 5: So sánh: 𝜒𝜒02 < 𝜒𝜒1−𝛼𝛼 ⇒ bác bỏ 𝐻𝐻0 .
• Bước 6: Có đủ bằng chứng để kết luận rằng quả mùa này đồng đều hơn mùa trước.
4. Kiểm định giả thuyết cho tần số tổng thể
• Để kiểm định cho tần số tổng thể khi chưa trung bình tổng thể đã biết
phải thoả mãn ba yêu cầu:
Xác định được mẫu ngẫu nhiên.
𝑛𝑛𝑝𝑝0 1 − 𝑝𝑝0 ≥ 10.
Mỗi giá trị trong mẫu đều độc lập với nhau.
̅
𝑥𝑥−𝜇𝜇
• Khi đó, có phân phối T với độ tự do n – 1.
𝑠𝑠/ 𝑛𝑛
Kiểm định giả thuyết tần số tổng thể (𝑝𝑝) bằng phương pháp cổ điển.

• Bước 1: Xác định giả thuyết gốc và đối thuyết. (𝒑𝒑𝟎𝟎 : giá trị tần số
tổng thể)
𝐻𝐻0 : 𝑝𝑝 = 𝑝𝑝0 𝐻𝐻0 : 𝑝𝑝 = 𝑝𝑝0 𝐻𝐻0 : 𝑝𝑝 = 𝑝𝑝0
� � �
𝐻𝐻1 : 𝑝𝑝 ≠ 𝑝𝑝0 𝐻𝐻1 : 𝑝𝑝 < 𝑝𝑝0 𝐻𝐻1 : 𝑝𝑝 > 𝑝𝑝0
(hai đuôi) (đuôi trái) (đuôi phải)
• Bước 2: Xác định mức ý nghĩa hay khả năng cho phép mắc sai lầm
loại I (𝜶𝜶) (level of significance).
• Bước 3: Tính tiêu chuẩn kiểm định (Z) (test statistic)
𝑓𝑓 − 𝑝𝑝0
𝑧𝑧0 =
𝑝𝑝0 1 − 𝑝𝑝0
𝑛𝑛
Kiểm định giả thuyết tần số tổng thể (𝑝𝑝) bằng phương pháp cổ điển.

• Bước 4: Xác định giá trị tới hạn hoặc giá trị kiểm định (critical
value): Vùng giới hạn hay vùng bác bỏ là tập hợp tất cả các giá trị bác
bỏ 𝐻𝐻0 .
Kiểm định giả thuyết tần số tổng thể (𝑝𝑝) bằng phương pháp cổ điển.

• Bước 5: So sánh giá trị kiểm định với tiêu chuẩn kiểm định:
Hai đuôi: Bác bỏ 𝐻𝐻0 nếu 𝑧𝑧0 < −𝑧𝑧𝛼𝛼/2 hoặc 𝑧𝑧0 > 𝑧𝑧𝛼𝛼/2
Đuôi trái: Bác bỏ 𝐻𝐻0 nếu 𝑧𝑧0 < −𝑧𝑧𝛼𝛼
Đuôi phải: Bác bỏ 𝐻𝐻0 nếu 𝑧𝑧0 > −𝑧𝑧𝛼𝛼
• Bước 6: Kết luận.
Kiểm định giả thuyết tần số tổng thể (𝑝𝑝) bằng phương pháp cổ điển.

• Bước 4: Xác định giá trị p-value


Kiểm định giả thuyết tần số tổng thể (𝑝𝑝) bằng phương pháp cổ điển.

• Bước 5: So sánh giá trị kiểm định với tiêu chuẩn kiểm định:
Bác bỏ 𝐻𝐻0 nếu 𝑝𝑝 − 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 < 𝛼𝛼.
• Bước 6: Kết luận.
Ví dụ:
• Tổng điều tra trên một khu vực 5 năm trước cho thấy có 10% dân số ở độ
tuổi trưởng thành không biết chữ. Năm nay điều tra ngẫu nhiên 400 người
thì có 22 người ở độ tuổi trưởng thành không biết chữ. Với mức ý nghĩa 5%,
a. Nhận xét ý kiến cho rằng tỷ lệ mù chữ không giảm đi so với 5 năm trước?
b. Phải chăng tỉ lệ mù chữ vẫn còn trên 3%?
c. Có thể cho rằng tỉ lệ mù chữ còn 5% hay không?
Giải
𝑘𝑘 22
a. 𝑝𝑝0 = 0.1, 𝛼𝛼 = 0.05, 𝑛𝑛 = 400, 𝑓𝑓 = = = 0.055
𝑛𝑛 400
𝐻𝐻0 : 𝑝𝑝 = 0.1
• Bước 1: Xác định cặp giả thuyết.: �
𝐻𝐻1 : 𝑝𝑝 < 0.1
• Bước 2: Xác định mức ý nghĩa 𝛼𝛼 = 0.05
• Bước 3: Tính tiêu chuẩn kiểm định:
𝑓𝑓 − 𝑝𝑝0 0.055 − 0.1
𝑧𝑧0 = = = −3
𝑝𝑝0 1 − 𝑝𝑝0 0.1 1 − 0.1
𝑛𝑛 400
• Bước 4: Xác định giá trị kiểm định:
Do kiểm định này là phía trái nên −𝑧𝑧𝛼𝛼 = −𝑧𝑧0.05 = −1.645
• Bước 5: So sánh:𝑧𝑧0 < −𝑧𝑧𝛼𝛼 ⇒ bác bỏ 𝐻𝐻0 .
• Bước 6: Có đủ bằng chứng để kết luận rằng tỷ lệ mù chữ đã giảm đi.
Giải
𝑘𝑘 22
b. 𝑝𝑝0 = 0.03, 𝛼𝛼 = 0.05, 𝑛𝑛 = 400, 𝑓𝑓 = = = 0.055
𝑛𝑛 400
𝐻𝐻0 : 𝑝𝑝 = 0.03
• Bước 1: Xác định cặp giả thuyết.: �
𝐻𝐻1 : 𝑝𝑝 > 0.03
• Bước 2: Xác định mức ý nghĩa 𝛼𝛼 = 0.05
• Bước 3: Tính tiêu chuẩn kiểm định:
𝑓𝑓 − 𝑝𝑝0 0.055 − 0.03
𝑧𝑧0 = = = 2.931
𝑝𝑝0 1 − 𝑝𝑝0 0.03 1 − 0.03
𝑛𝑛 400
• Bước 4: Xác định giá trị kiểm định:
Do kiểm định này là phía phải nên 𝑧𝑧𝛼𝛼 = 𝑧𝑧0.05 = 1.645
• Bước 5: So sánh:𝑧𝑧0 > 𝑧𝑧𝛼𝛼 ⇒ bác bỏ 𝐻𝐻0 .
• Bước 6: Có đủ bằng chứng để kết luận rằng tỷ lệ mù chữ vẫn còn trên 3%.
Giải
𝑘𝑘 22
b. 𝑝𝑝0 = 0.05, 𝛼𝛼 = 0.05, 𝑛𝑛 = 400, 𝑓𝑓 = = = 0.055
𝑛𝑛 400
𝐻𝐻0 : 𝑝𝑝 = 0.05
• Bước 1: Xác định cặp giả thuyết.: �
𝐻𝐻1 : 𝑝𝑝 ≠ 0.05
• Bước 2: Xác định mức ý nghĩa 𝛼𝛼 = 0.05
• Bước 3: Tính tiêu chuẩn kiểm định:
𝑓𝑓 − 𝑝𝑝0 0.055 − 0.05
𝑧𝑧0 = = = 0.4588
𝑝𝑝0 1 − 𝑝𝑝0 0.05 1 − 0.05
𝑛𝑛 400
• Bước 4: Xác định giá trị kiểm định:
Do kiểm định này là phía phải nên 𝑧𝑧𝛼𝛼/2 = 𝑧𝑧0.05/2 = 1.96
• Bước 5: So sánh: −𝑧𝑧𝛼𝛼/2 < 𝑧𝑧0 < 𝑧𝑧𝛼𝛼/2 ⇒ không bác bỏ 𝐻𝐻0 .
• Bước 6: không có đủ bằng chứng để kết luận rằng tỷ lệ mù chữ vẫn còn 5%.
5. Kiểm định giả thuyết cho hiệu hai trung
bình tổng thể của hai phân phối chuẩn
• Phân biệt hai mẫu độc lập và mẫu phụ thuộc
• Kiểm định cho sự khác biệt trên hai trung bình tổng thể với hai mẫu
độc lập.
• Kiểm định cho sự khác biệt trên hai trung bình tổng thể với hai mẫu
liên hệ (mẫu phối hợp từng cặp).
Phân biệt lấy mẫu độc lập với lấy mẫu liên hệ (mẫu phối hợp từng cặp)
(independence sample or matched – pairs sample)

• Phương pháp lấy mẫu độc lập khi các quan sát được chọn ở mẫu thứ
nhất sẽ không ảnh hưởng các quan sát ở mẫu thứ hai.
• Phương pháp lấy mẫu liên hệ (mẫu phối hợp từng cặp) khi các quan sát
của mẫu thứ nhất sẽ được dùng để xác định các quan sát ở mẫu thứ hai.
Phân biệt lấy mẫu độc lập với lấy mẫu liên hệ (mẫu phối hợp từng cặp)
(independence sample or matched – pairs sample)

• Ví dụ: Phân biệt lấy mẫu độc lập và lấy mẫu liên hệ:
a. Một nhà nghiên cứu muốn biết về năng suất lao động của công nhân
gia công sản phẩm theo hai phương pháp có khác nhau hay không. Bà
ta tiến hành lấy 18 công nhân và thu thập năng suất của họ ứng với
từng phương pháp.
b. Một nhà nghiên cứu muốn biết về mức thu nhập của người dân ở
TPHCM và Hà Nội có sự khác biệt hay không. Ông ta tiến hành chọn
18 người ở TPHCM và 16 người ở Hà Nội, thu thập mức thu nhập của
từng người.
Hai mẫu liên hệ (mẫu phối hợp từng cặp)

• Để kiểm định cho sự khác biệt trung bình tổng thể của hai mẫu không
độc lập, ta cần thoả các điều kiện sau:
• Các mẫu được lấy ra là ngẫu nhiên.
• Hai mẫu này không độc lập.
• Sự khác biệt giữa hai mẫu tuân theo phân phối chuẩn hoặc cỡ mẫu lớn
(𝑛𝑛 ≥ 30).
Hai mẫu không độc lập

• Bước 1: Xác định giả thuyết gốc và đối thuyết.


𝐻𝐻0 : 𝜇𝜇𝐷𝐷 = 𝐷𝐷0 𝐻𝐻0 : 𝜇𝜇𝐷𝐷 = 𝐷𝐷0 𝐻𝐻0 : 𝜇𝜇𝐷𝐷 = 𝐷𝐷0
� � �
𝐻𝐻1 : 𝜇𝜇𝐷𝐷 ≠ 𝐷𝐷0 𝐻𝐻1 : 𝜇𝜇𝐷𝐷 < 𝐷𝐷0 𝐻𝐻1 : 𝜇𝜇𝐷𝐷 > 𝐷𝐷0
(hai đuôi) (đuôi trái) (đuôi phải)
• Bước 2: Xác định mức ý nghĩa hay khả năng cho phép mắc sai lầm
loại I (𝜶𝜶) (level of significance).
• Bước 3: Tính tiêu chuẩn kiểm định (test statistic)
� − 𝐷𝐷0 𝑛𝑛
𝐷𝐷
𝑡𝑡0 =
𝑠𝑠𝑑𝑑
Trong đó, 𝐷𝐷� và 𝑠𝑠𝑑𝑑 là trung bình và phương sai của giá trị chênh lệch.
Hai mẫu không độc lập (cách tiếp cận truyền thống)

• Bước 4: Xác định giá trị tới hạn hoặc giá trị kiểm định (critical
value): Vùng giới hạn hay vùng bác bỏ là tập hợp tất cả các giá trị bác
bỏ 𝐻𝐻0 .
Hai mẫu không độc lập (cách tiếp cận truyền thống)

• Bước 5: So sánh giá trị kiểm định với tiêu chuẩn kiểm định:
Hai đuôi: Bác bỏ 𝐻𝐻0 nếu 𝑡𝑡0 < −𝑡𝑡𝛼𝛼/2 hoặc 𝑡𝑡0 > 𝑡𝑡𝛼𝛼/2
Đuôi trái: Bác bỏ 𝐻𝐻0 nếu 𝑡𝑡0 < −𝑡𝑡𝛼𝛼
Đuôi phải: Bác bỏ 𝐻𝐻0 nếu 𝑡𝑡0 > −𝑡𝑡𝛼𝛼
• Bước 6: Kết luận.
Hai mẫu không độc lập (cách tiếp cận truyền thống)

• Bước 4: Tính giá trị p-value


Hai mẫu không độc lập (cách tiếp cận sử dụng p-value)

• Bước 5: Quy tắc bác bỏ: 𝑝𝑝 − 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 < 𝛼𝛼


• Bước 6: Kết luận.
Ví dụ:
• Nghiên cứu điểm kiểm tra môn Anh văn chương trình TOEFL của 11 học
viên khi nhập học và sau khi học một tháng, người ta khẳng định rằng sau
một tháng học ở trung tâm, trung bình mỗi học viên tăng thêm 5 điểm. Hãy
kiểm định điều đó với mức ý nghĩa 5%.
Điểm sau khi Điểm trước khi
Số thứ tự Chênh lệch điểm
học 1 tháng học
1 34 27 7
2 41 40 1
3 45 43 2
4 32 26 6
5 32 28 4
6 31 26 5
7 32 28 4
8 30 27 3
9 35 32 3
10 33 27 6
11 42 39 3
Giải
a. D0 = 5, 𝛼𝛼 = 0.05, 𝑛𝑛 = 11
𝐻𝐻0 : 𝜇𝜇𝐷𝐷 = 5
• Bước 1: Xác định cặp giả thuyết.: �
𝐻𝐻1 : 𝜇𝜇𝐷𝐷 ≠ 5
• Bước 2: Xác định mức ý nghĩa 𝛼𝛼 = 0.05
• Bước 3: Tính tiêu chuẩn kiểm định:
� − 𝐷𝐷0 𝑛𝑛
𝐷𝐷 4 − 5 11
𝑡𝑡0 = = = 1.799
𝑠𝑠𝑑𝑑 1.844
Bước 4: Xác định giá trị kiểm định:
𝑛𝑛−1 10
Do kiểm định này là hai phía nên 𝑡𝑡𝛼𝛼 = 𝑡𝑡0.025 = 2.228
2
• Bước 5: So sánh:−𝑡𝑡𝛼𝛼 < 𝑡𝑡0 < 𝑡𝑡𝛼𝛼/2 ⇒ không bác bỏ 𝐻𝐻0 .
2
• Bước 6: Không có đủ bằng chứng để kết luận rằng sau một tháng khi học ở trung
tâm trung bình mỗi học viên sẽ không tăng thêm 5 điểm.
Kết quả khi chạy Excel
Kết quả khi chạy SPSS
Hai mẫu độc lập

• Trường hợp biết phương sai cả hai tổng thể


• Trường hợp không biết phương sai hai tổng thể (𝑛𝑛1 ≥ 30, 𝑛𝑛2 ≥ 30)
• Trường hợp biết phương sai hai tổng thể bằng nhau (𝜎𝜎12 = 𝜎𝜎22 ) và (𝑛𝑛1 <
30, 𝑛𝑛2 < 30)
• Trường hợp không biết phương sai hai tổng thể bằng nhau và (𝑛𝑛1 <
30, 𝑛𝑛2 < 30)
Hai mẫu độc lập – biết phương sai hai tổng thể

• Bước 1: Xác định giả thuyết gốc và đối thuyết.


𝐻𝐻0 : 𝜇𝜇1 − 𝜇𝜇2 = 𝐷𝐷0 𝐻𝐻0 : 𝜇𝜇1 − 𝜇𝜇2 = 𝐷𝐷0 𝐻𝐻0 : 𝜇𝜇1 − 𝜇𝜇2 = 𝐷𝐷0
� � �
𝐻𝐻1 : 𝜇𝜇1 − 𝜇𝜇2 ≠ 𝐷𝐷0 𝐻𝐻1 : 𝜇𝜇1 − 𝜇𝜇2 < 𝐷𝐷0 𝐻𝐻1 : 𝜇𝜇1 − 𝜇𝜇2 > 𝐷𝐷0
(hai đuôi) (đuôi trái) (đuôi phải)
• Bước 2: Xác định mức ý nghĩa hay khả năng cho phép mắc sai lầm loại I
(𝜶𝜶) (level of significance).
• Bước 3: Tính tiêu chuẩn kiểm định (test statistic)
𝑋𝑋�1 − 𝑋𝑋�2 − 𝜇𝜇1 − 𝜇𝜇2
𝑍𝑍 =
𝜎𝜎12 𝜎𝜎22
𝑛𝑛1 + 𝑛𝑛2
� và 𝑠𝑠𝑑𝑑 là trung bình và phương sai của giá trị chênh lệch.
Trong đó, 𝐷𝐷
Hai mẫu độc lập – biết phương sai hai tổng thể

• Bước 4: Xác định giá trị tới hạn hoặc giá trị kiểm định (critical
value): Vùng giới hạn hay vùng bác bỏ là tập hợp tất cả các giá trị bác
bỏ 𝐻𝐻0 .
Hai mẫu độc lập – biết phương sai hai tổng thể

• Bước 5: So sánh giá trị kiểm định với tiêu chuẩn kiểm định:
Hai đuôi: Bác bỏ 𝐻𝐻0 nếu 𝑧𝑧0 < −𝑧𝑧𝛼𝛼/2 hoặc 𝑧𝑧0 > 𝑧𝑧𝛼𝛼/2
Đuôi trái: Bác bỏ 𝐻𝐻0 nếu 𝑧𝑧0 < −𝑧𝑧𝛼𝛼
Đuôi phải: Bác bỏ 𝐻𝐻0 nếu 𝑧𝑧0 > −𝑧𝑧𝛼𝛼
• Bước 6: Kết luận.
Hai mẫu độc lập – biết phương sai hai tổng thể

• Bước 4: Xác định giá trị p-value


Hai mẫu độc lập – biết phương sai hai tổng thể

• Bước 5: So sánh giá trị kiểm định với tiêu chuẩn kiểm định:
Bác bỏ 𝐻𝐻0 nếu 𝑝𝑝 − 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 < 𝛼𝛼.
• Bước 6: Kết luận.
Hai mẫu độc lập – không biết phương sai hai tổng thể và (𝑛𝑛1 > 30, 𝑛𝑛2 > 30)

• Bước 1: Xác định giả thuyết gốc và đối thuyết.


𝐻𝐻0 : 𝜇𝜇1 − 𝜇𝜇2 = 𝐷𝐷0 𝐻𝐻0 : 𝜇𝜇1 − 𝜇𝜇2 = 𝐷𝐷0 𝐻𝐻0 : 𝜇𝜇1 − 𝜇𝜇2 = 𝐷𝐷0
� � �
𝐻𝐻1 : 𝜇𝜇1 − 𝜇𝜇2 ≠ 𝐷𝐷0 𝐻𝐻1 : 𝜇𝜇1 − 𝜇𝜇2 < 𝐷𝐷0 𝐻𝐻1 : 𝜇𝜇1 − 𝜇𝜇2 > 𝐷𝐷0
(hai đuôi) (đuôi trái) (đuôi phải)
• Bước 2: Xác định mức ý nghĩa hay khả năng cho phép mắc sai lầm loại I
(𝜶𝜶) (level of significance).
• Bước 3: Tính tiêu chuẩn kiểm định (test statistic)
𝑋𝑋�1 − 𝑋𝑋�2 − 𝜇𝜇1 − 𝜇𝜇2
𝑍𝑍 =
𝑠𝑠12 𝑠𝑠22
𝑛𝑛1 + 𝑛𝑛2
Hai mẫu độc lập – không biết phương sai hai tổng thể và (𝑛𝑛1 > 30,
𝑛𝑛2 > 30)

• Bước 4: Xác định giá trị tới hạn hoặc giá trị kiểm định (critical
value): Vùng giới hạn hay vùng bác bỏ là tập hợp tất cả các giá trị bác
bỏ 𝐻𝐻0 .
Hai mẫu độc lập – không biết phương sai hai tổng thể và (𝑛𝑛1 > 30,
𝑛𝑛2 > 30)

• Bước 5: So sánh giá trị kiểm định với tiêu chuẩn kiểm định:
Hai đuôi: Bác bỏ 𝐻𝐻0 nếu 𝑧𝑧0 < −𝑧𝑧𝛼𝛼/2 hoặc 𝑧𝑧0 > 𝑧𝑧𝛼𝛼/2
Đuôi trái: Bác bỏ 𝐻𝐻0 nếu 𝑧𝑧0 < −𝑧𝑧𝛼𝛼
Đuôi phải: Bác bỏ 𝐻𝐻0 nếu 𝑧𝑧0 > 𝑧𝑧𝛼𝛼
• Bước 6: Kết luận.
Ví dụ:
• Cân thử 40 quả trồng theo phương pháp truyền thống thì trọng lượng trung
bình là 30.32g, phương sai 7.5272. Cân thử 50 quả trồng theo phương pháp
cải tiến thì trọng lượng trung bình là 32.5 và phương sai là 6.722. Biết trọng
lượng quả tuân theo phân phối chuẩn, mức ý nghĩa 5%.
a. Trọng lượng loại quả trồng theo phương pháp truyền thống và cải tiến có
như nhau không?
b. Phải chăng loại quả trồng theo phương pháp cải tiến nặng hơn
Giải
a. D0 = 0, 𝛼𝛼 = 0.05, 𝑛𝑛1 = 40, 𝑛𝑛2 = 50, 𝑋𝑋�1 = 30.32, 𝑋𝑋�2 = 32.5, 𝑠𝑠12 =
7.572, 𝑠𝑠22 = 6.722
𝐻𝐻0 : 𝜇𝜇1 − 𝜇𝜇2 = 0
• Bước 1: Xác định cặp giả thuyết.: �
𝐻𝐻1 : 𝜇𝜇1 − 𝜇𝜇2 ≠ 0
• Bước 2: Xác định mức ý nghĩa 𝛼𝛼 = 0.05
• Bước 3: Tính tiêu chuẩn kiểm định:
𝑋𝑋�1 − 𝑋𝑋�2 − 𝜇𝜇1 − 𝜇𝜇2 30.32 − 32.5 − 0
𝑍𝑍 = = = −3.814
2 2
𝑠𝑠1 𝑠𝑠2 7.572 6.722
+
+ 40 50
𝑛𝑛1 𝑛𝑛2
Bước 4: Xác định giá trị kiểm định:
Do kiểm định này là hai phía nên 𝑧𝑧𝛼𝛼/2 = 𝑧𝑧0.025 = 1.96
• Bước 5: So sánh ⇒ bác bỏ 𝐻𝐻0 .
• Bước 6: Có đủ bằng chứng để kết luận rằng trọng lượng hai loại quả trồng theo hai
phương pháp là khác nhau.
Giải
b. D0 = 0, 𝛼𝛼 = 0.05, 𝑛𝑛1 = 40, 𝑛𝑛2 = 50, 𝑋𝑋�1 = 30.32, 𝑋𝑋�2 = 32.5, 𝑠𝑠12 =
7.572, 𝑠𝑠22 = 6.722
𝐻𝐻0 : 𝜇𝜇1 − 𝜇𝜇2 = 0
• Bước 1: Xác định cặp giả thuyết.: �
𝐻𝐻1 : 𝜇𝜇1 − 𝜇𝜇2 < 0
• Bước 2: Xác định mức ý nghĩa 𝛼𝛼 = 0.05
• Bước 3: Tính tiêu chuẩn kiểm định:
𝑋𝑋�1 − 𝑋𝑋�2 − 𝜇𝜇1 − 𝜇𝜇2 30.32 − 32.5 − 0
𝑍𝑍 = = = −3.814
2 2
𝑠𝑠1 𝑠𝑠2 7.572 6.722
+
+ 40 50
𝑛𝑛1 𝑛𝑛2
Bước 4: Xác định giá trị kiểm định:
Do kiểm định này là phía trái nên 𝑧𝑧𝛼𝛼 = 𝑧𝑧0.005 = 1.645
• Bước 5: So sánh ⇒ bác bỏ 𝐻𝐻0 .
• Bước 6: Có đủ bằng chứng để kết luận rằng trọng lượng quả trồng theo phương
pháp cải tiến tốt hơn trọng lượng trồng theo phương pháp truyền thống.
Hai mẫu độc lập – không biết phương sai hai tổng thể và (𝑛𝑛1 < 30, 𝑛𝑛2 < 30)

• Bước 1: Xác định giả thuyết gốc và đối thuyết.


𝐻𝐻0 : 𝜇𝜇1 − 𝜇𝜇2 = 𝐷𝐷0 𝐻𝐻0 : 𝜇𝜇1 − 𝜇𝜇2 = 𝐷𝐷0 𝐻𝐻0 : 𝜇𝜇1 − 𝜇𝜇2 = 𝐷𝐷0
� � �
𝐻𝐻1 : 𝜇𝜇1 − 𝜇𝜇2 ≠ 𝐷𝐷0 𝐻𝐻1 : 𝜇𝜇1 − 𝜇𝜇2 < 𝐷𝐷0 𝐻𝐻1 : 𝜇𝜇1 − 𝜇𝜇2 > 𝐷𝐷0
(hai đuôi) (đuôi trái) (đuôi phải)
• Bước 2: Xác định mức ý nghĩa hay khả năng cho phép mắc sai lầm loại I
(𝜶𝜶) (level of significance).
• Bước 3: Tính tiêu chuẩn kiểm định (test statistic)
𝑋𝑋�1 − 𝑋𝑋�2 − 𝜇𝜇1 − 𝜇𝜇2
𝑇𝑇 =
𝑠𝑠12 𝑠𝑠22
𝑛𝑛1 + 𝑛𝑛2
Với độ tự do 𝑛𝑛 = min(𝑛𝑛1 − 1, 𝑛𝑛2 − 1)
Hai mẫu độc lập – không biết phương sai hai tổng thể và (𝑛𝑛1 < 30, 𝑛𝑛2 < 30)

• Chú ý
• Bước 3: Tính tiêu chuẩn kiểm định (test statistic)
𝑋𝑋�1 − 𝑋𝑋�2 − 𝜇𝜇1 − 𝜇𝜇2
𝑇𝑇 =
𝑠𝑠12 𝑠𝑠22
𝑛𝑛1 + 𝑛𝑛2
Với độ tự do df= min(𝑛𝑛1 − 1, 𝑛𝑛2 − 1)
Nếu muốn tính độ tự do chính xác
2 2 2
𝑠𝑠1 𝑠𝑠2
𝑛𝑛1 + 𝑛𝑛2
𝑑𝑑𝑑𝑑 =
2 2 2 2
𝑠𝑠1 𝑠𝑠2
𝑛𝑛1 𝑛𝑛2
𝑛𝑛1 − 1 + 𝑛𝑛2 − 1
Hai mẫu độc lập – không biết phương sai hai tổng thể và (𝑛𝑛1 < 30,
𝑛𝑛2 < 30)

• Bước 4: Xác định giá trị tới hạn hoặc giá trị kiểm định (critical
value): Vùng giới hạn hay vùng bác bỏ là tập hợp tất cả các giá trị bác
bỏ 𝐻𝐻0 .
Hai mẫu độc lập – không biết phương sai hai tổng thể và (𝑛𝑛1 < 30,
𝑛𝑛2 < 30)

• Bước 5: So sánh giá trị kiểm định với tiêu chuẩn kiểm định:
Hai đuôi: Bác bỏ 𝐻𝐻0 nếu 𝑡𝑡0 < −𝑡𝑡𝛼𝛼/2 hoặc 𝑡𝑡0 > 𝑡𝑡𝛼𝛼/2
Đuôi trái: Bác bỏ 𝐻𝐻0 nếu 𝑡𝑡0 < −𝑡𝑡𝛼𝛼
Đuôi phải: Bác bỏ 𝐻𝐻0 nếu 𝑡𝑡0 > 𝑡𝑡𝛼𝛼
• Bước 6: Kết luận.
Ví dụ:
• Một nhà nghiên cứu về trọng lượng hai kiện hàng của hai công ty A và B
xem trọng lượng của các kiện hàng công ty A có nặng hơn trọng lượng kiện
hàng của công ty B hay không. Ông ta tiến hành lấy 18 kiện hàng của công
ty A và 16 kiện hàng của công ty B. Kết quả thu được ở bảng sau:
Khối lượng kiện hàng công ty A Khối lượng kiện hàng công ty B
5.70 5.67 5.67 5.55
5.73 5.61 5.70 5.61
5.70 5.67 5.72 5.58
5.65 5.62 5.66 5.74
5.73 5.65 5.70 5.68
5.79 5.73 5.68 5.53
5.77 5.71 5.67 5.55
5.70 5.76 5.61 5.74
5.73 5.72
Giải
a. D0 = 5, 𝛼𝛼 = 0.05, 𝑛𝑛1 = 18, 𝑛𝑛2 = 16, 𝑋𝑋�1 = 5.7022, 𝑋𝑋�2 = 5.6494, 𝑠𝑠1 =
0.0497, 𝑠𝑠2 = 0.0689
𝐻𝐻0 : 𝜇𝜇1 − 𝜇𝜇2 = 0
• Bước 1: Xác định cặp giả thuyết.: �
𝐻𝐻1 : 𝜇𝜇1 − 𝜇𝜇2 > 0
• Bước 2: Xác định mức ý nghĩa 𝛼𝛼 = 0.05
• Bước 3: Tính tiêu chuẩn kiểm định:
𝑋𝑋�1 − 𝑋𝑋�2 − 𝜇𝜇1 − 𝜇𝜇2 5.7022 − 5.6494 − 0
𝑇𝑇 = = = 2.537
0.0497 2 0.06892
2 2
𝑠𝑠1 𝑠𝑠2 +
+ 18 16
𝑛𝑛1 𝑛𝑛2
Với độ tự do 𝑛𝑛 = min
2
𝑛𝑛1 − 1, 𝑛𝑛2 − 1 = 15
𝑠𝑠2 2
1 + 𝑠𝑠2
𝑛𝑛1 𝑛𝑛2
Hoặc 𝑑𝑑𝑑𝑑 = 2 2 2
= 27
𝑠𝑠2
1 𝑠𝑠 2
𝑛𝑛1 𝑛𝑛2
+
𝑛𝑛1 −1 𝑛𝑛2 −1
Giải
a. D0 = 5, 𝛼𝛼 = 0.05, 𝑛𝑛1 = 18, 𝑛𝑛2 = 16, 𝑋𝑋�1 = 5.7022, 𝑋𝑋�2 = 5.6494, 𝑠𝑠1 =
0.0497, 𝑠𝑠2 = 0.0689
𝐻𝐻0 : 𝜇𝜇1 − 𝜇𝜇2 = 0
• Bước 1: Xác định cặp giả thuyết.: �
𝐻𝐻1 : 𝜇𝜇1 − 𝜇𝜇2 > 0
• Bước 2: Xác định mức ý nghĩa 𝛼𝛼 = 0.05
• Bước 3: Tính tiêu chuẩn kiểm định:
𝑋𝑋�1 − 𝑋𝑋�2 − 𝜇𝜇1 − 𝜇𝜇2 5.7022 − 5.6494 − 0
𝑇𝑇 = = = 2.537
0.0497 2 0.06892
2 2
𝑠𝑠1 𝑠𝑠2 +
+ 18 16
𝑛𝑛1 𝑛𝑛2
Với độ tự do 𝑛𝑛 = min 𝑛𝑛1 − 1, 𝑛𝑛2 − 1 = 15
Bước 4: Xác định giá trị kiểm định:
𝑛𝑛−1 15
Do kiểm định này là phía phải nên 𝑡𝑡𝛼𝛼 = 𝑡𝑡0.05 = 1.753
• Bước 5: So sánh: 𝑡𝑡0 > 𝑡𝑡𝛼𝛼 ⇒ bác bỏ 𝐻𝐻0 .
• Bước 6: Có đủ bằng chứng để kết luận rằng trọng lượng kiện hàng của công ty A nặng
hơn công ty B.
Kết quả khi chạy Excel
Kết quả chạy trên SPSS
Hai mẫu độc lập – không biết phương sai hai tổng thể nhưng biết chúng bang
nhau và (𝑛𝑛1 < 30, 𝑛𝑛2 < 30)

• Bước 1: Xác định giả thuyết gốc và đối thuyết.


𝐻𝐻0 : 𝜇𝜇1 − 𝜇𝜇2 = 𝐷𝐷0 𝐻𝐻0 : 𝜇𝜇1 − 𝜇𝜇2 = 𝐷𝐷0 𝐻𝐻0 : 𝜇𝜇1 − 𝜇𝜇2 = 𝐷𝐷0
� � �
𝐻𝐻1 : 𝜇𝜇1 − 𝜇𝜇2 ≠ 𝐷𝐷0 𝐻𝐻1 : 𝜇𝜇1 − 𝜇𝜇2 < 𝐷𝐷0 𝐻𝐻1 : 𝜇𝜇1 − 𝜇𝜇2 > 𝐷𝐷0
(hai đuôi) (đuôi trái) (đuôi phải)
• Bước 2: Xác định mức ý nghĩa hay khả năng cho phép mắc sai lầm loại I
(𝜶𝜶) (level of significance).
• Bước 3: Tính tiêu chuẩn kiểm định (test statistic)
𝑋𝑋�1 − 𝑋𝑋�2 − 𝜇𝜇1 − 𝜇𝜇2
𝑇𝑇 =
1 1
𝑠𝑠𝑝𝑝 𝑛𝑛 + 𝑛𝑛
1 2
Hai mẫu độc lập – không biết phương sai hai tổng thể nhưng biết chúng bang
nhau và (𝑛𝑛1 < 30, 𝑛𝑛2 < 30)

• Bước 3: Tính tiêu chuẩn kiểm định (test statistic)


𝑋𝑋�1 − 𝑋𝑋�2 − 𝜇𝜇1 − 𝜇𝜇2
𝑇𝑇 =
1 1
𝑠𝑠𝑝𝑝 𝑛𝑛 + 𝑛𝑛
1 2
𝑛𝑛1 −1 𝑆𝑆12 + 𝑛𝑛2 −1 𝑆𝑆22
Với 𝑆𝑆𝑃𝑃2 = , 𝑘𝑘 = 𝑛𝑛1 + 𝑛𝑛2 − 2.
𝑛𝑛1 +𝑛𝑛2 −2
Hai mẫu độc lập – không biết phương sai hai tổng thể nhưng biết chúng
bang nhau và (𝑛𝑛1 < 30, 𝑛𝑛2 < 30)

• Bước 4: Xác định giá trị tới hạn hoặc giá trị kiểm định (critical
value): Vùng giới hạn hay vùng bác bỏ là tập hợp tất cả các giá trị bác
bỏ 𝐻𝐻0 .
Hai mẫu độc lập – không biết phương sai hai tổng thể nhưng biết chúng
bang nhau và (𝑛𝑛1 < 30, 𝑛𝑛2 < 30)

• Bước 5: So sánh giá trị kiểm định với tiêu chuẩn kiểm định:
Hai đuôi: Bác bỏ 𝐻𝐻0 nếu 𝑡𝑡0 < −𝑡𝑡𝛼𝛼/2 hoặc 𝑡𝑡0 > 𝑡𝑡𝛼𝛼/2
Đuôi trái: Bác bỏ 𝐻𝐻0 nếu 𝑡𝑡0 < −𝑡𝑡𝛼𝛼
Đuôi phải: Bác bỏ 𝐻𝐻0 nếu 𝑡𝑡0 > −𝑡𝑡𝛼𝛼
• Bước 6: Kết luận.
Ví dụ:
• Từ một chuồng lợn, nuôi theo phương pháp A, sau 4 tháng chọn cân ngẫu
nhiên 14 con lợn thu được trọng lượng trung bình là 75.5kg và độ lệch chuẩn
là 3kg.
• Từ một chuồng khác nuôi theo phương pháp B, sau 4 tháng cân ngẫu nhiên
13 con và trọng lượng trung bình thu được là 73.5kg và độ lệch chuẩn tương
ứng 2.8kg.
• Với mức ý nghĩa 5%, có thể cho rằng trọng lượng trung bình của lợn nuôi
theo phương pháp A cao hơn phương pháp B không? Giả thiết trọng lượng
của lợn tuân theo phân phối chuẩn và phương sai trọng lượng ở hai chuồng
là bằng nhau.
Giải
D0 = 0, 𝛼𝛼 = 0.05, 𝑛𝑛1 = 14, 𝑛𝑛2 = 13, 𝑋𝑋�1 = 75.5, 𝑋𝑋�2 = 73.5, 𝑠𝑠1 = 3, 𝑠𝑠2 = 7.84
𝐻𝐻0 : 𝜇𝜇1 − 𝜇𝜇2 = 0
• Bước 1: Xác định cặp giả thuyết.: �
𝐻𝐻1 : 𝜇𝜇1 − 𝜇𝜇2 > 0
• Bước 2: Xác định mức ý nghĩa 𝛼𝛼 = 0.0
• Bước 3: Tính tiêu chuẩn kiểm định:
2 2
2
𝑛𝑛1 − 1 𝑆𝑆1 + 𝑛𝑛2 − 1 𝑆𝑆2 13 × 9 + 12 × 7.84
𝑆𝑆𝑃𝑃 = = = 8.4432
𝑛𝑛1 − 𝑛𝑛2 − 2 14 + 13 − 2

𝑋𝑋�1 − 𝑋𝑋�2 − 𝜇𝜇1 − 𝜇𝜇2 75.5 − 73.5 − 0


𝑇𝑇 = = = 1.787
1 1 1 1
𝑠𝑠𝑝𝑝 +
𝑛𝑛1 𝑛𝑛2 2.906 +
14 13

𝑘𝑘 = 𝑛𝑛1 + 𝑛𝑛2 − 2 = 14 + 13 − 2 = 25
Giải
Bước 4: Xác định giá trị kiểm định:
25
Do kiểm định này là phía phải nên 𝑡𝑡𝛼𝛼𝑘𝑘 = 𝑡𝑡0.05 = 1.708

Bước 5: So sánh ⇒ bác bỏ 𝐻𝐻0 .


• Bước 6: Có đủ bằng chứng để kết luận rằng trọng lượng heo nuôi theo phương
pháp A cao hơn trọng lượng heo nuôi theo phương pháp B.
5. Kiểm định giả thuyết cho tỉ lệ hai phương
sai tổng thể của hai phân phối chuẩn
• Điều kiện để kiểm định cho tỉ lệ phương sai (𝜎𝜎12 , 𝜎𝜎22 ):
• Mỗi mẫu được lấy phải ngẫu nhiên.
• Dữ liệu của mẫu là độc lập.
• Tổng thể của hai mẫu phải là phân phối chuẩn.
Hai mẫu độc lập – không biết phương sai hai tổng thể nhưng biết chúng bằng
nhau và (𝑛𝑛1 < 30, 𝑛𝑛2 < 30)

• Bước 1: Xác định giả thuyết gốc và đối thuyết.


𝐻𝐻0 : 𝜎𝜎12 = 𝜎𝜎22 𝐻𝐻0 : 𝜎𝜎12 = 𝜎𝜎22 𝐻𝐻0 : 𝜎𝜎12 = 𝜎𝜎22
� 2 2 � 2 2 �
𝐻𝐻1 : 𝜎𝜎1 ≠ 𝜎𝜎2 𝐻𝐻1 : 𝜎𝜎1 < 𝜎𝜎2 𝐻𝐻1 : 𝜎𝜎12 > 𝜎𝜎22
(hai đuôi) (đuôi trái) (đuôi phải)
• Bước 2: Xác định mức ý nghĩa hay khả năng cho phép mắc sai lầm
loại I (𝜶𝜶) (level of significance).
• Bước 3: Tính tiêu chuẩn kiểm định (test statistic)
𝑠𝑠12
𝐹𝐹0 = 2
𝑠𝑠2
Với độ tư do là (𝑛𝑛1 − 1, 𝑛𝑛2 − 1).
Hai mẫu độc lập – không biết phương sai hai tổng thể nhưng biết chúng
bằng nhau và (𝑛𝑛1 < 30, 𝑛𝑛2 < 30)

• Bước 4: Xác định giá trị tới hạn hoặc giá trị kiểm định (critical
value): Vùng giới hạn hay vùng bác bỏ là tập hợp tất cả các giá trị bác
bỏ 𝐻𝐻0 .
Hai mẫu độc lập – không biết phương sai hai tổng thể nhưng biết chúng
bằng nhau và (𝑛𝑛1 < 30, 𝑛𝑛2 < 30)

• Bước 5: So sánh giá trị kiểm định với tiêu chuẩn kiểm định:
(𝑛𝑛1 −1,𝑛𝑛2 −1) (𝑛𝑛1 −1,𝑛𝑛2 −1)
Hai đuôi: Bác bỏ 𝐻𝐻0 nếu 𝐹𝐹0 < 𝐹𝐹 𝛼𝛼 hoặc𝐹𝐹0 > 𝐹𝐹𝛼𝛼
1−
2 2
(𝑛𝑛 −1,𝑛𝑛2 −1)
Đuôi trái: Bác bỏ 𝐻𝐻0 nếu 𝐹𝐹0 < 𝐹𝐹1−𝛼𝛼1
(𝑛𝑛1 −1,𝑛𝑛2 −1)
Đuôi phải: Bác bỏ 𝐻𝐻0 nếu𝐹𝐹0 > 𝐹𝐹𝛼𝛼
• Bước 6: Kết luận.
Ví dụ:
• Một nhà nghiên cứu về trọng lượng hai kiện hàng của hai công ty A và B
xem các kiện hàng công ty A có có đồng đều hơn các kiện hàng của công ty
B không. Ông ta tiến hành lấy 18 kiện hàng của công ty A và 16 kiện hàng
của công ty B. Kết quả thu được ở bảng sau:
Khối lượng kiện hàng công ty A Khối lượng kiện hàng công ty B
5.70 5.67 5.67 5.55
5.73 5.61 5.70 5.61
5.70 5.67 5.72 5.58
5.65 5.62 5.66 5.74
5.73 5.65 5.70 5.68
5.79 5.73 5.68 5.53
5.77 5.71 5.67 5.55
5.70 5.76 5.61 5.74
5.73 5.72
Giải
𝛼𝛼 = 0.05, 𝑛𝑛1 = 18, 𝑛𝑛2 = 16, 𝑋𝑋�1 = 5.7022, 𝑋𝑋�2 = 5.6494, 𝑠𝑠1 = 0.0497, 𝑠𝑠2 =
0.0689
𝐻𝐻0 : 𝜎𝜎12 = 𝜎𝜎22
• Bước 1: Xác định cặp giả thuyết.: �
𝐻𝐻1 : 𝜎𝜎12 < 𝜎𝜎22
• Bước 2: Xác định mức ý nghĩa 𝛼𝛼 = 0.05
• Bước 3: Tính tiêu chuẩn kiểm định:
𝑠𝑠12 0.04972
𝐹𝐹0 = 2 = 2
= 0.52
𝑠𝑠2 0.0689
Với độ tư do là (𝑛𝑛1 − 1, 𝑛𝑛2 − 1) = (17, 15) .
Giải
Bước 4: Xác định giá trị kiểm định:
1 1
Do kiểm định này là phía phải nên 𝐹𝐹0.95,17,15 = = = 0.42
𝐹𝐹0.05,15,17 2.40

• Bước 5: So sánh: 𝐹𝐹0 > 𝐹𝐹0.95,17,15 ⇒ không bác bỏ 𝐻𝐻0 .


• Bước 6: Không có đủ bằng chứng để kết luận rằng kiện hàng của công ty A đồng
đều hơn kiện hàng của công ty B.
Kết quả khi chạy Excel
5. Kiểm định giả thuyết cho tỉ lệ hai tổng thể
phân phối chuẩn
• Điều kiện để kiểm định cho tỉ lệ hai tổng thể:
• Mỗi mẫu được lấy ngẫu nhiên và độc lập.
• 𝑛𝑛𝑓𝑓1 1 − 𝑓𝑓1 ≥ 10 và 𝑛𝑛𝑓𝑓2 1 − 𝑓𝑓2 ≥ 10
• 𝑛𝑛1 ≤ 0.05𝑁𝑁1 và 𝑛𝑛2 ≤ 0.05𝑁𝑁2
• Bước 1: Xác định giả thuyết gốc và đối thuyết.
𝐻𝐻0 : 𝑝𝑝1 = 𝑝𝑝2 𝐻𝐻0 : 𝑝𝑝1 = 𝑝𝑝2 𝐻𝐻0 : 𝑝𝑝1 = 𝑝𝑝2
� � �
𝐻𝐻1 : 𝑝𝑝1 ≠ 𝑝𝑝2 𝐻𝐻1 : 𝑝𝑝1 < 𝑝𝑝2 𝐻𝐻1 : 𝑝𝑝1 > 𝑝𝑝2
(hai đuôi) (đuôi trái) (đuôi phải)
• Bước 2: Xác định mức ý nghĩa hay khả năng cho phép mắc sai lầm
loại I (𝜶𝜶) (level of significance).
Hai mẫu độc lập – không biết phương sai hai tổng thể nhưng biết chúng bằng
nhau và (𝑛𝑛1 < 30, 𝑛𝑛2 < 30)

• Bước 3: Tính tiêu chuẩn kiểm định (test statistic)


𝑓𝑓1 − 𝑓𝑓2
𝑧𝑧0 =
̅ ̅ 1 1
𝑓𝑓 1 − 𝑓𝑓 +
𝑛𝑛1 𝑛𝑛2
𝑘𝑘1 +𝑘𝑘2
̅
Với 𝑓𝑓 =
𝑛𝑛1 +𝑛𝑛2
Hai mẫu độc lập – không biết phương sai hai tổng thể nhưng biết chúng
bằng nhau và (𝑛𝑛1 < 30, 𝑛𝑛2 < 30)

• Bước 4: Xác định giá trị tới hạn hoặc giá trị kiểm định (critical
value): Vùng giới hạn hay vùng bác bỏ là tập hợp tất cả các giá trị bác
bỏ 𝐻𝐻0 .
Hai mẫu độc lập – không biết phương sai hai tổng thể nhưng biết chúng
bằng nhau và (𝑛𝑛1 < 30, 𝑛𝑛2 < 30)

• Bước 5: So sánh giá trị kiểm định với tiêu chuẩn kiểm định:
Hai đuôi: Bác bỏ 𝐻𝐻0 nếu 𝑧𝑧0 < −𝑧𝑧𝛼𝛼/2 hoặc 𝑧𝑧0 > 𝑧𝑧𝛼𝛼/2
Đuôi trái: Bác bỏ 𝐻𝐻0 nếu 𝑧𝑧0 < −𝑧𝑧𝛼𝛼
Đuôi phải: Bác bỏ 𝐻𝐻0 nếu 𝑧𝑧0 > −𝑧𝑧𝛼𝛼
• Bước 6: Kết luận.
Ví dụ:
• Kết quả điều tra tại một trung tân thương mại cho thấy trong một ngày có
400 khách hàng nam vào trung tâm, trong đó có 212 người mua hàng và có
500 khách hàng nữ vào trung tâm, trong đó có 285 người mua hàng. Với
mức ý nghĩa 5%, có thể cho rằng nói chung trong dài hạn tỉ lệ khách nam
mua hàng là ít hơn khách nữ hay không?
Giải
𝛼𝛼 = 0.05, 𝑛𝑛1 = 400, 𝑛𝑛2 = 500, 𝑘𝑘1 = 212, 𝑘𝑘2 = 285
𝑘𝑘1 212 𝑘𝑘2 285
𝑓𝑓1 = = = 0.53, 𝑓𝑓2 = = = 0.57
𝑛𝑛1 400 𝑛𝑛2 500

𝑘𝑘1 + 𝑘𝑘2 212 + 285


𝑓𝑓 ̅ = = = 0.552
𝑛𝑛1 + 𝑛𝑛2 400 + 500
𝐻𝐻0 : 𝑝𝑝1 = 𝑝𝑝2
• Bước 1: Xác định cặp giả thuyết.: �
𝐻𝐻1 : 𝑝𝑝1 < 𝑝𝑝2
• Bước 2: Xác định mức ý nghĩa 𝛼𝛼 = 0.05
• Bước 3: Tính tiêu chuẩn kiểm định:
𝑓𝑓1 − 𝑓𝑓2 0.53 − 0.57
𝑧𝑧0 = = − 1.2
̅ ̅ 1 1 1 1
𝑓𝑓 1 − 𝑓𝑓 + 0.552 1 − 0.552 +
𝑛𝑛1 𝑛𝑛2 400 500
Giải
Bước 4: Xác định giá trị kiểm định:
Do kiểm định này là phía trái nên 𝑧𝑧𝛼𝛼 = 1.645

• Bước 5: So sánh: 𝑧𝑧0 > −𝑧𝑧𝛼𝛼 ⇒ không bác bỏ 𝐻𝐻0 .


• Bước 6: Không có đủ bằng chứng để kết luận rằng tỉ lệ nam mua hàng ít hơn tỉ lệ
nữ mua hàng.

You might also like