Ôn Tập Thống Kê Lần 02

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 23

ÔN TẬP THỐNG KÊ 02

PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ

Trương Đức An
tdan.boss@tdanclass.com

Ngày 5 tháng 11 năm 2021


Phân tích phương sai một nhân tố

Bài toán phân tích phương sai một nhân tố - trường hợp các mẫu
bằng nhau
1. Đặt giả thuyết:

H0 : µ1 = µ2 = µ3 = ... = µk

(Trung bình của k tổng thể bằng nhau)

H1 : ∃µi 6= µj (i 6= j)

(Có ít nhất 2 giá trị trung bình ở các tổng thể khác nhau).
2. Xác định miền bác bỏ:

Wα = (Fα;k−1;k(n−1) ; +∞) hay F > Fα;k−1;k(n−1)


với k : số nhóm so sánh, n : số quan sát trong 1 mẫu.

Tìm Fα;k−1;k(n−1) : tra bảng Fisher mức ý nghĩa α và cột k − 1 và dòng k(n − 1).

Trương Đức An tdan.boss@tdanclass.com ÔN TẬP THỐNG KÊ 02 Ngày 5 tháng 11 năm 2021 2 / 23


Phân tích phương sai một nhân tố

Bài toán phân tích phương sai một nhân tố - trường hợp các mẫu
bằng nhau
3. Tính các trung bình: x 1 , x 2 , ..., x k ; x.
4. Tính các tổng bình phương:
k
X
SSB = n (x i − x)2 = n.[(x 1 − x)2 + (x 2 − x)2 + ... + (x k − x)2 ].
i=1
n
X n
X n
X
2 2
SSW = SS1 +SS2 +...+SSk = (x1j −x 1 ) + (x2j −x 2 ) +...+ (xkj −x k )2 .
j=1 j=1 j=1
SST = SSB + SSW

hoặc ta có tính thể tính các tổng bình phương theo thứ tự sau:
k X
X n
SSB (như trên) ; SST = (xij − x)2
i=1 j=1
SSW = SST − SSB
Trương Đức An tdan.boss@tdanclass.com ÔN TẬP THỐNG KÊ 02 Ngày 5 tháng 11 năm 2021 3 / 23
Phân tích phương sai một nhân tố

Bài toán phân tích phương sai một nhân tố - trường hợp các mẫu
bằng nhau
5. Tính các phương sai (trung bình bình phương):
SSB SSW SST
MSB = ; MSW = ; MST =
k −1 k(n − 1) kn − 1
với k : số nhóm so sánh, n : số quan sát trong 1 mẫu.

6. Tính thống kê kiểm định:


MSB
F =
MSW
7. Đưa ra kết luận:
Nếu F > Fα;k−1;k(n−1) ⇔ F ∈ Wα ⇒ Bác bỏ H0 , chấp nhận H1
Nếu F < Fα;k−1;k(n−1) ⇔ F ∈
/ Wα ⇒ không bác bỏ H0

Trương Đức An tdan.boss@tdanclass.com ÔN TẬP THỐNG KÊ 02 Ngày 5 tháng 11 năm 2021 4 / 23


Phân tích phương sai một nhân tố

Bài toán phân tích phương sai một nhân tố - trường hợp các mẫu
bằng nhau
Bảng mô hình phân tích phương sai một nhân tố (trường hợp các mẫu
bằng nhau):

Nguồn của sự biến thiên SS df MS F


Giữa các nhóm SSB k-1 MSB
MSB
Trong từng nhóm SSW k(n - 1) MSW F=
Toàn bộ SST kn - 1 MSW

Trương Đức An tdan.boss@tdanclass.com ÔN TẬP THỐNG KÊ 02 Ngày 5 tháng 11 năm 2021 5 / 23


Phân tích phương sai một nhân tố
BT - 01
Một nhà sản xuất các túi giấy dùng để đựng hoa quả muốn tăng độ chịu kéo của
sản phẩm, các kỹ sư tin rằng độ chịu kéo phụ thuộc vào tỉ lệ gỗ cứng có trong
bột giấy và tỉ lệ này có giá trị từ 5% đến 20%. Nhóm kỹ sư phụ trách nghiên cứu
này đã quyết định thử nghiệm ở bốn mức tỉ lệ: 5%, 10%, 15%, và 20%. Họ kiểm
tra sáu mẫu ở mỗi mức tỉ lệ. Tất cả 24 mẫu được kiểm tra độ chịu kéo với cùng
một thiết bị và theo thứ tự ngẫu nhiên. Dưới đây là dữ liệu thu được:

Tỉ lệ gỗ cứng Độ chịu kéo Tổng Trung bình


5% 7 ; 8 ; 15 ; 11 ; 9 ; 10 60 10.00
10% 12 ; 17 ; 13 ; 18 ; 19 ; 15 94 15.67
15% 14 ; 18 ; 19 ; 17 ; 16 ; 18 102 17.00
20% 19 ; 25 ; 22 ; 23 ; 18 ; 20 127 21.17

Thực hiện kiểm định với mức ý nghĩa 5%.

Trương Đức An tdan.boss@tdanclass.com ÔN TẬP THỐNG KÊ 02 Ngày 5 tháng 11 năm 2021 6 / 23


Phân tích phương sai một nhân tố
BT - 01
.

Trương Đức An tdan.boss@tdanclass.com ÔN TẬP THỐNG KÊ 02 Ngày 5 tháng 11 năm 2021 7 / 23


Phân tích phương sai một nhân tố
BT - 02
Một nhà sản xuất các túi giấy dùng để đựng hoa quả muốn tăng độ chịu kéo của
sản phẩm, các kỹ sư tin rằng độ chịu kéo phụ thuộc vào tỉ lệ gỗ cứng có trong
bột giấy. Nhóm kỹ sư phụ trách nghiên cứu này đã quyết định thử nghiệm ở năm
mức tỉ lệ: 5%, 8%, 11%, 14% và 17%. Họ kiểm tra 4 mẫu ở mỗi mức tỉ lệ. Tất
cả 20 mẫu được kiểm tra độ chịu kéo với cùng một thiết bị và theo thứ tự ngẫu
nhiên. Dưới đây là dữ liệu thu được:

5% 8% 11% 14% 17%


12.3 14.1 22.7 32.3 35.8
17.4 16 14.4 33.1 37
14.3 14.3 24.9 33.1 47.3
9.9 15 17.5 31.8 32.7

Giả sử các giả thuyết về phân phối chuẩn đều thoả và α = 0.01. Hãy dùng
phương pháp Anova để đưa ra kết luận phù hợp.

Trương Đức An tdan.boss@tdanclass.com ÔN TẬP THỐNG KÊ 02 Ngày 5 tháng 11 năm 2021 8 / 23


Phân tích phương sai một nhân tố
BT - 02
a. Phép kiểm định được sử dụng ở đây là gì? _______
b. Điền các giá trị còn thiếu vào bảng sau:

Tác nhân Bậc tự do Tổng bình phương Trung bình bình phương F
Nghiệm thức ____ _________ ____________ _______
Sai số ____ _________ ____________
Toàn thể ____ _________

c. Miền bác bỏ giả thuyết H0 : (_______; _______)


d. Kết luận nào có thể rút ra sau khi phân tích Anova?
Độ chịu kéo phụ thuộc vào tỷ lệ lệ gỗ cứng trong bột giấy.
Độ chịu kéo không phụ thuộc vào tỷ lệ lệ gỗ cứng trong bột giấy.
e. Xây dựng khoảng tin cậy hai phía với độ tin cậy 99% cho độ chịu kéo trung
bình của nhóm tương ứng với tỉ lệ gỗ 8%: (_______; _______)

Trương Đức An tdan.boss@tdanclass.com ÔN TẬP THỐNG KÊ 02 Ngày 5 tháng 11 năm 2021 9 / 23


Phân tích phương sai một nhân tố
BT - 03
Trong một nghiên cứu, người ta sử dụng 8 loại phân bón khác nhau cho cùng
một loại cây trồng, và tương ứng với mỗi loại phân bón có 23 mẫu cây. Sử dụng
mức ý nghĩa α = 0.05. Điền các giá trị còn thiếu trong bảng Anova dưới đây:

Độ lệch SS df MS F
Giữa các nhóm 51.143 ____ ____________ _______
Trong từng nhóm _________ ____ ____________
Toàn thể 658.343 ____

a. Với mức ý nghĩa cho trước, kết luận của phương pháp Anova là gì?
Bác bỏ giả thuyết H0 .
Không thể bác bỏ giả thuyết H0 .
b. Kết luận về các loại phân bón là gì?
Ảnh hưởng của các loại phân bón là không có ý nghĩa.
Ảnh hưởng của các loại phân bón là có ý nghĩa.
Trương Đức An tdan.boss@tdanclass.com ÔN TẬP THỐNG KÊ 02 Ngày 5 tháng 11 năm 2021 10 / 23
Phân tích phương sai một nhân tố
BT - 04
Người ta khảo sát số giờ tự học môn XSTK trong một tuần của 4 nhóm sinh
viên: Nhóm 1 gồm những sinh viên đến lớp đầy đủ; nhóm 2 gồm những sinh viên
đến lớp tương đối đầy đủ; nhóm 3 gồm những sinh viên thỉnh thoảng đến lớp và
nhóm 4 gồm những sinh viên không đến lớp. Bảng dưới đây thể hiện một phần
của số liệu 4 mẫu nhận được. Hãy dùng phương pháp Anova để kiểm định xem
thời gian tự học trung bình của 4 nhóm sinh viên trên có như nhau hay không,
kết luận với mức ý nghĩa 1%.

Trương Đức An tdan.boss@tdanclass.com ÔN TẬP THỐNG KÊ 02 Ngày 5 tháng 11 năm 2021 11 / 23


Phân tích phương sai một nhân tố
BT - 04
a. Hãy điền những giá trị còn thiếu trong bảng số liệu trên.
b. Yêu cầu nào sau đây không nằm trong điều kiện của mô hình bài toán Anova?
Phương sai của thời gian tự học ở 4 nhóm là như nhau
Thời gian tự học trung bình của 4 nhóm là như nhau
Các mẫu được lấy độc lập
c. Miền bác bỏ giả thiết kiểm định H0 . Đáp án: (_______ ; _______)
d. Tính giá trị SSB (một kí hiệu khác là SSTr). Đáp án: _______
e. Tính giá trị MSW (một kí hiệu là MSE). Đáp án: _______
f. Tính tiêu chuẩn kiểm định F. Đáp án: _______
g. Kết luận cho bài toán:
Chưa bác bỏ được giả thiết H0
Bác bỏ giả thiết H0

Trương Đức An tdan.boss@tdanclass.com ÔN TẬP THỐNG KÊ 02 Ngày 5 tháng 11 năm 2021 12 / 23


Phân tích phương sai một nhân tố
BT - 05
Hội chứng thiếu sắt là dạng suy dinh dưỡng phổ biến nhất ở các nước đang phát
triển. Trước đây, mọi người thường dùng nồi sắt để nấu thức ăn. Sau này, nồi
nhôm đã được sử dụng nhiều hơn vì nó rẻ hơn và nhẹ hơn. Có ý kiến cho rằng vật
liệu nồi ảnh hưởng đến hàm lượng sắt có trong thức ăn. Để kiểm chứng ý kiến
này, người ta chọn một món ăn phổ biến và lần lượt dùng một trong ba loại nồi,
nhóm, đất, và sắt để chế biến món ăn. Bốn mẫu thức ăn được chọn ngẫu nhiên
từ mỗi nồi. Dưới đây là hàm lượng sắt đo được trong các mẫu thức ăn.

Vật liệu nồi Hàm lượng sắt (mg/100g thức ăn)


Nhôm 1.77 ; 2.36 ; 1.96 ; 2.14
Đất 2.27 ; 1.28 ; 2.48 ; 2.68
Sắt 5.27 ; 5.17 ; 4.06 ; 4.22

Với mức ý nghĩa 0.01, hãy kiểm chứng nhận định trên.

Trương Đức An tdan.boss@tdanclass.com ÔN TẬP THỐNG KÊ 02 Ngày 5 tháng 11 năm 2021 13 / 23


Phân tích phương sai một nhân tố
BT - 05
a. Giả thuyết cần kiểm định:
Vật liệu nồi ảnh hưởng đến hàm lượng sắt có trong thức ăn
Vật liệu nồi không ảnh hưởng đến hàm lượng sắt có trong thức ăn
b. Hoàn thành bảng sau:

Trương Đức An tdan.boss@tdanclass.com ÔN TẬP THỐNG KÊ 02 Ngày 5 tháng 11 năm 2021 14 / 23


Phân tích phương sai một nhân tố
BT - 06
Một bác sĩ phòng cấp cứu muốn tìm hiểu xem liệu có bất kỳ sự khác biệt nào về
thời gian khi dùng ba loại thuốc hít khác nhau để làm ngừng cơn hen suyễn.
Trong một khoảng thời gian hàng tuần, cô ấy đã dùng các loại thuốc này cho
những người bị hen suyễn và ghi lại số phút cần để bệnh nhân ngừng cơn hen.
Sau đó, cô dựa vào kết quả đo được từ các nhóm 12 bệnh nhân đã được điều trị
với mỗi loại thuốc, và tính được trung bình mẫu và phương sai mẫu (hiệu chỉnh).
Kết quả được biểu diễn dưới đây:

Thuốc xi si2
A 32 145
B 40 138
C 30 150

Kiểm tra giả thuyết rằng thời gian trung bình để làm ngừng cơn hen là như nhau
đối với cả ba loại thuốc. Sử dụng mức ý nghĩa 5%.

Trương Đức An tdan.boss@tdanclass.com ÔN TẬP THỐNG KÊ 02 Ngày 5 tháng 11 năm 2021 15 / 23


Phân tích phương sai một nhân tố
BT - 06
a. Điền các giá trị còn thiếu trong bảng Anova dưới đây:

Nguồn biến thiên SS df MS F


Giữa các nhóm _________ ____ ____________ _______
Trong từng nhóm _________ ____ ____________
Toàn thể _________ ____

b. Miền bác bỏ giả thuyết H0 : (_______; _______)


c. Kết luận của bài toán?
Chưa đủ bằng chứng để bác bỏ giả thuyết H0
Bác bỏ giả thuyết H0

Trương Đức An tdan.boss@tdanclass.com ÔN TẬP THỐNG KÊ 02 Ngày 5 tháng 11 năm 2021 16 / 23


Phân tích phương sai một nhân tố

Bài toán phân tích phương sai một nhân tố - tổng quát
1. Đặt giả thuyết:

H0 : µ1 = µ2 = µ3 = ... = µk

(Trung bình của k tổng thể bằng nhau)

H1 : ∃µi 6= µj (i 6= j)

(Có ít nhất 2 giá trị trung bình ở các tổng thể khác nhau).
2. Xác định miền bác bỏ:

Wα = (Fα;k−1;N−k ; +∞) hay F > Fα;k−1;N−k


với k : số nhóm so sánh, N : tổng số quan sát trong k mẫu.

Tìm Fα;k−1;N−k : tra bảng Fisher mức ý nghĩa α và cột k − 1 và dòng N − k.

Trương Đức An tdan.boss@tdanclass.com ÔN TẬP THỐNG KÊ 02 Ngày 5 tháng 11 năm 2021 17 / 23


Phân tích phương sai một nhân tố

Bài toán phân tích phương sai một nhân tố - tổng quát
3. Tính các trung bình: x 1 , x 2 , ..., x k ; x (lưu ý cách tính x)
4. Tính các tổng bình phương:
k
X
SSB = ni .(x i − x)2 = n1 .(x 1 − x)2 + n2 .(x 2 − x)2 + ... + nk .(x k − x)2 .
i=1
n1
X n2
X nk
X
SSW = SS1 +SS2 +...+SSk = (x1j −x 1 )2 + (x2j −x 2 )2 +...+ (xkj −x k )2 .
j=1 j=1 j=1
SST = SSB + SSW với ni : số quan sát trong mẫu thứ i.

hoặc ta có tính thể tính các tổng bình phương theo thứ tự sau:
nk
k X
X
SSB (như trên) ; SST = (xij − x)2
i=1 j=1
SSW = SST − SSB

Trương Đức An tdan.boss@tdanclass.com ÔN TẬP THỐNG KÊ 02 Ngày 5 tháng 11 năm 2021 18 / 23


Phân tích phương sai một nhân tố

Bài toán phân tích phương sai một nhân tố - tổng quát
5. Tính các phương sai (trung bình bình phương):
SSB SSW SST
MSB = ; MSW = ; MST =
k −1 N −k N −1
với k : số nhóm so sánh, N : tổng số quan sát trong k mẫu.

6. Tính thống kê kiểm định:


MSB
F =
MSW
7. Đưa ra kết luận:
Nếu F > Fα;k−1;N−k ⇔ F ∈ Wα ⇒ Bác bỏ H0 , chấp nhận H1
Nếu F < Fα;k−1;N−k ⇔ F ∈
/ Wα ⇒ không bác bỏ H0

Trương Đức An tdan.boss@tdanclass.com ÔN TẬP THỐNG KÊ 02 Ngày 5 tháng 11 năm 2021 19 / 23


Phân tích phương sai một nhân tố

Bài toán phân tích phương sai một nhân tố - tổng quát
Bảng mô hình phân tích phương sai một nhân tố (tổng quát):

Nguồn của sự biến thiên SS df MS F


Giữa các nhóm SSB k-1 MSB
MSB
Trong từng nhóm SSW N-k MSW F=
Toàn bộ SST N-1 MSW

Trương Đức An tdan.boss@tdanclass.com ÔN TẬP THỐNG KÊ 02 Ngày 5 tháng 11 năm 2021 20 / 23


Phân tích phương sai một nhân tố
BT - 07
Ba mẫu thiết kế bao bì của một loại sản phẩm được xem xét bằng cách thu thập
doanh số (triệu đồng/năm) của mỗi loại bao bì trong một mẫu ngẫu nhiên của
các cửa hàng. Kết quả được ghi nhận trong bảng sau. Với kiểm định ANOVA ở
mức ý nghĩa 0.01, có thể kết luận rằng doanh số của sản phẩm với các mẫu bao
bì khác nhau là như nhau hay không? (Giả định doanh số các mẫu bao bì có phân
phối chuẩn và phương sai bằng nhau.)

Mẫu bao bì I Mẫu bao bì II Mẫu bao bì III


18 24 19
16 25 24
29 21 24
26 31 28
29 22 15
14 29
12 32
23
Trương Đức An tdan.boss@tdanclass.com ÔN TẬP THỐNG KÊ 02 Ngày 5 tháng 11 năm 2021 21 / 23
Phân tích phương sai một nhân tố
BT - 07

Trương Đức An tdan.boss@tdanclass.com ÔN TẬP THỐNG KÊ 02 Ngày 5 tháng 11 năm 2021 22 / 23


Phân tích phương sai một nhân tố
BT - 08
Một nghiên cứu về thu nhập của các hộ gia đình ở ngoại thành của một thành
phố được thực hiện. Khu vực ngoại thành được chia thành 7 địa bàn dân cư khác
nhau, chọn ngẫu nhiên các hộ trong vùng từng địa bàn và ghi nhận thu nhập. Địa
bàn dân cư thứ 3 có 13 hộ được chọn, tất cả các địa bàn còn lại, mỗi địa bàn có
19 hộ. Kết quả ANOVA từ máy tính như sau:

Nguồn biến thiên Tổng bình phương Bậc tự do TB bình phương F


Giữa các nhóm 187.2649 ____ __________ _____
Trong nội bộ nhóm _______ _____ __________
Tổng cộng 1269.6891 _____

a. Hãy hoàn tất bảng ANOVA.


b. Ở mức ý nghĩa 0.01, có thể cho rằng thu nhập trung bình của các hộ gia đình
ở các địa bàn dân cư khác nhau là như nhau được không?

Trương Đức An tdan.boss@tdanclass.com ÔN TẬP THỐNG KÊ 02 Ngày 5 tháng 11 năm 2021 23 / 23

You might also like