Professional Documents
Culture Documents
Estimation
Estimation
VÀ ƯỚC LƯỢNG
Phân phối mẫu
• Phân phối cho trung bình mẫu
• Phân phối cho tỷ lệ mẫu
1. Phân phối cho trung bình mẫu
• Mô tả phân phối của trung bình mẫu: mẫu tuân theo phân phối chuẩn.
• Mô tả phân phối của trung bình mẫu: mẫu không tuân theo phân phối
chuẩn.
• Thống kê 𝑥𝑥̅ là một đại lượng ngẫu nhiên bởi vì giá trị của nó biến thiên
theo từng mẫu xác định. Vì vậy, nó có phân phối xác suất tương ứng.
Trong chương này, ta sẽ tập trung nghiên cứu về hình dạng, độ đo tập
trung và độ đo phân tán của đại lượng ngẫu nhiên này.
• Phân phối mẫu của thống kê là phân phối xác suất cho tất cả các giá trị
có được của thống kê, được tính từ mẫu có cỡ mẫu là n.
• Phân phối mẫu của trung bình mẫu là phân phối xác suất của tất cả giá
trị có được của đại lượng ngẫu nhiên được tính từ mẫu có cỡ mẫu là n.
Mẫu này được lấy từ tổng thể có phân phối chuẩn với trung bình là 𝜇𝜇
và độ lệch chuẩn 𝜎𝜎.
Minh hoạ phân phối mẫu
• Bước 1: Xác định mẫu ngẫu nhiên có cỡ mẫu là n.
• Bước 2: Tính trung bình mẫu.
• Bước 3: Giả sử ta lấy hữu hạn mẫu từ tổng thể, lặp lại các bước 1, 2
cho đến khi tất cả mẫu nhiên đã được xác định.
Ví dụ 1: Phân phối mẫu cho trung bình mẫu
(Phân phối tổng thể là phân phối chuẩn)
• Trọng lượng của những đồng xu đúc sau năm 1982 tuân theo phân
phối chuẩn với trung bình là 2.46 gam và độ lệch chuẩn là 0.02 gam.
• Xấp xỉ phân phối mẫu của trung bình mẫu, phân phối mẫu được xác
định bởi 200 mẫu ngẫu nhiên có cỡ mẫu n = 5 được lấy từ tổng thể.
• Dữ liệu ở trang kế tiếp đại diện cho trung bình mẫu của 200 mẫu ngẫu
nhiên có cỡ mẫu n = 5.
• Ví dụ: Mẫu đầu tiên (n = 5) có dữ liệu như sau:
2.493 2.466 2.473 2.492 2.471
0.2146
Ví dụ 4: Mẫu được lấy từ tổng thể không tuân
theo phân phối chuẩn
• Khi tung một đồng xu cân đối, ta có bảng tần số tương đối và đồ thị
histogram của phân phối xác suất như sau:
Số
Tần số tương đối
chấm
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6
• 𝜇𝜇 = 3.5, 𝜎𝜎 = 1.708 Phân phối tổng thể không phải là phân phối chuẩn
• Ước lượng phân phối mẫu của 𝑥𝑥̅ được xác định bởi 200 mẫu ngẫu
nhiên có cỡ mẫu n = 4 và tính giá trị trung bình mẫu cho mỗi mẫu
ngẫu nhiên.
• Lặp lại đối với n = 10 và n = 30.
• Đồ thị histogram cho phân phối mẫu của trung bình mẫu đối với từng
cỡ mẫu được trình bày ở trang sau.
Nhận xét
• Trung bình của phân phối mẫu bằng với trung bình tổng thể.
𝜎𝜎
• Độ lệch chuẩn của phân phối mẫu là .
𝑛𝑛
• Trung bình của phân phối mẫu không phụ thuộc vào cỡ mẫu.
Định lý giới hạn trung tâm
• Khi n càng lớn, hình dạng phân phối của trung bình mẫu sẽ tiến gần
đến phân phối chuẩn và không phụ thuộc vào hình dạng của tổng thể.
Ví dụ 5: Định lý giới hạn trung tâm
• Giả sử, trung bình thời gian cho mỗi lần thay dầu nhớt là 11.4 phút và
độ lệch chuẩn là 3.2 phút.
a. Chọn một ngẫu nhiên có cỡ mẫu n = 35, hãy mô tả phân phối mẫu
của trung bình mẫu.
b. Chọn một ngẫu nhiên có cỡ mẫu n = 35, tính xác suất của trung bình
thời gian thay dầu nhớt nhỏ hơn 11 phút.
2. Phân phối cho tỷ lệ mẫu
• Mô tả phân phối cho tỷ lệ mẫu
• Tính xác suất suất cho tỷ lệ mẫu
Ước lượng điểm cho tỷ lệ tổng thể
• Giả sử rằng mỗi người trong một tổng thể chỉ có 2 sự lựa chọn “Có”
hoặc “Không”, một mẫu ngẫu nhiên có cỡ mẫu n được xác định từ
tổng thể.
• Tỷ lệ mẫu được ký hiệu 𝑝𝑝̂ được xác định như sau:
𝑥𝑥
𝑝𝑝̂ =
𝑛𝑛
Trong đó, x là số người trả lời ”Có” trong n người.
• Tỷ lệ mẫu là một thống kê dùng để ước lượng tỷ lệ tổng thể, p
Ví dụ 1: Tính tỷ lệ mẫu.
• Trong một cuộc khảo sát được tiến hành vào tháng 5 năm 2008, tại đại
học Quinnipiac, có 1745 người tham gia được hỏi về vấn đề có đồng ý
với đường lối kinh tế mà tổng thống George W.Bush đang thực hiện.
Có 349 người đồng ý. Xác định ước lượng điểm cho tỷ lệ được chấp
thuận đường lối kinh tế này.
Ví dụ 2: Sử dụng mô phỏng để mô tả phân
phối của tỷ lệ mẫu
• Một cuộc khảo sát của tạp chí Times được tiến hành vào tháng 6 năm
2008. 42% số người đồng ý về việc kết hôn đồng giới.
• Mô tả phân phối của tỷ lệ mẫu cho từng cỡ mẫu n = 10, n = 50,
n = 100.
Nhận xét:
• Hình dáng phân phối: Khi n càng lớn, hình dáng phân phối càng tiến
gần về phân phối chuẩn.
• Độ đo tập trung: trung bình của phân phối tỷ lệ mẫu bằng với tỷ lệ của
tổng thể, p.
• Độ đo phân tán: độ lệch chuẩn của phân phối tỷ lệ mẫu tỷ lệ nghịch
với cỡ mẫu n, nghĩa là khi cỡ mẫu càng tăng thì độ lệch chuẩn càng
giảm và ngược lại.
Phân phối mẫu của 𝑝𝑝̂
Với một mẫu ngẫu nhiên có n phần tử và tỷ lệ tổng thể là p:
• Hình dạng phân phối mẫu của 𝑝𝑝̂ xấp xỉ phân phối chuẩn khi
𝑛𝑛𝑛𝑛 1 − 𝑝𝑝 ≥ 10.
• Trung bình của phân phối mẫu 𝑝𝑝̂ là 𝜇𝜇𝑝𝑝� = 𝑝𝑝.
• Độ lệch chuẩn của phân phối mẫu 𝑝𝑝̂ là
𝑝𝑝(1 − 𝑝𝑝)
𝜎𝜎𝑝𝑝� =
𝑛𝑛
Phân phối mẫu của 𝑝𝑝̂
• Mô hình trên trang trước đó yêu cầu các giá trị được lấy mẫu là độc
lập. Khi lấy mẫu từ các tổng thể có số lượng hữu hạn, giả định này
được xác minh bằng cách kiểm tra rằng cỡ mẫu n không quá 5% cỡ
quần thể N (𝑛𝑛 ≤ 0.05𝑁𝑁).
• Cho dù 𝑛𝑛𝑛𝑛 1 − 𝑝𝑝 ≥ 10 có xảy ra hay không thì trung bình của phân
𝑝𝑝(1−𝑝𝑝)
phối mẫu cho tỷ lệ vẫn là p, độ lệch chuẩn là 𝜎𝜎𝑝𝑝� = .
𝑛𝑛
Ví dụ 3: Mô tả phân phối mẫu của tỷ lệ
• Một cuộc khảo sát của tạp chí Times được tiến hành vào tháng 6 năm
2008. 42% số người đồng ý về việc kết hôn đồng giới. Giả sử rằng
mẫu ngẫu nhiên có 50 người và xác định tỷ lệ phần trăm về việc kết
hôn đồng giới. Mô tả phân phối tỷ lệ mẫu của mẫu có 50 người này.
Ví dụ 4: Tính xác suất của tỷ lệ mẫu
• Theo trung tâm Kiểm soát và Phòng chống bệnh tật, có 18.8% trẻ em
đến trường có độ tuổi từ 6 đến 11 đang bị thừa cân vào năm 2004.
a. Lấy mẫu ngẫu nhiên gồm 90 em có độ tuổi từ 6 đến 11 đang đi học,
tính xác suất có ít nhất 19% trẻ bị thừa cân?
b. Lấy mẫu ngẫu nhiên gồm 90 em có độ tuổi từ 6 đến 11 đang đi học,
và kết quả nhận được có 24 trẻ bị thừa cân. Bạn có nhận xét gì?
ƯỚC LƯỢNG THAM SỐ
Ước lượng tham số
1. Ước lượng điểm:
2. Tiêu chuẩn lựa chọn ước lượng:
3. Lý thuyết ước lượng khoảng:
4. Ước lượng khoảng tham số tổng thể phân phối chuẩn
1. Ước lượng điểm
• Ước lượng điểm là giá trị của thống kê mà có thể ước lượng cho giá
trị của tham số.
• Ví dụ, trung bình mẫu, 𝑥𝑥,̅ là một ước lượng điểm cho trung bình tổng
thể, 𝜇𝜇.
1. Ước lượng điểm
• Ví dụ 1: Tìm một ước lượng điểm
Đồng xu được đúc sau năm 1982 được làm từ 97,5% kẽm và 2,5%
đồng. Dữ liệu sau đây đại diện cho trọng lượng (tính bằng gam) của 17
đồng xu được chọn ngẫu nhiên được đúc sau năm 1982.
2.46 2.47 2.49 2.48 2.50 2.44 2.46 2.45 2.49
2.47 2.54 2.46 2.45 2.46 2.47 2.44 2.45
Xem dữ liệu như một mẫu ngẫu nhiên đơn giản. Ước tính trọng lượng
trung bình tổng thể của đồng xu được đúc sau năm 1982.
1. Ước lượng điểm
• Ví dụ 1: Tìm một ước lượng điểm
Đồng xu được đúc sau năm 1982 được làm từ 97,5% kẽm và 2,5%
đồng. Dữ liệu sau đây đại diện cho trọng lượng (tính bằng gam) của 17
đồng xu được chọn ngẫu nhiên được đúc sau năm 1982.
2.46 2.47 2.49 2.48 2.50 2.44 2.46 2.45 2.49
2.47 2.54 2.46 2.45 2.46 2.47 2.44 2.45
Xem dữ liệu như một mẫu ngẫu nhiên đơn giản. Ước tính trọng lượng
trung bình tổng thể của đồng xu được đúc sau năm 1982.
Gọi X là trọng lượng của loại quả, 𝑋𝑋~𝑁𝑁 𝜇𝜇, 𝜎𝜎 2 , 𝜎𝜎 2 chưa biết.
𝑛𝑛 = 25, 𝑋𝑋� = 30.48, 𝑆𝑆 2 = 8.4267 ⇒ 𝑆𝑆 = 2.9029
c) 𝛼𝛼 = 0.1 ⇒ 𝑡𝑡𝛼𝛼𝑛𝑛−1 = 𝑡𝑡0.05
24
= 1.712
2
Khoảng tin cậy đối xứng:
2.9029 2.9029
30.48 − × 1.712 < 𝜇𝜇 < 30.48 + × 1.712
25 25
Hay
29.4860 < 𝜇𝜇 < 31.4740
Khoảng tin cậy đối xứng cho trung bình loại quả này là (29.4860, 31.4740)
Ví dụ 4:
Gọi X là trọng lượng của loại quả, 𝑋𝑋~𝑁𝑁 𝜇𝜇, 𝜎𝜎 2 , 𝜎𝜎 2 chưa biết.
𝑛𝑛 = 25, 𝑋𝑋� = 30.48, 𝑆𝑆 2 = 8.4267 ⇒ 𝑆𝑆 = 2.9029
d) 𝛼𝛼 = 0.05 ⇒ 𝑡𝑡𝛼𝛼𝑛𝑛−1 = 𝑡𝑡0.025
24
= 2.064
2
Khoảng tin cậy đối xứng cho trung bình loại quả này là (29.2817,
31.6783)
Độ dài khoảng tin cậy: 𝐼𝐼 = 31.6783 − 29.2817 = 2.3966
1
Độ dài khoảng tin cậy giảm đi một nửa: 𝐼𝐼0 = 𝐼𝐼 = 1.1983
2
Áp dụng công thức, ta có
2
′ 4𝑆𝑆 2 𝑛𝑛−1 ′ 4×8.4267
𝑛𝑛 ≥ 𝑡𝑡𝛼𝛼 ⟺ 𝑛𝑛 ≥ × 2.0642 ⟺ 𝑛𝑛′ ≥ 100.001 ≈ 101
𝐼𝐼02 2
1.19832
Vậy cần cân thử 101 quả.
Ví dụ 4:
Gọi X là trọng lượng của loại quả, 𝑋𝑋~𝑁𝑁 𝜇𝜇, 𝜎𝜎 2 , 𝜎𝜎 2 chưa biết.
𝑛𝑛 = 25, 𝑋𝑋� = 30.48, 𝑆𝑆 2 = 8.4267 ⇒ 𝑆𝑆 = 2.9029
e) 𝛼𝛼 = 0.05 ⇒ 𝑡𝑡𝛼𝛼𝑛𝑛−1 = 𝑡𝑡0.025
24
= 2.064
2
Khoảng tin cậy đối xứng cho trung bình loại quả này là (29.2817,
31.6783)
Vậy trọng lượng trung bình của toàn vụ mùa với 10,000 quả là:
(292817, 316783)
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng phương sai tổng thể 𝝈𝝈𝟐𝟐
• Không biết trung bình tổng thể 𝝁𝝁
• Ví dụ 5: Giả sử mức hao phí nguyên liệu cho một đơn vị sản phẩm là
đại lượng ngẫu nhiên tuân theo phân phối chuẩn. Quan sát 25 sản
phẩm, ta có số liệu sau:
Khối lượng nguyên liệu hao phí (gam) 19.5 20.0 20.5
Số sản phẩm 5 18 2
Với độ tin cậy 90%, hãy ước lượng độ phân tán (phương sai và độ lệch
chuẩn) của mức hao phí nguyên liệu trong 2 trường hợp:
a. Mức hao phí nguyên liệu trung bình của một sản phẩm trên tổng thể
là 𝜇𝜇 = 20 gam.
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng phương sai tổng thể 𝝈𝝈𝟐𝟐
• Không biết trung bình tổng thể 𝝁𝝁
• Ví dụ 5: Giả sử mức hao phí nguyên lieu cho một đơn vị sản phẩm là
đại lượng ngẫu nhiên tuân theo phân phối chuẩn. Quan sát 25 sản
phẩm, ta có số liệu sau:
Khối lượng nguyên liệu hao phí (gam) 19.5 20.0 20.5
Số sản phẩm 5 18 2
Với độ tin cậy 90%, hãy ước lượng độ phân tán (phương sai và độ lệch
chuẩn) của mức hao phí nguyên liệu trong 2 trường hợp:
b. Không biết mức hao phí nguyên liệu trung bình trên tổng thể.
Khối lượng nguyên liệu hao phí (gam) 19.5 20.0 20.5
Ví dụ 5: Số sản phẩm 5 18 2
a) Mức hao phí nguyên liệu trung bình của một sản phẩm trên tổng thể là
𝜇𝜇 = 20 gam.
3
Với độ tin cậy 95%, ước lượng sự khác biệt về độ tuổi của khách hàng.
Biết rằng phương sai tổng thể lần lượt là 9 và 10 tuổi.
• Tóm tắt:
𝑛𝑛1 = 36 𝑛𝑛2 = 49
𝑥𝑥̅ = 40 𝑦𝑦� = 35
𝜎𝜎1 = 9 𝜎𝜎2 = 10
Công thức ước lượng hiệu hai trung bình:
𝑋𝑋� − 𝑌𝑌� − 𝜀𝜀 < 𝜇𝜇1 − 𝜇𝜇2 < 𝑋𝑋� − 𝑌𝑌� + 𝜀𝜀
𝜎𝜎12 𝜎𝜎22
Với 𝜀𝜀 = 𝑧𝑧𝛼𝛼/2 +
𝑛𝑛1 𝑛𝑛2
Ta có: độ tin cậy 95% ⇒ 𝛼𝛼 = 0.05 ⇒ 𝑧𝑧𝛼𝛼/2 = 1.96
𝜎𝜎12 𝜎𝜎22 92 102
⇒ 𝜀𝜀 = 𝑧𝑧𝛼𝛼/2 + = 1.96 + = 4.06
𝑛𝑛1 𝑛𝑛2 36 49
Vậy khoảng tin cậy 95% cho sự khác biệt hai trung bình là:
40 − 35 − 4.06 < 𝜇𝜇1 − 𝜇𝜇2 < 40 − 35 + 4.06 ⟺ 0.94 < 𝜇𝜇1 − 𝜇𝜇2 < 9.06
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng sự khác biệt hai trung bình của hai mẫu độc lập (hiệu
hai trung bình)
Trường hợp 2: Chưa biết phương sai tổng thể và kích thước mẫu
lớn hơn 30 (𝒏𝒏𝟏𝟏 > 𝟑𝟑𝟑𝟑 và 𝒏𝒏𝟐𝟐 > 𝟑𝟑𝟑𝟑)
Công thức ước lượng hiệu hai trung bình:
𝑋𝑋� − 𝑌𝑌� − 𝜀𝜀 < 𝜇𝜇1 − 𝜇𝜇2 < 𝑋𝑋� − 𝑌𝑌� + 𝜀𝜀
𝑆𝑆12 𝑆𝑆22
Với 𝜀𝜀 = 𝑧𝑧𝛼𝛼/2 +
𝑛𝑛1 𝑛𝑛2
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng sự khác biệt hai trung bình của hai mẫu độc lập (hiệu
hai trung bình)
Trường hợp 2: Chưa biết phương sai tổng thể và kích thước mẫu
lớn hơn 30 (𝒏𝒏𝟏𝟏 > 𝟑𝟑𝟑𝟑 và 𝒏𝒏𝟐𝟐 > 𝟑𝟑𝟑𝟑)
Ví dụ 8: Bộ Giao thông Vận tải Hoa Kỳ cung cấp số dặm mà cư dân
của 75 khu vực đô thị lớn nhất di chuyển mỗi ngày trên ô tô. Giả sử ta
lấy một mẫu ngẫu nhiên gồm 50 cư dân của thành phố A có trung bình
và độ lệch chuẩn lần lượt là 22.5 và 8.4 dặm một ngày. Một mẫu ngẫu
nhiên khác được lấy ở thành phố B gồm 40 cư dân với trung bình là
18.6 dặm một ngày và độ lệch chuẩn là 7.4 dặm một ngày. Hãy tìm
khoảng tin cậy 95% cho sự khác biệt trung bình của hai tổng thể?
• Tóm tắt:
𝑛𝑛1 = 50 𝑛𝑛2 = 40
𝑥𝑥̅ = 22.5 𝑦𝑦� = 18.6
𝑠𝑠1 = 8.4 𝑠𝑠2 = 7.4
Công thức ước lượng hiệu hai trung bình:
𝑋𝑋� − 𝑌𝑌� − 𝜀𝜀 < 𝜇𝜇1 − 𝜇𝜇2 < 𝑋𝑋� − 𝑌𝑌� + 𝜀𝜀
𝑆𝑆12 𝑆𝑆22
Với 𝜀𝜀 = 𝑧𝑧𝛼𝛼/2 +
𝑛𝑛1 𝑛𝑛2
Ta có: độ tin cậy 95% ⇒ 𝛼𝛼 = 0.05 ⇒ 𝑧𝑧0.025 = 1.96
𝑆𝑆12 𝑆𝑆22 8.42 7.42
⇒ 𝜀𝜀 = 𝑧𝑧𝛼𝛼/2 + = 1.96 + = 3.268
𝑛𝑛1 𝑛𝑛2 50 40
Vậy khoảng tin cậy 95% cho sự khác biệt hai trung bình là:
22.5 − 18.6 − 3.268 < 𝜇𝜇1 − 𝜇𝜇2 < 22.5 − 18.6 + 3.268
⟺ 0.632 < 𝜇𝜇1 − 𝜇𝜇2 < 7.168
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng sự khác biệt hai trung bình của hai mẫu độc lập (hiệu
hai trung bình)
Trường hợp 3: Chưa biết phương sai tổng thể nhưng biết chúng
bằng nhau (𝝈𝝈𝟐𝟐𝟏𝟏 = 𝝈𝝈𝟐𝟐𝟐𝟐 ) và kích thước mẫu nhỏ hơn 30 (𝒏𝒏𝟏𝟏 < 𝟑𝟑𝟑𝟑
hoặc 𝒏𝒏𝟐𝟐 < 𝟑𝟑𝟑𝟑)
Công thức ước lượng hiệu hai trung bình:
𝑋𝑋� − 𝑌𝑌� − 𝜀𝜀 < 𝜇𝜇1 − 𝜇𝜇2 < 𝑋𝑋� − 𝑌𝑌� + 𝜀𝜀
𝑘𝑘 1 1 𝑛𝑛1 −1 𝑆𝑆12 + 𝑛𝑛2 −1 𝑆𝑆22
Với 𝜀𝜀 = 𝑡𝑡𝛼𝛼 𝑆𝑆𝑃𝑃 + , 𝑆𝑆𝑃𝑃2 = , 𝑘𝑘 = 𝑛𝑛1 − 𝑛𝑛2 − 2
𝑛𝑛1 𝑛𝑛2 𝑛𝑛1 −𝑛𝑛2 −2
2
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng sự khác biệt hai trung bình của hai mẫu độc lập (hiệu
hai trung bình)
Trường hợp 3: Chưa biết phương sai tổng thể nhưng biết chúng
bằng nhau (𝝈𝝈𝟐𝟐𝟏𝟏 = 𝝈𝝈𝟐𝟐𝟐𝟐 ) và kích thước mẫu nhỏ hơn 30 (𝒏𝒏𝟏𝟏 < 𝟑𝟑𝟑𝟑
hoặc 𝒏𝒏𝟐𝟐 < 𝟑𝟑𝟑𝟑)
Ví dụ 9: Để xác định hiệu quả của giáo viên đến điểm thi SAT, người ta
lấy ngẫu nhiên mẫu ngẫu nhiên của 2 bang, mỗi bang gồm 4 học sinh và
thu được kết quả: bang thứ nhất có điểm trung bình 330 điểm và độ lệch
chuẩn mẫu 33.67 điểm; bang thứ hai có điểm trung bình 360 điểm và độ
lệch chuẩn mẫu 29.44 điểm. Hãy tìm khoảng tin cậy 95% cho hiệu
điểm thi của hai bang. Biết rằng điểm thi của mỗi bạn có phân phối
chuẩn và giả sử phương sai của hai bang này là bằng nhau.
• Tóm tắt: 𝜎𝜎12 = 𝜎𝜎22 𝑛𝑛1 = 4 𝑛𝑛2 = 4
𝑥𝑥̅ = 330 𝑦𝑦� = 360
𝑠𝑠1 = 33.67 𝑠𝑠2 = 29.44
Công thức ước lượng hiệu hai trung bình:
𝑋𝑋� − 𝑌𝑌� − 𝜀𝜀 < 𝜇𝜇1 − 𝜇𝜇2 < 𝑋𝑋� − 𝑌𝑌� + 𝜀𝜀
𝑘𝑘 1 1 𝑛𝑛1 −1 𝑆𝑆12 + 𝑛𝑛2 −1 𝑆𝑆22
Với 𝜀𝜀 = 𝑡𝑡𝛼𝛼 𝑆𝑆𝑃𝑃 + , 𝑆𝑆𝑃𝑃2 = , 𝑘𝑘 = 𝑛𝑛1 + 𝑛𝑛2 − 2
𝑛𝑛1 𝑛𝑛2 𝑛𝑛1 +𝑛𝑛2 −2
2
6
Ta có: độ tin cậy 95% ⇒ 𝛼𝛼 = 0.05, 𝑘𝑘 = 4 + 4 − 2 = 6 ⇒ 𝑡𝑡0.025 = 2.44
2 2 2 2
𝑛𝑛1 − 1 𝑆𝑆1 + 𝑛𝑛 2 − 1 𝑆𝑆2 4 − 1 × 33.67 + 4 − 1 × 29.44
𝑆𝑆𝑃𝑃2 = = = 1000.19125
𝑛𝑛1 + 𝑛𝑛2 − 2 4+4−2
1 1 1 1
⇒ 𝜀𝜀 = 𝑡𝑡𝛼𝛼𝑘𝑘 𝑆𝑆𝑃𝑃 + = 2.447 × 1000.19125 + = 54.722
2 𝑛𝑛1 𝑛𝑛2 4 4
Vậy khoảng tin cậy 95% cho sự khác biệt hai trung bình là:
330 − 360 − 54.722 < 𝜇𝜇1 − 𝜇𝜇2 < 330 − 360 + 54.722
⟺ −84.722 < 𝜇𝜇1 − 𝜇𝜇2 < 24.722
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng sự khác biệt hai trung bình của hai mẫu độc lập (hiệu hai
trung bình)
Trường hợp 4: Chưa biết phương sai tổng thể nhưng biết chúng
không bằng nhau (𝝈𝝈𝟐𝟐𝟏𝟏 ≠ 𝝈𝝈𝟐𝟐𝟐𝟐 ) và kích thước mẫu nhỏ hơn 30 (𝒏𝒏𝟏𝟏 < 𝟑𝟑𝟑𝟑
hoặc 𝒏𝒏𝟐𝟐 < 𝟑𝟑𝟑𝟑)
Công thức ước lượng hiệu hai trung bình:
𝑋𝑋� − 𝑌𝑌� − 𝜀𝜀 < 𝜇𝜇1 − 𝜇𝜇2 < 𝑋𝑋� − 𝑌𝑌� + 𝜀𝜀
2 2 2
𝑆𝑆1 𝑆𝑆2
+
𝑘𝑘 𝑆𝑆12 𝑆𝑆22 𝑛𝑛1 𝑛𝑛2
Với 𝜀𝜀 = 𝑡𝑡𝛼𝛼 + , 𝑘𝑘 = 2 2 2
𝑛𝑛1 𝑛𝑛2 𝑆𝑆2
1 𝑆𝑆2
2
𝑛𝑛1 𝑛𝑛2
+
𝑛𝑛1 −1 𝑛𝑛2 −1
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng sự khác biệt hai trung bình của hai mẫu độc lập (hiệu hai
trung bình)
Trường hợp 4: Chưa biết phương sai tổng thể nhưng biết chúng
không bằng nhau (𝝈𝝈𝟐𝟐𝟏𝟏 ≠ 𝝈𝝈𝟐𝟐𝟐𝟐 ) và kích thước mẫu nhỏ hơn 30 (𝒏𝒏𝟏𝟏 < 𝟑𝟑𝟑𝟑
hoặc 𝒏𝒏𝟐𝟐 < 𝟑𝟑𝟑𝟑)
Ví dụ 10: Để cung cấp sự khác biệt về trung bình tổng thể số dư tài khoản
của một ngân hàng, ta tiến hành lấy mẫu.
Ở chi nhánh A, 𝑛𝑛1 = 28, 𝑥𝑥1̅ = $1025, 𝑠𝑠1 = $150.
Ở chi nhánh B, 𝑛𝑛2 = 22, 𝑥𝑥̅2 = $910, 𝑠𝑠2 = $125.
Tìm khoảng tin cậy 95% cho sự khác biệt về trung bình của hai chi nhánh
này.
• Tóm tắt: 𝜎𝜎12 ≠ 𝜎𝜎22 𝑛𝑛1 = 28 𝑛𝑛2 = 22
𝑥𝑥̅ = 1025 𝑦𝑦� = 910
𝑠𝑠1 = 150 𝑠𝑠2 = 125
Công thức ước lượng hiệu hai trung bình:
𝑋𝑋� − 𝑌𝑌� − 𝜀𝜀 < 𝜇𝜇1 − 𝜇𝜇2 < 𝑋𝑋� − 𝑌𝑌� + 𝜀𝜀
𝑆𝑆2 𝑆𝑆2 2
1+ 2
𝑘𝑘 𝑆𝑆12 𝑆𝑆22 𝑛𝑛1 𝑛𝑛2
Với 𝜀𝜀 = 𝑡𝑡𝛼𝛼 + 𝑛𝑛 , 𝑘𝑘 = 2 2 2
𝑛𝑛1 2 𝑆𝑆2
1 𝑆𝑆2
2
𝑛𝑛1 𝑛𝑛2
+
𝑛𝑛1 −1 𝑛𝑛2 −1
2 2 2 2 2
𝑆𝑆1 𝑆𝑆2 1502
125
𝑛𝑛1 + 𝑛𝑛2 28 + 22
𝑘𝑘 = = = 47.805 ≈ 47
2 2 2 2 1502 2
1252 2
𝑆𝑆1 𝑆𝑆2
𝑛𝑛1 𝑛𝑛2 28 22
28 − 1 + 22 − 1
𝑛𝑛1 − 1 + 𝑛𝑛2 − 1
47
Ta có: độ tin cậy 95% ⇒ 𝛼𝛼 = 0.05, 𝑘𝑘 = 4 + 4 − 2 = 6 ⇒ 𝑡𝑡0.025 = 2.012 (Ex𝑐𝑐𝑐𝑐𝑐𝑐)
• Tóm tắt: 𝜎𝜎12 ≠ 𝜎𝜎22 𝑛𝑛1 = 28 𝑛𝑛2 = 22
𝑥𝑥̅1 = 1025 𝑥𝑥̅2 = 910
𝑠𝑠1 = 150 𝑠𝑠2 = 125
Công thức ước lượng hiệu hai trung bình:
𝑋𝑋� − 𝑌𝑌� − 𝜀𝜀 < 𝜇𝜇1 − 𝜇𝜇2 < 𝑋𝑋� − 𝑌𝑌� + 𝜀𝜀
𝑆𝑆2 𝑆𝑆2 2
1+ 2
𝑘𝑘 𝑆𝑆12 𝑆𝑆22 𝑛𝑛1 𝑛𝑛2 47
Với 𝜀𝜀 = 𝑡𝑡𝛼𝛼 + 𝑛𝑛 , 𝑘𝑘 = 2 2 , 𝑡𝑡0.025 = 2.012.
𝑛𝑛1 2 𝑆𝑆2
1 𝑆𝑆2
2
2
𝑛𝑛1 𝑛𝑛2
+
𝑛𝑛1 −1 𝑛𝑛2 −1
0.335 0.335
0.3 − 2.571 × ≤ 𝜇𝜇1 − 𝜇𝜇2 ≤ 0.3 + 2.571 ×
6 6
⟺ −0.052 ≤ 𝜇𝜇1 − 𝜇𝜇2 ≤ 0.652
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng sự khác biệt giữa hai tỷ lệ tổng thể
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng sự khác biệt giữa hai tỷ lệ tổng thể
Công thức ước lượng hiệu hai tỷ lệ tổng thể:
𝑓𝑓1 − 𝑓𝑓2 − 𝜀𝜀 < 𝑝𝑝1 − 𝑝𝑝2 < 𝑓𝑓1 − 𝑓𝑓2 + 𝜀𝜀
𝑓𝑓1 1−𝑓𝑓1 𝑓𝑓2 1−𝑓𝑓2
Với 𝜀𝜀 = 𝑧𝑧𝛼𝛼/2 +
𝑛𝑛1 𝑛𝑛2
1 1 𝑛𝑛1 𝑓𝑓1 +𝑛𝑛2 𝑓𝑓2
Hoặc 𝜀𝜀 = 𝑧𝑧𝛼𝛼/2 𝑓𝑓 ̅ 1 − 𝑓𝑓 ̅ + ̅
với 𝑓𝑓 =
𝑛𝑛1 𝑛𝑛2 𝑛𝑛1 +𝑛𝑛2
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng sự khác biệt giữa hai tỷ lệ tổng thể
Ví dụ 11: Thông tin khai thuế của hai văn phòng được ghi nhận như
sau:
Văn phòng 1 Văn phòng 2
Tổng số tờ khai 250 300
Số lượng tờ khai sai 35 27
Tìm khoảng tin cậy 90% cho sự khác biệt tỷ lệ tờ khai thuế sai giữa hai
văn phòng này.
• Tóm tắt: 𝑛𝑛1 = 250 𝑛𝑛2 = 300
𝑥𝑥1 = 35 𝑥𝑥2 = 27
𝑥𝑥1 35 𝑥𝑥2 27
𝑓𝑓1 = = = 0.14 𝑓𝑓2 = = = 0.09
𝑛𝑛1 250 𝑛𝑛2 300
Công thức ước lượng hiệu hai tỷ lệ tổng thể:
𝑓𝑓1 − 𝑓𝑓2 − 𝜀𝜀 < 𝑝𝑝1 − 𝑝𝑝2 < 𝑓𝑓1 − 𝑓𝑓2 + 𝜀𝜀
𝑓𝑓1 1−𝑓𝑓1 𝑓𝑓2 1−𝑓𝑓2
Với 𝜀𝜀 = 𝑧𝑧𝛼𝛼/2 +
𝑛𝑛1 𝑛𝑛2