Professional Documents
Culture Documents
16TKTKDc5. Phan Bo Mau Va Uoc Luong Khoang Hung Tomtat
16TKTKDc5. Phan Bo Mau Va Uoc Luong Khoang Hung Tomtat
16TKTKDc5. Phan Bo Mau Va Uoc Luong Khoang Hung Tomtat
PHÂN BỐ MẪU
và ƯỚC LƯỢNG KHOẢNG
Ước lượng khoảng của trung bình tổng thể: không biết s
Một
Một Tổng
Tổng thể
thể là
là tập
tập hợp
hợp tất
tất cả
cả các
các phần
phần tử
tử cần
cần
quan
quan tâm
tâm trong
trong một
một nghiên
nghiên cứu.
cứu.
Một
Một Mẫu
Mẫu là
là một
một tập
tập hợp
hợp con
con của
của tổng
tổng thể.
thể.
Mục
Mục đích
đích của
của thống
thống kê
kê suy
suy diễn
diễn là
là thu
thu thập
thập
thông
thông tin
tin về
về tổng
tổng thể
thể từ
từ các
các thông
thông tin
tin có
có trong
trong
mẫu.
mẫu.
Các
Các trị
trị thống
thống kê
kê mẫu:
mẫu:
Một
Một đặc
đặc trưng
trưng của
của mẫu
mẫu như
như trung
trung bình
bình mẫu
mẫu ,,
độ x chuẩn
độ lệch
lệch chuẩn mẫu
mẫu s,s, tỷ
tỷ lệ
lệ mẫu
mẫu .. p
Giá
Giá trị
trị của
của trị
trị thống
thống kê
kê mẫu
mẫu được
được dùng
dùng để
để ước
ước
lượng
lượng giá
giá trị
trị tham
tham số
số của
của tổng
tổng thể.
thể.
Trong
Trong Ước
Ước lượng
lượng điểm,
điểm, chúng
chúng ta
ta sử
sử dụng
dụng dữ
dữ liệu
liệu
từ
từ mẫu
mẫu để
để tính
tính một
một giá
giá trị
trị của
của trị
trị thống
thống kê
kê mẫu
mẫu và
và
dựa
dựa vào
vào đó
đó cung
cung cấp
cấp một
một ước
ước lượng
lượng về
về một
một tham
tham số
số
của
của tổng
tổng thể.
thể.
Ước
Ước lượng
lượng điểm
điểm là
là một
một trị
trị thống
thống kê
kê mẫu
mẫu
(( x,, ss hay
hay p)) cung
cung cấp
cấp ước
ước lượng
lượng điểm
điểm về
về
tham
tham số
số của
của tổng
tổng thể (, hay
thể (, hay p).
p).
Khi giá trị kỳ vọng của ước lượng điểm bằng với
tham số tổng thể, ước lượng điểm gọi là không thiên
lệch
Giá trị tuyệt đối của hiệu giữa ước lượng điểm không
thiên lệch và tham số tổng thể tương ứng gọi là Sai
số lấy mẫu.
Sai số lấy mẫu là kết quả của việc dùng tập con của
tổng thể (mẫu), mà không phải toàn bộ mẫu.
Các phương pháp thống kê có thể được dùng để tính
các báo cáo xác suất về kích thước của sai số lấy mẫu.
© 2005 Thomson/South-Western Slide
13
Sai số lấy mẫu
Sai số lấy mẫu là:
| p p| cho tỷ lệ mẫu
i
( x ) 2
80
900
E( x ) =
Với:
= Trung bình tổng thể
N n
x ( ) x
n N 1 n
• Tổng thể hữu hạn được xử lý như vô hạn (Bỏ
qua nhân tố điều chỉnh tổng thể hữu hạn) nếu
n/N < .05.
• ( N n ) / ( N 1) là nhân tố điều chỉnh tổng
thể hữu hạn.
• x xem như là sai số chuẩn của trung bình.
© 2005 Thomson/South-Western Slide
28
DẠNG PHÂN PHỐI MẪU CỦA x
Phân phối của x
• Câu hỏi: Phân phối xác suất của x là gì?
Phân phối
m ẫu 80
của x x 14.6
n 30
x
E( x ) 990
Phân phối
m ẫu x 14.6
của x
x
990 1000
Phân phối
m ẫu x 14.6
của x
x
980 990
Phân phối
m ẫu x 14.6
của x
x
980 990 1000
Giả sử chọn mẫu ngẫu nhiên đơn giản 100 ứng viên
thay vì chỉ xem xét 30 như ban đầu.
Với n = 100,
x 8
Với n = 30,
x 14.6
x
E( x ) 990
x
980 990 1000
Độ hữu hiệu
Độ nhất quán
Độ hữu hiệu
Cho hai ước lượng điểm không thiên lệch của tham số tổng
thể, ước lượng điểm với độ lệch chuẩn nhỏ hơn
θ̂1được xem là hiệu quả hơn θ̂nếu:2
Độ nhất quán
Các cỡ mẫu lớn hơn sẽ cung cấp các ước lượng điểm gần với
tham số của tổng thể.
Không
Không th
thểể kỳ
kỳ vvọọng ướcc llượ
ng ướ ượng
ng đi
điểểm
m cung
cung ccấấpp
giá
giá tr
trịị chính
chính xác
xác ccủủaa tham
tham ssốố ttổổng
ng th
thểể..
Có
Có ththểể tính ướcc llượ
tính ướ ượng ng kho ng bbằằng
khoảảng ng cách
cách ccộộng
ng
và
và tr
trừừ biên
biên ccủủaa sai
sai ssốố vvớớii ướ
ướcc llượ
ượng
ng đi
điểểm.
m.
M
Mụụcc tiêu
tiêu ccủủaa ướ
ướcc llượ
ượng
ng kho ng là
khoảảng là cung
cung ccấấpp
thông
thông tin
tin vvềề ướ
ướcc llượ
ượng
ng đi
điểểm
m ggầầnn vvớớii giá
giá tr
trịị ccủủaa
tham
tham ssốố nh
nhưư th
thếế nào.
nào.
© 2005 Thomson/South-Western Slide
48
BIÊN CỦA SAI SỐ và ƯỚC LƯỢNG KHOẢNG
DDạạng
ng ttổổng
ng quát
quát ccủủaa ướ
ướcc llượ
ượng
ng kho
khoảảng
ng ccủủaa
trung
trung bình
bình ttổổng
ng th
thểể..
Phân phối
m ẫu
của x
x
z /2 x z /2 x
© 2005 Thomson/South-Western Slide
51
ƯỚC LƯỢNG KHOẢNG CỦA TRUNG BÌNH TỔNG THỂ:
Biết s
Phân phối
m ẫu
của x
1 - của tất cả
/2 /2
các giá trị x
Khoảng
không x
có m z /2 x Kho
interval
ảng
z /2 x
có m m
includes
[------------------------- x -------------------------]
[------------------------- x -------------------------]
[------------------------- x -------------------------]
Trong
Trong hhầầuu hhếếtt các
các ứứng
ng ddụụng,
ng, kích
kích th ướcc m
thướ mẫẫuu
nn == 30
30 thích
thích hhợợp.
p.
N
Nếếuu phân
phân ph
phốốii ttổổng
ng th
thểể có
có đđộộ llệệch
ch cao
cao ho
hoặặcc
ch
chứứaa các
các đi
điểểm
m cá
cá bi
biệệt,t, thì
thì nên
nên ch
chọọnn kích
kích th ướcc
thướ
m
mẫẫuu llớớnn hhơơnn ho
hoặặcc bbằằng
ng 50.
50.
N
Nếếuu ttổổng
ng th
thểể không
không phân
phân ph
phốốii chu
chuẩẩn,
n, nh
nhưưng
ng
cân
cân xxứứng
ng nhi
nhiềều,
u, thì
thì kích
kích th ướcc m
thướ mẫẫuu thích
thích hhợợpp
bbằằng
ng 15.
15.
N
Nếếuu ttổổng
ng th
thểể đđượ
ượcc tin
tin là
là xxấấpp xxỉỉ ítít chu
chuẩẩnn hóa,
hóa,
thì
thì có
có th
thểể dùng
dùng kích
kích th ướcc m
thướ mẫẫuu nh
nhỏỏ hhơơnn 15.
15.
$31,100 + $1,470
Hoặc
$29,630 đến $32,570
Phân
Phân ph
phốốii tt là
là hhọọ các
các phân
phân ph
phốốii xác
xác su
suấấtt
ttươ
ương
ng ttựự..
Phân
Phân ph
phốốii tt ccụụ th
thểể ph
phụụ thu
thuộộcc vào
vào tham
tham ssốố ggọọii
là do..
là BBậậcc ttựự do
BBậậcc ttựự do
do tham
tham kh
khảảoo đđếếnn ssốố thông
thông tin
tin đđộộcc llậậpp
đđưưaa vào
vào tính
tính s.s.
Phân
Phân ph
phốốii tt có
có nhi
nhiềềuu bbậậcc ttựự do
do thì
thì ítít phân
phân tán.
tán.
Khi
Khi ssốố bbậậcc ttựự do
do tăng
tăng lên,
lên, thì
thì khác
khác nhau
nhau gi
giữữaa
phân
phân ph
phốốii tt và
và phân
phân ph
phốốii xác
xác su
suấấtt chu
chuẩẩnn
chu
chuẩẩnn hóa
hóa tr
trởở nên
nên càng
càng nh
nhỏỏ hhơơn.
n.
Phân phối t
Phân phối (20 các bậc tự do)
chuẩn
chuẩn hóa
Phân phối t
(10 các bậc tự do)
z, t
0
V
Vớớii nhi
nhiềềuu hhơơnn 100
100 các
các bbậậcc ttựự do,
do, thì
thì giá
giá tr
trịị zz
chu
chuẩẩnn chu
chuẩẩnn hóa
hóa cung
cung ccấấpp m
mộộtt xxấấpp xxỉỉ ttốốtt đđốốii
vvớớii giá
giá tr
trịị t.t.
Có
Có th
thểể tìm
tìm các
các giá
giá tr
trịị zz chu
chuẩẩnn chu
chuẩẩnn hóa
hóa ởở
hàng
hàng các
các bbậậcc ttựự do vô hhạạnn (( )) ccủủaa bbảảng
do vô ng phân
phân
ph
phốốii t.t.
55
650 2.131 650 29.30
16
Dùng Dùng
s
x z /2 x t /2
n n
Trường hợp biết s Trường hợp không biết s
© 2005 Thomson/South-Western Slide
70
Kích thước mẫu cho ước lượng khoảng của
trung bình tổng thể
G
Gọọii EE == Biên
Biên ccủủaa sai
sai ssốố kỳ
kỳ vvọọng.
ng.
EE ccộộng
ng và
và tr
trừừ vvớớii ướ
ướcc llượ
ượng
ng đi
điểểm
m đđểể llấấyy Ướ
Ướcc
llượ
ượng
ng kho ng..
khoảảng
D
Dạạng
ng ttổổng
ng quát
quát ccủủaa ướ
ướcc llượ
ượng
ng kho
khoảảng
ng ccủủaa ttỷỷ llệệ
ttổổng
ng th
thểể là
là
p Biên của sai số
Phân
Phân ph mẫẫuu ccủủaa p đóng
phốốii m đóng vai
vai trò
trò chính
chính
trong
trong tính
tính biên
biên ccủủaa sai
sai ssốố cho ướcc llượ
cho ướ ượng
ng
kho
khoảảng
ng này.
này.
Có
Có th
thểể xxấấpp xxỉỉ phân
phân ph
phốốii m
mẫẫuu ccủủaa p bbằằng
ng
phân
phân ph
phốốii chu
chuẩẩnn bbấấtt ccứứ khi
khi nào
nào
np >> 55 và
np n(1 –– p)
và n(1 p) >> 5.
5.
/2 /2
1 - của tất cả
các giá trị p
p
p
z /2 p z /2 p
© 2005 Thomson/South-Western Slide
77
ƯỚC LƯỢNG KHOẢNG CỦA
TỶ LỆ TỔNG THỂ
Ước lượng khoảng
p (1 p )
p z / 2
n
.44(1 .44)
.44 1.96 = .44 ± .0435
500
( z / 2 ) 2 p* (1 p* )
n
E2
p(1 p )
z /2 .03
n
Ở độ tin cậy 99%, z.005 = 2.576. Nhớ lại, rằng = .44. p
( z /2 )2 p(1 p) (2.576)2 (.44)(.56)
n 1817
E2 (.03) 2
Ghi chú:
Dùng .44 là ước lượng tốt nhất của p trong các
diễn tả trước. Nếu không có thông tin sẵn
sàng về p, thì thường giả sử là .5 vì nó cung
cấp kích thước mẫu có thể cao nhất. Nếu
dùng p = .5, thì n được khuyên là 1843.