16TKTKDc5. Phan Bo Mau Va Uoc Luong Khoang Hung Tomtat

You might also like

Download as pptx, pdf, or txt
Download as pptx, pdf, or txt
You are on page 1of 86

CHƯƠNG 5

PHÂN BỐ MẪU
và ƯỚC LƯỢNG KHOẢNG

TS. Nguyễn Thanh Hùng

© 2005 Thomson/South-Western Slide


1
Chương 5
Phân bố mẫu và Ước lượng khoảng
Phân bố mẫu
 Giới thiệu vấn đề lấy mẫu

 Lấy mẫu ngẫu nhiên đơn giản

 Ước lượng điểm

 Giới thiệu phân phối mẫu

 Phân phối mẫu của trung bình mẫu x

 Các tính chất của ước lượng điểm

© 2005 Thomson/South-Western Slide


2
Ước lượng khoảng

 Ước lượng khoảng của trung bình tổng thể: biết s

 Ước lượng khoảng của trung bình tổng thể: không biết s

 Xác định cỡ mẫu

 Ước lượng khoảng của tỷ lệ tổng thể

© 2005 Thomson/South-Western Slide


3
GIỚI THIỆU VẤN ĐỀ LẤY MẪU

Một
Một Tổng
Tổng thể
thể là
là tập
tập hợp
hợp tất
tất cả
cả các
các phần
phần tử
tử cần
cần
quan
quan tâm
tâm trong
trong một
một nghiên
nghiên cứu.
cứu.

Một
Một Mẫu
Mẫu là
là một
một tập
tập hợp
hợp con
con của
của tổng
tổng thể.
thể.

Mục
Mục đích
đích của
của thống
thống kê
kê suy
suy diễn
diễn là
là thu
thu thập
thập
thông
thông tin
tin về
về tổng
tổng thể
thể từ
từ các
các thông
thông tin
tin có
có trong
trong
mẫu.
mẫu.

© 2005 Thomson/South-Western Slide


4
GIỚI THIỆU VẤN ĐỀ LẤY MẪU

© 2005 Thomson/South-Western Slide


5
GIỚI THIỆU VẤN ĐỀ LẤY MẪU

Các
Các trị
trị thống
thống kê
kê mẫu:
mẫu:

Một
Một đặc
đặc trưng
trưng của
của mẫu
mẫu như
như trung
trung bình
bình mẫu
mẫu ,,
độ x chuẩn
độ lệch
lệch chuẩn mẫu
mẫu s,s, tỷ
tỷ lệ
lệ mẫu
mẫu .. p

Giá
Giá trị
trị của
của trị
trị thống
thống kê
kê mẫu
mẫu được
được dùng
dùng để
để ước
ước
lượng
lượng giá
giá trị
trị tham
tham số
số của
của tổng
tổng thể.
thể.

© 2005 Thomson/South-Western Slide


6
LẤY MẪU NGẪU NHIÊN ĐƠN GIẢN:
Tổng thể hữu hạn

Định nghĩa của mẫu ngẫu nhiên đơn giản và


quá trình lựa chọn một mẫu ngẫu nhiên đơn
giản tùy thuộc vào tổng thể là hữu hạn hay
vô hạn.
Tổng thể hữu hạn thường được định nghĩa
bằng một danh sách như:
 Số tài khoản thẻ tín dụng
 Số sản phẩm tồn kho
© 2005 Thomson/South-Western Slide
7
LẤY MẪU NGẪU NHIÊN ĐƠN GIẢN:
Tổng thể hữu hạn

 Lấy mẫu từ tổng thể hữu hạn


• Một mẫu ngẫu nhiên đơn giản cỡ mẫu n từ
tổng thể hữu hạn cỡ N là một mẫu được
chọn sao cho mỗi mẫu có thể với cỡ mẫu n
đều có cùng xác suất được chọn.
• Số mẫu ngẫu nhiên đơn giản cỡ mẫu n khác
N!
nhau từ tổng thể hữu hạn cỡ N là:
n! (N  n)!
© 2005 Thomson/South-Western Slide
8
LẤY MẪU NGẪU NHIÊN ĐƠN GIẢN:
Tổng thể hữu hạn

 Lấy mẫu từ tổng thể hữu hạn


• Lấy mẫu không thay thế: Khi một phần tử được chọn
vào mẫu thì nó được lấy ra khỏi tổng thể và không thể
được chọn lần thứ hai.
• Lấy mẫu có thay thế: Khi một phần tử được chọn vào
mẫu thì nó được bỏ trở lại tổng thể. Một phần tử được lựa
chọn lần trước thì nó có thể được lựa chọn lần nữa và vì
vậy phần tử đó có thể xuất hiện trong mẫu hơn một lần.

© 2005 Thomson/South-Western Slide


9
LẤY MẪU NGẪU NHIÊN ĐƠN GIẢN:
Tổng thể vô hạn

 Tổng thể vô hạn thường được định nghĩa là một quá


trình đang diễn ra. Các phần tử của tổng thể vô hạn có
thể không liệt kê được.

 Lấy mẫu từ tổng thể vô hạn


Một mẫu ngẫu nhiên đơn giản từ một tổng thể vô hạn
là một mẫu được chọn phải thỏa mãn các điều kiện sau:
• Mỗi phần tử được chọn phải đến từ cùng một tổng thể
• Mỗi phần tử được chọn một cách độc lập.

© 2005 Thomson/South-Western Slide


10
LẤY MẪU NGẪU NHIÊN ĐƠN GIẢN:
Tổng thể vô hạn

 Trong trường hợp tổng thể vô hạn, không thể


lấy một danh sách gồm tất cả các phần tử
trong tổng thể.

 Thủ tục chọn số ngẫu nhiên không thể dùng


cho tổng thể vô hạn.

© 2005 Thomson/South-Western Slide


11
ƯỚC LƯỢNG ĐIỂM

Trong
Trong Ước
Ước lượng
lượng điểm,
điểm, chúng
chúng ta
ta sử
sử dụng
dụng dữ
dữ liệu
liệu
từ
từ mẫu
mẫu để
để tính
tính một
một giá
giá trị
trị của
của trị
trị thống
thống kê
kê mẫu
mẫu và

dựa
dựa vào
vào đó
đó cung
cung cấp
cấp một
một ước
ước lượng
lượng về
về một
một tham
tham số
số
của
của tổng
tổng thể.
thể.

Ước
Ước lượng
lượng điểm
điểm là
là một
một trị
trị thống
thống kê
kê mẫu
mẫu
(( x,, ss hay
hay p)) cung
cung cấp
cấp ước
ước lượng
lượng điểm
điểm về
về
tham
tham số
số của
của tổng
tổng thể (,  hay
thể (, hay p).
p).

© 2005 Thomson/South-Western Slide


12
Sai số lấy mẫu

 Khi giá trị kỳ vọng của ước lượng điểm bằng với
tham số tổng thể, ước lượng điểm gọi là không thiên
lệch
 Giá trị tuyệt đối của hiệu giữa ước lượng điểm không
thiên lệch và tham số tổng thể tương ứng gọi là Sai
số lấy mẫu.
 Sai số lấy mẫu là kết quả của việc dùng tập con của
tổng thể (mẫu), mà không phải toàn bộ mẫu.
 Các phương pháp thống kê có thể được dùng để tính
các báo cáo xác suất về kích thước của sai số lấy mẫu.
© 2005 Thomson/South-Western Slide
13
Sai số lấy mẫu
 Sai số lấy mẫu là:

|x   | cho trung bình mẫu

|s   | cho độ lệch chuẩn mẫu

| p  p| cho tỷ lệ mẫu

© 2005 Thomson/South-Western Slide


14
Ví dụ: St. Andrew’s
Đại học St. Andrew’s nhận
900 đơn xin nhập học hàng năm
từ các sinh viên có triển vọng.

Đơn xin nhập học có các thông


tin khác nhau gồm điểm SAT (scholastic
aptitude test) của cá nhân và yêu cầu có ho ặc
không có sở hữu nhà ở trường.

© 2005 Thomson/South-Western Slide


15
Ví dụ: St. Andrew’s

Giám đốc chương trình nhập học


muốn biết thông tin sau:

• Điểm trung bình SAT


của 900 ứng viên, và

• Tỷ lệ các ứng viên muốn sống ở trường.

© 2005 Thomson/South-Western Slide


16
Ví dụ: St. Andrew

Có 3 phương án lấy thông tin yêu cầu.

 Điều tra tổng thể


gồm toàn bộ 900 ứng viên

 Chọn mẫu gồm 30 ứng viên,


dùng bảng số ngẫu nhiên.

 Chọn mẫu gồm 30 ứng viên, dùng Excel.


© 2005 Thomson/South-Western Slide
17
Điều tra tổng thể
 Trung bình tổng thể cho điểm SAT

 x i
 990
900

 Độ lệch chuẩn tổng thể cho điểm SAT


 i
( x   ) 2

 80
900

 Tỷ lệ tổng thể muốn sở hữu nhà ở trường


648
p  .72
900

© 2005 Thomson/South-Western Slide


18
Lấy mẫu ngẫu nhiên đơn giản

 Bây giờ giả sử rằng Dữ liệu cần thiết về các


ứng viên năm nay chưa được nhập vào cơ sở
dữ liệu của trường đại học.
 Hơn nữa, giám đốc chương trình nhập học
phải lấy ước lượng các tham số tổng thể quan
tâm cho cuộc họp sẽ diễn ra trong vài giờ.

 GĐ quyết định sử dụng mẫu gồm 30 ứng viên.

 Các ứng viên được đánh số từ 1 đến 900, khi


đơn của ứng viên đến.
© 2005 Thomson/South-Western Slide
19
Lấy mẫu ngẫu nhiên đơn giản:
Dùng bảng số ngẫu nhiên
 Dùng số ngẫu nhiên cho việc lấy mẫu

Số ngẫu nhiên Ứng viên được


có 3 chữ số đưa vào mẫu
744 Số 744
436 Số 436
865 Số 865
790 Số 790
835 Số 835
902 Số vượt quá 900
190 Số 190
836 Số 836
. . . Và …

© 2005 Thomson/South-Western Slide


20
Lấy mẫu ngẫu nhiên đơn giản:
Dùng bảng số ngẫu nhiên
 Dữ liệu mẫu
Số Điểm Sống ở
STT ngẫu nhiên Ứng viên SAT trường
1 744 Conrad Harris 1025 Có
2 436 Enrique Romero 950 Có
3 865 Fabian Avante 1090 Không
4 790 Lucila Cruz 1120 Có
5 835 Chan Chiang 930 Không
. . . . .
. . . . .
30 498 Emily Morse 1010 Không

© 2005 Thomson/South-Western Slide


21
Lấy mẫu ngẫu nhiên đơn giản:
Dùng máy tính
 Lấy mẫu gồm 30 ứng viên
• Dùng máy tính để phát sinh các số ngẫu
nhiên cho việc chọn mẫu ngẫu nhiên.
• Ví dụ, sử dụng hàm của Excel
= RANDBETWEEN(1,900)
để phát sinh các số ngẫu nhiên từ 1 đến 900.

• Sau đó, chọn 30 ứng viên tương ứng với 30


số ngẫu nhiên nhỏ nhất là mẫu.
© 2005 Thomson/South-Western Slide
22
Ước lượng điểm
 x là ước lượng điểm của 
x
 x i

29, 910
 997
30 30
 s là ước lượng điểm của 
s
 (x i  x )2

163, 996
 75.2
29 29
 p là ước lượng điểm của p
p  20 30  .68

Ghi chú: Các số ngẫu nhiên khác nhau sẽ


nhận dạng mẫu khác nhau, nên có kết quả ước
lượng điểm khác nhau.
© 2005 Thomson/South-Western Slide
23
Tổng kết các ước lượng điểm
được lấy từ mẫu ngẫu nhiên đơn giản

Tham số Giá trị Ước lượng Giá trị ước


tổng thể Tham số điểm lượng điểm
m = Trung bình tổng thể 990 x = Trung bình mẫu 997
cho điểm SAT cho điểm SAT

s = Độ lệch chuẩn 80 s = Độ lệch chuẩn 75.2


tổng thể m ẫu
cho điểm SAT cho điểm SAT

p = Tỷ lệ tổng thể .72 p = Tỷ lệ mẫu .68


muốn sở hữu muốn sở hữu
nhà ở trường nhà ở trường

© 2005 Thomson/South-Western Slide


24
GiỚI THIỆU PHÂN PHỐI MẪU

 Phân phối xác suất của bất kỳ trị thống kê


mẫu cụ thể được gọi là phân phối mẫu của trị
thống kê.
 Phân phối xác suất của x được gọi là phân
phối mẫu của x . Kiến thức về phân phối mẫu
này và các tính chất của nó sẽ cho phép chúng
ta phát biểu về xác suất để cho trung bình
mẫu x gần bằng với trung bình tổng thể .
 Trong thực tế, chúng ta chỉ chọn một mẫu
ngẫu nhiên đơn giản từ tổng thể.
© 2005 Thomson/South-Western Slide
25
PHÂN PHỐI MẪU CỦA x
 Quy trình thống kê suy diễn

Tổng thể có Mẫu ngẫu nhiên đơn


trung bình giản gồm n phần tử
m=? được chọn từ tổng thể.

Giá trị của x được Dữ liệu mẫu cung


dùng để suy diễn về cấp giá trị cho
giá trị của m. trung bình mẫu x .

© 2005 Thomson/South-Western Slide


26
PHÂN PHỐI MẪU CỦA x
Phân phối mẫu của xlà phân phối xác suất của
tất cả các giá trị có thể của trung bình mẫu .
x
Giá trị kỳ vọng của x

E( x ) = 

Với:
 = Trung bình tổng thể

© 2005 Thomson/South-Western Slide


27
PHÂN PHỐI MẪU CỦA x
Độ lệch chuẩn của x
Tổng thể hữu hạn Tổng thể vô hạn
hay biết N hay không biết N

N n 
x  ( ) x 
n N 1 n
• Tổng thể hữu hạn được xử lý như vô hạn (Bỏ
qua nhân tố điều chỉnh tổng thể hữu hạn) nếu
n/N < .05.
• ( N  n ) / ( N  1) là nhân tố điều chỉnh tổng
thể hữu hạn.
• x xem như là sai số chuẩn của trung bình.
© 2005 Thomson/South-Western Slide
28
DẠNG PHÂN PHỐI MẪU CỦA x
 Phân phối của x
• Câu hỏi: Phân phối xác suất của x là gì?

 Định lý giới hạn trung tâm


• Phân phối của tổng thể được biết là phân
phối chuẩn
X  N (, 2) x  N (, 2/n)

© 2005 Thomson/South-Western Slide


29
DẠNG PHÂN PHỐI MẪU CỦA x
 Định lý giới hạn trung tâm
• Trong việc chọn các mẫu ngẫu nhiên đơn giản cỡ
mẫu n từ một tổng thể, phân phối mẫu của trung
bình mẫu x có thể gần đúng tuân theo phân phối
chuẩn khi cỡ mẫu đủ lớn.
• X ~ Bất kỳ phân phối nào
• Không biết phân phối
xác suất tổng thể
X  N (,  2
/n)
• Cỡ mẫu lớn
(N>30)

© 2005 Thomson/South-Western Slide


30
DẠNG PHÂN PHỐI MẪU CỦA x

 X  N (, 2/n) ZN


(0,12)
x
Z
với / n

© 2005 Thomson/South-Western Slide


31
Phân phối mẫu của x cho điểm SAT

Phân phối
m ẫu  80
của x x    14.6
n 30

x
E( x )  990

© 2005 Thomson/South-Western Slide


32
Phân phối mẫu của x cho điểm SAT

Xác suất để mẫu ngẫu nhiên đơn giản gồm


30 ứng viên sẽ cung cấp ước lượng của trung
bình tổng thể điểm SAT trong khoảng +/-10
trung bình tổng thể thực sự  là gì?

Nói cách khác, xác suất để x ở giữa 980 và


1000 là gì?

© 2005 Thomson/South-Western Slide


33
Phân phối mẫu của x cho điểm SAT

Bước 1: Tính giá trị z ở điểm trên của khoảng.

z = (1000 - 990)/14.6= .68

Bước 2: Tìm diện tích dưới đường cong phía


trái của điểm trên.
P(z < .68) = .7517

© 2005 Thomson/South-Western Slide


34
Phân phối mẫu của x cho điểm SAT

Xác suất tích lũy cho


phân phối chuẩn chuẩn hóa
z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
. . . . . . . . . . .
.5 .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224
.6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549
.7 .7580 .7611 .7642 .7673 .7704 .7734 .7764 .7794 .7823 .7852
.8 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8078 .8106 .8133
.9 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389
. . . . . . . . . . .

© 2005 Thomson/South-Western Slide


35
Phân phối mẫu của x cho điểm SAT

Phân phối
m ẫu  x  14.6
của x

Diện tích = .7517

x
990 1000

© 2005 Thomson/South-Western Slide


36
Phân phối mẫu của x cho điểm SAT

Bước 3: Tính giá trị z ở điểm dưới của khoảng.

z = (980 - 990)/14.6= - .68

Bước 4: Tìm diện tích dưới đường cong phía


trái của điểm dưới.
P(z < -.68) = P(z > .68)
= 1 - P(z < .68)
= 1 - . 7517
= .2483
© 2005 Thomson/South-Western Slide
37
Phân phối mẫu của x cho điểm SAT

Phân phối
m ẫu  x  14.6
của x

Diện tích = .2483

x
980 990

© 2005 Thomson/South-Western Slide


38
Phân phối mẫu của x cho điểm SAT

Bước 5: Tính diện tích dưới đường cong giữa


điểm trên và điểm dưới của khoảng.
P(-.68 < z < .68) = P(z < .68) - P(z < -.68)
= .7517 - .2483
= .5034

Xác suất để trung bình mẫu cho điểm SAT ở


giữa 980 và 1000 là: P(980 < x < 1000) = .5034
© 2005 Thomson/South-Western Slide
39
Phân phối mẫu của x cho điểm SAT

Phân phối
m ẫu  x  14.6
của x

Diện tích = .5034

x
980 990 1000

© 2005 Thomson/South-Western Slide


40
Mối quan hệ giữa kích thước mẫu
và phân phối mẫu của x

 Giả sử chọn mẫu ngẫu nhiên đơn giản 100 ứng viên
thay vì chỉ xem xét 30 như ban đầu.

 E( x ) = m bất chấp kích thước mẫu là bao nhiêu.


Trong ví dụ, E( x) duy trì ở 990.

 Bất cứ khi nào kích thước mẫu tăng, độ lệch chuẩn


của trung bình
 x giảm. Kích thước mẫu càng tăng

đến n = 100, thì độ lệch chuẩn của trung bình càng


 80
giảm đến: x    8.0
n 100
© 2005 Thomson/South-Western Slide
41
Mối quan hệ giữa kích thước mẫu
và phân phối mẫu của x

Với n = 100,
x  8

Với n = 30,
 x  14.6

x
E( x )  990

© 2005 Thomson/South-Western Slide


42
Mối quan hệ giữa kích thước mẫu
và phân phối mẫu của x
 Nhớ lại, khi n = 30, P(980 <x < 1000) = .5034.
 Giải cùng các bước cho P(980 < x < 1000) khi
n = 100 như cách giải khi n = 30.
 Bây giờ, với n = 100, P(980 < x < 1000) = .7888.

 Vì phân phối mẫu với n = 100 có độ lệch chuẩn


nhỏ hơn, giá trị của x ít biến thiên và có xu
hướng gần với trung bình tổng thể hơn giá trị
của x với n = 30.
© 2005 Thomson/South-Western Slide
43
Mối quan hệ giữa kích thước mẫu
và phân phối mẫu của x
Phân phối
m ẫu x  8
của x

Diện tích = .7888

x
980 990 1000

© 2005 Thomson/South-Western Slide


44
TÍNH CHẤT CỦA ƯỚC LƯỢNG ĐIỂM

 Trước khi sử dụng thống kê mẫu như là ước


lượng điểm, các nhà thống kê kiểm tra xem
Thống kê mẫu có các tính chất sau có kết hợp
với ước lượng điểm tốt không?
Không thiên lệch

Độ hữu hiệu

Độ nhất quán

© 2005 Thomson/South-Western Slide


45
TÍNH CHẤT CỦA ƯỚC LƯỢNG ĐIỂM
Không thiên lệch

Gọi  = tham số tổng thể được quan tâm


̂ = trị thống kê mẫu hay ước lượng điểm của 

 Không thiên lệch


Trị thống kê mẫu̂ là một ước lượng không thiên lệch
của tham số tổng thể  nếu
̂E( ) = 

 Độ thiên lệch (Bias)


̂ ( ) =̂E( ) - 
Bias
© 2005 Thomson/South-Western Slide
46
TÍNH CHẤT CỦA ƯỚC LƯỢNG ĐIỂM

Độ hữu hiệu

Cho hai ước lượng điểm không thiên lệch của tham số tổng
thể, ước lượng điểm với độ lệch chuẩn nhỏ hơn
θ̂1được xem là hiệu quả hơn θ̂nếu:2

Var ( θ̂1) < Var ( θ̂ )2

Độ nhất quán
Các cỡ mẫu lớn hơn sẽ cung cấp các ước lượng điểm gần với
tham số của tổng thể.

© 2005 Thomson/South-Western Slide


47
BIÊN CỦA SAI SỐ và ƯỚC LƯỢNG KHOẢNG

Không
Không th
thểể kỳ
kỳ vvọọng ướcc llượ
ng ướ ượng
ng đi
điểểm
m cung
cung ccấấpp
giá
giá tr
trịị chính
chính xác
xác ccủủaa tham
tham ssốố ttổổng
ng th
thểể..

Có ththểể tính ướcc llượ
tính ướ ượng ng kho ng bbằằng
khoảảng ng cách
cách ccộộng
ng

và tr
trừừ biên
biên ccủủaa sai
sai ssốố vvớớii ướ
ướcc llượ
ượng
ng đi
điểểm.
m.

Ước lượng điểm +/- Biên của sai số

M
Mụụcc tiêu
tiêu ccủủaa ướ
ướcc llượ
ượng
ng kho ng là
khoảảng là cung
cung ccấấpp
thông
thông tin
tin vvềề ướ
ướcc llượ
ượng
ng đi
điểểm
m ggầầnn vvớớii giá
giá tr
trịị ccủủaa
tham
tham ssốố nh
nhưư th
thếế nào.
nào.
© 2005 Thomson/South-Western Slide
48
BIÊN CỦA SAI SỐ và ƯỚC LƯỢNG KHOẢNG

DDạạng
ng ttổổng
ng quát
quát ccủủaa ướ
ướcc llượ
ượng
ng kho
khoảảng
ng ccủủaa
trung
trung bình
bình ttổổng
ng th
thểể..

x Biên của sai số

© 2005 Thomson/South-Western Slide


49
ƯỚC LƯỢNG KHOẢNG CỦA TRUNG BÌNH MẪU:
Biết s

 Để phát triển ước lượng khoảng của trung


bình tổng thể, thì tính biên của sai số dùng:
• Độ lệch chuẩn tổng thể s , hoặc
• Độ lệch chuẩn mẫu s

 s hiếm khi được biết chính xác, nhưng thông


thường ước lượng tốt có thể được lấy từ dữ liệu
lịch sử hoặc thông tin khác.
 Tham khảo những trường hợp đó khi biết s .
© 2005 Thomson/South-Western Slide
50
ƯỚC LƯỢNG KHOẢNG CỦA TRUNG BÌNH MẪU:
Biết s

Có xác suất 1 -  giá trị của trung bình mẫu sẽ


cung cấp biên của sai số của z /2  x hoặc nhỏ hơn.

Phân phối
m ẫu
của x

/2 1 -  của tất cả /2


các giá trị x

x

z /2  x z /2  x
© 2005 Thomson/South-Western Slide
51
ƯỚC LƯỢNG KHOẢNG CỦA TRUNG BÌNH TỔNG THỂ:
Biết s

Phân phối
m ẫu
của x
1 -  của tất cả
/2 /2
các giá trị x
Khoảng
không x

có m z /2  x Kho
interval
ảng
z /2  x
có m m
includes
[------------------------- x -------------------------]
[------------------------- x -------------------------]
[------------------------- x -------------------------]

© 2005 Thomson/South-Western Slide


52
ƯỚC LƯỢNG KHOẢNG CỦA TRUNG BÌNH TỔNG THỂ:
Biết s
 Ước lượng khoảng của m

x  z /2
n

Với: x là trung bình mẫu


1 - là độ tin cậy
z/2 là giá trị z cung cấp diện tích của
/2 ở phía trên của phân phối
xác suất chuẩn chuẩn hóa
s độ lệch chuẩn của tổng thể
n là kích thước mẫu
© 2005 Thomson/South-Western Slide
53
ƯỚC LƯỢNG KHOẢNG CỦA TRUNG BÌNH TỔNG THỂ:
Biết s
 Kích thước mẫu thích hợp

Trong
Trong hhầầuu hhếếtt các
các ứứng
ng ddụụng,
ng, kích
kích th ướcc m
thướ mẫẫuu
nn == 30
30 thích
thích hhợợp.
p.

N
Nếếuu phân
phân ph
phốốii ttổổng
ng th
thểể có
có đđộộ llệệch
ch cao
cao ho
hoặặcc
ch
chứứaa các
các đi
điểểm
m cá
cá bi
biệệt,t, thì
thì nên
nên ch
chọọnn kích
kích th ướcc
thướ
m
mẫẫuu llớớnn hhơơnn ho
hoặặcc bbằằng
ng 50.
50.

© 2005 Thomson/South-Western Slide


54
ƯỚC LƯỢNG KHOẢNG CỦA TRUNG BÌNH TỔNG THỂ:
Biết s
 Kích thước mẫu thích hợp

N
Nếếuu ttổổng
ng th
thểể không
không phân
phân ph
phốốii chu
chuẩẩn,
n, nh
nhưưng
ng
cân
cân xxứứng
ng nhi
nhiềều,
u, thì
thì kích
kích th ướcc m
thướ mẫẫuu thích
thích hhợợpp
bbằằng
ng 15.
15.

N
Nếếuu ttổổng
ng th
thểể đđượ
ượcc tin
tin là
là xxấấpp xxỉỉ ítít chu
chuẩẩnn hóa,
hóa,
thì
thì có
có th
thểể dùng
dùng kích
kích th ướcc m
thướ mẫẫuu nh
nhỏỏ hhơơnn 15.
15.

© 2005 Thomson/South-Western Slide


55
ƯỚC LƯỢNG KHOẢNG CỦA TRUNG BÌNH TỔNG THỂ:
Biết s
 Ví dụ: Discount Sounds
D
Discount Sounds có 260 đại lý bán lẻ
trên khắp nước Mỹ. Công ty đang đánh
S
giá vị trí tiềm năng cho đại lý mới, dựa một phần
vào thu nhập hàng năm trung bình của các cá
nhân trong khu vực tiếp thị vị trí mới.
Lấy kích thước mẫu n = 36; thu nhập trung bình
của mẫu là $31,100. Tổng thể không được tin
tưởng là có độ lệch cao. Độ lệch chuẩn của tổng thể
được ước lượng là $4,500 và độ tin cậy được dùng
trong ước lượng khoảng là .95.
© 2005 Thomson/South-Western Slide
56
ƯỚC LƯỢNG KHOẢNG CỦA TRUNG BÌNH TỔNG THỂ:
Biết s
D
S
95% mẫu có nghĩa rằng có thể được quan sát
trong khoảng  x + 1.96 của trung bình tổng thể .

Biên của sai số:


  4,500 
z /2  1.96    1, 470
n  36 

Do đó, với độ tin cậy 95%, biên của sai số


là $1,470.
© 2005 Thomson/South-Western Slide
57
ƯỚC LƯỢNG KHOẢNG CỦA TRUNG BÌNH TỔNG THỂ:
Biết s
D
S
Ước lượng khoảng của  là:

$31,100 + $1,470
Hoặc
$29,630 đến $32,570

Độ tin cậy 95% khoảng chứa trung bình của


tổng thể.

© 2005 Thomson/South-Western Slide


58
ƯỚC LƯỢNG KHOẢNG CỦA TRUNG BÌNH TỔNG THỂ:
Không biết s

 Nếu ước lượng của độ lệch chuẩn tổng thể s


không thể được phát triển trước khi lấy mẫu,
thì dùng độ lệch chuẩn mẫu s cho ước lượng s.
 Đây là trường hợp không biết s .

 Trong trường hợp này, ước lượng khoảng cho


m dựa vào phân phối t.

 (Giả sử tổng thể tuân theo phân phối chuẩn.)


© 2005 Thomson/South-Western Slide
59
Phân phối t

Phân
Phân ph
phốốii tt là
là hhọọ các
các phân
phân ph
phốốii xác
xác su
suấấtt
ttươ
ương
ng ttựự..

Phân
Phân ph
phốốii tt ccụụ th
thểể ph
phụụ thu
thuộộcc vào
vào tham
tham ssốố ggọọii
là do..
là BBậậcc ttựự do

BBậậcc ttựự do
do tham
tham kh
khảảoo đđếếnn ssốố thông
thông tin
tin đđộộcc llậậpp
đđưưaa vào
vào tính
tính s.s.

© 2005 Thomson/South-Western Slide


60
Phân phối t

Phân
Phân ph
phốốii tt có
có nhi
nhiềềuu bbậậcc ttựự do
do thì
thì ítít phân
phân tán.
tán.

Khi
Khi ssốố bbậậcc ttựự do
do tăng
tăng lên,
lên, thì
thì khác
khác nhau
nhau gi
giữữaa
phân
phân ph
phốốii tt và
và phân
phân ph
phốốii xác
xác su
suấấtt chu
chuẩẩnn
chu
chuẩẩnn hóa
hóa tr
trởở nên
nên càng
càng nh
nhỏỏ hhơơn.
n.

© 2005 Thomson/South-Western Slide


61
Phân phối t

Phân phối t
Phân phối (20 các bậc tự do)
chuẩn
chuẩn hóa

Phân phối t
(10 các bậc tự do)

z, t
0

© 2005 Thomson/South-Western Slide


62
Phân phối t

V
Vớớii nhi
nhiềềuu hhơơnn 100
100 các
các bbậậcc ttựự do,
do, thì
thì giá
giá tr
trịị zz
chu
chuẩẩnn chu
chuẩẩnn hóa
hóa cung
cung ccấấpp m
mộộtt xxấấpp xxỉỉ ttốốtt đđốốii
vvớớii giá
giá tr
trịị t.t.


Có th
thểể tìm
tìm các
các giá
giá tr
trịị zz chu
chuẩẩnn chu
chuẩẩnn hóa
hóa ởở
hàng
hàng các
các bbậậcc ttựự do vô hhạạnn (( )) ccủủaa bbảảng
do vô ng phân
phân
ph
phốốii t.t.

© 2005 Thomson/South-Western Slide


63
Phân phối t
Degrees
Các bậc Area tích
Diện in Upper
phía Tail
trên
of Freedom
tự do .20 .10 .05 .025 .01 .005
. . . . . . .
50 .849 1.299 1.676 2.009 2.403 2.678
60 .848 1.296 1.671 2.000 2.390 2.660
80 .846 1.292 1.664 1.990 2.374 2.639
100 .845 1.290 1.660 1.984 2.364 2.626
 .842 1.282 1.645 1.960 2.326 2.576

Các giá trị z


chuẩn chuẩn hóa

© 2005 Thomson/South-Western Slide


64
ƯỚC LƯỢNG KHOẢNG CỦA TRUNG BÌNH TỔNG THỂ:
Không biết s
 Ước lượng khoảng
s
x  t /2
n

Với: 1 - = Độ tin cậy

t/2 = Giá trị t cung cấp diện tích

của /2 ở phía trên của phân


phối t với n - 1 các bậc tự do
s = Độ lệch chuẩn của mẫu
© 2005 Thomson/South-Western Slide
65
ƯỚC LƯỢNG KHOẢNG CỦA TRUNG BÌNH TỔNG THỂ:
Không biết s
 Ví dụ: Căn hộ cho thuê

Phóng viên tờ báo sinh viên đang đăng


tựa đề chi phí sở hữu nhà ở
trường. Mẫu gồm 16 căn
hộ nhỏ trong nữa dặm của trường có kết quả
trung bình của mẫu là $650/tháng và độ lệch
chuẩn của mẫu là $55.

© 2005 Thomson/South-Western Slide


66
ƯỚC LƯỢNG KHOẢNG CỦA TRUNG BÌNH TỔNG THỂ:
Không biết s
 Ví dụ: Căn hộ cho thuê

Hãy cung cấp 95% ước lượng khoảng tin


cậy của giá cho thuê trung bình trên
một tháng cho tổng thể của
các căn hộ nhỏ trong nữa dặm
của trường. Giả sử tổng thể này tuân theo
phân phối chuẩn.
© 2005 Thomson/South-Western Slide
67
ƯỚC LƯỢNG KHOẢNG CỦA TRUNG BÌNH TỔNG THỂ:
Không biết s

Vớ i độ tin cậ y 95%,  = .05, và /2 = .025.


t.025 được dựa trên n - 1 = 16 - 1 = 15 các bậc tự do.
Trong bảng phân phối t , tìm thấy t.025 = 2.131.
Các bậc
Degrees Diện
Area tích phía Tail
in Upper trên
tự do
of Freedom .20 .100 .050 .025 .010 .005
15 .866 1.341 1.753 2.131 2.602 2.947
16 .865 1.337 1.746 2.120 2.583 2.921
17 .863 1.333 1.740 2.110 2.567 2.898
18 .862 1.330 1.734 2.101 2.520 2.878
19 .861 1.328 1.729 2.093 2.539 2.861
. . . . . . .

© 2005 Thomson/South-Western Slide


68
ƯỚC LƯỢNG KHOẢNG CỦA TRUNG BÌNH TỔNG THỂ:
Không biết s
 Ước lượng khoảng
s
x  t.025
n

55
650  2.131  650  29.30
16

Với độ tin cậy 95%, thì giá cho thuê trung


bình trên một tháng cho tổng thể các căn hộ
nhỏ trong nữa dặm của trường ở giữa $620.70
và $679.30.
© 2005 Thomson/South-Western Slide
69
Tổng kết các thủ tục ước lượng khoảng cho
trung bình tổng thể

Có Có thể giả sử Không


độ lệch chuẩn của
tổng thể s đã biết?
Dùng độ lệch
chuẩn của mẫu s
để ước lượng s

Dùng Dùng
 s
x  z /2 x  t /2
n n
Trường hợp biết s Trường hợp không biết s
© 2005 Thomson/South-Western Slide
70
Kích thước mẫu cho ước lượng khoảng của
trung bình tổng thể

G
Gọọii EE == Biên
Biên ccủủaa sai
sai ssốố kỳ
kỳ vvọọng.
ng.

EE ccộộng
ng và
và tr
trừừ vvớớii ướ
ướcc llượ
ượng
ng đi
điểểm
m đđểể llấấyy Ướ
Ướcc
llượ
ượng
ng kho ng..
khoảảng

© 2005 Thomson/South-Western Slide


71
Kích thước mẫu cho ước lượng khoảng của
trung bình tổng thể

 Biên của sai số



E  z /2
n

 Kích thước mẫu cần thiết


( z / 2 ) 2  2
n
E2

© 2005 Thomson/South-Western Slide


72
Kích thước mẫu cho ước lượng khoảng của
trung bình tổng thể
D
Nhớ lạ i, Discount Sounds đang đánh giá
S
vị trí tiềm năng cho đại lý bán lẻ mới, dựa một
phần vào thu nhập hàng năm trung bình của các
cá nhân ở vùng tiếp thị vị trí mới.
Giả sử nhóm quản lý Discount Sounds muốn
ước lượng trung bình của tổng thể mà có xác suất
.95 mà sai số mẫu <= $500.
Kích thước mẫu cần lớn như thế nào để thỏa mãn
độ chính xác yêu cầu?

© 2005 Thomson/South-Western Slide


73
Kích thước mẫu cho ước lượng khoảng của
trung bình tổng thể
D
S

z /2  500
n

Vớ i độ tin cậ y 95%, z.025 = 1.96. Nhớ lạ i = 4,500.

(1.96)2 (4, 500)2


n 2
 311.17  312
(500)

Cần kích thước mẫu 312 để đạt đến độ chính


xác kỳ vọng + $500 với độ tin cậy 95%.

© 2005 Thomson/South-Western Slide


74
ƯỚC LƯỢNG KHOẢNG CỦA
TỶ LỆ TỔNG THỂ

D
Dạạng
ng ttổổng
ng quát
quát ccủủaa ướ
ướcc llượ
ượng
ng kho
khoảảng
ng ccủủaa ttỷỷ llệệ
ttổổng
ng th
thểể là

p Biên của sai số

© 2005 Thomson/South-Western Slide


75
ƯỚC LƯỢNG KHOẢNG CỦA
TỶ LỆ TỔNG THỂ

Phân
Phân ph mẫẫuu ccủủaa p đóng
phốốii m đóng vai
vai trò
trò chính
chính
trong
trong tính
tính biên
biên ccủủaa sai
sai ssốố cho ướcc llượ
cho ướ ượng
ng
kho
khoảảng
ng này.
này.


Có th
thểể xxấấpp xxỉỉ phân
phân ph
phốốii m
mẫẫuu ccủủaa p bbằằng
ng
phân
phân ph
phốốii chu
chuẩẩnn bbấấtt ccứứ khi
khi nào
nào
np >> 55 và
np n(1 –– p)
và n(1 p) >> 5.
5.

© 2005 Thomson/South-Western Slide


76
ƯỚC LƯỢNG KHOẢNG CỦA
TỶ LỆ TỔNG THỂ
 Xấp xỉ chuẩn của phân phối mẫu p

Phân phối p(1  p)


m ẫu p 
n
của p

/2 /2
1 -  của tất cả
các giá trị p
p
p
z /2 p z /2 p
© 2005 Thomson/South-Western Slide
77
ƯỚC LƯỢNG KHOẢNG CỦA
TỶ LỆ TỔNG THỂ
 Ước lượng khoảng
p (1  p )
p  z / 2
n

Với: 1 - là độ tin cậy

z/2 là giá trị z cung cấp diện tích


của /2 ở phía trên của phân
phối xác suất chuẩn chuẩn hóa
p là tỷ lệ mẫu
© 2005 Thomson/South-Western Slide
78
ƯỚC LƯỢNG KHOẢNG CỦA
TỶ LỆ TỔNG THỂ
 Ví dụ: Political Science, Inc.
PSI chuyên thiế t kế các khả o sát
và các cuộc tuyển cử để theo dõi
những người tìm kiếm chức vụ chính trị nhằm
thông báo về vị trí trong cuộc chạy đua.
Dùng các khảo sát điện thoại, các phỏng vấn PSI
yêu cầu người bỏ phiếu đã đăng ký: họ sẽ bỏ
phiế u cho ai nế u hôm đó tổ chứ c cuộ c tuyể n
© 2005 Thomson/South-Western Slide
79
ƯỚC LƯỢNG KHOẢNG CỦA
TỶ LỆ TỔNG THỂ
 Ví dụ: Political Science, Inc.
Trong chiến dịch tuyển cử hiện tại, PSI
vừa mới tìm thấy 220 người bỏ
phiếu đã đăng ký trong 500
liên lạc, mà ủng hộ một ứng viên đặc biệt.
PSI muốn phát triển ước lượng khoảng tin cậy
95% cho tỷ lệ tổng thể của những người bỏ
phiếu đã đăng ký nhằm ủng hộ ứng viên.
© 2005 Thomson/South-Western Slide
80
ƯỚC LƯỢNG KHOẢNG CỦA
TỶ LỆ TỔNG THỂ
p (1  p )
p  z / 2
n
Với: n = 500, p = 220/500 = .44, z/2 = 1.96

.44(1  .44)
.44  1.96 = .44 ± .0435
500

PSI tin cậy 95% mà tỷ lệ tất cả những người bỏ


phiếu ủng hộ ứng viên ở giữa .3965 và .4835.

© 2005 Thomson/South-Western Slide


81
Kích thước mẫu cho ước lượng khoảng của
trung bình tổng thể
 Biên của sai số
p (1  p )
E  z / 2
n

Giải kích thước mẫu cần thiết, lấy


( z / 2 ) 2 p (1  p )
n
E2
Tuy nhiên, p sẽ không được biết cho đến
sau khi chọn mẫu. Dùng giá trị hoạch
định p* cho p .
© 2005 Thomson/South-Western Slide
82
Kích thước mẫu cho ước lượng khoảng của
trung bình tổng thể

 Kích thước mẫu cần thiết

( z / 2 ) 2 p* (1  p* )
n
E2

Có thể chọn giá trị hoạch định p* bằng cách:


1. Dùng tỷ lệ mẫu từ mẫu trước của các đơn vị
tương tự hoặc giống nhau, hoặc
2. Chọn mẫu sơ bộ và dùng tỷ lệ mẫu từ mẫu này.
© 2005 Thomson/South-Western Slide
83
Kích thước mẫu cho ước lượng khoảng của
trung bình tổng thể

Giả sử rằng PSI muốn xác suất .99 để tỷ


lệ mẫu trong khoảng ± .03 tỷ lệ tổng thể.

Kích thước mẫu cần thiết lớn như thế


nào để thỏa mãn độ chính xác yêu cầu? (Mẫu
trước của các đơn vị tương tự có kết quả là .44
cho tổng thể mẫu.)

© 2005 Thomson/South-Western Slide


84
Kích thước mẫu cho ước lượng khoảng của
trung bình tổng thể

p(1  p )
z /2  .03
n
Ở độ tin cậy 99%, z.005 = 2.576. Nhớ lại, rằng  = .44. p
( z /2 )2 p(1  p) (2.576)2 (.44)(.56)
n   1817
E2 (.03) 2

Kích thước mẫu 1817 cần thiết để đạt đến


yêu cầu chính xác của + .03 ở độ tin cậy 99%.

© 2005 Thomson/South-Western Slide


85
Kích thước mẫu cho ước lượng khoảng của
trung bình tổng thể

Ghi chú:
Dùng .44 là ước lượng tốt nhất của p trong các
diễn tả trước. Nếu không có thông tin sẵn
sàng về p, thì thường giả sử là .5 vì nó cung
cấp kích thước mẫu có thể cao nhất. Nếu
dùng p = .5, thì n được khuyên là 1843.

© 2005 Thomson/South-Western Slide


86

You might also like