TKKDKT Chuong4

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 34

Chương 4 LẤY MẪU VÀ ƯỚC LƯỢNG THAM SỐ

TỔNG THỂ

1. Lấy mẫu
2. Tham số tổng thể và thống kê mẫu
3. Phân phối lấy mẫu
4. Ước lượng điểm
5. Ước lượng khoảng

6. Xác định kích thước mẫu

1
*
4.1. LẤY MẪU

 Mẫu ngẫu nhiên đơn giản là mẫu lấy từ một tổng thể
hữu hạn sao cho mọi mẫu có cùng kích thước sẽ được
chọn với xác suất như nhau.
Ví dụ: Xét tổng thể có 5 phần tử là A, B, C, D, E.
 Có tất cả 15 mẫu được phép lấy lặp, kích thước n=2
bao gồm: AA, BB, CC, DD, EE, AB, AC, AD, AE, BC, BD,
BE, CD, CE, DE. Một trong 15 mẫu này là mẫu ngẫu
nhiên đơn giản với xác suất được chọn như nhau là 1/15.
 Có tất cả 10 mẫu lấy không lặp, kích thước n=2 bao
gồm: AB, AC, AD, AE, BC, BD, BE, CD, CE, DE. Một trong
10 mẫu này là mẫu ngẫu nhiên đơn giản với xác suất
được chọn đều như nhau là 1/10.
2
*
Lấy mẫu lặp và lấy mẫu không lặp

 Trả lại mỗi phần tử đã được lấy mẫu trước khi lựa chọn
các phần tử sau được gọi là lấy mẫu lặp.
Lấy mẫu lặp là cách lấy mẫu có hiệu lực trong việc xác
định một mẫu ngẫu nhiên đơn giản.
 Không trả lại mỗi phần tử đã được lấy mẫu trước khi
lựa chọn các phần tử sau được gọi là lấy mẫu không lặp.
 Lấy mẫu không lặp là thủ tục lấy mẫu thường được
dùng nhất trong thực hành.
 Khi chúng ta nói đến lấy mẫu ngẫu nhiên đơn giản là
nói đến lấy mẫu không lặp.
3
*
Lấy mẫu từ một tổng thể hữu hạn

 Tổng thể hữu hạn thường được định nghĩa bằng các
danh sách gọi là khung lấy mẫu (dàn mẫu) như :
* Bảng phân công các thành viên của tổ chức
* Các số tài khoản thẻ tín dụng
* Bảng kê số sản phẩm
 Trong các dự án lấy mẫu lớn, các số ngẫu nhiên do
máy tính tạo ra thường được sử dụng để tự động hóa quá
trình chọn mẫu.
Ví dụ: Đại học St. Andrew’s đã nhận 900 đơn xin vào
học năm tới từ các sinh viên tương lai. Các ứng viên đã
được đánh số, từ 1 đến 900, khi đơn của họ nộp vào.
Trưởng ban tuyển sinh muốn chọn một mẫu ngẫu nhiên
đơn giản gồm 30 ứng viên.
* 4
Lấy mẫu từ một tổng thể hữu hạn

Bước 1: Gắn một số ngẫu nhiên cho mỗi ứng viên trong
danh sách (khung lấy mẫu) 900 ứng viên nói trên.
Bước 2: Chọn 30 ứng viên tương ứng với 30 số ngẫu
nhiên được tạo bởi hàm ngẫu nhiên RANDBETWEEN của
Excel với chỉ định Bottom = 1 và Top =900.

Ví dụ có mẫu 30 số ngẫu nhiên lấy từ hàm Excel:

722 267 437 274 228 749 505 139 510 342
784 191 255 123 554 274 478 764 592 166
22 187 117 469 172 217 194 137 677 853

5
*
Lấy mẫu từ một tổng thể vô hạn

 Tổng thể vô hạn thường được tạo ra bằng một quá


trình đang diễn ra, ở đó không có giới hạn trên đối với
số lượng phần tử có thể được tạo ra.
Ví dụ:
* Các bộ phận đang được sản xuất trên một dây
chuyền sản xuất.
* Các giao dịch đang xảy ra tại một ngân hàng
* Các cuộc gọi đến một tổ hỗ trợ kỹ thuật.
* Các khách hàng đang đi vào một cửa hàng

6
*
Lấy mẫu từ một tổng thể vô hạn

 Mẫu ngẫu nhiên là mẫu lấy từ một tổng thể vô hạn


thỏa mãn 2 điều kiện:
(1) Mỗi phần tử của mẫu phải được chọn từ một
tổng thể như nhau.
(2) Mỗi phần tử của mẫu phải được chọn độc lập
nhau.
 Tùy tình huống mà lấy mẫu thỏa mãn 2 đk:
* Với đk (1): Cần giới hạn tổng thể lấy mẫu về thời
gian (hoặc không gian) để tránh sự biến đổi đáng kể
về tổng thể.
* Với đk (2): Cần lấy các phần tử rải đều về thời
gian (hoặc không gian), tránh cùng nhóm, cùng loại,
7
... *
4.2. Tham số tổng thể và thống kê mẫu

Các tham số tổng thể cơ bản:

- Số trung bình tổng thể:  


 x i (Tiêu thức định lượng)
N

- Phương sai tổng thể: 2



 i
(x  )2
(Tiêu thức định lượng)
N
X
- Tỉ lệ tổng thể: p
N
X là số đơn vị tổng thể có đặc tính nghiên cứu.

8
*
4.2. Tham số tổng thể và thống kê mẫu

Các thống kê mẫu cơ bản:

- Số trung bình mẫu: x


 x i (Tiêu thức định lượng)
n

-Phương sai mẫu: s 


2  ( xi  x ) 2
(Tiêu thức định lượng)
n 1
x
- Tỉ lệ mẫu: p 
n
x là số đơn vị tổng thể có đặc tính nghiên cứu.

9
*
4.3. Phân phối lấy mẫu

 Phân phối lấy mẫu của một thống kê mẫu là phân


phối xác suất của tất cả các giá trị có khả năng của
thống kê mẫu đó trên vô số mẫu ngẫu nhiên cùng
kích thước được lấy từ một tổng thể.

* 10
4.3. Phân phối lấy mẫu
Phân phối lấy mẫu của Trung bình mẫu:

 Lấy mẫu ngẫu nhiên đơn giản hoặc lấy mẫu ngẫu
nhiên từ tổng thể vô hạn hoàn toàn đáp ứng các điều
kiện của định lý giới hạn trung tâm đề cập ở Chương
3.
 Do đó, định lý giới hạn trung tâm có thể phát biểu
cho phân phối lấy mẫu như sau.
 Khi lấy mẫu ngẫu nhiên kích thước n từ một tổng
thể, phân phối lấy mẫu của trung bình mẫu có thể
được xấp xỉ bởi một phân phối chuẩn nếu kích thước
mẫu đủ lớn.
* 11
4.3. Phân phối lấy mẫu
Phân phối lấy mẫu của Trung bình mẫu:

 Trường hợp tổng thể vô hạn:


2
X ~ N(, )
n
Trường hợp tổng thể hữu hạn:
2 N  n
X ~ N(, . )
n N 1
Điều kiện:
+ n  30 nếu tổng thể có phân phối bất kỳ
+ n  15 nếu tổng thể có phân phối đối xứng
+ n bất kỳ nếu tổng thể có phân phối chuẩn
* 12
Chú ý
 Sai số chuẩn cho hai trường hợp lấy mẫu:

  N n
X  và X 
n n N 1

N n
 Đại lượng được gọi là nhân tố điều chỉnh hữu
N 1
hạn.

 Khi n/N≤0,05 nhân tố điều chỉnh hữu hạn rất gần 1.



Trong thực hành nói chung, X  được dùng để
n
tính sai số chuẩn cho cả hai trường hợp lấy mẫu.

* 13
4.3. Phân phối lấy mẫu

Phân phối lấy mẫu của Tỉ lệ mẫu:

 Trường hợp tổng thể vô hạn:


 p (1  p ) 
p ~ N  p, 
 n 
 Trường hợp tổng thể hữu hạn:

 p (1  p ) N  n 
p ~ N  p, 
 n N  1 

Điều kiện: np≥5 và n(1-p)≥5


* 14
Chú ý
 Sai số chuẩn cho hai trường hợp lấy mẫu:

p(1  p) p (1  p ) N n
p  và p  
n n N 1

 Đại lượng N  n được gọi là nhân tố điều chỉnh hữu


hạn. N 1

 Khi n/N≤0,05 nhân tố điều chỉnh hữu hạn rất gần 1.

p(1  p)
 Trong thực hành nói chung,  p  được dùng
n
để tính sai số chuẩn cho cả hai trường hợp lấy mẫu.

* 15
4.3. Phân phối lấy mẫu
Phân phối lấy mẫu của Phương sai mẫu:

 Khi tổng thể có phân phối chuẩn, theo luật phân


phối Khi bình phương:

( n  1) s 2  i
( x  x ) 2

 i 1
~  n21
2 2

* 16
4.4. Ước lượng điểm

 Trong ước lượng điểm chúng ta sử dụng dữ liệu từ


mẫu để tính toán giá trị của một thống kê mẫu mà
dùng như một ước lượng của tham số tổng thể.

 Ước lượng điểm tốt nhất của Số trung bình tổng


thể  là số trung bình mẫu: x
 Ước lượng điểm tốt nhất của Tỉ lệ tổng thể P là tỉ lệ
mẫu: p
 Ước lượng điểm không chệch của Phương sai tổng

thể 2 là phương sai mẫu: s 


2  i
( x  x ) 2
ni
n 1
* 17
4.4. Ước lượng điểm
Ví dụ: Để kiểm tra chất lượng một lô hàng lớn, người
ta chọn ngẫu nhiên không lặp 100 sản phẩm. Kết quả
thu được như sau.
Trọng Số sản
Ước lượng điểm trọng lượng
trung bình một sản phẩm của lô lượng (kg) phẩm
hàng: (xi) (fi)
x
 xi f i
 5,02 (kg) 4,8 10
 fi 4,9 20
Ước lượng điểm tỉ lệ sản phẩm có 5,0 30
trọng lượng từ 5 kg trở lên của lô 5,1 20
hàng: 5,2 20
x 30  20  20
p   0,7 Cộng 100
n 100
* 18
4.4. Ước lượng điểm
Ví dụ: Để kiểm tra chất lượng một lô hàng lớn, người
ta chọn ngẫu nhiên không lặp 100 sản phẩm. Kết quả
thu được như sau:
Trọng Số sản
Ước lượng điểm phương sai
trọng lượng sản phẩm của lô
lượng (kg) phẩm
hàng: (xi) (fi)
4,8 10

s2 
 i
( x  x ) 2
fi
 0.0162
4,9 20
n 1 5,0 30
5,1 20
5,2 20
Cộng 100
* 19
4.5.1. Ước lượng khoảng của Số trung bình tổng thể
a. Trường hợp biết trước phương sai tổng thể:

 Khoảng tin cậy của µ: ( x  z 2 )
n

Trong đó: x : Số trung bình mẫu


z / 2 : Phân vị chuẩn mức α/2
 : Độ lệch chuẩn tổng thể
Chú ý:
 Nếu n<30 tổng thể phải có phân phối chuẩn.

   Z 2X : Biên sai số (margin of error).

 D x  2Z  2 X : Độ dài khoảng tin cậy.


20
*
4.5.1. Ước lượng khoảng của Số trung bình tổng thể

b. Trường hợp chưa biết Phương sai tổng thể:

s
 Khoảng tin cậy của µ: ( x  t n 1, 2 )
n
Trong đó:
t n 1, / 2 : Phân vị Student bậc tự do n-1, mức α/2
x : Số trung bình mẫu
s : Độ lệch chuẩn mẫu

Chú ý: Nếu n<30 tổng thể phải có phân phối chuẩn.


21
*
Ví dụ: Để kiểm tra chất lượng một lô hàng lớn, người ta
chọn ngẫu nhiên đơn giản 100 sản phẩm. Kết quả thu được
như sau.
s Trọng Số sản
Khoảng tin cậy 95%: ( x  t n 1, 2 ) lượng (kg) phẩm
n
(xi) (fi)
Trong đó: x 
 xf i i
 5,02 (kg) 4,8 10
f i
4,9 20

s 
2 ( xi  x ) 2
fi
 0,0162
5,0 30
n 1 5,1 20
5,2 20
Tra bảng: tn-1, α /2 =t99, 0,025 =1,99

 0 , 0162 
Thay số:  5 , 02  1,99 
 100 
 
Hay: (4,995 ; 5,065) kg
22
*
4.5.2 Ước lượng khoảng của Tỉ lệ tổng thể

 Khoảng tin cậy của tỉ lệ tổng thể:


p (1  p )
( p  z 2 )
n
Trong đó: : Số trung bình mẫu
z /p2 : Phân vị chuẩn mức α/2

p (1  p ) : Biên sai số.


Chú ý:   z 2
n
Điều kiện np≥5 và n(1-p)≥5.

* 23
4.5.2 Ước lượng khoảng của Tỉ lệ tổng thể
Ví dụ: Để kiểm tra chất lượng của một dây chuyền sản
xuất, người ta chọn 1000 sản phẩm ngẫu nhiên cứ một phút
một sản phẩm vừa ra khỏi dây chuyền. Kết quả cho thấy, có
20 sản phẩm có khuyết tật. Ước lượng Tỉ lệ sản phẩm có
khuyết tật của dây chuyền.
20
Ước lượng điểm: p   0,02  2%
1000
p (1  p )
Khoảng tin cậy 95%: ( p  z 2 )
n
Tra bảng phân vị chuẩn: zα/2 = z0,025 =1,96

Thay số: ( 0 , 02  1,96 0 , 02 (1  0 , 02 )


)
1000
Hay: ( 1,13 ; 2,87 ) %
* 24
4.5.3. Ước lượng khoảng của Phương sai tổng thể

 Khoảng tin cậy của phương sai tổng thể:

 ( n  1) s 2 ( n  1) s 2 
 , 2 
 2  n  1 ,1   / 2 
 n  1 , / 2 

* 25
Ví dụ: Để kiểm tra chất lượng một lô hàng lớn, người ta
chọn ngẫu nhiên đơn giản 100 sản phẩm. Kết quả thu được
như sau.
 ( n  1) s 2 ( n  1) s 2 
Khoảng tin cậy 95%:  , 2 

  n  1 , / 2  n  1 ,1   / 2
2

Trong đó: x  5, 02 s 2  0,0162 Trọng Số sản
lượng (kg) phẩm
Tra bảng Khi bình phương:
(xi) (fi)
 n21, / 2   992 ; 0 , 025  128 ,4
4,8 10
 2n 1,1 / 2   99;
2
0,975  73, 4
4,9 20
Thay số: 5,0 30
 (100  1)0,0162 (100  1) 0,0162  5,1 20
 ,  5,2 20
 128 ,4 73,4 

Hay: (0,0125 ; 0,0219)


* 26
4.6. Xác định kích thước mẫu
4.6.1. Kích thước mẫu khi ước lượng số trung bình

 Đặt sai số biên mong muốn là E. Từ công thức tính


sai số biên, ta có: 2

E  z 2
n

z2
Suy ra: n 2
2
2
E

Chú ý: Độ tin cậy 1-α thường được chọn từ 90 đến


99%. Giá trị thường dùng nhất là 95%.

* 27
4.6. Xác định kích thước mẫu
4.6.1. Kích thước mẫu khi ước lượng số trung bình
 Thường không có sẵn Phương sai tổng thể, chọn
một trong những thay thế sau:
+ Lấy phương sai lớn nhất trong các cuộc điều tra
trước (nếu có).
+ Lấy phương sai tương tự ở nơi khác (nếu có).
+ Lấy σ =(xmax-xmin)/4 với xmax và xmin là lượng
biến lớn nhất và nhỏ nhất quan sát hay phỏng đoán
được trong thực tế.
+ Điều tra sơ bộ trên phạm vi nhỏ n* nào đó để
ước lượng σ = s.

* 28
Xác định kích thước mẫu
Ví dụ: Cần phải kiểm tra bao nhiêu sản phẩm để ước
lượng trọng lượng trung bình một sản phẩm của một lô
hàng với độ tin cậy 95% và sai số biên mong muốn là
0,025kg. Mẫu ngẫu nhiên tạm thời 30 SP được chọn.
Trên mẫu tạm thời:
 i Trọng Số sản
 xi fi  2
( x x ) fi
 5, s   0,0107 lượng (kg) phẩm
2
x
 fi n 1
(xi) (fi)
Kích thước mẫu : 4,8 2
z2 2 2 4,9 7
n 2 
E 5,0 13
1,96 2 5,1 5
n 2
* 0,0107  66 SP 5,2 3
0,025
29
*
Xác định kích thước mẫu

Ví dụ: Cần phải kiểm tra bao nhiêu sản phẩm để ước
lượng trọng lượng trung bình một sản phẩm của một lô
hàng với độ tin cậy 95% và sai số biên mong muốn là
0,025kg. Theo ước đoán, sản phẩm nặng nhất của lô
hàng là 5,2kg, sản phẩm nhẹ nhất của lô hàng là 4,8 kg.

σ ≈ (xmax-xmin)/4 = (5,2 – 4,8)/4 = 0,1

Kích thước mẫu :


z2
n 2
2
2
E
1,96 2
n * 0,1  62 SP
2

0,0252
* 30
4.6. Xác định kích thước mẫu
4.6.2. Kích thước mẫu khi ước lượng tỉ lệ

 Đặt sai số biên mong muốn là E. Từ công thức tính


sai số biên, ta có:
p(1  p)
E  z 2
n

z2 2
Suy ra: n 2
p (1  p )
E

Chú ý: Độ tin cậy 1-α thường được chọn từ 90 đến


99%. Giá trị thường dùng nhất là 95%.

* 31
4.6. Xác định kích thước mẫu

4.6.2. Kích thước mẫu khi ước lượng tỉ lệ

 Thường không có sẵn Phương sai tỉ lệ tổng thể,


chọn một trong những thay thế sau:
+ Lấy phương sai lớn nhất trong các cuộc điều tra
trước (nếu có).
+ Lấy phương sai tương tự ở nơi khác (nếu có).
+ Điều tra sơ bộ trên phạm vi nhỏ n* nào đó để
ước lượng.
+ Lấy p=0,5.

* 32
Xác định kích thước mẫu
Ví dụ: Cần phải kiểm tra bao nhiêu sản phẩm để ước
lượng tỉ lệ sản phẩm trên 5kg của một lô hàng với độ tin
cậy 99% và sai số biên mong muốn là 0,1. Một mẫu
ngẫu nhiên tạm thời 30 SP được chọn.
Trọng Số sản
Trên mẫu tạm thời:
lượng (kg) phẩm
p *  8 / 30  0, 267 (xi) (fi)
z2 2 4,8 2
Kích thước mẫu: n  p (1  p )
E 2 4,9 7
5,0 13
2 ,575 2
n 2
 0 , 267 (1  0 , 267 )  130 SP 5,1 5
0 ,1
5,2 3

* 33
Xác định kích thước mẫu
Ví dụ: Cần phải kiểm tra bao nhiêu sản phẩm để ước
lượng tỉ lệ sản phẩm trên 5kg của một lô hàng với độ tin
cậy 99% và sai số biên mong muốn là 0,1.

Không có thông tin mẫu. Chọn p = 0,5.

z2 2
Kích thước mẫu: n p (1  p )
2
E
2,575 2
n 2
* 0,5(1  0,5)  166 SP
0,1

* 34

You might also like