Professional Documents
Culture Documents
L4_ƯỚC LƯƠNG THAM SỐ THỐNG KÊ
L4_ƯỚC LƯƠNG THAM SỐ THỐNG KÊ
VẬT SUẤT
XÁC LÝ ĐẠITHỐNG
CƯƠNGKÊ
(Dành cho sinh viên y khoa năm nhất)
Giả sử biến ngẫu nhiên X có quy luật phân phối xác suất đã biết, nhưng chưa
biết tham số nào đó của nó. Ta phải xác định một cách gần đúng (ước
lượng) giá trị đó.
Từ tổng thể nghiên cứu, rút ra một mẫu ngẫu nhiên kích thước n :
X , X , … , X . Dựa vào mẫu này ta xây dựng một hàm ∗ của n biến
X , X , … , X để ước lượng .
Có hai phương pháp để ước lượng , đó là ước lượng điểm và ước lượng
khoảng.
1. Ước lượng điểm
Mô tả phương pháp
Từ tổng thể rút ra một mẫu ngẫu nhiên kích thước n:
, ,…, . Ta xây dựng một hàm ∗ nào đó của n biến
ngẫu nhiên X , X , … , X để ước lượng . Ký hiệu hàm đó là
∘
= f X ,X ,…,X .
Vì X , X , … , X là các biến ngẫu nhiên độc lập, có cùng phân
phối, nên ∘ = , ,…, cũng là một biến ngẫu nhiên.
Khi mẫu ngẫu nhiên , ,…, nhận một giá trị cụ thể
x , x , … , x , thì hàm ∗ = f X , X , … , X nhận một giá trị cụ
thể (một điểm) là ∗ = f x , x , … , x và được gọi là ước
lượng điểm của .
1. Ước lượng điểm
Các tiêu chuẩn đánh giá ước lượng điểm
Ước lượng không chệch
∗
Hàm được gọi là ước lượng không chệch của tham số của biến ngẫu
∗
nhiên gốc X nếu = .
∗ ∗
Ngược lại, nếu E ≠ thì được gọi là ước lượng chệch của và
∗
hiệu E − biểu thị sai số của ước lượng, được gọi là độ chệch.
1. Ước lượng điểm
Các tiêu chuẩn đánh giá ước lượng điểm
Ước lượng không chệch
Ước lượng ∗ của được gọi là ước lượng vững nếu với mọi số > 0 cho
trước (bé tùy ý), ta luôn có: lim → P ∗ − < = 1. Nghĩa là khi
kích thước mẫu tăng lên đủ lớn thì ∗ chỉ khác một lượng > 0 (nhỏ tùy
ý) với xác suất gần bằng 1
Trung bình mẫu ‾ là ước lượng vững của kỳ vọng của biến ngẫu
nhiên X.
2. Ước lượng khoảng
Khái niệm khoảng tin cậy
+ Không thể đánh giá khả năng mắc sai lầm khi ước lượng bằng bao
nhiêu
Do đó người ta thường sử dụng phương pháp ước lượng khoảng, đặc biệt
khi mẫu có kích thước nhỏ.
2. Ước lượng khoảng
Khái niệm khoảng tin cậy
∗ ∗
Một khoảng với hai đầu mút là biến ngẫu nhiên ; được gọi là khoảng
∗ ∗
tin cậy của tham số với độ tin cậy p nếu tham số thuộc khoảng ; với
∗ ∗
xác suất p, nghĩa là: P < < =p
∗
Đặt p = 1 − ta có < < ∗ =1−
Ở đây được gọi là độ tin cậy, là mức ý nghĩa của khoảng tin cậy.
∗ ∗
Như vậy ∉ ; chỉ với xác suất .
∗ ∗
Trường hợp khoảng tin cậy có tính chất đối xứng dạng − ; + , thì
được gọi là độ chính xác của ước lượng.
2. Ước lượng khoảng
a.Trường hợp đã biết phương sai hoặc kích thước mẫu ≥ 30
phối chuẩn tắc N(0; 1). Do đó với độ tin cậy p = 1 − cho trước, theo lý
thuyết xác suất ta có:
X−
P <t =1− ⇔ P |X − | < t =1−
n
n
Vậy với độ tin cậy p = 1 − , thì khoảng tin cậy của kỳ vọng của biến ngẫu
Ký hiệu =t và được gọi là độ chính xác của ước lượng, nó phản ánh
mức độ sai lệch của trung bình mẫu X so với trung bình tổng thể với xác suất
p=1− cho trước. Độ tin cậy p = 1 − thường được lấy là 0,95 hoặc 0,99.
2. Ước lượng khoảng
a.Trường hợp đã biết phương sai hoặc kích thước mẫu ≥ 30
Trong thực tế, khi mẫu có kích thước lớn (n ≥ 30) thì ta thay bằng
phương sai mẫu S . Do đó với độ tin cậy p = 1 − , khoảng tin cậy của kỳ
vọng là: S S
X−t ;X + t (đơn vị)
n n
khoảng tin cậy cụ thể của trung bình tổng thể là:
x− ;x + (đơn vị)
2. Ước lượng khoảng
a. Trường hợp đã biết phương sai hoặc kích thước mẫu ≥ 30
Ví dụ: Kiểm nghiệm hàm lượng viên nén Indomethacin của một cơ sở sản
xuất, thu được kết quả (tinh theo mg/viên) như sau:
Hàm lượng 48,5 49,0 49,5 50,0 50,5 51,0
Só viên 1 6 7 9 5 3
Với độ tin cậy 95%; hãy xác định khoảng tin cậy của hàm lượng trung bình
của viên nén Indomethacin của cơ sở sản xuất trên.
2. Ước lượng khoảng
Trường hợp đã biết phương sai hoặc kích thước mẫu ≥ 30
,
Giải: Chọn ℎ = 0,5; = 50,0 và đặt =
,
, = 1,6.
n = 31
48,5 1 −3 −3 9 1 −11
‾= +ℎ⋅ = 50,0 + 0,5 ⋅ = 49,82
49,0 6 −2 −12 24 31
49,5 7 −1 −7 7
50,0 9 0 0 0 1 1
=ℎ −
50,5 5 1 5 5
51,0 3 2 6 12 1 1
= (0,5) ⋅ 57 − (−11) = 0,4282
31 31
Σ 31 −11 57
2. Ước lượng khoảng
Trường hợp đã biết phương sai hoặc kích thước mẫu ≥ 30
Giải:
Với độ tin cậy p = 0,95 ⇒ = 0,05. Tra bảng được t , = 1,960
S 0,4282 50,05
̅± = 49,82 ± 1,960 = 49,82 ± 0,23 =
31 49,59
Vậy khoảng tin cậy của hàm lượng trung bình của viên nén Indomethacin của
cơ sở sản xuất trên là: (49,59; 50,05)(mg/v). Kết luận có độ tin cậy 0,95
2. Ước lượng khoảng
Trường hợp đã biết phương sai hoặc kích thước mẫu ≥ 30
VD2: Tiến hành đo chiều cao cho 95 em học sinh lớp 9 ở một trường trung
học cơ sở, thu được kết quả (tính theo cm ).
Với độ tin cậy 0,95 hãy xác định khoảng tin cậy của chiều cao trung bình của
học sinh lớp 9 trường trung học cơ sở trên.
2. Ước lượng khoảng
Trường hợp đã biết phương sai hoặc kích thước mẫu ≥ 30
Giải: Ta lập bảng tính: Khoảng chiều cao
x∗ y n ny ny
∗ + −
x = ,
2 148 − 152 150 −3 8 −24 72
h= − = 4(i = 1,6)
152 − 156 154 −2 12 −24 48
156 − 160 158 −1 23 −23 23
Chọn x = 162 160 − 164 162 0 27 0 0
∗
164 − 168 166 1 16 16 16
đặt y = (i = 1,6)
168 − 172 170 2 9 18 36
Σ 95 −37 195
2. Ước lượng khoảng
Trường hợp đã biết phương sai hoặc kích thước mẫu ≥ 30
n = 95
1 −37
x=x +h⋅ n y = 162 + 4 ⋅ = 160,44
n 95
1 1 1 1
S =h ⋅ ny − ny =4 ⋅ 195 − (−37) = 30,4151
n n 95 95
h 4
S =S − = 30,4151 − = 29,0818
12 12
2. Ước lượng khoảng
Trường hợp đã biết phương sai hoặc kích thước mẫu ≥ 30
29,0818 161,52
̅± . = 160,44 ± 1,960 = 160,44 ± 1,08 =
95 159,36
Vậy khoảng tin cây của chiều cao trung bình của học sinh lớp 9 trường trung
học cơ sở trên là: (159,36; 161,52)(cm).
Kết luận có độ tin cậy 95%.
2. Ước lượng khoảng
b.Trường hợp chưa biết phương sai và kích thước mẫu n < 30
‾ có phân phối xấp xỉ chuẩn N ; , nhưng chưa biết và kích thước
Theo lý thuyết xác suất thì T có phân phối Student với k = n − 1 bậc tự do và
|X − | t ; S
P < = 1 − ⇔ P |X − | < t ; =1−
S n
n
S S
⇔P X−t ; < <X+t ; =1−
n n
Trong đó giá trị ;
được tra từ bảng giá trị ;
của phân phối Student
2. Ước lượng khoảng
b.Trường hợp chưa biết phương sai và kích thước mẫu n < 30
‾ có phân phối xấp xỉ chuẩn N ; , nhưng chưa biết và kích thước
Theo lý thuyết xác suất thì T có phân phối Student với k = n − 1 bậc tự do và
|X − | t ; S
P < = 1 − ⇔ P |X − | < t ; =1−
S n
n
S S
⇔P X−t ; < <X+t ; =1−
n n
Trong đó giá trị ;
được tra từ bảng giá trị ;
của phân phối Student
2. Ước lượng khoảng
b.Trường hợp chưa biết phương sai và kích thước mẫu n < 30
Vậy với độ tin cậy p = 1 − , thì khoảng tin cậy của kỳ vọng của biến ngẫu
nhiên gốc X (trung bình tổng thể) là: S S
X−t ; ;X +t ; (đơn vị)
n n
x−t ;
;x + t ;
(đơn vị)
2. Ước lượng khoảng
b.Trường hợp chưa biết phương sai và kích thước mẫu n < 30
VD: Nghiên cứu hoạt tính Tetracyclin hydroclorid người ta thu được kết quả
sau (tính theo ED/mg ):
925 940 960 965 995 960 940 925 940 905
Với độ tin cậy 95%; hãy xác định khoảng tin cậy của hoạt tính trung bình của
Tetracyclin hydroclorid được nghiên cứu trên.
2. Ước lượng khoảng
b.Trường hợp chưa biết phương sai và kích thước mẫu n < 30
x n y ny ny
Giải: Ta lập bảng tính: 905 1 −7 −7 49
925 2 −3 −6 18
Chọn ℎ = 5, = 940 940 3 0 0 0
đặt = ( = 1,6) 960 2 4 8 32
965 1 5 25
995 1 11 56 121
Σ 10 10 11 245
2. Ước lượng khoảng
b.Trường hợp chưa biết phương sai và kích thước mẫu n < 30
n = 10 x n y ny ny
1
x=x +h⋅
n
ny 905 1 −7 −7 49
11 925 2 −3 −6 18
= 940 + 5 ⋅ = 945,50
10
940 3 0 0 0
1 1 960 2 4 8 32
S =h ⋅ ny − ny
n−1 n
965 1 5 25
1 1
= (5) ⋅ 245 − (11) = 646,9444 995 1 11 56 121
9 10
Σ 10 10 11 245
2. Ước lượng khoảng
b.Trường hợp chưa biết phương sai và kích thước mẫu n < 30
n = 10
k = n − 1 = 9. Với độ tin cậy p = 0,95
1
x=x +h⋅ ny ⇒ = 0,05. Tra bảng có
n
11 t , ; = 2,262
= 940 + 5 ⋅ = 945,50
10
1 1 S 646,9444
S =h ⋅ ny − ny x±t . ; = 945,50 ± 2,262
n−1 n n 10
963,69
1 1 = 945,50 ± 18,19 =
= (5) ⋅ 245 − (11) = 646,9444 927,31
9 10
Vậy khoảng tin cậy của hoạt tính trung bình của Tetracyclin hydroclorid được nghiên cứu
trên là: (927,31; 963,69)(ED/mg). Kết luận có độ tin cậy 95%.
2. Ước lượng khoảng
c. Khoảng tin cậy của tỉ lệ hay xác suất của biến ngẫu nhiên
Giả sử tổng thể cần nghiên cứu có kích thước N, trong đó có M phần tử mang
dấu hiệu nghiên cứu. Nếu lấy ngẫu nhiên một phần tử thì xác suất để lấy được
phần tử mang dấu hiệu nghiên cứu là p = (tần suất của tổng thể).
Nếu lấy ngẫu nhiên một phần tử và gọi X là số phần tử mang dấu hiệu
nghiên cứu được lấy ra thì X là một biến ngẫu nhiên chỉ có thể nhận giá trị 1
(phần tử lấy ra mang dấu hiệu nghiên cứu) với xác suất P(X = 1) = p, hoặc
nhận giá trị 0 (phần tử lấy ra không mang dấu hiệu nghiên cứu) với xác suất
P(X = 0) = 1 − p.
Ta có kỳ vọng = và phương sai DX = p(1 − p)
2. Ước lượng khoảng
c. Khoảng tin cậy của tỉ lệ hay xác suất của biến ngẫu nhiên
1−
⇔ −p < =1−
2. Ước lượng khoảng
c. Khoảng tin cậy của tỉ lệ hay xác suất của biến ngẫu nhiên
Nếu n khá lớn ( ≥ 100) và không quá gần 0 và 1:
1− 1−
⇔ − < < + =1−
Vậy với độ tin cậy (1 − ), khoảng tin cậy của tỳ lệ hay xác suất p của tổng thể là:
1− 1−
− ; +
Trong đó t là giá trị t ; được tra từ bảng giá trị t ; của phân phối Student.
2. Ước lượng khoảng
c. Khoảng tin cậy của tỉ lệ hay xác suất của biến ngẫu nhiên
Nếu n khá lớn ( ≥ 100) và không quá gần 0 và 1:
Ví dụ: Để xác định tỷ lệ nảy mầm của một lô hạt giống, người ta gieo thử 300
hạt, thì thấy có 276 hạt nảy mầm. Với độ tin cậy 95% hãy xác định khoảng tin cậy
của tỷ lệ nảy mầm của lô hạt giống trên.
Giải: Theo công thức, khoảng tin cậy của tỷ lệ p của tổng thể là:
1− 1−
− ; +
Với mẫu cụ thể: n = 300, m = 276. Độ tin cậy 0,95 thì = 0,05 ⇒ t , = 1,96
2. Ước lượng khoảng
c. Khoảng tin cậy của tỉ lệ hay xác suất của biến ngẫu nhiên
Nếu n khá lớn ( ≥ 100) và không quá gần 0 và 1:
Ta có:
m m 276 276
m 1− 1−
±t n n = 276 ± 1,96 300 300 = 0,92 ± 0,03 = 0,95
,
n n 300 300 0,89
Vậy khoảng tin cậy của tỷ lệ nảy mầm của lô hạt giống trên là: (0,89; 0,95)
hay tỷ lệ nảy mầm từ 89% đến 95%.
Kết luận có độ tin cậy 95%.
2. Ước lượng khoảng
c. Khoảng tin cậy của tỉ lệ hay xác suất của biến ngẫu nhiên
Nếu n khá lớn ( ≥ 100) và không quá gần 0 và 1:
VD: Một vùng có 2000 hộ gia đình. Để điều tra nhu cầu sử dụng một loại
thuốc tân dược tại vùng đó, người ta tìm hiểu ngẫu nhiên 100 gia đình và thấy có
60 gia đình có nhu cầu sử dụng loại thuốc trên. Với độ tin cậy 95% hãy xác định
khoảng tin cậy của số gia đình trong vùng có nhu cầu sử dụng loại thuốc tần
dược trên.
Giải: Gọi M là số gia đình có nhu cầu sử dụng loại thuốc trên thì tỳ lệ gia đình
có nhu cầu sử dụng loại thuốc này là: p =
2. Ước lượng khoảng
c. Khoảng tin cậy của tỉ lệ hay xác suất của biến ngẫu nhiên
Nếu n khá lớn ( ≥ 100) và không quá gần 0 và 1:
Như vậy bài toán được đưa về việc tìm khoảng tin cậy của tỷ lệ p của tổng
thể. Theo công thức, khoảng tin cậy của tỷ lệ p của tổng thể là:
1− 1−
− < < +
Ta có: ±t , = ± 1,96
0,696
= 0,6 ± 0,096 =
0,504
Khoảng tin cậy của tỷ lệ p của tổng thể là: 0,504 < < 0,696
Do p = ⇒ M = p. 2000 ⇒ (1008 < M < 1392)
Vậy khoảng tin cậy của số gia đình trong vùng có nhu cầu sử dụng loại thuốc
tân dược trên là: (1008 < M < 1392) (người). Kết luận có độ tin cậy 95%.
2. Ước lượng khoảng
c. Khoảng tin cậy của tỉ lệ hay xác suất của biến ngẫu nhiên
Nếu n lớn và p gần 0 hoặc gần 1
Theo lý thuyết xác suất thì ta không thể xấp xỉ phân phối nhị thức của p
bằng phân phối chuẩn được, mà ta xấp xỉ bằng phân phối Poisson với tham
số = . Trên cơ sở đó lập được các giá trị trong bảng 5 (phụ lục). Tương
ứng với giá trị m, tra bảng ta tìm được giá trị np và np với độ tin cậy 95%.
Từ đó có khoảng tin cậy 95% của xác suất p là p ; p .
2. Ước lượng khoảng
c. Khoảng tin cậy của tỉ lệ hay xác suất của biến ngẫu nhiên
Nếu n lớn và p gần 0 hoặc gần 1
Ví dụ:
Làm xét nghiệm AIDS cho 1000 người ở một thành phố, thấy có 15 người cho
kết quả dương tính. Xét nghiệm tiếp đối với những người này thấy có 3 người
mắc bệnh AIDS. Hãy xác định khoảng tin cậy cho tỷ lệ người mắc bệnh AIDS ở
thành phố trên với độ tin cậy 95%.
2. Ước lượng khoảng
c. Khoảng tin cậy của tỉ lệ hay xác suất của biến ngẫu nhiên
Nếu n lớn và p gần 0 hoặc gần 1
Giải: Ta thấy tỷ lệ mắc bệnh AIDS được quan sát trên 1000 người ở thành phố
trên là = = 0,003 khá bé, nên tra bảng 5 với m = 3 ta được np = 0,62
và np = 8,76. Do đó p = 0,00062 và p = 0,00876.
Vậy với độ tin cậy 0,95 thì khoảng tin cậy của tỷ lệ người mắc bệnh AIDS ở
thành phố trên là: (0,00062; 0,00876).
2. Ước lượng khoảng
c. Khoảng tin cậy của tỉ lệ hay xác suất của biến ngẫu nhiên
Nếu bé và p không quá gần 0 hoặc 1
Trong trường hợp này ta tra bảng 6 hoặc 7 (phụ lục).
Giả sử 4 ≤ ≤ 10 và m là số lần xuất hiện biến cố A, tương ứng ta tra bảng 7
(phụ lục) tìm được khoảng tin cậy 95% của tỳ lệ p là p ; p ).
Ví dụ:
Người ta áp dụng một trị liệu cho 9 người mắc một bệnh hiếm có, thấy 4
người khỏi bệnh và 5 người không khỏi. Với độ tin cậy 95%, khoảng tin cậy
của tỷ lệ khỏi bệnh là bao nhiêu?
2. Ước lượng khoảng
c. Khoảng tin cậy của tỉ lệ hay xác suất của biến ngẫu nhiên
Nếu bé và p không quá gần 0 hoặc 1
Giải:
Ta có tỷ lệ khỏi bệnh quan sát trên 9 người là = = 0,4444 (44,44%).
Vì n = 9 (mẫu bé), nên ta tra bảng 7 ứng với m = 4, n = 9 được p = 13,7%
và p = 78,8%.
Vậy với độ tin cậy 95% , khoảng tin cậy của tỷ lệ khỏi bệnh là
(13,7%; 78,8%).
2. Phương pháp xác định kích thước mẫu cần thiết
Như vậy với độ tin cậy ( − ) cho trước ta có các trường hợp sau
2. Phương pháp xác định kích thước mẫu cần thiết
Khoảng tin cậy của trung bình:
Với mẫu điều tra sơ bộ có kích thước m ≥ 2 và độ lệch chuẩn mẫu s thì độ
( )
của ước lượng là
Do đó muốn độ chính xác của ước lượng không vượt quá số cho trước thì
phải lấy mẫu kích thước n thỏa mãn: (1 −
(1 − )
≤ ⇒ ≥
Vậy n là số nguyên dương nhỏ nhất thoà mãn: (1 −
≥
Trong đó f là tần suất mẫu điều tra sơ bộ với kích thước m ≥ 2.
3. Phương pháp xác định kích thước mẫu cần thiết
Ví dụ:
Phỏng vấn 5 gia đình có 4 người ở một vùng về chi phí hàng tháng cho nhu
yếu phẩm, thu được các số liệu sau (tính theo nghìn đồng):
700,740,850,930,990. Vậy phải phỏng vấn bao nhiêu gia đình cùng loại để
với độ tin cậy 0,95 sai số của việc ước lượng khoảng tin cậy của chi phí trung
bình hàng tháng cho nhu yếu phẩm không vượt quá 60 ngàn đồng.
3. Phương pháp xác định kích thước mẫu cần thiết
Độ chính xác số = 60
Với độ tin cậy p = 0,95 ⇒ = 0,05
Số bậc tự do k = m − 1 = 4
Tra bảng được t , ; = 2,776
;
( , ) ( )
Theo công thức có: ≥ = = 33,39
( )
Vậy phải phỏng vấn ít nhất 34 gia đình, nghĩa là cần phỏng vấn thêm ít nhất là:
34 − 5 = 29 (gia đình).
3. Phương pháp xác định kích thước mẫu cần thiết
Kiểm tra ngẫu nhiên 100 sản phẩm do một máy sản xuất, thấy có 7 phế phẩm.
Vậy phải kiểm tra bao nhiêu sản phẩm do máy đó sản xuất để với độ tin cậy
0,95 sai số của việc ước lượng khoảng tin cậy của tỳ lệ phế phẩm do máy đó
sản xuất không vượt quá 3%.
Giải
Mẫu sơ bộ có kích thước m = 100, trong đó có 7 phế phầm ⇒ f = = 0,07
Với độ tin cậy = 0,95 ⇒ = 0,05. Tra bảng được t , = 1,96.
3. Phương pháp xác định kích thước mẫu cần thiết
Khoảng tin cậy của tỷ lệ phế phẩm do máy đó sản xuất là:
t f(1 − f)
(1,96) 0,07(1 − 0,07)
n≥ = = 277,88
(0,03)
Vậy phải kiểm tra ít nhất 278 sản phẩm.