Download as pdf or txt
Download as pdf or txt
You are on page 1of 145

Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

TRƯỜNG ĐẠI HỌC KINH TẾ - LUẬT


KHOA TOÁN KINH TẾ

Chương 2. ƯỚC LƯỢNG

GVC. TS. Lê Thanh Hoa


Thành phố Hồ Chí Minh, Ngày 11 tháng 10 năm 2022
1 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

Nội dung
1 Các vấn đề liên quan đến bài toán ước lượng
2 Ước lượng điểm, ước lượng khoảng tin cậy
3 Uớc lượng trung bình của một tổng thể
4 Xác định cỡ mẫu trong ước lượng TB 1 TT
5 Ước lượng sự sai khác trung bình trên hai tổng thể
6 Ước lượng tỉ lệ trên một tổng thể
7 Xác định cỡ mẫu cho bài toán ước lượng tỉ lệ
8 Ước lượng sự sai khác tỉ lệ trên hai tổng thể
9 Ước lượng phương sai trên một tổng thể
10 Ước lượng sự sai khác phương sai của hai tổng thể
2 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

1. Các vấn đề liên quan đến bài toán ước lượng

3 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

1. Các vấn đề liên quan đến bài toán ước lượng

Các tham số đặc trưng Mẫu Tổng thể


Trung bình x̄ µ
Tỷ lệ p̂ p
Phương sai S 2 σ2
Độ lệch chuẩn S σ

4 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

2. Ước lượng điểm, ước lượng khoảng tin cậy


Có hai loại ước lượng là: ước lượng điểm và ước lượng khoảng

5 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

2. Ước lượng điểm, ước lượng khoảng tin cậy


Ước lượng điểm là phương pháp dùng một tham số thống kê mẫu
đơn lẻ để ước lượng về giá trị thật của tham số tổng thể.

6 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

2. Ước lượng điểm, ước lượng khoảng tin cậy


Ước lượng khoảng là phương pháp dựa vào dữ liệu của mẫu, với
một độ tin cậy cho trước, xác định khoảng giá trị mà đặc trưng của
tổng thể có thể rơi vào.
Giả sử, dựa vào mẫu quan sát tìm được hai biến ngẫu nhiên A
và B sao cho
P(A < θ < B) = 1 − α.
Gọi a, b lần lượt là các giá trị cụ thể của A và B. Khoảng
(a, b) được gọi là khoảng ước lượng với độ tin cậy (1 − α)của
θ, hay nói một cách ngắn gọn là khoảng tin cậy (1 − α) của θ.
7 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

2. Ước lượng điểm, ước lượng khoảng tin cậy

8 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

2. Ước lượng điểm, ước lượng khoảng tin cậy

Bài tập
Bài tập 3.1.a)
Ước lượng điểm cho trọng lượng trung bình của sản phẩm
Trọng lượng 10-12 12-14 14-16 16-18 18-20
(Kg)
Số sản phẩm 4 5 8 3 5

9 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

2. Ước lượng điểm, ước lượng khoảng tin cậy

Thêm vào cột điểm giữa


Trọng lượng 10-12 12-14 14-16 16-18 18-20
(Kg)
Điểm giữa 11 13 15 17 19
Số sản phẩm 4 5 8 3 5

Tính X là ước lượng điểm của trung bình.

10 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

2. Ước lượng điểm, ước lượng khoảng tin cậy


Bài tập
Bài tập 3.7.a) Ước lượng điểm cho mức phương sai của tuổi thọ
bóng đèn

Tuổi thọ 1000 1050 1100 1150 1200


(giờ)
Số bóng 12 23 28 27 10

Giải
Tính phương sai mẫu hiệu chỉnh chính là ước lượng điểm cho
phương sai.
11 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

2. Ước lượng điểm, ước lượng khoảng tin cậy


Các bài toán ước lượng:
Ước lượng trung bình trên 1 tổng thể
Đã biết σ 2
Chưa biết σ 2
Bài toán xác định cỡ mẫu
Ước lượng sự sai khác trung bình trên 2 tổng thể:
Mẫu phối hợp
Mẫu độc lập
Cả 2 mẫu đều lớn
Ít nhất 1 trong 2 mẫu có cỡ mẫu nhỏ
Giả định phương sai hai tổng thể bằng nhau
12 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

2. Ước lượng điểm, ước lượng khoảng tin cậy

Các bài toán ước lượng:


Ước lượng tỷ lệ trên 1 tổng thể
Xác định cỡ mẫu
Ước lượng sai khác tỷ lệ trên 2 tổng thể
Ước lượng phương sai trên 1 tổng thể
Chưa biết µ
Đã biết µ
Ước lượng sai khác phương sai trên 2 tổng thể

13 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

3. Uớc lượng trung bình của một tổng thể


3.0. Biến ngẫu nhiên gốc phân phối chuẩn
Biến ngẫu nhiên gốc tuân theo phân phối X ∼ N(µ, σ 2 )
n
1X
Trung bình mẫu X = Xi
n
i=1
E (X1 )+E (X2 )+···+E (Xn )
Trung bình E (X ) = n
Phương sai của các biến ngẫu nhiên độc lập
Var (X1 ) + Var (X2 ) + · · · + Var (Xn )
Var (X ) =
n2
14 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

3. Uớc lượng trung bình của một tổng thể


3.0. Biến ngẫu nhiên gốc phân phối chuẩn

Biến ngẫu nhiên gốc tuân theo phân phối X ∼ N(µ, σ 2 )

σ2
⇒ X ∼ N(µ, )
n
X −µ
Xét thống kê Z = σ ⇒ Z ∼ N(0, 1).

n

15 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

3. Uớc lượng trung bình của một tổng thể


3.0. Biến ngẫu nhiên gốc phân phối chuẩn
Suy luận cho trung bình của tổng thể có phân phối chuẩn

(X − µ)
T = ∼ T (n − 1)
√S
n

ˆ Khi cỡ mẫu lớn T (n − 1) ∼ N(0, 1).


ˆ Trường hợp đã biết phương sai của tổng thể thì giá trị
T = Z ∼ N(0, 1).
16 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

3. Uớc lượng trung bình của một tổng thể


3.1 Biết phương sai của tổng thể
Giả sử có mẫu n quan sát được chọn ngẫu nhiên từ tổng thể có
phân phối N(µ, σ 2 ) với σ 2 đã biết.
Gọi X̄ là trung bình mẫu.
Khoảng tin cậy (1 − α) của trung bình tổng thể µ được xác định:
Khoảng tin cậy đối xứng (tối ưu)
σ σ
X̄ − zα/2 ∗ √ < µ < X̄ + zα/2 ∗ √
n n
với z có giá trị tra bảng phân phối chuẩn với mức ý nghĩa
α/2.
17 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

3. Uớc lượng trung bình của một tổng thể


3.1 Biết phương sai của tổng thể

18 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

3. Uớc lượng trung bình của một tổng thể


3.1 Biết phương sai của tổng thể
Khoảng tin cậy bất đối xứng, giá trị cực tiểu
σ
X̄ − zα ∗ √ < µ.
n
với z tra bảng phân phối chuẩn với mức ý nghĩa α.
Khoảng tin cậy bất đối xứng, giá trị cực đại
σ
µ < X̄ + zα ∗ √ .
n
với z tra bảng phân phối chuẩn với mức ý nghĩa α.
19 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

3. Uớc lượng trung bình của một tổng thể


3.1 Biết phương sai của tổng thể

20 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

3. Uớc lượng trung bình của một tổng thể


3.1 Biết phương sai của tổng thể
Ví dụ
Một công ty muốn ước lượng số tài liệu (trang) được chuyển bằng
fax trong một ngày. Kết quả thu thập từ 15 ngày cho thấy trung
bình một ngày có 267 trang tài liệu được chuyển bằng fax.
Theo kinh nghiệm từ các văn phòng tương tự thì độ lệch chuẩn là
32 trang.
Hãy ước lượng khoảng tin cậy đối xứng số trang tài liệu chuyển
bằng fax trong một ngày với độ tin cậy 95%. Giả định số trang tài
liệu được chuyển bằng fax tuân theo phân phối chuẩn.
21 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

3. Uớc lượng trung bình của một tổng thể


3.1 Biết phương sai của tổng thể
Giải:
Giả sử số trang tài liệu chuyển bằng fax trong một ngày có phân
phối chuẩn với độ tin cậy 0.95, ta ước lượng
σ σ
X̄ − zα/2 ∗ √ < µ < X̄ + zα/2 ∗ √
n n
với X̄ = 267, σ = 32, n = 15, zα/2 = z0.025 = 1.96.
Ta có 250.8055 < µ < 283.1945.
Như vậy với độ tin cậy 0.95, số lượng tài liệu chuyển trung bình
một ngày được ước lượng từ 251 đến 284 trang.
22 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

3. Uớc lượng trung bình của một tổng thể


3.1 Biết phương sai của tổng thể
Nhận xét:
Với một độ tin cậy và kích thước mẫu n không đổi, nếu độ
lệch chuẩn càng lớn thì khoảng ước lượng càng rộng, tức là độ
chính xác của ước lượng càng thấp.
Với một độ tin cậy và độ lệch chuẩn không đổi, nếu kích thước
mẫu n càng lớn thì khoảng ước lượng càng hẹp, tức là độ
chính xác của ước lượng càng cao.
Với độ lệch chuẩn và kích thước mẫu n không đổi, nếu độ tin
cậy càng cao thì khoảng ước lượng càng rộng, tức là độ chính
xác của ước lượng càng thấp. 23 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

3. Uớc lượng trung bình của một tổng thể


3.1 Biết phương sai của tổng thể

Bài tập
Bài tập 3.1. b)
Trọng lượng sản phẩm là BNN có phân phối chuẩn với σ = 2(Kg ).
Với độ tin cậy 95%, tìm khoảng tin cậy đối xứng cho trọng lượng
trung bình của sản phẩm.

24 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

3. Uớc lượng trung bình của một tổng thể


3.1 Biết phương sai của tổng thể

Giải
Trung bình X
Độ lệch chuẩn σ 2(Kg)
Khoảng tin cậy 95% cho trung bình
 
2 2
X − 1.96 × √ , X + 1.96 × √
n n

25 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

3. Uớc lượng trung bình của một tổng thể


3.2 Chưa biết phương sai của tổng thể
Trong thực tế, ta thường không biết phương sai của tổng thể.
Trong trường hợp này ta vẫn giả định tổng thể có phân phối chuẩn,
khoảng tin cậy đối xứng (1 − α) trung bình tổng thể µ là:
S S
X̄ − tn−1, α/2 ∗ √ < µ < X̄ + tn−1, α/2 ∗√
n n

với t có phân phối Student với bậc tự do (n − 1) và mức ý


nghĩa α/2.
26 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

3. Uớc lượng trung bình của một tổng thể


3.2 Chưa biết phương sai của tổng thể

27 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

3. Uớc lượng trung bình của một tổng thể


3.2 Chưa biết phương sai của tổng thể
Ví dụ
Công ty điện thoại ở một thành phố muốn ước lượng thời gian trung
bình của các cuộc điện đàm đường dài vào những ngày cuối tuần.
Mẫu ngẫu nhiên 20 cuộc gọi đường dài vào những ngày cuối tuần
cho thấy thời gian điện đàm trung bình là 14.8 phút, độ lệch
chuẩn là 5.6 phút.
Hãy ước lượng thời gian trung bình của cuộc điện đàm đường dài
với độ tin cậy 95%. Giả định thời gian điện đàm đường dài tuân
theo phân phối chuẩn.
28 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

3. Uớc lượng trung bình của một tổng thể


3.2 Chưa biết phương sai của tổng thể
Giải:
Với độ tin cậy 0.95, thời gian trung bình của cuộc điện đàm đường
dài µ được xác định như sau:
S S
X̄ − tn−1, α/2 ∗ √ < µ < X̄ + tn−1, α/2 ∗ √
n n
với X̄ = 14.8; S = 5.6; n = 20, tn−1, α/2 = t19, 0.025 = 2.093.
Ta có 12.1792 < µ < 17.4208, nghĩa là với độ tin cậy 0.95, thời
gian trung bình của một cuộc điện đàm đường dài vào cuối tuần
được ước lượng khoảng từ 12.1792 đến 17.4208 phút. 29 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

3. Uớc lượng trung bình của một tổng thể


3.2 Chưa biết phương sai của tổng thể

30 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

3. Uớc lượng trung bình của một tổng thể


3.2 Chưa biết phương sai của tổng thể

31 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

3. Uớc lượng trung bình của một tổng thể


3.2 Chưa biết phương sai của tổng thể

Lưu ý: Trong trường hợp mẫu lớn (n ≥ 30), ta có thể dùng phân
phối chuẩn thay cho phân phối Student.

32 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

3. Uớc lượng trung bình của một tổng thể


3.2 Chưa biết phương sai của tổng thể
Ví dụ
Một trường đại học thực hiện nghiên cứu về số giờ tự học của sinh
viên trong một tuần.
Chọn ngẫu nhiên 200 sinh viên cho thấy số giờ tự học trong tuần
tính trung bình là 18.36 giờ, độ lệch chuẩn là 3.92 giờ.
Hãy ước lượng số giờ tự học trung bình của sinh viên ở trường với
độ tin cậy 95%. Giả sử số giờ tự học của sinh viên trong một tuần
là tuân theo phân phối chuẩn.
33 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

3. Uớc lượng trung bình của một tổng thể


3.2 Chưa biết phương sai của tổng thể
Giải:
Với độ tin cậy 0.95, số giờ tự học trung bình của sinh viên ở trường
này µ được ước lượng là:
S S
X̄ − zα/2 ∗ √ < µ < X̄ + zα/2 ∗ √
n n
với X̄ = 18.36; S = 3.92; n = 200; zα/2 = z0.025 = 1.96.
Ta có 17.8168 < µ < 18.9032, nghĩa là với độ tin cậy 0.95, số giờ
tự học trung bình trong tuần của sinh viên được ước lượng từ
17.8168 đến 18.9032 giờ. 34 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

3. Uớc lượng trung bình của một tổng thể


3.2 Chưa biết phương sai của tổng thể
Bài tập
Bài tập 3.3.a)
Mức cho tiêu trung bình với độ tin cậy 90%.
Giải
Tính các giá trị:
Cỡ mẫu n ≥ 30
Trung bình mẫu X
Độ lệch chuẩn mẫu hiệu chỉnh S
35 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

3. Uớc lượng trung bình của một tổng thể


3.2 Chưa biết phương sai của tổng thể

Ước lượng khoảng với độ tin cậy 90%, nên giá trị tra bảng
z0.05 = 1.645
 
S S
X − 1.645 × √ , X + 1.645 × √
n n

36 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

3. Uớc lượng trung bình của một tổng thể


3.2 Chưa biết phương sai của tổng thể

Bài tập
Bài tập 3.4.a)
Ước lượng mức doanh thu trung bình tối thiểu của cửa hàng với độ
tin cậy 90%.

37 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

3. Uớc lượng trung bình của một tổng thể


3.2 Chưa biết phương sai của tổng thể
Giải
Tính các giá trị:
Cỡ mẫu n ≥ 30
Trung bình mẫu X
Độ lệch chuẩn mẫu hiệu chỉnh S
Ước lượng doanh thu trung bình tối thiểu với độ tin cậy 90%, nên
giá trị tra bảng z0.1 = 1.285
 
S
X − 1.285 × √ , +∞
n 38 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

3. Uớc lượng trung bình của một tổng thể


3.2 Chưa biết phương sai của tổng thể

39 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

40 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

3. Uớc lượng trung bình của một tổng thể


3.2 Chưa biết phương sai của tổng thể

41 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

3. Uớc lượng trung bình của một tổng thể


3.2 Chưa biết phương sai của tổng thể

42 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

4. Xác định cỡ mẫu trong ước lượng TB 1 TT


Giả sử ta có mẫu quan sát được chọn ngẫu nhiên từ tổng thể phân
phối chuẩn có phương sai σ 2 .
Khoảng tin cậy (1 − α) của trung bình tổng thể µ được
xác định bởi
σ σ
X̄ − zα/2 ∗ √ < µ < X̄ + zα/2 ∗ √ .
n n
Gọi ε là sai số ước lượng được xác định bằng nửa chiều
rộng của khoảng tin cậy nên
2
σ zα/2 ∗ σ 2
ε = zα/2 ∗ √ → n = .
n ε2
43 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

4. Xác định cỡ mẫu trong ước lượng TB 1 TT


Ví dụ
Sử dụng các số liệu của ví dụ trên với yêu cầu:
Một công ty muốn ước lượng số tài liệu (trang) được chuyển bằng
fax trong một ngày. Kết quả thu thập từ 15 ngày cho thấy trung
bình một ngày có 267 trang tài liệu được chuyển bằng fax.
Theo kinh nghiệm từ các văn phòng tương tự thì độ lệch chuẩn là
32 trang.
Độ sai lệch khi ước lượng số lượng tài liệu chuyển bằng fax trong
một ngày với độ tin cậy 99% là ε = 10 trang. Kích thước mẫu phải
là bao nhiêu để thỏa mãn điều kiện này?
44 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

4. Xác định cỡ mẫu trong ước lượng TB 1 TT

Giải:
Ta có
zα/2 = z0.005 = 2.575; ε = 10; σ = 32
thì 2
zα/2 ∗ σ 2
n= = 67.89.
ε2
Như vậy cần phải thu thập số liệu ít nhất trong 68 ngày.

45 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

4. Xác định cỡ mẫu trong ước lượng TB 1 TT

46 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

5. Ước lượng sự sai khác trung bình trên hai tổng thể
5.1 Mẫu phối hợp từng cặp

Mẫu phối hợp từng cặp (mẫu phụ thuộc)


Mẫu được chọn từng cặp, từ hai tổng thể.
Giả sử có n các cặp quan sát (x, y ) lấy ngẫu nhiên từ hai tổng
thể X và Y .
Gọi µX , µY lần lượt là trung bình của tổng thể X , Y ;
d¯ là trung bình của n khác biệt;
Sd là độ lệch tiêu chuẩn của n khác biệt.

47 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

5. Ước lượng sự sai khác trung bình trên hai tổng thể
5.1 Mẫu phối hợp từng cặp

Khoảng tin cậy (1 − α) của (µX − µY ) được xác định như sau:
Sd Sd
d¯ − tn−1, α/2 × √ < µX − µY < d¯ + tn−1, α/2 ×√ ,
n n

với t có phân phối Student với bậc tự do (n − 1) .

48 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

Ví dụ
Công ty điện lực thực hiện các biện pháp khuyến khích tiết kiệm
điện. Lượng điện tiêu thụ ghi nhận ở 12 hộ gia đình
Hộ gia đình Trước Sau Độ lệch Bình phương độ
(KWh) (KWh) di = xi − yi lệch (di − d)2
1 73 69 4 0.340278
2 50 54 -4 55.00694
3 83 82 1 5.840278
4 78 67 11 57.50694
5 56 60 -4 55.00694
6 74 73 1 5.840278
49 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

5. Ước lượng sự sai khác trung bình trên hai tổng thể
5.1 Mẫu phối hợp từng cặp
Hộ gia đình Trước Sau Độ lệch Bình phương độ
(KWh) (KWh) di = xi − yi lệch (di − d)2
7 74 75 -1 19.50694
8 87 78 9 31.17361
9 69 64 5 2.506944
10 72 72 0 11.67361
11 77 70 7 12.84028
12 75 63 12 73.67361
Tổng 41 330.9167
50 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

5. Ước lượng sự sai khác trung bình trên hai tổng thể
5.1 Mẫu phối hợp từng cặp
Vậy ta có
41 330.9167
d¯ = = 3.4167; Sd2 = = 30.08333
12 12 − 1
↔ Sd = 5.4848.
Giả sử rằng các khác biệt giữa lượng điện trước và sau khi
khuyến khích tiết kiệm điện di có phân phối chuẩn, khoảng tin
cậy 0.95 của µX − µY là
51 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

5. Ước lượng sự sai khác trung bình trên hai tổng thể
5.1 Mẫu phối hợp từng cặp

Sd Sd
d¯ − tn−1,∗ √ < µX − µY < d¯ + tn−1, α/2 ∗ √ .
α/2
n n
Ta có −0.0682 < µX − µY < 6.9016.
Như vậy, khoảng tin cậy 0.95 của khác biệt giữa lượng điện tiêu thụ
trung bình trước và sau khi khuyến khích tiết kiệm được ước lượng
từ -0.0682 KWh đến 6.9016 KWh.
Khoảng ước lượng này bao gồm trị số 0, do vậy có thể tin rằng
lượng điện tiêu thụ trung bình trước và sau khi thực hiện các
biện pháp khuyến khích tiết kiệm bằng nhau. 52 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

5. Ước lượng sự sai khác trung bình trên hai tổng thể
5.1 Mẫu phối hợp từng cặp

53 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

5. Ước lượng sự sai khác trung bình trên hai tổng thể
5.1 Mẫu phối hợp từng cặp
Bài tập

54 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

5. Ước lượng sự sai khác trung bình trên hai tổng thể
5.2 Mẫu độc lập

Hệ hai biến ngẫu nhiên phân phối chuẩn


X1 ∼ N(µ1 , σ12 ) và X2 ∼ N(µ2 , σ22 )
ˆ Hai mẫu ngẫu nhiên độc lập W1 = {X11 , X12 , ..., X1n1 } và
W2 = {X21 , X22 , ..., X2n2 }.
σ12 σ22
   
ˆ Trung bình mẫu X 1 ∼ N µ1 , và X 2 ∼ N µ2 , .
n1 n2

55 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

5. Ước lượng sự sai khác trung bình trên hai tổng thể
5.2 Mẫu độc lập
Hệ hai biến ngẫu nhiên phân phối chuẩn
Biến ngẫu nhiên Z = X1 − X2 :
ˆ X1 và X2 độc lập
ˆ E (Z ) = µ1 − µ2
σ12 σ22
ˆ Var (Z ) = +
n1 n2
(X1 −X2 )−(µ1 −µ2 )
Do đó phân phối U = v
u 2 ∼ N(0, 1)
u σ1 σ22
t
+
n1 n2
56 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

5. Ước lượng sự sai khác trung bình trên hai tổng thể
5.2 Mẫu độc lập

a. Cả hai mẫu đều là mẫu lớn


Gọi nX , nY là các mẫu được chọn ngẫu nhiên độc lập từ hai tổng
thể phân phối chuẩn X và Y ;
µX , µY là trung bình của hai tổng thể X và Y ;
σX2 , σY2 là phương sai của hai tổng thể X và Y ;
X̄ , Ȳ là trung bình của hai mẫu.

57 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

5. Ước lượng sự sai khác trung bình trên hai tổng thể
5.2 Mẫu độc lập

a. Cả hai mẫu đều là mẫu lớn


Khoảng tin cậy (1 − α) của µX − µY được xác định như sau:
s s
 2
σX 2
σY  σX2 σY2
X̄ − Ȳ −zα/2 ∗ + < µX −µY < X̄ − Ȳ +zα/2 ∗ + ,
nX nY nX nY

với z là giá trị tra bảng phân phối chuẩn.

58 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

5. Ước lượng sự sai khác trung bình trên hai tổng thể
5.2 Mẫu độc lập
Ví dụ
Một công ty đang xem xét kế hoạch tiết giảm chi phí sản xuất
thông qua việc xây dựng một dây chuyền sản xuất mới.
Ở dây chuyền sản xuất mới 40 sản phẩm được sản xuất với thời
gian trung bình 46.5 phút/sản phẩm, độ lệch tiêu chuẩn là 8 phút.
Với dây chuyền sản xuất, 38 sản phẩm được sản xuất với thời gian
trung bình 51.2 phút/sản phẩm, độ lệch chuẩn 9.5 phút.
Hãy ước lượng khoảng tin cậy 0.95 cho khác biệt về thời gian sản
xuất giữa dây chuyền sản xuất mới và cũ.
59 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

5. Ước lượng sự sai khác trung bình trên hai tổng thể
5.2 Mẫu độc lập

a. Cả hai mẫu đều là mẫu lớn


Giải:
Ta có
X̄ = 46.5, SX = 8, nX = 40,
Ȳ = 51.2, SY = 9.5 , nY = 38,
zα/2 = z0.025 = 1.96.

60 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

5. Ước lượng sự sai khác trung bình trên hai tổng thể
5.2 Mẫu độc lập
a. Cả hai mẫu đều là mẫu lớn
Ta có khoảng tin cậy 0.95 sự khác biệt về thời gian sản xuất trung
bình giữa dây chuyền sản xuất mới và cũ là
r
82 9.52
(46.5 − 51.2) − 1.96 ∗ + < µX − µY
40 38
r
82 9.52
< (46.5 − 51.2) + 1.96 ∗ +
40 38
⇒ −8.6077 < µX − µY < −0.7923.
61 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

5. Ước lượng sự sai khác trung bình trên hai tổng thể
5.2 Mẫu độc lập

a. Cả hai mẫu đều là mẫu lớn


Khoảng tin cậy 0.95 tính được chỉ là các giá trị âm, không bao gồm
giá trị 0. Do vậy có thể nói rằng dây chuyền sản xuất mới có thời
gian sản xuất ngắn hơn.
Với độ tin cậy 0.95, ta ước lượng dây chuyền sản xuất mới rút
ngắn thời gian trung bình sản xuất một sản phẩm trong khoảng
từ 0.7923 phút đến 8.6077 phút.

62 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

5. Ước lượng sự sai khác trung bình trên hai tổng thể
5.2 Mẫu độc lập
a. Cả hai mẫu đều là mẫu lớn

63 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

5. Ước lượng sự sai khác trung bình trên hai tổng thể
5.2 Mẫu độc lập
a. Cả hai mẫu đều là mẫu lớn

64 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

5. Ước lượng sự sai khác trung bình trên hai tổng thể
5.2 Mẫu độc lập

a. Cả hai mẫu đều là mẫu lớn


Bài tập
Bài tập 3.T3

65 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

5. Ước lượng sự sai khác trung bình trên hai tổng thể
5.2 Mẫu độc lập

b. Ít nhất một mẫu có cỡ mẫu nhỏ


Trong trường hợp mẫu nhỏ (hoặc nX và nY hoặc cả hai giá trị
này đều nhỏ hơn 30), với giả định hai tổng thể X và Y có phân
phối chuẩn.

66 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

5. Ước lượng sự sai khác trung bình trên hai tổng thể
5.2 Mẫu độc lập
b. Ít nhất một mẫu có cỡ mẫu nhỏ
Giá trị tra bảng phân phối Student với số bậc tự do được xác định
bởi công thức
 2 2
SX SY2
+
nX nY
k = Số bậc tự do =  2 2  2 2
SX SY
nX nY
+
nX − 1 nY − 1
với mức ý nghĩa α/2. 67 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

5. Ước lượng sự sai khác trung bình trên hai tổng thể
5.2 Mẫu độc lập

b. Ít nhất một mẫu có cỡ mẫu nhỏ


Khoảng ước lượng cho sự sai khác trung bình hai tổng thể
s s
2
SX S 2 SX2 S2
(X −Y )−tk,α/2 × + Y < µX −µY < (X −Y )+tk,α/2 × + Y
nX nY nX nY

68 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

5. Ước lượng sự sai khác trung bình trên hai tổng thể
5.2 Mẫu độc lập

b. Ít nhất một mẫu có cỡ mẫu nhỏ


Bài tập
Bài tập 3.T2

69 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

5. Ước lượng sự sai khác trung bình trên hai tổng thể
5.2 Mẫu độc lập

c. Giả định phương sai tổng thể bằng nhau


Gọi S 2 là giá trị ước lượng cho phương sai chung của cả hai
tổng thể
2 (nX − 1) SX2 + (nY − 1) SY2
S = .
nX + nY − 2
Giá trị tra bảng phân phối Student tnX +nY −2,α/2 .

70 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

5. Ước lượng sự sai khác trung bình trên hai tổng thể
5.2 Mẫu độc lập
c. Giả định phương sai tổng thể bằng nhau
Khoảng tin cậy (1 − α) của µX − µY được xác định như sau:
s  
 1 1
X̄ − Ȳ − tnX +nY −2, α/2 ∗ S 2 . + < µX − µY
nX nY
s  
 1 1
< X̄ − Ȳ + tnX +nY −2, α/2 ∗ S 2. + .
nX nY
71 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

5. Ước lượng sự sai khác trung bình trên hai tổng thể
5.2 Mẫu độc lập
c. Giả định phương sai tổng thể bằng nhau
Bài tập
Bài tập 3.4. c)
Năm 2015 cỡ mẫu 6+8+7+6+4=31
trung bình 25.9032
độ lệch chuẩn 0.6636
Năm 2014 cỡ mẫu 25 ngày
trung bình 25.25 triệu đồng
độ lệch chuẩn mẫu 0.5 triệu đồng 72 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

5. Ước lượng sự sai khác trung bình trên hai tổng thể
5.2 Mẫu độc lập

c. Giả định phương sai tổng thể bằng nhau


Ước lượng chênh lệch doanh thu trung bình hằng ngày giữa hai
năm 2015 và 2014 với độ tin cậy 0.95, với giả thiết độ ổn định của
doanh thu hằng ngày của hai năm là bằng nhau.

73 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

5. Ước lượng sự sai khác trung bình trên hai tổng thể
5.2 Mẫu độc lập
c. Giả định phương sai tổng thể bằng nhau
Giải
Phương sai chung

2 30 × 0.66362 + 24 × 0.52
S = = 0.3557 ⇒ S = 0.5964
31 + 25 − 2
Giá trị tra bảng có bậc tự do 31+25-2>30, nên tra bảng phân
phối chuẩn với Z0.025 = 1.96
74 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

5. Ước lượng sự sai khác trung bình trên hai tổng thể
5.2 Mẫu độc lập
c. Giả định phương sai tổng thể bằng nhau
Khoảng tin cậy 95% là
r
1 1
25.9032 − 25.25 − 1.96 × 0.5964 + < µ2015 − µ2014 <
31 25
r
1 1
25.9032 − 25.25 + 1.96 × 0.5964 +
31 25
⇒ 0.3390 < µ2015 − µ2014 < 0.9675
75 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

5. Ước lượng sự sai khác trung bình trên hai tổng thể
5.2 Mẫu độc lập

76 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

5. Ước lượng sự sai khác trung bình trên hai tổng thể
5.2 Mẫu độc lập
c. Giả định phương sai tổng thể bằng nhau

77 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

6. Ước lượng tỉ lệ trên một tổng thể


Biến ngẫu nhiên X tuân theo phân phối Không - Một
(Bernoulli distribution)
Với p là xác suất thành công:

EX = p, Var (X ) = p(1 − p)

ˆ Trong mẫu ngẫu nhiên với cỡ mẫu n,


k là số lượng các quan sát có tính chất A nào đó;
ˆ Tần suất xuất hiện biến cố A là f = kn .
q q
ˆ Nếu n > 5 và 1−p − 1−p
p
p < 0.3

78 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

6. Ước lượng tỉ lệ trên một tổng thể

Biến ngẫu nhiên X tuân theo phân phối Không - Một


(Bernoulli distribution)  
p(1−p)
⇒ Tần suất mẫu xấp xỉ phân phối chuẩn f ∼ N p, n .
f −p
Chuyển hóa dữ liệu Z = r ∼ N(0, 1).
p(1 − p)
n

79 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

6. Ước lượng tỉ lệ trên một tổng thể


Ước lượng tỷ lệ trên một tổng thể
Với mẫu lớn n ≥ 40, khoảng tin cậy (1 − α) của tỷ lệ p các quan
sát có tính chất A trong tổng thể được xác định bởi:
r r
f (1 − f ) f (1 − f )
f − zα/2 < p < f + zα/2 ,
n n

với z là phân phối chuẩn.


Nhận xét: Khi n càng lớn thì khoảng ước lượng càng hẹp, tức độ
chính xác của ước lượng càng cao.
80 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

6. Ước lượng tỉ lệ trên một tổng thể

Ví dụ
Một nghiên cứu được thực hiện nhằm ước lượng thị phần của sản
phẩm nội địa (do các công ty trong nước sản xuất) đối với mặt
hàng bánh kẹo.
Kết quả điều tra ngẫu nhiên 100 khách hàng cho thấy có 34 người
dùng sản phẩm nội địa.
Hãy ước lượng tỷ lệ khách hàng sử dụng sản phẩm bánh kẹo nội địa
với độ tin cậy 0.95.

81 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

6. Ước lượng tỉ lệ trên một tổng thể


Giải:
Với độ tin cậy 0.95, tỷ lệ khách hàng sử dụng sản phẩm bánh kẹo
nội địa p được ước lượng là:
r r
f (1 − f ) f (1 − f )
f − zα/2 < p < f + zα/2 ,
n n
với f = 0.34; n = 100; zα/2 = z0.05 =1.96 ta có:
0.2472 < p < 0.4328
Nghĩa là với độ tin cậy 0.95, thị phần bánh kẹo nội địa được ước
lượng từ 0.2472 đến 0.4328.
82 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

6. Ước lượng tỉ lệ trên một tổng thể

83 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

6. Ước lượng tỉ lệ trên một tổng thể

84 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

6. Ước lượng tỉ lệ trên một tổng thể

85 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

6. Ước lượng tỉ lệ trên một tổng thể

Bài tập
Bài tập 3.2. b)
Ước lượng tỷ lệ chuyến xe có mức tiêu hao không vượt quá 11 (lít),
với độ tin cậy 90%.

86 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

6. Ước lượng tỉ lệ trên một tổng thể


Giải
Cỡ mẫu n=15+20+25+22+18=100
Mức tiêu hao không quá 11 (lít) k=15+20+25=60
k 60
Tỷ lệ f = = = 0.6
n 100
Tra bảng z0.05 = 1.645
Ước lượng khoảng của tỷ lệ tổng thể với độ tin cậy 90% là
r r
0.6(1 − 0.6) 0.6(1 − 0.6)
0.6 − 1.645 × < p < 0.6 + 1.645 ×
100 100
⇒ 0.5194 < p < 0.6806
87 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

6. Ước lượng tỉ lệ trên một tổng thể

88 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

6. Ước lượng tỉ lệ trên một tổng thể

Bài tập
Bài tập 3.3.c)
Cỡ mẫu n=13+21+27+20+19=100
Mức chi tiêu bình thường k=27+20=47
1.6 đến 2.0 triệu
Tỷ lệ f = 0.47
Độ tin cậy 95%

89 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

6. Ước lượng tỉ lệ trên một tổng thể

Giải
Ước lượng khoảng tỷ lệ với độ tin cậy 95%

0.3722 < p < 0.5678

Ước lượng số sinh viên có mức chi tiêu bình thường, biết rằng cả
nước có 2 triệu sinh viên

744353.118092825 < Số sinh viên < 1135646.88190717

90 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

7. Xác định cỡ mẫu cho bài toán ước lượng tỉ lệ

Với các giả thiết


Độ tin cậy (1 − α)
Độ chính xác ε
Tỷ lệ biểu thị tính chất cần xét trong mẫu điều tra f
Ta xác định kích thước mẫu tối thiểu như sau:
2
zα/2 ∗ f ∗ (1 − f )
n= .
ε2

91 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

7. Xác định cỡ mẫu cho bài toán ước lượng tỉ lệ

Trong trường hợp không có thông tin về mẫu điều tra, do


1
f ∗ (1 − f ) ≤
4
Ta có thể sử dụng công thức xác định cỡ mẫu tối thiểu như sau:
2
zα/2
n= .
4ε2

92 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

7. Xác định cỡ mẫu cho bài toán ước lượng tỉ lệ


Ví dụ
Ước lượng thị phần của sản phẩm bánh kẹo nội địa với độ tin cậy
0.99 với sai số ước lượng là 0.03. Kích thước mẫu phải là bao nhiêu
để thỏa mãn điều kiện này?
Giải:
Ta có zα/2 = z0.005 = 2.575; ε = 0.03 nên
2
zα/2
n= = 1841.84.
4ε2
Như vậy cần phải điều tra 1842 người.
93 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

7. Xác định cỡ mẫu cho bài toán ước lượng tỉ lệ

Bài tập
Bài tập 3.8.a)
Ước lượng tỷ lệ chính phẩm của lô hàng bằng khoảng tin cậy đối
xứng với độ tin cậy 95%.
Bài tập 3.8.b)
Muốn giữ nguyên độ tin cậy
1
Độ dài khoảng tin cậy giảm đi còn
4
Cần kiểm tra thêm bao nhiêu sản phẩm nữa?

94 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

7. Xác định cỡ mẫu cho bài toán ước lượng tỉ lệ

Bài tập
Bài tập 3.12.a)
Lô trái cây 200 sọt mỗi sọt có 100 trái
Kiểm tra 50 sọt 450 trái "Không đạt tiêu chuẩn"
Độ tin cậy 96%
Độ chính xác ? số trái cây "Không đạt tiêu chuẩn"

95 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

7. Xác định cỡ mẫu cho bài toán ước lượng tỉ lệ


Độ chính xác tỷ lệ "Không đạt tiêu chuẩn"

s
450 450
r 
f (1 − f ) 50×100 1 − 50×100
ϵ = zα/2 × = 2.045 × = 0.0083
n 50 × 100

Độ chính xác số lượng "Không đạt tiêu chuẩn"

0.0083 × 200 × 100 = 166(trái)

96 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

7. Xác định cỡ mẫu cho bài toán ước lượng tỉ lệ


Bài tập 3.12.b)
Độ chính xác "Đạt tiêu chuẩn" là 150 trái, suy ra độ chính xác tỷ
lệ là
150
ϵ= = 0.0075
200 × 100
Với độ tin cậy 98%, cần kiểm tra số lượng trái cây
 z 2
α/2
n= f (1 − f )
ϵ
 2   
2.33 450 450
= 1− 1−1+
0.0075 50 × 100 50 × 100
97 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

7. Xác định cỡ mẫu cho bài toán ước lượng tỉ lệ

⇒ n = 7904.478 quy tròn n = 7905


Cần kiểm tra thêm

7905 − 50 × 100 = 2905 (trái)

98 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

7. Xác định cỡ mẫu cho bài toán ước lượng tỉ lệ


Bài tập
Bài tập 3.13.
Số tờ bạc giả n=600
Số tờ được đánh dấu k=15
15
Tỷ lệ số tờ được đánh dấu f = = 0.0250
600
Ước lượng khoảng tỷ lệ số tờ giấy bạc giả được đánh dấu với độ tin
cậy 95%
200
0.0125 < p = < 0.0375

⇒ 5334.38629733233 < ñ < 15990.5308020524 99 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

7. Xác định cỡ mẫu cho bài toán ước lượng tỉ lệ

Hay làm tròn


5335 < ñ < 15991
Số lượng tờ giấy bạc giả không được đánh dấu

5135 < ñ˜ < 15791

100 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

8. Ước lượng sự sai khác tỉ lệ trên hai tổng thể

Hai biến ngẫu nhiên gốc trong hai tổng thể là phân phối
Không - Một X1 ∼ A(p1 ), X2 ∼ A(p2 )
ˆ Hai mẫu tương ứng có tần suất lần lượt là f1 , f2 ứng với kích
thước mẫu là n1 , n2 ,
ˆ Phân phối
 xác suấtcủa tần suất khi n1 , n2 đủ  lớn là
p1 (1−p1 ) p2 (1−p2 )
f1 ∼ N p1 , n1 và f2 ∼ N p2 , n2

101 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

8. Ước lượng sự sai khác tỉ lệ trên hai tổng thể


Xét biến ngẫu nhiên hiệu Z = f1 − f2
ˆ E (Z ) = E (f1 − f2 ) = p1 − p2
p1 (1 − p1 ) p2 (1 − p2 )
ˆ Var (Z ) = Var (f1 − f2 ) = +
 n 1 n2 
p1 (1 − p1 ) p2 (1 − p2 )
⇒ Z ∼ N p1 − p2 , +
n1 n2
Chuẩn hóa dữ liệu
(f1 − f2 ) − (p1 − p2 )
⇒U = q ∼ N(0, 1)
p1 (1−p1 ) p2 (1−p2 )
n1 + n2
102 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

8. Ước lượng sự sai khác tỉ lệ trên hai tổng thể

Giả sử ta có hai mẫu


nX , nY được chọn ngẫu nhiên độc lập từ hai tổng thể X và Y ;
pX , pY lần lượt là tỷ lệ các đơn vị có tính chất A trong tổng
thể;
fX , fY lần lượt là tỷ lệ các đơn vị có tính chất A trong mẫu.

103 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

8. Ước lượng sự sai khác tỉ lệ trên hai tổng thể


Với mẫu lớn nX , nY ≥ 40.
Khoảng tin cậy (1 − α) của sự khác biệt tỷ lệ hai tổng thể
pX − pY được xác định như sau:
s
fX (1 − fX ) fY (1 − fY )
(fX − fY ) − zα/2 + ≤ pX − pY
nX nY
s
fX (1 − fX ) fY (1 − fY )
≤ (fX − fY ) + zα/2 +
nX nY

104 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

8. Ước lượng sự sai khác tỉ lệ trên hai tổng thể

Ví dụ
Kết quả điều tra từ mẫu ngẫu nhiên 1000 người ở mỗi thành phố
cho thấy năm 2008.
Tỷ lệ thất nghiệp ở thành phố H là 0.075, ở thành phố K là 0.072.
Hãy ước lượng khoảng tin cậy 0.99 cho sự khác biệt về tỷ lệ thất
nghiệp giữa hai thành phố.

105 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

8. Ước lượng sự sai khác tỉ lệ trên hai tổng thể


Giải:
Ta có
fH = 0.075; fK = 0.072; nH = nK = 1000; zα/2 = z0.005 = 2.575 .
Khoảng ước lượng sự sai khác tỷ lệ trên hai tổng thể:
s
fH (1 − fH ) fK (1 − fK )
(fH − fK ) − zα/2 + ≤ pH − pK
nH nK
s
fH (1 − fH ) fK (1 − fK )
≤ (fH − fK ) + zα/2 +
nH nK
106 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

8. Ước lượng sự sai khác tỉ lệ trên hai tổng thể

→ −0.027 ≤ pH − pK ≤ 0.033.
Với độ tin cậy 0.99, có thể nói rằng tỷ lệ thất nghiệp ở thành
phố H ở trong khoảng thấp hơn 0.027 đến cao hơn 0.033 so
với thành phố K.
Với khoảng tin cậy này ta có thể tin rằng tỷ lệ thất nghiệp ở
hai thành phố là bằng nhau (khoảng tin cậy chứa trị số 0 cho
thấy dấu hiệu về sự bằng nhau giữa hai tỷ lệ tổng thể).

107 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

8. Ước lượng sự sai khác tỉ lệ trên hai tổng thể

108 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

8. Ước lượng sự sai khác tỉ lệ trên hai tổng thể

109 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

8. Ước lượng sự sai khác tỉ lệ trên hai tổng thể

110 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

8. Ước lượng sự sai khác tỉ lệ trên hai tổng thể


Bài tập
Bài tập 3.8.c)
Lô hàng A nA =100 sản phẩm kA =10 phế phẩm
CP k̃A = 100 − 10 = 90 sp
90
fA = = 0.9
100
Lô hàng B nB =120 sản phẩm kB =15 phế phẩm
CP k̃B = 120 − 15 = 105 sp
105
fB = = 0.8750
120
111 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

8. Ước lượng sự sai khác tỉ lệ trên hai tổng thể

Chênh lệch tỷ lệ chính phẩm của hai lô hàng

−0.0450 < pA − pB < 0.0950′

112 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

9. Ước lượng phương sai trên một tổng thể


Suy luận cho phương sai của tổng thể có phân phối chuẩn
a. Trường hợp đã biết µ
Xét thống kê
n n  2
nS ∗2 n 1X 2
X Xi − µ
= 2× (Xi − µ) =
σ2 σ n σ
i=1 i=1
Xi − µ
Do ∼ N(0, 1) nên
σ
n  2
X Xi − µ
∼ χ2 (n)
σ
i=1
113 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

9. Ước lượng phương sai trên một tổng thể

Suy luận cho phương sai của tổng thể có phân phối chuẩn
a. Trường hợp đã biết µ
Hay biểu diễn tương đương

nS ∗2
χ = 2 ∼ χ2 (n).
2
σ

114 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

9. Ước lượng phương sai trên một tổng thể

Suy luận cho phương sai của tổng thể có phân phối chuẩn
a. Trường hợp đã biết µ
Chọn mẫu n quan sát từ tổng thể có phân phối chuẩn.
Khoảng tin cậy (1 − α) của phương sai tổng thể σ 2 là

(n) .S ∗ 2 2 (n) .S ∗ 2
<σ < 2 ,
χ2n; α χn;1− α
2 2

Pn 2
∗2 (Xi −µ)
trong đó S = i=1
n , với trung bình tổng thể đã biết là µ.

115 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

9. Ước lượng phương sai trên một tổng thể

Suy luận cho phương sai của tổng thể có phân phối chuẩn
a. Trường hợp đã biết µ
Công thức tính S ∗2
Pn
X 2 − 2nµX + nµ2
S ∗2 = i=1 i
n
Lưu ý: Trường hợp biết trung bình tổng thể ít khi xảy ra, nên chủ
yếu sử dụng trong trường hợp chưa biết trung bình tổng thể.

116 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

9. Ước lượng phương sai trên một tổng thể

Suy luận cho phương sai của tổng thể có phân phối chuẩn
a. Trường hợp đã biết µ
Bài tập
Bài tập 3.10.b)
Ước lượng sai số của thiết bị với độ tin cậy 0.9 khi biết chiếc ô tô
nặng 5000 (Kg)

117 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

9. Ước lượng phương sai trên một tổng thể


Suy luận cho phương sai của tổng thể có phân phối chuẩn
a. Trường hợp đã biết µ
Giải
Giá trị µ = 5000, n =?
Pn 2 2
∗2 i=1 Xi − 2nµX + nµ
S = = 99
n
Khoảng ước lượng phương sai khi đã biết trung bình của tổng thể

49.2537 < σ 2 < 319.7970


118 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

9. Ước lượng phương sai trên một tổng thể


Suy luận cho phương sai của tổng thể có phân phối chuẩn
b. Trường hợp chưa biết µ
Xét thống kê
Pn n  2
(n − 1)S 2 (X i − X )2 X X i − X
2
= i=1 2 =
σ σ σ
i=1

Hay biểu diễn tương đương

2 (n − 1)S 2
χ = 2
∼ χ2 (n − 1)
σ
119 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

9. Ước lượng phương sai trên một tổng thể

Suy luận cho phương sai của tổng thể có phân phối chuẩn
b. Trường hợp chưa biết µ
Chọn mẫu n quan sát từ tổng thể có phân phối chuẩn.
Khoảng tin cậy (1 − α) của phương sai tổng thể σ 2 , khi không có
bất cứ thông tin gì về trung bình của tổng thể là

(n − 1) .S 2 2 (n − 1) .S 2
<σ < 2 .
χ2n−1; α χn−1;1− α
2 2

120 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

9. Ước lượng phương sai trên một tổng thể

Suy luận cho phương sai của tổng thể có phân phối chuẩn
b. Trường hợp chưa biết µ
trong đó
Cỡ mẫu n;
Độ lệch chuẩn mẫu hiệu chỉnh S 2 ;
Giá trị tra bảng χ2 , lưu ý là chia cả hai giá trị với mức ý nghĩa
là α2 và 1 − α2 .

121 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

9. Ước lượng phương sai trên một tổng thể

Suy luận cho phương sai của tổng thể có phân phối chuẩn
b. Trường hợp chưa biết µ
Ví dụ
Nhà sản xuất quan tâm đến biến thiên của tỷ lệ tạp chất trong một
loại hương liệu được cung cấp.
Chọn mẫu n = 15; S = 0.0236.
Tìm khoảng tin cậy 0.95 về phương sai của tỷ lệ tạp chất.

122 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

9. Ước lượng phương sai trên một tổng thể

Suy luận cho phương sai của tổng thể có phân phối chuẩn
b. Trường hợp chưa biết µ
Dựa vào đề bài ta có
n = 15;
S = 0.0236;
Độ tin cậy 1 − α = 0.95, nên hai giá trị cần tra bảng là
χ215−1, 0.05 và χ215−1,1− 0.05
2 2

123 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

9. Ước lượng phương sai trên một tổng thể


Giải:
Tra bảng phân phối Chi bình phương
χ214;0,025 = 26, 12; χ214;0,975 = 5, 63
Khoảng tin cậy 0.95 cho phương sai của tổng thể là
14.0.02362 2 14.0.02362
<σ <
26, 12 5, 63
→ 2, 9852 × 10−4 < σ 2 < 1, 385 × 10−3
Khoảng tin cậy của phương sai tổng thể là từ 2, 9852 × 10−4 đến
1, 385 × 10−3 .
124 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

9. Ước lượng phương sai trên một tổng thể

125 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

9. Ước lượng phương sai trên một tổng thể

Suy luận cho phương sai của tổng thể có phân phối chuẩn
b. Trường hợp chưa biết µ

126 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

9. Ước lượng phương sai trên một tổng thể

Suy luận cho phương sai của tổng thể có phân phối chuẩn
b. Trường hợp chưa biết µ
Bài tập
Bài tập 3.3.b)
Ước lượng mức độ biến động chi tiêu hàng tháng của sinh viên với
độ tin cậy 95%

127 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

9. Ước lượng phương sai trên một tổng thể


Suy luận cho phương sai của tổng thể có phân phối chuẩn
b. Trường hợp chưa biết µ
Giải
Cỡ mẫu n = 13 + 21 + 27 + 20 + 19 = 100
Phương sai mẫu hiệu chỉnh S 2 = 0.0678
Giá trị tra bảng χ299,0.025 = 129.6 và χ299,0.925 = 74.22
Khoảng ước lượng phương sai
99 × 0.0678 99 × 0.0678
< σ2 <
129.6 74.22
⇒ 0.0518 < σ 2 < 0.0904
128 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

9. Ước lượng phương sai trên một tổng thể

Suy luận cho phương sai của tổng thể có phân phối chuẩn
b. Trường hợp chưa biết µ

129 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

9. Ước lượng phương sai trên một tổng thể


Suy luận cho phương sai của tổng thể có phân phối chuẩn
b. Trường hợp chưa biết µ
Bài tập
Bài tập 3.4.b)
Khoảng tin cậy tối đa cho mức ổn định của doanh thu với độ tin
cậy 95%

σ 2 < 0.7144

130 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

9. Ước lượng phương sai trên một tổng thể

Suy luận cho phương sai của tổng thể có phân phối chuẩn
b. Trường hợp chưa biết µ

131 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

9. Ước lượng phương sai trên một tổng thể


Suy luận cho phương sai của tổng thể có phân phối chuẩn
b. Trường hợp chưa biết µ
Bài tập
Bài tập 3.10.a)
Ước lượng sai số của thiết bị với độ tin cậy 0.9
Cỡ mẫu n=7
Phương sai mẫu 106.9048
Khoảng ước lượng của phương sai
50.9475 < σ 2 < 392.3111 132 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

10. Ước lượng sự sai khác phương sai của hai tổng thể

Xuất phát từ hai mẫu đã chọn từ hai tổng thể, tính các giá trị SX2
và SY2 , giả sử trong hai giá trị thì SX2 > SY2 .
Khi đó ta có công thức về tỷ lệ các phương sai:
SX2
σX2
F(nX −1;nY −1;1− α ) < SY2
< FnX −1;nY −1, α2 .
2
σY2

133 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

10. Ước lượng sự sai khác phương sai của hai tổng thể

Khoảng ước lượng (1 − α) sai khác phương sai của hai tổng
thể là
SX2 1 σX2 SX2 1
. < < .
SY2 FnX −1;nY −1; α2 σY2 SY2 FnX −1;nY −1,;1− α2
SX2 1 σX2 SX2
→ 2. < 2 < 2 .FnY −1;nX −1; α2 .
SY FnX −1;nY −1; α2 σY SY

134 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

10. Ước lượng sự sai khác phương sai của hai tổng thể

Bài tập
Bài tập 3.9.b)
Ước lượng tỷ số hai phương sai của doanh thu với độ tin cậy 0.95

135 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

10. Ước lượng sự sai khác phương sai của hai tổng thể
Giải
Nội thành n1 =20 S1 = 15
Ngoại thành n2 = 20 S2 = 12
Do S1 > S2 nên giá trị tra bảng F19,19,0.025 = 2.509 và
1 1
F19,19,0.975 = =
F19,19,0.025 2.509
Khoảng ước lượng tỷ số hai phương sai là:
σ12
0.6228 < 2 < 3.9203
σ2
136 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

10. Ước lượng sự sai khác phương sai của hai tổng thể

137 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

10. Ước lượng sự sai khác phương sai của hai tổng thể

138 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

10. Ước lượng sự sai khác phương sai của hai tổng thể

139 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

Các nội dung cần ôn tập

Chương 1: Thống kê mô tả
Dữ liệu định tính, dữ liệu đinh lượng
Các loại thang đo dữ liệu (4 loại thang đo)
Các phương pháp chọn mẫu (theo xác suất)
Biểu diễn dữ liệu dưới dạng bảng và đồ thị
Các đại lượng đặc trưng đo độ tập trung của dữ liệu
Các đại lượng đo độ phân tán của dữ liệu

140 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

Các nội dung cần ôn tập


Chương 1: Thống kê mô tả
Các đại lượng đặc trưng đo độ tập trung của dữ liệu
Trung bình
Trung vị
Số yếu vị
Tứ phân vị
Các đại lượng đo độ phân tán của dữ liệu
Khoảng biến thiên
Độ trải giữa
Phương sai và độ lệch chuẩn
Hệ số biến thiên
141 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

Các nội dung cần ôn tập


Chương 2: Ước lượng
Ước lượng điểm, ước lượng khoảng
Ước lượng khoảng trung bình trên một tổng thể
Biết σ 2
Chưa biết σ 2
Ước lượng sai khác trung bình trên hai tổng thể
Mẫu phối hợp
Mẫu độc lập
Hai mẫu đều lớn
Có ít nhất một mẫu có cỡ mẫu nhỏ
Giả định phương sai của hai tổng thể bằng nhau

142 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

Các nội dung cần ôn tập

Chương 2: Ước lượng


Ước lượng tỷ lệ trên một tổng thể
Ước lượng sự sai khác tỷ lệ trên hai tổng thể
Ước lượng hương sai trên một tổng thể
Chưa biết trung bình tổng thể µ
Biết trung bình tổng thể µ
Ước lượng tỷ lệ phương sai trên hai tổng thể

143 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

ĐỀ TÀI LẦN 2: CÁC DỮ LIỆU ĐỊNH LƯỢNG

Kiểm tra dữ liệu có tuân theo phân phối chuẩn hay không?
Nếu có:
Ước lượng trung bình của các biến định lượng trên một tổng
thể với độ tin cậy 90%, 95% và 99%
Sử dụng một biến định tính, chia bộ dữ liệu biến định lượng ra
làm 2 phần, ước lượng sự khác biệt trung bình của biến định
lượng được chia tách bởi biến định tính này.

144 / 145
Các BT UL Đ&K TB 1TT XĐCM TB TB 2 TT TL 1 TT XĐCM TL TL

ĐỀ TÀI LẦN 2: CÁC DỮ LIỆU ĐỊNH LƯỢNG


Kiểm tra dữ liệu có tuân theo phân phối chuẩn hay không?
Nếu không, sử dụng một tính chất để chia bộ dữ liệu ra làm hai
phần, một phần thỏa mãn tính chất nghiên cứu nhận giá trị 1 và
phần còn lại nhận giá trị 0. Bộ dữ liệu mới chỉ nhận giá trị 1 hoặc 0.
Ước lượng tỷ lệ của tính chất nghiên cứu trong dữ liệu mới
trên một tổng thể với độ tin cậy 90%, 95% và 99%
Sử dụng một biến định tính, chia bộ dữ liệu mới ra làm 2
phần, ước lượng sự khác biệt tỷ lệ của tính chất nghiên cứu
trong dữ liệu mới được chia tách bởi biến định tính này.
Deadline: 1 tuần sau khi kết thúc lý thuyết chương 3. Làm
gộp chương 2 và chương 3.
145 / 145

You might also like