Professional Documents
Culture Documents
Chương 5- Điều Tra Chọn Mẫu
Chương 5- Điều Tra Chọn Mẫu
Chương 5
ĐIỀU TRA CHỌN MẪU
Nội dung
I II III IV
XÁC SUẤT VÀ NHỮNG VẤN ĐỀ ƯỚC LƯỢNG KIỂM ĐỊNH GIẢ
QUY LUẬT CHUNG VỀ ĐIỀU KẾT QUẢ ĐIỀU THUYẾT
PHÂN PHỐI TRA CHỌN MẪU TRA CHỌN THỐNG KÊ
XÁC SUẤT MẪU
1
2/22/2021
• Quy luật phân phối xác suất của biến ngẫu nhiên
• Biến ngẫu nhiên là biến nhận một trong các giá trị có thể có của nó tuỳ
thuộc vào sự tác động của các nhân tố ngẫu nhiên trong một phép thử.
• Biến ngẫu nhiên là biến mà các giá trị không được xác định trước qua mỗi
lần thực nghiệm (phép thử) (experiment)
• Biến ngẫu nhiên thường được ký hiệu bằng chữ in hoa X, Y, Z…; các giá
trị của nó được ký hiệu bằng chữ thường x, y, z…
2
2/22/2021
• Xác suất của một biến cố là một con số đặc trưng khả năng khách quan
xuất hiện biến cố đó khi thực hiện phép thử
3
2/22/2021
• Bảng phân phối xác suất (áp dụng cho biến ngẫu nhiên rời rạc)
• Hàm phân phối xác suất (áp dụng cho cả hai loại biến ngẫu nhiên rời rạc
và liên tục)
• Hàm mật độ xác suất (áp dụng cho biến ngẫu nhiên liên tục)
X x1 x2 … xn
P p1 p2 … pn
Lưu ý: 0 ≤ pi ≤ 1
𝑝 =1
𝑝 𝐴<𝑋<𝐵 = 𝑃 𝑋=𝑥 = 𝑝
4
2/22/2021
𝐹 𝑥 = 𝑝
Hàm F(x) cho biết tỷ lệ phần trăm giá trị của X nằm về bên trái của số thực x.
5
2/22/2021
Hàm mật độ xác suất của biến ngẫu nhiên X tại mỗi điểm cho biết mức độ tập trung
xác suất tại điểm đó.
• Kỳ vọng toán (Expected value, mean) của biến ngẫu nhiên X là một số, ký
hiệu là E(X).
• Với biến ngẫu nhiên rời rạc:
𝐸 𝑋 = 𝑥𝑝
• Với biến ngẫu nhiên liên tục với hàm mật độ xác suất f(x):
𝐸 𝑋 = 𝑥𝑓 𝑥 𝑑𝑥
6
2/22/2021
• Phương sai (Variance) của biến ngẫu nhiên X, ký hiệu là V(X) là kỳ vọng
toán của bình phương sai lệch của biến ngẫu nhiên so với kỳ vọng toán
của nó.
𝑉 𝑋 = 𝐸[𝑋 − 𝐸 𝑋 ] = 𝐸 𝑋 − [𝐸 𝑋 ]
• Với biến ngẫu nhiên rời rạc:
𝑉 𝑋 =∑ [𝑥 − 𝐸 𝑋 ] 𝑝 = ∑ 𝑥 𝑝 − [𝐸 𝑋 ]
• Với biến ngẫu nhiên liên tục:
𝑉 𝑋 =∫ [𝑥 − 𝐸 𝑋 ] 𝑓 𝑥 𝑑𝑥 = ∫ 𝑥 𝑓 𝑥 𝑑𝑥 − [𝐸 𝑋 ]
𝑥 x
7
2/22/2021
• V X =𝐸 𝑋 − 𝐸 𝑋 = 𝑝 − 𝑝 = 𝑝 1 − 𝑝 = 𝑝𝑞
Áp dụng với các biến định tính chỉ có hai thuộc tính/phạm trù
8
2/22/2021
• 𝐸 𝑓 =𝐸 = 𝐸 𝑋 = =𝑝
• 𝑉 𝑓 =𝑉 = 𝑉 𝑋 = =
1 ( )
𝐹 𝑥 = 𝑒 𝑑𝑥
𝜎 2𝜋
9
2/22/2021
0 µ x
Φ 𝑢 = ∫ 𝑒 𝑑𝑢
10
2/22/2021
0 u
11
2/22/2021
1 ( ) 𝑏−𝜇 𝑎−𝜇
𝑃 𝑎<𝑋<𝑏 = 𝑓 𝑥 𝑑𝑥 = 𝑒 𝑑𝑥 = Φ −Φ
𝜎 2𝜋 𝜎 𝜎
Với Φ 𝑢 = ∫ 𝑒 𝑑𝑍
12
2/22/2021
m x
m – 3s m – 1s m + 1s m + 3s
m – 2s m + 2s
Tra bảng giá trị tới hạn phân phối chuẩn hóa
z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
. . . . . . . . . . .
1.5 .9332 .9345 .9357 .9370 .9382 .9394 .9406 .9418 .9429 .9441
1.6 .9452 .9463 .9474 .9484 .9495 .9505 .9515 .9525 .9535 .9545
1.7 .9554 .9564 .9573 .9582 .9591 .9599 .9608 .9616 .9625 .9633
1.8 .9641 .9649 .9656 .9664 .9671 .9678 .9686 .9693 .9699 .9706
1.9 .9713 .9719 .9726 .9732 .9738 .9744 .9750 .9756 .9761 .9767
. . . . . . . . . . .
Với 𝛼 = 0,05, phần diện tích phía trái còn lại là 1-0,05=0,95; giá trị tới hạn
tương ứng là 1,645
13
2/22/2021
( )
𝑓 𝑡 = 1+ ∀𝑡
( )
14
2/22/2021
( , ) x
𝑓
15
2/22/2021
Điều tra chọn mẫu là loại hình điều tra không toàn bộ, trong đó người ta
chỉ chọn ra một số đơn vị đủ lớn thuộc đối tượng nghiên cứu để tiến hành
điều tra thực tế.
→Các đơn vị này được chọn theo những quy tắc nhất định để đảm bảo tính
đại biểu và kết quả của ĐTCM được dùng để suy rộng cho toàn bộ hiện
tượng.
16
2/22/2021
Quy mô N n
Số bình quân µ 𝑥̅
𝜎 𝑆
Phương sai
p(1-p) f(1-f)
17
2/22/2021
• Kết cấu tổng thể mẫu khác với kết cấu tổng thể chung
18
2/22/2021
19
2/22/2021
Lưu ý
• Các mẫu ngẫu nhiên là các mẫu được chọn có sử dụng các nguyên lý xác
suất
• Nó cho phép xác định phân phối mẫu của một thống kê mẫu
• Có thể xác định xác suất của bất kỳ sai số chọn mẫu nào và thực hiện suy
luận cho các đặc trưng của tổng thể
20
2/22/2021
21
2/22/2021
( )
Độ lệch chuẩn của tỷ lệ mẫu là: 𝜎 =
22
2/22/2021
Lấy mẫu
23
2/22/2021
Ước lượng tỷ lệ theo một tiêu thức của tổng thể chung
• Đưa ra một khoảng giá trị dựa trên quan sát từ 1 tổng thể mẫu
• Tìm giá trị gần nhất đối với các tham số của tổng thể chung
• Khoảng tin cậy luôn tương ứng với 1 xác suất nhất định
24
2/22/2021
Xác suất để tham số của tổng thể chung rơi vào trong khoảng tin cậy gọi là
độ tin cậy (level of confidence), là (1-α)%.
Ví dụ: 90%, 95%, 99%...
α là xác suất để tham số của tổng thể chung không rơi vào trong khoảng
tin cậy, gọi là mức ý nghĩa (significance level).
• Để ước lượng khoảng tin cậy cho trung bình của TTC, phạm vi sai số
chọn mẫu phụ thuộc vào độ lệch chuẩn của TTC б hoặc độ lệch chuẩn
của TTM S
25
2/22/2021
𝑥̅ p
m
𝑍 .𝜎 𝑧 / 𝜎 𝑧 / 𝜎
⁄ ̅ 𝑍 ⁄ .𝜎 ̅
x z / 2 .s x m x z / 2 .s x
• Khoảng tin cậy phía phải:
m x z .s x
• Khoảng tin cậy phía trái:
x z .s x m
26
2/22/2021
x t n / 21.s x m x t n / 21.s x
• Khoảng tin cậy phía phải:
m x t n 1.s x
• Khoảng tin cậy phía trái:
x t n 1.s x m
f z / 2 .s f p f z / 2 .s f
• Khoảng tin cậy phía phải:
p x z .s f
• Khoảng tin cậy phía trái:
f z .s f p
27
2/22/2021
Lưu ý
• Hệ số tin cậy zα là giá trị tới hạn mức α của phân phối chuẩn hoá
• Hệ số tin cậy tα là giá trị tới hạn mức α của phân phối Student
s2 s2 n
sx sx (1 )
Số bình quân n n N
S2 S2 n
sx sx (1 )
n n N
f (1 f ) f (1 f ) n
Tỷ lệ sf sf (1 )
n n N
28
2/22/2021
Lưu ý
• Sự khác biệt giữa hai phương pháp chọn hoàn lại và chọn không hoàn lại
chính là (1 – n/N). Do đó, ta luôn có sai số bình quân chọn mẫu theo cách
chọn hoàn lại lớn hơn sai số bình quân chọn mẫu theo cách chọn không
hoàn lại.
• Khi n nhỏ hơn rất nhiều so với N thì khi đó n/N nhỏ và (1-n/N) gần với 1.
Do vậy có thể chọn theo cách không hoàn lại nhưng sử dụng công thức
của chọn hoàn lại để tính sai số bình quân chọn mẫu cho đơn giản.
Yêu cầu:
29
2/22/2021
s s
x z / 2 .s x z / 2 x t / 2,(n1) .sx t / 2,(n1)
n n
f (1 f )
f z / 2 .
n
30
2/22/2021
Lưu ý
Trong trường hợp chưa biết phương sai của TTC, có thể sử dụng một
trong các cách sau:
• Lấy phương sai (s2) lớn nhất trong các lần điều tra trước (nếu có). Trong
trường hợp ước lượng tỷ lệ, chọn tỷ lệ (p) gần 0,5 nhất.
• Lấy phương sai hoặc tỷ lệ của các cuộc điều tra khác có tính chất tương
tự (nếu có)
• Điều tra thí điểm để xác định phương sai.
• Ước lượng phương sai dựa vào khoảng biến thiên
R x max x min
s
6 6
31
2/22/2021
• Các bước tiến hành kiểm định một giả thuyết thống kê
• Tham số phải được xác định trước khi © 1984-1994 T/Maker Co.
phân tích.
Thu thập thông tin từ mẫu để rút ra kết luận
về giả thiết cần kiểm định.
32
2/22/2021
33
2/22/2021
Kiểm định 2 phía là bác bỏ giả thuyết H0 khi tham số đặc trưng của mẫu
cao hơn hoặc thấp hơn so với giá trị của giả thuyết về tổng thể chung.
Kiểm định 2 phía có 2 miền bác bỏ.
Kiểm định phía trái là bác bỏ giả thuyết H0 khi tham số đặc trưng của
mẫu nhỏ hơn một cách đáng kể so với giá trị của giả thuyết H0. Miền bác
bỏ nằm ở phía trái của đường phân phối.
34
2/22/2021
Kiểm định phía phải là bác bỏ giả thuyết H0 khi tham số đặc trưng của
mẫu lớn hơn một cách đáng kể so với giá trị của giả thuyết H0. Miền bác
bỏ nằm ở phía phải của đường phân phối.
35
2/22/2021
H 0: m ≥ 3 Giá trị
H 1: m < 3 tới hạn
0
Miền bác bỏ
H 0: m ≤ 3
H 1: m > 3
0
/2
H 0: m 3
H 1: m 3
0
36
2/22/2021
37
2/22/2021
Sau khi tính được giá trị của tiêu chuẩn kiểm định từ mẫu quan sát,
tính P-value tùy theo loại kiểm định
• Với kiểm định phía trái, P-value=diện tích của đuôi trái
• Với kiểm định phía phải, P-value=diện tích của đuôi phải
• Với kiểm định hai phía, P-value=2 lần diện tích đuôi trái hoặc phải
38
2/22/2021
VD. Tiêu chuẩn kiểm định của kiểm định hai phía là z = 2,63. Tính P-value.
• Kiểm định trung bình của nhiều tổng thể (tự đọc)
39
2/22/2021
• Giả sử lượng biến của tiêu thức X trong tổng thể chung phân phối theo
quy luật chuẩn với trung bình là m và phương sai là s2. Ký hiệu: N (m, s2).
• Để kiểm định giả thuyết này, từ TTC, chọn điều tra ngẫu nhiên một mẫu
mẫu gồm n đơn vị và tính được trung bình mẫu là 𝑥̅ .
H0 đúng, z phân phối theo quy luật chuẩn hoá N(0,1).
H0: m ≤ m0
Kiểm định phía phải: Nếu z > Z, bác bỏ H0.
H1: m > m0
H0: m ≥ m0
Kiểm định phía trái: Nếu z < -Z, bác bỏ H0.
H1: m < m0
H0: m = m0
Kiểm định hai phía:
H1: m ≠ m0
40
2/22/2021
H0 đúng, t phân phối theo quy luật Student với (n - 1) bậc tự do.
H0: m ≤ m0
Kiểm định phía phải: Nếu t > t,(n-1), bác bỏ H0.
H1: m > m0
H0: m ≥ m0
Kiểm định phía trái: Nếu t < -t,(n-1), bác bỏ H0.
H1: m < m0
H0: m = m0
Kiểm định hai phía:
H1: m ≠ m0
• Kiểm định giả thuyết về tỷ lệ của 1 tổng thể chung
• Kiểm định giả thuyết về tỷ lệ của 2 tổng thể (tự đọc)
• Kiểm định giả thuyết về tỷ lệ của nhiều tổng thể (tự đọc)
41
2/22/2021
( f p0 )
z
p0 ( 1 p0 )
n
H0: p ≤ p0
Kiểm định phía phải: Nếu z > Z, bác bỏ giả thuyết H0.
H1: p > p0
H0: p ≥ p0
Kiểm định phía trái: Nếu z < -Z, bác bỏ giả thuyết H0.
H1: p < p0
H0: p = p0
Kiểm định hai phía: Nếu |z| > Z/2, bác bỏ giả thuyết H0.
H1: p ≠ p0
42