Phuong Phap Lay Mau Nghien Cuu

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 61

CÁC PHƯƠNG PHÁP CHỌN MẪU

1
Điều tra chọn mẫu
Một số khái niệm
 Phần tử (element): đơn vị cần quan sát và thu
thập dữ liệu (cá nhân, hộ gia đình, tổ chức,…).
 Tổng thể nghiên cứu (study population): tập hợp
các phần tử mà thực tế có thể nhận dạng và lấy
mẫu. Ví dụ tổng thể nghiên cứu là số hộ gia đình
của một địa phương, số doanh nghiệp tại một địa
phương, số sinh viên tại một trường đại học, số
người tiêu dùng tại một vùng...
Điều tra chọn mẫu

Tổng thể Mẫu


Tóm tắt các đặc trưng

Suy diễn cho các tham số của tổng thể


Điều tra chọn mẫu
200 bóng đèn được chọn để
kiểm tra tuổi thọ
Tổng thể là
toàn bộ bóng
đèn mới mà
công ty A sản
xuất (tuổi thọ Mẫu
trung bình của
bóng đèn mới Tóm tắt các đặc trưng
chưa biết)
Tính tuổi thọ trung bình của
Tuổi thọ trung bình của bóng
200 bóng đèn này
đèn mới

Suy diễn cho các tham số của tổng thể


Một số khái niệm
Khung mẫu (sampling frame): Danh sách các
đơn vị lấy mẫu có sẵn để phục vụ cho việc lấy
mẫu.
STT Hộ
1 Nguyễn Văn A
2 Trần Thị B
3 Trần Thị B
4 Lê Văn C
Chọn mẫu (sampling)
 Là quá trình lựa chọn một bộ phận tương
đối nhỏ từ tổng thể với tích cách là đại
diện cho tổng thể cần nghiên cứu.
 Dựa trên kết quả thu được từ mẫu, nhà
nghiên cứu sẽ suy diễn rộng ra cho tổng
thể.
Vì sao phải chọn mẫu?
 Để có thông tin nhanh hơn và tiết kiệm hơn.
Vd: muốn có số liệu về thu nhập của các hộ gia
đình ở Việt Nam thì nên điều tra toàn bộ hay điều
tra chọn mẫu?
 Trường hợp khi tiến hành điều tra làm biến dạng
hay phá hủy thuộc tính của đơn vị
Vd: thử độ bền của vỏ xe sản xuất
Vì sao phải chọn mẫu?
 Trường hợp số đơn vị của hiện tượng vô hạn hoặc không
xác định
Vd: muốn có số liệu về những người bệnh cao huyết áp tại
TPHCM
 Khi muốn so sánh các hiện tượng với nhau mà chưa có
thông tin cụ thể hoặc khi muốn kiểm định một giả thuyết
đặt ra, người ta thường dùng điều tra chọn mẫu để thu
thập dữ liệu.
Vd: kiểm tra tác dụng của một loại thuốc đối với điều trị
tim mạch
Quá trình chọn mẫu
B1: Định nghĩa tổng thể và phần tử
B2: Xác định khung lấy mẫu
B3: Xác định kích thước mẫu
B4: Xác định phương pháp chọn mẫu
B5: Tiến hành lấy mẫu theo phương pháp đã chọn
Các phương pháp chọn mẫu

1.Chọn mẫu xác suất


2.Chọn mẫu phi xác
suất

11
Chọn mẫu xác suất
 Biết trước xác suất xuất hiện của các phần tử
vào trong mẫu.
 Quá trình chọn mẫu tuân theo quy luật toán,
không thể tự ý thay đổi.
 Các thông số của mẫu có thể dùng để ước
lượng/kiểm nghiệm các thông số của tổng thể.
 Nhược điểm: ?
Hạn chế
(1) Trong nhiều trường hợp không mang tính khả
thi vì không thể có được danh sách tất cả các
đối tượng liên hệ, hoặc nhà nghiên cứu không
đủ thời gian để tiếp cận các đối tượng khi họ
phân tán ở nhiều địa bàn cách xa nhau.
(2) Tốn kém nhiều thời gian và công sức
Chọn mẫu phi xác suất
 Nhà nghiên cứu chọn các phần tử vào mẫu
không theo quy luật ngẫu nhiên
 Không biết xác suất xuất hiện của các phần tử.
Chọn mẫu tùy thuộc vào nhà nghiên cứu.
Ví dụ đến siêu thị phỏng vấn các bà nội trợ về
chi tiêu hàng ngày cho lương thực
 Nhược điểm: ?
Hạn chế
Việc chọn mẫu phải dựa vào kỹ năng
của nhà nghiên cứu hay của nhân viên
chọn mẫu.
Phân loại
Chọn mẫu xác suất Chọn mẫu phi xác suất
Ngẫu nhiên đơn giản Lấy mẫu thuận tiện
(simple random) (convenience)
Hệ thống Lấy mẫu phán đoán
(systematic) (judgment)
Phân tầng Lấy mẫu theo lớp
(stratified random) (quota)
Theo nhóm (cụm, Lấy mẫu theo mầm
chùm) (snow ball)
(cluster)
16
Chọn mẫu ngẫu nhiên đơn giản
Quy trình:
 Cần danh sách của tất cả các
đơn vị mẫu
 Số lượng các đơn vị (cỡ mẫu).
 Chọn ngẫu nhiên các đơn vị
trong danh sách
Ví dụ: Khảo sát thực trạng hiểu
biết về luật giao thông đường
bộ trong 1000 học sinh tại một
trường phổ thông trung học,
chọn mẫu ngẫu nhiên 100 học
sinh để khảo sát. 17
Câu hỏi
 Theo danh sách chọn mẫu, người thu thập
dữ liệu phải phỏng vấn sinh kế của hộ A.
Nhưng hộ A đi vắng, hộ B (không có
trong danh sách mẫu) sẵn sàng cung cấp
dữ liệu sinh kế của gia đình mình (hộ B) .
Người thu thập dữ liệu nên chờ hộ A về
phỏng vấn hay phỏng vấn hộ B?
Thực hành trên Excel
 Cần lấy mẫu ngẫu nhiên 10 phần tử từ khung mẫu có
20 phần tử.
 Thực hiện
 1. Tạo một danh sách số thứ tự từ 1 đến 20 (giả sử đây
là khung mẫu)
 2. Tại cột mới (cột Ngẫu nhiên) dùng hàm RAND()
 3. Sắp xếp theo thứ tự cột mới
 4. Chọn 10 phần tử đầu tiên vào mẫu.
Chọn mẫu hệ thống
Chọn ngẫu nhiên một
điểm xuất phát, dựa vào
bước nhảy để xác định
các phần tử tiếp theo

20
Chọn mẫu hệ thống
Chọn mẫu hệ thống
Chọn mẫu phân tầng (stratified random)
 Tổng thể được chia ra nhiều tầng
(strata) theo nguyên tắc: “cùng tầng
đồng nhất, khác tầng dị biệt”.
 Để chọn phần tử trong mỗi tầng: có thể
dùng p.p. hệ thống.
 Số phần tử trong mỗi tầng được xác
định theo tỷ lệ hoặc không theo tỷ lệ
với kích thước tổng thể.
Ví dụ về các tầng: Theo địa lý: bắc,
trung, nam, 7 vùng kinh tế; Tôn
giáo/sắc tộc; mức thu nhập; giới tính,
nghề nghiệp… 23
Chọn mẫu phân tầng
Các phương pháp chọn mẫu ngẫu nhiên
c. Chọn mẫu phân tầng
Chọn mẫu theo nhóm/cụm (cluster)
 Tổng thể được chia làm nhiều nhóm
(mỗi nhóm mang tính đại diện cho tổng
thể) và tuân theo nguyên tắc: “cùng
nhóm dị biệt, khác nhóm đồng nhất”.
 Các nhóm sẽ được chọn một cách ngẫu
nhiên để tạo thành mẫu
Ví dụ: Chọn mẫu điều tra cá nhân hộ gia
đình
Bước 1: lựa chọn ngẫu nhiên một số
huyện.
Bước 2: các hộ gia đình được lựa chọn
trong các huyện vừa được chọn.
Bước 3: Tất cả cá nhân từ hộ được chọn. 26
Các phương pháp chọn mẫu ngẫu nhiên
d. Chọn mẫu theo nhóm
Chọn mẫu theo nhóm (cluster)
 Ví dụ 2: Chuỗi cửa hàng thức ăn nhanh muốn
tìm hiểu món ăn nào được đặt nhiều nhất.
 B1: Chọn ngẫu nhiên một vài cửa hàng
 B2: Hỏi ý kiến tất cả khách hàng tại các cửa
hàng được chọn.
Ví dụ
Một nhà phân tích thị trường ô tô khảo sát mức độ
hài lòng của những người mới mua ô tô. Danh
sách có tên của 10.000 chủ xe, trong đó 2.500
người mua Ford, 2.500 người mua Honda, 2.500
người mua Toyota, 2.500 người mua GM. Nhà
phân tích này lấy một mẫu danh sách 400 chủ
xe bằng cách chọn ngẫu nhiên 100 chủ xe ở mỗi
nhãn hiệu. Nhà phân tích đang sử dụng phương
pháp chọn mẫu nào? Giải thích.

29
Câu hỏi
Giống và khác giữa chọn mẫu phân
tầng và chọn mẫu theo nhóm?
Trả lời
 Giống: Chia tổng thể thành nhiều nhóm (tầng)
 Khác:
Phân tầng: Khi lấy mẫu thì chọn một vài quan sát
trong tầng
Nhóm: Khi lấy mẫu thì chọn tất cả quan sát trong
nhóm
Bài tập cá nhân
 Tình huống: Có một NC cần quy mô mẫu
500 SV năm một của 5 trường đại học.
Tổng số SV năm một của 5 trường là
10.000 với số lượng từng trường 1, 2, 3, 4,
5 là 2000, 2000, 1000, 2500, 2500. Sinh
viên hãy cho biết cụ thể cách chọn mẫu
500 SV theo 4 cách của phương pháp
chọn mẫu xác suất.
Số liệu giả định về số hộ gia đình nông thôn có vốn đầu tư
cho sản xuất, kinh doanh phân theo vùng của địa bàn “Y”.
Sv cho biết cách chọn mẫu 20 hộ.
Tên Tên
TT bản Số hộ Vùng(*) TT bản Số hộ Vùng
bản bản
1 A 9 1 11 N 10 2
2 I 10 2 12 E 13 1
3 D 11 3 13 P 11 3
4 B 11 1 14 F 11 2
5 K 12 1 15 G 12 1
6 Y 12 2 16 Q 9 3
7 C 9 3 17 Z 10 2
8 L 10 2 18 J 8 1
9 V 11 1 19 H 13 1
10 M 10 1 20 S 14 2
Tổng số 216
(*)Ghi chú: 1: Vùng cánh đồng; 2: Vùng khe dọc; 3: vùng cao
Chọn mẫu thuận tiện (convenience)
 Chọn phần tử dựa trên sự thuận tiện, dễ tiếp
cận, dễ lấy thông tin.
 Nhược điểm: Không xác định được sai số lấy
mẫu và không thể kết luận cho tổng thể từ kết
quả mẫu.
 Sử dụng phổ biến khi bị giới hạn về thời gian
và chi phí.
Vd: phỏng vấn các bà nội trợ tại các siêu thị để
tìm hiểu về hành vi tiêu dùng của người nội trợ.
34
Chọn mẫu phán đoán (judgment)
 Nhà nghiên cứu tự phán đoán sự thích hợp của
các phần tử để mời họ tham gia vào mẫu.
 Đặc điểm giống như chọn mẫu thuận tiện,
nhưng nếu khả năng/kinh nghiệm phán đoán
tốt sẽ cho mẫu tốt hơn thuận tiện.
Ví dụ muốn tìm hiểu thói quen tiêu dùng của phụ
nữ thành đạt, nhà nghiên cứu theo phán đoán sẽ
chọn những phụ nữ ăn mặc sang trọng để
phỏng vấn.
35
Chọn mẫu theo lớp (quota)
 Dựa vào một số thuộc tính kiểm soát xác định một số
phần tử sao cho chúng đảm bảo tỷ lệ của tổng thể và
các đặc trưng kiểm soát.
 Có thể dùng 1 hoặc nhiều thuộc tính kiểm soát như
tuổi, giới tính, thu nhập, loại hình DN…
Vd. Cần phỏng vấn 800 người có tuổi trên 18 tại 1 thành
phố. Phân tổ theo giới tính và tuổi như sau: chọn 400
người (200 nam và 200 nữ) có tuổi từ 18 đến 40, chọn
400 người (200 nam và 200 nữ) có tuổi từ 40 trở lên.

36
Chọn mẫu theo mầm (snow ball)
Chọn ngẫu nhiên những người phỏng
vấn ban đầu, những người tiếp theo
được chọn dựa trên sự giới thiệu của
người trước

37
Sai lệch liên quan đến việc chọn mẫu
 Sai lệch do chọn mẫu (do tính đại diện của
mẫu)
 Sai lệch không do chọn mẫu (xảy ra trong quá
trình phỏng vấn, hiệu chỉnh, nhập dữ liệu,..).

38
Bài tập
 Một công ty có ba nhà máy A, B, C cùng sản xuất linh
kiện điện tử với số lượng lần lượt tại các nhà máy là
20%, 50% và 30%. Bộ phận quản lý chất lượng của
công ty muốn kiểm tra ngẫu nhiên chất lượng 100 linh
kiện ở ba nhà máy nên yêu cầu mỗi nhà máy gửi số
lượng linh kiện như sau: A gửi 20, B gửi 50, C gửi 30.
 a. Bộ phận quản lý chất lượng có phải đang lấy mẫu
ngẫu nhiên đơn giản không?
 b. Nếu không phải thì bộ phận này đang lấy mẫu theo
phương pháp nào?
Bài tập
 Công ty A muốn khảo sát việc sử dụng ngân hàng điện
tử của những người trong độ tuổi từ 18 trở lên. Ở gần
địa bàn của công ty A có năm công ty khác nên A đến
phỏng vấn các nhân viên của năm công ty này.
 a. Tổng thể mà A quan tâm là gì?
 b. Phương pháp thu thập dữ liệu như vậy là phương
pháp gì?
 c. Anh chị cho rằng kết quả phân tích việc sử dụng
ngân hàng điện tử của mẫu này có phản ánh đúng tổng
thể không?
BÀI TẬP
Cho danh sách 100 công ty được đánh số
thứ tự từ 0 đến 99 và sản lượng sản xuất
năm qua. (ĐTV: 10.000 bảng Anh)
1. Lấy các mẫu theo phương pháp ngẫu
nhiên đơn giản, mỗi mẫu chọn 10 công ty.
2. Tính trung bình sản lượng của các công
ty ở các mẫu.
01/04/2017 41
BÀI TẬP
Cho danh sách 100 công ty được đánh số thứ tự từ 0 đến
99 và sản lượng sản xuất năm qua. (ĐTV: 10.000
bảng Anh)
3. Giả sử trung bình tổng thể là 66,08900 bảng Anh.
Trung bình mẫu so với trung bình tổng thể có sai lệch
không?

01/04/2017 42
Hướng dẫn
 Lấy giấy cắt thành 20 tờ thăm.
 Chia đôi thành 2 phần
 Phần 1: 10 tờ thăm đánh số từ 0 đến 9 biểu thị cho hàng
đơn vị
 Phần 2: 10 tờ thăm đánh số từ 0 đến 9 biểu thị cho hàng
chục
 Bốc ngẫu nhiên hàng chục trước, ví dụ số 1.
 Bốc ngẫu nhiên hàng đơn vị, ví dụ số 3
 Vậy công ty thứ 13 được chọn vào mẫu. Làm tiếp tục để
701014
chuong 5-

có thêm các công ty khác vào mẫu. Nếu thăm bốc trùng
Thiết kế
nghiên cứu

thứ tự công ty thì bốc lại.


và các
phương
pháp lấy
01/04/2017 mẫu
43
BÀI TẬP
4. Chọn quy mô mẫu là 10% so với tổng thể và
chọn theo phương pháp hệ thống
5. Tính trung bình cho mẫu này.
6. So sánh với trung bình tổng thể là 660,8900
thì trung bình mẫu này cho kết quả tốt hơn hay
tệ hơn so với trung bình hai mẫu trên?

01/04/2017 44
701014
chuong 5-
Thiết kế
nghiên cứu
và các
phương
pháp lấy
01/04/2017 mẫu
45
 Giả sử trung bình tổng thể là 660.89. Trung bình mẫu
so với trung bình tổng thể có sai lệch không?
 Trung bình bàn 1: 825.05
 Trung bình bàn 2: 593.8
 Trung bình bàn 3: 706.35
 Trung bình bàn 4: 632.6
 Trung bình thứ 5: 989.6
BÀI TẬP
 Tổng thể có 111376 dân phân bố theo tuổi và giới tính
như dưới đây. Hãy chọn mẫu 10% theo quota

701014
chuong 5-
Thiết kế
nghiên cứu
và các
phương
pháp lấy
01/04/2017 mẫu
47
XÁC ĐỊNH CỠ MẪU
 Xác định cỡ mẫu (số đơn vị mẫu) chính là xác
định số lượng đơn vị điều tra trong tổng thể
mẫu để tiến hành thu thập số liệu. Yêu cầu của
cỡ mẫu là vừa đủ để vừa đảm bảo độ tin cậy
cần thiết của số liệu điều tra vừa đảm bảo phù
hợp với điều kiện về nhân lực và kinh phí và có
thể thực hiện được, tức là có tính khả thi.
XÁC ĐỊNH CỠ MẪU
 Khi điều tra chọn mẫu để suy rộng số bình quân theo
một tiêu thức nào đó

 Khi điều tra chọn mẫu để suy rộng tỷ lệ theo một tiêu
thức nào đó

Trong đó:
- N là số đơn vị tổng thể chung.
- S2 và p (1- p) là phương sai của tổng thể chung
với chỉ tiêu bình quân và chỉ tiêu tỷ lệ.
- t là hệ số tin cậy
- ε là phạm vi sai số chọn mẫu.
hệ số tin cậy và xác suất tin cậy

t
1 0,6826
1,5 0,8663
2 0,9545
2,5 0,9875
3 0,9973
XÁC ĐỊNH CỠ MẪU
 Các thông tin trên đây cần có từ khi chuẩn bị điều tra
để xây dựng và quyết định phương án điều tra. Trong
đó, số đơn vị tổng thể chung (N) lấy từ số liệu thống
kê; xác xuất tin cậy (pt) và phạm vi sai số chọn mẫu
(ε) do người tổ chức điều tra yêu cầu cho từng cuộc
điều tra. Riêng phương sai của tổng thể chung (S2 và
p(1-p)) thì phải dựa và kết quả của các cuộc điều tra
trước đó;
XÁC ĐỊNH CỠ MẪU
 Trường hợp không có các cuộc điều tra trước tương tự
hoặc có nhưng không tính được phương sai thì sẽ xử
lý như sau:
 - Khi điều tra nghiên cứu chỉ tiêu bình quân thì phải
điều tra mẫu nhỏ để xác định phương sai
Hoặc

 - Khi điều tra nghiên cứu chỉ tiêu tỷ lệ thì sẽ lấy


phương sai lớn nhất: p(1-p) = 0,5 x (1-0,5) =0,25
VÍ DỤ XÁC ĐỊNH CỠ MẪU
Hãy xác định số hộ (cỡ mẫu) để điều tra thu nhập 1
năm của hộ nông dân trên địa bàn tỉnh “Y” có
200.000 hộ gia đình (N = 200.000), với xác xuất tin
cậy là 0,9875 (tức là t = 2,5), phạm vi sai số chọn
mẫu (ε) không vượt quá 2,52 triệu đồng/năm trong
điều kiện có phương sai về thu nhập của hộ:
S2=61,52.
VÍ DỤ XÁC ĐỊNH CỠ MẪU
Hãy xác định số hộ (cỡ mẫu) để điều tra thu nhập 1
năm của hộ nông dân trên địa bàn tỉnh “Y” có
200.000 hộ gia đình (N = 200.000), với xác xuất tin
cậy là 0,9875 (tức là t = 2,5), phạm vi sai số chọn
mẫu (ε) không vượt quá 2,52 triệu đồng/năm trong
điều kiện có phương sai về thu nhập của hộ:
S2=61,52.
Xác định cỡ mẫu trong nghiên cứu

 Nghiên cứu mô tả: tùy thuộc vào số phần tử của


đám đông (N)
 N< 10.000 phần tử: chọn cỡ mẫu 10%
 N từ 10.000 đến 100.000: chọn từ 1%-5%
 N từ 100.000 đến 1.000.000: chọn 1%
 N trên 1.000.000: chọn 0.1% đến 0.5%

01/04/2017 55
Xác định cỡ mẫu trong nghiên cứu

 Nghiên cứu giải thích


 Theo yêu cầu xử lý thống kê:
 Cỡ mẫu n = bậc của thang đo x số câu hỏi
 Nếu phân tích nhiều nhóm: n= bậc thang đo x số câu
hỏi x số nhóm

01/04/2017 56
THANG ĐO LIKERT
Là thang đo thường có 5 (hoặc 7,9) mức độ
Ví dụ: “Xin đọc kỹ các phát biểu sau. Sau mỗi phát biểu, vui
lòng trả lời bằng cách khoanh tròn vào con số tương ứng
với chọn lựa của Anh/Chị, với qui ước:
Số 1: Rất không đồng ý với câu phát biểu
Số 2: Không đồng ý với câu phát biểu
Số 3: Trung hoà với câu phát biểu
Số 4: Đồng ý với câu phát biểu
Số 5: Rất đồng ý với câu phát biểu”

Công ty có chế độ phúc lợi tốt 1 2 3 4 5


Công ty thực hiện chế độ bảo
1 2 3 4 5
hiểm xã hội tốt
Công ty thực hiện chế độ bảo
1 2 3 4 5
hiểm y tế tốt
VÍ DỤ: TÍNH QUY MÔ MẪU

1. Hãy xác định số hộ (cỡ mẫu) để xác định mức thu


nhập trung bình hàng năm của các hộ gia đình biết
a. xác xuất tin cậy là 0,9875 (tức là t = 2.5),
b. phạm vi sai số chọn mẫu không vượt quá 20 ngàn
đồng
c. Độ lệch chuẩn về thu nhập của hộ 160 ngàn
VÍ DỤ: TÍNH QUY MÔ MẪU
1. Hãy xác định số hộ (cỡ mẫu) để xác định mức thu nhập
trung bình hàng năm của các hộ gia đình biết
a. xác xuất tin cậy là 0,9875 (tức là t = 2.5),
b. phạm vi sai số chọn mẫu (ε) không vượt quá 20 ngàn đồng
c. Độ lệch chuẩn về thu nhập của hộ: S= 160 (S2= 1602 )
Nếu xác xuất tin cậy là 0,9875

Nếu xác xuất tin cậy là 0,95 (t=2)

(hộ)
VÍ DỤ: TÍNH QUY MÔ MẪU

1. Ở 1 tỉnh người ta tổ chức điều tra để xác định tỷ lệ mù


chữ ở độ tuổi lớn hơn 8 tuổi biết
a. xác xuất tin cậy là 0,95 (tức là t = 2),

b. phạm vi sai số chọn mẫu ( ε) là 1%

c. Ở cuộc điều tra năm trước đã xác định tỷ lệ mù chữ ở


tỉnh này là 9%
Tính quy mô mẫu cho cuộc điều tra mù chữ năm nay
VÍ DỤ: TÍNH QUY MÔ MẪU

1. Ở 1 tỉnh người ta tổ chức điều tra để xác định tỷ lệ mù


chữ ở độ tuổi lớn hơn 8 tuổi biết
a. xác xuất tin cậy là 0,95 (tức là t = 2),

b. phạm vi sai số chọn mẫu ( Δ) là 1%

c. Ở cuộc điều tra năm trước đã xác định tỷ lệ mù chữ ở


tỉnh này là 9%
Tính quy mô mẫu cho cuộc điều tra mù chữ năm nay

(người)

You might also like