Professional Documents
Culture Documents
Phuong Phap Lay Mau Nghien Cuu
Phuong Phap Lay Mau Nghien Cuu
Phuong Phap Lay Mau Nghien Cuu
1
Điều tra chọn mẫu
Một số khái niệm
Phần tử (element): đơn vị cần quan sát và thu
thập dữ liệu (cá nhân, hộ gia đình, tổ chức,…).
Tổng thể nghiên cứu (study population): tập hợp
các phần tử mà thực tế có thể nhận dạng và lấy
mẫu. Ví dụ tổng thể nghiên cứu là số hộ gia đình
của một địa phương, số doanh nghiệp tại một địa
phương, số sinh viên tại một trường đại học, số
người tiêu dùng tại một vùng...
Điều tra chọn mẫu
11
Chọn mẫu xác suất
Biết trước xác suất xuất hiện của các phần tử
vào trong mẫu.
Quá trình chọn mẫu tuân theo quy luật toán,
không thể tự ý thay đổi.
Các thông số của mẫu có thể dùng để ước
lượng/kiểm nghiệm các thông số của tổng thể.
Nhược điểm: ?
Hạn chế
(1) Trong nhiều trường hợp không mang tính khả
thi vì không thể có được danh sách tất cả các
đối tượng liên hệ, hoặc nhà nghiên cứu không
đủ thời gian để tiếp cận các đối tượng khi họ
phân tán ở nhiều địa bàn cách xa nhau.
(2) Tốn kém nhiều thời gian và công sức
Chọn mẫu phi xác suất
Nhà nghiên cứu chọn các phần tử vào mẫu
không theo quy luật ngẫu nhiên
Không biết xác suất xuất hiện của các phần tử.
Chọn mẫu tùy thuộc vào nhà nghiên cứu.
Ví dụ đến siêu thị phỏng vấn các bà nội trợ về
chi tiêu hàng ngày cho lương thực
Nhược điểm: ?
Hạn chế
Việc chọn mẫu phải dựa vào kỹ năng
của nhà nghiên cứu hay của nhân viên
chọn mẫu.
Phân loại
Chọn mẫu xác suất Chọn mẫu phi xác suất
Ngẫu nhiên đơn giản Lấy mẫu thuận tiện
(simple random) (convenience)
Hệ thống Lấy mẫu phán đoán
(systematic) (judgment)
Phân tầng Lấy mẫu theo lớp
(stratified random) (quota)
Theo nhóm (cụm, Lấy mẫu theo mầm
chùm) (snow ball)
(cluster)
16
Chọn mẫu ngẫu nhiên đơn giản
Quy trình:
Cần danh sách của tất cả các
đơn vị mẫu
Số lượng các đơn vị (cỡ mẫu).
Chọn ngẫu nhiên các đơn vị
trong danh sách
Ví dụ: Khảo sát thực trạng hiểu
biết về luật giao thông đường
bộ trong 1000 học sinh tại một
trường phổ thông trung học,
chọn mẫu ngẫu nhiên 100 học
sinh để khảo sát. 17
Câu hỏi
Theo danh sách chọn mẫu, người thu thập
dữ liệu phải phỏng vấn sinh kế của hộ A.
Nhưng hộ A đi vắng, hộ B (không có
trong danh sách mẫu) sẵn sàng cung cấp
dữ liệu sinh kế của gia đình mình (hộ B) .
Người thu thập dữ liệu nên chờ hộ A về
phỏng vấn hay phỏng vấn hộ B?
Thực hành trên Excel
Cần lấy mẫu ngẫu nhiên 10 phần tử từ khung mẫu có
20 phần tử.
Thực hiện
1. Tạo một danh sách số thứ tự từ 1 đến 20 (giả sử đây
là khung mẫu)
2. Tại cột mới (cột Ngẫu nhiên) dùng hàm RAND()
3. Sắp xếp theo thứ tự cột mới
4. Chọn 10 phần tử đầu tiên vào mẫu.
Chọn mẫu hệ thống
Chọn ngẫu nhiên một
điểm xuất phát, dựa vào
bước nhảy để xác định
các phần tử tiếp theo
20
Chọn mẫu hệ thống
Chọn mẫu hệ thống
Chọn mẫu phân tầng (stratified random)
Tổng thể được chia ra nhiều tầng
(strata) theo nguyên tắc: “cùng tầng
đồng nhất, khác tầng dị biệt”.
Để chọn phần tử trong mỗi tầng: có thể
dùng p.p. hệ thống.
Số phần tử trong mỗi tầng được xác
định theo tỷ lệ hoặc không theo tỷ lệ
với kích thước tổng thể.
Ví dụ về các tầng: Theo địa lý: bắc,
trung, nam, 7 vùng kinh tế; Tôn
giáo/sắc tộc; mức thu nhập; giới tính,
nghề nghiệp… 23
Chọn mẫu phân tầng
Các phương pháp chọn mẫu ngẫu nhiên
c. Chọn mẫu phân tầng
Chọn mẫu theo nhóm/cụm (cluster)
Tổng thể được chia làm nhiều nhóm
(mỗi nhóm mang tính đại diện cho tổng
thể) và tuân theo nguyên tắc: “cùng
nhóm dị biệt, khác nhóm đồng nhất”.
Các nhóm sẽ được chọn một cách ngẫu
nhiên để tạo thành mẫu
Ví dụ: Chọn mẫu điều tra cá nhân hộ gia
đình
Bước 1: lựa chọn ngẫu nhiên một số
huyện.
Bước 2: các hộ gia đình được lựa chọn
trong các huyện vừa được chọn.
Bước 3: Tất cả cá nhân từ hộ được chọn. 26
Các phương pháp chọn mẫu ngẫu nhiên
d. Chọn mẫu theo nhóm
Chọn mẫu theo nhóm (cluster)
Ví dụ 2: Chuỗi cửa hàng thức ăn nhanh muốn
tìm hiểu món ăn nào được đặt nhiều nhất.
B1: Chọn ngẫu nhiên một vài cửa hàng
B2: Hỏi ý kiến tất cả khách hàng tại các cửa
hàng được chọn.
Ví dụ
Một nhà phân tích thị trường ô tô khảo sát mức độ
hài lòng của những người mới mua ô tô. Danh
sách có tên của 10.000 chủ xe, trong đó 2.500
người mua Ford, 2.500 người mua Honda, 2.500
người mua Toyota, 2.500 người mua GM. Nhà
phân tích này lấy một mẫu danh sách 400 chủ
xe bằng cách chọn ngẫu nhiên 100 chủ xe ở mỗi
nhãn hiệu. Nhà phân tích đang sử dụng phương
pháp chọn mẫu nào? Giải thích.
29
Câu hỏi
Giống và khác giữa chọn mẫu phân
tầng và chọn mẫu theo nhóm?
Trả lời
Giống: Chia tổng thể thành nhiều nhóm (tầng)
Khác:
Phân tầng: Khi lấy mẫu thì chọn một vài quan sát
trong tầng
Nhóm: Khi lấy mẫu thì chọn tất cả quan sát trong
nhóm
Bài tập cá nhân
Tình huống: Có một NC cần quy mô mẫu
500 SV năm một của 5 trường đại học.
Tổng số SV năm một của 5 trường là
10.000 với số lượng từng trường 1, 2, 3, 4,
5 là 2000, 2000, 1000, 2500, 2500. Sinh
viên hãy cho biết cụ thể cách chọn mẫu
500 SV theo 4 cách của phương pháp
chọn mẫu xác suất.
Số liệu giả định về số hộ gia đình nông thôn có vốn đầu tư
cho sản xuất, kinh doanh phân theo vùng của địa bàn “Y”.
Sv cho biết cách chọn mẫu 20 hộ.
Tên Tên
TT bản Số hộ Vùng(*) TT bản Số hộ Vùng
bản bản
1 A 9 1 11 N 10 2
2 I 10 2 12 E 13 1
3 D 11 3 13 P 11 3
4 B 11 1 14 F 11 2
5 K 12 1 15 G 12 1
6 Y 12 2 16 Q 9 3
7 C 9 3 17 Z 10 2
8 L 10 2 18 J 8 1
9 V 11 1 19 H 13 1
10 M 10 1 20 S 14 2
Tổng số 216
(*)Ghi chú: 1: Vùng cánh đồng; 2: Vùng khe dọc; 3: vùng cao
Chọn mẫu thuận tiện (convenience)
Chọn phần tử dựa trên sự thuận tiện, dễ tiếp
cận, dễ lấy thông tin.
Nhược điểm: Không xác định được sai số lấy
mẫu và không thể kết luận cho tổng thể từ kết
quả mẫu.
Sử dụng phổ biến khi bị giới hạn về thời gian
và chi phí.
Vd: phỏng vấn các bà nội trợ tại các siêu thị để
tìm hiểu về hành vi tiêu dùng của người nội trợ.
34
Chọn mẫu phán đoán (judgment)
Nhà nghiên cứu tự phán đoán sự thích hợp của
các phần tử để mời họ tham gia vào mẫu.
Đặc điểm giống như chọn mẫu thuận tiện,
nhưng nếu khả năng/kinh nghiệm phán đoán
tốt sẽ cho mẫu tốt hơn thuận tiện.
Ví dụ muốn tìm hiểu thói quen tiêu dùng của phụ
nữ thành đạt, nhà nghiên cứu theo phán đoán sẽ
chọn những phụ nữ ăn mặc sang trọng để
phỏng vấn.
35
Chọn mẫu theo lớp (quota)
Dựa vào một số thuộc tính kiểm soát xác định một số
phần tử sao cho chúng đảm bảo tỷ lệ của tổng thể và
các đặc trưng kiểm soát.
Có thể dùng 1 hoặc nhiều thuộc tính kiểm soát như
tuổi, giới tính, thu nhập, loại hình DN…
Vd. Cần phỏng vấn 800 người có tuổi trên 18 tại 1 thành
phố. Phân tổ theo giới tính và tuổi như sau: chọn 400
người (200 nam và 200 nữ) có tuổi từ 18 đến 40, chọn
400 người (200 nam và 200 nữ) có tuổi từ 40 trở lên.
36
Chọn mẫu theo mầm (snow ball)
Chọn ngẫu nhiên những người phỏng
vấn ban đầu, những người tiếp theo
được chọn dựa trên sự giới thiệu của
người trước
37
Sai lệch liên quan đến việc chọn mẫu
Sai lệch do chọn mẫu (do tính đại diện của
mẫu)
Sai lệch không do chọn mẫu (xảy ra trong quá
trình phỏng vấn, hiệu chỉnh, nhập dữ liệu,..).
38
Bài tập
Một công ty có ba nhà máy A, B, C cùng sản xuất linh
kiện điện tử với số lượng lần lượt tại các nhà máy là
20%, 50% và 30%. Bộ phận quản lý chất lượng của
công ty muốn kiểm tra ngẫu nhiên chất lượng 100 linh
kiện ở ba nhà máy nên yêu cầu mỗi nhà máy gửi số
lượng linh kiện như sau: A gửi 20, B gửi 50, C gửi 30.
a. Bộ phận quản lý chất lượng có phải đang lấy mẫu
ngẫu nhiên đơn giản không?
b. Nếu không phải thì bộ phận này đang lấy mẫu theo
phương pháp nào?
Bài tập
Công ty A muốn khảo sát việc sử dụng ngân hàng điện
tử của những người trong độ tuổi từ 18 trở lên. Ở gần
địa bàn của công ty A có năm công ty khác nên A đến
phỏng vấn các nhân viên của năm công ty này.
a. Tổng thể mà A quan tâm là gì?
b. Phương pháp thu thập dữ liệu như vậy là phương
pháp gì?
c. Anh chị cho rằng kết quả phân tích việc sử dụng
ngân hàng điện tử của mẫu này có phản ánh đúng tổng
thể không?
BÀI TẬP
Cho danh sách 100 công ty được đánh số
thứ tự từ 0 đến 99 và sản lượng sản xuất
năm qua. (ĐTV: 10.000 bảng Anh)
1. Lấy các mẫu theo phương pháp ngẫu
nhiên đơn giản, mỗi mẫu chọn 10 công ty.
2. Tính trung bình sản lượng của các công
ty ở các mẫu.
01/04/2017 41
BÀI TẬP
Cho danh sách 100 công ty được đánh số thứ tự từ 0 đến
99 và sản lượng sản xuất năm qua. (ĐTV: 10.000
bảng Anh)
3. Giả sử trung bình tổng thể là 66,08900 bảng Anh.
Trung bình mẫu so với trung bình tổng thể có sai lệch
không?
01/04/2017 42
Hướng dẫn
Lấy giấy cắt thành 20 tờ thăm.
Chia đôi thành 2 phần
Phần 1: 10 tờ thăm đánh số từ 0 đến 9 biểu thị cho hàng
đơn vị
Phần 2: 10 tờ thăm đánh số từ 0 đến 9 biểu thị cho hàng
chục
Bốc ngẫu nhiên hàng chục trước, ví dụ số 1.
Bốc ngẫu nhiên hàng đơn vị, ví dụ số 3
Vậy công ty thứ 13 được chọn vào mẫu. Làm tiếp tục để
701014
chuong 5-
có thêm các công ty khác vào mẫu. Nếu thăm bốc trùng
Thiết kế
nghiên cứu
01/04/2017 44
701014
chuong 5-
Thiết kế
nghiên cứu
và các
phương
pháp lấy
01/04/2017 mẫu
45
Giả sử trung bình tổng thể là 660.89. Trung bình mẫu
so với trung bình tổng thể có sai lệch không?
Trung bình bàn 1: 825.05
Trung bình bàn 2: 593.8
Trung bình bàn 3: 706.35
Trung bình bàn 4: 632.6
Trung bình thứ 5: 989.6
BÀI TẬP
Tổng thể có 111376 dân phân bố theo tuổi và giới tính
như dưới đây. Hãy chọn mẫu 10% theo quota
701014
chuong 5-
Thiết kế
nghiên cứu
và các
phương
pháp lấy
01/04/2017 mẫu
47
XÁC ĐỊNH CỠ MẪU
Xác định cỡ mẫu (số đơn vị mẫu) chính là xác
định số lượng đơn vị điều tra trong tổng thể
mẫu để tiến hành thu thập số liệu. Yêu cầu của
cỡ mẫu là vừa đủ để vừa đảm bảo độ tin cậy
cần thiết của số liệu điều tra vừa đảm bảo phù
hợp với điều kiện về nhân lực và kinh phí và có
thể thực hiện được, tức là có tính khả thi.
XÁC ĐỊNH CỠ MẪU
Khi điều tra chọn mẫu để suy rộng số bình quân theo
một tiêu thức nào đó
Khi điều tra chọn mẫu để suy rộng tỷ lệ theo một tiêu
thức nào đó
Trong đó:
- N là số đơn vị tổng thể chung.
- S2 và p (1- p) là phương sai của tổng thể chung
với chỉ tiêu bình quân và chỉ tiêu tỷ lệ.
- t là hệ số tin cậy
- ε là phạm vi sai số chọn mẫu.
hệ số tin cậy và xác suất tin cậy
t
1 0,6826
1,5 0,8663
2 0,9545
2,5 0,9875
3 0,9973
XÁC ĐỊNH CỠ MẪU
Các thông tin trên đây cần có từ khi chuẩn bị điều tra
để xây dựng và quyết định phương án điều tra. Trong
đó, số đơn vị tổng thể chung (N) lấy từ số liệu thống
kê; xác xuất tin cậy (pt) và phạm vi sai số chọn mẫu
(ε) do người tổ chức điều tra yêu cầu cho từng cuộc
điều tra. Riêng phương sai của tổng thể chung (S2 và
p(1-p)) thì phải dựa và kết quả của các cuộc điều tra
trước đó;
XÁC ĐỊNH CỠ MẪU
Trường hợp không có các cuộc điều tra trước tương tự
hoặc có nhưng không tính được phương sai thì sẽ xử
lý như sau:
- Khi điều tra nghiên cứu chỉ tiêu bình quân thì phải
điều tra mẫu nhỏ để xác định phương sai
Hoặc
01/04/2017 55
Xác định cỡ mẫu trong nghiên cứu
01/04/2017 56
THANG ĐO LIKERT
Là thang đo thường có 5 (hoặc 7,9) mức độ
Ví dụ: “Xin đọc kỹ các phát biểu sau. Sau mỗi phát biểu, vui
lòng trả lời bằng cách khoanh tròn vào con số tương ứng
với chọn lựa của Anh/Chị, với qui ước:
Số 1: Rất không đồng ý với câu phát biểu
Số 2: Không đồng ý với câu phát biểu
Số 3: Trung hoà với câu phát biểu
Số 4: Đồng ý với câu phát biểu
Số 5: Rất đồng ý với câu phát biểu”
(hộ)
VÍ DỤ: TÍNH QUY MÔ MẪU
(người)