Chương 5 - Dữ Liệu Trong Nghiên Cứu Kinh Tế Và Kinh Doanh

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 46

Bài giảng 5:

Dữ liệu trong nghiên cứu


kinh tế và kinh doanh

http://www.youtube.com/watch?v=S_vVUIYOmJM&feature=related
YÊU CẦU TRƯỚC BÀI HỌC

2
Mục tiêu bài học

Sau bài giảng, sinh viên có thể:


• Hiểu được sự cần thiết của việc lấy mẫu trong nghiên cứu kinh doanh và quản lý
• Biết được một loạt các kỹ thuật lấy mẫu xác suất và phi xác suất & sự cần thiết
của việc kết hợp các kỹ thuật trong dự án nghiên cứu
• Năm được phương pháp & biện minh cho lựa chọn các kỹ thuật lấy mẫu với độ
phù hợp cho các trường hợp nghiên cứu khác nhau
• Sử dụng đa dạng các kỹ thuật lấy mẫu
• Đánh giá mức độ hợp lý của việc khái quát hóa từ một mẫu
• Áp dụng kiến thức & kỹ năng lấy mẫu vào dự án nghiên cứu của bản thân
Sơ lược bài học

5.1. Tổng quan về dữ liệu


5.2. Lựa chọn mẫu trong nghiên
trong nghiên cứu kinh tế -
cứu kinh tế - kinh doanh
kinh doanh

5.2.1. 5.2.2.
Các phương pháp chọn mẫu có Các phương pháp chọn mẫu
xác suất phi xác suất
4
5.1. Tổng quan về dữ liệu trong
nghiên cứu kinh tế - kinh
doanh
TỔNG THỂ. MẪU VÀ CÁC PHẦN TỬ

Tổng thể

Mẫu

Tình huống
& phần tử

6
Sự cần thiết của chọn mẫu
Lấy mẫu - là sự thay thế hiệu quả cho việc điều tra khi:
- Điều tra toàn bộ tổng thể thiếu tính khả thi
- Giới hạn về ngân sách trở thành rào cản trong việc triển
khai khảo sát tổng thể
- Giới hạn thời gian cản trở quá trình thu thập dữ liệu tổng
thể
- Cần kết quả nhanh chóng sau khi đã hoàn thành quá trình
thu thập dữ liệu
TỔNG QUAN VỀ KỸ THUẬT LẤY MẪU

Kỹ thuật chọn mẫu

Xác suất Phi xác suất

Ngẫu nhiên Ngẫu nhiên Hạn ngạch Lan dần Thuận


đơn giản phân tầng tiện
Có mục Phần tử
Hệ thống Theo cụm đích điển hình

Đa giai đoạn Phần tử Phần tử


ngoại lệ điển hình
Không
Phàn tử đồng nhất Đồng
giới hạn nhất

8
5.2. Lựa chọn mẫu cho các
nghiên cứu trong lĩnh vực kinh
tế & kinh doanh
5.2.1. Kỹ thuật lấy mẫu theo
xác suất

10
Chọn mẫu theo xác suất
Quy trình lấy mẫu gồm 4 giai đoạn:
Giai đoạn 1: Xác định khung lấy mẫu phù hợp dựa
trên mục tiêu của nghiên cứu
Giai đoạn 2: Lựa chọn kích cỡ mẫu phù hợp
Giai đoạn 3: Lựa chọn kỹ thuật lấy mẫu phù hợp nhất
Giai đoạn 4: Kiểm tra tính đại diện tổng thể của mẫu
Giai đoạn 1: Xác định khung lấy
mẫu
Những điều lưu ý:
- Các vấn đề liên quan đến sử dụng các dữ liệu
- Về mặt thống kê, không khái quát hóa vượt quá khung mẫu
- Luôn đánh giá tính xác thức và tin cậy của mẫu
- Hạn chế định kiến và các yếu tố chủ quan
Danh sách câu hỏi đánh giá
lựa chọn khung mẫu
Những phần tử được liệt kê trong khung lấy mẫu có giúp bạn trả lời
c
câu hỏi nghiên cứu và đáp ứng các mục tiêu nghiên cứu?

Khung lấy mẫu được thu thập từ bao giờ, tính cập nhật có còn
c
hiệu lực không?

c Khung lấy mẫu có bao gồm các thông tin chính xác không?

Khung lấy mẫu đã loại bỏ các trường hợp chưa cần thiết chưa? Liệu
c
các trường hợp bị loại bỏ có chính xác?
(Đối với các danh sách mẫu được mua) Liệu bạn có thể thiết lập và
c
kiểm soát chính xác cách thức chọn mẫu?
Giai đoạn 2: Lựa chọn kích cỡ
mẫu phù hợp
Yếu tố ảnh hướng quyết định lựa chọn kích cỡ mẫu:
- Mức độ tin cậy vào chất lượng dữ liệu
- Hạn mức chấp nhận của biên độ sai số (*)
- Kiểu phân tích thực hiện trong nghiên cứu
- Kích cỡ của tổng thể để lấy mẫu
Chú ý:
+ Biên độ sai số (hay Khoảng tin cậy) con số đo lường độ không chắc chắn hoặc chắc chắn trong phương pháp
lấy mẫu. Khoảng tin cậy có thể có bất kì con số xác suất nào, trong đó phổ biến nhất là độ tin cậy 95% hoặc 99%
Biên độ sai số

Tổng thể
mục tiêu

Kích cỡ mẫu cho các tổng thể khác nhau với mức độ tin cậy 95%
(Giả sử: tất cả dữ liệu thu thập từ tất cả các phần từ của mẫu)
Tầm quan trọng của tỉ lệ
hồi đáp cao
- Mẫu đại diện hoàn hảo là mẫu đại diện chính xác cho tổng thể
của nó
=> Tỷ lệ hồi đáp càng cao thì tính đại diện của mẫu càng cao
- Hệ quả của tỷ lệ hồi đáp thấp: không đại diện cho tổng thể & dữ
liệu thu thập có thể sai lệch
- Tăng thêm chi phí: Với những trường hợp không hồi đáp, phải
tìm người hồi đáp bổ sung

16
Tầm quan trọng của tỉ lệ
hồi đáp cao
=> Lời khuyên: Nên phân tích lý do dẫn đến các từ chối hồi đáp
gồm 04 vấn đề chính sau:
+ Từ chối hồi đáp (Lý do chủ yếu)
+ Không đủ điều kiện để hồi đáp
+ Không có khả năng xác định địa chỉ người hồi đáp
+ Địa chỉ người hồi đáp được xác định nhưng không thể liên hệ

17
Giai đoạn 3: Lựa chọn kỹ
thuật lấy mẫu

04 Kỹ thuật chính trong việc lựa chọn mẫu xác suất:


- Chọn mẫu giản đơn
- Chọn mẫu hệ thống
- Chọn mẫu phân tầng ngẫu nhiên
- Chọn mẫu nhóm cả khối
Vậy làm thế nào để lựa chọn kỹ thuật
chọn mẫu xác suất phù hợp?
Các yếu tố ảnh hưởng đến sự lựa chọn kỹ thuật chọn mẫu xác suất

Kỹ thuật Khung mẫu Cỡ mẫu Khu vực Chi phí Dễ giải thích Ưu điểm so vs
chọn mẫu yêu cầu yêu cầu địa lý phù hợp tương đối dể hỗ trợ chọn mẫu giản đơn
nhân viên?

Ngẫu nhiên Chính Tốt hơn Tập Cao, nếu Khá khó
đơn giản xác và dễ nếu trên trung nếu cỡ mẫu giải thích
tiếp cận vài trăm yêu cầu lớn hoặc
mẫu tiếp xúc khung
trực diện mẫu
không
được
điện toán
hóa

Tập trung Tương đối Thường


Chính xác, Phù hợp Thấp
dễ tiếp cận nếu yêu cầu dễ giải không có
cho mọi
tiếp xúc thích khác biệt
và không kích cỡ
Hệ thống có dạng trực diện
thức chu
kỳ. Thỉnh
thoảng cần
danh sách
thực
Các yếu tố ảnh hưởng đến sự lựa chọn kỹ thuật chọn mẫu xác suất

Kỹ thuật Khung mẫu Cỡ mẫu Khu vực Chi phí Dễ giải thích Ưu điểm so vs
chọn mẫu yêu cầu yêu cầu địa lý phù hợp tương đối dể hỗ trợ chọn mẫu giản đơn
nhân viên?

Ngẫu nhiên Chính Tốt hơn Tập Thấp, Khá khó Độ so


phân tầng xác, dễ nếu trên trung nếu miễn là giải thích sánh giữa
tiếp cận, vài trăm yêu cầu có danh các phân
có thể mẫu tiếp xúc sách của tầng tốt
chia trực diện những hơn ->
thành các phân tính đại
tầng liên tầng liên diện qua
quan quan các tầng

Chính xác, Càng lớn Phân tán Thấp, miễn Khá khó Nhanh
dễ tiếp cận, tính thực nếu yêu cầu có danh giải thích nhưng độ
liên quan tiễn càng tiếp xúc sách các cho đến khi chính xác
Cụm với các cao trực tiếp và cụm liên đã chọn các giảm
cụm thay vì dùng sử quan cụm liên
các phần tử dụng các quan
riêng rẽ của cụm theo
tổng thể quy mô địa

Kỹ thuật lấy mẫu ngẫu
nhiên giản đơn
- Đánh số từng trường hợp trong khung mẫu với từng con số
riêng biệt
- Lựa chọn các trường hợp thông qua các con số ngẫu nhiên
cho đến khi đạt được số lượng mẫu thực tế
- Ứng dụng hình thức phỏng vấn bằng phần mềm máy tính
hỗ trợ bởi điện thoại (CATI)
Kỹ thuật lấy mẫu hệ
thống
Kỹ thuật hệ thống đòi hỏi bạn phải lựa chọn mẫu theo những khoảng thời gian
đều đặn từ khung lấy mẫu. Quy trình:
- Đánh số mỗi phần tử trong khung mẫu bằng một con số duy nhất. Phần tử đầu
tiên đánh số 0, tiếp 1,2,3

- Lựa chọn phần tử đầu tiên sử dụng một con số ngẫu nhiên
- Tính phân số lấy mẫu
- Lựa chọn các phần tử tiếp theo một cách hệ thống, bằng cách sử dụng phân số
của mẫu để xác định tần suất lựa chọn
- Phân số mẫu = Kích cỡ mẫu thực tế / Tổng thể
Kỹ thuật lấy mẫu hệ thống
1 26
51
76
N = 100 2 27
52
77

muốn n = 20 3 28
53
78
4 29
54
N/n = 5 79
5 30
55
80
Chọn 1 số ngẫu nhiên từ 1-5, chọn 4 6 31
56
81
7 32
57
bắt đầu từ 4 và lấy 5 số một 82
8 33
58
83
9 34
59 2
84 4
Kỹ thuật lấy mẫu ngẫu nhiên
phân tầng - Mục đích
- Đảm bảo tính đại diện của mỗi địa tầng, nhân dữ liệu lên thành nhiều nhóm

tổng thể nhỏ hơn

- Thuận tiện cho các thủ tục hành chính

- Các phân tầng có thể gặp các vấn đề chọn mẫu khác nhau

- Tăng độ chính xác (độ lệch chuẩn thấp hơn) nếu phân tầng đồng nhất
Kỹ thuật lấy mẫu phân tầng ngẫu
nhiên - Quy trình

- Chọn biến số phân tầng

- Chia khung mẫu thành các tầng riêng biệt

- Đánh số mỗi phần tử trong mỗi tầng bằng một con số duy nhất

- Lựa chọn mẫu của bạn sử dụng kỹ thuật lấy mẫu ngẫu nhiên đơn giản hoặc

ngẫu nhiên hệ thống


Ví dụ
Danh sách khách hàng

African-American Hispanic-American Others

Phân tầng

Mẫu con của phân số mẫu


2
7
Ngẫu nhiên phân tầng:
Cân xứng vs Bất cân xứng

• Cân xứng: Nếu tỷ lệ mẫu bằng nhau ở mỗi phân tầng


• Bất cân xứng: Tỷ lệ mẫu không bằng nhau ở mỗi phân tầng
=> Vai trò: Tăng tính đại diện cho các phân tầng mẫu với cỡ mẫu
thiểu số
Kỹ thuật lấy mẫu theo cụm

- Chọn các nhóm mẫu để tạo khung mẫu


- Đánh số mỗi cụm bằng một con số duy nhất
- Lựa chọn cụm mẫu ngẫu nhiên
Đánh giá
Population Clusters
• Ưu điểm: hữu ích về mặt xử consumers SMAs
county
lý hành chính, đặc biệt khi shopping malls
telephone
exchanges
nghiên cứu có độ phủ địa lý census tracts
blocks
rộng households
college students colleges
dormitories
• VD: chọn mẫu ngẫu nhiên từ classes
K-12 Schooling districts
một khu dân cư trong thành schools
grade levels
phố & đo lường tất các các business
classes
counties
localities
hộ gia đình trong khu được plant sites
patients hospitals
chọn wards 52
Giai đoạn 4: Kiểm tra tính đại
diện mẫu
- Nếu không có sự khác biệt đáng kể về mặt thống kê => mẫu mang tính
đại diện
- Những phương pháp đánh giá tính đại diện của mẫu:
+ Sao chép các phát hiện bằng cách sử dụng một mẫu mới được chọn bằng
các kỹ thuật lấy mẫu khác nhau (chứng minh tính tổng quát)
+ Khảo sát lại những đối tượng không trả lời (phương pháp hậu quan sát)
+ Phân tích lý do của việc không phản hồi: do từ chối hay do không đủ
điều kiện (phân tích phi phản hồi chủ động )
+ So sánh phản hồi của đối tượng trả lời muộn so với đối tượng trả lời sớm
(Wave analysis)
5.2.2. Kỹ thuật lấy mẫu phi xác
suất

32
Kỹ thuật chọn mẫu phi xác suất
- Kỹ thuật chọn mẫu phi xác suất: cung cấp các kỹ thuật thay để chọn
mẫu dựa trên đánh giá chủ quan

- Điều cần lưu ý khi áp dụng kỹ thuật:

+ Kích cỡ mẫu quyết định dựa trên câu hỏi và mục tiêu nghiên cứu
thay vì dựa trên số liệu thống kê

=> Để đảm bảo thu thập đủ số liệu, nhà nghiên cứu nên thu thập các
dữ liệu định tính cho đến khi đạt điểm bão hòa dữ liệu (data
saturation)
Note: Bão hòa dữ liệu là khi dữ liệu thu thập được không còn nhiều giá trị thông tin và không
cung cấp thêm ý nghĩa mới
Một số kỹ thuật lấy mẫu phi
xác suất
- Chọn mẫu hạn mức (dành cho các tổng thể lớn hơn)
- Chọn mẫu theo mục đích
- Chọn mẫu theo mối quan hệ
- Chọn mẫu tự chọn
- Chọn mẫu thuận tiện
Kỹ thuật lấy mẫu hạn mức

- Chia tổng thể thành các nhóm cụ thể


- Tính toán định mức cho từng nhóm dựa trên các dữ liệu có
sẵn và liên quan
- Thu thập dữ liệu từ mỗi hạn ngạch đã tính toán
Ưu điểm

- Ít tốn kém và tốn ít thời gian để thực hiện


Ví dụ: Trong trường hợp cần lấy ý kiến khán giả truyền hình,
yêu cầu thu thập dữ liệu nhanh chóng
-> kỹ thuật lấy mẫu theo hạn mức là lựa chọn duy nhất
- Không đòi hỏi khung mẫu
-> Kỹ thuật duy nhất khi không có khung mẫu
Kỹ thuật lấy mẫu theo mục
đích
- Kỹ thuật lấy mẫu theo mục đích hay theo phán đoán
(judgemental): cho phép sử dụng phán đoán để lựa chọn
các phần tử -> trả lời câu hỏi nghiên cứu và đạt mục tiêu tốt
nhất
- Phù hợp xử lý mẫu rất nhỏ
Ví dụ: Trong nghiên cứu tình huống hoặc khi lựa chọn
phần tử đặc biệt, chứa nhiều thông tin
Phương pháp chọn mẫu theo mục
đích (1)
- Chọn mẫu đặc biệt/ lấy mẫu lệch: kỹ thuật dựa trên giả định rằng các kết
quả từ trường hợp ngoại lệ có liên quan đến việc tìm hiểu và giải thích các
trường hợp có tính điển hình hơn
- Chọn mẫu không đồng nhất (heterogenous) hoặc biến thiên cực đaị:
phương pháp thu thập dữ liệu để mô tả và giải thích những chủ đề then chốt có
thể quan sát
- Chọn mẫu đồng nhất: Tập trung vào một nhóm phụ mà ở đó các phần tử
mẫu giống nhau -> cho phép bạn nghiên cứu theo chiều sâu
- Chọn mẫu phần tử tới hạn (critical case sampling): Mấu chốt của việc thu
thập dữ liệu để tìm hiểu vấn đề cốt lõi -> đưa ra được các khái quát hóa mang
tính logic
Phương pháp chọn mẫu theo mục
đích (2)
- Chọn mẫu điển hình: Đóng vai trò đại diện cho các tính chất nổi bật của
mẫu -> cung cấp người đọc nghiên cứu của bạn cái nhìn tổng quan về tính chất
điển hình của phần tử
- Chọn mẫu dựa trên lý thuyết:
+ là quá trình thu thập dữ liệu để tạo ra lý thuyết
+ liên quan mật thiết đến lý thuyết Grounded và quá trình phân tích quy nạp cụ
thể: nhà phân tích thu thập mã, phân tích và quyết định dữ liệu tiếp theo và địa
điểm tìm dữ liệu -> phát triển tiếp tục đến khi lý thuyết xuất hiện
- Chọn mẫu cơ hội: Mẫu được chọn là mẫu cơ hội, mẫu này dựa trên tình
huống trong quá trình thu thập thông tin thực địa
Kỹ thuật lấy mẫu Snowball
(Mở rộng dần)
- Kỹ thuật lấy mẫu Snowball: thường được sử dụng khi khó xác định phần
tử của tổng thể. Ví dụ, những người đang làm việc trong khi lại đòi hưởng
trợ cấp thất nghiệp.
=> Do đó, bạn cần:
- Liên lạc với một hoặc hai phần tử trong quần thể
- Lấy thông tin từ các trường hợp này để xác định các phần tử tiếp theo
(theo quy trình tiếp diễn tương tự)
- Dừng lại khi không có ca mới hoặc mẫu đủ lớn.
Kỹ thuật lấy mẫu Snowball
(Mở rộng dần)
Chú ý:
+ Một phát triển của phương pháp Snowball: Phương pháp RDS
(respondent driven sampling)
-> Phương pháp giải quyết vấn đề khó khăn trong việc tiếp cận các mẫu khó
tiếp cận, đó là các nhóm tương đối nhỏ trong tổng thể & không có danh sách
đầy đủ của các cá thể trong quần thể nghiên cứu. Ví dụ: các nhóm trong
danh sách của y tế công cộng như gái mại dâm, người nghiện ma túy,...
Kỹ thuật lấy mẫu tự chọn

- Kỹ thuật lẫy mẫu tự chọn: là phương pháp lấy mẫu tình


nguyện thứ hai. Phương pháp cho phép người tham gia chủ
động bày tỏ những mong muốn được tham gia vào nghiên cứu
=> Do đó, bạn cần:
+ Công bố các yêu cầu từ các phần tử, thông qua các phương
tiện truyền thông phù hợp hoặc chủ động mời họ thma gia
+ Thu thập dữ liệu từ những người hồi đáp
Kỹ thuật lấy mẫu thuận tiện
(Convenience sampling)
- Kỹ thuật lấy mẫu thuận tiện (hay còn gọi là kỹ thuật lấy
mẫu tình cờ - haphazard): lựa chọn một cách tình cờ hững
phần tử dễ lấy nhất cho mẫu
- Nhược điểm:
+ Thiên kiến và độ tin cậy không cao do độ sai lệch cao vì
không kiểm soát được những ảnh hưởng của mẫu
TỔNG KẾT BÀI HỌC
Tiêu chí Kỹ thuật chọn mẫu xác Kỹ thuật chọn mẫu phi xác
suất suất
Khi nào sử Sử dụng các ước lượng Không yêu cầu các sự khái
dụng? thống kê để tìm ra các đặc quát về mặt thống kê
điểm của tổng thể mục tiêu
từ các mẫu
Khung Cần Không cần
mẫu
Cỡ mẫu Yêu cầu kích cỡ mẫu tối Phụ thuộc vào câu hỏi nghiên
thiểu là 30 & Phụ thuộc vào cứu và mục đích
mẫu tổng thể; biên độ sai số
và mức độ tin cây
- Sự lựa chọn kỹ thuật nghiên cứu phụ thuộc vào tính khả thi và hợp
lý của việc thu thập dữ liệu
- Tổng thể dưới 50 phần tử, thì nên lựa chọn khi thu thập dữ liệu từ
toàn bộ tổng thể; trên 50 phần tử, có thể xem xét sử dụng kỹ thuật
lấy mẫu xác suất
- Nhiều dự án nghiên cứu yêu cầu kết hợp nhiều kỹ thuật chọn mẫu
khác nhau
- Tất cả các lựa chọn phải phụ thuộc vào khả năng tiếp cận với các
tổ chức cung cấp thông tin => các kỹ thuật phải điều chỉnh để tăng
tính khả thi
KẾT THÚC BÀI HỌC.

You might also like