Download as pdf or txt
Download as pdf or txt
You are on page 1of 8

NGHIÊN CỨU DỊCH TỄ HỌC TRÊN MẪU

Mục tiêu: Sau khi học sinh viên có khả năng:


1. Phân tích được ưu nhược điểm của kỹ thuật chọn mẫu cho một nghiên cứu cụ thể.
2. Phân tích được các tiêu chuẩn của một mẫu tốt trong một nghiên cứu cụ thể
3. Đề xuất được một kỹ thuật chọn mẫu và các bước tiến hành cho một nghiên cứu cụ
thể.
Nội dung:
1. Tổng quan
Trong mỗi nghiên cứu, quần thể nghiên cứu bao gồm toàn bộ các cá thể chúng ta đang
quan tâm. Mẫu nghiên cứu (sample) bao gồm các cá thể được nghiên cứu. Do điều kiện nguồn
lực có hạn, đối với mỗi nghiên cứu, chúng ta thường không thể tiến hành nghiên cứu trên toàn
bộ quần thể mà thường chỉ tiến hành nghiên cứu trên một mẫu. Chọn mẫu (sampling) nghiên
cứu là quá trình chọn ra các cá thể đại diện cho quần thể để đưa vào nghiên cứu. Để đảm bảo
tính đại diện, cần áp dụng các kỹ thuật chọn mẫu xác suất hay còn gọi là chọn mẫu ngẫu
nhiên. Ta cũng cần tính toán cỡ mẫu, tức là tính toán số lượng cá thể được đưa vào nghiên
cứu sao cho có thể ngoại suy từ các đặc điểm của mẫu ra các đặc điểm tương ứng của quần
thể. Nội dung bài này sẽ tập trung vào các phương pháp chọn mẫu, phương pháp tính toán cỡ
mẫu sẽ được đề cập chi tiết trong học phần thống kê y sinh ứng dụng.
2. Nguyên tắc chung chọn mẫu nghiên cứu
Ba câu hỏi thường được đặt ra khi chọn mẫu là
- Quần thể nào mà từ đó mẫu sẽ được lấy ra cho nghiên cứu?
- Làm thế nào để mẫu có thể đại diện cho quần thể nghiên cứu?
- Mẫu bao nhiêu là đủ cho một nghiên cứu?
Trả lời cho 3 câu hỏi này chính là giải quyết vấn đề xác định quần thể nghiên cứu, chọn mẫu
và tính toán cỡ mẫu cho một nghiên cứu. Một thiết kễ mẫu được coi là tốt nếu như nó đáp ứng
một số tiêu chuẩn sau:
- Đại diện cho quần thể nghiên cứu: khi nó có tất cả các tính chất cơ bản của quần thể mà
từ đó nó được rút ra.
- Mẫu là đủ lớn: để có thể cho phép khái quát hoá một cách tin cậy cho quần thể nghiên
cứu.
- Tính thực tế và tiện lợi: để việc thu thập số liệu dễ dàng và thuận tiện.
- Tính kinh tế và hiệu quả: Mẫu được chọn sao cho thông tin thu được là nhiều nhất trong
khi chi phí là thấp nhất.

1
3. Chọn mẫu xác suất
Mẫu xác suất: một cá thể trong quần thể có một cơ hội biết trước để chọn vào mẫu. Kỹ
thuật này chỉ thực hiện được khi biết khung chọn mẫu của quần thể nghiên cứu.
3.1. Mẫu ngẫu nhiên đơn (sample random sampling)
Là mẫu mà tất cả các cá thể trong quần thể có cùng một cơ hội (cùng xác suất) để được
chọn vào mẫu.
Ví dụ: chọn 500 hồ sơ trong số 5000 sản phụ đã đẻ tại bệnh viện A trong năm 1995 để nghiên
cứu. Nếu theo cách chọn ngẫu nhiên đơn thì mỗi sản phụ có xác suất là 10% được chọn vào
mẫu.
Các bước:
- Lập một khung chọn mẫu gồm các đơn vị mẫu.
- Sử dụng quá trình ngẫu nhiên để chọn các cá thể vào mẫu. Có nhiều cách để chọn ngẫu
nhiên đơn từ quần thể như: tung đồng xu, tung súc sắc, sử dụng bảng ngẫu nhiên…
Ưu điểm:
- Cách làm đơn giản, tính ngẫu nhiên cao và tính đại diện cao.
- Là kỹ thuật chọn xác suất cơ bản và có thể lồng vào tất cả các kỹ thuật chọn mẫu xác suất
cơ bản và có thể lồng vào các kỹ thuật chọn mẫu xác suất phức tạp.
Hạn chế:
- Cần phải có một danh sách các đơn vị mẫu để phục vụ chọn mẫu. Đơn vị này thường
không thể có được với một mẫu lớn hoặc mẫu dao động.
- Các cá thể được chọn vào mẫu có thể phân bố tản mạn trong quần thể, do vậy thu thập số
liệu sẽ tốn kém và mất thời gian.
3.2. Mẫu hệ thống (systematic sampling)
Trong mẫu hệ thống mỗi cá thể trong một danh sách được chọn bằng cách áp dụng một
khoảng hằng định theo sau bởi một sự bắt đầu ngẫu nhiên
Các bước:
- Tất cả các đơn vị mẫu trong quần thể định nghiên cứu được ghi vào một danh sách hoặc
trình bày trên bản đồ (khung chọn mẫu).
- Xác định khoảng cách k= N/n (N: số cá thể trong quần thể, n: cỡ mẫu định chọn).
- Một số ngẫu nhiên (i) giữa 1 và k được chọn bằng kỹ thuật chọn mẫu ngẫu nhiên đơn.
- Các cá thể có số thứ tự (i+ 1k), (i+2k), (i+3k)… sẽ được chọn vào mẫu cho đến khi kết
thúc danh sách.
Ưu điểm:
- Nhanh và dễ áp dụng.
- Nếu danh sách cá thể của quần thể được xếp ngẫu nhiên, chọn mẫu hệ thống tương tự như
chọn mẫu ngẫu nhiên đơn.
- Nếu danh sách cá thể được xếp theo thứ tự tầng, đây là cách lựa chọn tương tự như mẫu
tầng có tỷ lệ.
- Trong một số trường hợp, mặc dù khung mẫu không có sẵn hoặc không biết tổng số cá thể
trong quần thể nghiên cứu, nhưng chọn mẫu hệ thống vẫn có thể được áp dụng bằng cách
xác định một qui luật phù hợp trước khi tiến hành chọn mẫu.

2
Ví dụ: để có thể thu thập được số liệu về sẹo lao ở trẻ em trong một cộng đồng nông thôn
không biết danh sách các hộ gia đình, người nghiên cứu có thể xác định một qui luật chọn
mẫu trước thu thập số liệu như sau:
- Hộ gia đình đầu tiên được điều tra là hộ thứ nhất nằm bên trái của UBND xã.
- Các hộ tiếp theo sẽ được chọn bằng cách người nghiên cứu tiếp tục đi về bên trái và cứ
cách 7 gia đình lại điều tra một gia đình (khoảng cách các hộ gia đình được chọn bằng
cách lấy tổng số hộ gia đình trong cộng đồng chia cho số hộ gia đình dự kiến điều tra).
- Nếu gặp lối rẽ, thì người điều tra chỉ được rẽ trái.
- Tất cả các trẻ em trong các hộ gia đình được chọn đều được kiểm tra sẹo lao cho đến khi
đủ số trẻ cần được điều tra.
- Số hộ gia đình cần điều tra có thể được ước đoán từ số trẻ em trung bình trong một số gia
đình ở cộng đồng và số trẻ cần nghiên cứu (cỡ mẫu).
Trong một số trường hợp khác, các cá thể trong quần thể nghiên cứu có thể không cần lên
danh sách để chọn, người nghiên cứu có thể đưa ra một qui luật trước khi chọn như sau:
- Tất cả các bệnh nhân đến phòng khám vào thứ năm hàng tuần sẽ được tham gia vào
nghiên cứu.
- Bệnh nhân đến khám ngày lẻ sẽ vào nhóm 1, đến ngày chẵn sẽ vào nhóm 2 để phục vụ
cho một thử nghiệm nào đó.
- Các cá thể trong mẫu được chọn cho một nghiên cứu đứng vòng tròn, sau đó đếm lần lượt
1,2,3; 1,2,3; … cho đến hết. Người đếm số 1 đầu tiên phaỉ chọn ngẫu nhiên. Các cá thể
đếm số 1 vào nhóm 1, các cá thể đếm số 2 vào nhóm 2, số 3 vào nhóm 3. Như vậy ta đã có
3 nhóm ngẫu nhiên cho một thử nghiệm.
Nhược điểm:
- Khi việc sắp xếp khung mẫu có một qui luật nào đó tình cờ trùng với khoảng chọn mẫu hệ
thống, các cá thể trong mẫu thiếu tính đại diện.
Ví dụ: Một cộng đồng được hình thành bởi nhiều dãy nhà, trong đó mỗi nhà đều có 10 gia
đình. Nếu tình cờ chọn hệ số k trong chọn mẫu hệ thống cũng bằng 10 và hộ gia đình đầu tiên
được chọn vào mẫu là gia đình nằm ở đầu một dãy nhà thì tất cả các hộ gia đình trong mẫu sẽ
đều là các hộ gia đình ở đầu các dãy nhà. Như vậy mẫu sẽ thiếu tính đại diện phân bố không
gian.
3.3. Mẫu ngẫu nhiên phân tầng (stratified random sampling)
Là mẫu đạt được bởi việc phân chia các cá thể của quần thể nghiên cứu thành các nhóm
riêng rẽ được gọi là tầng và cách chọn mẫu ngẫu nhiên đơn sẽ được sử dụng trong mỗi tầng.
Các bước:
- Phân chia quần thể nghiên cứu thành các tầng khác nhau dựa vào một hoặc vài đặc điểm
nào đó như nhóm tuổi, giới, tầng lớp xã hội,…Giữa các tầng không có sự chồng chéo.
- Thực hiện việc chọn mẫu ngẫu nhiên đơn trong từng tầng.
- Các phân tích thống kê (như giá trị trung bình, độ lệch) được tính toán riêng cho mỗi tầng
sau đó sẽ kết hợp lại trên cơ sở kích cỡ của từng tầng (cân bằng trọng) để có kết quả
chung cho toàn bộ quần thể.
Ưu điểm:
- Tạo ra mỗi tầng có một sự đồng nhất về yếu tố được chọn để phân tầng, do đó sẽ giảm sự
chênh lệch giữa các cá thể.

3
- Quá trình thu thập số liệu thường dễ hơn so với mẫu ngẫu nhiên đơn.
- Khi nguyên tắc mẫu tỷ lệ được sử dụng, tầng có kích cỡ lớn hơn sẽ có nhiều cá thể được
chọn vào mẫu hơn. Khi đó cỡ mẫu cho một tầng i nào đó sẽ là:
Ni
n1 = n
N
Trong đó: n1 = cỡ mẫu của tầng i
Ni: dân số tầng i
n: cỡ mẫu của tất cả các tầng
N: dân số của quần thể
- Nguyên tắc mẫu không tỷ lệ cũng có thể được áp dụng trong mỗi tầng. Khi đó tỷ lệ mẫu
trong các tầng sẽ khác nhau. Với những tầng có biến thiên lớn giữa các cá thể hoặc chi phí
cho chọn mẫu thấp, người ta thường áp dụng tỷ lệ mẫu lớn. Cách này giúp cho người điều
tra có đủ số cá thể trong mỗi tầng để có thể phân tích được.
- Mẫu đạt được từ mỗi tầng có tính đại diện và khái quát hoá cao cho tầng đó.
- Nếu tính đồng nhất về yếu tố được chọn để phân tầng là cao trong mỗi tầng, trong khi lại
thấp giữa các tầng thì kết quả nghiên cứu sẽ có độ chính xác cao hơn là mẫu chọn theo
cách ngẫu nhiên đơn (hai cách được chọn với cùng cỡ mẫu).
Nhược điểm:
- Cũng như chọn mẫu ngẫu nhiên đơn, danh sách tất cả các cá thể trong mỗi tầng phải được
liệt kê và được gán số ngẫu nhiên. Điều đó là khó thực hiện trong thực tế
3.4. Mẫu chùm (cluster sampling)
Là mẫu đạt được bởi việc lựa chọn ngẫu nhiên các nhóm cá thể được gọi là chùm từ
nhiều chùm trong một quần thể nghiên cưú. Trong trường hợp này đơn vị mẫu là chùm chứ
không phải là các cá thể.
Các bước:
- Xác định các chùm thích hợp: Chùm được làm bởi tập hợp các cá thể gần nhau (làng, xã,
trường học, khoa phòng, bệnh viện…) do đó thường có chung một số đặc điểm. Các chùm
thường không có cùng kích cỡ.
- Lên danh sách tất cả các chùm và chọn một cách xác suất số chùm vào mẫu. Từ đây sẽ có
hai cách chọn tuỳ theo ý tưởng của người nghiên cứu.
- Cách 1: tất cả các cá thể trong chùm đã chọn sẽ được bao gồm vào nghiên cứu. Trong
cách này đơn vị mẫu chính là các chùm được chọn, trong khi yếu tố quan sát lại là các cá
thể trong chùm (ví dụ các hộ gia đình trong thôn được chọn, trẻ em trong hộ gia đình được
chọn…) cách này được gọi là mẫu chùm 1 bậc và xác suất của 1 chùm được chọn vào
mẫu bằng số chùm dự kiến chọn chia cho tổng số các chùm.
- Cách 2: liệt kê danh sách các cá thể trong các chùm đã chọn, sau đó áp dụng cách chọn
mẫu ngẫu nhiên đơn hoặc mẫu ngẫu nhiên hệ thống trong mỗi chùm để chọn cá thể vào
mẫu. Trong trường hợp này đơn vị mẫu và đơn vị quan sát là trùng nhau (mẫu bậc 2).
Ưu điểm:
- Thường được áp dụng trong các nghiên cứu điều tra trong một phạm vi rộng lớn, độ phân
tán cao, danh sách của tất cả các cá thể trong quần thể không thể có được (do khó hoặc
đắt) trong khi chỉ có danh sách hay bản đồ các chùm.

4
- Sự lựa chọn thường dễ hơn, chi phí cho nghiên cứu với mẫu chùm thường rẻ hơn nhiều do
các cá thể trong một chùm thường gần nhau.
Nhược điểm:
- Tính đại diện cho quần thể hoặc tính chính xác của mẫu được chọn theo phương pháp mẫu
chùm thường thấp hơn so với mẫu đựơc chọn theo phương pháp ngẫu nhiên đơn (nếu
cùng cỡ mẫu). Vì vậy để tăng tính chính xác này người ta thường tăng cỡ mẫu bằng cách
nhân cỡ mẫu (được tính theo công thức chọn các mẫu ngẫu nhiên đơn) với hệ số ảnh
hưởng của thiết kế. Hệ số này ta có thể coi nó bằng 2.
- Có sự tương quan nghịch giữa cỡ của mẫu và tính đại diện của mẫu, do vậy cỡ chùm càng
nhỏ càng tốt, tuy nhiên chi phí sẽ cao hơn. Số mẫu chùm được chọn vào nghiên cứu tốt
nhất là phải > 30.
- Phân tích số liệu từ mẫu chùm thường phức tạp hơn mẫu khác.
3.5. Chọn mẫu chùm theo phương pháp PPS (probability proportionate to size- xác suất
tỷ lệ với cỡ của cộng đồng)
Đây là phương pháp rất hay áp dụng trong nghiên cứu cộng đồng khi quần thể nghiên cứu
là quá lớn và các cộng đồng có kích thước không đều nhau. Trong trường hợp này chùm được
định nghĩa là nhóm dân cư được lựa chọn ngẫu nhiên mà trontg đó chứa một số lượng nhất
định các cá thể điều tra.
Các bước tiến hành chọn mẫu 30 cụm ngẫu nhiên trong mô tả tình hình SKCĐ:
Giai đoạn I: chọn huyện
Bước1:
- Xác định số huyện mà nhóm nghiên cứu có thể có đủ điều kiện triển khai.
- Nhìn chung nghiên cứu bao phủ càng nhiều huyện càng có giá trị.
Ví dụ chọn ngẫu nhiên 4 trong các huyện của tỉnh A , ta cần làm các bước tiếp theo:
Bước 2:
- Liệt kê tất cả các huyện trong tỉnh và dân số tương ứng của từng huyện.
Bước 3:
- Nếu các huyện có dân số khá đều nhau, ta có thể đánh thứ tự các huyện sau đó dùng bảng
số ngẫu nhiên để chọn 4 huyện vào nghiên cứu
- Nếu huyện có dân số khác nhau, tính dân số cộng dồn của huyện (theo bảng sau) và làm
tiếp các bước sau đây để chọn huyện (giống như trong chọn mẫu hệ thống).
Tên huyện Dân số tương ứng Dân số cộng dồn Huyện được chọn

Bước 4:
- Xác định khoảng cách mẫu:
dân số cộng dồn của các huyện trong tỉnh
k1=
số huyện được chọn vào nghiên cứu
Bước 5:
- Dùng bảng số ngẫu nhiên chọn một số nằm trong khoảng cách mẫu đầu tiên (i1).
Bước 6:
- Xác định huyện đầu tiên được chọn là huyện có dân số cộng dồn bằng hoặc lớn hơn i1.
Bước 7:

5
- Chọn huyện thứ 2 bằng cách lấy ngẫu nhiê i1 + k1 ; sau đó so với dân số cộng dồn. Huyện
thứ hai được chọn là huyện mà dân số cộng dồn của nó bằng hoặc lớn hơn tổng (i1+k1).
Bước 8:
- Tiếp tục làm như bước 7 để chọn các huyện khác (i1+2k1; i1+3k1….).
Giai đoạn II chọn xã:
Bước 9:
- Liệt kê danh sách của các xã trong các huyện đã được lựa chọn trong giai đoạn I cùng với
dân số của nó.
- Nếu trong huyện có các cộng đồng dân cư khác như tập thể, nhà máy, nông, lâm
trường…thì cũng phải đưa vào danh sách.
Bước 10:
- Tính tần số cộng dồn cho các xã như đã làm trong giai đoạn I.
Bước 11:
- Xác định khoảng cách mẫu (k2)
dân số cộng dồn của các xã trong các huyện được chọn
k2 =
số chùm sẽ được chọn vào nghiên cứu (≥ 30 chùm)
Bước 12:
- Lựa chọn ngẫu nhiên một số nằm trong khoảng cách mẫu đầu tiên (kí hiệu i2).
Bước 13:
- Xác định xã mà trong đó chứa chùm thứ nhất của nghiên cứu: tìm xã thứ nhất trong danh
sách mà dân số cộng dồn của nó bằng hoặc lớn hơn i2
Bước 14:
- Xác định xã mà chứa chùm thứ hai của nghiên cứu bằng cách lấy số ngẫu nhiên i2+k2 sau
đó so với dân số cộng dồn. Xã chứa chùm thứ hai là xã mà dân số cộng dồn của nó bằng
hoặc lớn hơn tổng i2 + k2.
Bước 15:
- Xác định các xã chứa các chùm tiếp theo như đã làm trong quá trình chọn tại bước 8
(i2+2k2; i2+3k2…) quá trình này sẽ dừng lại khi chọn đủ số chùm (≥ 30 chùm).
Giai đoạn III: chọn các hộ gia đình trong các xã chứa chùm nghiên cứu
Quá trình này phải được chọn ngẫu nhiên tại mỗi xã được chọn trong giai đoạn II.
Nếu có khung mẫu của xã được chọn ta có thể chọn như sau:
- Xác định số cá thể cần thiết cho mỗi chùm:
cỡ mẫu cần thiết
Số cá thể cần thiết cho mỗi chùm =
số chùm

Ví dụ nếu cỡ mẫu cần thiết là 2450 trẻ em dưới 5 tuổi và số chùm là 30, số trẻ dưới 5 tuổi
trong một chùm sẽ là 82.
- Xác định số dân cần thiết cho mỗi chùm:
số trẻ dưới 5 tuổi cần thiết trong mỗi chùm
Số dân cần thiết cho mỗi chùm =
tỷ lệ trẻ dưới 5 tuổi so với số dân trong xã
Ví dụ: nếu số trẻ dưới 5 tuổi cần cho mỗi chùm là 82 và tỷ lệ trẻ dưới 5 tuổi so với dân chung
là 15% thì số dân trong mỗi chùm sẽ là 547 người.

6
- Xác định số hộ gia đình cần được điều tra trong mỗi chùm
Số dân cần có trong mỗi chùm
Số hộ gia đình cần có trong mỗi chùm =
cỡ hộ gia đình tại xã cần điều tra
Ví dụ: nếu hộ gia đình trung bình là 4,5 trong khi cỡ dân của một chùm là 547, số hộ cần điều
tra trong một chùm sẽ khoảng 122 hộ
- Chọn ngẫu nhiên cho đủ số hộ gia đình trong xã để điều tra.
4. Chọn mẫu không xác suất
4.1. Chọn mẫu thuận tiện
Đạt được trên cơ sở các cá thể có sẵn khi thu thập số liệu. (Ví dụ như tất cả các bệnh
nhân đến khám tại phòng khám trong ngày). Phương pháp này không quan tâm đến việc sự
lựa chọn có ngẫu nhiên hay không. Đây là cách chọn mẫu rất hay gặp trong các nghiên cứu
lâm sàng.
4.2. Chọn mẫu chỉ tiêu
Là phương pháp đảm bảo rằng một số nhất định các đơn vị mẫu từ các loại khác nhau của
quần thể nghiên cứu với các tính chất đặc trưng sẽ có mặt trong mẫu. Nó gần giống như cách
chọn mẫu tầng nhưng không ngẫu nhiên. Người nghiên cứu đặt kế hoạch là sẽ chọn bao nhiêu
đối tượng cho mỗi tầng hoặc nhóm đối tượng và bằng cách chọn mẫu thuận tiện cho đến khi
đủ số lượng từ mỗi tầng.
4.3. Chọn mẫu có mục đích
Người nghiên cứu đã xác định trước các nhóm quan trọng trong quần thể để tiến hành thu
thập số liệu. Các nhóm khác nhau sẽ có tỷ lệ mẫu khác nhau. Đây là cách rất hay dùng trong
các điều tra thăm dò, phỏng vấn sâu.
4.4. Các ứng dụng của các kỹ thuật chọn mẫu không xác suất
Các cách chọn mẫu không xác suất thường dễ làm, rẻ nhưng do lựa chọn không ngẫu
nhiên nên tính đại diện cho quần thể nghiên cứu rất thấp. Nếu như mục đích của nghiên cứu là
để đo lường các biến số và từ đó khái quát hoá cho một quần thể thì các kết quả thu được từ
mẫu không xác suất thường không đủ cơ sở khoa học cho việc ngoại suy. Do đó, cần phải dè
dặt khi đưa ra các kết luận. Tuy nhiên với một số loại nghiên cứu được thiết kế với mục đích
thăm dò hoặc muốn tìm hiểu sâu một vấn đề nào đó của quần thể (như kiến thức, động cơ,
thái độ, niềm tin v.v...) thì khi đó việc chọn mẫu xác suất là không cần thiết và có thể áp dụng
cách chọn mẫu không xác suất. Ngoài ra, trong một số thử nghiệm lâm sàng, mẫu thường là
những người tình nguyện, khi đó cách chọn mẫu xác suất không thể áp dụng được.
Tài liệu tham khảo:
1. Dương Đình Thiện. Chẩn đoán cộng đồng. Dịch tễ học y học. Hà Nội. NXB y học, 1993,
tr: 290-303
2. Dịch tễ học trong y học lao động. Khám sàng lọc trong đánh giá các nguy cơ tới sức khoẻ.
Hà Nội. Bộ y tế, 1993, tr: 89 -106.
3. Tài liệu phát tay bộ môn vệ sinh - môi trường - dịch tễ, phần dịch tễ. Kỹ thuật sàng tuyển.
Hà Nội. Trường đại học y Hà Nội, 1999, tr: 3 - 7.

7
4. Nghiên cứu sức khoẻ cộng đồng. Quần thể và mẫu nghiên cứu. Trường đại học y Hà Nội,
2003, tr: 109-114.
5. Mạng lưới Nghiên cứu sức khỏe Việt Nam. Phương pháp chọn mẫu và tính toán cỡ mẫu
trong nghiên cứu khoa học sức khỏe. Trường Đại học Y tế công cộng. Hà nội, 2020.

You might also like