Professional Documents
Culture Documents
Bai 3 - Dai Cuong Thong Ke Mo Ta TS Trang
Bai 3 - Dai Cuong Thong Ke Mo Ta TS Trang
1
NỘI DUNG TRÌNH BÀY
3 Thống kê mô tả
4 Biểu đồ và đồ thị
2
KHÁI NIỆM VỀ THỐNG KÊ
Dữ liệu thống kê trong đời sống hằng
ngày qua các phương tiên truyền
thông như báo chí, đài phát thanh,
tivi, mạng Internet.
Ví dụ:
• Tại Việt Nam, tỷ lệ sinh mổ tại các thành phố lớn hàng năm
khoảng 40% và có xu hướng tăng nhanh.
• Chi phí trung bình cho 1 năm học ở bậc Đại học tại Mỹ là $18.000
• Tại Mỹ, mức lương trung vị của nam giới có bằng đại học là
$49,982, trong khi mức lương trung vị của nữ giới có bằng đại học
là $35,408.
4
TẠI SAO THỐNG KÊ QUAN TRỌNG?
Thiết kế nghiên cứu, kiểm soát chất lượng nghiên cứu, ước
Góp phần đưa ra các quyết định sau các nghiên cứu khoa học
5
TẠI SAO NÊN HỌC THỐNG KÊ?
1. Khả năng hiểu được các khái niệm, thuật ngữ, ký hiệu và
phương pháp thống kê dùng trong các nghiên cứu chuyên
ngành.
2. Khả năng nghiên cứu khoa học: nắm các phương pháp thống
kê là chìa khóa để thực hiện nghiên cứu.
Ví dụ: Tính cỡ mẫu trong chọn mẫu
3. Khả năng ứng dụng các kết quả nghiên cứu khoa học để ra
quyết định đúng đắn.
Ví dụ: Từ kết quả phân tích gộp nhiều nghiên cứu khác nhau, kết
luận một loại thuốc mới có hiệu quả hơn so với loại thuốc đang
6 dùng không?
Thống kê là khoa
học tiến hành các
nghiên cứu thông qua
việc thu thập, sắp
xếp, mô tả, phân tích,
trình bày, diễn giải và
đưa ra kết luận từ
dữ liệu.
7
8
Dân số, mẫu nghiên cứu
và thống kê suy luận
Dân số Tham số
Chứa toàn bộ các cá thể hoặc các Con số mô tả đặc tính của 1 dân
kết cục đo lường trong quần thể số
Tổng số cá thể cố định, có danh sách Số cá thể rất lớn, khó thu thập
liệt kê hết
Mẫu Thống kê
Là tập hợp con của dân số, chứa
Con số mô tả đặc tính của 1 mẫu
các cá thể hoặc các kết cục được
quan sát thật sự
10
KHÁI NIỆM
11
KHÁI NIỆM
Khi chỉ khám cho từng cá nhân bệnh nhân, không quan
tâm kiến thức mới, điều quan tâm là
Đặc trưng từng cá nhân bệnh nhân
Nếu muốn thực hiện nghiên cứu khoa học có mục đích
phát hiện kiến thức mới có tính khái quát hóa cao, cần
nắm vững
Phương pháp thống kê
hay phương pháp tính toán từ số liệu (tập hợp các giá trị
đặc trưng của nhiều cá nhân) để rút ra con số thống kê.
12
SỐ LIỆU
Là tập hợp kết quả của việc
các đặc tính dân số, xã hội và sinh học trên các đối tượng
khác nhau hoặc trên cùng đối tượng tại các thời điểm khác
nhau
13
SỐ LIỆU
Ví dụ: Quan sát Giới tính, có được bộ số liệu như sau
Lê Anh Tú Nam
15
SỐ LIỆU
Số liệu phải liên kết với một đặc tính hay đại lượng nhất
định.
Ghi nhận giới tính ở người này, tuổi của người khác thì
kết quả có được không phải là số liệu
Số liệu được tóm tắt, trình bày hay phân tích bằng phương
pháp thống kê sẽ trở thành thông tin
Việc trình bày, tóm tắt số liệu phụ thuộc vào hình thức của
số liệu (hay loại biến số)
16
BIẾN SỐ
Là những đặc trưng của cá nhân, thay đổi:
• Từ người này sang người khác
• Từ thời điểm này sang thời điểm khác
Ví dụ:
• Cân nặng
• Chiều cao
• Huyết áp
17
BIẾN SỐ
Phân loại:
18
BIẾN SỐ
Biến số định tính: thể hiện 1 đặc tính, gồm 3 loại:
-Biến số danh định: có 3 giá trị trở lên, không theo một trật tự
nhất định nào
Ví dụ: Dân tộc là biến số danh định có các giá trị là Kinh,
Hoa, Khơme, Chăm,…
-Biến số thứ tự: có 3 giá trị trở lên, có tính chất thứ tự
Ví dụ: Tình trạng kinh tế xã hội là biến số thứ tự với các
giá trị là giàu, khá, trung bình, nghèo, rất nghèo
19
BIẾN SỐ
Các biến số sau là biến nhị giá, danh định hay thứ tự?
- Đái tháo đường
- Nhóm máu
20
BIẾN SỐ
Ví dụ:
- Tuổi
- Chiều cao
- Cân nặng
21
BIẾN SỐ
phép trừ và phép chia, chứa giá trị zero tuyệt đối (biến
số không có giá trị 0).
Vd: Khối lượng
Biến số khoảng (inteval): các giá trị có thể được so sánh
bằng phép trừ, không chứa giá trị zero tuyệt đối (biến số
có giá trị 0).
Vd: Nhiệt độ
22
(Lưu ý: nhiệt độ Kelvin là 1 ngoại lệ, không có giá trị<0)
BIẾN SỐ
Biến số sống còn: Khi nghiên cứu quan tâm:
- Kết cuộc là biến cố có xảy ra hay không
Ví dụ:
2. Nghiên cứu về Phẫu thuật vòi trứng trong điều trị vô sinh
- Biến cố kết cuộc: khả năng mang thai
Ví dụ:
Chiều cao
BMI
Mức độ hài lòng của bệnh nhân
Kiến thức về phòng ngừa loãng xương
Nồng độ endorphin gia tăng sau châm cứu
24
BIẾN SỐ - GIÁ TRỊ BIẾN SỐ
Phân biệt BS và giá trị của BS (yếu tố)
Giới Nam / Nữ
Dân tộc Kinh / Mường/Hoa…
Tình trạng hôn nhân Độc thân / Góa…
sử dụng dịch vụ y tế
26
BIẾN SỐ
Trong phân tích thống kê, để tiện việc nhập số liệu hay lí
giải kết quả, người ta có thể gán các giá trị của biến định
tính vào các con số
Ví dụ: 1 – Nam; 0 – Nữ
Việc mã hóa này hoàn toàn có tính chất áp đặt và các con
số được dùng trong mã hóa không phản ánh bản chất của
biến số danh định
27
MÔ TẢ VÀ TRÌNH BÀY SỐ LIỆU
28
THỐNG KÊ MÔ TẢ BIẾN ĐỊNH TÍNH
Tần số, tỷ lệ %
Số liệu ghi nhận các đặc tính hay đại lượng có thể
trình bày thành bảng và bảng này được gọi là bảng
phân phối tần suất
Ví dụ: Khảo sát giới tính của 11 SV VLTL được kết
quả: nữ, nữ, nữ, nam, nam, nữ, nữ, nữ, nữ, nữ, nữ
Giới Tần số Tỷ lệ %
Nam
Nữ
29 Tổng số
THỐNG KÊ MÔ TẢ BIẾN ĐỊNH TÍNH
Tần số, tỷ lệ %, % cộng dồn
Nếu là biến số thứ tự thì nên trình bày phần trăm tích lũy
Vd: Trình độ học vấn là biến thứ tự có 4 giá trị
31
THỐNG KÊ MÔ TẢ BIẾN ĐỊNH LƯỢNG
Thống kê mô tả khuynh hướng tập trung:
Trung bình (mean)
xi
x
N
VD: Số liệu về huyết áp tâm thu của 5 đối tượng là 120,
125, 130, 135, 150. Huyết áp tâm thu trung bình là bao
nhiêu?
32
THỐNG KÊ MÔ TẢ BIẾN ĐỊNH LƯỢNG
Thống kê mô tả khuynh hướng tập trung:
Trung vị: (median)
Giá trị ở giữa của số liệu được sắp thứ tự, là giá trị
thứ (n+1)/2
Nếu có 2 giá trị ở giữa, trung vị là trung bình của 2
giá trị này
34
THỐNG KÊ MÔ TẢ BIẾN ĐỊNH LƯỢNG
35
ĐO LƯỜNG KHUYNH HƯỚNG TRUNG TÂM
Trung bình = Trung vị = Yếu vị
36
ĐO LƯỜNG KHUYNH HƯỚNG TRUNG TÂM
Trung bình
(Mean)
Trung vị
(Median)
Yếu vị (Mode)
37
ĐO LƯỜNG KHUYNH HƯỚNG TRUNG TÂM
Trung bình < Trung vị: dữ liệu lệch trái
Trung bình
(Mean)
Trung vị
(Median)
Yếu vị (Mode)
38
ĐO LƯỜNG KHUYNH HƯỚNG TRUNG TÂM
VD: Chi phí điều trị (tính bằng USD) cho 10 bệnh nhân
bị loét dạ dày - tá tràng được điều trị theo một phác đồ
diệt vi khuẩn Helicobacter được ghi nhận là như sau:
10, 20, 20, 20, 20, 20, 30, 30, 30, 300.
Trung vi? Trung bình? Chọn lựa trung bình hay trung vị
để dự tính chi phí bảo hiểm y tế cho 10 ngàn người
bệnh?
39
THỐNG KÊ MÔ TẢ BIẾN ĐỊNH LƯỢNG
n
( xi x ) 2
s
i 1 N 1
41
THỐNG KÊ MÔ TẢ BIẾN ĐỊNH LƯỢNG
42
THỐNG KÊ MÔ TẢ BIẾN ĐỊNH LƯỢNG
n
( xi x ) 2
s
2
i 1 N 1
43
THỐNG KÊ MÔ TẢ BIẾN ĐỊNH LƯỢNG
Tứ phân vị (quartile)
Tứ phân vị trên (upper quartile) còn gọi là bách vị
(percentile) 75%
(percentile) 25%
44
45
THỐNG KÊ MÔ TẢ BIẾN ĐỊNH LƯỢNG
- Khoảng tứ vị: (quartile) các giá trị chia số liệu
làm 4 phần bằng nhau
- KHÔNG bị ảnh hưởng bởi các giá trị ngoại lai
(outlier)
Ví dụ 1: Số liệu về huyết áp tâm thu của 5 đối
tượng là 120, 125, 130, 135, 150
46
THỐNG KÊ MÔ TẢ BIẾN ĐỊNH LƯỢNG
Thống kê mô tả khuynh hướng phân tán
Phạm vi: (Range)
Là khoảng giá trị tối thiểu – giá trị tối đa (Min –
Max)
Ví dụ 1: Số liệu về huyết áp tâm thu của 6 đối tượng
là 110, 120, 125, 130, 135, 150.
Ví dụ 2: Số giờ ngủ của 8 người sau khi sử dụng
thuốc mê trong phẫu thuật: 7, 10, 12, 4, 8, 7, 5, 12
47
THỐNG KÊ MÔ TẢ BIẾN ĐỊNH LƯỢNG
Trường hợp Giá trị tiêu biểu Mức độ phân tán
48
THỐNG KÊ MÔ TẢ TRÊN MẪU
Biến định tính Biến định lượng
- Tần số
– Có phân phối bình thường
• Trung bình
- Tỷ lệ %
• Độ lệch chuẩn
- % cộng dồn • Phạm vi
– Không có phân phối bình
thường
• Trung vị
• Khoảng tứ vị
• Phạm vi
49
THỐNG KÊ MÔ TẢ BIẾN ĐỊNH LƯỢNG
50
PHÂN BIỆT SD VÀ SE
● Độ lệch chuẩn (SD-Standard deviation)
σ 𝑋𝑖 − 𝑋ത 2
𝑠=
𝑁−1
Mô tả độ phân tán dữ liệu so với trung bình mẫu
● Sai số chuẩn (SE-Standard error)
𝑠𝑒 = 𝑠ൗ
𝑁
Mô tả độ phân tán dữ liệu so với trung bình của dân số,
phụ thuộc vào cỡ mẫu N.
Nếu N tăng, sai số chuẩn giảm và ngược lại.
51
THỐNG KÊ MÔ TẢ BIẾN ĐỊNH LƯỢNG
52
THỐNG KÊ MÔ TẢ BIẾN ĐỊNH LƯỢNG
53
THỐNG KÊ MÔ TẢ BIẾN ĐỊNH LƯỢNG
54
THỐNG KÊ MÔ TẢ BIẾN ĐỊNH LƯỢNG
Ví dụ 1: Tiến hành đo đạc hemoglobin của 40 phụ nữ
được chọn một cách ngẫu nhiên trong dân số đích ta
có trung bình và độ lệch chuẩn của biến số
hemoglobin là 11,5 và 0,84. Tính KTC 95% của trung
bình haemoglobin ở dân số đích.
Ví dụ 2: Chiều cao của 10 thanh niên là 160, 162,
165, 166, 169, 170, 172, 172, 176, 176. Hãy ước
lượng KTC 95% của chiều cao trung bình. (biết
t=2.26)
Ví dụ 3: Điều tra trên 120 thanh niên có 30 thanh
niên hút thuốc lá. Hãy tính tỷ lệ thanh niên hút thuốc
lá và KTC 95% của tỷ lệ hút thuốc lá.
55
BiỂU ĐỒ VÀ ĐỒ THỊ
56
BIỂU ĐỒ MÔ TẢ
Biểu đồ thanh
- Nhằm mô tả sự phân bố của biến số rời rạc.
- Trục hoành trên đó xác định những giá trị của biến số.
- Ứng với từng giá trị của biến số ta vẽ các thanh có chiều
cao tỉ lệ với tần suất của giá trị đó.
- Luôn luôn có khoảng trống giữa các thanh.
50
40
45
30
20
24
10
57
0
BIỂU ĐỒ MÔ TẢ
Biểu đồ thanh
Sinh moå 57
Sinh forceps 65
58
Biểu đồ mô tả
Biểu đồ thanh
- Ðối với biến số thứ tự, các giá trị của biến số phải được
sẵp xếp thứ tự theo trục hoành.
2000
Taàn suaát
1000
Nöõ
35%
Nam
65%
60
Biểu đồ mô tả
Biểu đồ hình bánh
- Biểu đô hình bánh là một vòng tròn được chia làm nhiều
cung tương ứng với các giá trị của biến số.
- Ðộ lớn của cung tỉ lệ với tần suất của giá trị biến số.
Sinh moå
Sinh
forceps
Sinh
thöôøn g
61
BIỂU ĐỒ MÔ TẢ
Tổ chức đồ (histogram)
20
15
Frequency
10
0
62 8 9 10 11 12 13 14 15 16
hemoglobin
BIỂU ĐỒ MÔ TẢ
Tổ chức đồ
- Chia biên độ của giá trị làm nhiều khoảng giá trị
- Tính tần suất của những khoảng giá trị đó.
- Những khoảng giá trị này được biểu thị ở trên trục
hoành.
- Ứng với mỗi khoảng giá trị ta vẽ những hình chữ nhật
có diện tích tỉ lệ với tần suất của khoảng giá trị đó.
- Vì các khoảng giá trị này nằm sát nhau trên trục hoành,
các hình chữ nhật của tổ chức đồ cũng thường nằm sát
nhau
63
BIỂU ĐỒ MÔ TẢ
Đa giác tần suất
Ðể vẽ đa giác tần suất, ta vẽ tổ chức đồ và nối các trung
điểm của các cạnh trên của các hình chữ nhật.
20
15
Frequency
10
0
64
8 9 10 11 12 13 14 15 16
hemoglobin
BIỂU ĐỒ MÔ TẢ
Đa giác tần suất
Không đẹp như các tổ chức đồ nhưng có thể vẽ nhiều đa
giác tần suất trên cùng một đồ thị để dễ so sánh.
15
10
8 9 10 11 12 13 14 15 16
65 hemoglobin
BIỂU ĐỒ MÔ TẢ
hem
Biểu đồ hộp 16
Giá trị lớn nhất
(Box plot) 15
14
Tứ phân vị trên (75th)
13
12
Trung vị (median)
11
Tứ phân vị dưới (25th)
10
66
Giá trị nhỏ nhất
8
Biểu đồ mô tả
Biểu đồ hộp
- Sơ đồ hộp gồm một hình chữ nhật và 2 đoạn thẳng
đứng.
- Hình hộp có cạnh trên là tứ vị trên, cạnh dưới là tứ vị
dưới.
- Ðường nằm trong hình hộp là đường đi qua trung vị.
- Hai thanh dọc của sơ đồ hộp nối liền giá trị tứ vị trên với
giá trị cực đại va tứ vị dưới với giá trị cực tiểu.
67
MÔ TẢ KẾT HỢP NHIỀU NHÓM
Cách đỡ đẻ Dùng ZDV1 Không dùng ZDV
Ðường âm đạo 0.043 0.195
Mổ lấy thai 0.008 0.039
25%
19.5%
20%
Ñöôøn g aâm ñaïo
15% Moå laáy thai
10%
4.3% 3.9%
5%
0.8%
0%
Duøn g ZDV† Khoân g duøn g ZDV
68
Biểu đồ thanh so sánh tỷ lệ kết cuộc sanh giữa 2 nhóm bà mẹ
dùng ZDV và không dùng ZDV
MÔ TẢ KẾT HỢP NHIỀU NHÓM
80%
SDD Naën g
20%
0%
0-5 6-11 12-17 18-23 24-35 36-48
1997 2000
Tình trạng dinh Xã can Xã can
dưỡng Xã chứng thiệp Xã chứng thiệp
Suy dinh dưỡng
độ 3 4 (2%) 0 (0%) 2 (3%) 1 (1%)
Suy dinh dưỡng
độ 2 21 (9%) 7 (7%) 5 (7%) 1 (1%)
Suy dinh dưỡng
độ 1 60 (25%) 26 (28%) 22 (31%) 24 (34%)
153
Bình thường (64%) 61 (65%) 43 (60%) 45 (63%)
238 94 72 71
70 Tổng số (100%) (100%) (100%) (100%)
TRÌNH BÀY SỐ LIỆU - THỐNG KÊ VỚI BẢNG
- Đơn giản
- Đủ thông tin
71
TRÌNH BÀY SỐ LIỆU - THỐNG KÊ VỚI BẢNG
2 nguyên tắc chính: Đơn giản
- Đặc tính chung của quần thể hoặc phân nhóm theo 1
biến số
- Đối với biến số định tính:
của bảng, quần thể nghiên cứu, thời điểm nếu cần
Đủ thông tin của hàng và cột: có tiêu đề
thích
73
TRÌNH BÀY SỐ LIỆU - THỐNG KÊ VỚI BẢNG
Biến định tính: liệt kê đầy đủ các giá trị (trừ khi là biến
nhị giá)
Đủ thông tin về kết quả thống kê:
75
TRÌNH BÀY SỐ LIỆU VỚI BẢNG
Ví dụ
76
TRÌNH BÀY SỐ LIỆU VỚI BẢNG
Ví dụ
77
78
TÓM TẮT
1. Thống kê, số liệu, biến số
4. Biểu đồ và đồ thị
79