Download as pdf or txt
Download as pdf or txt
You are on page 1of 143

NGUYÊN LÝ KIỂM ĐỊNH

KIỂM ĐỊNH THỐNG KÊ

1
TS. Nguyễn Thị Minh Trang
Bộ môn Thống kê – Khoa Y tế Công cộng
Đại học Y Dược TPHCM
Email: drminhtrang@gmail.com
17/03/2021
NỘI DUNG

1 • Khái niệm kiểm định giả thuyết

2 • Khái niệm P value

3 • Sai lầm và năng lực thống kê

4 • Kiểm định biến định tính

5 • Kiểm định biến định lượng

17/03/2021 2
➢ GIẢ THUYẾT (GT)
3 1. KHÁI NIỆM
➢ KIỂM ĐỊNH GT

Giả thuyết: Hypothesis


Kiểm định giả thuyết: Hypothesis testing
17/03/2021
KHÁI NIỆM VỀ GIẢ THUYẾT

Giả thuyết:
Mệnh đề có thể kiểm định được về việc dự đoán mối liên
quan giữa 2 hoặc nhiều biến số với nhau.
Ví dụ:
Nghiên cứu về mối liên quan giữa mất ngủ và điểm số thi
có giả thuyết là
“Những người mất ngủ sẽ có điểm số thi thấp hơn
những người ngủ đủ giấc”
4
KHÁI NIỆM VỀ GIẢ THUYẾT

Ví dụ:

▪ Nghiên cứu về mối liên quan giữa tiền căn gia đình về

K vú và K vú

-> Giả thuyết của NC này là:

……………………………………………………………….

▪ Note: lưu ý về loại biến số nghiên cứu

5
KHÁI NIỆM VỀ GIẢ THUYẾT

Giả thuyết Ho và Ha:

• Ho (o: null hypothesis): Không có sự liên hệ thống kê

nào.

• Ha (a: alternative): đảo thuyết.

17/03/2021 6
KHÁI NIỆM VỀ GIẢ THUYẾT

Giả thuyết Ho và Ha:


• Ho (o: null): Không có sự khác biệt về điểm số thi giữa
2 nhóm người mất ngủ và ngủ đủ giấc
• Ha (a: alternative): đảo thuyết. Có sự khác biệt về
điểm số thi giữa 2 nhóm người mất ngủ và ngủ đủ
giấc

7
KHÁI NIỆM VỀ GIẢ THUYẾT

Ví dụ:

Nghiên cứu về mối liên quan giữa tiền căn gia đình về
K vú và K vú

-> Giả thuyết Ho là:


……………………………………………………………….
-> Giả thuyết Ha là:
……………………………………………………………….
17/03/2021 8
Note: lưu ý về loại biến số nghiên cứu
KHÁI NIỆM KIỂM ĐỊNH GIẢ THUYẾT

Nguyên tắc dựa trên “Phương pháp phản chứng”

▪ Nếu {A=>B không xảy ra} thì {B xảy ra=>A không xảy ra}

Ví dụ:

Nếu BN bị tắc ruột (A) thì BN sẽ không trung tiện (không B)

Do BN trung tiện bình thường (B) nên BN không bị tắc ruột


(không A)
17/03/2021 9
KHÁI NIỆM KIỂM ĐỊNH GIẢ THUYẾT

Nguyên tắc dựa trên “Phương pháp phản chứng”

▪ Gọi: T là biến cố nghiên cứu

P(T) là xác suất của biến cố T

▪ Nếu {Ho=>T hiếm xảy ra} thì {T xảy ra=>Ho hiếm xảy ra}

▪ Nếu {Ho=>P(T) nhỏ} thì {T xảy ra=>P(Ho) nhỏ}

17/03/2021 10
QUI TRÌNH KIỂM ĐỊNH GIẢ THUYẾT

1. Xây dựng giả thuyết Ho

2. Chọn lựa kiểm định thích hợp

3. Tính giá trị thống kê của kiểm định đã chọn

4. Tính xác suất thống kê (giá trị P) từ giá trị thống kê

tính được

5. Nêu kết luận dựa trên giá trị P (P-value)

17/03/2021 11
QUI TRÌNH KIỂM ĐỊNH GIẢ THUYẾT

▪ Ví dụ: Nghiên cứu về mối liên quan giữa tiền căn gia đình có

K vú và mắc K vú. Giả sử tỷ lệ K vú quan sát trong mẫu NC


cho nhóm có tiền căn là 5% và nhóm không có tiền căn là 2%.

▪ Các bước xây dựng kiểm định thống kê

1. Xây dựng GT Ho:

Không có mối liên hệ giữa tiền căn gđ và K vú hay

Tỷ lệ K vú/ nhóm tiền căn gđ = Tỷ lệ K vú/ không tiền căn

P1=P2 17/03/2021 12
QUI TRÌNH KIỂM ĐỊNH GT

▪ Ví dụ: Nghiên cứu về mối liên quan giữa tiền căn gia

đình có K vú và mắc K vú. Giả sử tỷ lệ K vú quan sát


trong mẫu NC cho nhóm có tiền căn là 5% và nhóm
không có tiền căn là 2%.

▪ Các bước xây dựng kiểm định thống kê

2. Chọn kiểm định phù hợp:

Kiểm định Chi bình phương để so sánh 2 tỷ lệ


17/03/2021 13
QUI TRÌNH KIỂM ĐỊNH GT

▪ Ví dụ: Nghiên cứu về mối liên quan giữa tiền căn gia

đình có K vú và mắc K vú. Giả sử tỷ lệ K vú quan sát


trong mẫu NC cho nhóm có tiền căn là 5% và nhóm
không có tiền căn là 2%.

▪ Các bước xây dựng kiểm định thống kê

3. Tính giá trị thống kê của kiểm định đã chọn

Giá trị thống kê của Chi bình phương là χ2


17/03/2021 14
QUI TRÌNH KIỂM ĐỊNH GT

▪ Ví dụ: Nghiên cứu về mối liên quan giữa tiền căn gia

đình có K vú và mắc K vú. Giả sử tỷ lệ K vú quan sát


trong mẫu NC cho nhóm có tiền căn là 5% và nhóm
không có tiền căn là 2%.

▪ Các bước xây dựng kiểm định thống kê

4. Tính xác suất thống kê (giá trị P) từ giá trị thống kê tính
được

Tra bảng χ2 theo độ tự do hoặc dùng phần mềm thống kê


17/03/2021 15
QUI TRÌNH KIỂM ĐỊNH GT
▪ Ví dụ: Nghiên cứu về mối liên quan giữa tiền căn gia

đình có K vú và mắc K vú. Giả sử tỷ lệ K vú quan sát


trong mẫu NC cho nhóm có tiền căn là 5% và nhóm
không có tiền căn là 2%.

▪ Các bước xây dựng kiểm định thống kê

5. Kết luận

Giả sử P(K vú /Ho) <0.001: nếu tỷ lệ K vú ở nhóm có và


không có tiền căn là như nhau thì xác suất có được sự
khác biệt như chúng ta quan sát thấy là nhỏ hơn 1/1000.
17/03/2021 16
QUI TRÌNH KIỂM ĐỊNH GT
▪ Các bước xây dựng kiểm định thống kê

5. Kết luận

Giả sử P(K vú /Ho) <0.001: nếu Ho đúng hay tỷ lệ K vú ở


nhóm có và không có tiền căn là như nhau thì xác suất có
được sự khác biệt như chúng ta quan sát thấy là nhỏ hơn
1/1000.

Xác suất này rất thấp nếu Ho đúng. Do đó, có khả năng
Ho không đúng
17/03/2021 17
=> Bác bỏ GT Ho
18 2. KHÁI NIỆM P VALUE

17/03/2021
KHÁI NIỆM VỀ P-VALUE

• Nghiên cứu về tiền căn gia đình và Ung thư vú


• Giả sử tỷ lệ mắc Ung thư vú ở phụ nữ không có tiền căn
gia đình là 2%
• Câu hỏi: Vậy phụ nữ có tiền căn gia đình bị K vú có tỷ lệ
bị K vú khác so với tỷ lệ trên không?
• Đặt giả thuyết Ho và Ha
𝐻0 : 𝑝 = 0.02
𝐻𝐴 : 𝑝 ≠ 0.02

19
KHÁI NIỆM VỀ P-VALUE

• Chọn 𝑁 = 100 phụ nữ có tiền căn gia đình bị K vú


• Quan sát 𝑋 = # phụ nữ trong nhóm này bị K vú
• Chú ý: Nếu GT 𝐻0 is đúng, chúng ta trông đợi rằng số
phụ nữ này tương tự như số phụ nữ không có tiền căn
gia đình
• Cụ thể, chúng ta trông đợi rằng 2 trong số 100 người phụ
nữ này bị K vú (dựa theo 𝐻0 : 𝑝 = 0.02)
• Giả sử chúng ta quan sát thấy 𝑋 = 5 ca K vú (5%)

20
KHÁI NIỆM VỀ P-VALUE
Câu hỏi:

Khả năng chúng ta quan sát được (𝑋 = 5) trong khi chúng ta kì


vọng X=2 là bao nhiêu?

Hoặc, xác suất chúng ta quan sát được từ 5 ca bị K vú trong khi


chúng ta kì vọng chỉ 2 ca là bao nhiêu?

𝑃(𝑋 ≥ 5 | 𝐻0 : p = 0.02 đúng)?

Trả lời: 𝑃 𝑋 ≥ 5 𝑝 = 0.02) = 1 − 𝑃 𝑋 < 5 𝑝 = 0.02) =


4
𝑁!
1−෍ × 𝑝𝑐 × 𝑞 𝑁−𝑐 =
𝑐! × 𝑁 − 𝑐 !
𝑐=0
100! 0 100
100!
1− × 0.02 × 0.98 +⋯ × 0.024 × 0.9896 =
0! × 100! 4! × 96!
21
1 − 0.1326 + ⋯ 0.0902 = 0.0508 (khoảng 1/20)
KHÁI NIỆM VỀ P-VALUE

Khái niệm: 𝟎. 𝟎𝟓𝟎𝟖 là giá trị P , hay P value (p=0.0508)

Giải thích: Nếu GT Ho đúng (không có mối liên quan giữa tiền
căn gđ và K vú), cơ hội quan sát thấy có từ 5 ca trở lên trong
số 100 phụ nữ có tiền căn gia đình là 1/20.

Vì quan sát của chúng ta là bất thường khi Ho đúng, có thể Ho


bị sai không?

22
KHÁI NIỆM VỀ P-VALUE

Câu hỏi:
● Con số quan sát (X=5) có giống như con số mong đợi
(X=2) khi Ho đúng?
● Phụ nữ có tiền căn gia đình có cần tầm soát K vú
thường xuyên không?
● Nếu N=200 thay vì 100 và chúng ta lại quan sát thấy tỷ
lệ K vú là 5% ở nhóm phụ nữ có tiền căn, cần đưa ra
khuyến cáo thế nào?

23
KHÁI NIỆM VỀ P-VALUE
Nếu 𝑁 = 200 & 𝑋 = 10 (Tỉ lệ 5%)

Nếu 𝐻0 : 𝑝 = 0.02 là đúng, chúng ta trông đợi khoảng


…./200 người bị K vú
Xác suất quan sát được >= 10 người bị K khi chỉ kì vọng 4
ca là bao nhiêu?
𝑃(𝑋 ≥ 10 | 𝐻0 : 𝑝 = 0.02 )?
P-value thay đổi
Trả lời: 𝑃 𝑋 ≥ 10 𝑝 = 0.02) =
9
200!
1−෍ × 0.02𝑐 × 0.98𝑁−𝑐 = 0.0075
𝑐! × 200 − 𝑐 !
𝑐=0
24
KHÁI NIỆM VỀ P-VALUE
NẾU 𝑁 = 200 & 𝑋 = 10 (Tỉ lệ 5%)

Nếu GT Ho đúng (không có mối liên quan giữa tiền căn gđ


và K vú), cơ hội quan sát thấy có từ 10 ca trở lên trong số
200 phụ nữ có tiền căn gia đình là P=0,0075.

Xác suất này rất thấp nếu Ho đúng. Do đó, có khả năng Ho
không đúng => Bác bỏ Ho

25
KHÁI NIỆM P-VALUE

● Mặc dù có thể quan sát được cùng 1 tỉ lệ phụ nữ bị K ở


cả 2 mẫu nghiên cứu(𝑁 = 100 và 𝑁 = 200), mẫu lớn hơn
sẽ đưa đến kết quả chính xác hơn khi đo lường ảnh
hưởng của tiền căn gia đình đối với K vú.
● Dựa vào phân tích trên mẫu lớn, chúng ta tự tin hơn khi
kết luận rằng tiền căn gia đình có thể có vai trò quan
trọng (𝑝 = 0.0075).
● Tuy nhiên, cỡ mẫu lớn đòi hỏi sự tốn kém về nhiều mặt
như thời gian, nhân lực, vật lực.
Data=Chứng cứ

26
KHÁI NIỆM VỀ P-VALUE

● Giá trị P (P-value) đo lường khả năng (xác suất) quan


sát được 1 giá trị khác với giá trị kì vọng (expected) nếu
giả thuyết H0 đúng
● Giá trị P nhỏ có ý nghĩa là giá trị quan sát được là bất
thường nếu GT Ho đúng
=> Bác bỏ GT Ho
● Giá trị P lớn có ý nghĩa là giá trị quan sát được không
phải là bất thường khi GT Ho đúng.
=> Không bác bỏ GT Ho

27
➢ CÁC LOẠI SAI LẦM
28
4.
➢ SỨC MẠNH THỐNG KÊ

Các sai lầm loại 1, loại 2: Type I, type II error


Sức mạnh thống kê: Power
17/03/2021
CÁC SAI LẦM (ERROR)

▪ Trong NC thống kê, không thể kết luận chắc chắn về

kết quả.

▪ Nhà nghiên cứu có thể mắc 2 loại sai lầm khi kết luận:

✓Bác bỏ giả thuyết Ho

✓Không bác bỏ giả thuyết Ho

với 1 xác suất nào đó.

17/03/2021 29
SAI LẦM LOẠI 1: TYPE I ERROR

▪ Ký hiệu: α

▪ Là xác suất bác bỏ giả thuyết Ho trong khi Ho đúng

▪ Qui ước:

✓Phổ biến: chọn α=0.05

✓Ít phổ biến: chọn α=0.01

17/03/2021 30
SAI LẦM LOẠI 1: TYPE I ERROR

▪ Ví dụ:

NC về mối liên quan giữa tiền căn gđ bị K vú và K vú

Ho: P(K vú/tiền căn) = P(K vú/không tiền căn)

Ha: P(K vú/tiền căn)  P(K vú/không tiền căn)

Sai lầm α là xác suất cho rằng tiền căn gia đình có liên quan
với K vú (GT Ha) trong khi thực tế không có mối liên quan
(GT Ho). 17/03/2021 31
SAI LẦM LOẠI 1: TYPE I ERROR

K vú (+) K vú (-)
Tiền căn gđ (+) Sai lầm loại I (α)
Tiền căn gđ (-)

Sai lầm loại I (α) là sai lầm cho rằng tiền căn gia đình có
liên quan với K vú (GT Ha) trong khi thực tế không có
mối liên quan (GT Ho).

*Xem tiền căn gia đình như 1 yếu tố nguy cơ, tương tự
1 “test” tầm soát 17/03/2021 32
SAI LẦM LOẠI 2: TYPE II ERROR

▪ Ký hiệu: β

▪ Là xác suất không bác bỏ giả thuyết Ho khi Ho không

đúng

▪ Qui ước

▪ Phổ biến: chọn β=0.2

▪ Ít phổ biến: chọn β=0.1

17/03/2021 33
SAI LẦM LOẠI 2: TYPE II ERROR

▪ Ví dụ:

NC về mối liên quan giữa tiền căn gđ bị K vú và K vú

Ho: P(K vú/tiền căn) = P(K vú/không tiền căn)

Sai lầm β là xác suất cho rằng tiền căn gia đình không
có liên quan với K vú (GT Ho) trong khi thực tế có mối
liên quan (GT Ha).

17/03/2021 34
SAI LẦM LOẠI 2: TYPE 2 ERROR

K vú (+) K vú (-)
Tiền căn gđ (+)
Tiền căn gđ (-) Sai lầm loại II (β)

Sai lầm loại II (β) là sai lầm cho rằng tiền căn gia đình
không có liên quan với K vú (GT Ho) trong khi thực tế
có mối liên quan (GT Ha).

17/03/2021 35
SỨC MẠNH THỐNG KÊ: POWER

▪ Power=1-β

▪ Là xác suất bác bỏ Ho khi Ho không đúng

▪ Được sử dụng khi tính cỡ mẫu cho mục tiêu kiểm định

giả thuyết.

▪ Qui ước:

✓Phổ biến: power=0.8 (β=0.2)

✓Ít phổ biến: power=0.9 (β=0.1)


17/03/2021 36
SỨC MẠNH THỐNG KÊ: POWER

K vú (+) K vú (-)
Tiền căn gđ (+) Power
Tiền căn gđ (-) β

▪ Là xác suất cho rằng tiền căn gia đình có liên quan

đến K vú (bác bỏ Ho) khi thực tế có mối liên quan này


(Ho không đúng).

17/03/2021 37
CÁC SAI LẦM VÀ POWER

NC về tiền căn gđ và K vú

K vú (+) K vú (-)
Tiền căn gđ (+) Dương tính thật Dương tính giả
Độ nhạy (Power) Sai lầm loại I (α)
Tiền căn gđ (-) Âm tính giả Âm tính thật
Sai lầm loại II (β) Độ đặc hiệu

17/03/2021 38
CÁC SAI LẦM VÀ POWER
Trong NC về test chẩn đoán:

K vú (+) K vú (-)
Test chẩn đoán (+) Dương tính thật Dương tính giả
Độ nhạy (Power) Sai lầm loại I (α)
Test chẩn đoán (-) Âm tính giả Âm tính thật
Sai lầm loại II (β) Độ đặc hiệu

17/03/2021 39
40 5. CHỌN LỰA
KIỂM ĐỊNH THỐNG KÊ

17/03/2021
CHỌN KIỂM ĐỊNH THỐNG KÊ

▪ Xác định loại biến kết cuộc (biến phụ thuộc) và biến

giải thích/ tiên lượng (biến độc lập):


✓Biến định lượng

✓Biến phân loại

o Nhị giá

o Danh định

o Thứ tự
17/03/2021 41
CHỌN KIỂM ĐỊNH THỐNG KÊ
Khi các quan sát độc lập, chọn lưa kiểm định theo bảng sau:

Biến phụ Biến độc lập


thuộc Nhị giá Danh định Thứ tự Định lượng
Nhị giá Chi2/Fisher Chi2/Fisher Chi2/Fisher Hồi qui Logistic
Danh định Chi2/Fisher Chi2/Fisher Chi2/Fisher Hồi qui Logistic
Danh định
Thứ tự Chi2/Fisher Chi2/Fisher Chi2/Fisher Hồi qui Logistic
Thứ tự
Định lượng T test ANOVA Tương quan Tương quan
(phân phối Pearson/ Hồi qui Pearson/ Hồi qui
bình thường) tuyến tính/ tuyến tính
ANOVA
Định lượng Wilcoxon Kruskal Tương quan Tương quan
(phân phối Rank sum Wallis Spearman Spearman
lệch) (Mann Whitney)
17/03/2021 42
CHỌN KIỂM ĐỊNH THỐNG KÊ
Khi các quan sát không độc lập, chọn lưa kiểm định theo bảng sau:

Biến phụ thuộc Biến độc lập

Nhị giá Danh định Thứ tự Định lượng

Nhị giá McNemar's test McNemar's test McNemar's test GEE

Danh định McNemar's test Cochrane Q Cochrane Q GEE

Thứ tự McNemar's test Cochrane Q Cochrane Q GEE

Định lượng Paired T test Repeated- Repeated- GEE /Mixed


(phân phối bình measures measures Model
thường) ANOVA/GEE ANOVA/ GEE

Định lượng Wilcoxon Friedman test Friedman test GEE/ GLMM


(phân phối lệch) Signed rank

17/03/2021 43
SƠ ĐỒ CHỌN LỰA KIỂM ĐỊNH THEO BIẾN SỐ PHỤ THUỘC

3/17/2021 44
45 KIỂM ĐỊNH
BIẾN KẾT CUỘC ĐỊNH TÍNH

• Chi bình phương (Chi-squared test)


• Fisher’s Exact Test

17/03/2021
CHỌN KIỂM ĐỊNH THỐNG KÊ
BIẾN ĐỊNH TÍNH
Khi các quan sát độc lập, chọn lưa kiểm định theo bảng sau:
Biến phụ Biến độc lập
thuộc Nhị giá Danh định Thứ tự Định lượng
Nhị giá Chi2/Fisher Chi2/Fisher Chi2/Fisher Hồi qui Logistic
Danh định Chi2/Fisher Chi2/Fisher Chi2/Fisher Hồi qui Logistic
Danh định
Thứ tự Chi2/Fisher Chi2/Fisher Chi2/Fisher Hồi qui Logistic
Thứ tự
Định lượng T test ANOVA Tương quan Tương quan
(phân phối Pearson/ Hồi qui Pearson/ Hồi qui
bình thường) tuyến tính/ tuyến tính
ANOVA
Định lượng Wilcoxon Kruskal Tương quan Tương quan
(phân phối Rank sum Wallis Spearman Spearman
lệch) (Mann Whitney)
17/03/2021 46
MỤC ĐÍCH

Kiểm định Chi bình phương được sử dụng để xác


định

❖ Có hay không mối liên quan có ý nghĩa thống kê

❖ Giữa 2 biến số định tính (nhị giá/ phân loại).

47
VÍ DỤ

Nghiên cứu về các yếu tố liên quan đến tiểu đường típ 2.

Câu hỏi:

Các yếu tố như chủng tộc, béo phì, hút thuốc lá, uống rượu,
ít vận động thể lực có liên quan đến việc mắc phải tiểu
đường típ 2 ở cộng đồng nghiên cứu hay không?

48
VÍ DỤ

Nghiên cứu về các yếu tố liên quan đến tiểu đường típ 2.

Biến số độc lập Giá trị biến số Loại biến số


(yếu tố liên quan)
Giới tính Nam, nữ Danh định
Béo phì Có, không Nhị giá
Hút thuốc lá Có, không Nhị giá
Uống rượu bia Có, không Nhị giá
Vận động thể lực Ít, trung bình, nhiều Thứ tự
Biến số phụ thuộc
(kết cuộc)
Tiểu đường típ 2 Có, không Nhị giá
49
BẢNG PHÂN PHỐI TẦN SUẤT

▪ Bảng phân phối tần suất còn được gọi là bảng dự


trù.

▪ Bảng dự trù r  c biểu diễn tần số quan sát của 2


biến số.

▪ R: row_hàng; C: column_cột

50
BẢNG PHÂN PHỐI TẦN SUẤT

Nghiên cứu về các yếu tố liên quan đến tiểu đường típ 2: Giới tính

Tiểu đường típ 2


Giới Tổng
Có Không
Nam 3487 5994 9481
Nữ 4678 7527 12205
Tổng 8165 13521 21686

Bảng dự trù 2 hàng x 2 cột

51
TẦN SỐ KÌ VỌNG (VỌNG TRỊ)

❖ Vọng trị là giá trị kì vọng quan sát được trong các ô
của bảng dự trù khi chưa thu thập dữ liệu thực tế.

❖ Giả sử 2 biến số khảo sát độc lập, có thể dùng


bảng dự trù để tính giá trị kì vọng của mỗi ô trong
bảng.

Tính vọng trị cho các ô trong bảng dự trù


Er,c: vọng trị (tần số kì vọng)
(Sum of row r )  (Sum of column c )
Expected frequency E = r ,c .
Sample size
VỌNG TRỊ (EXPECTED)

Tiểu đường típ 2


Giới Tổng
Có (cột 1) Không (cột 2)
Nam (hàng 1) 3487 5994 9481
Nữ (hàng 2) 4678 7527 12205
Tổng 8165 13521 21686

Vọng trị của ô (1,1) (ô giao của hàng 1 và cột 1): E(1,1)

E(1,1)=

53
VỌNG TRỊ (EXPECTED)

Tiểu đường típ 2


Giới Tổng
Có (cột 1) Không (cột 2)
Nam (hàng 1) 3487 5994 9481
Nữ (hàng 2) 4678 7527 12205
Tổng 8165 13521 21686

Vọng trị của ô (1,1) (ô giao của hàng 1 và cột 1): E(1,1)

E(1,1)=(9481x8165)/21686=3570
E(1,2)=(9481x13521)/21686=5911
E(2,1)=(12205x8165)/21686=4595
54
E(2,2)=(12205x13521)/21686=7609
VỌNG TRỊ (EXPECTED)

Tiểu đường típ 2


Giới Tổng
Có (cột 1) Không (cột 2)
Nam (hàng 1) 3487 (3570) 5994 (5911) 9481
Nữ (hàng 2) 4678 (4595) 7527 (7609) 12205
Tổng 8165 13521 21686

Vọng trị: số màu đỏ trong ngoặc đơn trông các ô của bảng
dự trù

55
GIẢ ĐỊNH CỦA KIỂM ĐỊNH Χ2

❖Mẫu nghiên cứu là mẫu ngẫu nhiên

❖Các biến số là biến định tính (phân loại)

❖Vọng trị trong các ô của bảng phân phối tần suất ≥ 5

56
CÁC BƯỚC HÌNH THÀNH
KIỂM ĐỊNH THỐNG KÊ

1. Qui định mức alpha (giá trị P)

2. Nêu giả thuyết, Ho và Ha

3. Tính toán giá trị thống kê phù hợp

4. Xác định mức ý nghĩa.

5. Nêu luật ra quyết định.

6. Nêu kết luận.


57
CÁC BƯỚC HÌNH THÀNH
KIỂM ĐỊNH THỐNG KÊ

1. Αlpha α=0.05

2. Ho: Giới tính có liên quan với tiểu đường típ 2

Ha: Không có mối liên quan giữa giới tính và tiểu


đường típ 2

3. Giá trị thống kê cần tính: Chi bình phương (χ2)

4. Mức ý nghĩa của χ2 theo bảng χ2

5. So sánh χ2 tính được và bảng χ2 58


CÁC BƯỚC TÍNH TOÁN

1. Tính độ tự do của χ2: d.f. = (r – 1)(c – 1)

Độ tự do của bảng 2x2 là d.f=(2-1)(2-1)=1

2. Tính vọng trị (Expected value)

Tính vọng trị cho các ô trong bảng dự trù


Er,c: vọng trị (tần số kì vọng)

(Sum of row r )  (Sum of column c )


Expected frequency E r ,c = .
Sample size
59
CÁC BƯỚC TÍNH TOÁN

3. Tính giá trị thống kê χ2

2
(observed - expected)
 =
2

expected

60
CÁC BƯỚC TÍNH TOÁN

3. Tính giá trị thống kê χ2

O E (0-E)2 (0-E)2
E
3487 3570 1.9
5994 5911 1.2
4678 4595 1.5
7527 7609 0.9
Χ2 =
61
KẾT LUẬN

4. χ2 = 5.47 > χ2 = 3.84 theo bảng với df=1 và


alpha=0.05

Có mối liên quan có ý nghĩa thống kê giữa giới tính và


mắc tiểu đường típ 2.

P<0.05

63
KIỂM ĐỊNH FISHER

**Khi có trên 20% ô có giá trị kì vọng nhỏ (<5), Fisher’s


exact test dùng thay thế Chi bình phương
65 KIỂM ĐỊNH
BIẾN KẾT CUỘC ĐỊNH LƯỢNG

• Kiểm định tham số


• Kiểm định phi tham số

17/03/2021
KIỂM ĐỊNH THAM SỐ
Khi các quan sát độc lập, chọn lưa kiểm định theo bảng sau:

Biến phụ Biến độc lập


thuộc Nhị giá Danh định Thứ tự Định lượng
Nhị giá Chi2/Fisher Chi2/Fisher Chi2/Fisher Hồi qui Logistic
Danh định Chi2/Fisher Chi2/Fisher Chi2/Fisher Hồi qui Logistic
Danh định
Thứ tự Chi2/Fisher Chi2/Fisher Chi2/Fisher Hồi qui Logistic
Thứ tự
Định lượng T test ANOVA Tương quan Tương quan
(phân phối Pearson/ Hồi qui Pearson/ Hồi qui
bình thường) tuyến tính/ tuyến tính
ANOVA
Định lượng Wilcoxon Kruskal Tương quan Tương quan
(phân phối Rank sum Wallis Spearman Spearman
lệch) (Mann Whitney)
17/03/2021 66
KIỂM ĐỊNH THAM SỐ
Khi các quan sát không độc lập, chọn lưa kiểm định theo
bảng sau:

Biến phụ thuộc Biến độc lập

Nhị giá Danh định Thứ tự Định lượng

Nhị giá McNemar's test McNemar's test McNemar's test GEE

Danh định McNemar's test Cochrane Q Cochrane Q GEE

Thứ tự McNemar's test Cochrane Q Cochrane Q GEE

Định lượng Paired T test Repeated- Repeated- GEE /Mixed


(phân phối bình measures measures Model
thường) ANOVA/GEE ANOVA/ GEE

Định lượng Wilcoxon Friedman test Friedman test GEE/ GLMM


(phân phối lệch) Signed rank
17/03/2021 67
PHÂN PHỐI T
Phân phối bình
thường
0.95

Phân phối t
0.95

00

−𝑡 −1.96 0 1.96 𝑡
-3-3 33

Tính chất:
● Hình chuông và tập trung tại giá trị 0(giống phân phối chuẩn)
● Biến thiên lớn hơn phân phối chuẩn
● Nếu mẫu càng tăng, phân phối t trở nên gần giống hình dạng
phân phối chuẩn
68
CÁC LOẠI KIỂM ĐỊNH T

1. Kiểm định T 1 nhóm (One sample T-test)


2. Kiểm định T không bắt cặp (Independent T-test)
a) Phương sai bằng nhau
b) Phương sai không bằng nhau
3. Kiểm định T bắt cặp (Paired T-test)

69
GIẢ ĐỊNH CỦA KIỂM ĐỊNH T

1. Thang đo biến số: biến liên tục


2. Dữ liệu được thu thập ngẫu nhiên (random
sampling)
3. Dữ liệu có phân phối bình thường (đường
cong phân phối hình chuông)
4. Phương sai đồng nhất

70
KIỂM ĐỊNH T 1 NHÓM

71
VÍ DỤ

Kiểm tra 1 loại bóng đèn có thể chiếu sáng khoảng 1000
giờ không?

1. Qui định alpha.  = .05

2. Nêu các giả thuyết.


▪ GT “không” H0:  = 1000.

▪ Đảo thuyết Ha:   1000.

3. Tính toán giá trị thống kê


72
TÍNH TOÁN GIÁ TRỊ T 1 NHÓM

800 1. Trung bình mẫu?


750 X
940 2. Độ lệch chuẩn của mẫu?
970 SD= σ 𝑋𝑖 − 𝑋ത 2

790 𝑁−1
980 SD
3. Sai số chuẩn của mẫu? SE =
820 N
760 4. Giá trị thống kê?
1000 X −
860 tX =
SX 73
TÍNH TOÁN GIÁ TRỊ T 1 NHÓM

800 1. Trung bình mẫu?


750 X = 867
940 2. Độ lệch chuẩn của mẫu?
970 SD= 96.73
790 3. Sai số chuẩn của mẫu?
980 SD 96.73
820 SE = = = 30.59
N 10
760 4. Giá trị thống kê?
1000
X −  867 − 1000
860 tX = = = −4.35 7
SX 30.59 4
XÁC ĐỊNH MỨC Ý NGHĨA

4. Mức alpha
0.05, độ tự
do N-1=9, t
theo bảng
2.262.
5. |-4.35| >
|2.262|, bác
bỏ H0.

75
NÊU KẾT LUẬN

6. Kết luận:
1. Tuổi thọ trung bình của bóng đèn?

2. Có sự khác biệt về tuổi thọ trung bình bóng đèn

so với giá trị chung? Khác biệt thế nào?

3. P value?

Lô bóng đèn được kiểm tra có tuổi thọ trung bình là


867 giờ, thấp hơn tuổi thọ qui chuẩn 1000 giờ. Sự
khác biệt này có ý nghĩa về mặt thống kê (P<0,05) 76
KIỂM ĐỊNH T KHÔNG BẮT CẶP
(T ĐỘC LẬP – INDEPENDENT T)

77
KIỂM ĐỊNH T KHÔNG BẮT CẶP

▪ 2 mẫu độc lập (Vd: nhóm điều trị - nhóm chứng)


▪ Công thức:

SD12 SD22
Sai số chuẩn gộp SEdiff = +
N1 N2

X1 − X 2
Giá trị thống kê t t X1 − X 2 =
SEdiff
78
KIỂM ĐỊNH T KHÔNG BẮT CẶP

Ví dụ:

Giả sử kiểm tra ảnh hưởng của cafeinne trên vận


động bằng cách ghi nhận thời gian giữ con trỏ di
động theo 1 điểm chuyển động.
Các đối tượng tham gia thử nghiệm được chia làm 2
nhóm:
Nhóm 1 uống chất lỏng chứa cafeinne, nhóm còn lại
dùng placebo.
Không đối tượng nào biết mình thuộc nhóm nào.

79
KIỂM ĐỊNH T KHÔNG BẮT CẶP
Experimental (Caff) Control (No Caffeine)
12 21
14 18
10 14
8 20
16 11
5 19
3 8
9 12
11 13
15
N1= , M1=, SD1= N2=, M2=, SD2= 80
KIỂM ĐỊNH T KHÔNG BẮT CẶP
Experimental (Caff) Control (No Caffeine)
12 21
14 18
10 14
8 20
16 11
5 19
3 8
9 12
11 13
15
N1=9, M1=9.778, N2=10, M2=15.1,
81
SD1=4.1164 SD2=4.2805
KIỂM ĐỊNH T KHÔNG BẮT CẶP

1. Đặt mức Alpha = .05


2. Nêu giả thuyết.
GT “không” H0: 1 = 2.
Đảo thuyết H1: 1  2.

82
KIỂM ĐỊNH T KHÔNG BẮT CẶP

3. Tính toán giá trị thống kê

2 2
SD SD
SEdiff = +
1 2
N1 N2

X1 − X 2
t=
SEdiff
83
KIỂM ĐỊNH T KHÔNG BẮT CẶP

3. Tính toán giá trị thống kê

X 1 − X 2 9.778 − 15.1 − 5.322


t= = = = −2.758
SEdiff 1.93 1.93

2 2 2 2
SD SD (4.1164) (4.2805)
SEdiff = +
1
= 2
+ = 1.93
N1 N2 9 10

84
KIỂM ĐỊNH T KHÔNG BẮT CẶP

4. Xác định giá trị tới


hạn t (bảng) tại
ngưỡng alpha =
0.05
với độ tự do
df = N1+N2-2
=10+9-2 = 17.
Giá trị t này là 2.11.
85
KIỂM ĐỊNH T KHÔNG BẮT CẶP

4. Nêu luật quyết định. Nếu |-2.758| > 2.11, bác bỏ


GT “không”.

5. Kết luận: Có sự khác biệt có ý nghĩa thống kê về


trung bình giữa 2 nhóm?.

P value?

Caffeine có ảnh hưởng đến vận động (P<0,05)

86
KIỂM ĐỊNH T BẮT CẶP
(PAIRED T TEST)

87
KIỂM ĐỊNH T BẮT CẶP

Kiểm định t bắt cặp được sử dụng khi so sánh 2 nhóm


dữ liệu có liên quan.

Ví dụ:
▪ Đo lường lặp lại (dữ liệu được thu thập ở thời điểm

T0, T1,..Ti) trên cùng 1 nhóm người

▪ Anh em, vợ chồng

▪ Tay phải, tay trái,…


88
KIỂM ĐỊNH T BẮT CẶP

Công thức:

SDD
Sai số chuẩn SEdiff =
n pairs

D
Giá trị thống kê t tXD =
SEdiff

89
KIỂM ĐỊNH T BẮT CẶP

Ví dụ:

Nghiên cứu về Painfree, 1 loại thuốc thay thế aspirin.

5 người được chọn vào nghiên cứu

Ngày đầu tiên, ½ được cho sử dụng painfree, ½ dùng


placebo. Sau đó tất cả nhúng tay vào nước đá đến khi
cảm thấy không chịu đựng được. Nhà nghiên cứu ghi
nhận thời gian này. Ngày hôm sau, các đối tượng đổi
nhóm và lặp lại thí nghiệm trên. 90
KIỂM ĐỊNH T BẮT CẶP

Người Painfree Placebo Khác biệt


(time in
sec)
1 60 55 5
2 35 20 15
3 70 60 10
4 50 45 5
5 60 60 0
M
SD 91
KIỂM ĐỊNH T BẮT CẶP

Painfree
Differenc
Person (time in Placebo
e
second)
1 60 55 5
2 35 20 15
3 70 60 10
4 50 45 5
5 60 60 0
M 55 48 7
SD 13.23 16.81 5.70 92
KIỂM ĐỊNH T BẮT CẶP

1. Mức alpha = .05


2. GT “không” H0: 1 = 2.
Đảo thuyết H1: 1  2.
3. Tính toán giá trị thống kê t:

SD D
SEdiff = t=
n pairs SEdiff

93
KIỂM ĐỊNH T BẮT CẶP

3. Tính toán giá trị thống kê t:

SD 5.70
SEdiff = = = 2.55
n pairs 5

D 55 − 48 7
t= = = = 2.75
SEdiff 2.55 2.55
94
KIỂM ĐỊNH T BẮT CẶP

4. Xác định giá trị tới


hạn t (bảng) với
alpha=0.05
Độ tự do
df =5-1=4.
Giá trị t là 2.776

95
KIỂM ĐỊNH T BẮT CẶP

5. Luật quyết định: |2.75| < 2.776, không bác bỏ GT


“không”.
6. Kết luận.

96
97 KIỂM ĐỊNH ANOVA

17/03/2021
ANOVA
(ANALYSIS OF VARIANCE)
Ý tưởng:
Kiểm định sự khác biệt giữa
các trung bình của 2 nhóm trở lên
đối với những biến số định lượng
có phân phối bình thường.

❖Là sự mở rộng của t-test( ANOVA trên 2 nhóm có kết


quả tính toán tương tự t-test).

98
PHÂN TÍCH PHƯƠNG SAI MỘT CHIỀU
ONE-WAY ANOVA
Các giả định của kiểm định ANOVA
1. Số liệu có phân phối bình thường

2. Phương sai bằng nhau giữa các nhóm

3. Các nhóm so sánh độc lập

99
GIẢ THUYẾT CỦA ONE-WAY ANOVA

H0 : μ1 = μ 2 = μ 3 = 
H a : Trung bình các nhóm khác nhau

100
KIỂM ĐỊNH ANOVA

▪ Giá trị thống kê F

▪ Có 2 độ tự do (df degree of freedom):

✓Độ tự do nội bộ nhóm (df within-group)

✓Độ tự do giữa các nhóm (df between groups)

▪ Kí hiệu: F(df between, df within)

101
CÁC BƯỚC TÍNH TOÁN F

Kí hiệu:

N: số đối tượng trong mẫu nghiên cứu

k: số nhóm

j: số thứ tự nhóm

df: độ tự do

102
CÁC BƯỚC TÍNH TOÁN F
Bước 1:Tổng bình phương nội bộ nhóm SSw
Within-group sum of square SSw: df = N – k

SS w =  ( N j − 1) s j
2

Bước 2:Tổng bình phương giữa các nhóm SSb


Between-group sum of square SSb: df = k - 1

SSb =  N j ( X j − X ) 2

j
103
CÁC BƯỚC TÍNH TOÁN F

Bước 3: Tổng bình phương toàn bộ SS


Total sum of square _ SS: df = N-1

SS = SSw + SSb

104
CÁC BƯỚC TÍNH TOÁN F

Bước 4: Trung bình bình phương nội bộ nhóm


Within_group mean squares_MSw

SSW
MSW =
N −k
Bước 5: Trung bình bình phương giữa các nhóm
Between_group mean squares_MSb

SSb
MSb =
k −1 105
CÁC BƯỚC TÍNH TOÁN F

Bước 6: Tính giá trị thống kê F

MSb
F=
MSW
ĐộĐộtự
tự do của F
do của F

F(k-1, N-k)

Ha: Trung bình giữa các nhóm khác nhau, MSb > MSw
106
PHÂN PHỐI CỦA F
Là phân phối xác suất liên tục dựa vào 2 tham số k-1 và N-k

Kiểm định dựa trên phân phối F > 1

107
PHÂN PHỐI CỦA F
▪ Tỷ số phương sai theo phân phối F:

 2
between
~ Fn ,m
 2
within

⚫Kiểm định F kiểm tra giả thuyết 2 phương sai bằng nhau.
⚫F gần bằng 1 nếu phương sai giữa các nhóm bằng nhau.

H 0 :  between
2
=  within
2

H a :  between
2
  within
2
108
VÍ DỤ

Phân ngẫu nhiên 33 đối tượng vào 3 nhóm: bổ sung


800 mg calcium vs. 1500 mg calcium vs. placebo.

So sánh mật độ xương sống của cả 3 nhóm sau 1 năm.

109
Mật độ xương theo điều trị
1.2

1.1

Within group
Between variability
1.0
S
group
P variation
I
N Within group
E
Within group variability
0.9
variability

0.8

0.7
PLACEBO 800mg CALCIUM 1500 mg CALCIUM 110
VÍ DỤ

▪ Nhóm Placebo (n=11):


▪ Mean spine BMD = .92 g/cm2
▪ standard deviation = .10 g/cm2

▪ Nhóm bổ sung 800 mg calcium (n=11)


▪ Mean spine BMD = .94 g/cm2
▪ standard deviation = .08 g/cm2

▪ Nhóm bổ sung 1500 mg calcium (n=11)


▪ Mean spine BMD =1.06 g/cm2
▪ standard deviation = .11 g/cm2

111
Cỡ mẫu
Dao động giữa Hiệu số giữa
các nhóm trung bình từng
nhóm và trung
KIỂM ĐỊNH F bình chung

(.92 − .97) 2
+ (.94 − .97) 2
+ (1.06 − .97) 2
2
sMS B
between = nsx = 11* (
2
) = .063
3 −1

2
sMS = avg s 2
= 1 (.102
+ .082
+ .112
) = .0095
within
W
3
2MS
sbetweenB
.063
F2,30 = 2 = = 6.6
swithin
MS W .0095
F lớn cho thấy
Dao động trung MSb>MSw
bình nội bộ nhóm Phương sai của từng
nhóm.
112
BẢNG F

▪ Tra bảng F trong sách giáo khoa với ngưỡng α=0.05.

▪ Nếu F>F ngưỡng trong bảng, kết luận rằng có sự

khác biệt có ý nghĩa thống kê giữa các trung bình với


P < 0.05.

▪ Theo bảng, F(2,30)=3.32 < F = 6.6

113
BẢNG F

Theo bảng, F(2,30)=3.32 < F = 6.6 17/03/2021 114


KẾT QUẢ
Kết luận:

1. Mật độ xương trung bình của 3 nhóm lần lượt là


0,92, 0,94 và 1,06.

2. Khác biệt này có ý nghĩa thống kê

3. P<0.05

Lưu ý: Kết quả ở bước phân tích này không cho biết sự
khác biệt cụ thể giữa các cặp so sánh

115
BẢNG ANOVA

Nguồn MS
SS
biến thiên d.f. F p-value
Go to
Giữa k-1 SSb MSb
các MSb Fk-1,N-k
nhóm F=
MSW
Nội bộ N-k SSw MSw
nhóm

Tổng N-1 SS
cộng SS=SSb + SSw 116
ANOVA TÓM TẮT

▪ 1 phép kiểm ANOVA có ý nghĩa thống kê chỉ cho biết

có ít nhất 2 trung bình khác nhau, nhưng không biết


cụ thể những nhóm nào.

▪ Để xác định cụ thể những nhóm nào khác nhau, cần 1

số phân tích sâu hơn để hiệu chỉnh vấn đề so sánh đa


nhóm.

117
KIỂM ĐỊNH PHI THAM SỐ
Khi các quan sát độc lập, chọn lưa kiểm định theo bảng sau:

Biến phụ Biến độc lập


thuộc Nhị giá Danh định Thứ tự Định lượng
Nhị giá Chi2/Fisher Chi2/Fisher Chi2/Fisher Hồi qui Logistic
Danh định Chi2/Fisher Chi2/Fisher Chi2/Fisher Hồi qui Logistic
Danh định
Thứ tự Chi2/Fisher Chi2/Fisher Chi2/Fisher Hồi qui Logistic
Thứ tự
Định lượng T test ANOVA Tương quan Tương quan
(phân phối Pearson/ Hồi qui Pearson/ Hồi qui
bình thường) tuyến tính/ tuyến tính
ANOVA
Định lượng Wilcoxon Kruskal Tương quan Tương quan
(phân phối Rank sum Wallis Spearman Spearman
lệch) (Mann Whitney)
17/03/2021 118
KIỂM ĐỊNH PHI THAM SỐ
Khi các quan sát không độc lập (có liên quan), chọn lưa kiểm
định theo bảng sau:
Biến phụ thuộc Biến độc lập

Nhị giá Danh định Thứ tự Định lượng

Nhị giá McNemar's test McNemar's test McNemar's test GEE

Danh định McNemar's test Cochrane Q Cochrane Q GEE

Thứ tự McNemar's test Cochrane Q Cochrane Q GEE

Định lượng Paired T test Repeated- Repeated- GEE /Mixed


(phân phối bình measures measures Model
thường) ANOVA/GEE ANOVA/ GEE

Định lượng Wilcoxon Friedman test Friedman test GEE/ GLMM


(phân phối lệch) Signed rank

17/03/2021 119
PHÂN BIỆT
THAM SỐ VÀ PHI THAM SỐ
❖ Dữ liệu thường phân phối theo 1 dạng nhất định.
✓ Phân phối bình thường
✓ Phân phối nhị thức
✓ Phân phối Poisson
✓ ……
❖ Các phép kiểm dựa trên các phân phối này
❖ Kiểm định tham số cần có một số giả định

3/17/2021 120
PHÂN BIỆT
THAM SỐ VÀ PHI THAM SỐ
Các phương pháp tham số đã học
❖ Kiểm định t
❖ Kiểm định ANOVA
❖ Hệ số tương quan Pearson
❖ Hồi qui tuyến tính
Giả định chung của các phương pháp này
✓ Số liệu có phân phối bình thường (tùy vào độ lớn cỡ
mẫu)
✓ Phương sai giữa các nhóm so sánh bằng nhau
3/17/2021 121
PHƯƠNG PHÁP PHI THAM SỐ
(NON-PARAMETRIC METHODS)

Kĩ thuật thống kê
❖Không cần các giả thuyết về tính phân phối bình

thường của số liệu.


❖Kết quả đúng khi số liệu phân phối bình thường và

phân phối không bình thường

3/17/2021 122
PHƯƠNG PHÁP PHI THAM SỐ
(NON-PARAMETRIC METHODS)

❖ Hữu dụng khi:

▪ Trong một nhóm số liệu nhỏ mà không thể sửa

chữa bằng phép biến đổi thích hợp.


▪ Khi không cần kiểm tra tính bình thường

❖ Khuyết điểm

▪ Khó tính được khoảng tin cậy

▪ Không thể mở rộng sang đa biến


3/17/2021 123
KIỂM ĐỊNH PHI THAM SỐ THAY THẾ
KIỂM ĐỊNH THAM SỐ

KIỂM ĐỊNH THAM SỐ PHI THAM SỐ


Tương quan Pearson Spearman
Mẫu bắt cặp Paired T test Wilcoxon Signed-
rank test
2 mẫu độc lập Independent Wilcoxon rank
samples T test sum test
≥ 3 mẫu độc lập Oneway ANOVA Kruskal-Wallis
3/17/2021 124
WILCOXON SIGNED-RANK TEST

▪ Kiểm định sắp hạng có dấu

▪ Kiểm định phi tham số tương đương với kiểm định T

bắt cặp

▪ Không dùng số liệu thật

▪ Sử dụng dấu và hạng để so sánh mẫu bắt cặp

3/17/2021 125
Số giờ ngủ
Bệnh nhân thuốc placebo hiệu số hạng (bỏ qua dấu)
1 6,1 5,2 0,9 3,5*
2 7,0 7,9 -0,9 3,5*
3 8,2 3,9 4,3 10
4 7,6 4,7 2,9 7
5 6,5 5,3 1,2 5
6 8,4 5,5 3,0 8
7 6,9 4,2 2,7 6
8 6,7 6,1 0,6 2
9 7,4 3,8 3,6 9
10 5,8 6,3 -0,5 1

3/17/2021 126
WILCOXON SIGNED-RANK TEST

1. Loại bỏ mọi hiệu số bằng zero. Sắp xếp các hiệu số


còn lại theo thứ tự tăng dần
Số giờ ngủ
Bệnh nhân thuốc placebo hiệu số hạng (bỏ qua dấu)
1 6,1 5,2 0,9 3,5*
2 7,0 7,9 -0,9 3,5*
3 8,2 3,9 4,3 10
4 7,6 4,7 2,9 7
5 6,5 5,3 1,2 5
6 8,4 5,5 3,0 8
7 6,9 4,2 2,7 6
8 6,7 6,1 0,6 2
9 7,4 3,8 3,6 9
10 5,8 6,3 -0,5 1
3/17/2021 127
WILCOXON SIGNED-RANK TEST

2. Cộng các hạng có hiệu số dương (T+)


T + = 3,5 + 10 + 7 + 5 + 8 + 6+ 2 + 9 = 50,5
Cộng các hạng theo hiệu số âm (T-)
T - = 3,5 + 1 = 4,5
Số giờ ngủ
Bệnh nhân thuốc placebo hiệu số hạng (bỏ qua dấu)
1 6,1 5,2 0,9 3,5*
2 7,0 7,9 -0,9 3,5*
3 8,2 3,9 4,3 10
4 7,6 4,7 2,9 7
5 6,5 5,3 1,2 5
6 8,4 5,5 3,0 8
7 6,9 4,2 2,7 6
8 6,7 6,1 0,6 2
9 7,4 3,8 3,6 9
3/17/2021 128
10 5,8 6,3 -0,5 1
WILCOXON SIGNED RANK TEST

3. Nếu không có sự khác biệt hiệu quả giữa thuốc ngủ


và placebo thì tổng T+ và T- phải bằng nhau. Nếu có
sự khác biệt thì một tổng sẽ lớn hơn và tổng kia sẽ
nhỏ hơn. Kí hiệu tổng nhỏ hơn là T

T = số nhỏ hơn của T+ và T-

Trong thí dụ này T = 4,5

4. Kiểm định sắp hạng có dấu Wilcoxon dựa trên việc


đánh giá T, số nhỏ hơn
3/17/2021 129
N = 10; P = 0.05;
T tới hạn = 8
T = 4.5
Vậy T < T tới hạn

Kết luận:
Thời gian ngủ giữa nhóm dùng
thuốc và không dùng thuốc khác
biệt có ý nghĩa thống kê với P <
0,05
3/17/2021 130
WILCOXON RANK SUM TEST
Không hút thuốc Hút thuốc lá nặng
Trọng lượng lúc sinh Hạng Trọng lượng lúc sinh Hạng
3,99 27 3,18 7
3,79 24 2,84 5
3,60* 18 2,90 6
3,73 22 3,27 11
3,21 8 3,85 26
3,60* 18 3,52 14
4,08 28 3,23 9
3,61 20 2,76 4
3,83 25 3,60* 18
3,31 12 3,75 23
4,13 29 3,59 16
3,26 10 3,63 21
3,54 15 2,38 2
3,51 13 2,34 1
2,71 3
Tổng số = 272 Tổng số = 163

3/17/2021 131
WILCOXON RANK SUM TEST
1. Sắp hạng các quan sát trong cả hai nhóm theo thứ tự độ lớn như
trong bảng. Nếu có các giá trị nào bằng nhau thì lấy trung bình của
chúng
Không hút thuốc Hút thuốc lá nặng
Trọng lượng lúc sinh Hạng Trọng lượng lúc sinh Hạng
3,99 27 3,18 7
3,79 24 2,84 5
3,60* 18 2,90 6
3,73 22 3,27 11
3,21 8 3,85 26
3,60* 18 3,52 14
4,08 28 3,23 9
3,61 20 2,76 4
3,83 25 3,60* 18
3,31 12 3,75 23
4,13 29 3,59 16
3,26 10 3,63 21
3,54 15 2,38 2
3,51 13 2,34 1
2,71 3 3/17/2021 132
Tổng số = 272 Tổng số = 163
WILCOXON RANK SUM TEST

2. Cộng các hạng trong nhóm có cỡ mẫu nhỏ.

Trong trường hợp này chính là nhóm người hút thuốc


lá và tổng sắp hạng là 163.

Nếu hai nhóm có cỡ mẫu bằng nhau thì lấy nhóm nào
cũng được.

T = Tổng các hạng của nhóm có cỡ mẫu nhỏ

3/17/2021 133
WILCOXON RANK SUM TEST

3. So sánh tổng số này với giá trị quyết định trong bảng
được sắp đặt hơi khác

3/17/2021 134
N1 = 15; N2 = 14; P=0,05
Khoảng giá trị tương ứng của T 164 - 256 3/17/2021 135

T =163
PHÉP KIỂM KRUSKAL WALLIS

▪ So sánh thứ hạng của biến định lượng giữa k nhóm (k

≥3)

▪ Biến số không phân phối bình thường giữa các nhóm

▪ Không quan tâm đến độ lớn của sự khác biệt

3/17/2021 136
PHÉP KIỂM KRUSKAL WALLIS

▪ Thang đo:

✓Biến phụ thuộc: biến định lượng có phân phối không

bình thường

✓Biến độc lập: biến danh định

▪ Không đòi hỏi giả định như phép kiểm tham số

3/17/2021 137
PHÉP KIỂM KRUSKAL WALLIS

Nguyên tắc

1. Mẫu: n1, n2,…,nk, với k là số nhóm so sánh

2. Xếp chung tất cả quan sát thành 1 chuỗi duy nhất

3. Xếp hạng các quan sát

3/17/2021 138
PHÉP KIỂM KRUSKAL WALLIS

4. Tính trung bình hạng của các giá trị từ k mẫu

5. Xác định giá trị K, độ tự do k-1

6. Tra bảng Chi bình phương


3/17/2021 139
PHÉP KIỂM KRUSKAL WALLIS

3/17/2021 140
PHÉP KIỂM KRUSKAL WALLIS

3/17/2021 141
TÀI LIỆU THAM KHẢO

▪ Sách:
1. ARMITAGE, P., BERRY, G. & MATTHEWS, J. N. S. 2008.
Statistical Methods in Medical Research, Chichester:, John
Wiley & Sons, Ltd
2. Ðỗ Văn Dũng. Xác suất và sinh thống kê căn bản. TP Hồ Chí
Minh, Khoa Y tế công cộng, Trường Ðại học Y Dược, 2001
▪ Web:
https://www.graphpad.com/support/faqid/1790/

17/03/2021 142
NỘI DUNG

1 • Khái niệm kiểm định giả thuyết

2 • Khái niệm P value

3 • Sai lầm và năng lực thống kê

4 • Kiểm định biến định tính

5 • Kiểm định biến định lượng

17/03/2021 143

You might also like