Download as pdf or txt
Download as pdf or txt
You are on page 1of 42

Đ IH CYD C TP.

H CHÍ MINH – KHOA Y T CÔNG C NG

KI M Đ NH CHI BÌNH PH NG

Môn h c: Th ng kê y h c

Huỳnh Ng c Vân Anh

B môn Th ng kê y h c và Tin h c
M C TIÊU

Sau khi h c xong, h c viên có khả năng:


1. Tính đ c các giá tr nh đ tự do, v ng tr , chi
bình ph ơng.
2. ng dụng đ c các kiểm đ nh Chi bình
ph ơng, Fisher trong nghiên c u khoa h c.
3

ÔN T P
Biến độc l p
Biến Nh giá Danh đ nh Thứ tự - Đ nh l ng
ph thuộc
Đa biến
Đ nh l ng T ơng quan Pearson
có phân phối T-test ANOVA
bình th ờng H i quy tuy n tính
Đ nh l ng
phân phối Mann- Kruskal-
T ơng quan Spearman
KHÔNG bình Whitney Wallis
th ờng

Chi bình Chi bình H i quy Logistic


Nh giá
ph ơng ph ơng H i quy Poisson
3
4

ÔN T P

Bước 1 Xây dựng giả thuyết Ho


Các
b ớc Bước 2 Chọn kiểm định phù hợp
xây
Tính giá trị thống kê χ 2 của số
dựng Bước 3
liệu thu thập được
1
Tính xác suất của thống kê χ2 –
ki m Bước 4
gọi là giá trị p
đ nh
Bước 5 Kết luận chấp nhận Ho hay
bác bỏ Ho
4
1. KI M Đ NH CHI BÌNH PH NG

(χ2)
6
1. Ki m đ nh χ2:
Công d ng của ki m đ nh χ2:
- Kiểm đ nh sự liên quan giữa các bi n s hàng và
bi n s c t.
- Sự phân ph i c a các cá nhân c a m t bi n s
này có phụ thu c vào sự phân ph i c a bi n kia
hay không.
- Bảng có hai hàng và hai c t (2 x 2) Æ g i là so
sánh hai tỷ lệ.
- Bảng có nhiều hàng và nhiều c t (n x m) Æ g i
là so sánh nhiều tỷ lệ.
7
1. Ki m đ nh χ2:

Có 240 ng ời đ c tiêm vacxin phòng bệnh cúm


và 220 ng ời không đ c tiêm vacxin. Trong
nhóm tiêm vacxin có 20 ng ời b cúm và trong
nhóm không đ c tiêm vacxin có 80 ng ời b
cúm. Hãy so sánh tỷ lệ mắc cúm giữa 2 nhóm?
Có sự khác biệt về tỷ lệ mắc cúm giữa nhóm tiêm
so với nhóm không đ c tiêm vacxin hay không?
Có m i liên quan giữa việc tiêm ngừa với bệnh
cúm hay không?
8
1. Ki m đ nh χ2:
B ớc 1: Đặt gi thuyết Ho
- Tỷ lệ mắc cúm ở nhóm có tiêm vacxine và nhóm
tiêm placebo là nh nhau
- Không có sự khác biệt về tỷ lệ mắc bệnh cúm
giữa nhóm tiêm vacxin so với nhóm không tiêm
vacxin
9
1. Ki m đ nh χ2:
B ớc 2: Ch n lựa ki m đ nh phù h p
Kiểm đ nh phù h p là kiểm đ nh χ2 với đ tự do
df = (h – 1)(c – 1) = (2 – 1)(2 – 1) = 1
B ớc 3: Tính giá tr thống kê
Lập bảng phân ph i tần suất
Bệnh cúm
Đặc tính
Có Không Tổng
a b
Có 20 220 240
Tiêm c d
Không 80 140 220
vacxin
Tổng 100 360 460
10
1. Ki m đ nh χ2:
B ớc 3: Tính giá tr thống kê
Toång cuûa coät × Toång cuûa haøng
Tính v ng tr : E=
Toång soá chung
Ea= (100 x 240) / 460 = 52,2
Eb= (360 x 240) / 460 = 187,8
Ec= (100 x 220) / 460 = 47,8
Ed= (360 x 220) / 460 = 172,2
Bệnh cúm
Đặc tính
Có Không Tổng
a b
Có 20 220 240
Tiêm c d
Không 80 140 220
vacxin
Tổng 100 360 460
11
1. Ki m đ nh χ2:
B ớc 3: Tính giá tr thống kê
Tính χ2 :
(O − E)
χ =Σ , d. f . = 1 ñoätöï do vôùi baûng2 x 2
2
2

E
Trong đó:
O: S quan sát
E: V ng tr Bệnh cúm
Đặc tính
Có Không Tổng
52,2 187,8
Có 20 220 240
Tiêm 47,8 172,2
Không 80 140 220
vacxin
Tổng 100 360 460
12
1. Ki m đ nh χ2:
B ớc 3: Tính giá tr thống kê
Tính χ2 :
− − − −
χ2 = + + +
2 2 2 2
( 20 52,2) (80 47,8) ( 220 187,8) (140 172,2)
52,2 47,8 187,8 172,2
= 19,86 + 21,69 + 5,52 + 6,02
= 53,09
Bệnh cúm
Đặc tính
Có Không Tổng
52,2 187,8
Có 20 220 240
Tiêm 47,8 172,2
Không 80 140 220
vacxin
Tổng 100 360 460
13
1. Ki m đ nh χ2:
B ớc 3: Tính giá tr thống kê
Tính χ2 :

N × ( ad − bc ) 460× (20 ×140 − 220× 80) 2


χ = = = 53,09
2

100× 360× 240× 220


2

h1h2 c1c 2

Bệnh cúm
Đặc tính
Có Không Tổng
a b h1
Có 20 220 240
Tiêm c d h2
Không 80 140 220
vacxin
c1 c2
Tổng 100 360 460 N
14
1. Ki m đ nh χ2:
B ớc 4: Tính xác su t của thống kê

Ta có χ2 = 53,09 > 10,83 p<0,001


Giá trị
P
d.f. 0.5 0.25 0.1 0.05 0.025 0.01 0.005 0.001

1 0.45 1.32 2.71 3.84 5.02 6.63 7.88 10.83

2 1.39 2.77 4.61 5.99 7.38 9.21 10.60 13.82

3 2.37 4.11 6.25 7.81 9.35 11.34 12.84 16.27

4 3.36 5.39 7.78 9.49 11.14 13.28 14.86 18.47

5 4.35 6.63 9.24 11.07 12.83 15.09 16.75 20.51


15
1. Ki m đ nh χ2:
B ớc 5: Kết lu n

Do p< 0,001 BÁC B giả thuy t Ho


-Có sự khác biệt về tỷ lệ mắc bệnh cúm ở nhóm
có tiêm vacxin so với nhóm không tiêm vacxin

-Những ng ời tiêm vacxin có tỷ lệ mắc cúm thấp


hơn so với những ng ời không đ c tiêm vacxin
16
1. Ki m đ nh χ2:
Tính h p lệ của ki m đ nh:
- Kiểm đ nh χ2 s h p lệ n u có ít hơn 20% s
các giá tr v ng tr <5 và KHÔNG CÓ giá tr v ng
tr nào <1. (Cochran - 1954)
-V ng tr nhỏ Æ kiểm đ nh chính xác theo Fisher
(Fisher‘s exact)
17
1. Ki m đ nh χ2:

p1 = p2 = ... = pn
Tóm lại:
- Giả thuy t Ho:
Toång cuûa coät × Toång cuûa haøng
- V ng tr : E =
Toångsoá chung

- Giá tr χ2 : χ 2 = Σ
2
(O E )
E
- Cách tính nhanh χ2 (chỉ áp dụng cho bảng 2 x 2)
× −
χ2 =
2
N ( ad bc )
h1h2 c1c 2
- Đ tự do: df = (r – 1)(c – 1)
2. KI M Đ NH FISHER
19
2. Ki m đ nh Fisher:
- Thay th kiểm đ nh chi bình ph ơng khi có >20%
các ô có v ng tr <5 hoặc có ô v ng tr <1
Quy trình tiến hành:
1. Sắp x p l i bảng sao s liệu có tổng hàng nhỏ
hơn nằm trên a b a+b
c d c+d
a+c b+d N

5 30 35 2 23 25
2 23 25 5 30 35
7 53 60 7 53 60
20
2. Ki m đ nh Fisher:
Quy trình tiến hành:

2. Bắt đầu liệt kê bảng đầu tiên có ô (1,1) = 0; (1,2)


= a + b; (2,1) = a + c; (2,2) =(c + d) – (a + c)

0 25
7 28

3. Bảng k ti p s tăng ô (1,1) lên 1 đơn v ; giảm ô


(1,2) và (2,1) đi 1 và tăng (2,2) lên 1
1 24
6 29
21
2. Ki m đ nh Fisher:
Quy trình tiến hành:
4. Ti p tục cho đ n khi nào có 1 ô có giá tr là 0 thì dừng

0 25 1 24 2 23 3 22
7 28 6 29 5 30 4 31

4 21 5 20 6 19 7 18
3 32 2 33 1 34 0 35
22
2. Ki m đ nh Fisher:
Quy trình tiến hành:
5. Tính xác suất cho m i bảng:

0 25 1 24 2 23 3 22
7 28 6 29 5 30 4 31
p = 0,018 p = 0,105 p = 0,252 p = 0,312

4 21 5 20 6 19 7 18
3 32 2 33 1 34 0 35
p = 0,214 p = 0,082 p = 0,016 p = 0,001

( a + b)!(c + d )!( a + c )!(b + d )!


a!b!c! d ! n!
23
2. Ki m đ nh Fisher:
Quy trình tiến hành:
6. Giá tr p c a kiểm đ nh Fisher (1 đuôi) là giá tr nhỏ
nhất trong 3 tr ờng h p:
0 25 1 24 2 23 3 22
7 28 6 29 5 30 4 31
p = 0,018 p = 0,105 p = 0,252 p = 0,312

4 21 5 20 6 19 7 18
3 32 2 33 1 34 0 35
p = 0,214 p = 0,082 p = 0,016 p = 0,001
• p(0) + p(1) + … + p(a) = 0,018 + 0,105 + 0,252
= 0,375
• p(a) + p(a+1) + … + p(k) = 0,252 + 0,312
+ 0,214 + 0,082 + 0,016 + 0,001 = 0,877
• 0,5 p = 0,375
24
2. Ki m đ nh Fisher:
Quy trình tiến hành:
6. Giá tr p c a kiểm đ nh Fisher (2 đuôi) là là tổng giá tr
nhỏ hơn giá tr p c a bảng ban đầu:
0 25 1 24 2 23 3 22
7 28 6 29 5 30 4 31
p = 0,018 p = 0,105 p = 0,252 p = 0,312

4 21 5 20 6 19 7 18
3 32 2 33 1 34 0 35
p = 0,214 p = 0,082 p = 0,016 p = 0,001
• Giá tr p c a bảng ban đầu = 0,252

• pFisher = 0,018 + 0,105 + 0,252 + 0,214 + 0,082


+ 0,016 + 0,001 = 0,688
p = 0,688
BÀI T P
26
Bài t p 1:
ng dụng ph ơng pháp điều tr A cho 20 đ i
t ng có 6 ng ời khỏi bệnh và điều tr B cho 20
ng ời có 13 ng ời khỏi bệnh. Sử dụng kiểm
đ nh chi bình ph ơng, chúng ta có thể k t luận

Điều tr A cho tỷ lệ Điều tr A tỷ lệ điều


A khỏi bệnh t t hơn B tr khỏi t ơng
điều tr B 1,76 lần đ ơng điều tr B

C Điều tr B có hiệu Điều tr A cho tỷ lệ


quả t t hơn điều tr A D điều tr khỏi cao hơn
điều tr B
27
Bài t p 1:
tabi 6 14 \ 13 7, exp chi
28
Bài t p 2:
M t khảo sát nhằm nghiên c u sự liên quan c a
tình tr ng kinh t xã h i và bệnh tiêu chảy ở trẻ
em. Nhà nghiên c u ch n ngẫu nhiên 2 nhóm trẻ:
40 trẻ ở gia đình khá giả và 50 trẻ từ các gia đình
nghèo. K t quả sau 3 tháng quan sát có 10 trẻ
trong gia đình khá giả b tiêu chảy và trong gia
đình nghèo có 30 trẻ b tiêu chảy.
Vậy, có liên quan giữa tình tr ng kinh t xã h i và
bệnh tiêu chảy ở trẻ em hay không?
29
Bài t p 2:
tabi 10 30 \ 30 20, exp chi
30
Bài t p 3:
M t cu c điều tra việc sử dụng mùng đ c ti n hành
trong m t mẫu ngẫu nhiên g m các đ a trẻ <7 tuổi ở
khu vực Tây Nguyên. Điều tra ghi nhận dân t c c a
đ a trẻ th ờng ng mùng có tẩm permethrin, mùng
không tẩm permethrin hay không ng mùng, k t quả
nh bảng d ới. Hỏi việc tẩm mùng có liên quan đ n
dân t c hay không? Tẩm mùng
Không Mùng Mùng tẩm
mùng không tẩm permethrin
Êđê 3 88 165
Dân tộc K’Ho 43 73 76
Stiêng 29 16 26
31
Bài t p 3:
tabi 3 88 165 \ 43 73 76 \ 29 16 26, exp chi
32
Bài t p 4:

Để so sánh phản ng c a 2 lo i vacxin X và Y,


ng ời ta tiêm cho 348 trẻ đ c chia làm 2 nhóm
nh bảng sau:
Nhẹ TB Loét Áp xe
Vacxin X 12 156 8 1
Vacxin Y 29 135 6 1
H i: tác d ng của 2 loại vacxin có
nh nhau?
33
Bài t p 3:
tabi 12 156 8 1 \ 29 135 6 1, exp chi exact
34
Bài t p 5:
Mở tập tin ivf_v2.dta. Đây là m t nghiên c u
nhằm tìm các y u t có liên quan đ n tình tr ng
sinh non.
Hãy cho bi t có m i liên quan giữa tình tr ng
sinh non c a trẻ với giới tính hay không?
35
Bài t p 5:
Đ ờng d n trong Stata:
1
2
3

4
36
Bài t p 5:
Đ ờng d n trong Stata:

Biến cột
Biến hàng Kiểm
5 định Chi 6
10 bình
11 phương 7 % theo cột
Kiểm định 8 % theo hàng
Fisher
9 Vọng trị

12
37
Bài t p 5:
tab sinhnon gioi, co ro exp chi

Vì p = 0,773
Æ CH P NH N Ho
Æ Không có sự
khác biệt về tỷ lệ
sinh non giữa trẻ
trai và trẻ gái.
Hay không có m i
liên quan giữa sinh
non và giới tính.
38
Bài t p 6:
Mở tập tin ivf_v2.dta. Hãy cho bi t có m i liên
quan giữa tình tr ng sinh non c a trẻ với tình
tr ng tăng huy t áp c a mẹ hay không?
39
Bài t p 6:
Đ ờng d n trong Stata:
1
2
3

4
40
Bài t p 6:
Đ ờng d n trong Stata:

Biến cột
Biến hàng Kiểm
5 định Chi 6
10 bình
11 phương 7 % theo cột
Kiểm định 8 % theo hàng
Fisher
9 Vọng trị

12
41
Bài t p 5:
tab sinhnon tang_ha, co ro exp chi
Vì p < 0,001
Æ BÁC B Ho
Æ Có sự khác biệt
về tỷ lệ trẻ
sinh non giữa
những bà mẹ có so
với không có tăng
huy t áp.
Hay có m i liên
quan giữa sinh non
và tăng huy t áp
c a mẹ.
42
Tóm tắt câu lệnh trong Stata:
Ki m đ nh chi bình ph ng, Fisher:
Ch a có biến số: tabi a b \ c d, co ro exp chi exact
Có biến số:
tab bi nhàng bi nc t, co ro exp chi exact
tab sinhnon gioi, co ro exp chi exact
co: % theo c t
ro: % theo hàng
exp: v ng tr
chi: Kiểm đ nh Chi bình ph ơng
exact: Kiểm đ nh Fisher

You might also like