臨床研究常用統計分析 - -卡方檢定與平均數檢定

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 61

內科部研究能力課程(三)

類別變數之統計檢定與
無母數檢定
何宗翰(Chung-Han Ho) Ph.D.
Department of Medical Research
Chi Mei Medical Center
資料屬性

大樣本/
小樣本

資料屬性

連續變數/ 常態/
類別變數 非常態
類別資料

• 資料按名義或順序尺度分類計算人數或個數。例
如:性別,教育,職業……。

• 次數分配表:單一變項 x
L1  H 1
f
f1

 

f2

L4  H 4 f4

 y
1 2  c 計
x 
1 O11 O12 O1c n1.

• 列聯表:二個變項以上  2

Or1 Or 2 Orc nr .
r
計 n 1 n2  nr n

3
範例:次數分配表
• 次數(frequency)與百分比(percent)
− 呈現研究樣本基本特性的分佈資訊,例如:性別、教育
程度

蔡仁貞,心臟病患對心臟復健工作的認知與實施需求之探討,新臺北護理期刊, 1999/08/01, Vol. 1(1), p59-67


列聯表分析(contingency table analysis)

• 列聯表分析主要是探討類別變數之間的關聯分佈,
並以表格型式顯示,但類別變數的值(種類、形式)
的數目必須是有限的。
• 列聯表分析可搭配卡方檢定以檢定變數間的獨立
性,此外也提供一些統計量以度量變數間的關聯
(measure of association)。
變數二
b1 b2 … bn
a1
變數一 a2 …

an
例:戴安全帽是否有效
卡方檢定(CHI-SQUARE TEST)
卡方檢定

• 以r 表示列數、c 表示行數的表格為例
rc
(Oi  Ei ) 2
 
2

i 1 Ei rc 為所有細格的總個數
O為觀察值;E是期待值
• 上式總和之機率分佈近似具有(r -1)(c -1)自由度的卡方分佈
• 因此2X2表格有(2-1)(2-1)=1的自由度,而3X4的表格有(3-
1)(4-1)=6的自由度

8
自由度

• 統計學上的自由度(英語:degree of freedom,
df),是指當以樣本的統計量來估計母體的參數
時,樣本中獨立或能自由變化的數據的個數,稱
為該統計量的自由度。
--維基百科
卡方檢定
• 假設檢定:
H0: A 變項與 B 變項之間沒有關聯性
H1: A 變項與 B 變項之間具有關聯性

• 判定標準:
χ2 >χ2 (r-1)(c-1),α 拒絕H0 P ≤ 0.05

χ2 <= χ2 (r-1)(c-1),α 接受H0 P > 0.05

• 檢定程序:
− 檢定每一細格之期望值是否過小(n < 5)
− 檢定A變項與B變項之間是否具有關聯性 ?

10
卡方分布

• 為確保機率分佈的有效性,在任一細格中的期望
次數均不能小於1,且各細格中期望次數小於5的
細格總數不能超過20%

11
費氏精確檢定
(Fisher’s Exact Test)
費氏精確檢定法(Fisher’s Exact Test)

• 對列聯表進行關聯性檢定時,其方格內(如下表之
A、B、C、D)樣本大小n < 5,費氏精確檢定法比
較精準,其資料形式如下:

樣品1 樣品2 總和
---------------------------------------
變數1 A B A+B
變數2 C D C+D
----------------------------------------
總和 A+C B+D N

13
費氏精確檢定法(Fisher’s Exact Test)

• 假設檢定:
H0:兩族群分布相同
H1:兩族群分布不同
• 費氏精確機率公式

 AC  B  D 
 A  B  ( A  B)!(C  D)!( A  C )!( B  D)!
P    
 N  N ! A! B !C ! D !
 A B 
 

14
SPSS 操作範例:
卡方檢定與Fisher’s exact test
Example: Lung Cancer Study
• N=94
• Case-control:
1:Case; 2: Control
• Gender:
1:Male; 2: Female
• Smoke:
0: Non-smoker;
1: Smoker;
2: Ever smoker
• DM:
0:No; 1:Yes
• CAD:
0:No; 1:Yes
卡方檢定:分析敘述統計交叉表
Step1:點選變數 Step2:精確性檢定
Step3:選取卡方分配
Step4:點選百分比
報表解讀

• 在所有94位病人中,
有DM的15人佔全部人
數的16%。而48位有
CANCER人中,其中
4.3%的人有DM少於
46位non-cancer患者
的11.7%。
當Fisher’s exact test,
p-value=0.05,因此
DM與是否得到肺癌並
沒有顯著差異。
交叉分析的重點

• 交叉分析表的每個方格中可有次數、期望次數、
列百分比、行百分比和總百分比的資訊。
− 從表中可看出資料大部分出現在那些方格中,其比例有
多少?
− 若選定列變數的某一個值,則可由列比例看出,在此條
件下,行變數的分配狀況。
− 若選定行變數的某一個值,則可由行比例看出,在此條
件下,列變數的分配狀況。
交叉分析的重點

• 由卡方檢定可瞭解行變數與列變數是否統計獨立。
若是,則表示行變數與列變數無統計相關。
• 一般卡方檢定的應用,期望次數低於5的方格數不
能多於20%。若多於20%,則須考慮合併期望次
數低於5的方格,使其能適合條件。
• 若樣本數很小的時候,採用費雪精確檢定
(Fisher`s Exact Test)
McNemar配對樣本檢定法
McNemar配對樣本檢定法
• McNemar 檢定又稱相依(配對)樣本的卡方檢定,
主要適用於 2×2 的表格

• 探討實驗前後由『是』變為『否』與由『否』變
為『是』的個數是否相等,因此被稱為『改變的
顯著檢定』

• 例如選民在看電視辯論前後,調查其投票行為結
果,因結果來自同一位選民,故此觀測值是具有
相關而配對二項隨機變數
SPSS操作範例:
McNemar test
範例:急性心肌梗塞與糖尿病的關聯性

• 此研究的個案組為144位心肌梗塞患者,為降低年齡與性別的影響,控制
組為經過年齡與性別配對的144位無心血管疾病之就診病人。

一般作法: 統計上正確作法:
卡方檢定, p=0.004 McNemar檢定, p=0.005
McNemar檢定:
分析敘述統計交叉表
Step1:點選變數至列與欄
Step2:點選統計量按鈕 Step3:勾選McNemar檢定
Step4:點選百分比

Step5:按確定產生統計報表
McNemar統計報表

在相同年齡與性別下,有急性心肌梗塞的病患較無急
性心肌梗塞的病患容易患有糖尿病(p=0.005)。
Kappa coefficient
Kappa coefficient

• Kappa coefficient為臨床上用來確立不同檢驗或診斷方法
是否有一致性的常用方法,主要應用在:
• 評估兩位醫護人員的診斷結果(或兩種檢驗方法)是否有一致性。
• 評估同一位醫護人員(或檢驗方法)重覆診斷的結果是否有一致性。
• Kappa值可約略分為五組來表示不同等級的一致性:
• 0.0~0.20 極低的一致性
• 0.21~0.40 一般的一致性
• 0.41~0.60 中等的一致性
• 0.61~0.80 高度的一致性
• 0.81~1 幾乎完全一致性
SPSS操作範例
 二位超級名醫,黑傑克醫師與喬巴醫師,診斷20位病人的
病情,其診斷結果是否有一致性?
Step1:分析敘述統計交叉表
Step2:點選變數分別放至列與欄
Step3:點選統計量

Step5:按確定得到統計報表 Step4:勾選Kappa統計量數
Kappa coefficient報表解釋

 從報表中可以發現黑
傑克與喬巴二位醫師
對20位病人的診斷結
果之Kappa係數為
0.700,顯著性p值為
0.001<0.05,表示二
位醫師的診斷結果有
高度的一致性。
無母數檢定

38
資料屬性

大樣本/
小樣本

資料
屬性
連續變數/ 常態/
類別變數 非常態

39
有母數 vs. 無母數

• 有母數統計:
− 須假設母體為一已知模型,甚至要為常態母體才能推論。
− 推論特定參數。

• 無母數統計:
− 不受特定母體分配限制。
− 不一定推論母體中特定參數。
− 推論時所使用的抽樣分配通常與母體分配無關。
− 稱「分配自由化(Distribution Free)」

40
無母數 VS. 母數的統計法

41
符號檢定(The Sign Test)

 用來比較兩組非獨立樣本的觀察值
− 適用於配對樣本
− 分析相關性高的配對資料,n對資料
 重點:每一對樣本的差距(符號),且差距母群
體並不需為常態分佈。
 以正號(+)、負號 (-)的個數當統計量做為檢定的
基礎。

42
Example :符號檢定(The Sign Test)

 檢定顧客對甲乙兩種車款試乘的滿意程度是否相
等? 假設母體不為常態分佈,檢定水準為0.05.

顧客編號 1 2 3 4 5 6 7 8 9 10

甲車 3 4 2 5 3 5 1 4 4 3

乙車 2 2 2 4 3 2 2 3 2 2

43
SPSS操作
Step1:分析無母數檢定歷史對話紀錄二個相關樣本

44
Step2:將變數移到成對檢定的方塊中

Step3:選取符號檢定

Step4:按確定得到統計報表

45
符號檢定報表解釋

 從右表可知甲車種與乙車種
的正負差異數量,並得知其
p-value=0.070.
 表示顧客對甲車種與乙車種
的喜好程度沒有統計上的差
異,喜好甲車種的程度與乙
車種差不多。

46
Wilcoxon符號化等級檢定
(The Wilcoxon Signed-Rank Test)
 適用於配對樣本,且母體不需為常態
 比Sign Test常用,因多考慮排序大小(Rank)的問題
 符號等級檢定不僅考慮差值的正負符號,同時考慮
差值大小的等級的檢定方法。

47
SPSS操作

Step1:分析無母數檢定歷史對話紀錄二個相關樣本

48
Step2:將變數移到成對檢定的方塊中

Step3:選取Wilcoxon檢定

Step4:按確定得到統計報表
49
SPSS報表解釋

 從右表可知甲車種與乙車
種的正負差異數量,並得
知其p-value=0.031.
 表示顧客對甲車種與乙車
種的喜好程度有統計上的
顯著差異,喜好甲車種的
顧客比教多。

50
Wilcoxon等級和檢定
(The Wilcoxon Rank Sum Test)
 兩組獨立樣本的檢定,n1 and n2不需成對
 母體不需假設為常態或假設母體變異數相等
 假設兩母體的分配相等
 考慮兩組觀察值合併排序數值大小再以其各自等
級和中較小者進行分析

51
範例: Wilcoxon等級和檢定

• 我們想知道A、B兩組的病人身高分配是否相同,
分別自兩組中隨機抽取了11和12個樣本。
• 在顯著水準0.05下,試以Wilcoxon等級和檢定法
檢定之。
A組 163 168 170 181 166 161 179 173 167 175 176

等級

B組 171 169 183 174 173 170 168 190 167 165 174 172

等級

52
SPSS 操作
Step1:分析無母數檢定歷史對話紀錄二個獨立樣本

53
Step2:將變數移到檢定變數清單的方塊中

Step3:將分組變數移到
分組變數的方塊中

Step4:定義分組變數

Step6:按確定得到統計報表
Step5:
選定檢定類型Mann-Whitney U test
54
SPSS報表解釋

 從報表可得知p=0.608,
亦即兩個班級的身高沒
有統計上的差異。

55
多組獨立樣本的無母數檢定:
Kruskal-Wallis Test
• 多組獨立樣本的檢定
• 母體不需假設為常態或假設母體變異數相等

56
Example

 為研究四種不同藥物對兒童咳嗽的治療效果,將25個體質
相似的病人隨機分為四組,各組人數分別為8人、4人、7
人和6人,各自採用A、B、C、D四種藥物進行治療,假
定其他條件均保持相同,五天後測量每位病人每天咳嗽次
數如表所示,試比較這四種藥物的治療效果是否相同。

林傑斌、林川雄、馮兆康, SPSS統計分析與實務, p.14-30

57
SPSS 操作
Step1:分析無母數檢定歷史對話紀錄二個獨立樣本

58
Step2:將變數移到檢定變數清單的方塊中

Step3:將分組變數移到
分組變數的方塊中

Step4:定義分組變數

Step6:按確定得到統計報表
Step5:
選定檢定類型Kruskal-Wallis test
59
SPSS統計報表結果

 從報表可得知p=0.045,
亦即四種不同藥物對兒
童咳嗽的治療效果有統
計上的差異。

60

You might also like