Professional Documents
Culture Documents
102S113 CS08L01
102S113 CS08L01
102S113 CS08L01
假說檢定Ⅰ
(Hypothesis Testing Ⅰ)
(Chapter 7)
劉仁沛教授
國立台灣大學農藝學研究所生物統計組
國立台灣大學流行病學與預防醫學研究所
國家衛生研究院生物統計與生物資訊組
jpliu@ntu.edu.tw
【本著作除另有註明,網站之內容皆採用 創用CC 姓名標示-
非商業使用-相同方式分享 3.0 台灣 授權條款釋出】
型Ⅰ與型Ⅱ錯誤 (TypeⅠ&TypeⅡError)
假說檢定之步驟 (Procedures of Hypothesis Testing)
樣品數之決定 (Sample Size Determination)
統計方法進行決策的過程 (Decision-Making
Process) ,將探討的問題二分為兩種假說:
對立假說:吾人欲證明的事件 ( 所感興趣 )
虛擬假說:對立假說之補事件 ( 不感興趣 )
6 111/10/03 Jen-pei Liu, PhD
例:若法官對審判的目的為證明嫌犯有罪
Ho :無罪
vs.
Ha :有罪
若藥廠要證明所研發的新藥有療效
Ho :無療效
vs.
Ha :有療效
奶粉重量不足 500 公克
Ho :平均奶粉重量至少 500 公克
Ha :平均奶粉重量不足 500 公克
奶粉重量不足 500 公克
vs.
Ho : μ500g
Ha : μ500g
事實 (Truth)
決策 (Decision) Ho : μ 500g 為真 Ha : μ 500g 為真
不拒絕 Ho
Not reject Ho 決策正確 型Ⅱ錯誤
拒絕 Ho
Reject Ho 型Ⅰ錯誤 決策正確
11 111/10/03 Jen-pei Liu, PhD
vs.
Ho :新藥不具療效
Ha :新藥具有療效
事實 (Truth)
Ho :新藥不具療效 Ha :新藥具有療效
決策 (Decision) 為真 為真
無法拒絕 Ho
決策正確 型Ⅱ錯誤
Not reject Ho
拒絕 Ho
型Ⅰ錯誤 決策正確
Reject Ho
12 111/10/03 Jen-pei Liu, PhD
型Ⅰ錯誤 (TypeⅠError)
拒絕虛無假說∣當 Ho 為真時
決策判定新藥有療效∣事實上新藥無療效
reject Ho∣Ho is true
消費者的風險 (Consumer's Risk)
無法拒絕虛無假說∣當 Ha 為真時
決策判定新藥無療效∣事實上新藥具有療效
無法拒絕 Ho∣Ha is true
生產者的風險 (Producer's Risk)
事實 (Truth)
決策 ( 診斷 )
Ho :無病為真 Ha :有病為真
拒絕 Ho 型Ⅰ錯誤 決策正確
型Ⅰ錯誤:診斷有病∣事實上無病
拒絕 Ho∣ Ho 為真
偽陽性 (False Positive)
型Ⅱ錯誤:診斷無病∣事實上有病
無法拒絕 Ho∣ Ha 為真
偽陰性 (False Negative)
15 111/10/03 Jen-pei Liu, PhD
統計假說檢定之邏輯基礎:反證法
目的:證明 Ha 為真
方法:利用資料證明 Ho 不成立
=> 間接地證明 Ha 為真
結論:二種可能性
1. 拒絕 Ho => 證明 Ha
2. 無法拒絕 Ho
不代表證明 Ho
僅說明資料無法提供足夠證據
16 推翻 Ho 111/10/03 Jen-pei Liu, PhD
目的:反證法證明 Ha 為真
必須先控制型Ⅰ錯誤
( 拒絕 Ho∣Ho 為真 )
β=P[ 型Ⅱ錯誤 ]
=P[ 無法拒絕 Ho∣ Ha 為真 ]
=P[ 偽陰性 ]
檢定力 =1 - β
=P[ 拒絕 Ho∣ Ha 為真 ]
17 111/10/03 Jen-pei Liu, PhD
統計假說檢定之步驟
Ho : μ 500g
vs. Ha : μ 500g
Ha 只考慮奶粉平均重量小於 500 公克
=> 單尾檢定
標準常態分佈之 (1 - α)% 百分位 z1
如果Z x o z1
n
=> 拒絕 Ho
α=0.05 , z0.95 =1.645
z1 0 Z
若 Z x o z => 拒絕 Ho
1
n
若 Z
x o
z1 => 拒絕 Ho
n
24 111/10/03 Jen-pei Liu, PhD
雙尾檢定:對立假說是兩個方向
x o
若Z z1 / 2 或
n
x o
Z z1 / 2 => 拒絕 Ho
n
x o
Z z1 / 2
n => 拒絕 Ho
25 111/10/03 Jen-pei Liu, PhD
(a)
棄卻區 棄卻區
2.5% 2.5%
接受區
Z
- 1.96 0 1.96
(c)
(b)
棄卻區 棄卻區
5% 5%
接受區 接受區
Z Z
0 1.645 - 1.645 0
圖 7.3 雙尾與單尾檢定圖
26 111/10/03 Jen-pei Liu, PhD
例子:正常成人血中平均膽固醇為 180mg/dL
標準偏差為 50mg/dL. 今調查某地區 16 位
成人平均膽固醇為 200mg/dL 問此
地區
平均膽固醇是否與 180mg/dL 有差
異?
1. Ho : μ=180mg/dL vs. Ha : μ 180mg/dL
2. α=0.05
x 180
3. Z
n
4. 若 Z z1 / 2 z0.975 1.96 => 拒絕 Ho
200 180
5. Z 1.6
50 / 16
因 Z 1.6 z0.975 1.96 => 無法拒絕
27 111/10/03 Ho Jen-pei Liu, PhD
例子:雞飼料加入魚骨粉後每隻雞每月平
均蛋產量是否高過 21 個?取樣 100 隻
雞
x 24 若 =9
1. H o : 21 vs. H a : 21
2. 0.05
x 21
3. Z
n
4.若 Z z0.95 1.645 => 拒絕 Ho
24 21
5. Z 3.33 z0.95 1.645 => 拒絕 Ho
9 / 100
28 111/10/03 Jen-pei Liu, PhD
P-value
檢定統計量 :
樣本平均數與虛無假說所設定母體平均數的差
異以抽樣誤差倍數表示。
樣品平均值為 485 g 與虛無假說所設定母體平
均數 500 g 的差異為 -15 g ,是抽樣誤差 -3 倍。
在虛無假說下,抽樣誤差 -3 倍或比 -3 倍更大
的抽樣誤差發生機率 -p-value
問題 : p-value 要多小,才可下推翻虛無假
說的決策 ?
答案 : 小於顯著水準。
– 顯著水準 : 吾人可容忍的型 I 錯誤發生的機率。
– 若顯著水準定為 0.05 表示 20 次推翻虛無假說
的決策中可允准一次錯誤 ( 即有一次虛無假說
為真 ) 。或 1000 次推翻虛無假說的決策中可
允准 50 次錯誤 ( 即有 50 次虛無假說為真 )
31 111/10/03 Jen-pei Liu, PhD
統計假說檢定或顯著性檢定 (Statistical
Hypothesis Testing or Significance Test)
問題 : p-value 要多小,才可下推翻虛無
假說的決策 ?
答案 : 小於顯著水準。
– 若顯著水準定為 0.05
– 樣本平均值為 485 時的 p-value 是 0.0013
– 1000 次推翻虛無假說的決策中可能犯 1.3 次
錯誤,小於可容忍的 50 次。
決策判定 :
–因 p-value = 0.0013 小於 0.05 的顯著水準
– 推翻虛無假說。
– 樣本平均值為 485g 與虛無假說所假設 500g
的差異在 5% 顯著水準下為統計顯著
(statistically significant) 。
– 統計假說檢定又稱顯著性檢定。
當 P-value 小於吾人所定之顯著水準
( 可容忍型Ⅰ錯誤機率 ) 拒絕 Ho
P-value=P[Z z∣ μ=μo]<α => 拒絕
34 111/10/03 Ho Jen-pei Liu, PhD
例:奶粉罐重量
若 α=0.05 ,無法拒絕 Ho
41 111/10/03 Jen-pei Liu, PhD
例:雞蛋每月平均產量
21/ 月
Ho : μ 21/ 月 vs. Ha : μ
24 21
z 3.33
9 / 100
P value P[ Z 3.33 o 21/月 ]
0.0005 0.05
若 α=0.05 ,拒絕 Ho
42 111/10/03 Jen-pei Liu, PhD
信賴區間與假說檢定
43 111/10/03
則拒絕 Ho Jen-pei Liu, PhD
信賴區間與假說檢定
在 5% 顯著水準下,拒絕 Ho
45 111/10/03 Jen-pei Liu, PhD
例:膽固醇
21/ 月
Ho : μ 21/ 月 vs. Ha : μ
L x z0.95
n
24 (1.645)(9 / 100)
22.5195 o 21
=> 在 5% 顯著水準下,拒絕 Ho
47 111/10/03 Jen-pei Liu, PhD
雙尾檢定
(2) p value P[ Z z | 0 ] 拒絕 Ho
(3) L x z 1 0 or U x z 1 0
2 n 2 n 拒絕 Ho
若 σ 未知但 n
30111/10/03
以S代
48 之 Jen-pei Liu, PhD
單尾檢定
μo vs. Ha : μ<μo
Ho : μ
決策
x o
(1) Z z1 拒絕 Ho
n
(2) p value P[ Z z o ] 拒絕 Ho
(3) U x z1 o 拒絕 Ho
n
49 若 σ 未知但 n30111/10/03
以 S 代之 Jen-pei Liu, PhD
單尾檢定
μo vs. Ha : μ>μo
Ho : μ
決策
x o
(1) Z z1 拒絕 Ho
n
(2) p value P[ Z z o ] 拒絕 Ho
(3) L x z1 o 拒絕 Ho
n
50 若 σ 未知但 n30111/10/03
以 S 代之 Jen-pei Liu, PhD
統計顯著 vs. 應用顯著 vs. 樣本數
樣本數增加,抽樣誤差下降。
Z 絕對值變大, p-value 變小。
統計顯著。
推翻虛無假說。
只要不斷增樣本數,一定可推翻虛無假說,
並達到統計顯著。
1g 差異的統計顯著,並無實用上意義。
必須先訂出實用上有意義的差異。
降血壓新藥降舒張壓的效果較安慰劑多 5
mmHg 。
在規劃的顯著水準 ( 如 5%) 與檢定力
(power 如 80%) 下,計算所需樣本數後,
收集資料進行顯著性檢定。
奶粉罐重量
Ho : μ 500g vs. Ha : μ 500g
30, n 25
以x 表示棄卻域
30
x o z0.95 500 (1.645)( ) 490.13
n 25
1 - β=P[ 拒絕 Ho∣ Ha 為真 ]
P[ x 490.13 a 496.13]
x a 490.13 496.13
P[ ]
/ n 30 / 25
P[ z 1]
0.1587 15.87%
56 111/10/03 Jen-pei Liu, PhD
α=0.05
μo=500
1 - β=0.1587
57 μa=496.13
111/10/03 Jen-pei Liu, PhD
490.13
設 0.1 z 0.90 1.28
30
x 500 1.28( )
25
500 7.68 492.32
若 a 496.13
492.32 496.13
1 P[ Z ]
30 / 25
P[ Z 0.635] 0.263
μo=500
1 - β=0.263
μa=496.13
59 492.32
111/10/03 Jen-pei Liu, PhD
若 μa=484.13
1 - β=P[ 拒絕 Ho∣ Ha 為真 ]
P[ x 490.13 a 484.13]
x a 490.13 484.13
P[ ]
/ n 30 / 25
P[ Z 1]
1 P[ Z 1]
1 0.1587 0.8413
μo=500
1 - β=0.8413
μa=484.13 490.13
61 111/10/03 Jen-pei Liu, PhD
1. μa 與 μo 差愈大時,檢定力愈高
3. 在固定樣品數下無法同時降低 α 及 β
4. 增加樣品數可同時降低 α 及 β
檢定力:1 P ( Z 0
a 0 a
z1 /2 ) P ( Z z1 /2 )
/ n / n
63 111/10/03 Jen-pei Liu, PhD
樣品數計算公式
單尾檢定:
H 0 : o ( 0 ) vs. H a : o ( a o )
H 0 : o ( 0 ) vs. H a : o ( a o )
0 a
1 P(Z z1 ) if 1 0.5
/ n
o a a o
z1 z1 , = z1 z1
/ n / n
a o ( z1 z1 ) n ( z1 z1 )
n ( a o )
2 2
n ( z1 z1 )
( a o ) 2
雙尾檢定: H 0 : o vs. H a : o ( a o )
2 2
n ( z1 / 2 z1 )
( a o ) 2
64 111/10/03 Jen-pei Liu, PhD
例:奶粉罐重量
22 臺灣大學 劉仁沛教授
26 臺灣大學 劉仁沛教授
26 臺灣大學 劉仁沛教授
26 臺灣大學 劉仁沛教授
36 臺灣大學 劉仁沛教授
37 臺灣大學 劉仁沛教授
55 臺灣大學 劉仁沛教授
57 臺灣大學 劉仁沛教授
59 臺灣大學 劉仁沛教授
61 臺灣大學 劉仁沛教授