Professional Documents
Culture Documents
07 Hypothesis
07 Hypothesis
7. Hypothesis Testing
假設檢定的意義
對有關母體參數的假設,利用樣本訊息,
決定接受 ( 不拒絕 ) 該假設或是拒絕該假
設的方法。
2
虛無假設
對母體參數的某一假設。用來與樣本資
料做比對之假設。
研究中想要否定的假設
被錯誤拒絕較嚴重的假設定為虛無假設
3
臨界值與決策
臨界點乃是區分接受區與拒絕區的值。
可根據設定的 α 值來求出數值,作為進
行分析的人下決策的依據。
根據樣本資料的統計量與臨界點的比較,
分析人員做出拒絕或接受虛無假設的決
定。
4
兩種錯誤 與 檢定力
第一類型錯誤 Type I error (α)
當 H0 為真時拒絕 H0
α 是犯第一類型錯誤的最大機率
預設
第二類型錯誤 Type II error (β)
當 H0 為假時無法拒絕 H0
根據不同的 μA (HA ) 會有所不同
5
兩種錯誤 與 檢定力
母體
檢定結果
H0 為真 H0 為假
無法拒絕 正確
第二類型
錯誤 (β)
拒絕
第一類型 正確 ( 檢定力 )
錯誤 (α)
6
第一類型錯誤
α = P( 拒絕 H0 | H0 為真 )
在進行重覆、相互獨立的統計檢定時,如果我們將顯
著水準設為 0.05 ,則我們會有 5% 的機會在虛無假設
為真時拒絕虛無假設
例:若已知 20-74 歲男性的血清膽固醇含量為 μ=180,
σ=46 (mg/ml) ,隨機抽取 20-74 歲男性菸民 25 人,問
男性菸民血清膽固醇含量是否比一般 (180) 為高?
H0: μ≤μ0(180), HA: μ>μ0, σ=46, n=25, α=0.05
z 1.645 x 180 / 46 / 25
, x 195.1
7
20-74 歲男性的血清膽固醇含量為 μ=180 , n=25 的樣本分布
H0: μ ≤ μ0 (180) HA: μ > μ0 σ = 46, n=25
8
第二類型錯誤
β = P( 無法拒絕 H0 | H0 為假 )
β 隨著母體參數 (μ) 的真值而改變
i.e. H0: μ ≤ 180 HA: μ > 180
若 H0 為假 , μ 可以是 > 180 的任何數
當 μ-μ0 增加時 , β 降低
在雙尾檢定時, β 隨著 |μ-μ0| 的增加而降低
9
若 μ = 211
(H0: μ ≤ 180 為假 , 但
當 x ≧ 195.1 時才會
拒絕 H0 )
假設 σ 不變 (46)
x ~ Norm(211, 46/5)
z = (195.1-211)/9.2
= -1.73
20-74 歲男性的血清膽固醇含量為 n=25 的樣本分
x ≤195.1 的機率 (β) 是 :
布
μ=180 vs μ=211 P(z ≤-1.73) = 0.042
10
檢定力 Power
假設檢定的檢定力 是 P( 拒絕 H0|H0 為假 )
power = 1 – β
只能對特定母體參數 (i.e. μ1) 計算一假設檢定
的檢定力
跟 β 同理
以血清膽固醇例子為例
當 μ1 = 211 時,單尾檢定 H0: μ ≤ 180 的檢定力為
P(reject μ ≤ 180 | μ = 211)
1 - 0.042 = 0.958
11
在不同的 μ1 下檢定力應該有所不同
如果計算所有可能的 μ1 的對應檢定力
(1-β) 並以散布圖表示,會得到該假設檢
定的檢定力曲線 power curve
注意 : 當 μ1 =180 時 (i.e. H0 為真 )
P( 拒絕 μ ≤ 180 | μ = 180) = α
12
μ0 = 180, σ= 46, α=0.05, n = 25 之下的檢定力曲線
13
n↑ Power↑(β↓)
μ1-μ0↑ Power↑(β↓)
α↑ Power↑(β↓)
14
假設檢定的步驟
1. 建立虛無假設及對立假設
決定顯著水準
2. 收集樣本資料
3. 計算樣本統計量
以估計母體參數
4. 比較估計值(樣本統計量)及檢定值
差距是否大到超過了「偶然」?
5. 做出決策
拒絕 H0 或不拒絕 H0
15
單尾檢定
當研究者只介意單一方向的差異時
H 0: μ ≤ μ 0 H A: μ > μ 0
男性菸民的血清膽固醇含量是否比一
般男性為高 ?
用 zα 或 t(n-1, α) 取代雙尾檢定的 ± zα/2
或 ± t(n-1, α/2)
注意檢定的方向
16
單尾檢定的方向
右尾檢定 左尾檢定
H0: μ ≤ μ0 H0: μ ≧μ0
HA: μ > μ0 HA: μ < μ0
用 zα 或 t(n-1, α) 用 - zα 或 - t(n-1, α)
查右邊的機率 查左邊的機率
若 x 小於 μ0, 則沒有 若 x 大於 μ0, 則沒有
必要繼續計算 必要繼續計算
i.e. Prob > .5 i.e. Prob > .5
17
同時降低 α 及 β
唯一可以同時降低 α 及 β 的方法就是減
少兩個樣本分布 ( 常態分布 ) 下重疊的面
積
i.e. 藉由增加樣本數
/ n n 來降低標準誤
18
樣本數估計
延續血清膽固醇例子
H0:μ≤ 180, HA:μ>μ0, σ=46
欲以 α=0.01 為顯著水準
若 μ> 211 時希望只有 5% 機會無法拒絕虛
無假設
i.e. β=0.05
問:需要多大的樣本數?
19
當 α=0.01 ,在 z ≥2.32 時拒絕 H0
z 2.32 ( x 180) /(46 / n )
時拒絕 H0
若真 μ = 211
z ( x 211) /(46 / n )
20
希望能正確拒絕虛無假設的機率為
1-β=0.95
對應 β=0.05 的 z 值為 -1.645
z 1.645 ( x 211) /(46 / n )
x 211 1.645(46 / n ) (2)
將兩個對樣本平均數 x 的算式放在一起
180 2.32(46 / n ) 211 1.645(46 / n )
21
n (211 180) 2.32 1.645(46)
2.32 1.645(46)
2
n 34.6
(211 180)
依慣例,對於樣本數估計的小數點都會
以無條件進位
需要以 35 為樣本數
22