Download as ppt, pdf, or txt
Download as ppt, pdf, or txt
You are on page 1of 22

七、假設檢定

7. Hypothesis Testing
假設檢定的意義
 對有關母體參數的假設,利用樣本訊息,
決定接受 ( 不拒絕 ) 該假設或是拒絕該假
設的方法。

2
虛無假設
 對母體參數的某一假設。用來與樣本資
料做比對之假設。
 研究中想要否定的假設
 被錯誤拒絕較嚴重的假設定為虛無假設

3
臨界值與決策
 臨界點乃是區分接受區與拒絕區的值。
可根據設定的 α 值來求出數值,作為進
行分析的人下決策的依據。
 根據樣本資料的統計量與臨界點的比較,
分析人員做出拒絕或接受虛無假設的決
定。

4
兩種錯誤 與 檢定力
 第一類型錯誤 Type I error (α)
 當 H0 為真時拒絕 H0
 α 是犯第一類型錯誤的最大機率
 預設
 第二類型錯誤 Type II error (β)
 當 H0 為假時無法拒絕 H0
 根據不同的 μA (HA ) 會有所不同

5
兩種錯誤 與 檢定力
母體
檢定結果
H0 為真 H0 為假

無法拒絕 正確
第二類型
錯誤 (β)

拒絕
第一類型 正確 ( 檢定力 )
錯誤 (α)
6
第一類型錯誤
 α = P( 拒絕 H0 | H0 為真 )
 在進行重覆、相互獨立的統計檢定時,如果我們將顯
著水準設為 0.05 ,則我們會有 5% 的機會在虛無假設
為真時拒絕虛無假設
 例:若已知 20-74 歲男性的血清膽固醇含量為 μ=180,
σ=46 (mg/ml) ,隨機抽取 20-74 歲男性菸民 25 人,問
男性菸民血清膽固醇含量是否比一般 (180) 為高?
 H0: μ≤μ0(180), HA: μ>μ0, σ=46, n=25, α=0.05

 
z  1.645  x  180 / 46 / 25
  , x  195.1

 Reject H0 when x > 195.1

7
20-74 歲男性的血清膽固醇含量為 μ=180 , n=25 的樣本分布
H0: μ ≤ μ0 (180) HA: μ > μ0 σ = 46, n=25
8
第二類型錯誤
 β = P( 無法拒絕 H0 | H0 為假 )
 β 隨著母體參數 (μ) 的真值而改變
 i.e. H0: μ ≤ 180 HA: μ > 180
若 H0 為假 , μ 可以是 > 180 的任何數
 當 μ-μ0 增加時 , β 降低
 在雙尾檢定時, β 隨著 |μ-μ0| 的增加而降低

9
若 μ = 211
(H0: μ ≤ 180 為假 , 但
當 x ≧ 195.1 時才會
拒絕 H0 )
假設 σ 不變 (46)
x ~ Norm(211, 46/5)
z = (195.1-211)/9.2
= -1.73
20-74 歲男性的血清膽固醇含量為 n=25 的樣本分
x ≤195.1 的機率 (β) 是 :

μ=180 vs μ=211 P(z ≤-1.73) = 0.042
10
檢定力 Power
 假設檢定的檢定力 是 P( 拒絕 H0|H0 為假 )
 power = 1 – β
 只能對特定母體參數 (i.e. μ1) 計算一假設檢定
的檢定力
 跟 β 同理
 以血清膽固醇例子為例
 當 μ1 = 211 時,單尾檢定 H0: μ ≤ 180 的檢定力為
P(reject μ ≤ 180 | μ = 211)
1 - 0.042 = 0.958
11
 在不同的 μ1 下檢定力應該有所不同
 如果計算所有可能的 μ1 的對應檢定力
(1-β) 並以散布圖表示,會得到該假設檢
定的檢定力曲線 power curve
 注意 : 當 μ1 =180 時 (i.e. H0 為真 )
P( 拒絕 μ ≤ 180 | μ = 180) = α

12
μ0 = 180, σ= 46, α=0.05, n = 25 之下的檢定力曲線

13
 n↑ Power↑(β↓)

 μ1-μ0↑ Power↑(β↓)

 α↑ Power↑(β↓)

14
假設檢定的步驟
1. 建立虛無假設及對立假設
決定顯著水準
2. 收集樣本資料
3. 計算樣本統計量
 以估計母體參數

4. 比較估計值(樣本統計量)及檢定值
 差距是否大到超過了「偶然」?

5. 做出決策

拒絕 H0 或不拒絕 H0

15
單尾檢定
 當研究者只介意單一方向的差異時
H 0: μ ≤ μ 0 H A: μ > μ 0
 男性菸民的血清膽固醇含量是否比一
般男性為高 ?
 用 zα 或 t(n-1, α) 取代雙尾檢定的 ± zα/2
或 ± t(n-1, α/2)
 注意檢定的方向

16
單尾檢定的方向
 右尾檢定  左尾檢定
 H0: μ ≤ μ0  H0: μ ≧μ0
HA: μ > μ0 HA: μ < μ0
 用 zα 或 t(n-1, α)  用 - zα 或 - t(n-1, α)
 查右邊的機率  查左邊的機率
 若 x 小於 μ0, 則沒有  若 x 大於 μ0, 則沒有
必要繼續計算 必要繼續計算
 i.e. Prob > .5  i.e. Prob > .5

17
同時降低 α 及 β
 唯一可以同時降低 α 及 β 的方法就是減
少兩個樣本分布 ( 常態分布 ) 下重疊的面

 i.e. 藉由增加樣本數
/ n n 來降低標準誤

18
樣本數估計
 延續血清膽固醇例子
 H0:μ≤ 180, HA:μ>μ0, σ=46
 欲以 α=0.01 為顯著水準
 若 μ> 211 時希望只有 5% 機會無法拒絕虛
無假設
 i.e. β=0.05
 問:需要多大的樣本數?

19
 當 α=0.01 ,在 z ≥2.32 時拒絕 H0
z  2.32  ( x  180) /(46 / n )

 在樣本平均數 x  180  2.32(46 / n ) (1)

時拒絕 H0
 若真 μ = 211
z  ( x  211) /(46 / n )

20
 希望能正確拒絕虛無假設的機率為
1-β=0.95
 對應 β=0.05 的 z 值為 -1.645
z  1.645  ( x  211) /(46 / n )
x  211  1.645(46 / n ) (2)

 將兩個對樣本平均數 x 的算式放在一起
180  2.32(46 / n )  211  1.645(46 / n )

21
n (211  180)  2.32   1.645(46)

 2.32  1.645(46) 
2

n   34.6
 (211  180) 
 依慣例,對於樣本數估計的小數點都會
以無條件進位
 需要以 35 為樣本數
22

You might also like