07 Hypothesis

七、假設檢定
7. Hypothesis Testing
假設檢定的意義
 對有關母體參數的假設，利用樣本訊息，
決定接受 ( 不拒絕 ) 該假設或是拒絕該假
設的方法。
2
虛無假設
 對母體參數的某一假設。用來與樣本資
料做比對之假設。
 研究中想要否定的假設
 被錯誤拒絕較嚴重的假設定為虛無假設
3
臨界值與決策
 臨界點乃是區分接受區與拒絕區的值。
可根據設定的 α 值來求出數值，作為進
行分析的人下決策的依據。
 根據樣本資料的統計量與臨界點的比較，
分析人員做出拒絕或接受虛無假設的決
定。
4
兩種錯誤與檢定力
 第一類型錯誤 Type I error (α)
 當 H0 為真時拒絕 H0
 α 是犯第一類型錯誤的最大機率
 預設
 第二類型錯誤 Type II error (β)
 當 H0 為假時無法拒絕 H0
 根據不同的 μA (HA ) 會有所不同
5
兩種錯誤與檢定力
母體
檢定結果
H0 為真 H0 為假
無法拒絕正確
第二類型
錯誤 (β)
拒絕
第一類型正確 ( 檢定力 )
錯誤 (α)
6
第一類型錯誤
 α = P( 拒絕 H0 | H0 為真 )
 在進行重覆、相互獨立的統計檢定時，如果我們將顯
著水準設為 0.05 ，則我們會有 5% 的機會在虛無假設
為真時拒絕虛無假設
 例：若已知 20-74 歲男性的血清膽固醇含量為 μ=180,
σ=46 (mg/ml) ，隨機抽取 20-74 歲男性菸民 25 人，問
男性菸民血清膽固醇含量是否比一般 (180) 為高？
 H0: μ≤μ0(180), HA: μ>μ0, σ=46, n=25, α=0.05

 
z  1.645  x  180 / 46 / 25
  , x  195.1
 Reject H0 when x > 195.1
7
20-74 歲男性的血清膽固醇含量為 μ=180 ， n=25 的樣本分布
H0: μ ≤ μ0 (180) HA: μ > μ0 σ = 46, n=25
8
第二類型錯誤
 β = P( 無法拒絕 H0 | H0 為假 )
 β 隨著母體參數 (μ) 的真值而改變
 i.e. H0: μ ≤ 180 HA: μ > 180
若 H0 為假 , μ 可以是 > 180 的任何數
 當 μ-μ0 增加時 , β 降低
 在雙尾檢定時， β 隨著 |μ-μ0| 的增加而降低
9
若 μ = 211
(H0: μ ≤ 180 為假 , 但
當 x ≧ 195.1 時才會
拒絕 H0 )
假設 σ 不變 (46)
x ~ Norm(211, 46/5)
z = (195.1-211)/9.2
= -1.73
20-74 歲男性的血清膽固醇含量為 n=25 的樣本分
x ≤195.1 的機率 (β) 是 :
布
μ=180 vs μ=211 P(z ≤-1.73) = 0.042
10
檢定力 Power
 假設檢定的檢定力是 P( 拒絕 H0|H0 為假 )
 power = 1 – β
 只能對特定母體參數 (i.e. μ1) 計算一假設檢定
的檢定力
 跟 β 同理
 以血清膽固醇例子為例
 當 μ1 = 211 時，單尾檢定 H0: μ ≤ 180 的檢定力為
P(reject μ ≤ 180 | μ = 211)
1 - 0.042 = 0.958
11
 在不同的 μ1 下檢定力應該有所不同
 如果計算所有可能的 μ1 的對應檢定力
(1-β) 並以散布圖表示，會得到該假設檢
定的檢定力曲線 power curve
 注意 : 當 μ1 =180 時 (i.e. H0 為真 )
P( 拒絕 μ ≤ 180 | μ = 180) = α
12
μ0 = 180, σ= 46, α=0.05, n = 25 之下的檢定力曲線
13
 n↑ Power↑(β↓)
 μ1-μ0↑ Power↑(β↓)
 α↑ Power↑(β↓)
14
假設檢定的步驟
1. 建立虛無假設及對立假設
決定顯著水準
2. 收集樣本資料
3. 計算樣本統計量
 以估計母體參數
4. 比較估計值（樣本統計量）及檢定值
 差距是否大到超過了「偶然」？
5. 做出決策

拒絕 H0 或不拒絕 H0
15
單尾檢定
 當研究者只介意單一方向的差異時
H 0: μ ≤ μ 0 H A: μ > μ 0
 男性菸民的血清膽固醇含量是否比一
般男性為高 ?
 用 zα 或 t(n-1, α) 取代雙尾檢定的 ± zα/2
或 ± t(n-1, α/2)
 注意檢定的方向
16
單尾檢定的方向
 右尾檢定  左尾檢定
 H0: μ ≤ μ0  H0: μ ≧μ0
HA: μ > μ0 HA: μ < μ0
 用 zα 或 t(n-1, α)  用 - zα 或 - t(n-1, α)
 查右邊的機率  查左邊的機率
 若 x 小於 μ0, 則沒有  若 x 大於 μ0, 則沒有
必要繼續計算必要繼續計算
 i.e. Prob > .5  i.e. Prob > .5
17
同時降低 α 及 β
 唯一可以同時降低 α 及 β 的方法就是減
少兩個樣本分布 ( 常態分布 ) 下重疊的面
積
 i.e. 藉由增加樣本數
/ n n 來降低標準誤
18
樣本數估計
 延續血清膽固醇例子
 H0:μ≤ 180, HA:μ>μ0, σ=46
 欲以 α=0.01 為顯著水準
 若 μ> 211 時希望只有 5% 機會無法拒絕虛
無假設
 i.e. β=0.05
 問：需要多大的樣本數？
19
 當 α=0.01 ，在 z ≥2.32 時拒絕 H0
z  2.32  ( x  180) /(46 / n )
 在樣本平均數 x  180  2.32(46 / n ) (1)
時拒絕 H0
 若真 μ = 211
z  ( x  211) /(46 / n )
20
 希望能正確拒絕虛無假設的機率為
1-β=0.95
 對應 β=0.05 的 z 值為 -1.645
z  1.645  ( x  211) /(46 / n )
x  211  1.645(46 / n ) (2)
 將兩個對樣本平均數 x 的算式放在一起
180  2.32(46 / n )  211  1.645(46 / n )
21
n (211  180)  2.32   1.645(46)
 2.32  1.645(46) 
2
n   34.6
 (211  180) 
 依慣例，對於樣本數估計的小數點都會
以無條件進位
 需要以 35 為樣本數
22

07 Hypothesis

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

07 Hypothesis

Uploaded by

Copyright:

Available Formats

七、假設檢定

 Reject H0 when x > 195.1

 在樣本平均數 x  180  2.32(46 / n ) (1)

You might also like