Professional Documents
Culture Documents
貝氏定理淺談
貝氏定理淺談
壹、前言
貝氏定理(Bayes' theorem)是條件機率中的一個重要內容,在歷史上,貝氏定理被歸之於
十八世紀英國長老派教會牧師貝氏( Reverend Thomas Bayes, 1702-1761)所提出。事實上,貝
氏並未明確給出定理的公式,只是在一篇論文〈關於解決機遇論的一個問題 "An Essay towards
solving a Problem in the Doctrine of Chances."〉中,討論其相關問題,法國著名的數學家拉普
拉斯( Laplace 1749-1827),才是第一位給出明確公式的人。甚至於貝氏在生前並沒有公布他
的發現,而是由他的一位牧師朋友,也是數學家的普萊斯 (Richard Price),於 1764 年將貝氏
的論文發表在英國皇家學會的會刊上。
據說貝氏在一次玩弄條件機率的公式時,無意中發現這些公式都是內部對稱的。這意味
著,我們可以由因向果來計算“正向機率”,也可以反轉過來由果向因以計算所謂的 “逆機率
(inverse probability)”。譬如:某零件可由 3 條不同的生產線甲、乙、丙生產,每條生產線所
生產的零件各佔產品比例:20%, 50% 與 30%,而根據經驗,每條生產線所生產的零件是瑕
疵品的比例分別為 4%, 2% 與 3%,那麼我們可以計算已知由甲生產,而產品為瑕疵品的比
例;也可以反問若抽樣的零件為瑕疵品,則由甲生產線生產的機率多大?
欲計算後面事件發生的機率而以前面發生的事件為條件,是有意義而且一般認知說的通
的;貝氏特別之處在於發現也可以反過來考量,在後面事件已發生的條件下,反問前面的事
件發生的機率。既然前面的事件都已經發生過了,還要再問事件發生的機率,這看似沒有什
麼道理的思維,結果卻深刻地影響了後來統計學的發展。利用貝氏定理,當我們碰到的現象
背後變因有很多時,經由分析各項變因的事前機率(Prior probability)和蒐集的新資訊,可以
幫助我們反推測哪個才最可能是主要的原因,釐清前後關聯,進而做出正確的判斷和決策。
今日,它被廣泛應用在許多領域中,例如:流行病學、藥品檢驗、品質管理等。
因為要談貝氏定理須以條件機率為基礎,以下,我們主要針對條件機率以及貝氏定理,
給出一些經典問題的範例,從中比較與體會條件機率與貝氏定理的異同、應用,並增進瞭解
貝氏思維的精神。
貳、內容
一、條件機率(Conditional Probability)
P( A B)
事件 B 發生的條件機率為 P( B | A) 。
P( A)
機率乘法原理: P( A B) P( A) P( B | A) 。
1
在舉例前,我想先引用黃文璋教授在數學傳播〈機率應用不易〉文章中的一句話起個頭。
「機率很難,尤其條件機率。」
表示前 n 次取球球號總和是偶數的機率,則
4 5 5 1 4
Pn1 Pn (1 Pn ) Pn ,其中 P1 ,解以上遞迴關係式,得
9 9 9 9 9
1 1 1 1
Pn 1 ( )n ,故所求 P10 1 ( )10 。
2 9 2 9
上例中不僅用到了遞迴關係式的技巧,以及條件機率的乘法原理,也在不知不覺間,運
用到了獨立事件 P( B) P( B | A) 的概念。
a
證:令 Ai 表示第 i 次取到白球的事件。容易得知 P( A1 ) ,而為求 P( A2 ) ,不妨參考
ab
以下的機率樹狀圖
第一次取球(機率) 加入同色球c顆 第二次取球(機率)
a a+c
白球( * )
a+b a+b+c
a
白球( ) 白球c顆
a+b a b
黑球( * )
a+b a+b+c
b a
白球( * )
b a+b a+b+c
黑球( ) 黑球c顆
a+b
b b+c
黑球( * )
a+b a+b+c
可知 P( A2 )
a ac b a a ac b a
( )
ab a bc a b a bc a b a bc a bc a b
a
接下來,假設 P( Ak ) ,
ab
則當 n k 1,第 k 1 次取球時,袋中共有 a b kc 顆球,而 P( Ak 1 )
2
P( Ak 1 Ak ) P( Ak 1 Ak ) P( Ak ) P( Ak 1 | Ak ) P( Ak ) P( Ak 1 | Ak ) ,
a
a b (k 1)c c
由 P( Ak 1 | Ak ) a b
a
bc
a b kc a b (a b)(a b kc)
a
a b (k 1)c
P( Ak 1 | Ak ) ab a ac
a b kc a b (a b)(a b kc)
a a bc
知 P( Ak 1 Ak ) P( Ak ) P( Ak 1 | Ak )
a b a b (a b)(a b kc)
b a ac
P( Ak 1 Ak ) P( Ak ) P( Ak 1 | Ak )
a b a b (a b)(a b kc)
a
所求 P( Ak 1 ) P( Ak 1 Ak ) P( Ak 1 Ak ) ,由數學歸納法得證。
ab
在此例中,用到了全機率(theorem of total probability) P( B) P( B A) P( B A) 的
率是不隨時間轉移的;也就是說,以前傳染病爆發與否對現在沒有影響。
例 3. 假設生男孩、女孩的機率是一樣的。
(1)某戶有兩個小孩,已知老大是男生,請問老二是男生的機率為何?
(2)某戶有兩個小孩,已知其中一個是男生,請問另外一個是男生的機率為何?
解:(1)令 A 表示老大是男生的事件, B 表示老二是男生的事件,
P( A B) 1 / 4 1
所求 P( B | A) 。
P( A) 1/ 2 2
1
(2)令樣本空間 S { (男,男),(男,女),(女,男),(女,女) } ,不難算出所求為 。
3
1 1
上例中兩小題的答案分別為 與 ,是因為例 3.(1)中的男生已知為特定對象,而例 3.(2)
2 3
中的男生非為特定對象的差別。看似不難,其實容易混淆,只要題目敘述稍模糊,就可能變
成文字遊戲題了。類似情境題如下:
類 3-1.已知某戶有兩個小孩,但不知性別為何?有天郵差按鈴送掛號信,若你看到開門的是
男生,則此家另一個小孩是男生的機率為何?
類 3-2.已知某戶有兩個小孩,但不知性別為何?有天郵差按鈴送掛號信,若鄰居告訴你他看
到兩個搶著開門的小孩,有一個男生,則此家另一個小孩為男生的機率為何?
3
關於條件機率的問題裡,有一個非常有名的經典問題,通常稱之為"蒙提霍爾問題(Monty
Hall problem)",或簡稱"三門問題"。
此問題源自美國的一個電視遊戲節目(Let’s Make a Deal),而問題名稱則來自該節目的主
持人蒙提·霍爾(Monty Hall )。其遊戲的玩法如下:
「有三扇門,每扇門後各有一份獎品,山羊或者汽車,而且僅有一扇門後藏有大獎汽車。
當參賽者從三扇門中選定一門還未開啟時,知道門後情形的主持人會打開剩下兩道門後藏有
山羊的一扇門,露出山羊頭,然後問參賽者:要不要換?」。
而據知實際的情況是,節目主持人的確會在參賽者選定一扇門時,再打開其中一扇藏有
山羊的門,但目的只是為了增加節目的刺激感,未必有允許參賽者真正換門。
總之,這個問題非常有趣。直覺上,還未打開的兩扇門,換與不換,中大獎的機率不是
1
都是 嗎?換有何優勢?當年瑪莉蓮·沃斯·莎凡特(Marilyn vos Savant 1980 年代中期因智商
2
228 擠身《金氏世界紀錄》中的紀錄保持人。)答覆此問題,提出了違反一般直覺的解答,
認為"換"比較有優勢後,就曾遭到眾多數學家的質疑,而在當時引起了非常多的關注。
以比較不含糊的語句,將蒙提霍爾問題重新描述如下:
例 4.已知參賽者不知道門後設獎情況,但是主持人知道,且當參賽者從三扇門中選定一門後,
主持人一定打開餘下兩扇門中藏有山羊的一道門(若兩扇門後皆為山羊,則隨機選取開
門。),並允許參賽者換門。那麼,參賽者選擇"換"是否比"不換"贏得汽車大獎的機率
較大?機率為何?
解: 關於此問題的解法已經有太多討論,例如,以逆向思考方式:一開始選中汽車門的機率
1 2
只有 ,選中山羊門的機率為 ,所以在主持人打開另一扇藏有山羊的門而僅餘一門
3 3
1
後,相對於最初贏得汽車僅有 的機率來說,換門顯然可以增加贏的機會。
3
再以如下的機率樹狀圖(圖(1))說明,假設 A 門後有汽車, B, C 門後是山羊:
1
乍看之下, e1 , e2 得山羊與 e3 , e4 得汽車的結果各占一半,所以機率皆為 似乎合理,卻
2
疏忽了 e1 , e2 與 e3 , e4 的機率其實並不均等。
把例 4.問題中的情境稍微修改一下。
*
例 4 如果主持人同參賽者一樣,事先不知道門後有什麼獎品,所以隨機選門,若只要門打
開後為汽車,則遊戲結束;那麼當門打開後是山羊時,參賽者"換"有沒有比較有利?
解:在其它條件不變之下,仍然假設 A 門後有汽車, B, C 門後是山羊,則參賽者"換"門的樣
本空間應為 S e1 ( 選 A, 開 B, 換 C ) , e2 ( 選 A, 開 C , 換 B ) , e3 ( 選 B, 開 C , 換 A) ,
e4 ( 選 C , 開 B, 換 A) , e5 ( 選 B, 開 A, end ) , e6 ( 選 C , 開 A, end ) 。
1
其中 S 比 S 增加了 e5 , e6 兩個樣本,不難計算 P(ei )
, i 1, 2,3, 4,5,6 。所以在主持人
6
1
隨機開門見到山羊的條件下,此時參賽者無論換與不換,贏得汽車大獎的機率都是 。
2
5
看完以上兩例,對蒙提霍爾問題是否就明瞭了呢?不妨再思考一下以下問題:
*
思考問題 4-1.在例 4 中,當主持人隨機開門見到山羊後,此時參賽者無論換與不換,獲大獎
1 1
的機率都比一開始的 增加為 。比較例 4.的結論,即使後來參賽者什麼都不做(不
3 2
1
換),機率也能提高嗎?那麼這個變大的機率 是什麼意思呢?
2
1
思考問題 4-2. 換與不換真的沒差嗎?正如參賽者一開始選門得汽車的機率只有 ,但當參
3
賽者"已經"看到主持人打開有山羊的門時,即便是隨機的,難道不能依例 4.中反向思考
的邏輯,然後在心理上"認為"主持人是"特意"打開此門,所以"覺得"此時無論如何換門
還是比較有利的?
想清楚後,以下的一個類似的例子(改編自網路問題 http://forum.pcdvd.com.tw/),各
位應該就可以釐清其解為何了。
類 4-1. 桌上有三把鑰匙可試開一門鎖,其中只有一把是正確的。今甲隨機挑選一把,拿在
手上還沒試開,乙接著隨便挑完一把後馬上拿去試開,結果說打不開。請問此時甲換另
一把還沒被挑到的鑰匙打開門鎖的機率,是否比不換高?
在條件機率的問題中,還有一個經典的應用問題,是關於敏感性問題的調查。所謂敏感
性調查,通常指的是想要調查的問題牽涉到個人的私德或者隱私,使得當事人根本不願回答
或不願正面回答的敏感性問題。既然直接問的話通常沒有效果,所以只好想辦法設計一種迂
迴的方法,盡量在減少當事人顧忌下爭取合作,希望能夠放心回答這經過設計看來沒什麼疑
慮的問題,然後從中分析、獲取我們想要得到的資訊。
其中有一種簡單方式,稱之為「隨檢問答」 (randomized response)的技巧,其問題設計
原則以及施行程序如下:
Problem:
問題 A .敏感問題(例如:你曾經考試作過弊嗎?)
問題 B .不敏感問題(例如:你搭公車上學嗎?)
Procedure:
a.丟一個硬幣。(或從一袋中取球,袋中有 3 紅球、4 白球等。)
b.出現正面,請回答問題 A 。(取到紅球,回答問題 A 。)
c.出現反面,請回答問題 B 。(取到白球,回答問題 B 。)
而被調查人回答問題時,只須回答"是"或"否"。
例 5. 某老師為了想要瞭解自己任課班的學生是不是真的喜歡上數學課,對班上 40 位同學作
了這樣的調查。首先在黑板上寫了兩個問題:
問題 A .你喜歡上數學課嗎? 問題 B .你住在新竹市嗎?
接著發給每位學生一小張空白紙張,再請學生準備一枚硬幣,然後跟學生說:「請你們
6
先丟一次硬幣,如果丟出正面則回答問題 A ,丟出反面回答問題 B ,然後將你們的回
答"是"或"否",寫在剛發下去的空白紙上。注意!請不要告訴我你的硬幣是丟出正面或
反面,或者你是就問題 A 或 B 回答,你的空白紙上只需要填一個字,"是"或"否"。」。
問卷回收後,老師發現有 22 位同學回答"是"。已知該班有 18 位學生住在新竹市,請問
該班學生喜歡上數學課的比例大約為何?
解:設 Y 表學生回答"是"的事件, A 表學生回答問題 A 的事件, B 表學生回答問題 B 的事件
則所求為 P(Y | A) 。
由 P(Y ) P(Y A) P(Y B) P( A) P(Y | A) P( B) P(Y | B)
22 1 1 18 26 13
P(Y | A) P(Y | A) 。
40 2 2 40 40 20
可以推論該班大約 65% 的學生喜歡上數學課。
以上例子,因為老師想要知道的資訊,是班上學生喜歡上這門課的整體比例,而不是針
對個人隱私喜好的回答,所以不以一般的直接問答方式進行調查。而學生回答"是"或"否"時,
既不需要讓老師知道他的硬幣擲出的是正面或反面,也不需要讓老師知道他到底是就問題 A
或者問題 B 回覆,所以在學生心理上多少消除了回答時要顧忌老師對其個人印象扣分的疑
慮,而增加了獲得誠實資訊的機率。
如果有學生非常小心,連是不是住在新竹市的問題都覺得可能是陷阱,那麼還可以修正
以上方法如下:準備一個袋子,裡面置入紅球 3 顆,白球 4 顆,黑球 2 顆,然後讓學生先在
此袋中取一球,事先說明若抽到紅球,則就問題 A 回答"是"或"否";若抽到白球,請直接回
答"是";若抽到黑球,直接回答"否"。
令 Y 表回答"是"的事件, A 為就問題 A 回答事件,W 與 B 分別為抽到白球、黑球事件。
則由 P(Y ) P(Y A) P(Y W ) P(Y B)
P( A) P(Y | A) P(W ) P(Y | W ) P( B) P(Y | B)
3 4 2
P(Y | A) 1 0 ,
9 9 9
再根據調查所得回答"是"的比例 P(Y ) ,即可計算得到 P(Y | A),進而推論出關於敏感問題回
答"是"的大約比例。這種方式的隨機問答,完全不會觸及個人的其它隱私,應該差不多可以
消除不必要的疑慮了吧!
機率值會改變,是機率的特性。而至於機率值的獲得,首先要弄清楚的,應該就是要知
道在什麼條件下?要求什麼事件的機率?然後根據所有可能的資訊,謹慎處理條件改變下,
樣本空間隨之變化對於機率的影響。因此,這樣看來,孰不是條件機率?
7
二、貝氏定理(Bayes' Theorem)
P( Ak B) P( Ak ) P( B | Ak ) P( A ) P( B | Ak )
P( Ak | B) n n k 。
P( B Ai ) P( Ai ) P( B | Ai )
P( B)
i 1 i 1
上述公式,看來就是一個條件機率的表達式,但和一般的條件機率公式有什麼不一樣呢?
其差別就在於一般的條件機率,通常分母 P( B) 為已知(條件的機率發生在待決定的事件之
n
機率(theorem of total probability)公式 P( B) P( A ) P( B | A ) 求出。其中的 P( A ) ,
i 1
i i i
簡單說就是事後的先見之明,其問題所要求解的一定是事後機率,一般用來求出由結果推測
各種可能原因發生的機率。
想像有一套防毒軟體,聲稱病毒偵測準確度達 99%。把它買下並成功安裝後,有一天,
這個軟體突然出現警報提示,此時心中一定以為「唉呀!我的電腦中毒了!」。但是,也許
更應該要問的是「我的電腦真的中毒了嗎?」。因為,防毒軟體廣告中的 99% 準確度通常指
的是當有病毒入侵時,有 99% 會響起警報,而不是響起警報時,有 99%的機會是真的有病毒,
這兩個概念其實是完全不同的。
那麼這個例子的計算結果可以告訴我們什麼呢?難道只是要強調軟體廣告其實沒有那麼
神,其誤判率高達 67%,準確度 99%沒什麼大用嗎?
我想,一方面是提醒我們需要去真正瞭解這裡所宣稱的準確度 99%,其真正的意涵到底
為何?另一方面,則是提醒我們應該要去注意,為什麼此例最後算出來的誤判率1 P( A | B)
1 1 1
會這麼高呢?如果事前機率 P( A) 不是 ,而是 甚至 ,結果又會如何?試算的結果
200 100 10
發現,其誤判率將分別降低為 50%甚至 8%。所以可以這麼說,在一般安全的網路環境下使用
電腦,也許這準確度 99%的軟體警示發生,不必過度反應;但要是不小心瀏覽到不安全的網
站,而警示出現呢?也許這時就能體會這準確度 99%的軟體確實有用,而且希望 P( A | B) 愈
高愈好了!
在流行病學的領域中,關於利用機率理論來計算某種疾病檢驗所帶來的偽陽性比率,也
有許多類似關於機率解讀的問題。說明如下:
1.符號
D :真正有病(disease) D ' :沒病(no disease)
T :檢驗結果為陽性(positive) T :檢驗結果為陰性(negative)
2.名詞解釋
(1) 盛行率(Prevalence P( D) )在某時間點上罹患某病的比例。
(2) 敏感度(Sensitivity P(T | D) )有病的人檢驗結果為陽性的機率。
(3) 特異度(Specificity P(T | D ') )沒病的人檢驗結果為陰性的機率。
(4) 偽陽性(False Positive P(T | D ') )沒病的人被誤檢驗為陽性的機率。
(5) 偽陰性(False Negative P(T | D) )有病的人被誤檢驗為陰性的機率。
3.關心的問題
若檢驗結果呈陽性 (T ) 時,實際上此人罹病的機率 P( D | T ) 為何?
若檢驗結果呈陰性 (T ) 時,實際上此人未罹病的機率 P( D ' | T ) 為何?
9
例 6. 假設根據某段時間的研究報告,一種罕見疾病在某地區每 10 萬人中有 8 人(盛行率)罹
患此病,且在醫學上已有方法可以檢驗此種疾病,但不是百分百有效,對於已經罹患此
病的人有 98%(敏感度)的檢驗結果呈現陽性反應,而對於未染病的人也有 1.6%的機率
(偽陽性)檢驗出罹患此病。已知某人剛做完此疾病的檢驗後呈陽性反應,請問此人真的
罹患此罕見疾病的機率有多大?
8 98 1.6
解:由 P( D) , P(T | D) , P(T | D ') ,以及貝氏定理,
100000 100 100
P(T ) P( D) P(T | D) P( D ') P(T | D ')
8 98 8 1.6
(1 ) 0.01607712
100000 100 100000 100
P( D) P(T | D) 0.0000784
所求 P( D | T ) 0.00488 。
P(T ) 0.01607712
可知此人真的罹患此罕見疾病的機率約為 0.00488,意即每 100000 人做此疾病檢驗呈陽
性反應,約有 488 人真正罹患此病。
這樣的結果乍看之下著實令人意外,在高敏感度的檢驗之下,呈陽性反應者其真正罹病
的機率才只有 0.00488。不過之前防毒軟體例子的經驗恰可以提醒我們,在看到 98%的高準確
度時,也不要輕忽了事前機率(盛行率)才只有 0.00008 的影響。再換一個角度來看,檢驗前,
一個人罹病的機率為 0.00008(每十萬人中有 8 人),如果檢驗後呈陽性反應,則罹病機率升
高為 0.00488(每十萬人中有 488 人),比原先高了約 61 倍,這未嘗不是一個警訊,所以醫生
通常會建議再做一次更精密的檢查,而這也正是數字 0.00488 的意義之一。
所以,如果有一名五十歲左右的婦女,沒有任何症狀,去參加了例行性的乳房 X 光照影
檢查,結果顯示為陽性,醫生該做何建議? 根據統計(資料來源 〈機率陷阱〉):
女性罹患乳癌的機率約為 1%(盛行率)。
如果一名婦女患有乳癌,那麼她檢驗為陽性的機率是 90%(敏感度)。
如果沒有乳癌,檢驗為陽性的機率仍然有 9%(偽陽性)。
利用貝氏定理估算,此婦女真正罹患乳癌的機率不大於 10%,也就是說,每十位檢查呈陽性
的婦女,約有 1 人真正罹患乳癌,而不是"多數"檢驗呈陽性的婦女會罹患乳癌。
有關機率的解讀,實在應該要注意掌握了多少相關的資訊。然後,貝氏定理背後的概念,
並不是只估算一次事後機率就好了,而是說,只要有新的證據(資訊)出現,我們就應該不斷
的修正。所以,如果這位婦女以同樣方式再做一次複檢之後還是陽性反應呢?那麼之前得到
的事後機率(0.09),就變成了新的事前機率,在敏感度與偽陽性條件不變下,可以貝氏定理
計算出新的事後機率(檢驗為陽性而真正罹患乳癌的機率)約為 0.5。此時,對於新的形勢應
如何的判斷與對付,勢必需要重新評估了。
再舉一例來看看貝氏定理的應用(改編自 94 年大學指定科目考試數學甲試題)。
10
例7. 宴會在場的50 位賓客有人偷了主人的珠寶,由於賓客身上都沒有珠寶,而且他們都不
承認偷竊。警方決定動用測謊器,並且只問客人一個問題:「你有沒有偷珠寶?」。已
知若某人說謊,則測謊器顯示他說謊的機率為99%(敏感度);若某人誠實,則測謊器顯
示他誠實的機率是90%。假設竊賊只有一人,則當測謊器顯示一賓客說謊時,該賓客正
是竊賊的機率為何?
解:由貝氏定理,容易計算得到
1 99
50 100 99
P( 竊賊|測謊器顯示說謊 ) 。
1 99 49 90 589
(1 )
50 100 50 100
注意到例 7.中解的機率值遠小於 50%,這樣測謊的結果,能證明測謊器顯示為陽性時,
嫌疑人真的為竊賊嗎?雖然這只是一個模擬例,但實際法庭上的法官對於測謊器測謊的結果
的採用,現在已經愈來愈謹慎,甚至於不予採信。原因除了考量測謊器所顯示結果的證據力
恐有不足外,即使調高了測謊器的敏感度(如調查間諜或恐怖份子,寧願錯殺一百,不可錯放
一人?),結果因為太敏感,同時也提高了清白者可能被誤判的機率,而只要有一個人被誤判,
影響將是誤判者未來大半輩子的幸福。於是,如果測謊器的敏感度不夠,有可能錯放;如果
測謊器的敏感度過高,則可能同時增加了誤判的機率,竟變成了一個兩難之局,難怪測謊器
的使用會有那麼多的爭議。
同樣的爭議也發生在規範運動員參賽資格的使用禁藥檢驗上。想像使用禁藥被檢驗出陽
性反應的機率為 p (敏感度),如果敏感度 p 不夠,有可能錯放造成不公平;如果敏感度過高,
則可能增加了誤判的機率,影響了清白運動員的權益。如 p 99%,運用貝氏定理的思維,應
該要瞭解這 99% 的敏感度通常指的是當有使用禁藥時,有 99%的機率會檢驗出陽性反應,而
不是檢驗顯示陽性時,有 99%的機率運動員有使用禁藥。事實上每年約有十萬名運動員接受
使用禁藥的尿液檢查,但不知道事後有否再以貝氏定理檢驗?更不知道曾有多少清白的運動
員在此程序下遭到誤判?
11
良品的情況下,由"優"的機器所生產的機率為何?而由"普通"或"不佳"的機器生產的機
率又為何?分析比較之後,再做決定!
於是把目前所有的相關資訊列一列,可以得到如下表(1):
機器優劣 機器生產不良品比例( X ) 採購機器( M )比例
表(1) 相關事前機率列表
n
令 S k 表示生產 n 個 DRAM 中有 k 個為不良品的事件。參考表(1)所列,其中機器 M i 所對
估計關於採購到 M i 類機器的事後機率。由貝氏定理,可得
P( M i ) P( S6100 | M i )
P( M i | S6100 ) , i 1,2,3
P( S6100 )
因為該型機器生產每一個 DREM 的製程不會互相影響,所以
12
0.05 0.15001
以及 P( M 3 | S6 ) 0.3307 。
100
0.02268
再由以上計算結果製作如下表(2):
200
們可以再次試驗,譬如在事件 S k 發生的情形下,以貝氏定理再次估算關於 M i 生產的事後
機率。而直觀上,一次一次的對事後機率估計再估計,該機器生產的平均不良率應該是會朝
*
著 x 修正趨近吧!
14
以上幾個例子,讓我們看到了貝氏定理在一些問題應用上的威力。而在許許多多的主題
中,有一個特別引起我興趣的,就是關於吸菸與肺癌之間因果關係的論戰。
關於香菸的歷史,至少可以追朔到十六世紀時美洲原住民利用香菸與靈界溝通的習俗。
但認知到吸菸與健康有關,特別是與肺癌的關聯,並以科學的方式嘗試驗證,則已經是二十
世紀以後的事情了。
1954年,年輕的英國流行病學家多爾(Sir Richard Doll)與他的老師希爾(Sir Austin
Bradford Hill),共同發表了長期追蹤4萬名男醫師的流行病學研究報告,首度證實吸菸與肺
癌相關。但此篇報告雖然對當時許多國家的公共衛生政策造成影響,甚至也成為這方面研究
的典範,卻並未動搖製菸業的根本。特別是美國的菸商大財團,當發現香菸在本土不好經營
後,竟然在美國政府的暗助下改為全球貿易輸出。因此反菸運動經歷了一段各國政府、財團、
民間反菸組織、學術界以及消費者對於香菸態度的一場角力混戰,而且是長期的對抗戰。
不說別的,注意到多爾的研究報告中,所抽樣的對象是英國、男性、醫生族群嗎?即使
還有其他類似的研究報告,其抽樣對象、研究方式,在當時其實經常遭人質疑,而且這些質
疑未必沒有道理。如英國著名的統計學家費雪(Ronald Aylmer Fisher,1890~1962 統計學"變異
數分析"發明者。),即以其老菸槍以及統計學家的身分,終生質疑且反駁吸菸會導致肺癌的
結論。當然,一篇研究論文或許不具代表性,但要是跨越不同地區,長時期,不同方法的許
多研究卻都指向相同的結果,那就另當別論了。如今,吸菸有害健康已經是公認的常識。1996
年4月,有史以來對菸商最重的菸害責任賠償判決出爐。美國波特蘭的陪審團裁定菸商萬寶路
(Marlboro)必須賠償一位叫威廉斯的肺癌死者家屬8100萬美金,原因是這個人生前抽了該品
牌將近40年的香菸。類似的案例可能不會只此一例,而菸商已經漸漸趨於劣勢。這是如何達
到的呢?不要忘了,這是建立在以「證據說話(evidence-based)」為前提的科學研究興起後,
奮戰了好幾十年才達到的共識與成果。
現在,已知吸菸不只會導致肺癌,還被發現是引起心血管疾病的重要危險因子之一。
例 10.下表為某地區心血管疾病調查資料,合計抽樣調查 61,963 人。
心血管疾病 (Y )
每日菸量 ( X )
無 (Y 0) 有 (Y 1) 合計
超過 2 包 ( X 2) 144 24 168
表(3)
15
試利用貝氏定理推估每日菸量 X 包的這些人罹患心血管疾病 Y 的機率,其中隨機變數
X 表每日菸量, Y 表心血管疾病有無。
解:由貝氏定理,所求
P(Y 1, X x) P(Y 1) P( X x | Y 1)
P(Y 1| X x)
P( X x) P(Y 1) P( X x | Y 1) P(Y 0) P( X x | Y 0)
5749 4166
當 x 0 , P(Y 1| X 0) 61963 5749 0.0910 。
5749 4166 56214 41629
61963 5749 61963 56214
同理可以計算得到,
P(Y 1| X 1) 0.0960 , P(Y 1| X 2) 0.1103 , P(Y 1| X 2) 0.1429 。
心血管疾病 (Y )
每日菸量 ( X )
無 (Y 0) 有 (Y 1) 合計
0包 ( X 0) 0.9090 0.0910 1
1包 ( X 1) 0.9040 0.0960 1
2包 ( X 2) 0.8897 0.1103 1
表(4)
回顧吸菸導致肺癌的論戰歷史,當初R.A.費雪質疑沒有證據顯示這兩者之間有直接的因
果關係,不僅有其道理(科學或哲學),而且無法反駁。事實上,即使在機率理論已經有條件
機率(貝氏定理)、統計上有相關係數、邏輯上有實質蘊含的概念,但科學或數學上仍然沒有
一個定理或者一條公式,可以表達出所謂的因果關係。而且,何謂因果關係呢?
任何方法,必有其侷限,也許我們所能做的,就是讓數字自己說話吧!
還有其他類似的議題嗎?近年來科學家正致力於研究長期使用手機是否會因電磁波影響
而導致腦癌?一些研究結果顯示電磁波確實會影響健康,一些研究結果則顯示不會。這樣的情
境是否似曾相識?而兩大陣營的研究,除了學術界的參與,背後還可能有誰?
二十世紀之前因為人類平均壽命不長,吸菸的害處可能根本來不及顯現,即使二十世紀
以後,吸菸導致肺癌的研究,也在經歷了40~50年的努力才看清楚一些事情,得到一些共識。
那麼電磁波是否會影響導致腦癌,需要花多長的時間驗證呢?
16
參、結語
貝氏定理出現之後,因為可以把條件機率反轉過來計算,而且似乎在許多地方大有名堂,
所以引起了一波統計學家的注意,一時也有許多的統計相關文獻中,出現了運用貝氏思維的
方法。但在使用上可能因為觀點的不同,而提出了許多導致不同結果的不同方法,卻沒有明
確的標準來決定哪個是對的,自然也造成不少的混淆與爭議,令許多統計分析學家相當迷惑。
特別的是,許多看來似乎不盡相同的想法,或者方法,招牌上經常掛著共同的 logo ― 貝氏。
所以在一段時間裡,不少統計學家以及學術界,都會盡量避免使用貝氏的相關理論,甚至連
沾上邊都避免,包括著名的統計學家 R.A.費雪。
貝氏統計(Bayesian statistics),是從條件機率所發展而來的統計方法,貝氏定理則為其
基礎理論。除此之外,貝氏思維的主要理論、方法、內容還有哪些?也許在這領域還聽過、
見過的一些與貝氏相關的名詞,如:貝氏層次模型(Bayesian hierarchal model)、貝氏因子
(Bayes factor)、貝氏網路(Bayesian network)
、貝氏分類(Bayesian classifier)等等,其實都
不是我能夠馬上說明或者弄清楚。倒是有一個一般人比較熟悉且與貝氏有關的名詞,並沒有
冠上貝氏兩個字,可以稍微補充一下,那就是 ― 主觀機率(subjective probability)。可以這
麼說,貝氏統計思維的立論基礎,主觀機率是有別於其它統計學派的一個主要支柱。
大致上來說,統計學主要分為兩大學派,古典統計學(classical statistics)與貝氏統計學,
其最大的爭議在於「看待母體參數的方式」不同。古典統計學派將母體參數視為有待估計的
「未知常數」,相信一定存在,只是一般不知此定值為何?相反的,貝氏統計學派則是將母
體參數視為「隨機變數」,只能猜測母體參數的機率分布為何?若從機率的角度而言,則可
以說這兩個學派在探討「不確定性」這件事時的出發點與立足點不同,古典統計學立基於客
觀機率,而貝氏統計學則仰賴於主觀機率。
經過反覆試驗得出 依憑個人主觀信念
可用統計工具驗證 不需(也不能) 被驗證
一般而言未知 總是可以任意假定
表(5)
乍看之下,因為客觀機率不涉及個人的主觀判斷,似乎較有說服力讓人容易接受。但有
沒有可能某些機率是沒有辦法重複試驗得到呢? 相反的,如同貝氏定理中的事前機率,即是
典型的主觀機率(或稱 Personal Probability),可以依憑個人經驗設定。但怎麼知道自己給定的
前提為真呢?所以在統計的應用上造成分歧,當然就會遭受到不同觀點統計學家的互相質疑。
綜上所述,應該要體認到兩個學派的爭論,其實並不是一個非黑即白的零和問題。兩個
學派均各有其信仰哲學、內在邏輯、合理性和局限性,看來誰也不能全對,誰也沒辦法取代
誰。既然勢將共存,若能有競有合、激盪發展,相信才是上佳之策。
17
肆、自學練習
1. 某旅館有三間房間,其中一間有兩個男生住進去,一間有兩個女生入住,剩下一間則住進
一男一女。正當服務生敲其中一間房門時,房間裡傳來女性的聲音說:"我正在忙,不知道
是誰來了?你去開門!"。 請問:聽話來開門的另一人,是男生的機率為何?
2. 某遊戲有 4 道門,其中只有一道門後有獎,而且主持人知情,參賽者不知。當參賽者選定
一門後,主持人一定打開一道沒有獎的空門(在所剩沒獎的門中隨機打開),然後允許參賽
者有換門的機會。請問參賽者此時"換"或"不換",得獎的機率分別為何?
4. 某教授為了調查學生曾經考試作弊的機率,並希望學生能夠坦誠回答,設計了以下問題:
問題 A :你是否考試作弊過? 問題 B :你的生日是否在五月?
然後要被測學生先自行擲一枚硬幣,若出現正面,回答問題 A ;反面則回答問題 B 。已
知該次測試學生回答"是"的機率為 q ,試估計學生曾經考試作弊的機率為何?
5. 有三個箱子A、B、C,每個箱子各有兩個抽屜。在箱子A 的兩個抽屜裏各放置一枚金幣,
在箱子B 的兩個抽屜裏各放置一枚銀幣,在箱子C 的兩個抽屜裏,一個放置一枚金幣,一
個放置一枚銀幣。隨意選一個箱子,再隨意打開箱子的一個抽屜,如果發現那裏放置了一
枚金幣的話,那麼另外那個抽屜裏也放置一枚金幣的機率為何?
7. 有甲、乙、丙三名囚犯,國王決定釋放其中一位,處決另兩位。他把結果告訴獄卒,但要
求獄卒不可以透露給當事人相關的資訊出去。甲在偷偷問獄卒那一位會被釋放不得要領
後,改問獄卒"那麼乙跟丙,那一位會被處決? "。獄卒想了一下,認為這樣做並不會提供
甲任何有關他會被釋放或處決的有利訊息,於是告訴甲"乙會遭處決"。甲聽到後暗自高
興,覺得自己被釋放的機率提高變為50%了。試問:
18
(1) 在獄卒告訴甲新的資訊後,甲會被釋放的機率為何?
(2) 若此時丙走進來偷聽到獄卒與甲的對話,丙會被釋放的機率為何?
8. 難得的春假期間,甲規劃了一個三天假期的家庭旅遊,但是擔心家裡的植物沒人照顧,所
以拜託鄰居幫忙澆水。假設甲有一棵植物特別嬌弱需要照顧,如果不澆水的話有80%的機
率枯萎,即使澆水,也有15%的機率存活不下來,而甲確信他的鄰居有9成的機率不會忘記
澆水,則當假期結束時:
(1) 甲的這棵植物存活下來的機率為何?
(2) 若甲的這棵植物沒有存活下來,則原因是鄰居忘記澆水的機率為何?
9. 某公司計畫推出新產品,並認為經濟景氣的好壞會影響新產品的銷售,公司行銷經理主觀
判斷景氣好、普通、不好的機率各為0.5、0.2、0.3。今公司委託專業市調公司進行市場
景氣調查,但該市調公司之調查並非百分之百正確,根據過去經驗,其正確率為0.9,不
正確的誤判為其它兩種景氣狀況的機率各為0.05。若該市調公司調查結果為景氣好,則市
場景氣真正是好的機率為何?
參考答案:
1 3 5 2 6 1
1. 2. "換"中獎 ,不中 ;"不換"中獎 ,不中 3. (1)不會,機率各 (2)
3 8 8 8 8 2
3 2 6 5 5 2
P(甲) ; P(乙) (3) 一發 P(甲) ; P(乙) ;二發 P(甲) ; P(乙)
5 5 11 11 7 7
1 2 12 1 2
4. 2q 5. 6. 7. (1) (2) 8. (1) 0.785 (2) 0.3721
12 3 29 3 3
9. 0.95 10. (1) 6; 24 (2) 0.8
19
伍、參考資料
[1] 蘇俊鴻 貝葉斯和貝氏定理(1) 科學 Online (網站)
[2] 黃文璋 機率應用不易 數學傳播 34 卷 1 期 民 99 年 3 月
[3] 黃提源 機率論 協進圖書
[4] 曼羅迪諾(Leonard Mlodinow)著 胡守仁譯 醉漢走路 天下文化
[5] 鄧進財 談統計應用 數學知識(網站)
[6] 薩爾斯伯格(David Salaburg)著 葉偉文譯 統計改變了世界 天下文化
[7] 捷爾德·蓋格瑞澤(Gerd Gigerenzer)著 廖育琳等譯 機率陷阱 商周出版
[8] Anthony O’Hagan Probability: Methods and measurement(p.59~61) Chapman and Hall
[9] 林宜平 小蝦米對抗大鯨魚:流行病學研究的利益與衝突 科學發展 437 期 2009.05
[10]蘇上豪 那些年,我們怎麼知道菸有害? PanSci 泛科學(網站)
20