貝氏定理淺談

貝氏定理淺談
壹、前言
貝氏定理(Bayes' theorem)是條件機率中的一個重要內容，在歷史上，貝氏定理被歸之於
十八世紀英國長老派教會牧師貝氏( Reverend Thomas Bayes, 1702-1761)所提出。事實上，貝
氏並未明確給出定理的公式，只是在一篇論文〈關於解決機遇論的一個問題 "An Essay towards
solving a Problem in the Doctrine of Chances."〉中，討論其相關問題，法國著名的數學家拉普
拉斯( Laplace 1749-1827)，才是第一位給出明確公式的人。甚至於貝氏在生前並沒有公布他
的發現，而是由他的一位牧師朋友，也是數學家的普萊斯 (Richard Price)，於 1764 年將貝氏
的論文發表在英國皇家學會的會刊上。
據說貝氏在一次玩弄條件機率的公式時，無意中發現這些公式都是內部對稱的。這意味
著，我們可以由因向果來計算“正向機率”，也可以反轉過來由果向因以計算所謂的 “逆機率
(inverse probability)”。譬如：某零件可由 3 條不同的生產線甲、乙、丙生產，每條生產線所
生產的零件各佔產品比例：20%, 50% 與 30%，而根據經驗，每條生產線所生產的零件是瑕
疵品的比例分別為 4%, 2% 與 3%，那麼我們可以計算已知由甲生產，而產品為瑕疵品的比
例；也可以反問若抽樣的零件為瑕疵品，則由甲生產線生產的機率多大？
欲計算後面事件發生的機率而以前面發生的事件為條件，是有意義而且一般認知說的通
的；貝氏特別之處在於發現也可以反過來考量，在後面事件已發生的條件下，反問前面的事
件發生的機率。既然前面的事件都已經發生過了，還要再問事件發生的機率，這看似沒有什
麼道理的思維，結果卻深刻地影響了後來統計學的發展。利用貝氏定理，當我們碰到的現象
背後變因有很多時，經由分析各項變因的事前機率(Prior probability)和蒐集的新資訊，可以
幫助我們反推測哪個才最可能是主要的原因，釐清前後關聯，進而做出正確的判斷和決策。
今日，它被廣泛應用在許多領域中，例如：流行病學、藥品檢驗、品質管理等。
因為要談貝氏定理須以條件機率為基礎，以下，我們主要針對條件機率以及貝氏定理，
給出一些經典問題的範例，從中比較與體會條件機率與貝氏定理的異同、應用，並增進瞭解
貝氏思維的精神。
貳、內容
一、條件機率(Conditional Probability)
定義：設 A, B 為樣本空間 S 中的兩個事件， P( A)  0 ，則在事件 A 發生的條件下，
P( A  B)
事件 B 發生的條件機率為 P( B | A)  。
P( A)
機率乘法原理： P( A  B)  P( A)  P( B | A) 。
1
在舉例前，我想先引用黃文璋教授在數學傳播〈機率應用不易〉文章中的一句話起個頭。
「機率很難，尤其條件機率。」
例 1. 設一袋中有編號 1~9 號的九顆球，每球被取到的機率相等。若每次從中取一球，記錄

球號後放回，則取球 10 次，球號總和為偶數的機率為何？
解：因為第 n  1次取球後，球號總和為偶數的關鍵是前 n 次取球總和是奇數還是偶數。令 Pn
表示前 n 次取球球號總和是偶數的機率，則
4 5 5 1 4
Pn1  Pn  (1  Pn )   Pn ，其中 P1  ，解以上遞迴關係式，得
9 9 9 9 9
1 1  1 1 
Pn  1  ( )n  ，故所求 P10  1  ( )10  。
2 9  2 9 
上例中不僅用到了遞迴關係式的技巧，以及條件機率的乘法原理，也在不知不覺間，運
用到了獨立事件 P( B)  P( B | A) 的概念。
例 2. 設一袋中有 a 個白球， b 個黑球，每球被取到的機率相等。若每次從中取一球，然後再

以同色球 c 個加入袋中。同樣的過程重複 n 次，試證每次取到白球的機率相等。
a
證：令 Ai 表示第 i 次取到白球的事件。容易得知 P( A1 )  ，而為求 P( A2 ) ，不妨參考
ab
以下的機率樹狀圖
第一次取球(機率) 加入同色球c顆第二次取球(機率)
a a+c
白球( * )
a+b a+b+c
a
白球( ) 白球c顆
a+b a b
黑球( * )
a+b a+b+c
b a
白球( * )
b a+b a+b+c
黑球( ) 黑球c顆
a+b
b b+c
黑球( * )
a+b a+b+c
可知 P( A2 ) 
a ac b a a ac b a
    (  )
ab a bc a b a bc a b a bc a bc a b
a
接下來，假設 P( Ak )  ，
ab
則當 n  k  1，第 k  1 次取球時，袋中共有 a  b  kc 顆球，而 P( Ak 1 ) 
2
P( Ak 1  Ak )  P( Ak 1  Ak )  P( Ak )  P( Ak 1 | Ak )  P( Ak )  P( Ak 1 | Ak ) ，
a
 a  b  (k  1)c   c
由 P( Ak 1 | Ak )  a  b 
a

bc
a  b  kc a  b (a  b)(a  b  kc)
a
 a  b  (k  1)c  
P( Ak 1 | Ak )  ab  a  ac
a  b  kc a  b (a  b)(a  b  kc)
a  a bc 
知 P( Ak 1  Ak )  P( Ak )  P( Ak 1 | Ak )  
a  b  a  b (a  b)(a  b  kc) 
b  a ac 
P( Ak 1  Ak )  P( Ak )  P( Ak 1 | Ak )  
a  b  a  b (a  b)(a  b  kc) 
a
所求 P( Ak 1 )  P( Ak 1  Ak )  P( Ak 1  Ak )  ，由數學歸納法得證。
ab
在此例中，用到了全機率(theorem of total probability) P( B)  P( B  A)  P( B  A) 的
概念。以上問題又稱 Polya 模型，是曾用於描述傳染病現象的一個簡化的數學模型(白球代表
不爆發，黑球代表爆發)，且由此結論， P( An ) 的機率與 n ， c 無關，意謂不爆發傳染病的機
率是不隨時間轉移的；也就是說，以前傳染病爆發與否對現在沒有影響。
例 3. 假設生男孩、女孩的機率是一樣的。
(1)某戶有兩個小孩，已知老大是男生，請問老二是男生的機率為何？
(2)某戶有兩個小孩，已知其中一個是男生，請問另外一個是男生的機率為何？
解：(1)令 A 表示老大是男生的事件， B 表示老二是男生的事件，
P( A  B) 1 / 4 1
所求 P( B | A)    。
P( A) 1/ 2 2
1
(2)令樣本空間 S  { (男,男)，(男,女)，(女,男)，(女,女) } ，不難算出所求為。
3
1 1
上例中兩小題的答案分別為與，是因為例 3.(1)中的男生已知為特定對象，而例 3.(2)
2 3
中的男生非為特定對象的差別。看似不難，其實容易混淆，只要題目敘述稍模糊，就可能變
成文字遊戲題了。類似情境題如下：
類 3-1.已知某戶有兩個小孩，但不知性別為何？有天郵差按鈴送掛號信，若你看到開門的是
男生，則此家另一個小孩是男生的機率為何？
類 3-2.已知某戶有兩個小孩，但不知性別為何？有天郵差按鈴送掛號信，若鄰居告訴你他看
到兩個搶著開門的小孩，有一個男生，則此家另一個小孩為男生的機率為何？
3
關於條件機率的問題裡，有一個非常有名的經典問題，通常稱之為"蒙提霍爾問題(Monty
Hall problem)"，或簡稱"三門問題"。
此問題源自美國的一個電視遊戲節目(Let’s Make a Deal)，而問題名稱則來自該節目的主
持人蒙提·霍爾(Monty Hall )。其遊戲的玩法如下：
「有三扇門，每扇門後各有一份獎品，山羊或者汽車，而且僅有一扇門後藏有大獎汽車。
當參賽者從三扇門中選定一門還未開啟時，知道門後情形的主持人會打開剩下兩道門後藏有
山羊的一扇門，露出山羊頭，然後問參賽者：要不要換？」。
而據知實際的情況是，節目主持人的確會在參賽者選定一扇門時，再打開其中一扇藏有
山羊的門，但目的只是為了增加節目的刺激感，未必有允許參賽者真正換門。
總之，這個問題非常有趣。直覺上，還未打開的兩扇門，換與不換，中大獎的機率不是
1
都是嗎？換有何優勢？當年瑪莉蓮·沃斯·莎凡特（Marilyn vos Savant 1980 年代中期因智商
2
228 擠身《金氏世界紀錄》中的紀錄保持人。）答覆此問題，提出了違反一般直覺的解答，
認為"換"比較有優勢後，就曾遭到眾多數學家的質疑，而在當時引起了非常多的關注。
以比較不含糊的語句，將蒙提霍爾問題重新描述如下：
例 4.已知參賽者不知道門後設獎情況，但是主持人知道，且當參賽者從三扇門中選定一門後，
主持人一定打開餘下兩扇門中藏有山羊的一道門(若兩扇門後皆為山羊，則隨機選取開
門。)，並允許參賽者換門。那麼，參賽者選擇"換"是否比"不換"贏得汽車大獎的機率
較大？機率為何？
解：關於此問題的解法已經有太多討論，例如，以逆向思考方式：一開始選中汽車門的機率
1 2
只有，選中山羊門的機率為，所以在主持人打開另一扇藏有山羊的門而僅餘一門
3 3
1
後，相對於最初贏得汽車僅有的機率來說，換門顯然可以增加贏的機會。
3
再以如下的機率樹狀圖(圖(1))說明，假設 A 門後有汽車， B, C 門後是山羊：
參賽者(選門機率) 主持人(開門機率) 參賽者(換門獲獎機率)

1 1 1 1
1 B 門( ) 選A換C得山羊( * = )
2 3 2 6
A 門( )
3
汽車 1 1 1 1
C 門( ) 選A換B得山羊( * = )
2 3 2 6
1 1 1
B 門( ) C 門(1) 選B換A 得汽車( *1= )
3 3 3
山羊
1 1 1
C 門( ) B 門(1) 選C換A得汽車( *1= ) 圖(1)
3 3 3
山羊
2
可以得結論，"換"贏得汽車大獎的機率為。
3
4
那麼現在看來簡單的解釋，何以當初困惑眾人呢？也許，條件機率的困難之處，就在於
能不能看清楚樣本空間的變化，以及變化後對機率的影響吧！
以後見之明，在 A 門後有汽車， B, C 門後是山羊的假設下，依規則，參賽者選門，主
持人開門，然後參賽者"換"門，動作完成的樣本空間可為
S  e1 ( 選 A, 開 B, 換 C )，e2 ( 選 A, 開 C , 換 B)，e3 ( 選 B, 開 C , 換 A)，e4 ( 選 C , 開 B, 換 A)
1
乍看之下， e1 , e2 得山羊與 e3 , e4 得汽車的結果各占一半，所以機率皆為似乎合理，卻
2
疏忽了 e1 , e2 與 e3 , e4 的機率其實並不均等。
以條件機率的理論計算，令 Ai 表示參賽者第 i 次選門，選擇 A 門的事件， Bi , Ci 同理，
i  1,2 ； B 表示主持人開門，打開 B 門的事件， C 同理。則

1 1 1
P(e1 )  P( A1  B  C2 )  P( A1 )  P(B | A1 )  P(C2 | A1  B)    1  ；同理
3 2 6
1
P(e2 )  ，此為換門得山羊的機率。
6
1 1
P(e3 )  P( B1  C  A2 )  P( B1 )  P(C | B1 )  P( A2 | B1  C)  1 1  ；同理
3 3
1
P(e4 )  ，此為換門得汽車的機率。
3
2
由此可以推論，參賽者"換"門贏得汽車大獎的機率將提高為 P(e3 )  P(e4 )  。
3
把例 4.問題中的情境稍微修改一下。
*
例 4 如果主持人同參賽者一樣，事先不知道門後有什麼獎品，所以隨機選門，若只要門打
開後為汽車，則遊戲結束；那麼當門打開後是山羊時，參賽者"換"有沒有比較有利？
解：在其它條件不變之下，仍然假設 A 門後有汽車， B, C 門後是山羊，則參賽者"換"門的樣
本空間應為 S   e1 ( 選 A, 開 B, 換 C ) ， e2 ( 選 A, 開 C , 換 B ) ， e3 ( 選 B, 開 C , 換 A) ，
e4 ( 選 C , 開 B, 換 A) ， e5 ( 選 B, 開 A, end ) ， e6 ( 選 C , 開 A, end ) 。
1
其中 S  比 S 增加了 e5 , e6 兩個樣本，不難計算 P(ei ) 
, i  1, 2,3, 4,5,6 。所以在主持人
6
1
隨機開門見到山羊的條件下，此時參賽者無論換與不換，贏得汽車大獎的機率都是。
2
5
看完以上兩例，對蒙提霍爾問題是否就明瞭了呢？不妨再思考一下以下問題：
*
思考問題 4-1.在例 4 中，當主持人隨機開門見到山羊後，此時參賽者無論換與不換，獲大獎
1 1
的機率都比一開始的增加為。比較例 4.的結論，即使後來參賽者什麼都不做(不
3 2
1
換)，機率也能提高嗎？那麼這個變大的機率是什麼意思呢？
2
1
思考問題 4-2. 換與不換真的沒差嗎？正如參賽者一開始選門得汽車的機率只有，但當參
3
賽者"已經"看到主持人打開有山羊的門時，即便是隨機的，難道不能依例 4.中反向思考
的邏輯，然後在心理上"認為"主持人是"特意"打開此門，所以"覺得"此時無論如何換門
還是比較有利的？
想清楚後，以下的一個類似的例子(改編自網路問題 http://forum.pcdvd.com.tw/)，各
位應該就可以釐清其解為何了。
類 4-1. 桌上有三把鑰匙可試開一門鎖，其中只有一把是正確的。今甲隨機挑選一把，拿在
手上還沒試開，乙接著隨便挑完一把後馬上拿去試開，結果說打不開。請問此時甲換另
一把還沒被挑到的鑰匙打開門鎖的機率，是否比不換高？
在條件機率的問題中，還有一個經典的應用問題，是關於敏感性問題的調查。所謂敏感
性調查，通常指的是想要調查的問題牽涉到個人的私德或者隱私，使得當事人根本不願回答
或不願正面回答的敏感性問題。既然直接問的話通常沒有效果，所以只好想辦法設計一種迂
迴的方法，盡量在減少當事人顧忌下爭取合作，希望能夠放心回答這經過設計看來沒什麼疑
慮的問題，然後從中分析、獲取我們想要得到的資訊。
其中有一種簡單方式，稱之為「隨檢問答」 (randomized response)的技巧，其問題設計
原則以及施行程序如下：
Problem：
問題 A .敏感問題(例如：你曾經考試作過弊嗎？)
問題 B .不敏感問題(例如：你搭公車上學嗎？)
Procedure：
a.丟一個硬幣。(或從一袋中取球，袋中有 3 紅球、4 白球等。)
b.出現正面，請回答問題 A 。(取到紅球，回答問題 A 。)
c.出現反面，請回答問題 B 。(取到白球，回答問題 B 。)
而被調查人回答問題時，只須回答"是"或"否"。
例 5. 某老師為了想要瞭解自己任課班的學生是不是真的喜歡上數學課，對班上 40 位同學作
了這樣的調查。首先在黑板上寫了兩個問題：
問題 A .你喜歡上數學課嗎？問題 B .你住在新竹市嗎？
接著發給每位學生一小張空白紙張，再請學生準備一枚硬幣，然後跟學生說：「請你們
6
先丟一次硬幣，如果丟出正面則回答問題 A ，丟出反面回答問題 B ，然後將你們的回
答"是"或"否"，寫在剛發下去的空白紙上。注意！請不要告訴我你的硬幣是丟出正面或
反面，或者你是就問題 A 或 B 回答，你的空白紙上只需要填一個字，"是"或"否"。」。
問卷回收後，老師發現有 22 位同學回答"是"。已知該班有 18 位學生住在新竹市，請問
該班學生喜歡上數學課的比例大約為何？
解：設 Y 表學生回答"是"的事件， A 表學生回答問題 A 的事件， B 表學生回答問題 B 的事件
則所求為 P(Y | A) 。
由 P(Y )  P(Y  A)  P(Y  B)  P( A)  P(Y | A)  P( B)  P(Y | B)
22 1 1 18 26 13
   P(Y | A)    P(Y | A)   。
40 2 2 40 40 20
可以推論該班大約 65% 的學生喜歡上數學課。
以上例子，因為老師想要知道的資訊，是班上學生喜歡上這門課的整體比例，而不是針
對個人隱私喜好的回答，所以不以一般的直接問答方式進行調查。而學生回答"是"或"否"時，
既不需要讓老師知道他的硬幣擲出的是正面或反面，也不需要讓老師知道他到底是就問題 A
或者問題 B 回覆，所以在學生心理上多少消除了回答時要顧忌老師對其個人印象扣分的疑
慮，而增加了獲得誠實資訊的機率。
如果有學生非常小心，連是不是住在新竹市的問題都覺得可能是陷阱，那麼還可以修正
以上方法如下：準備一個袋子，裡面置入紅球 3 顆，白球 4 顆，黑球 2 顆，然後讓學生先在
此袋中取一球，事先說明若抽到紅球，則就問題 A 回答"是"或"否"；若抽到白球，請直接回
答"是"；若抽到黑球，直接回答"否"。
令 Y 表回答"是"的事件， A 為就問題 A 回答事件，W 與 B 分別為抽到白球、黑球事件。
則由 P(Y )  P(Y  A)  P(Y  W )  P(Y  B)
 P( A)  P(Y | A)  P(W )  P(Y | W )  P( B)  P(Y | B)
3 4 2
  P(Y | A)   1   0 ，
9 9 9
再根據調查所得回答"是"的比例 P(Y ) ，即可計算得到 P(Y | A)，進而推論出關於敏感問題回
答"是"的大約比例。這種方式的隨機問答，完全不會觸及個人的其它隱私，應該差不多可以
消除不必要的疑慮了吧！
機率值會改變，是機率的特性。而至於機率值的獲得，首先要弄清楚的，應該就是要知
道在什麼條件下？要求什麼事件的機率？然後根據所有可能的資訊，謹慎處理條件改變下，
樣本空間隨之變化對於機率的影響。因此，這樣看來，孰不是條件機率？
7
二、貝氏定理(Bayes' Theorem)
設  A1 , A2 , A3 , , An  為樣本空間 S 的一組分割， B 為 S 的一個事件。若 P( B)  0 ，
P( Ai )  0 , i  1, 2, , n ，則在事件 B 發生的情況下，事件 Ak , 1  k  n 發生的機率為
P( Ak  B) P( Ak )  P( B | Ak ) P( A )  P( B | Ak )
P( Ak | B)   n  n k 。
 P( B  Ai )  P( Ai )  P( B | Ai )
P( B)
i 1 i 1
上述公式，看來就是一個條件機率的表達式，但和一般的條件機率公式有什麼不一樣呢？
其差別就在於一般的條件機率，通常分母 P( B) 為已知(條件的機率發生在待決定的事件之
前)；而貝氏定理中的 P( B) ，則須透過 P( Ai ) 以及 P( B  Ai )  P( Ai )  P( B | Ai ) ，利用全
n
機率(theorem of total probability)公式 P( B)   P( A )  P( B | A ) 求出。其中的 P( A ) ,
i 1
i i i
i  1, 2, , n 稱為事前機率(或先驗機率 Prior probability)，在加入新的資訊 P( B | Ai ) 後，所求
出的 P( Ak | B) , 1  k  n 則為事後機率(或後驗機率 posterior probability)。貝氏定理的精神，
簡單說就是事後的先見之明，其問題所要求解的一定是事後機率，一般用來求出由結果推測
各種可能原因發生的機率。
想像有一套防毒軟體，聲稱病毒偵測準確度達 99%。把它買下並成功安裝後，有一天，
這個軟體突然出現警報提示，此時心中一定以為「唉呀！我的電腦中毒了！」。但是，也許
更應該要問的是「我的電腦真的中毒了嗎？」。因為，防毒軟體廣告中的 99% 準確度通常指
的是當有病毒入侵時，有 99% 會響起警報，而不是響起警報時，有 99%的機會是真的有病毒，
這兩個概念其實是完全不同的。
為了簡化問題，我們假設平均電腦每 200 個下載的檔案中會有一個帶有病毒。令 A 表示

1
電腦發生中毒的事件， B 表示防毒軟體警示發生的事件，則依據所給資訊 P( A)  (事前
200
99
機率)，以及 P( B | A)  (廣告訊息)，我們想要知道的是 P( A | B) 為何？由貝氏定理
100
1 99

P( A)  P( B | A) 200 100
P( A | B)    0.33
P( A)  P( B | A)  P( A ')  P( B | A ') 1 99 199 1
  
200 100 200 100
8
可知根據防毒軟體的宣稱偵測準確度雖達 99%，但當防毒軟體的警示出現時，電腦真正
中毒的機率才大約為 33%，是不是跟我們原先"以為"的很不一樣呢！
那麼這個例子的計算結果可以告訴我們什麼呢？難道只是要強調軟體廣告其實沒有那麼
神，其誤判率高達 67%，準確度 99%沒什麼大用嗎？
我想，一方面是提醒我們需要去真正瞭解這裡所宣稱的準確度 99%，其真正的意涵到底
為何？另一方面，則是提醒我們應該要去注意，為什麼此例最後算出來的誤判率1  P( A | B)
1 1 1
會這麼高呢？如果事前機率 P( A) 不是，而是甚至，結果又會如何？試算的結果
200 100 10
發現，其誤判率將分別降低為 50%甚至 8%。所以可以這麼說，在一般安全的網路環境下使用
電腦，也許這準確度 99%的軟體警示發生，不必過度反應；但要是不小心瀏覽到不安全的網
站，而警示出現呢？也許這時就能體會這準確度 99%的軟體確實有用，而且希望 P( A | B) 愈
高愈好了！
在流行病學的領域中，關於利用機率理論來計算某種疾病檢驗所帶來的偽陽性比率，也
有許多類似關於機率解讀的問題。說明如下：
1.符號
D ：真正有病(disease) D ' ：沒病(no disease)
T  ：檢驗結果為陽性(positive) T  ：檢驗結果為陰性(negative)
2.名詞解釋
(1) 盛行率（Prevalence P( D) ）在某時間點上罹患某病的比例。

(2) 敏感度（Sensitivity P(T | D) ）有病的人檢驗結果為陽性的機率。

(3) 特異度（Specificity P(T | D ') ）沒病的人檢驗結果為陰性的機率。

(4) 偽陽性（False Positive P(T | D ') ）沒病的人被誤檢驗為陽性的機率。

(5) 偽陰性（False Negative P(T | D) ）有病的人被誤檢驗為陰性的機率。
3.關心的問題
 
若檢驗結果呈陽性 (T ) 時，實際上此人罹病的機率 P( D | T ) 為何?
 
若檢驗結果呈陰性 (T ) 時，實際上此人未罹病的機率 P( D ' | T ) 為何?
9
例 6. 假設根據某段時間的研究報告，一種罕見疾病在某地區每 10 萬人中有 8 人(盛行率)罹
患此病，且在醫學上已有方法可以檢驗此種疾病，但不是百分百有效，對於已經罹患此
病的人有 98%(敏感度)的檢驗結果呈現陽性反應，而對於未染病的人也有 1.6%的機率
(偽陽性)檢驗出罹患此病。已知某人剛做完此疾病的檢驗後呈陽性反應，請問此人真的
罹患此罕見疾病的機率有多大？
8  98  1.6
解：由 P( D)  , P(T | D)  , P(T | D ')  ，以及貝氏定理，
100000 100 100
P(T  )  P( D)  P(T  | D)  P( D ')  P(T  | D ')
8 98 8 1.6
   (1  )  0.01607712
100000 100 100000 100
 P( D)  P(T  | D) 0.0000784
所求 P( D | T )    0.00488 。
P(T  ) 0.01607712
可知此人真的罹患此罕見疾病的機率約為 0.00488，意即每 100000 人做此疾病檢驗呈陽
性反應，約有 488 人真正罹患此病。
這樣的結果乍看之下著實令人意外，在高敏感度的檢驗之下，呈陽性反應者其真正罹病
的機率才只有 0.00488。不過之前防毒軟體例子的經驗恰可以提醒我們，在看到 98%的高準確
度時，也不要輕忽了事前機率(盛行率)才只有 0.00008 的影響。再換一個角度來看，檢驗前，
一個人罹病的機率為 0.00008(每十萬人中有 8 人)，如果檢驗後呈陽性反應，則罹病機率升
高為 0.00488(每十萬人中有 488 人)，比原先高了約 61 倍，這未嘗不是一個警訊，所以醫生
通常會建議再做一次更精密的檢查，而這也正是數字 0.00488 的意義之一。
所以，如果有一名五十歲左右的婦女，沒有任何症狀，去參加了例行性的乳房 X 光照影
檢查，結果顯示為陽性，醫生該做何建議？根據統計(資料來源〈機率陷阱〉)：
女性罹患乳癌的機率約為 1%(盛行率)。
如果一名婦女患有乳癌，那麼她檢驗為陽性的機率是 90%(敏感度)。
如果沒有乳癌，檢驗為陽性的機率仍然有 9%(偽陽性)。
利用貝氏定理估算，此婦女真正罹患乳癌的機率不大於 10%，也就是說，每十位檢查呈陽性
的婦女，約有 1 人真正罹患乳癌，而不是"多數"檢驗呈陽性的婦女會罹患乳癌。
有關機率的解讀，實在應該要注意掌握了多少相關的資訊。然後，貝氏定理背後的概念，
並不是只估算一次事後機率就好了，而是說，只要有新的證據(資訊)出現，我們就應該不斷
的修正。所以，如果這位婦女以同樣方式再做一次複檢之後還是陽性反應呢？那麼之前得到
的事後機率(0.09)，就變成了新的事前機率，在敏感度與偽陽性條件不變下，可以貝氏定理
計算出新的事後機率(檢驗為陽性而真正罹患乳癌的機率)約為 0.5。此時，對於新的形勢應
如何的判斷與對付，勢必需要重新評估了。
再舉一例來看看貝氏定理的應用(改編自 94 年大學指定科目考試數學甲試題)。
10
例7. 宴會在場的50 位賓客有人偷了主人的珠寶，由於賓客身上都沒有珠寶，而且他們都不
承認偷竊。警方決定動用測謊器，並且只問客人一個問題：「你有沒有偷珠寶？」。已
知若某人說謊，則測謊器顯示他說謊的機率為99％(敏感度)；若某人誠實，則測謊器顯
示他誠實的機率是90％。假設竊賊只有一人，則當測謊器顯示一賓客說謊時，該賓客正
是竊賊的機率為何？
解：由貝氏定理，容易計算得到
1 99

50 100 99
P( 竊賊|測謊器顯示說謊 )   。
1 99 49 90 589
   (1  )
50 100 50 100
注意到例 7.中解的機率值遠小於 50%，這樣測謊的結果，能證明測謊器顯示為陽性時，
嫌疑人真的為竊賊嗎？雖然這只是一個模擬例，但實際法庭上的法官對於測謊器測謊的結果
的採用，現在已經愈來愈謹慎，甚至於不予採信。原因除了考量測謊器所顯示結果的證據力
恐有不足外，即使調高了測謊器的敏感度(如調查間諜或恐怖份子，寧願錯殺一百，不可錯放
一人？)，結果因為太敏感，同時也提高了清白者可能被誤判的機率，而只要有一個人被誤判，
影響將是誤判者未來大半輩子的幸福。於是，如果測謊器的敏感度不夠，有可能錯放；如果
測謊器的敏感度過高，則可能同時增加了誤判的機率，竟變成了一個兩難之局，難怪測謊器
的使用會有那麼多的爭議。
同樣的爭議也發生在規範運動員參賽資格的使用禁藥檢驗上。想像使用禁藥被檢驗出陽
性反應的機率為 p (敏感度)，如果敏感度 p 不夠，有可能錯放造成不公平；如果敏感度過高，
則可能增加了誤判的機率，影響了清白運動員的權益。如 p  99%，運用貝氏定理的思維，應
該要瞭解這 99% 的敏感度通常指的是當有使用禁藥時，有 99%的機率會檢驗出陽性反應，而
不是檢驗顯示陽性時，有 99%的機率運動員有使用禁藥。事實上每年約有十萬名運動員接受
使用禁藥的尿液檢查，但不知道事後有否再以貝氏定理檢驗？更不知道曾有多少清白的運動
員在此程序下遭到誤判？
例 8. 竹科園區某記憶體製造廠以一種特定的機器製造 DRAM，並將製造出來 DRAM 的品質區分

為良品或不良品，假設該型機器在生產每一個 DRAM 的製程不會互相影響，且每次製造
出一個 DRAM 為不良品的機率一樣。
最近該工廠添購了一台同型的新機器，根據過去經驗，該型機器依製造 DRAM 的良率可
區分為：優(99%)、普通(97%)，以及不佳(95%)；而進口該機器為優、普通，以及不佳
的可能性依次為 65%、30%、5%。
在機器試用期間，為了決定是否要留下此機器或是要退貨？身為經理人的你決定先對機
器進行測試，結果發現，在初次生產的 100 個 DRAM 中有 6 個不良品。
試問，在觀察到這樣的結果後，你對這台新機器的評價為何?
解：在 100 個 DRAM 中有 6 個不良品，粗估平均不良率為 6%  5%，看來似乎是屬於不佳的機
器，但再看看買到不佳機器的機率也只有 5%，難道運氣真的這麼差？必須要做出退貨的
重大決定嗎？或許，是不是應該要評估一下，在初次生產的 100 個 DRAM 中有 6 個為不
11
良品的情況下，由"優"的機器所生產的機率為何？而由"普通"或"不佳"的機器生產的機
率又為何？分析比較之後，再做決定！
於是把目前所有的相關資訊列一列，可以得到如下表(1)：
機器優劣機器生產不良品比例( X ) 採購機器( M )比例
優( M 1 ) 1  0.99  0.01( X  x1 ) 0.65 ( P( M1 ) )
普通( M 2 ) 1  0.97  0.03 ( X  x2 ) 0.30 ( P( M 2 ) )
不佳( M 3 ) 1  0.95  0.05 ( X  x3 ) 0.05 ( P( M 3 ) )
表(1) 相關事前機率列表
n
令 S k 表示生產 n 個 DRAM 中有 k 個為不良品的事件。參考表(1)所列，其中機器 M i 所對
應生產 DRAM 的不良率為 X  xi ，而採購到 M i 機器的機率為 P( M i ) , i  1,2,3 。我們只
有就這些主觀的事前機率 X  xi 以及 P( M i ) 為依據，想知道在事件 S6 發生的情形下，

100
估計關於採購到 M i 類機器的事後機率。由貝氏定理，可得
P( M i )  P( S6100 | M i )
P( M i | S6100 )  , i  1,2,3
P( S6100 )
因為該型機器生產每一個 DREM 的製程不會互相影響，所以
P(S6100 | M1 )  P(S6100  X  x1 )  C6100 (0.01)6 (0.99)94  0.00046
P(S6100 | M 2 )  P(S6100  X  x2 )  C6100 (0.03)6 (0.97)94  0.04961
P(S6100 | M 3 )  P(S6100  X  x3 )  C6100 (0.05)6 (0.95)94  0.15001

而分母
P(S6100 )  P(S6100  M1 )  P(S6100  M 2 )  P(S6100  M 3 )
 P(M1 )  P(S6100 | M1 )  P(M 2 )  P(S6100 | M 2 )  P( M 3 )  P( S6100 | M 3 )

 0.65  0.00046  0.30  0.04961  0.05  0.15001  0.02268
於是可以分別求得
0.65  0.00046 0.30  0.04961
P( M1 | S6100 )   0.0132 ， P( M 2 | S6100 )   0.6561 ，
0.02268 0.02268
12
0.05  0.15001
以及 P( M 3 | S6 )   0.3307 。
100
0.02268
再由以上計算結果製作如下表(2)：
事前機率新的資訊事後機率
機器優劣 X  xi P( M i ) P(S6100 | M i ) P(M i | S6100 )
優( M 1 ) 0.01 0.65 0.00046 0.0132
普通( M 2 ) 0.03 0.30 0.04961 0.6561
不佳( M 3 ) 0.05 0.05 0.15001 0.3307

表(2) 事前機率、新的資訊與事後機率列表
由上表(2)可以清楚看出，在新的資訊 P( S6 | M i ) , i  1,2,3 加入考量後，發現在初次

100
生產的 100 個 DRAM 中有 6 個為不良品的情形下，由普通機器所生產的機率，將近是不佳

機器所生產的機率的兩倍，再加上所購入同型機器為不佳機器的比例只有 5% 的經驗感
受，如果信念不變，是不是傾向於評估此次新購入的機器為普通機器的可能性較大呢？
最後，雖然還是不知道此機器每次製造出 DRAM 為不良品的機率參數 X  x 為何？但我

*
200
們可以再次試驗，譬如在事件 S k 發生的情形下，以貝氏定理再次估算關於 M i 生產的事後
機率。而直觀上，一次一次的對事後機率估計再估計，該機器生產的平均不良率應該是會朝
*
著 x 修正趨近吧!
西元 1787 至 1788 年間，有為數不少的短文投書在當時的報紙上，以敦促美國憲法的批

准。其中有 85 篇，後來被收錄在〈聯邦黨人文集 The Federalist Papers〉中，據信是由麥迪
遜(James Madison)與漢彌爾頓(Alexander Hamilton)執筆。雖然此論文集中大部分的文章作者
已經明確知道，但仍有 12 篇的出處一直有爭議，在歷史上的一段時間裡無法斷定原作是誰，
只知大多數人傾向是 Madison，少數人支持 Hamilton。
1970年代，莫斯提勒(Frederick Mosteller) 與華萊士( David L. Wallace) 曾利用機率統計
的方法研究這具有爭議的12篇文章，藉由對兩位作者在個別文章中對同一用字遣詞的不同習
慣所造成的差異(機率分布)進行分析，提出了令人信服的新證據，終於使得這件歷史公案有
所結論。
其中，就應用到了貝氏思維，以下試著簡單說明。
13
例 9.已知在作者確認為 Hamilton 或 Madison 的現有 98 篇文章中，對於單字"innavotion"的
用字習慣分析，發現其中 Hamiltonu 所佔的 48 篇只有 1 篇有使用到這個字，而 Madison
所佔的 50 篇文章中，卻有 16 篇有出現這個字，其餘 34 篇則完全沒提到。
今就有爭議的〈聯邦黨人文集〉12 篇文章中取出一篇，如果其中有出現"innavotion"
這個字，那麼我們將如何做出可能的判定呢？
解：以下，我們將從三個頗具代表性的觀點，並藉由貝氏定理的幫忙來分析判定。
首先，令 W ：文章裡有包含關鍵用字"innavotion"的事件， H ( i ) ：文章為 Hamilton 所
有的事件， M ( i ) ：文章為 Madison 所有的事件，i  1, 2,3 分別代表對應不同的三個觀點。
且根據資料，令此文章為 Hamilton 或 Madison 的手筆而其中出現關鍵用字的機率分別為

1 16
P(W | H (i ) )  與 P(W | M (i ) )  , i  1, 2,3。這裡我們準備計算的是，若文章裡有
48 50
出現"innavotion"這個字，則此文章為 Madison 所有的機率為何？
P( M (*) )  P(W | M (*) )

由貝氏定理 P( M (*) | W ) 
P( M (*) )  P(W | M (*) )  P( H (*) )  P(W | H (*) )
觀點(1).從原本就有強烈信念在著作權上為 Hamilton 支持者的觀點來看，假設此文章為
9 1
Hamilton 所有的機率 P( H (1) )  ，而為 Madison 所有的機率為 P( M (1) )  ，則
10 10
1 16

P( M (1) | W )  10 50  0.6305
1 16 9 1
  
10 50 10 48
觀點(2).從原本就有強烈信念在著作權上為 Madison 支持者的觀點來看，假設此文章為
1 9
Hamilton 所有的機率 P( H (2) )  ，而為 Madison 所有的機率為 P( M (2) )  ，則
10 10
9 16

P( M (2) | W )  10 50  0.9928
9 16 1 1
  
10 50 10 48
觀點(3).如果從對著作權屬於誰沒有任何偏見的外行者來看，可預設此文章為兩人所有
1 16

1 2 50
的機率皆為，則 P( M (3) | W )   0.9389
2 1 16 1 1
  
2 50 2 48
如上分析的結果，我們似乎可以合理推論，若文章裡有出現"innavotion"這個字，則此
文章最可能為 Madison 所有。而依據這樣的思維，〈聯邦黨人文集〉這 12 篇爭議文章的著作
權，最終皆斷定為正如 Madison 所宣稱的，是他自己寫的。
14
以上幾個例子，讓我們看到了貝氏定理在一些問題應用上的威力。而在許許多多的主題
中，有一個特別引起我興趣的，就是關於吸菸與肺癌之間因果關係的論戰。
關於香菸的歷史，至少可以追朔到十六世紀時美洲原住民利用香菸與靈界溝通的習俗。
但認知到吸菸與健康有關，特別是與肺癌的關聯，並以科學的方式嘗試驗證，則已經是二十
世紀以後的事情了。
1954年，年輕的英國流行病學家多爾（Sir Richard Doll）與他的老師希爾（Sir Austin
Bradford Hill），共同發表了長期追蹤4萬名男醫師的流行病學研究報告，首度證實吸菸與肺
癌相關。但此篇報告雖然對當時許多國家的公共衛生政策造成影響，甚至也成為這方面研究
的典範，卻並未動搖製菸業的根本。特別是美國的菸商大財團，當發現香菸在本土不好經營
後，竟然在美國政府的暗助下改為全球貿易輸出。因此反菸運動經歷了一段各國政府、財團、
民間反菸組織、學術界以及消費者對於香菸態度的一場角力混戰，而且是長期的對抗戰。
不說別的，注意到多爾的研究報告中，所抽樣的對象是英國、男性、醫生族群嗎？即使
還有其他類似的研究報告，其抽樣對象、研究方式，在當時其實經常遭人質疑，而且這些質
疑未必沒有道理。如英國著名的統計學家費雪(Ronald Aylmer Fisher,1890~1962 統計學"變異
數分析"發明者。)，即以其老菸槍以及統計學家的身分，終生質疑且反駁吸菸會導致肺癌的
結論。當然，一篇研究論文或許不具代表性，但要是跨越不同地區，長時期，不同方法的許
多研究卻都指向相同的結果，那就另當別論了。如今，吸菸有害健康已經是公認的常識。1996
年4月，有史以來對菸商最重的菸害責任賠償判決出爐。美國波特蘭的陪審團裁定菸商萬寶路
(Marlboro)必須賠償一位叫威廉斯的肺癌死者家屬8100萬美金，原因是這個人生前抽了該品
牌將近40年的香菸。類似的案例可能不會只此一例，而菸商已經漸漸趨於劣勢。這是如何達
到的呢？不要忘了，這是建立在以「證據說話（evidence-based）」為前提的科學研究興起後，
奮戰了好幾十年才達到的共識與成果。
現在，已知吸菸不只會導致肺癌，還被發現是引起心血管疾病的重要危險因子之一。
例 10.下表為某地區心血管疾病調查資料，合計抽樣調查 61,963 人。
心血管疾病 (Y )
每日菸量 ( X )
無 (Y  0) 有 (Y  1) 合計
0 包 ( X  0) 41629 4166 45795
1 包 ( X  1) 13021 1383 14404
2 包 ( X  2) 1420 176 1596
超過 2 包 ( X  2) 144 24 168
合計 56214 5749 61963
表(3)
15
試利用貝氏定理推估每日菸量 X 包的這些人罹患心血管疾病 Y 的機率，其中隨機變數
X 表每日菸量， Y 表心血管疾病有無。
解：由貝氏定理，所求
P(Y  1, X  x) P(Y  1)  P( X  x | Y  1)
P(Y  1| X  x)  
P( X  x) P(Y  1)  P( X  x | Y  1)  P(Y  0)  P( X  x | Y  0)
5749 4166

當 x  0 ， P(Y  1| X  0)  61963 5749  0.0910 。
5749 4166 56214 41629
  
61963 5749 61963 56214
同理可以計算得到，
P(Y  1| X  1)  0.0960 ， P(Y  1| X  2)  0.1103 ， P(Y  1| X  2)  0.1429 。
如再計算 P(Y  0 | X  x) ，可得下表：
心血管疾病 (Y )
每日菸量 ( X )
無 (Y  0) 有 (Y  1) 合計
0包 ( X  0) 0.9090 0.0910 1
1包 ( X  1) 0.9040 0.0960 1
2包 ( X  2) 0.8897 0.1103 1
超過2包 ( X  2) 0.8571 0.1429 1
表(4)
回顧吸菸導致肺癌的論戰歷史，當初R.A.費雪質疑沒有證據顯示這兩者之間有直接的因
果關係，不僅有其道理(科學或哲學)，而且無法反駁。事實上，即使在機率理論已經有條件
機率(貝氏定理)、統計上有相關係數、邏輯上有實質蘊含的概念，但科學或數學上仍然沒有
一個定理或者一條公式，可以表達出所謂的因果關係。而且，何謂因果關係呢？
任何方法，必有其侷限，也許我們所能做的，就是讓數字自己說話吧！
還有其他類似的議題嗎？近年來科學家正致力於研究長期使用手機是否會因電磁波影響
而導致腦癌?一些研究結果顯示電磁波確實會影響健康，一些研究結果則顯示不會。這樣的情
境是否似曾相識？而兩大陣營的研究，除了學術界的參與，背後還可能有誰？
二十世紀之前因為人類平均壽命不長，吸菸的害處可能根本來不及顯現，即使二十世紀
以後，吸菸導致肺癌的研究，也在經歷了40~50年的努力才看清楚一些事情，得到一些共識。
那麼電磁波是否會影響導致腦癌，需要花多長的時間驗證呢？
16
參、結語
貝氏定理出現之後，因為可以把條件機率反轉過來計算，而且似乎在許多地方大有名堂，
所以引起了一波統計學家的注意，一時也有許多的統計相關文獻中，出現了運用貝氏思維的
方法。但在使用上可能因為觀點的不同，而提出了許多導致不同結果的不同方法，卻沒有明
確的標準來決定哪個是對的，自然也造成不少的混淆與爭議，令許多統計分析學家相當迷惑。
特別的是，許多看來似乎不盡相同的想法，或者方法，招牌上經常掛著共同的 logo ― 貝氏。
所以在一段時間裡，不少統計學家以及學術界，都會盡量避免使用貝氏的相關理論，甚至連
沾上邊都避免，包括著名的統計學家 R.A.費雪。
貝氏統計（Bayesian statistics），是從條件機率所發展而來的統計方法，貝氏定理則為其
基礎理論。除此之外，貝氏思維的主要理論、方法、內容還有哪些？也許在這領域還聽過、
見過的一些與貝氏相關的名詞，如：貝氏層次模型(Bayesian hierarchal model)、貝氏因子
(Bayes factor)、貝氏網路（Bayesian network）
、貝氏分類（Bayesian classifier）等等，其實都
不是我能夠馬上說明或者弄清楚。倒是有一個一般人比較熟悉且與貝氏有關的名詞，並沒有
冠上貝氏兩個字，可以稍微補充一下，那就是 ― 主觀機率(subjective probability)。可以這
麼說，貝氏統計思維的立論基礎，主觀機率是有別於其它統計學派的一個主要支柱。
大致上來說，統計學主要分為兩大學派，古典統計學(classical statistics)與貝氏統計學，
其最大的爭議在於「看待母體參數的方式」不同。古典統計學派將母體參數視為有待估計的
「未知常數」，相信一定存在，只是一般不知此定值為何？相反的，貝氏統計學派則是將母
體參數視為「隨機變數」，只能猜測母體參數的機率分布為何？若從機率的角度而言，則可
以說這兩個學派在探討「不確定性」這件事時的出發點與立足點不同，古典統計學立基於客
觀機率，而貝氏統計學則仰賴於主觀機率。
客觀機率( objective probability) 主觀機率( subjective probability)
經過反覆試驗得出依憑個人主觀信念
可用統計工具驗證不需(也不能) 被驗證
一般而言未知總是可以任意假定
表(5)
乍看之下，因為客觀機率不涉及個人的主觀判斷，似乎較有說服力讓人容易接受。但有
沒有可能某些機率是沒有辦法重複試驗得到呢？相反的，如同貝氏定理中的事前機率，即是
典型的主觀機率(或稱 Personal Probability)，可以依憑個人經驗設定。但怎麼知道自己給定的
前提為真呢？所以在統計的應用上造成分歧，當然就會遭受到不同觀點統計學家的互相質疑。
綜上所述，應該要體認到兩個學派的爭論，其實並不是一個非黑即白的零和問題。兩個
學派均各有其信仰哲學、內在邏輯、合理性和局限性，看來誰也不能全對，誰也沒辦法取代
誰。既然勢將共存，若能有競有合、激盪發展，相信才是上佳之策。
17
肆、自學練習
1. 某旅館有三間房間，其中一間有兩個男生住進去，一間有兩個女生入住，剩下一間則住進
一男一女。正當服務生敲其中一間房門時，房間裡傳來女性的聲音說:"我正在忙，不知道
是誰來了？你去開門！"。請問：聽話來開門的另一人，是男生的機率為何?
2. 某遊戲有 4 道門，其中只有一道門後有獎，而且主持人知情，參賽者不知。當參賽者選定
一門後，主持人一定打開一道沒有獎的空門(在所剩沒獎的門中隨機打開)，然後允許參賽
者有換門的機會。請問參賽者此時"換"或"不換"，得獎的機率分別為何？
3. 電影越戰獵鹿人(The Deer Hunter)中，有一段描述虐待戰俘的方法。在一可裝6發子彈的

左輪手槍(revolver) 裡，只放一顆子彈，隨機地一轉後，要兩個戰俘輪流用手槍向自己的
頭部發射，直到一名戰俘中槍，另一名戰俘才逃過一劫。這就是所謂俄羅斯輪盤(Russian
roulette) 的遊戲。假設子彈轉到任意位置的機率一樣，試問：
(1) 先發射者是否較不利?
(2) 若改為放兩顆子彈，結果有何不同?
(3) 若改為每次發射前，均須將彈匣隨機地一轉，則結果有何不同?
4. 某教授為了調查學生曾經考試作弊的機率，並希望學生能夠坦誠回答，設計了以下問題：
問題 A ：你是否考試作弊過？問題 B ：你的生日是否在五月？
然後要被測學生先自行擲一枚硬幣，若出現正面，回答問題 A ；反面則回答問題 B 。已
知該次測試學生回答"是"的機率為 q ，試估計學生曾經考試作弊的機率為何？
5. 有三個箱子A、B、C，每個箱子各有兩個抽屜。在箱子A 的兩個抽屜裏各放置一枚金幣，
在箱子B 的兩個抽屜裏各放置一枚銀幣，在箱子C 的兩個抽屜裏，一個放置一枚金幣，一
個放置一枚銀幣。隨意選一個箱子，再隨意打開箱子的一個抽屜，如果發現那裏放置了一
枚金幣的話，那麼另外那個抽屜裏也放置一枚金幣的機率為何?
6. 2002 年諾貝爾經濟學獎得主丹尼爾·卡尼曼(Daniel Kahneman，1934~)，在他的著作《思

考，快與慢》中出了這樣一道題：一輛出租車在夜晚肇事之後逃逸，一位目擊證人辨認出
肇事車輛是藍色的。已知這座城市 85% 的出租車是綠色的，15% 是藍色的。警察經過
測試後，認為目擊者在當時可以正確辨認出這兩種顏色的機率是 80%，辨別錯誤的機率
是 20%。請問，肇事出租車是藍色的機率為何？
7. 有甲、乙、丙三名囚犯，國王決定釋放其中一位，處決另兩位。他把結果告訴獄卒，但要
求獄卒不可以透露給當事人相關的資訊出去。甲在偷偷問獄卒那一位會被釋放不得要領
後，改問獄卒"那麼乙跟丙，那一位會被處決? "。獄卒想了一下，認為這樣做並不會提供
甲任何有關他會被釋放或處決的有利訊息，於是告訴甲"乙會遭處決"。甲聽到後暗自高
興，覺得自己被釋放的機率提高變為50%了。試問：
18
(1) 在獄卒告訴甲新的資訊後，甲會被釋放的機率為何？
(2) 若此時丙走進來偷聽到獄卒與甲的對話，丙會被釋放的機率為何？
8. 難得的春假期間，甲規劃了一個三天假期的家庭旅遊，但是擔心家裡的植物沒人照顧，所
以拜託鄰居幫忙澆水。假設甲有一棵植物特別嬌弱需要照顧，如果不澆水的話有80%的機
率枯萎，即使澆水，也有15%的機率存活不下來，而甲確信他的鄰居有9成的機率不會忘記
澆水，則當假期結束時：
(1) 甲的這棵植物存活下來的機率為何？
(2) 若甲的這棵植物沒有存活下來，則原因是鄰居忘記澆水的機率為何？
9. 某公司計畫推出新產品，並認為經濟景氣的好壞會影響新產品的銷售，公司行銷經理主觀
判斷景氣好、普通、不好的機率各為0.5、0.2、0.3。今公司委託專業市調公司進行市場
景氣調查，但該市調公司之調查並非百分之百正確，根據過去經驗，其正確率為0.9，不
正確的誤判為其它兩種景氣狀況的機率各為0.05。若該市調公司調查結果為景氣好，則市
場景氣真正是好的機率為何？
10. 最近台中開了一家LV 名品旗艦店，疼老婆的羅冰先生也準備了好幾張信用卡帶著老婆

來朝聖。羅冰進到店裡五分鐘後心想「天啊！太貴了」，雖然羅冰很疼愛老婆，但還是
擔心老婆會過度消費他的疼愛，於是準備在老婆瘋狂Shopping之前給他教育一番。他說：
「我親愛的老婆啊！你知道嗎？像你氣質這麼高尚的人是不需要靠LV 來襯托的。根據
NCU 資訊公司的調查，台灣總人口中氣質高尚與否的比率大約4：6，氣質高尚的人當中
會買LV 的只有30%，氣質不高尚的人當中會買LV 的卻高達80%，你如果可以回答出下
面幾個問題的話，你就會了解像你這麼氣質出眾的人真的不需要買LV 啊！當然，如果
這些問題你都答得出來，那表示你真的是冰雪聰明，那就讓你隨便買吧！」這時羅冰先
生突然尿急去了，機靈的羅太太為了過過像貴婦般瘋狂Shopping 的滋味，於是偷偷打電
話向你求救了。問題如下：
(1) 若在LV 店內的50 個客人是台灣人口組成的完完全全縮小版，既高尚又會買LV 的
有幾個？不高尚但會買LV 又有幾個？
(2) 在結帳的那位小姐（不是店員喔！）是假高尚的機率有多少？
參考答案：
1 3 5 2 6 1
1. 2. "換"中獎，不中；"不換"中獎，不中 3. (1)不會，機率各 (2)
3 8 8 8 8 2
3 2 6 5 5 2
P(甲)  ; P(乙)  (3) 一發 P(甲)  ; P(乙)  ；二發 P(甲)  ; P(乙) 
5 5 11 11 7 7
1 2 12 1 2
4. 2q  5. 6. 7. (1) (2) 8. (1) 0.785 (2) 0.3721
12 3 29 3 3
9. 0.95 10. (1) 6; 24 (2) 0.8
19
伍、參考資料
[1] 蘇俊鴻貝葉斯和貝氏定理(1) 科學 Online (網站)
[2] 黃文璋機率應用不易數學傳播 34 卷 1 期民 99 年 3 月
[3] 黃提源機率論協進圖書
[4] 曼羅迪諾(Leonard Mlodinow)著胡守仁譯醉漢走路天下文化
[5] 鄧進財談統計應用數學知識(網站)
[6] 薩爾斯伯格(David Salaburg)著葉偉文譯統計改變了世界天下文化
[7] 捷爾德·蓋格瑞澤(Gerd Gigerenzer)著廖育琳等譯機率陷阱商周出版
[8] Anthony O’Hagan Probability: Methods and measurement(p.59~61) Chapman and Hall
[9] 林宜平小蝦米對抗大鯨魚：流行病學研究的利益與衝突科學發展 437 期 2009.05
[10]蘇上豪那些年，我們怎麼知道菸有害？ PanSci 泛科學(網站)
20

貝氏定理淺談

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

貝氏定理淺談

Uploaded by

Copyright:

Available Formats

貝氏定理淺談

定義：設 A, B 為樣本空間 S 中的兩個事件， P( A)  0 ，則在事件 A 發生的條件下，

例 1. 設一袋中有編號 1~9 號的九顆球，每球被取到的機率相等。若每次從中取一球，記錄

解：因為第 n  1次取球後，球號總和為偶數的關鍵是前 n 次取球總和是奇數還是偶數。令 Pn

例 2. 設一袋中有 a 個白球， b 個黑球，每球被取到的機率相等。若每次從中取一球，然後再

概念。以上問題又稱 Polya 模型，是曾用於描述傳染病現象的一個簡化的數學模型(白球代表

不爆發，黑球代表爆發)，且由此結論， P( An ) 的機率與 n ， c 無關，意謂不爆發傳染病的機

參賽者(選門機率) 主持人(開門機率) 參賽者(換門獲獎機率)

S  e1 ( 選 A, 開 B, 換 C )，e2 ( 選 A, 開 C , 換 B)，e3 ( 選 B, 開 C , 換 A)，e4 ( 選 C , 開 B, 換 A)

以條件機率的理論計算，令 Ai 表示參賽者第 i 次選門，選擇 A 門的事件， Bi , Ci 同理，

i  1,2 ； B 表示主持人開門，打開 B 門的事件， C 同理。則

設  A1 , A2 , A3 , , An  為樣本空間 S 的一組分割， B 為 S 的一個事件。若 P( B)  0 ，

P( Ai )  0 , i  1, 2, , n ，則在事件 B 發生的情況下，事件 Ak , 1  k  n 發生的機率為

前)；而貝氏定理中的 P( B) ，則須透過 P( Ai ) 以及 P( B  Ai )  P( Ai )  P( B | Ai ) ，利用全

i  1, 2, , n 稱為事前機率(或先驗機率 Prior probability)，在加入新的資訊 P( B | Ai ) 後，所求

出的 P( Ak | B) , 1  k  n 則為事後機率(或後驗機率 posterior probability)。貝氏定理的精神，

為了簡化問題，我們假設平均電腦每 200 個下載的檔案中會有一個帶有病毒。令 A 表示

例 8. 竹科園區某記憶體製造廠以一種特定的機器製造 DRAM，並將製造出來 DRAM 的品質區分

優( M 1 ) 1  0.99  0.01( X  x1 ) 0.65 ( P( M1 ) )

普通( M 2 ) 1  0.97  0.03 ( X  x2 ) 0.30 ( P( M 2 ) )

不佳( M 3 ) 1  0.95  0.05 ( X  x3 ) 0.05 ( P( M 3 ) )

應生產 DRAM 的不良率為 X  xi ，而採購到 M i 機器的機率為 P( M i ) , i  1,2,3 。我們只

有就這些主觀的事前機率 X  xi 以及 P( M i ) 為依據，想知道在事件 S6 發生的情形下，

P(S6100 | M1 )  P(S6100  X  x1 )  C6100 (0.01)6 (0.99)94  0.00046

P(S6100 | M 2 )  P(S6100  X  x2 )  C6100 (0.03)6 (0.97)94  0.04961

P(S6100 | M 3 )  P(S6100  X  x3 )  C6100 (0.05)6 (0.95)94  0.15001

P(S6100 )  P(S6100  M1 )  P(S6100  M 2 )  P(S6100  M 3 )

 P(M1 )  P(S6100 | M1 )  P(M 2 )  P(S6100 | M 2 )  P( M 3 )  P( S6100 | M 3 )

事前機率 新的資訊 事後機率

機器優劣 X  xi P( M i ) P(S6100 | M i ) P(M i | S6100 )

優( M 1 ) 0.01 0.65 0.00046 0.0132

普通( M 2 ) 0.03 0.30 0.04961 0.6561

不佳( M 3 ) 0.05 0.05 0.15001 0.3307

由上表(2)可以清楚看出，在新的資訊 P( S6 | M i ) , i  1,2,3 加入考量後，發現在初次

生產的 100 個 DRAM 中有 6 個為不良品的情形下，由普通機器所生產的機率，將近是不佳

最後，雖然還是不知道此機器每次製造出 DRAM 為不良品的機率參數 X  x 為何？但我

西元 1787 至 1788 年間，有為數不少的短文投書在當時的報紙上，以敦促美國憲法的批

首先，令 W ：文章裡有包含關鍵用字"innavotion"的事件， H ( i ) ：文章為 Hamilton 所

有的事件， M ( i ) ：文章為 Madison 所有的事件，i  1, 2,3 分別代表對應不同的三個觀點。

且根據資料，令此文章為 Hamilton 或 Madison 的手筆而其中出現關鍵用字的機率分別為

P( M (*) )  P(W | M (*) )

0 包 ( X  0) 41629 4166 45795

1 包 ( X  1) 13021 1383 14404

2 包 ( X  2) 1420 176 1596

合計 56214 5749 61963

如再計算 P(Y  0 | X  x) ，可得下表：

超過2包 ( X  2) 0.8571 0.1429 1

客觀機率( objective probability) 主觀機率( subjective probability)

3. 電影越戰獵鹿人(The Deer Hunter)中，有一段描述虐待戰俘的方法。在一可裝6發子彈的

6. 2002 年諾貝爾經濟學獎得主丹尼爾·卡尼曼(Daniel Kahneman，1934~)，在他的著作《思

10. 最近台中開了一家LV 名品旗艦店，疼老婆的羅冰先生也準備了好幾張信用卡帶著老婆

You might also like

事前機率新的資訊事後機率

P( M () )  P(W | M () )