其中P(A|B)是在 B 發生的狀況下 A 發生的可能性。code
在貝葉斯定理中,每一個名詞都有約定俗成的名稱:orm
P(A)是 A 的先驗機率,之因此稱爲「先驗」是由於它不考慮任何 B 方面的因素。 P(A|B)是已知 B 發生後 A 的條件機率,也因爲得自 B 的取值而被稱做 A 的後驗機率。 P(B|A)是已知 A 發生後 B 的條件機率,也因爲得自 A 的取值而被稱做 B 的後驗機率。 P(B)是 B 的先驗機率,也做標淮化常量(normalizing constant)。
按這些術語,貝葉斯定理可表述爲:blog
後驗機率 = (類似度 * 先驗機率)/標淮化常量
也就是說,後驗機率與先驗機率和類似度的乘積成正比。事件
另外,比例P(B|A)/P(B)也有時被稱做標淮類似度(standardised likelihood),Bayes定理可表述爲:ip
後驗機率 = 標淮類似度 * 先驗機率
假設有兩個各裝了100個球的箱子,甲箱子中有70個紅球,30個綠球,乙箱子中有30個紅球,70個綠球。假設隨機選擇其中一個箱子,從中拿出一個球記下球色再放回原箱子,如此重複12次,記錄獲得8次紅球,4次綠球。問題來了,你認爲被選擇的箱子是甲箱子的機率有多大?get
調查結果顯示,大部分人都低估了選擇的是甲箱子的機率。根據貝葉斯定理,正確答案是96.7%。下面容我來詳細分析解答。sed
剛開始選擇甲乙兩箱子的先驗機率都是50%,由於是隨機二選一(這是貝葉斯定理二選一的特殊形式)。即有:im
P(甲) = 0.5, P(乙) = 1 - P(甲);img
這時在拿出一個球是紅球的狀況下,咱們就應該根據這個信息來更新選擇的是甲箱子的先驗機率:
P(甲|紅球1) = P(紅球|甲) × P(甲) / (P(紅球|甲) × P(甲) + (P(紅球|乙) × P(乙)))
P(紅球|甲):甲箱子中拿到紅球的機率
P(紅球|乙):乙箱子中拿到紅球的機率
所以在出現一個紅球的狀況下,選擇的是甲箱子的先驗機率就可被修正爲:
P(甲|紅球1) = 0.7 × 0.5 / (0.7 × 0.5 + 0.3 × 0.5) = 0.7
即在出現一個紅球以後,甲乙箱子被選中的先驗機率就被修正爲:
P(甲) = 0.7, P(乙) = 1 - P(甲) = 0.3;
如此重複,直到經歷8次紅球修正(機率增長),4此綠球修正(機率減小)以後,選擇的是甲箱子的機率爲:96.7%。