可怕的貝葉斯定理,看完後忍不住感慨數學過重要了

本文用淺顯易懂的語言介紹了貝葉斯定理,對於剛接觸貝葉斯定理的同窗很實用。特轉載至此。


夏一晚上算法

百家號 17-09-10 22:54

衆所周知,貝葉斯定理是一種在已知其餘機率的狀況下求機率的方法:
那咱們怎麼去理解這個傳說中不黃但很暴力的貝葉斯定理呢,貝葉斯定理是如何暴力狂虐數學界的?

首先,對於貝葉斯定理,仍是要先了解各個機率所對應的事件。機器學習

P(A|B) 是在 B 發生的狀況下 A 發生的機率;學習

P(A) 是 A 發生的機率;spa

P(B|A) 是在 A 發生的狀況下 B 發生的機率;blog

P(B) 是 B 發生的機率。事件


還沒看懂。。。那我仍是舉個栗子吧數學

京西大旅館爲了慶祝開業三週年的好日子,老闆劉強西準備帶着實習生小天去郊外旅遊,不過一大早天空多雲:it

糟了!50%的雨天的早上是多雲的!class

但多雲的早上其實挺多的(大約40%的日子早上是多雲的)!基礎

這個月乾旱爲主(平均30天裏通常只有3天會下雨,10%)!

劉強西45°角仰望天空,想着要不要去郊遊。。。

做爲聰明的實習生,小天立馬拿出他的小本子:

此時,咱們用"雨"來表明今天下雨,"雲"來表明早上多雲。

當早上多雲時,當天會下雨的可能性是 P(雨|雲)。

P(雨|雲) = P(雨)·P(雲|雨) /P(雲)

P(雨) 是今天下雨的機率 = 10%

P(雲|雨) 是在下雨天早上有云的機率 = 50%

P(雲) 早上多雲的機率 = 40%

基本的機率狀況已經肯定,那就簡單了

P(雨|雲) =0.1×0.5/0.4=0.125

小天:劉老闆,不用看天氣了,今天下午的機率只有12.5%,能夠去郊遊的。

劉強西聽完後:行,那趕忙上車!

然而,「小天」算不如天算,你看,天就下雨了。。。

小天尷尬ing

故事到這裏還沒結束,超模君當時在學習貝葉斯定理的時候,時常會記不住究竟是B在前,仍是A在前,公式該怎麼寫。

直到有一次,小天(這個小天是超模君的小天,不是劉強西的小天)看我在寫貝葉斯公式,說出:AB AB AB。


因此對於貝葉斯公式,記住AB AB AB,而後再作分組:"AB = A×BA/B"。

別急,假如「A」還有兩個可能

各位模友,大家據說「假陽性」、「假陰性」這兩個詞嗎?

是的,沒錯,就是某些疾病檢測通常喜歡用名詞,醫學院的同窗趕忙拿好小板凳,接下來就是考試重點了。

貝葉斯定理雖然只是一個機率計算公式,但其最著名的一個用途即是「假陽性」和「假陰性」檢測。


再丟個栗子。。。

上次沒出成郊遊,劉強西卻在路邊撿了一隻小流浪貓回京西大旅館,天天就顧着擼貓。。。


兩天事後,劉強西忽然渾身發癢,小天就想起來是否是劉強西對貓過敏,因而劉強西就作了一個簡單的過敏檢測:

對於真的有這種過敏的人,檢測有 80% 的機會給回 "有" 的結果;

對於沒有這種過敏的人,檢測有 10% 的機會給回 "有" 的結果(而這種狀況,稱之爲"假陽性")。

從實際狀況看,京西大旅館的村子有 1% 的人有這種過敏,而劉強西的檢測結果是 "有",那麼劉強西真的有這種過敏的可能性有多大?


P(過敏) 是有這種過敏的機率 = 1%

P(有|過敏) 是對於真的有這種過敏的人,檢測的結果是 "有" = 80%

P(有) 是對於任何人,檢測的結果是 "有" = ??%

糟糕!咱們並不知道檢測結果是 "有" 的通常可能性是多少……

不過咱們能夠把有這種過敏和沒有這種過敏的機率相加來求這個通常機率:

1% 的人有這種過敏,檢測對 80% 的這些人說 "有"

99% 的人沒有這種過敏,檢測對 10% 的這些人說 "有"

把機率加起來:

P(有) = 1% × 80% + 99% × 10% = 10.7%

就是說大約 10.7% 的人會獲得 "有" 的檢測結果。

那此時咱們就能夠計算出,劉強西真正對貓過敏的機率爲

P(過敏|有) = 1% × 80%/10.7%= 7.48%

因此此時也就有了貝葉斯定理特別版:

最後說多兩句:

貝葉斯統計做爲經常使用的基礎算法,不要小看其做用,其在機器學習中是佔據重要的一席之地。尤爲是在數據處理方面,針對事件發生的機率以及事件可信度分析上具備良好的分類效果。