一個村子,三個小偷:A1小張,A2小英,A3小鄭。事件B爲村子發生失竊。已知小張去偷東西成功的機率爲0,小英去偷東西成功的機率是1/2,小鄭去偷東西成功的機率是1。每次只能有一我的去偷竊,求P(B)機器學習
由題目咱們知道,三我的去偷東西的機率是都是,因此咱們有:學習
注意到:是互斥的,又由乘法公式:
,因此咱們有:.net
因此3d
求解過程,咱們運用到了全機率公式:code
其中,B是試驗E的一個事件,是一個完備事件組。全機率公式至關重要,是咱們推導貝葉斯公式的基礎。事件
某一天,村子一我的大喊:失竊啦!!!而後警察來了。一共有3個嫌疑人:A1小張,A2小英,A3小鄭。警局已經對他們的偷竊能力有備案:小張去偷東西成功的機率爲0,小英去偷東西成功的機率是1/2,小鄭去偷東西成功的機率是1。試問:這三人中,與此次失竊案件有關的機率是多少。io
這個問題和引例有一點不一樣,引例是已知3人的偷竊能力,求村子失竊的機率。而這個問題是已知3人的偷竊能力,和村子失竊的機率,求每一個人去偷竊的機率。這就是所謂的逆事件機率
,貝葉斯公式
須要解決的問題。class
在偷竊發送以前,咱們認爲:三我的去偷竊的機率都是同樣的(這是咱們的主觀感覺)。故,咱們有:基礎
咱們須要求的是:,應用全機率公式,條件機率公式與乘法公式,有:gc
因此,最大嫌疑人是小政。
這個例子,就運用到所謂的貝葉斯公式啦:
就是所謂的先驗機率,而
就是後驗機率。
爲何這樣子去叫呢
在失竊發送以前,咱們認爲3我的去偷竊的機率都是1/3。可是失竊發送後,因爲每一個人的偷竊能力不一樣,咱們預判誰去偷竊的機率就會發生變化。這個例子中,先驗機率。先驗機率每每都是咱們的主觀映像:在失竊發送以前,咱們認爲全部人去偷竊的機率都是同樣的。然後驗機率是什麼呢?由於每一個人偷竊的成功率不一樣,因此偷竊發生後,到底誰去偷竊的機率也就發生了變化。因此後驗機率就是一個調整因子,當一件事件發生後,對原事件發生的機率產生了影響。
貝葉斯公式解決了什麼問題
貝葉斯解決的是逆向機率的問題。什麼叫逆向機率呢?好比在村子失竊
的例子中,正向機率
就是:已知每一個人的偷竊能力,求村子失竊的機率。
而逆向機率
就是:已知村子失竊的機率和每一個人的偷竊能力,偷竊事件發生了,而後求每一個人與這起偷竊案件相關的機率。
貝葉斯公式有哪些應用呢
貝葉斯公式真正被應用起來,是在其發表一百多年後了。爲何一開始貝葉斯公式不背重視呢?由於加入了先驗機率,而先驗機率是咱們的主觀映像,傳統的機率學認爲,機率統計是不能被主觀引導的,這就致使了貝葉斯公式不被重視。
後來,人們逐漸發現了貝葉斯公式大有用處,而且將其普遍應用與天氣預報,垃圾郵件處理等一系列的問題之中。貝葉斯公式也是機器學習中及其重要的模型。
這裏有A,B兩個箱子有大小形狀和數量都同樣的球,A箱子1/3是白球,2/3是黑球。B箱子所有是黑球
咱們蒙着眼睛,伸手從箱子取球:因爲球的大小形狀和數量都同樣,因此咱們認爲取的球來自A箱和B箱的機率都是1/2。
可是我摸出來之後,我瞄了一眼,發現:這是白球。而後我就判定:這個球必定來自A箱子。
摸出來的球來自A箱的機率由1/2變成了1。這是爲何呢?就是由於有後驗機率是不同的,摸出來球的顏色會對一開始的機率產生影響。
咱們用貝葉斯公式來計算一下:
咱們定義:
已知
由貝葉斯公式:
可見:摸出來的球來自A箱的機率從1/2變成了1,這是由於後驗機率對原機率發生了影響。