本文出處主要來源於 https://blog.csdn.net/Hearthougan/article/details/75174210,感謝該博主的博客。spa
貝葉斯分類器的前提條件是全機率公式以及條件機率公式:、.net
1:條件機率公式3d
舉個例子,好比讓你背對着一我的,讓你猜猜背後這我的是女孩的機率是多少?直接猜想,確定是只有50%的機率,假如如今告訴你背後這我的是個長頭髮,那麼女的機率就變爲90%。因此條件機率的意義就是,當給定條件發生變化後,會致使事件發生的可能性發生變化。blog
也能夠利用維恩圖進行理解事件
表示B發生後A發生的機率,由上圖能夠看出B發生後,A再發生的機率就是,所以:博客
由:io
得:class
這就是條件機率公式。基礎
假如事件A與B相互獨立,那麼:im
注:
相互獨立:表示兩個事件發生互不影響。而互斥:表示兩個事件不能同時發生,(兩個事件確定沒有交集)。互斥事件必定不獨立(由於一件事的發生致使了另外一件事不能發生);獨立事件必定不互斥,(若是獨立事件互斥, 那麼根據互斥事件必定不獨立,那麼就矛盾了),可是在機率形式上具備一些巧合性,通常地:
可是,對於兩個獨立事件,依然能夠等於0,由於事件A或者事件B發生的機率可能爲0.因此,並非必定表示互斥。互斥和獨立的理解仍是要究其真正意義,而不是表達形式。
先舉個例子,小張從家到公司上班總共有三條路能夠直達(以下圖),可是每條路天天擁堵的可能性不太同樣,因爲路的遠近不一樣,選擇每條路的機率以下:
天天上述三條路不擁堵的機率分別爲:
假設遇到擁堵會遲到,那麼小張從Home到Company不遲到的機率是多少?
其實不遲到就是對應着不擁堵,設事件C爲到公司不遲到,事件爲選擇第i條路,則:
全機率就是表示達到某個目的,有多種方式(或者形成某種結果,有多種緣由),問達到目的的機率是多少(形成這種結果的機率是多少)?
全機率公式:
設事件是一個完備事件組,則對於任意一個事件C,如有以下公式成立:
那麼就稱這個公式爲全機率公式。
3、貝葉斯公式
仍舊借用上述的例子,可是問題發生了改變,問題修改成:到達公司未遲到選擇第1條路的機率是多少?
可不是,由於0.5這個機率表示的是,選擇第一條路的時候並無靠考慮是否是遲到,只是由於距離公司近才知道選擇它的機率,而如今咱們是知道未遲到這個結果,是在這個基礎上問你選擇第一條路的機率,因此並非直接就能夠得出的。
故有:
因此選擇第一條路的機率爲0.28.
貝葉斯公式就是當已知結果,問致使這個結果的第i緣由的可能性是多少?執果索因!
貝葉斯公式:
在已知條件機率和全機率的基礎上,貝葉斯公式是很容易計算的: