通俗易懂--邏輯迴歸算法講解(算法+案例)

時間 2019-12-14

標籤通俗易懂邏輯迴歸算法講解案例简体版

原文原文鏈接

1.邏輯迴歸(Logistic Regression)

1.1邏輯迴歸與線性迴歸的關係

邏輯迴歸是用來作分類算法的，你們都熟悉線性迴歸，通常形式是Y=aX+b，y的取值範圍是[-∞, +∞]，有這麼多取值，怎麼進行分類呢？不用擔憂，偉大的數學家已經爲咱們找到了一個方法。git

首先咱們先來看一個函數，這個函數叫作Sigmoid函數：github

函數中t不管取什麼值，其結果都在[0,-1]的區間內，回想一下，一個分類問題就有兩種答案，一種是「是」，一種是「否」，那0對應着「否」，1對應着「是」，那又有人問了，你這不是[0,1]的區間嗎，怎麼會只有0和1呢？這個問題問得好，咱們假設分類的閾值是0.5，那麼超過0.5的歸爲1分類，低於0.5的歸爲0分類，閾值是能夠本身設定的。算法

好了，接下來咱們把aX+b帶入t中就獲得了咱們的邏輯迴歸的通常模型方程：微信

結果P也能夠理解爲機率，換句話說機率大於0.5的屬於1分類，機率小於0.5的屬於0分類，這就達到了分類的目的。app

1.2損失函數

邏輯迴歸的損失函數跟其它的不一樣，先一睹尊容：機器學習

解釋一下，當真實值爲1分類時，用第一個方程來表示損失函數；當真實值爲0分類時，用第二個方程來表示損失函數，爲何要加上log函數呢？能夠試想一下，當真實樣本爲1是，但h=0機率，那麼log0=∞，這就對模型最大的懲罰力度；當h=1時，那麼log1=0，至關於沒有懲罰，也就是沒有損失，達到最優結果。因此數學家就想出了用log函數來表示損失函數，把上述兩式合併起來就是以下函數，並加上正則化項：函數

最後按照梯度降低法同樣，求解極小值點，獲得想要的模型效果。學習