機器學習公開課筆記第三週，邏輯迴歸

時間 2019-11-24

標籤機器學習開課筆記第三邏輯迴歸简体版

原文原文鏈接

1，邏輯迴歸(Logistic Regression)正則表達式

監督學習除了線性迴歸以外，還有邏輯迴歸(Logistic Regression)，也叫分類(Classifycation)算法

分類問題輸入和線性迴歸問題同樣，不過它的輸出是離散值。函數

咱們先來學習簡單二元分類（輸出值只有0和1）學習

問題就是給定n個特徵值Xi，輸出它的類別0或1.atom

由於輸出只有0和1，線性迴歸的假設函數就不適合，須要找一種輸出值是0到1的函數，可使用S函數(Sigmoid Function)，也叫邏輯函數(Logistic Function)代替咱們的假設函數spa

\(h_{\theta}(x)= g(\theta ^{T}x)\)3d

\(z= \theta ^{T}x\)orm

\(g(z)= \frac{1}{1 + e^{-z}}\)blog

\(h_{\theta}(x) = g(z)\)ci

\(g(z)\)函數圖以下所示

能夠發現0<=\(g(z) = h_{\theta}(x)\)<=1，符合咱們的條件，咱們能夠對半分，根據h_θ(x)更靠近0仍是1來分類

h_θ(x)≥0.5→y=1

h_θ(x)<0.5→y=0

或者解釋h_θ(x)爲類1的機率，那麼獲得以下公式

h_θ(x)=P(y=1|x;θ)=1−P(y=0|x;θ)

P(y=0|x;θ)+P(y=1|x;θ)=1

\(z=0\)
\(e^{0}=1 \Rightarrow g(z)=1/2 \)
\(z \to \infty, e^{-\infty} \to 0 \Rightarrow g(z)=1 \)
\(z \to -\infty, e^{\infty}\to \infty \Rightarrow g(z)=0 \)

\(y=1\rightarrow h_{\theta}(x) \geq 0.5 \rightarrow h_{\theta}(x)= \frac{1}{1 + e^{-z}} \geq 0.5\rightarrow \frac{e^{z}}{e^{z} + 1} \geq 0.5\rightarrow \frac{e^{\theta^{T} x}}{e^{\theta^{T} x} + 1} \geq 0.5 \rightarrow \theta^{T} x \geq 0\)

\(y=0 \rightarrow \theta^{T} x < 0\)

z = 0也稱爲決策邊界(Decision Boundary)，是分隔0和1的界線

還有多是非線性多項式的決策邊界

2，代價函數(Cost Function)

若是使用相似線性迴歸的代價函數，在使用梯度降低法的時候，隨着\( \theta \)減少，代價函數會出現多個局部最小值，並不能達到全局最小值，是非凸函數，須要另外選代價函數，能夠選擇以下代價函數

當y=1和0時的代價函數Cost圖像以下

不管y=0仍是1，h_θ(x)都是與y越接近越小，越遠越大，符合代價函數的最初定義

y=0和1合併可得單個樣例的代價函數

全部樣例的代價函數

改爲向量形式

梯度降低法求偏導後

最後結果的公式和線性迴歸如出一轍，除了假設函數h_θ(x)