機器學習筆記第二週

時間 2019-11-07

標籤機器學習筆記第二简体版

原文原文鏈接

1、 Logistic迴歸與Logistic函數

　　分類問題的標籤能夠是$y\epsilon \left \{ 0,1 \right \},y\epsilon \left \{ 0,1,2 \right \},y\epsilon \left \{ 0,1,2,3,... \right \}$，對應分別爲二元、三元、…分類問題。借鑑線性迴歸算法，咱們但願預測樣本屬於每一個標籤的機率$p\left \{ y=i \right \}$ ，並且$p\epsilon \left [ 0,1 \right ]$。將機率最大的標籤做爲分類結果。這裏的機率就對應爲假設函數$h_\theta (x)$，與線性迴歸不一樣，logistic迴歸要求$h_\theta (x)\epsilon \left \lfloor 0,1 \right \rfloor$。因而新的$h_\theta (x)$函數的構造以下：算法

2、 Logistic決策邊界（decision boundary）

　　以二元分類爲例，從假設函數中能夠發現，當$\theta^Tx>0$時，機率大於0.5，所以預測y=1；反之預測y=0。$\theta^Tx=0$就是決策邊界，其展開形式爲:$\theta_0x+\theta_1x+\theta_2x+...=0$。對應的邊界線以下圖所示：函數

　　這裏的邊界就是一條直線，將空間劃分爲兩個區域。若是是多項式迴歸，那麼邊界多是下面形式：學習

3、 Logistic代價函數

　　以二元分類爲例，Logistic迴歸同線性迴歸同樣，都要肯定合適的模型參數，來更好地預測機率。一樣，使用代價函數來評價$\theta$好壞，logistic迴歸裏採用對數代價形式：優化

　當所給標籤爲1時，若是預測的機率接近1，則代價接近0；若是預測的機率接近0，則代價接近無窮。當所給標籤爲0時，若是預測的機率接近1，則代價接近無窮；若是預測的機率接近0，則代價接近1。spa

4、 Logistic梯度降低

　　用代價函數去懲罰模型參數：3d

　　對式3-1求偏導可得：orm

5、多分類問題

　　解決多分類的一種思想是分解爲多個二分類，爲每個二分類都維護一個假設函數，記成下面的形式：　　blog

　　例如三分類中，咱們維護三個假設函數：$h_\theta^{(0)}(x)、h_\theta^{(1)}(x)、h_\theta^{(2)}(x)$，表示屬於三個類的機率，當更新$h_\theta^{(0)}(x)$時，將標籤爲0的視做0，將標籤爲1、2都視做1。$h_\theta^{(1)}(x)、h_\theta^{(2)}(x)$也相似。最終預測分類的時候，比較三個假設函數值的大小，取機率最大的做爲分類標準。內存