交叉熵代價函數(損失函數)及其求導推導

時間 2019-11-08

標籤交叉代價函數損失及其推導简体版

原文原文鏈接

原文：https://blog.csdn.net/jasonzzj/article/details/52017438算法

本文只討論Logistic迴歸的交叉熵，對Softmax迴歸的交叉熵相似。函數

交叉熵的公式

以及 $J (θ) 对$ 優化

$J (θ) 对$

交叉熵損失函數

假設函數（hypothesis function）定義爲： atom

由於Logistic迴歸問題就是0/1的二分類問題，能夠有 spa

如今，咱們不考慮「熵」的概念，根據下面的說明，從簡單直觀角度理解，就能夠獲得咱們想要的損失函數：咱們將機率取對數，其單調性不變，有：.net

那麼對於第 $i$ 3d

$i$

其中，I{y(i)=1}和I{y(i)=0}爲示性函數（indicative function），簡單理解爲{ }內條件成立時取1，不然取0。xml

由以上表徵正確的機率含義可知，咱們但願其值越大，模型對數據的表達能力越好。而咱們在參數更新或衡量模型優劣時是須要一個能充分反映模型表現偏差的損失函數（Loss function）或者代價函數（Cost function）的，並且咱們但願損失函數越小越好。由這兩個矛盾，那麼咱們不妨領代價函數爲上述組合對數機率的相反數：
blog