分類問題不使用平方損失函數的原因

  一般平方損失函數的公式如下圖所示: h表示的是你的預測結果,y表示對應的標籤,J就可以理解爲用二範數的方式將預測和標籤的差距表示出來,模型學習的過程就是優化權重參數,使得J達到近似最小值,理論上這個損失函數是很有效果的,但是在實踐中卻又些問題,它這個h是激活函數激活後的結果,激活函數通常是非線性函數,例如sigmoid之類的,這就使得這個J的曲線變得很複雜,並不是凸函數,不利於優化,很容易陷入
相關文章
相關標籤/搜索