JavaShuo
欄目
標籤
LR爲什麼不可以用MSE作爲損失函數
時間 2021-01-01
標籤
機器學習算法
機器學習
简体版
原文
原文鏈接
原因總結: MSE 會有梯度消失現象 MSE 的導數非凸函數,求解最優解困難 證明: 1. 梯度消失公式證明: 令 ,記爲 。 只關注其中單項的公式,並簡化可得: 可見, 當 h 趨近於 0 時或者趨近於 1 時,該 Loss 的導數都會趨近爲 0,從而造成梯度消失現象。 2. 非凸函數公式證明 關注 其二階導數,可以得出其二階導數矩陣即 Hessian 矩陣不是正定矩陣。 該導數是非凸函數,不是
>>阅读原文<<
相關文章
1.
爲什麼分類問題不能使用mse損失函數
2.
爲什麼使用交叉熵作爲損失函數?
3.
分類問題的損失函數爲何通常不用MSE?
4.
爲什麼平方損失函數不適用分類問題
5.
爲什麼交叉熵能作爲損失函數及其彌補了平方差損失什麼缺陷
6.
爲什麼LR要用對數似然,而不是平方損失?
7.
LR損失函數推導
8.
lr的損失函數
9.
LR爲何用極大似然估計,損失函數爲何是log損失函數(交叉熵)
10.
感知機的損失函數中1/||w||爲什麼可以忽略
更多相關文章...
•
爲什麼使用 XML Schemas?
-
XML Schema 教程
•
爲什麼使用 Web Services?
-
Web Services 教程
•
Git可視化極簡易教程 — Git GUI使用方法
•
爲了進字節跳動,我精選了29道Java經典算法題,帶詳細講解
相關標籤/搜索
爲什麼
不知爲什麼
作爲
以爲
可爲
用爲
不爲
爲數
不論什麼
損失
Spring教程
NoSQL教程
Redis教程
應用
數據傳輸
數據庫
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
子類對象實例化全過程
2.
【Unity2DMobileGame_PirateBomb09】—— 設置基本敵人
3.
SSIS安裝以及安裝好找不到商業智能各種坑
4.
關於 win10 安裝好的字體爲什麼不能用 WebStrom找不到自己的字體 IDE找不到自己字體 vs找不到自己字體 等問題
5.
2019版本mac電腦pr安裝教程
6.
使用JacpFX和JavaFX2構建富客戶端
7.
MySQL用戶管理
8.
Unity區域光(Area Light) 看不見光線
9.
Java對象定位
10.
2019-9-2-用自動機的思想說明光速
本站公眾號
歡迎關注本站公眾號,獲取更多信息
相關文章
1.
爲什麼分類問題不能使用mse損失函數
2.
爲什麼使用交叉熵作爲損失函數?
3.
分類問題的損失函數爲何通常不用MSE?
4.
爲什麼平方損失函數不適用分類問題
5.
爲什麼交叉熵能作爲損失函數及其彌補了平方差損失什麼缺陷
6.
爲什麼LR要用對數似然,而不是平方損失?
7.
LR損失函數推導
8.
lr的損失函數
9.
LR爲何用極大似然估計,損失函數爲何是log損失函數(交叉熵)
10.
感知機的損失函數中1/||w||爲什麼可以忽略
>>更多相關文章<<