JavaShuo
欄目
標籤
LR爲什麼不可以用MSE作爲損失函數
時間 2021-01-01
標籤
機器學習算法
機器學習
简体版
原文
原文鏈接
原因總結: MSE 會有梯度消失現象 MSE 的導數非凸函數,求解最優解困難 證明: 1. 梯度消失公式證明: 令 ,記爲 。 只關注其中單項的公式,並簡化可得: 可見, 當 h 趨近於 0 時或者趨近於 1 時,該 Loss 的導數都會趨近爲 0,從而造成梯度消失現象。 2. 非凸函數公式證明 關注 其二階導數,可以得出其二階導數矩陣即 Hessian 矩陣不是正定矩陣。 該導數是非凸函數,不是
>>阅读原文<<
相關文章
1.
爲什麼分類問題不能使用mse損失函數
2.
爲什麼使用交叉熵作爲損失函數?
3.
分類問題的損失函數爲何通常不用MSE?
4.
爲什麼平方損失函數不適用分類問題
5.
爲什麼交叉熵能作爲損失函數及其彌補了平方差損失什麼缺陷
6.
爲什麼LR要用對數似然,而不是平方損失?
7.
LR損失函數推導
8.
lr的損失函數
9.
LR爲何用極大似然估計,損失函數爲何是log損失函數(交叉熵)
10.
感知機的損失函數中1/||w||爲什麼可以忽略
更多相關文章...
•
爲什麼使用 XML Schemas?
-
XML Schema 教程
•
爲什麼使用 Web Services?
-
Web Services 教程
•
Git可視化極簡易教程 — Git GUI使用方法
•
爲了進字節跳動,我精選了29道Java經典算法題,帶詳細講解
相關標籤/搜索
爲什麼
不知爲什麼
作爲
以爲
可爲
用爲
不爲
爲數
不論什麼
損失
Spring教程
NoSQL教程
Redis教程
應用
數據傳輸
數據庫
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
如何將PPT某一頁幻燈片導出爲高清圖片
2.
Intellij IDEA中使用Debug調試
3.
build項目打包
4.
IDEA集成MAVEN項目極簡化打包部署
5.
eclipse如何導出java工程依賴的所有maven管理jar包(簡單明瞭)
6.
新建的Spring項目無法添加class,依賴下載失敗解決:Maven環境配置
7.
記在使用vue-cli中使用axios的心得
8.
分享提高自己作品UI設計形式感的幾個小技巧!
9.
造成 nginx 403 forbidden 的幾種原因
10.
AOP概述(什麼是AOP?)——Spring AOP(一)
本站公眾號
歡迎關注本站公眾號,獲取更多信息
相關文章
1.
爲什麼分類問題不能使用mse損失函數
2.
爲什麼使用交叉熵作爲損失函數?
3.
分類問題的損失函數爲何通常不用MSE?
4.
爲什麼平方損失函數不適用分類問題
5.
爲什麼交叉熵能作爲損失函數及其彌補了平方差損失什麼缺陷
6.
爲什麼LR要用對數似然,而不是平方損失?
7.
LR損失函數推導
8.
lr的損失函數
9.
LR爲何用極大似然估計,損失函數爲何是log損失函數(交叉熵)
10.
感知機的損失函數中1/||w||爲什麼可以忽略
>>更多相關文章<<