JavaShuo
欄目
標籤
fast-r-cnn論文中個爲什麼使用smooth_L1 (x),smooth_l1是什麼?
時間 2021-01-02
標籤
深度學習
機器學習
pytorch
简体版
原文
原文鏈接
先把論文中這部分描述摘抄過來,如下圖所示: 假設我們不適用smooth_L1,考慮L2函數 其梯度爲 那麼會出現一個原文描述的問題,when the regression targets are unbounded,既x很大的時候,會發生梯度爆炸,再考慮L1函數 此時會出現另外一個問題,當x變化很小的時候,梯度依舊很大,此時函數很有可能無法收斂(除非你控制學習率降低的更多,但是這樣手工智能
>>阅读原文<<
相關文章
1.
L1/2-smooth_l1
2.
1.什麼是消息中間件,爲什麼要使用?
3.
什麼是Webpack,爲什要使用WebPack
4.
什麼是UML?爲什麼要用UML?
5.
什麼是vue?爲什麼用vue?
6.
爲什麼要用Hibernate,Hibernate是什麼
7.
redis是什麼,爲什麼要用redis?
8.
Dubbo是什麼,爲什麼要用它?
9.
什麼是Socket,爲什麼要用Socket
10.
使用arch linux_什麼是Arch Linux? 爲什麼要使用它?
更多相關文章...
•
爲什麼使用 XML Schemas?
-
XML Schema 教程
•
爲什麼使用 Web Services?
-
Web Services 教程
•
Scala 中文亂碼解決
•
Composer 安裝與使用
相關標籤/搜索
什麼
不論什麼
爲什麼
什麼是數學
不知爲什麼
什麼時候
什麼樣
什麼人
沒有什麼
在什麼
Spring教程
MySQL教程
PHP教程
應用
註冊中心
文件系統
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
正確理解商業智能 BI 的價值所在
2.
解決梯度消失梯度爆炸強力推薦的一個算法-----LSTM(長短時記憶神經網絡)
3.
解決梯度消失梯度爆炸強力推薦的一個算法-----GRU(門控循環神經⽹絡)
4.
HDU4565
5.
算概率投硬幣
6.
密碼算法特性
7.
DICOMRT-DiTools:clouddicom源碼解析(1)
8.
HDU-6128
9.
計算機網絡知識點詳解(持續更新...)
10.
hods2896(AC自動機)
本站公眾號
歡迎關注本站公眾號,獲取更多信息
相關文章
1.
L1/2-smooth_l1
2.
1.什麼是消息中間件,爲什麼要使用?
3.
什麼是Webpack,爲什要使用WebPack
4.
什麼是UML?爲什麼要用UML?
5.
什麼是vue?爲什麼用vue?
6.
爲什麼要用Hibernate,Hibernate是什麼
7.
redis是什麼,爲什麼要用redis?
8.
Dubbo是什麼,爲什麼要用它?
9.
什麼是Socket,爲什麼要用Socket
10.
使用arch linux_什麼是Arch Linux? 爲什麼要使用它?
>>更多相關文章<<