weight-decay與L2正則化差異

時間 2020-12-20

標籤 pytorch python 深度學習欄目正則表達式简体版

原文原文鏈接

最近在看其他量化訓練的一些代碼、論文等，不經意間注意到有人建議要關注weight decay值的設置，建議設置爲1e-4，不要設置爲1e-5這麼小，當然，這個值最好還是在當下的訓練任務上調一調。因爲weight-decay 可以使參數儘可能地小，儘可能地緊湊，那這樣權重的數值就不太可能出現若干個極端數值（偏離權重均值過大或過小）導致數值區間過大，這樣求得的scale=(b-a)/255 會偏大

>>阅读原文<<

相關文章

相關標籤/搜索

正則表達式

Thymeleaf 教程

Hibernate教程

代碼格式化

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公眾號

歡迎關注本站公眾號,獲取更多信息

相關文章

>>更多相關文章<<