[work] Weight Decay 權值衰減

時間 2020-12-19

原文原文鏈接

之一：在機器學習中，常常會出現overfitting，網絡權值越大往往overfitting的程度越高，因此，爲了避免出現overfitting,會給誤差函數添加一個懲罰項，常用的懲罰項是所有權重的平方乘以一個衰減常量之和。右邊項即用來懲罰大權值。權值衰減懲罰項使得權值收斂到較小的絕對值，而懲罰大的權值。從而避免overfitting的出現。之二：假設我們原來的損失函數沒有weig

>>阅读原文<<