weight decay的作用和實現

weight decay(權值衰減)的目的既不是提高精確度也不是提高收斂速度,可以將它看做是一種正則化,其最終目的是爲了防止過擬合。在進行梯度下降時,使用一個 λ \lambda λ值(取值介於0到1之間)乘以當前計算的每一個weight。 momentum是梯度下降中一種常用的加速技術,用來跳過局部最優 如下圖,0.99就是權重衰減係數, η \eta η爲學習率
相關文章
相關標籤/搜索