權重衰減（weight decay）與學習率衰減（learning rate decay）

時間 2020-12-20

標籤深度學習简体版

原文原文鏈接

1. 權重衰減（weight decay） L2正則化的目的就是爲了讓權重衰減到更小的值，在一定程度上減少模型過擬合的問題，所以權重衰減也叫L2正則化。 1.1 L2正則化與權重衰減係數 L2正則化就是在代價函數後面再加上一個正則化項：其中 C0 代表原始的代價函數，後面那一項就是L2正則化項，它是這樣來的：所有參數w的平方的和，除以訓練集的樣本大小n。λ就是正則項係數，權衡正則項與 C0項

>>阅读原文<<