權重衰減(weight decay)與學習率衰減(learning rate decay)

1. 權重衰減(weight decay) L2正則化的目的就是爲了讓權重衰減到更小的值,在一定程度上減少模型過擬合的問題,所以權重衰減也叫L2正則化。 1.1 L2正則化與權重衰減係數 L2正則化就是在代價函數後面再加上一個正則化項:   其中 C0 代表原始的代價函數,後面那一項就是L2正則化項,它是這樣來的:所有參數w的平方的和,除以訓練集的樣本大小n。λ就是正則項係數,權衡正則項與 C0項
相關文章
相關標籤/搜索