L2 normalization 爲什麼能夠降低過擬合

L2 normalization 爲什麼能夠降低過擬合? 假設 cost function 爲: J(w,b)=1m∑ni=0(yi^−yi)2+λ2m∑Ll=1||w[l]||2F 其中: ||w[l]||2F=∑n[l−1]i=1∑n[l]j=1||wij||2 假定激活函數使用: g(z)=tanh(z) 若使成本函數最小化,若 λ 變大,則, w[l] 變小,那麼, z[l]=w[l]a[
相關文章
相關標籤/搜索