正則

1.爲什麼L2不稀疏: 理解一: 稀疏則表示在0點處於最小值,而L2的導數在-0那裏基本不爲0。 因爲L2項在0點處導數是0, 所以如果原來的損失函數在0點處導數不爲0,那麼正則後的損失函數在0點處的導數就不爲0。 而施加 L1 regularization 時,只要 regularization 項的係數 C 大於原先費用函數在 0 點處的導數的絕對值,x = 0 就會變成一個極小值點。 只要保
相關文章
相關標籤/搜索
本站公眾號
   歡迎關注本站公眾號,獲取更多信息