【翻譯】Sklearn 與 TensorFlow 機器學習實用指南 —— 第11章 訓練深層神經網絡(下) ...

訓練稀疏模型 所有剛剛提出的優化算法都會產生密集的模型,這意味着大多數參數都是非零的。 如果你在運行時需要一個非常快速的模型,或者如果你需要它佔用較少的內存,你可能更喜歡用一個稀疏模型來代替。 實現這一點的一個微不足道的方法是像平常一樣訓練模型,然後擺脫微小的權重(將它們設置爲 0)。 另一個選擇是在訓練過程中應用強 l1 正則化,因爲它會推動優化器儘可能多地消除權重(如第 4 章關於 Lasso
相關文章
相關標籤/搜索