在訓練的時候loss增大怎麼辦

引發這種問題的根本緣由是Hessian矩陣的病態條件數 一、對學習率乘上一個參數(0.99或者0.999)使得學習率隨着學習步驟的進行而降低 二、另外一種辦法就是採用現成的優化算法。web 參考連接:https://www.zhihu.com/question/60510992算法
相關文章
相關標籤/搜索