深度學習中學習率和batchsize對模型準確率的影響

本內容來自其他的人解析,參考鏈接在最後的註釋。 1. 前言 目前深度學習模型多采用批量隨機梯度下降算法進行優化,隨機梯度下降算法的原理如下: n是批量大小(batchsize),η是學習率(learning rate)。可知道除了梯度本身,這兩個因子直接決定了模型的權重更新,從優化本身來看它們是影響模型性能收斂最重要的參數。 學習率直接影響模型的收斂狀態,batchsize則影響模型的泛化性能,兩
相關文章
相關標籤/搜索