學習率和batchsize如何影響模型的性能?

前幾期我們講述了數據,模型的深度,寬度對深度學習模型性能的影響,這一次我們講述學習率和batchsize對模型性能的影響,在實踐中這兩個參數往往一起調整。 1 爲什麼說學習率和batchsize 目前深度學習模型多采用批量隨機梯度下降算法進行優化,隨機梯度下降算法的原理如下, n是批量大小(batchsize),η是學習率(learning rate)。可知道除了梯度本身,這兩個因子直接決定了模型
相關文章
相關標籤/搜索