從動力學角度看優化算法：從SGD到動量加速

時間 2020-12-27

原文原文鏈接

來源：https://kexue.fm/archives/5655 目錄梯度下降訓練目標分析 GD與ODE 隨機梯度下降從GD到SGD 從SGD到SDE 結果啓發動量加速從一階到二階 GD+Momentum 如何加速？ Nesterov動量 Kramers方程思考回顧在本文中，我們來關心優化算法 SGD（stochastic gradient descent，隨機梯度下降），包

>>阅读原文<<