keras各種優化方法總結 SGDmomentumnesterov

時間 2021-01-02

原文原文鏈接

http://blog.csdn.net/luo123n/article/details/48239963 前言這裏討論的優化問題指的是，給定目標函數f(x)，我們需要找到一組參數x，使得f(x)的值最小。本文以下內容假設讀者已經瞭解機器學習基本知識，和梯度下降的原理。 SGD SGD指stochastic gradient descent，即隨機梯度下降。是梯度下降的batch版本。

>>阅读原文<<