002 SGD、SGDM、Adagrad、RMSProp、Adam、AMSGrad、NAG

參考 http://speech.ee.ntu.edu.tw/~tlkagk/courses/ML2020/Optimization.pdf 變量解釋 目標:尋找使損失函 L ( θ ) L(\theta) L(θ)數最小的模型參數 θ \theta θ 模型參數 θ \theta θ、損失函數 L ( θ ) L(\theta) L(θ)、動量 m m m SGD(Stochastic grad
相關文章
相關標籤/搜索