爲什麼說隨機最速下降法(SGD)是一個很好的方法?

[本文主要介紹SGD算法,和兩篇分析它逃離鞍點的論文: 我與鬲融,金馳,黃芙蓉寫的Escaping From Saddle Points – Online Stochastic Gradient for Tensor Decomposition, 以及由金馳,鬲融等人寫的最新力作:How to Escape Saddle Points Efficiently] 假如我們要優化一個函數 ,即找到它的
相關文章
相關標籤/搜索