爲什麼說隨機最速下降法 (SGD) 是一個很好的方法?

轉載:本文原作者袁洋,原文載於作者的知乎專欄——理論與機器學習,雷鋒網經授權發佈。 轉載自:http://www.sohu.com/a/190641434_114877 本文主要介紹 SGD 算法,和兩篇分析它逃離鞍點的論文: 我與鬲融,金馳,黃芙蓉寫的 Escaping From Saddle Points – Online Stochastic Gradient for Tensor Deco
相關文章
相關標籤/搜索