爲什麼說隨機最速下降法 (SGD) 是一個很好的方法？

時間 2020-12-20

原文原文鏈接

轉載：本文原作者袁洋，原文載於作者的知乎專欄——理論與機器學習，雷鋒網經授權發佈。轉載自：http://www.sohu.com/a/190641434_114877 本文主要介紹 SGD 算法，和兩篇分析它逃離鞍點的論文: 我與鬲融，金馳，黃芙蓉寫的 Escaping From Saddle Points – Online Stochastic Gradient for Tensor Deco

>>阅读原文<<