深度學習中的動量

時間 2019-12-04

標籤深度學習動量简体版

原文原文鏈接

動量的優勢雖然隨機梯度降低仍然是很是受歡迎的優化方法，但其學習過程有時會很慢。動量方法 (Polyak, 1964) 旨在加速學習，特別是處理高曲率、小但一致的梯度，或是帶噪聲的梯度。動量算法積累了以前梯度指數級衰減的移動平均，而且繼續沿該方向移動。動量的效果以下圖所示。 web 動量的主要目的是解決兩個問題： Hessian 矩陣的病態條件和隨機梯度的方差。咱們經過此圖說明動量如何克服這兩

>>阅读原文<<