Nesterov Accelerated Gradient

比Momentum更快:揭開Nesterov Accelerated Gradient的真面目 轉自:https://zhuanlan.zhihu.com/p/22810533 做爲一個調參狗,天天用着深度學習框架提供的各類優化算法如Momentum、AdaDelta、Adam等,卻對其中的原理不甚清楚,這樣和一條鹹魚有什麼分別!(誤)html 可是我又懶得花太多時間去看每一個優化算法的原始論文,
相關文章
相關標籤/搜索