動量與學習率衰減

動量 取決於β參數的選取,根據矢量三角形法則,選取下次的運動方向。 不加動量的狀況下,方向變化比較尖銳,沒有考慮歷史變化的狀況,且容易局部最優。 加動量後,變化更加的緩和,依靠慣性,可能跳出局部最優解。 web 學習率調整
相關文章
相關標籤/搜索