TensorFlow2.0學習筆記---學習率衰減

在梯度下降的時候,如果學習率learning rate 太低會導致梯度更新次數很多次才能到最低點(圖一) 學習率learning rate 太高會導致梯度更新時一直震盪不能到最低點   學習率衰減 學習率在梯度下降時一開始可以大,但是後面要慢慢變小,在儘可能短的時間內達到最小點。
相關文章
相關標籤/搜索