李宏毅機器學習筆記---Gradient Descent

時間 2020-12-29

標籤筆記简体版

原文原文鏈接

Gradient Descent In step3,we have to solve the following optimization: 找到使得Loss Function最小的parameter Tuning your learning rates 學習率太大太小均不可以 Adaptive learning Rates Adagrad 給每一個參數一個不同的learning rate

>>阅读原文<<