李宏毅機器學習入門學習筆記(三)Gradient Descent

文章目錄 什麼是Gradient Descent(梯度下降法)? Review: 梯度下降法 Tip1:調整 learning rates(學習速率) 小心翼翼地調整 learning rate 自適應 learning rate Adagrad 算法 Adagrad 是什麼? Adagrad舉例 Adagrad 存在的矛盾? 多參數下結論不一定成立 Adagrad 進一步的解釋 Tip2:Sto
相關文章
相關標籤/搜索