機器學習中梯度下降算法解釋爲什麼梯度方向函數值是下降的

之前學習逆向傳播算法對參數的優化,看到了它的原理是梯度下降,所以查了知乎,看到了梯度下降(知乎上資料的鏈接)的數學原理。梯度就是偏導數構成的一個向量,梯度的模與方向導數最大值一樣,指的是函數值變化最大的方向,但是爲什麼反梯度方向即爲函數下降最快呢?很多地方都沒有說明,本文用直觀的方法進行說明。
相關文章
相關標籤/搜索