從導數到梯度下降算法

函數的導數(derivative)描述了函數的變化率: 導數越大,表示函數增加的越快 導數越小,表示函數減少的越快 導數 = 0,對應函數的極值 對於一個誤差函數(error function),我們期望找到誤差函數最小的點,使得E(x)最小,那麼,就要找到一個x的變化量 Δ x \Delta x Δx,使得導數最小,這樣,誤差函數會按照最快的減少速度逼近最小值。當x的變化方向與導數方向180°相
相關文章
相關標籤/搜索