理解梯度下降

理解梯度下降 梯度下降的公式相信大家都耳熟能詳: θ = θ − λ ∂ f ( x ; θ ) ∂ θ \theta=\theta-\lambda \frac{\partial f(x;\theta)}{\partial \theta} θ=θ−λ∂θ∂f(x;θ)​ 其中 λ \lambda λ是步長,那爲什麼他有效呢? Local linearity 在討論梯度下降之前,我們先討論一個更簡單
相關文章
相關標籤/搜索