什麼是Gradient Descent(梯度下降法)以及學習率的解釋

什麼是Gradient Descent(梯度下降法)? Review: 梯度下降法 在迴歸問題的第三步中,需要解決下面的最優化問題: θ∗=argminθL(θ) L:lossfunction(損失函數) θ:parameters(參數) 這裏的parameters是複數,即 θ 指代一堆參數,比如上篇說到的 w 和 b 。 我們要找一組參數 θ ,讓損失函數越小越好,這個問題可以用梯度下降法解決
相關文章
相關標籤/搜索