梯度下降與提升性能的方法

文章來自李宏毅教授課程所做筆記 梯度下降法 在迴歸問題的第三步中,需要解決下面的最優化問題: L:lossfunction(損失函數) θ:parameters(參數) 這裏的parameters是複數,即θ 指代一堆參數。我們要找一組參數 θ ,讓損失函數越小越好,這個問題可以用梯度下降法解決 。 首先假設θ裏面有兩個參數θ1​,θ2​ 分別隨機取值 同時,我們令 那麼,梯度下降法可以表示爲 即
相關文章
相關標籤/搜索