隨機梯度下降算法SGD

隨機梯度下降算法SGD 參考:爲什麼說隨機最速下降法 (SGD) 是一個很好的方法? 假如我們要優化一個函數 f ( x ) f(x) f(x) ,即找到它的最小值,常用的方法叫做 Gradient Descent (GD),也就是最速下降法。說起來很簡單, 就是每次沿着當前位置的導數方向走一小步,走啊走啊就能夠走到一個好地方了。 如上圖, 就像你下山一樣,每一步你都挑最陡的路走,如果最後你沒摔死
相關文章
相關標籤/搜索