梯度下降（gradient descent）原理

時間 2020-12-24

原文原文鏈接

目標：解決多變量函數的最優化問題例如神經網絡中的損失函數（loss function）： C ( w , b ) = 1 2 n ∑ x ∥ y ( x ) − a ∥ 2 C(w,b)=\frac{1}{2n}\sum_{x}\|y(x)-a\|^2 C(w,b)=2n1x∑∥y(x)−a∥2 其中 w w w和 b b b爲網絡的參數， x x x爲訓練樣本， n n n爲訓練樣本的數目

>>阅读原文<<