周志華機器學習 Day8

時間 2021-01-09

標籤周志華機器學習简体版

原文原文鏈接

我們以上圖隱層到輸出層的連接權whj爲例推導： BP算法基於梯度下降策略，以目標的負梯度方向對參數進行調整，對的誤差Ek，給定學習率η，有往下推導過程詳看P103起 Sigmoid函數有一個很好的性質：f'(x)=f(x)(1-f(x)) 一般地，我們把學習率η∈（0,1）設置成0.1，這樣不會導致太大容易震盪，太小收斂速度過慢。誤差逆傳播算法一般來說，標準BP算法僅針對單個樣例，參數更新非

>>阅读原文<<