周志華 機器學習 Day8

我們以上圖隱層到輸出層的連接權whj爲例推導: BP算法基於梯度下降策略,以目標的負梯度方向對參數進行調整,對的誤差Ek,給定學習率η,有 往下推導過程詳看P103起 Sigmoid函數有一個很好的性質:f'(x)=f(x)(1-f(x)) 一般地,我們把學習率η∈(0,1)設置成0.1,這樣不會導致太大容易震盪,太小收斂速度過慢。 誤差逆傳播算法 一般來說,標準BP算法僅針對單個樣例,參數更新非
相關文章
相關標籤/搜索