數據酷客【深度學習:理論與應用】深度學習介紹

多層感知機(MLP) 多個神經元以全連接層次相連 前饋神經網絡 萬能逼近原理:非線性函數的有限次複合來無限接近目標函數 多層感知機:誤差函數 模型的目標是讓預測誤差最小 一般使用梯度下降法(求導)來更新參數 鏈式法則計算梯度 後向傳播計算梯度 MLP的困境 目標函數通常爲非凸函數,不易求導獲得最小值 極容易陷入局部最優值 網絡層數增加後,鏈式法則計算梯度會出現梯度消失或爆炸問題 典型網絡結構 卷積
相關文章
相關標籤/搜索