神經網絡(四)-vanishing gradient problem

在前面的章節中,咱們已經瞭解了神經網絡的基本模型,以及如何使用梯度降低法來學習優化神經網絡的參數。在前面的數字識別的例子中,咱們能夠設計不一樣的神經網絡結構,固然獲得的識別率也是有區別的,好比除了輸入層(784個神經元)和輸出層(10個神經元),若是咱們只添加一個隱含層(30個神經元),運行30個epoch,mini-batch爲10, η=0.1 ,正則項 λ=5.0 ,能夠獲得的識別準確率爲9
相關文章
相關標籤/搜索