消失的梯度問題(vanishing gradient problem)

784節點輸入層+單30節點隱藏層+10節點輸出層在《神經網絡的優化方式》中已經表現的很好了,達到了96.35%的準確率,如果增加神經網絡的隱藏層深度效果會如何呢? 雙30節點隱藏層,準確率96.84%; 三30節點隱藏層,準確率96.39%; 四30節點隱藏層,準確率96.38%。 整個測試效果分析下來,隱藏層深度的提高對準確率沒有什麼影響。但是這真的顛覆了我們對深度學習的理解,難道不是深度越高
相關文章
相關標籤/搜索