層數比較深的網絡訓練技巧

      監督性區分性分層訓練               遇見的 問題: 假如訓練20層的網絡,直接堆積網絡,由於網絡過於深入,每一層都會有誤差(並且是小於1的值),這樣可能會在回傳的時候會導致梯度消失(連續累✖️越來越小),無法收斂,那麼是如何訓練的呢(很多情況都是由於初始數值不好導致)。                 解決方法:1. 進行分層訓練,首先先抽7層隱層,然後後邊直接接入一個到
相關文章
相關標籤/搜索