層數比較深的網絡訓練技巧

時間 2021-01-20

原文原文鏈接

監督性區分性分層訓練遇見的問題：假如訓練20層的網絡，直接堆積網絡，由於網絡過於深入，每一層都會有誤差（並且是小於1的值），這樣可能會在回傳的時候會導致梯度消失（連續累✖️越來越小），無法收斂，那麼是如何訓練的呢（很多情況都是由於初始數值不好導致）。解決方法：1. 進行分層訓練，首先先抽7層隱層，然後後邊直接接入一個到

>>阅读原文<<