殘差網絡的理解

殘差網絡的理解 趁熱乎~寫一下自己現在的理解,以後隨着知識的積累補充,咳咳。 深層次網絡的問題 計算資源的消耗 模型容易過擬合 梯度消失/梯度爆炸問題的產生 問題1可以通過GPU集羣來解決,對於一個企業資源並不是很大的問題; 問題2的過擬合通過採集海量數據,並配合Dropout正則化等方法也可以有效避免; 問題3通過Batch Normalization也可以避免。 梯度消失/爆炸 網絡退化 隨着
相關文章
相關標籤/搜索