對於殘差網絡(Resnet)的理解

     理論上來說,網絡結構越深,提取的圖像特徵越「高級」,應該得到的學習效果更好。但是當我們傳統網絡堆到一定深度時,卻準確度下降了。文章中主出了深層網絡存在的兩個問題: 1.梯度彌散與梯度爆炸 2.對於一個已經實現了最優擬合的淺層網絡,如果再增加一些層,我們希望這些層最終權重都是1,實現恆等映射,而實際的學習中很難做到這一點,導致多經過網絡加深後反而效果下降。這個問題稱作退化問題。 針對以上問
相關文章
相關標籤/搜索