ResNet和ResNext--網絡架構、設計思路、主要差異

1.ResNet網絡 1.1 ResNet解決的關鍵問題是什麼? 是過擬合嗎?是梯度消失嗎?都不是,或者說不完全是。過擬合的最明顯表徵是方差大,即訓練集上效果好,測試集上效果差,但是深層模型在訓練和測試上效果都差。而梯度消失的問題在BN層(本質上控制了每一層的模值輸入,將上一層的輸出從飽和區拉到了非飽和區,使得每一層的梯度都維持在較合理的範圍內)引入之後也解決了大半。 ResNet解決的最關鍵問題
相關文章
相關標籤/搜索