Notes on ResNet

這篇博文是博主讀過何愷明及其團隊的論文Deep Residual Learning for Image Recognition所做的總結,如有錯誤,歡迎指正! 人們主觀的認爲更深層的神經網絡可以更好的擬合訓練數據,因爲深層網絡會有更多的參數來學習更多的細節。但隨着神經網絡層數的增加,在執行反向傳播的過程中很容易遇到梯度爆炸或消失的問題,從而使學習效率降低甚至不收斂。該類問題可以通過合理的初始化參數
相關文章
相關標籤/搜索