論文閱讀筆記:殘差神經網絡(ResNet v1)

ResNet v1 1、四個問題 要解決什麼問題?/ 用了什麼辦法解決? 理論上來說,深層網絡的效果至少不會比淺層網絡差。 對於淺層網絡A,深層網絡B,假設B的前面部分與A完全相同,後面部分都是恆等映射,這樣B至少也會與A性能相同,不會更差。 在深層網絡中存在梯度消失/梯度爆炸(vanishing/exploding gradients)。 歸一初始化(normalized initializat
相關文章
相關標籤/搜索