殘差網絡論文筆記

時間 2021-01-12

原文原文鏈接

退化表明並非系統越深效果越好。對於更深的模型，這有一種通過構建的解決方案：恆等映射（identity mapping）(層輸出等於輸入)來構建增加的層，而其它層直接從淺層模型中複製而來。這個構建的解決方案也表明了，一個更深的模型不應當產生比它的淺層版本更高的訓練錯誤率。通過將逼近的內容變爲H(x)-x，如果恆等映射是所要擬合的函數的話，那麼只需要把權值全置爲0就能逼近恆等映射。即使最優值不是恆