ResNet

時間 2020-12-24

原文原文鏈接

2、深度殘差網絡—— http://blog.csdn.net/twenty_seven/article/details/70153848 這樣的一個好處可能是當需要這個F（x）時，網絡就會把他正常優化，當不需要這幾層時，網絡就會自動把它訓練的趨近於0（相比於把他由非線性層擬合成恆等映射，變成0而另外直接添加一個恆等映射x會更容易），這樣讓網絡來整體的自動選擇一個最佳的網絡的層數。那麼實際的映射