新建文本文檔

概述 本文要解決的問題是在文獻[1]和[2]中都提到過的跳躍連接聚集的問題。雖然跳躍連接可以使超網絡的長度可以收縮,但它使超網絡的訓練便得不穩定,進而使評估模型變得困難。本文首先深入討論了跳躍連接給訓練帶來的不穩定性,給出了造成這種現象的根本原因;然後提出了一種可學習的穩定子,使超網絡在可變深度的情況下訓練也變得穩定;最後利用這種穩定子在ImageNet上訓練達到了76.9%的SOTA,且相比於E
相關文章
相關標籤/搜索