Gradient Centralization: 簡單的梯度中心化,一行代碼加速訓練並提升泛化能力 | ECCV 2020 Oral

梯度中心化GC對權值梯度進行零均值化,能夠使得網絡的訓練更加穩定,並且能提高網絡的泛化能力,算法思路簡單,論文的理論分析十分充分,能夠很好地解釋GC的作用原理   來源:曉飛的算法工程筆記 公衆號 論文: Gradient Centralization: A New Optimization Technique for Deep Neural Networks 論文地址:https://arxiv
相關文章
相關標籤/搜索