Batch Normalization(批量歸一化)

轉載自:http://blog.csdn.net/shuzfan/article/details/50723877 原論文下載地址:https://arxiv.org/pdf/1502.03167.pdf 1-Motivation 作者認爲:網絡訓練過程中參數不斷改變導致後續每一層輸入的分佈也發生變化,而學習的過程又要使每一層適應輸入的分佈,因此我們不得不降低學習率、小心地初始化。作者將分佈發生變
相關文章
相關標籤/搜索