inception v2

深度網絡爲什麼難訓練?   因爲internal covariate shift internal covariate shift:在訓練過程中,每層的輸入分佈因爲前層的參數變化而不斷變化 從不同的角度說明問題internal covariate shift   1.SGD訓練多層網絡           總損失是,當,損失轉換爲            梯度更新是            當x的分佈
相關文章
相關標籤/搜索