【BN層】批量歸一化

記錄一下學習的批歸一化層也就是Batch Normalize層 BN層的計算過程: (1)先給論文中的計算過程和公式: 最後基本可以獲得一個組均值爲 β 、方差爲 γ^2的分佈的新數據  (2)形象化過程: BN的作用和意義: 通俗說:BN層使得深層的參數更加適應淺層參數的變化,沒有大的影響 官方說法: 防止「梯度彌散」 加速網絡收斂速度 可以使用較大的學習率 可代替其他正則方式,例如Dropou
相關文章
相關標籤/搜索