深度學習中的Batch Normalization

時間 2020-12-20

原文原文鏈接

Batch Normalization 假設我們有兩組training data： x1=[1,2,3,⋯] x 1 = [ 1 , 2 , 3 , ⋯ ] ,x2=[100,200,300,⋯] , x 2 = [ 100 , 200 , 300 , ⋯ ] 當我們利用這組數據進行機器學習的時候，會發現對於第一筆數據 x1 x 1 ，它的梯度會比第二筆數據 x2 x 2 的梯度要小得多，這時候的

>>阅读原文<<