深度學習中的Batch Normalization

Batch Normalization 假設我們有兩組training data: x1=[1,2,3,⋯] x 1 = [ 1 , 2 , 3 , ⋯ ] ,x2=[100,200,300,⋯] , x 2 = [ 100 , 200 , 300 , ⋯ ] 當我們利用這組數據進行機器學習的時候,會發現對於第一筆數據 x1 x 1 ,它的梯度會比第二筆數據 x2 x 2 的梯度要小得多,這時候的
相關文章
相關標籤/搜索