BN層的主要作用

BN層的主要作用 BN層的作用主要有三個: 加快網絡的訓練和收斂的速度 控制梯度爆炸防止梯度消失 防止過擬合 分析: (1)加快收斂速度:在深度神經網絡中中,如果每層的數據分佈都不一樣的話,將會導致網絡非常難收斂和訓練,而如果把 每層的數據都在轉換在均值爲零,方差爲1 的狀態下,這樣每層數據的分佈都是一樣的訓練會比較容易收斂。 (2)防止梯度爆炸和梯度消失: 以sigmoid函數爲例,sigmoi
相關文章
相關標籤/搜索