梯度消失和梯度爆炸問題及其解決方法詳解

時間 2020-07-20

標籤梯度消失爆炸問題及其解決方法詳解简体版

原文原文鏈接

梯度不穩定概念和解決方法梯度消失和梯度爆炸問題概念原理詳解解決方法更改激活函數（Relu、Leaky-Relu、P-Relu等）權重初始化加入BN層（Batch Normalization）梯度剪切、權重正則（針對梯度爆炸）使用預訓練模型進行finetue 使用ResNet殘差結構梯度消失和梯度爆炸問題概念梯度消失是由於隨着網絡深度的加深，網絡反向傳播的小於1的導數通過逐層

>>阅读原文<<

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。