深度學習之如何防止梯度爆炸/梯度消失?

時間 2020-12-27

原文原文鏈接

什麼是梯度爆炸/梯度消失? 深度神經網絡訓練的時候，採用的是反向傳播方式，該方式使用鏈式求導，計算每層梯度的時候會涉及一些連乘操作，因此如果網絡過深。那麼如果連乘的因子大部分小於1，最後乘積的結果可能趨於0，也就是梯度消失，後面的網絡層的參數不發生變化. 那麼如果連乘的因子大部分大於1，最後乘積可能趨於無窮，這就是梯度爆炸如何防止梯度消失？ sigmoid容易發生，更換激活函數爲 ReLU即可

>>阅读原文<<

相關文章

相關標籤/搜索

深度學習 CNN

Python深度學習

Python 深度學習

深度學習篇

Thymeleaf 教程

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公眾號

歡迎關注本站公眾號,獲取更多信息

相關文章

>>更多相關文章<<