RNN激活函數、Encoder-Decoder、Seq2Seq、Attention

時間 2020-02-17

標籤 rnn 激活函數 encoder decoder seq2seq seq attention 简体版

原文原文鏈接

RNN中爲何使用使用tanh激活，不用sigmoid、Relu Sigmoid函數的導數範圍是(0,0.25], Tanh函數的導數是(0,1]。網絡因爲RNN中會執行不少累乘，小於1的小數累乘會致使梯度愈來愈接近於0,出現梯度消失現象。函數 Tanh與Sigmoid相比，梯度更大，收斂速度更快而且出現梯度消失的狀況要優於Sigmoid。優化另外一點是Sigmoid的輸出均大於0，不是

>>阅读原文<<

1. NLP—RNN、Seq2Seq和Attention
2. 激活函數（2）Softmax激活函數
3. 【NLP】圖解從RNN到seq2seq+Attention
4. seq2seq入門詳解：從RNN到Attention
5. 激活函數
更多相關文章...
• W3C XQuery 活動 - W3C 教程
• W3C Soap 活動 - W3C 教程
• Flink 數據傳輸及反壓詳解
• TiDB 在摩拜單車在線數據業務的應用和實踐

相關標籤/搜索

seq2seq+attention+transformer