LSTM簡單理解

RNN LSTM 長短期記憶(Long short-term memory, LSTM)是一種特殊的RNN,主要是爲了解決長序列訓練過程中的梯度消失和梯度爆炸問題。簡單來說,就是相比普通的RNN,LSTM能夠在更長的序列中有更好的表現。 遺忘門 輸入門 更新cell狀態 輸出門 LSTM怎麼解決梯度消失和爆炸的問題? 首先三個門的激活函數是sigmoid,這也就意味着這三個門的輸出要麼接近於0,
相關文章
相關標籤/搜索