LSTM詳解

1 什麼是LSTM 長短期記憶(Long short-term memory, LSTM)是一種特殊的RNN,主要是爲了解決長序列訓練過程中的梯度消失和梯度爆炸問題。簡單來說,就是相比普通的RNN,LSTM能夠在更長的序列中有更好的表現。 2 深入LSTM結構 下面具體對LSTM的內部結構來進行剖析。 下面開始進一步介紹這四個狀態在LSTM內部的使用。(敲黑板) 下圖是普通RNN公式: 下圖是LS
相關文章
相關標籤/搜索