LSTM變種比較

LSTM簡介 LSTM(Long Short Term Memory)是在標準RNN基礎上改進而來的一種網絡結構,其出現的主要作用是爲了解決標準RNN訓練過程中的梯度消失問題,LSTM的結構如下圖所示。因此其可以處理時間間隔和延遲較長的序列問題,近年來在語音識別,機器翻譯,OCR等領域得到了廣泛的應用並取得了比較可觀的效果。 相比於標準RNN模型,LSTM主要是增加了三個控制門單元:遺忘門,輸入門
相關文章
相關標籤/搜索