Seq2Seq與Attention

一、seq2seq 對於序列數據常用的深度學習結構是RNN,但是普通RNN的結構存在缺陷,比如梯度消失,輸入序列與輸出序列要求等長等問題。這在許多情況下,比如翻譯、生成總結等,RNN沒有很好的效果。爲了解決RNN梯度消失問題,提出了lstn結構,但是仍沒有解決輸入序列與輸出序列要求等長的問題。 Sequence-to-sequence(seq2seq)解除了輸入和輸出序列等長和長度固定的問題。一個
相關文章
相關標籤/搜索