Seq2Seq和Attention機制詳解

一、Seq2Seq簡介 seq2seq模型最早可追溯到2014年的兩篇paper [1, 2],主要用於機器翻譯任務(MT)。 seq2seq 是一個Encoder–Decoder 結構的網絡,它的輸入是一個序列,輸出也是一個序列, Encoder 中將一個可變長度的信號序列變爲固定長度的向量表達,Decoder 將這個固定長度的向量變成可變長度的目標的信號序列。 由於encoder與decode
相關文章
相關標籤/搜索