神經機器翻譯中的Attention機制

傳統的機器翻譯系統通常依賴於基於文本統計特性的複雜特徵工程,需要投入大量工程大見他們。 神經機器翻譯系統NMT,把一句話的意思映射到一個固定長度的特徵向量,然後基於此進行翻譯。由於NMT不再依賴於n-gram計數,而是捕捉文本更高層的含義。 基於encoder-decoder的模型 NMT系統使用RNN將源語句(比如,一句德語)編碼爲一個向量,然後同樣用RNN將其解碼爲英語。 如上圖中,「Echt
相關文章
相關標籤/搜索