Attention Is All You Need

摘要     目前的序列轉化模型都是基於編碼器-解碼器的複雜CNN和RNN。目前最好的模型就是將編碼器與解碼器利用注意力機制(attention mechanism)連接起來。本文提出一種簡單的模型結構,遺棄了CNN和RNN,僅僅使用注意力機制。在兩個機器翻譯的任務上,本文模型在性能上比現有模型好。 1.Introduction     RNN,LSTM以及gated RNN在序列模型中已經得到了
相關文章
相關標籤/搜索