機器翻譯模型簡介(二)

本系列將記錄一些最近的機器翻譯模型,作爲筆記,以備日後查看。 2、Convolutional Sequence to Sequence Learning        本文提出用卷積網絡進行序列到序列模型的建立,針對循環神經網絡中現有的時序優勢,將卷積網絡進行改進,採用pos embedding,多跳attention以及多層卷積等,以將卷積適用於這種時序的場景。 整體框架如下圖:        
相關文章
相關標籤/搜索