dual learning for machine translation

時間 2020-12-24

原文原文鏈接

對於翻譯系統，如語言A翻譯到語言B，通常需要大量的語言對來訓練神經機器翻譯，而數據量的增大會大大的增加成本。本文通過構建兩個神經翻譯網絡，θAB和θBA，這兩個網絡分別用於將語言A翻譯到語言B和語言B翻譯到語言A。文章先採用少量的語言對訓練好這兩個模型。之後，採用無監督學習，訓練這兩個模型，具體爲將語言A輸入網絡θAB，同時將θAB的輸出輸入到網絡θBA中，再採用強化學習的思想，對網絡θAB和網絡

>>阅读原文<<