基於注意力機制的 中 英機器翻譯

數據處理模塊 數據介紹 語料介紹一下: data文件夾有如下文件: cn.txt:中文語料,裏面的句子都已經分好了詞。 en.txt: 英語對齊語料,裏面的單詞也分詞完畢。 cn.text.txt: 中文測試集語料 en.tetx.txt:英語對齊測試集語料 cn.txt.vab:中文詞典文件 en.txt.vab:英語詞典文件 語料一共才6000多個對齊的句子。因此,在生成詞典的時候,沒有做詞頻
相關文章
相關標籤/搜索