字子序列中英翻譯模型(五筆特徵)

文章:Wei Zhang, etc. Subcharacter Chinese-English Neural Machine Translation with Wubi encoding 主要思想:將五筆作爲中文字模型特徵用於翻譯模型 背景:有人使用了詞子序列(sub-word)作爲基本單位,用以規避典外詞彙(Out Of Vocabulary, OOV)帶來的問題,縮小了詞表,並取得了良好的效果
相關文章
相關標籤/搜索