[ACL2016]Pointing the Unknown Words

時間 2021-01-02

原文原文鏈接

在很多NLP系統中，包括傳統計數和深度學習模型中，稀疏詞和未登錄詞的處理是一個很重要的問題，模型中用了兩個softmaxt層用於預測條件語言模型中的next word, 其的生成有兩種來源（1）原句子中的token(原句子指的是input sentence), (2)shortlist vocabulary(如果任務是機器翻譯，shortlist vocabulary 是目標語言中部分詞) sho

>>阅读原文<<