[ACL2016]Pointing the Unknown Words

在很多NLP系統中,包括傳統計數和深度學習模型中,稀疏詞和未登錄詞的處理是一個很重要的問題,模型中用了兩個softmaxt層用於預測條件語言模型中的next word, 其的生成有兩種來源(1)原句子中的token(原句子指的是input sentence), (2)shortlist vocabulary(如果任務是機器翻譯,shortlist vocabulary 是目標語言中部分詞) sho
相關文章
相關標籤/搜索