論文閱讀 Training Neural Machine Translation To Apply Terminology Constraints

一.  該方法是在模型訓練層面解決術語注入的問題。 二. 訓練階段主要是改變數據的處理方式: 1. 原始數據層面(增加註釋,0無關,1源語術語,2目標語言術語) 2.bpe層面 將原始數據的註釋推廣到bpe切分後的token上,eg:如果Stellvertreter_2切分成了a、b,則a_2,b_2。 3.embedding層面 將註釋向量和詞向量進行拼接。 4. 術語覆蓋度問題 爲了保證沒有包
相關文章
相關標籤/搜索