序列標註 | (7) 融入字典知識的神經中文分詞

文章目錄 融入字典知識的神經中文分詞 一、背景 二、 主要方法 融入字典知識的神經中文分詞 一、背景 當前基於深度神經網絡的中文分詞方法直接從標註樣本/句子中學習相關信息,缺乏處理稀有詞以及和訓練集來自不同領域的數據的能力。OOV(Out-of-vocabulary)問題是監督學習最主要的問題。 例如,中文句子「人工智能最近很火」,它的正確分割是「人工智能/最近/很火」。然而,如果「人工智能」沒有
相關文章
相關標籤/搜索