序列標註 | (7) 融入字典知識的神經中文分詞

時間 2021-01-13

標籤序列標註简体版

原文原文鏈接

文章目錄融入字典知識的神經中文分詞一、背景二、主要方法融入字典知識的神經中文分詞一、背景當前基於深度神經網絡的中文分詞方法直接從標註樣本/句子中學習相關信息，缺乏處理稀有詞以及和訓練集來自不同領域的數據的能力。OOV(Out-of-vocabulary)問題是監督學習最主要的問題。例如，中文句子「人工智能最近很火」，它的正確分割是「人工智能/最近/很火」。然而，如果「人工智能」沒有

>>阅读原文<<

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。