中文分詞與關鍵詞提取概述

本文基於題庫查重需求實現過程及《NLP自然語言處理原理與實踐》學習過程總結得出。定有不足之處,懇請指出。 介紹 中文分詞是自然語言處理(NLP)在中文環境下,首要解決的問題。主要難點爲中文不同於英文,存在明確的分隔符(如空格)用於切分詞語,且不同的切分方式,不一定存在語病,舉個例子: 結婚的/和尚/未結婚的人。 結婚的和尚未結婚的人 基本概念 評價指標 一般,中文分詞從Precision、Reca
相關文章
相關標籤/搜索