細說中文分詞

完整的中文自然語言處理過程一般包括以下五種中文處理核心技術:分詞、詞性標註、命名實體識別、依存句法分析、語義分析。其中,分詞是中文自然語言處理的基礎,搜素引擎、文本挖掘、機器翻譯、關鍵詞提取、自動摘要生成等等技術都會用到中文分詞,包括最近在學習的聊天機器人、文本相似性等。可以說分詞是自然語言大廈的地基,下面就讓我們從它開始談起。   什麼是中文分詞 中文分詞就是將中文語句中的詞彙按照使用時的含義切
相關文章
相關標籤/搜索