8種Python文本處理工具集

文本處理一般包括詞性標註,句法分析,關鍵詞提取,文本分類,情感分析等等,這是針對中文的,如果是對於英文來說,只需要基本的tokenize。本文爲大家提供了以下這些工具包。 1.Jieba 【結巴中文分詞】做最好的 Python 中文分詞組件 其功能包括支持三種分詞模式(精確模式、全模式、搜索引擎模式),支持繁體分詞,支持自定義詞典等。 代碼主頁:https://github.com/fxsjy/j
相關文章
相關標籤/搜索