目錄python
jieba是優秀的中文分詞第三方庫函數
pip install jieba
(cmd命令行)ui
Jieba分詞依靠中文詞庫搜索引擎
精確模式、全模式、搜索引擎模式命令行
函數 | 描述 |
---|---|
jieba.lcut(s) | 精確模式,返回一個列表類型的分詞結果 |
jieba.lcut(s, cut_all=True) | 全模式,返回一個列表類型的分詞結果,存在冗餘 |
jieba.lcut_for_search(s) | 搜索引擎模式,返回一個列表類型的分詞結果,存在冗餘 |
jieba.add_word(w) | 向分詞詞典增長新詞w |
import jieba jieba.lcut("中國是一個偉大的國家")
Building prefix dict from the default dictionary ... Loading model from cache /var/folders/mh/krrg51957cqgl0rhgnwyylvc0000gn/T/jieba.cache Loading model cost 0.979 seconds. Prefix dict has been built succesfully. ['中國', '是', '一個', '偉大', '的', '國家']
jieba.lcut("中國是一個偉大的國家",cut_all=True)
['中國', '國是', '一個', '偉大', '的', '國家']
jieba.lcut("中華人民共和國是偉大的")
['中華人民共和國', '是', '偉大', '的']
jieba.lcut("中華人民共和國是偉大的",cut_all=True)
['中華', '中華人民', '中華人民共和國', '華人', '人民', '人民共和國', '共和', '共和國', '國是', '偉大', '的']
jieba.lcut_for_search("中華人民共和國是偉大的")
['中華', '華人', '人民', '共和', '共和國', '中華人民共和國', '是', '偉大', '的']
jieba.add_word("蟒蛇語言")
jieba.lcut(s)
code