python調用jieba(結巴)分詞 加入自定義詞典和去停用詞功能

轉自:http://www.cnblogs.com/zhangtianyuan/p/6875080.htmlhtml 把語料從數據庫提取出來之後就要進行分詞啦,我是在linux環境下作的,先把jieba安裝好,而後找到內容是build jieba PKG-INFO setup.py test的那個文件夾(我這邊是jieba-0.38),把本身的自定義詞典(選用,目的是爲了分出原始詞庫中沒有的詞以及
相關文章
相關標籤/搜索