天然語言處理工具hanlp定製用戶詞條

做者:baiziyu3d

關於hanlp的文章已經分享過不少,彷佛好像大部分以理論性的居多。最近有在整理一些hanlp應用項目中的文章,待整理完成後會陸續分享出來。本篇分享的依然是由baiziyu 分享的一篇文章,感興趣的能夠在知乎上關注下他的專欄,寫的仍是挺好的!blog

如下爲文章的主要內容:io

自定義詞表的修改import

自定義詞表在「pyhanlp\static\data\dictionary\custom」路徑下的「CustomDictionary.txt」文件中,HanLP.segment支持自定義此詞表。若是須要修改自定義詞表,則直接編輯文件「CustomDictionary.txt」,以後刪除路徑下的「CustomDictionary.txt.bin」,運行分詞代碼後便可自動生效。im

驗證修改是否生效專欄

驗證代碼項目

from pyhanlp import *static

term_list = HanLP.segment(text)dict

 

原文連接:https://zhuanlan.zhihu.com/p/64267104img

相關文章
相關標籤/搜索