如何在hanlp詞典中手動添加未登陸詞

咱們在使用hanlp詞典進行分詞的時候,不免會出現分詞不許確的狀況,緣由是因爲內置詞典中並無收錄當前的這個詞,也就是咱們所說的未登陸詞,只要把這個詞加入到內置詞典中就能夠解決相似問題,如何操做,下面咱們就看一下具體的步驟code

 

1找到hanlp內置詞典目錄blog

位於D:\hnlp\hanlp_code\hanlp\data\dictionary\custom也就是Hanlp安裝包中的data\dictionary\custom下目錄io

2將未登陸詞以詞名,詞性,詞頻的格式添加到文件中(句首或者句尾均可以)登錄

3將字典的同名bin文件刪除掉程序

執行文件時讀取的是bin文件,必須刪掉後等下次執行時從新生成,新字典才發揮做用im

 

4使用新字典從新執行文件dict

執行時會遇到沒有相關bin文件的提示,不過放心,程序會自動生成一個新的bin文件,騷等片刻,就行了。img

驗證結果是否正確di

相關文章
相關標籤/搜索