第一種方法:java
1.HanLP分詞器插件下載地址
https://github.com/pengcong90/elasticsearch-analysis-hanlp/releases
下載analysis-hanlp.zipgit
2.解壓到ElasticSearch下plugins目錄下github
3.配置
修改analysis-hanlp目錄下的hanlp.properties文件,修改root的屬性,值爲analysis-hanlp下的data 目錄的地址
修改analysis-hanlp目錄下的plugin-descriptor.properties文件,elasticsearch.version=你的es版本號(like:5.5.1)jvm
修改es config目錄下的jvm.options文件,最後一行添加
-Djava.security.policy=../plugins/analysis-hanlp/plugin-security.policyelasticsearch
4.HanLP有如下兩種分詞器
hanlp-index:儘量的切分多的結果
hanlp-smart:切分少的詞
---------------------
第二種方法:插件
安裝方式:code
方式一索引
a. 下載對應的release安裝包ip
b. 將相關內容解壓至ES_HOME/plugins/analysis-hanlpget
c. 將config目錄下的文件移動至ES_HOME/config/analysis-hanlp
d. 解壓出的data目錄爲詞典目錄
方式二
a. 使用elasticsearch插件腳本安裝command以下:
./bin/elasticsearch-plugin install https://github.com/KennFalcon/elasticsearch-analysis-hanlp/releases/download/v6.5.4/elasticsearch-analysis-hanlp-6.5.4.zip
release包中存放的爲HanLP源碼中默認的分詞數據,若要下載完整版數據包,請查看HanLP Release。
數據包目錄:ES_HOME/analysis-hanlp
注:因原版數據包自定義詞典部分文件名爲中文,這裏的hanlp.properties中已修改成英文,請對應修改文件名
注:上述說明中的ES_HOME爲本身的ES安裝路徑,須要絕對路徑
在本版本中,增長了詞典熱更新,修改步驟以下:
a. 在ES_HOME/analysis-hanlp/data/dictionary/custom目錄中新增自定義詞典
b. 修改hanlp.properties,修改CustomDictionaryPath,增長自定義詞典配置
c. 等待1分鐘後,詞典自動加載
注:每一個節點都須要作上述更改
hanlp: hanlp默認分詞
hanlp_standard: 標準分詞
hanlp_index: 索引分詞
hanlp_nlp: NLP分詞
hanlp_n_short: N-最短路分詞
hanlp_dijkstra: 最短路分詞
hanlp_crf: CRF分詞(在hanlp 1.6.6已開始廢棄)
hanlp_speed: 極速詞典分詞