Elasticsearch集成HanLP分詞器-我的學習

一、經過git下載分詞器代碼。git

鏈接以下:https://gitee.com/hualongdata/hanlp-extapache

hanlp官網以下:http://hanlp.linrunsoft.com/安全

 

二、下載gradle,若是本機有,就能夠略過此步驟。經過gradle官方網站下載,解壓,配置環境便可。jvm

官方安裝配置說明:https://gradle.org/install/elasticsearch

三、按本地elasticsearch進行打包。學習

注意:經過git下載的源代碼,除非與git配置的版本相同,不然可能會致使你elasticearch沒法加載分詞器。測試

修改git下載的源代碼包中的elasticsearch版本。並經過gradle進行打包。會自動下載同步elasticsearch對應版本的jar包。gradle

 

 

 

 

 

 

 

 

四、按本地環境配置詞類位置網站

 

五、配置打包的插件所對應支持的elasticesarch的版本。(修改成:5.6.5,es安裝的學習環境爲5.6.5)ui

 

六、完成上述配置把。gradle自動下載對應版本的包。能夠經過以下方式進行版本查看。

 

七、確認對應版本的包存在後,在工程所在目錄下執行以下命令進行打包:

gradle -p es-plugin jar buildPluginZip

以下操做:在項目工程目錄下,運行命令。

八、打包完成後,會出現對應的安裝包。

九、在elasticsearch安裝目錄下執行插件安裝命令。

./bin/elasticsearch-plugin install file:///Users/jiangyu/code/git/hanlp-ext/es-plugin/build/distributions/elasticsearch-hanlp-5.6.5.zip

能夠看到上面安裝完成的提示。有個過程要選擇y。

注:若是上向的命令出現以下報錯。錯誤提示以下:

上述錯誤提示,說明有兩個相同的jar包存在。因此有提示,能夠先在build.gradle配置中,找到打包的過程,增長一條path.contains("org.apache.logging.log4j")配置,這樣打包時,這個jar包不會在被找到插件中。配置修改完成後。重新執行第7步『gradle -p es-plugin jar buildPluginZip』,進從新打包。再從新安裝插件便可。

 

(注:測試時,這個包不能去掉。會致使測試插件時,缺乏log4j包)

十、給插件增長訪問權限

在系統的elasticsearch的安裝目錄下,找到config目錄,經過vi jvm.options打開文件進行編輯。增長以下內容:用來指定安全配置文件。

十一、修改elasticsearch配置,在系統的elasticsearch的安裝目錄下,找到bin目錄,經過vi elasticearch.in.sh打開文件進行編輯。增長以下內容:用來指定安全配置文件。

在文件中增長指定的lib包。咱們將插件要用到的Lib包路徑引入到系統環境變量中。

1四、安裝完成後能夠使用以下命令進行驗證。 analyzer,指定分詞器爲:"hanlp"

GET /_analyze

{

"analyzer" : "hanlp",

"text": ["記錄就是用來打破的。你準備好向新的記錄發起衝擊了嗎?"]

}

若是不指定分詞器的話。因此返回結果,type沒有說明詞性,都是按單字返回結果。

GET /_analyze

{

"text": ["記錄就是用來打破的。你準備好向新的記錄發起衝擊了嗎?"]

}

參考鏈接以下:https://gitee.com/hualongdata/hanlp-ext/tree/master/es-plugin

其它操做:

一、若是想移除或刪除插件,能夠執行以下命令

 

來源:https://my.oschina.net/u/3519280/blog/1621783

相關文章
相關標籤/搜索