elasticsearch之ik分詞器插件安裝

最近學習es,記錄下怎麼安裝ik分詞器,方便參考。git

ik分詞器安裝很簡單,github

進入https://github.com/medcl/elasticsearch-analysis-ik/releases

下載對應es版本的zip包,該包是無需用mvn打包版本,解壓zip,在es的plugins目錄下建立名爲ik的文件夾,將解壓後的文件放到ik文件夾下面瀏覽器

重啓es便可;elasticsearch

測試:學習

建立名爲「index」的索引,瀏覽器輸入以下:測試

http://localhost:9200/index/_analyze?analyzer=ik&pretty=true&text=我是中國人

結果只要不是單個分詞結果就代表成功了!spa

切記:路徑絕對不能有空格,不然會報錯IKanalyze.cfg.xml找不到,或者 AccessControlException  read 讀取問題!xml

es 6.5.3版本es的安裝(應該適用6.x版本)blog

    進入es的bin目錄下運行命令:索引

elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.5.3/elasticsearch-analysis-ik-6.5.3.zip

     出現以下窗口說明安裝成功(也可查看plugins目錄下是否有ik的文件夾):

                         

若是已安裝則會提示卸載,運行以下命令便可:

elasticsearch-plugin remove analysis-ik;

 

2019/1/28追加記錄:

es內置分詞器
standard分詞器:(默認的)它將詞彙單元轉換成小寫形式,並去掉停用詞(a、an、the等沒有實際意義的詞)和標點符號,支持中文采用的方法爲單字切分(例如,‘你好’切分爲‘你’和‘好’)。
simple分詞器:首先經過非字母字符來分割文本信息,而後將詞彙單元同一爲小寫形式。該分析器會去掉數字類型的字符。
Whitespace分詞器:僅僅是去除空格,對字符沒有lowcase(大小寫轉換)化,不支持中文;而且不對生成的詞彙單元進行其餘的標準化處理。
language分詞器:特定語言的分詞器,不支持中文;

查看es分詞結果

相關文章
相關標籤/搜索