ik中文分詞插件官網 git
https://github.com/medcl/elasticsearch-analysis-ik github
下載和您ES匹配的版本,如今已經支持最新的2.2.0版本 json
源碼壓縮文件解壓到任意文件夾 瀏覽器
一、首先將源代碼用maven打包,這個打包不用必須在服務器上, 服務器
安裝配置好maven後,進入源碼所在文件夾執行以下命令 curl
mvn clean package elasticsearch
打包命令會下載不少依賴的包,會比較慢 maven
二、命令執行成功後在源碼路徑下生成以下目錄, 編碼
elasticsearch-analysis-ik-master\target\releases
找到這個文件 elasticsearch-analysis-ik-{version}.zip url
三、將第二部的zip文件解壓縮到elasticsearch 安裝目錄的以下目錄中,沒有ik目錄則手動創建
elasticsearch-2.2.0/plugins/ik
三、啓動elasticsearch便可
./bin/elasticsearch
四、驗證
瀏覽器輸入相似以下地址,ip端口,yang是索引
http://192.168.0.128:9200/yang/_analyze?analyzer=ik&pretty=true&text="我是中國人"
可以顯示以下信息則說明安裝正確
{ tokens: [ { token: "我", start_offset: 0, end_offset: 1, type: "CN_CHAR", position: 0 }, { token: "中國人", start_offset: 2, end_offset: 5, type: "CN_WORD", position: 1 }, { token: "中國", start_offset: 2, end_offset: 4, type: "CN_WORD", position: 2 }, { token: "國人", start_offset: 3, end_offset: 5, type: "CN_WORD", position: 3 } ] }
五、插入數據,此處用curl方式插入數據須要注意中文編碼問題,此處我用fiddler插入
連續插入多條相同數據,嘗試查找執行以下命令
六、查找,關鍵詞北京
七、結果json,關鍵詞高亮
{ "took": 196, "timed_out": false, "_shards": { "total": 5, "successful": 5, "failed": 0 }, "hits": { "total": 3, "max_score": 2, "hits": [ { "_index": "index", "_type": "fulltext", "_id": "4", "_score": 2, "_source": { "content": "中華人民共和國,北京天安門" }, "highlight": { "content": [ "中華人民共和國,<tag1>北京</tag1>天安門" ] } }, { "_index": "index", "_type": "fulltext", "_id": "5", "_score": 0.61370564, "_source": { "content": "中華人民共和國,北京天安門" }, "highlight": { "content": [ "中華人民共和國,<tag1>北京</tag1>天安門" ] } }, { "_index": "index", "_type": "fulltext", "_id": "3", "_score": 0.61370564, "_source": { "content": "中華人民共和國,北京天安門" }, "highlight": { "content": [ "中華人民共和國,<tag1>北京</tag1>天安門" ] } } ] } }