ElasticSearch5中文分詞(IK)

ElasticSearch安裝html

官網:https://www.elastic.cojava

1.ElasticSearch安裝linux

1.1.下載安裝公共密鑰git

rpm --import https://artifacts.elastic.co/GPG-KEY-elasticsearch

1.2.在 /etc/yum.repos.d/ 目錄下創建 elasticsearch.repo 文件github

vim /etc/yum.repos.d/elasticsearch.repo

在文件中寫入:apache

複製代碼

[elasticsearch-5.x]
name=Elasticsearch repository for 5.x packages
baseurl=https://artifacts.elastic.co/packages/5.x/yum
gpgcheck=1
gpgkey=https://artifacts.elastic.co/GPG-KEY-elasticsearch
enabled=1
autorefresh=1
type=rpm-md

複製代碼

保存退出vim

1.3.使用yum安裝 oracle

yum install elasticsearch

1.4.添加系統服務app

chkconfig --add elasticsearch
service elasticsearch start  //啓動
service elasticsearch stop  //關閉
service elasticsearch status//查看狀態

啓動後訪問 localhost:9200  獲得elasticsearch

複製代碼

{
  "name" : "Cp8oag6",
  "cluster_name" : "elasticsearch",
  "cluster_uuid" : "AT69_T_DTp-1qgIJlatQqA",
  "version" : {
    "number" : "5.0.1",
    "build_hash" : "f27399d",
    "build_date" : "2016-11-21T09:51:41.449Z",
    "build_snapshot" : false,
    "lucene_version" : "6.2.1"
  },
  "tagline" : "You Know, for Search"
}

複製代碼

2 安裝ik中文分詞插件

2.1 ik git地址 https://github.com/medcl/elasticsearch-analysis-ik

克隆ik

git clone https://github.com/medcl/elasticsearch-analysis-ik
git checkout tags/v5.0.1 切換版本 版本號能夠修改

2.2 經過java工具打包  

mvn package

若是提示 mvn 不存在看下面

打包後  在  target/releases/  這個路徑下面 有一個 elasticsearch-analysis-ik-{version}.zip 這個文件  將這個壓縮文件複製到  ElasticSearch 下plugins/ik 目錄下 而後解壓

個人 plugins 目錄是  /usr/share/elasticsearch/plugins  這個路

創建 ik 目錄

mkdir /usr/share/elasticsearch/plugins/ik

複製文件 

cp  ./target/releases/elasticsearch-analysis-ik-{version}.zip  /usr/share/elasticsearch/plugins/ik

解壓

cd /usr/share/elasticsearch/plugins/ik
unzip elasticsearch-analysis-ik-{version}.zip

2.3 將ik 插件 安裝到 ElasticSearch中

建立索引m8:

http put 'http://localhost:9200/m8'

若是提示http put不存在看下面

爲索引(m8)及類型(logs)下的字段(message)設置分詞器(分詞器可選ik_smart或ik_max_word):

複製代碼

http put localhost:9200/m8 -d '{
    "settings" : {
        "analysis" : {
            "analyzer" : {
                "ik" : {
                    "tokenizer" : "ik_smart"
                }
            }
        }
    },
    "mappings" : {
        "logs" : {
            "dynamic" : true,
            "properties" : {
                "message" : {
                    "type" : "string",
                    "analyzer" : "ik_smart"
                }
            }
        }
    }
}'

複製代碼

案例

http://192.168.199.115:9200/m8/_analyze?analyzer=ik_max_word&text=南京市長江大橋

結果

參數說明:

ik_max_word: 會將文本作最細粒度的拆分,好比會將「中華人民共和國國歌」拆分爲「中華人民共和國,中華人民,中華,華人,人民共和國,人民,人,民,共和國,共和,和,國國,國歌」,會窮盡各類可能的組合;

ik_smart: 會作最粗粒度的拆分,好比會將「中華人民共和國國歌」拆分爲「中華人民共和國,國歌」。

 

mvn 不存在看下面 解決:

1.安裝java的jdk

官網下載地址http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html  

 下載rpm包:

wget  http://download.oracle.com/otn-pub/java/jdk/8u111-b14/jdk-8u111-linux-x64.rpm?AuthParam=1479708556_19e817839b0ee72d40569ae8a23689d0

安裝:

rpm  -ivh jdk-8u111-linux-x64.rpm

設置環境變量:

vim  /etc/profile

在最後添加

JAVA_HOME=/usr/java/jdk1.8.0_111
JRE_HOME=/usr/java/jdk1.8.0_111/jre
PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin
CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib
export JAVA_HOME JRE_HOME PATH CLASSPATH

當即生效:

source /etc/profile

驗證:

java -version

 

 

安裝 maven 就是 mvn 命令 他須要java 才能運行

wget http://repos.fedorapeople.org/repos/dchen/apache-maven/epel-apache-maven.repo -O /etc/yum.repos.d/epel-apache-maven.repo
yum -y install apache-maven

http put不存在問題:

yum install httpie
相關文章
相關標籤/搜索