【轉載】Solr4+IKAnalyzer的安裝配置

時間 2019-12-09

標籤轉載 solr4+ikanalyzer solr ikanalyzer 安裝配置简体版

原文原文鏈接

轉載：http://www.cnblogs.com/madyina/p/4131751.htmlhtml

1、下載Solr4.10.2
咱們以Windows版本爲例，solr-4.10.2.zip是目前最新版本，下載地址：
http://www.apache.org/dyn/closer.cgi/lucene/solr/4.10.2
2、 Solr安裝：java

一、解壓solr-4.10.2.zipweb

二、將 solr-4.10.2/example/webapps/solr.war 拷貝到Tomcat的webapps目錄下（如D:\apache-tomcat-7.0.57\webapps），從新啓動Tomcat 並訪問http://localhost:8080/(目的是解壓solr.war)，而後你會發現solr-4.10.2/example/webapps/下多了一個Solr的目錄。apache

三、在D:\apache-tomcat-7.0.57\webapps\solr建立solr_home目錄：tomcat

四、修改D:\apache-tomcat-7.0.57\webapps\solr\WEB-INF\web.xml 添加以下配置（apache-tomcat-7.0.56/webapps/solr/WEB-INF/web.xml）app

配置solr home的地址：webapp

   <env-entry>
   <env-entry-name>solr/home</env-entry-name>
<env-entry-value>
    D:\apache-tomcat-7.0.57\webapps\solr\solr_home
</env-entry-value>
   <env-entry-type>java.lang.String</env-entry-type>
</env-entry>

五、複製solr-4.10.2的solr-4.10.2/example/solr/ 全部內容copy到solr_homegoogle

六、複製solr-4.10.2的solr-4.10.2/example/lib/ext目錄下全部文件spa

到 apache-tomcat-7.0.56/webapps/solr/WEB-INF/libcode

複製solr-4.10.2的example/resources目錄下的log4j.properties文件到Tomcat的lib下；

啓動Tomcat。

訪問：http://localhost:8080/solr 進入到管理界面

3、集成ikanalyzer中文分詞器

一、在谷歌http://code.google.com/p/ik-analyzer/downloads/list下載IK Analyzer 2012FF_hf1解壓後獲得以下目錄結構：

二、將IKAnalyzer2012FF_u1.jar包copy到 apache-tomcat-7.0.56/webapps/solr/WEB-INF/lib 下。

在apache-tomcat-7.0.56/webapps/solr/WEB-INF/下建立classes目錄

將IKAnalyzer.cfg.xml、stopword.dic copy到 apache-tomcat-7.0.56/webapps/solr/WEB-INF/classes

三、修改apache-tomcat-7.0.56/webapps/solr/solr_home/collection1/conf/schema.xml

在第一個節點內添加以下配置：

<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
 </fieldType>

將對應須要用ik分詞的字段的type改成以上定義的name值 text_ik（大約120行處）：

   <field name="sku" type="text_en_splitting_tight" indexed="true" stored="true" omitNorms="true"/>
   <field name="name" type="text_ik" indexed="true" stored="true"/>
   <field name="manu" type="text_ik" indexed="true" stored="true" omitNorms="true"/>

配置完成，重啓tomcat並訪問http://localhost:8080/solr。發現左邊能夠選擇分詞器

根據咱們配置的中文分詞器，選擇Manu：

分析一個熊孩子造的句子：小明吃完水果真後喝水

發現很是智能的構建出關鍵詞了。