Solr5.4.0+Tomcat+mmseg4j

solr5.4    mmseg4j-solr-2.3.0    mmseg4j-core-1.10.0html

Solr的配置:java

一、去http://www.apache.org/dyn/closer.lua/lucene/solr/5.4.0下載 solr-5.4.0.tgz,並解壓;web

二、將/solr/solr-5.4.0/server/solr-webapp/下的webapp文件夾複製到/usr/local/tomcat/tomcat-8.0.30/webapps/目錄下,更名爲solr;apache

三、將/usr/local/solr/solr-5.4.0/server/lib/ext/目錄下的全部jar包複製到/usr/local/tomcat/tomcat-8.0.30/webapps/solr/WEB-INF/lib/目錄下;tomcat

四、將/usr/local/solr/solr-5.4.0/server/solr目錄複製到/usr/local/tomcat/並重命名爲solr_home;(存放檢索數據的)app

五、修改/usr/local/tomcat/tomcat-8.0.30/webapps/solr/WEB-INF/web.xml,找到<env-entry>節點,該結點處於被註釋狀態,去掉註釋,按以下代碼修改:webapp

<env-entry>
    <env-entry-name>solr/home</env-entry-name>
    <env-entry-value>/usr/local/tomcat/solr_home</env-entry-value>
    <env-entry-type>java.lang.String</env-entry-type>
</env-entry>

六、將/usr/local/solr/solr-5.4.0/server/resources/目錄下的log4j.properties放到/usr/local/tomcat/tomcat-8.0.30/webapps/solr/WEB-INF/classes/目錄下,若是classes文件夾不存在就手動新建一個;lua

七、還須要添加solr-dataimporthandler-5.3.0.jar和solr-dataimporthandler-extras-5.3.0.jar這2個jar包到目錄/usr/local/tomcat/tomcat-8.0.30/webapps/solr/WEB-INF/lib/下,不然會報錯,這2個包默認不在webapp裏,在下載包的dist目錄下;spa

八、從新啓動Tomcat服務;.net

九、訪問:localhsot:8080/solr/index.html 能夠看到Solr的控制檯;

十、添加mysolr

在/usr/local/tomcat/solr_home/目錄下建立mysolr(可自定義),在mysolr目錄下建立data目錄,
並將 /usr/local/tomcat/solr_home/configsets/basic_configs/目錄下的conf目錄複製到mysolr下;

在mysolr目錄中新建core.properties內容爲name=mysolr   (solr中的mysolr應用)

經過控制檯添加mysolr,並從新啓動Tomcat,就會看到新建的mysolr.

2、配置中文分詞器(mmseg4j)

mmseg4j-solr-2.3.0

1.將兩個jar包考入tomcat中solr項目裏的lib文件內

 
2.配置solr_home中mysolr\conf\schema.xml     
    添加:       

<fieldtype name="textComplex" class="solr.TextField" positionIncrementGap="100"> 
      <analyzer> 
         <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic"/>
      </analyzer> 
 </fieldtype> 
 
<fieldtype name="textMaxWord" class="solr.TextField" positionIncrementGap="100"> 
     <analyzer> 
         tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" /> 
     </analyzer> 
</fieldtype> 
 
<fieldtype name="textSimple" class="solr.TextField" positionIncrementGap="100"> 
     <analyzer> 
         <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple"                                 dicPath="n:/custom/path/to/my_dic" /> 
     </analyzer> 
</fieldtype>

修改solr_home中mysolr域的schema.xml,新增要用到mmseg4j分詞索引的字段 content_test  分詞器選擇定義好的textMaxWord

<field name="content_test" type="textMaxWord" indexed="true" stored="true" multiValued="true"/> 

重啓tomcat。 

已配好的tomcat連接:http://pan.baidu.com/s/1gf9HHoJ 密碼:sn6p

相關文章
相關標籤/搜索
本站公眾號
   歡迎關注本站公眾號,獲取更多信息