solr5.4 mmseg4j-solr-2.3.0 mmseg4j-core-1.10.0html
Solr的配置:java
一、去http://www.apache.org/dyn/closer.lua/lucene/solr/5.4.0下載 solr-5.4.0.tgz,並解壓;web
二、將/solr/solr-5.4.0/server/solr-webapp/下的webapp文件夾複製到/usr/local/tomcat/tomcat-8.0.30/webapps/目錄下,更名爲solr;apache
三、將/usr/local/solr/solr-5.4.0/server/lib/ext/目錄下的全部jar包複製到/usr/local/tomcat/tomcat-8.0.30/webapps/solr/WEB-INF/lib/目錄下;tomcat
四、將/usr/local/solr/solr-5.4.0/server/solr目錄複製到/usr/local/tomcat/並重命名爲solr_home;(存放檢索數據的)app
五、修改/usr/local/tomcat/tomcat-8.0.30/webapps/solr/WEB-INF/web.xml,找到<env-entry>節點,該結點處於被註釋狀態,去掉註釋,按以下代碼修改:webapp
<env-entry> <env-entry-name>solr/home</env-entry-name> <env-entry-value>/usr/local/tomcat/solr_home</env-entry-value> <env-entry-type>java.lang.String</env-entry-type> </env-entry>
六、將/usr/local/solr/solr-5.4.0/server/resources/目錄下的log4j.properties放到/usr/local/tomcat/tomcat-8.0.30/webapps/solr/WEB-INF/classes/目錄下,若是classes文件夾不存在就手動新建一個;lua
七、還須要添加solr-dataimporthandler-5.3.0.jar和solr-dataimporthandler-extras-5.3.0.jar這2個jar包到目錄/usr/local/tomcat/tomcat-8.0.30/webapps/solr/WEB-INF/lib/下,不然會報錯,這2個包默認不在webapp裏,在下載包的dist目錄下;spa
八、從新啓動Tomcat服務;.net
九、訪問:localhsot:8080/solr/index.html 能夠看到Solr的控制檯;
十、添加mysolr
在/usr/local/tomcat/solr_home/目錄下建立mysolr(可自定義),在mysolr目錄下建立data目錄,
並將 /usr/local/tomcat/solr_home/configsets/basic_configs/目錄下的conf目錄複製到mysolr下;
在mysolr目錄中新建core.properties內容爲name=mysolr (solr中的mysolr應用)
經過控制檯添加mysolr,並從新啓動Tomcat,就會看到新建的mysolr.
2、配置中文分詞器(mmseg4j)
mmseg4j-solr-2.3.0
1.將兩個jar包考入tomcat中solr項目裏的lib文件內
2.配置solr_home中mysolr\conf\schema.xml
添加:
<fieldtype name="textComplex" class="solr.TextField" positionIncrementGap="100"> <analyzer> <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic"/> </analyzer> </fieldtype> <fieldtype name="textMaxWord" class="solr.TextField" positionIncrementGap="100"> <analyzer> tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" /> </analyzer> </fieldtype> <fieldtype name="textSimple" class="solr.TextField" positionIncrementGap="100"> <analyzer> <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="n:/custom/path/to/my_dic" /> </analyzer> </fieldtype>
修改solr_home中mysolr域的schema.xml,新增要用到mmseg4j分詞索引的字段 content_test 分詞器選擇定義好的textMaxWord
<field name="content_test" type="textMaxWord" indexed="true" stored="true" multiValued="true"/>
重啓tomcat。
已配好的tomcat連接:http://pan.baidu.com/s/1gf9HHoJ 密碼:sn6p