1、下載Solr4.10.2
咱們以Windows版本爲例,solr-4.10.2.zip是目前最新版本,下載地址:
http://www.apache.org/dyn/closer.cgi/lucene/solr/4.10.2
2、 Solr安裝: java
一、解壓solr-4.10.2.zip web
二、將 solr-4.10.2/example/webapps/solr.war 拷貝到Tomcat的webapps目錄下(如D:\apache-tomcat-7.0.57\webapps),從新啓動Tomcat 並訪問http://localhost:8080/(目的是解壓solr.war),而後你會發現solr-4.10.2/example/webapps/下多了一個Solr的目錄。apache
三、在D:\apache-tomcat-7.0.57\webapps\solr建立solr_home目錄: centos
四、修改D:\apache-tomcat-7.0.57\webapps\solr\WEB-INF\web.xml 添加以下配置(apache-tomcat-7.0.56/webapps/solr/WEB-INF/web.xml) tomcat
配置solr home的地址: app
<env-entry> <env-entry-name>solr/home</env-entry-name> <env-entry-value> D:\apache-tomcat-7.0.57\webapps\solr\solr_home </env-entry-value> <env-entry-type>java.lang.String</env-entry-type> </env-entry>
五、複製solr-4.10.2的solr-4.10.2/example/solr/ 全部內容copy到solr_homewebapp
六、複製solr-4.10.2的solr-4.10.2/example/lib/ext目錄下全部文件google
到 apache-tomcat-7.0.56/webapps/solr/WEB-INF/libspa
複製solr-4.10.2的example/resources目錄下的log4j.properties文件到Tomcat的lib下;code
啓動Tomcat。
訪問:http://localhost:8080/solr 進入到管理界面
3、 集成ikanalyzer中文分詞器
一、在谷歌http://code.google.com/p/ik-analyzer/downloads/list下載IK Analyzer 2012FF_hf1解壓後獲得以下目錄結構:
二、將IKAnalyzer2012FF_u1.jar包copy到 apache-tomcat-7.0.56/webapps/solr/WEB-INF/lib 下。
在apache-tomcat-7.0.56/webapps/solr/WEB-INF/下建立classes目錄
將IKAnalyzer.cfg.xml、stopword.dic copy到 apache-tomcat-7.0.56/webapps/solr/WEB-INF/classes
三、修改apache-tomcat-7.0.56/webapps/solr/solr_home/collection1/conf/schema.xml
在第一個節點內添加以下配置:
<fieldType name="text_ik" class="solr.TextField"> <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/> <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/> </fieldType>
將對應須要用ik分詞的字段的type改成以上定義的name值 text_ik(大約120行處):
<field name="sku" type="text_en_splitting_tight" indexed="true" stored="true" omitNorms="true"/> <field name="name" type="text_ik" indexed="true" stored="true"/> <field name="manu" type="text_ik" indexed="true" stored="true" omitNorms="true"/>
配置完成,重啓tomcat並訪問http://localhost:8080/solr。 發現左邊能夠選擇分詞器
根據咱們配置的中文分詞器,選擇Manu:
分析一個熊孩子造的句子:小明吃完水果真後喝水
發現很是智能的構建出關鍵詞了。
centos下面的配置:
建立solr目錄
/usr/local/solr/tomcat
複製tomcat到指定目錄cp apache-tomcat-7.0.47 /usr/local/solr/tomcat -r
將解壓後的war複製到tomcat運行目錄下cp solr-4.10.3.war /usr/local/solr/tomcat/webapps/solr.war
啓動tomcat解壓war包 ./startup.sh
查看啓動狀況:tail -f logs/catalina.out
關閉tomcat:./shutdown.sh
刪除war包:rm -rf solr.war
複製lib包cp -f /root/solr-4.10.3/example/lib/ext/* /usr/local/solr/tomcat/webapps/solr/WEB-INF/lib
建立solrhome:cp -r /root/solr-4.10.3/example/solr /usr/local/solr/solrhome
進入/usr/local/solr/tomcat/webapps/solr/WEB-INF/
修改web.xml中,注意去掉註釋
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>/usr/local/solr/solrhome</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
而後啓動,而後訪問/solr/便可
配置分詞
cp IKAnalyzer2012FF_u1.jar /usr/local/solr/tomcat/webapps/solr/WEB-INF/lib
在/usr/local/solr/tomcat/webapps/solr/WEB-INF/
建立mkdir classes
複製配置文件cp ext_stopword.dic IKAnalyzer.cfg.xml mydict.dic /usr/local/solr/tomcat/webapps/solr/WEB-INF/classes
複製schema.xml到/usr/local/solr/solrhome/collection1/confcp -rf schema.xml /usr/local/solr/solrhome/collection1/conf複製solrconfig.xml到/usr/local/solr/solrhome/collection1/confcp -rf solrconfig.xml /usr/local/solr/solrhome/collection1/conf