CDH添加solr中文分詞

參考別人的文章:http://www.52itstyle.com/thread-2476-1-1.html
html

cdh最難找的就是solr\WEB-INF\lib的位置,因爲cdh不是我安裝的,也沒有配置    SOLR_HOME,因此,我找了好久時間。能夠贏find命令找。web

solr自己對中文分詞的處理不是太好,因此中文應用不少時候都須要額外加一箇中文分詞器對中文進行分詞處理,ik-analyzer就是其中一個不錯的中文分詞器。
1、版本信息
solr版本:4.10.0
須要ik-analyzer版本:IK Analyzer 2012FF_hf1

2、配置步驟
下載壓縮解壓
咱們把IKAnalyzer2012FF_u1.jar拷貝到solr服務的solr\WEB-INF\lib下面。注意:若是是cdh這個路徑有變更,個人爲:tomcat

/opt/cloudera/parcels/CDH-5.4.4-1.cdh5.4.4.pp0.4/lib/solr/webapps/solr/WEB-INF/lib
app

在高版本的CDH中,位置爲:/usr/lib/solr/webapps/solr/WEB-INF/libwebapp

若是不知道jar位置在哪裏 ,能夠這樣搜搜索: find   /   -name  admin.html
測試

注意:不要把jar上傳到這裏:/var/lib/solr/tomcat-deployment/webapps/solr/WEB-INF/libspa

這是tomcat部署的時候的位置,重啓後從新從上面兩個路徑的jar拷貝到/var/lib/solr/tomcat-deployment/webapps/solr/WEB-INF/lib這裏,若是你上傳到這裏,重啓solr,jar會消失xml


咱們把IKAnalyzer.cfg.xml、stopword.dic拷貝到須要使用分詞器的core的conf下面,和core的schema.xml文件一個目錄。
修改core的schema.xml:
htm

  1. <fieldType name="text_ik" class="solr.TextField">   
    部署

  2.         <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>  

  3.         <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>  

  4.     </fieldType>



配置測試字段:

  1. <field name="quesContent" type="text_ik" />


三:測試配置

相關文章
相關標籤/搜索