Solr環境搭建及IK分詞的集成及solrJ的調用(二)

看上一篇請移步到這裏:http://my.oschina.net/zimingforever/blog/120732 Solr環境搭建及IK分詞的集成及solrJ的調用(一) web

這裏首先介紹如何作分詞,首先solr並無加入中文分詞在裏面,因此若是是中文搜索的項目咱們要加入分詞在裏面,經常使用的中文分詞有不少,網上大多數都是和庖丁分詞結合的,我這裏主要加入了IK analyzer,如下簡稱IK,使用IK是由於以前沒有使用solr的時候我一直在用Ik作搜索,感受用起來還蠻不錯,不過網上關於IK和solr的配置就少了一些。 tomcat

IK的介紹能夠看這裏:http://www.oschina.net/p/ikanalyzer app

首先把iK的jar放入工程裏,這裏爲了不找不到jar包,我把IKAnalyzer2012.jar這個包扔到了tomcat下的lib下,同時webapps\solr\WEB-INF\lib這裏我也扔了相同的jar包進去 webapp

接下來,打開schemal.xml文件(上一節咱們就提到過這個文件是用來配置分詞的) jsp

在types的標籤內加以下的配置: spa

<fieldType name="text" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
也能夠使用IKtokenizerFactory,我沒有使用這個方法,由於提示我找不到這個類。估計是jar包的問題
<fieldType name="text" class="solr.TextField">
  <analyzer type="index">
    <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory"
isMaxWordLength="false"/>
  </analyzer>
  <analyzer type="query">
    <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory"
isMaxWordLength="true"/>
  </analyzer>
</fieldType>

沒錯 solr加入中文分詞就是這麼簡單,怎麼能驗證一下呢?打開solr的admin界面即 /solr/admin/analysis.jsp?highlight=on .net

從微博上隨便取了段話,貼在index欄裏,query欄裏隨便輸入,同時打開高亮,顯示的結果以下: code

這說明中文分詞也已經配置好了。另外這裏field的name對應的是filedtype配置的值 xml

總結一下,本文在搭建好的solr工程下加入了IKanalyze的中文分詞,使得solr支持中文了,接下來咱們要簡單介紹一下如何調用solrJ的接口來增長索引和進行查詢。 blog

相關文章
相關標籤/搜索