看上一篇請移步到這裏:http://my.oschina.net/zimingforever/blog/120732 Solr環境搭建及IK分詞的集成及solrJ的調用(一) web
這裏首先介紹如何作分詞,首先solr並無加入中文分詞在裏面,因此若是是中文搜索的項目咱們要加入分詞在裏面,經常使用的中文分詞有不少,網上大多數都是和庖丁分詞結合的,我這裏主要加入了IK analyzer,如下簡稱IK,使用IK是由於以前沒有使用solr的時候我一直在用Ik作搜索,感受用起來還蠻不錯,不過網上關於IK和solr的配置就少了一些。 tomcat
IK的介紹能夠看這裏:http://www.oschina.net/p/ikanalyzer app
首先把iK的jar放入工程裏,這裏爲了不找不到jar包,我把IKAnalyzer2012.jar這個包扔到了tomcat下的lib下,同時webapps\solr\WEB-INF\lib這裏我也扔了相同的jar包進去 webapp
接下來,打開schemal.xml文件(上一節咱們就提到過這個文件是用來配置分詞的) jsp
在types的標籤內加以下的配置: spa
<fieldType name="text" class="solr.TextField"> <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/> </fieldType>也能夠使用IKtokenizerFactory,我沒有使用這個方法,由於提示我找不到這個類。估計是jar包的問題
<fieldType name="text" class="solr.TextField"> <analyzer type="index"> <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="false"/> </analyzer> <analyzer type="query"> <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="true"/> </analyzer> </fieldType>
沒錯 solr加入中文分詞就是這麼簡單,怎麼能驗證一下呢?打開solr的admin界面即 /solr/admin/analysis.jsp?highlight=on .net
從微博上隨便取了段話,貼在index欄裏,query欄裏隨便輸入,同時打開高亮,顯示的結果以下: code
這說明中文分詞也已經配置好了。另外這裏field的name對應的是filedtype配置的值 xml
總結一下,本文在搭建好的solr工程下加入了IKanalyze的中文分詞,使得solr支持中文了,接下來咱們要簡單介紹一下如何調用solrJ的接口來增長索引和進行查詢。 blog