Solr環境搭建及IK分詞的集成及solrJ的調用（二）

時間 2019-11-11

原文原文鏈接

看上一篇請移步到這裏：http://my.oschina.net/zimingforever/blog/120732 Solr環境搭建及IK分詞的集成及solrJ的調用（一） web

這裏首先介紹如何作分詞，首先solr並無加入中文分詞在裏面，因此若是是中文搜索的項目咱們要加入分詞在裏面，經常使用的中文分詞有不少，網上大多數都是和庖丁分詞結合的，我這裏主要加入了IK analyzer，如下簡稱IK，使用IK是由於以前沒有使用solr的時候我一直在用Ik作搜索，感受用起來還蠻不錯，不過網上關於IK和solr的配置就少了一些。 tomcat

IK的介紹能夠看這裏：http://www.oschina.net/p/ikanalyzer app

首先把iK的jar放入工程裏，這裏爲了不找不到jar包，我把IKAnalyzer2012.jar這個包扔到了tomcat下的lib下，同時webapps\solr\WEB-INF\lib這裏我也扔了相同的jar包進去 webapp

接下來，打開schemal.xml文件（上一節咱們就提到過這個文件是用來配置分詞的） jsp

在types的標籤內加以下的配置： spa

<fieldType name="text" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>

也能夠使用IKtokenizerFactory，我沒有使用這個方法，由於提示我找不到這個類。估計是jar包的問題

<fieldType name="text" class="solr.TextField">
  <analyzer type="index">
    <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory"
isMaxWordLength="false"/>
  </analyzer>
  <analyzer type="query">
    <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory"
isMaxWordLength="true"/>
  </analyzer>
</fieldType>

沒錯 solr加入中文分詞就是這麼簡單,怎麼能驗證一下呢？打開solr的admin界面即 /solr/admin/analysis.jsp?highlight=on .net

從微博上隨便取了段話，貼在index欄裏，query欄裏隨便輸入，同時打開高亮，顯示的結果以下： code