1、版本信息測試
solr版本:4.6.0google
須要ik-analyzer版本:IK Analyzer 2012FF_hf1spa
ik-analyzer下載地址:http://code.google.com/p/ik-analyzer/downloads/listcode
2、配置步驟xml
下載壓縮解壓後獲得以下目錄結構的文件夾:blog
咱們把IKAnalyzer2012FF_u1.jar拷貝到solr服務的solr\WEB-INF\lib下面。token
咱們把IKAnalyzer.cfg.xml、stopword.dic拷貝到須要使用分詞器的core的conf下面,和core的schema.xml文件一個目錄。ci
修改core的schema.xml,在<types></types>配置項間加一段以下配置:rem
<!-- IKAnalyzer -->get
<fieldType name="cn_ik" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.solr.SolrIKAnalyzer" useSmart="true"/>
<filter class="solr.LowerCaseFilterFactory" />
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.solr.SolrIKAnalyzer" useSmart="true"/>
<filter class="solr.LowerCaseFilterFactory" />
</analyzer>
</fieldType>
咱們就多了一種cn_ik的field類型了,該類型使用的分詞器就是ik-analyzer。
咱們在這個core的schema.xml裏面配置field類型的時候就能夠使用cn_ik了。
<field name="cn_ik" type="cn_ik" indexed="true" stored="true"/>
3、中文分詞測試
結果以下:
IKT |
|
|
|
|
|
|||||||||||||||||||||||||||||||||||
LCF |
|
|
|
|
|