IK Analyzer分詞器java
這個其實比較好配,奈何資源很差找,並且用solr搜中文通常都用這個我把分詞器打了個包放在下面了。裏面沒有字典,但願哪位又好用的互通下有無。web
http://pan.baidu.com/s/1pLjE2Tltomcat
假設solr部署在tomcat上,位置webapp\solrapp
一、IKAnalyzer2012FF_u1.jar 放在solr\WEB-INF\libwebapp
二、IKAnalyzer.cfg.xml和stopword.dic 放在solr\WEB-INF\classescode
IKAnalyzer.cfg.xmlxml
<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd"> <properties> <comment>IK Analyzer 擴展配置</comment> <!--用戶能夠在這裏配置本身的擴展字典 <entry key="ext_dict">ext.dic;</entry> --> <!--用戶能夠在這裏配置本身的擴展中止詞字典--> <entry key="ext_stopwords">stopword.dic;</entry> <!--放一些其餘好用的字典--> </properties>
三、找到solr數據文件夾 我這裏是/media/data/solr 在文件夾裏面找到你的collection的目錄 個人叫test,也就是這個地址/media/data/solr/test這個目錄下有個文件是managed-schema(老版本solr是schema)在裏面加入ik配置資源
<fieldType name="text_ik" class="solr.TextField"> <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/> <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/> </fieldType> <field name="ik" type="text_ik" indexed="true" stored="true" multiValued="false" />
須要中文分詞的字段配置部署
<field name="title" type="text_ik" indexed="true" stored="true" multiValued="false"/>
配置完了get