solr配置IK分詞

IK Analyzer分詞器java

這個其實比較好配,奈何資源很差找,並且用solr搜中文通常都用這個我把分詞器打了個包放在下面了。裏面沒有字典,但願哪位又好用的互通下有無。web

http://pan.baidu.com/s/1pLjE2Tltomcat

假設solr部署在tomcat上,位置webapp\solrapp

一、IKAnalyzer2012FF_u1.jar 放在solr\WEB-INF\libwebapp

二、IKAnalyzer.cfg.xml和stopword.dic 放在solr\WEB-INF\classescode

IKAnalyzer.cfg.xmlxml

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">  
<properties>  
	<comment>IK Analyzer 擴展配置</comment>
	<!--用戶能夠在這裏配置本身的擴展字典 
	<entry key="ext_dict">ext.dic;</entry> 
	-->
	<!--用戶能夠在這裏配置本身的擴展中止詞字典-->
	<entry key="ext_stopwords">stopword.dic;</entry> 
	<!--放一些其餘好用的字典-->
</properties>

三、找到solr數據文件夾 我這裏是/media/data/solr 在文件夾裏面找到你的collection的目錄 個人叫test,也就是這個地址/media/data/solr/test這個目錄下有個文件是managed-schema(老版本solr是schema)在裏面加入ik配置資源

<fieldType name="text_ik" class="solr.TextField">
		<analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
		<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
	</fieldType>

	<field name="ik" type="text_ik" indexed="true" stored="true" multiValued="false" />

須要中文分詞的字段配置部署

<field name="title" type="text_ik" indexed="true" stored="true" multiValued="false"/>

配置完了get

相關文章
相關標籤/搜索