[solr] - IKAnalyzer 擴展分詞庫

在solr中加入本身的擴展分詞庫方法:html

參考文章:java

http://www.cnblogs.com/dennisit/archive/2013/04/07/3005847.html web

 

一、在solr的web中:\WEB-INF目錄下新增一個文件夾:classes測試

 

二、新增一個文件:IKAnalyzer.cfg.xmlspa

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">  
<properties>  
    <comment>IK Analyzer 擴展配置</comment>
    <!--用戶能夠在這裏配置本身的擴展字典-->
    <entry key="ext_dict">my.dic;</entry> 
    
    <!--用戶能夠在這裏配置本身的擴展中止詞字典-->
    <entry key="ext_stopwords">stopword.dic;</entry> 
    
</properties>

說明:code

my.dic即爲擴展分詞庫,分詞庫能夠爲多個,以分號隔開便可。中止詞庫同樣。xml

 

三、新增my.dic文件。文件格式必需是:無BOM的UTF-8格式,示例內容爲:htm

西麗

 

四、保存,重啓solr。blog

使用了新的分詞,須要從新建索引數據。索引

 

五、測試:

相關文章
相關標籤/搜索