solr中文分詞

1.簡介

Solr是一個高性能,採用Java5開發,Solr基於Lucene的全文搜索服務器。同時對其進行了擴展,提供了比Lucene更爲豐富的查詢語言,同時實現了可配置、可擴展並對查詢性能進行了優化,而且提供了一個完善的功能管理界面,是一款很是優秀的全文搜索引擎。由於中文的特殊性,在對中文文檔創建全文索引時,須要利用分詞工具進行分詞。web

目前比較知名的分詞工具備:
IK,庖丁等服務器

2.下載

 solr連接:https://pan.baidu.com/s/1iitpaYgBVpXQSUABtkCm5Q 
提取碼:tuuo app

3.安裝

解壓文件。webapp

進入bin 啓動solr工具

./solr start -p 8984性能

能夠在ip:8984端口上查看solr狀況優化

關閉solr搜索引擎

./solr stop -allspa

4.中文分詞配置

copy ik-analyzer-solr5-5.x.jar to server/solr-webapp/webapp/WEB-INF/libcode

ik-analyzer-solr5-5.x.jar 下載地址:連接:https://pan.baidu.com/s/1MlzginuetwyONGQ5KbtnOg 
提取碼:7g7z 

 

/usr/local/solr/solr-5.4.0/server/solr-webapp/webapp/WEB-INF/lib

修改schema.xml

<fieldType name="text_ik" class="solr.TextField"> <analyzer type="index"> <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" /> </analyzer><analyzer type="query"><tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" /></analyzer></fieldType>

<field name="docContent" type="text_ik" indexed="true" stored="true" multiValued="true"/>

<field name="docType" type="text_ik" indexed="true" stored="true" multiValued="true"/>

<field name="docName" type="text_ik" indexed="true" stored="true" multiValued="true"/>

重啓solr

檢測: 進入solr管理頁面-->analysis 查看分詞結果

相關文章
相關標籤/搜索