Solr是一個高性能,採用Java5開發,Solr基於Lucene的全文搜索服務器。同時對其進行了擴展,提供了比Lucene更爲豐富的查詢語言,同時實現了可配置、可擴展並對查詢性能進行了優化,而且提供了一個完善的功能管理界面,是一款很是優秀的全文搜索引擎。由於中文的特殊性,在對中文文檔創建全文索引時,須要利用分詞工具進行分詞。web
目前比較知名的分詞工具備:
IK,庖丁等服務器
solr連接:https://pan.baidu.com/s/1iitpaYgBVpXQSUABtkCm5Q
提取碼:tuuo app
解壓文件。webapp
進入bin 啓動solr工具
./solr start -p 8984性能
能夠在ip:8984端口上查看solr狀況優化
關閉solr搜索引擎
./solr stop -allspa
copy ik-analyzer-solr5-5.x.jar to server/solr-webapp/webapp/WEB-INF/libcode
ik-analyzer-solr5-5.x.jar 下載地址:連接:https://pan.baidu.com/s/1MlzginuetwyONGQ5KbtnOg
提取碼:7g7z
/usr/local/solr/solr-5.4.0/server/solr-webapp/webapp/WEB-INF/lib
修改schema.xml
<fieldType name="text_ik" class="solr.TextField"> <analyzer type="index"> <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" /> </analyzer><analyzer type="query"><tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" /></analyzer></fieldType>
<field name="docContent" type="text_ik" indexed="true" stored="true" multiValued="true"/>
<field name="docType" type="text_ik" indexed="true" stored="true" multiValued="true"/>
<field name="docName" type="text_ik" indexed="true" stored="true" multiValued="true"/>
重啓solr
檢測: 進入solr管理頁面-->analysis 查看分詞結果