<p><b>1、安裝solr</b><b>(未集成Tomcat</b><b>,服務器上Tomcat</b><b>不能安裝成功)</b></p> <p>參考網址:http://blog.csdn.net/clebeg/article/details/21241195</p> <p>1. 安裝 Solr5</p> <p>step1: 下載Solr5 wget </p> <p>http://mirrors.hust.edu.cn/apache/lucene/solr/5.0.0/solr-5.0.0.tgz</p> <p>step2: 解壓縮Solr5 tar –xzvf solr-5.0.0.tgz </p> <p>step3: 啓Solr5 bin/solr start -e cloud -noprompt</p> <p>2、solr配置中文分詞jcseg</p> <p>關於 jcseg: jcseg 是使用Java 開發的一款開源的中文分詞器, 使用mmseg 算法. 分詞準確率高達</p> <p>98.4%, 支持中文人名識別, 同義詞匹配, 中止詞過濾..., 詳情請查看jcseg 官方首頁.</p> <p>官方首頁 : https://code.google.com/p/jcseg/</p> <p>下載地址 : https://code.google.com/p/jcseg/downloads/list</p> <p>git 源碼: http://git.oschina.net/lionsoul/jcseg</p> <p>1. 克隆git源碼下來</p> <p>2. 從jcseg 附件解壓目錄中將jcseg-core-{version}.jar 和jcseg-solr-{version}.jar 複製到</p> <p>solr 的類庫目錄中.</p> <p>3. 在solr 的scheme.xml 加入以下兩種配置之一:</p> <p><!----複雜模式分詞: --></p> <p><fieldtype name="textComplex" class="solr.TextField"></p> <p><analyzer></p> <p><tokenizer class="org.lionsoul.jcseg.solr.JcsegTokenizerFactory" mode="complex"/></p> <p></analyzer></p> <p></fieldtype></p> <p><!----簡易模式分詞: --></p> <p><fieldtype name="textSimple" class="solr.TextField"></p> <p><analyzer></p> <p><tokenizer class="org.lionsoul.jcseg.solr.JcsegTokenizerFactory" mode="simple"/></p> <p></analyzer></p> <p></fieldtype></p> <p><!----檢測模式分詞: --></p> <p><fieldtype name="textSimple" class="solr.TextField"></p> <p><analyzer></p> <p><tokenizer class="org.lionsoul.jcseg.solr.JcsegTokenizerFactory" mode="detect"/></p> <p></analyzer></p> <p></fieldtype></p> <p>若是須要作相似上面lucene 的配置, 須要更改</p> <p>org.lionsoul.jcseg.solr.JcsegTokenizerFactory 分詞工廠.</p>git