lucene

lucene 網址:http://lucene.apache.org/

1.Lucene 工做原理(使用了倒排索引):http://www.cnblogs.com/dewin/archive/2009/11/24/1609905.html

2.初識lucene(使用方法):http://www.ibm.com/developerworks/cn/java/j-lo-lucene1/;

                                     http://my.oschina.net/u/238958/blog/214284html

3.lucene評分算法:http://www.hankcs.com/program/java/lucene-scoring-algorithm-explained.htmljava

4.全文檢索lucene中文分詞的一些總結(MMAnalyzer中文分詞器):http://blog.csdn.net/buptdavid/article/details/5842517web

Lucene的中文分詞器IKAnalyzer(使用最新版本不會和Lucene4產生衝突:IKAnalyzer2012FF_u1.jar):http://blog.sina.com.cn/s/blog_67196ddc0101a3so.html算法

4.1  IKAnalyzer的安裝部署:十分簡單,將IKAnalyzer2012.jar部署亍項目的lib目彔中;apache

IKAnalyzer.cfg.xml和stopword.dic文件放置在代碼根目彔(對亍web項目,一般是WEB-INF/classes目彔,同hibernate、log4j等配置文件相同)下便可。api

當前幾個主要的Lucene中文分詞器的比較:http://www.chepoo.com/major-chinese-segmentation-lucene-comparative.htmlpost

5。lucene的API參考文檔:http://www.dotlucene.net/documentation/api/編碼

6.如何查看lucene創建的index:使用luke,下載一個luke-version.jar。打開方式:在cmd下使用命令,java -jar lukeall-version.jarspa

7.遇到的問題:.net

lucene創建的中文索引出現問題:

用於創建索引的txt文件編碼方式不是utf-8。(解決方案:使用notepad++修改編碼方式)

8.lucene打分公式的數學推導

http://www.cnblogs.com/forfuture1978/archive/2010/03/07/1680007.html

相關文章
相關標籤/搜索