lucene集成IK實現中文分詞檢索

時間 2019-11-07

標籤 lucene 集成實現中文分詞檢索欄目搜索引擎简体版

原文原文鏈接

接上篇，解決lucene中文分詞問題。

這裏採用IK分詞器。

IKAnalyzer2012_u5.zip下載地址：http://code.google.com/p/ik-analyzer/downloads/detail?name=IKAnalyzer2012_u5.zip&can=2&q=

解壓縮後，有以下文件：

一、將IKAnalyzer2012.jar導入工程；

二、將IKAnalyzer.cfg.xml、stopword.dic文件拷貝到src根目錄下（編譯後在classes根目錄下）;

三、修改CreateIndex.java文件，用IK分詞器替換lucene默認分詞器。找到

indexWriter = new IndexWriter(dir, new StandardAnalyzer(

Version.LUCENE_30), true,

IndexWriter.MaxFieldLength.UNLIMITED);

替換爲：

indexWriter = new IndexWriter(dir,new IKAnalyzer(), true,

IndexWriter.MaxFieldLength.UNLIMITED);

四、修改Select.java文件，用IK分詞器替換lucene默認分詞器。找到

QueryParser queryParser = new QueryParser(Version.LUCENE_30,

"contents", new IKAnalyzer() );

以上四步即完成集成IK分詞器操做。

相關標籤/搜索