lucene集成IK實現中文分詞檢索

    接上篇,解決lucene中文分詞問題。
    這裏採用IK分詞器。
     IKAnalyzer2012_u5.zip下載地址:http://code.google.com/p/ik-analyzer/downloads/detail?name=IKAnalyzer2012_u5.zip&can=2&q=
    解壓縮後,有以下文件:
    一、將IKAnalyzer2012.jar導入工程;
    二、將IKAnalyzer.cfg.xml、stopword.dic文件拷貝到src根目錄下(編譯後在classes根目錄下);
    三、修改CreateIndex.java文件,用IK分詞器替換lucene默認分詞器。找到
        indexWriter = new IndexWriter(dir, new StandardAnalyzer(
Version.LUCENE_30), true,
IndexWriter.MaxFieldLength.UNLIMITED);
        替換爲:
        indexWriter = new IndexWriter(dir,new IKAnalyzer(), true,
IndexWriter.MaxFieldLength.UNLIMITED); 
    四、修改Select.java文件,用IK分詞器替換lucene默認分詞器。找到
        QueryParser queryParser = new QueryParser(Version.LUCENE_30,   
            "contents",   new IKAnalyzer() );  

    以上四步即完成集成IK分詞器操做。
相關文章
相關標籤/搜索