給LUKE增長word分詞器

word分詞是一個Java實現的分佈式中文分詞組件html

 

一、下載http://luke.googlecode.com/files/lukeall-4.0.0-ALPHA.jar(國內不能訪問)java

二、下載並解壓Java中文分詞組件word-1.0-bin.zipgit

三、將解壓後的 Java中文分詞組件word-1.0-bin/word-1.0 文件夾裏面的4個jar包解壓到當前文件夾,用壓縮解壓工具如winrar打開lukeall-4.0.0-ALPHA.jar,將當前文件夾裏面除了.jar、.bat、.html文件外的其餘全部文件拖到lukeall-4.0.0-ALPHA.jar裏面 github

四、執行命令 java  -jar  lukeall-4.0.0-ALPHA.jar 啓動luke,在Search選項卡的Analysis裏面就能夠選擇 org.apdplat.word.lucene.ChineseWordAnalyzer 分詞器了分佈式

五、在Plugins選項卡的Available analyzers found on the current classpath裏面也能夠選擇 org.apdplat.word.lucene.ChineseWordAnalyzer 分詞器工具


下載已經集成好的Luke插件:google

lukeall-4.0.0-ALPHA-with-word-1.0.jar (適用於lucene4.0.0)spa

lukeall-4.10.3-with-word-1.2.jar(適用於lucene4.10.3)插件

以下圖所示:code

  

相關文章
相關標籤/搜索