Lucene中使用Paoding中文分詞

1,把paoding-analysis-2.0.4-beta解壓縮,給項目中加入paoding-analysis.jar。this

2,把dic文件夾放到項目的根目錄中。dic文件夾裏是paoding的詞庫。google

3,配置paoding的詞庫:把paoding-analysis-2.0.4-beta\src裏面的paoding-dic-home.properties拷貝到項目的根目錄下。編輯以下:spa

  1. #values are "system-env" or "this";   code

  2. #if value is "this" , using the paoding.dic.home as dicHome if configed!   orm

  3. #paoding.dic.home.config-fisrt=system-env   it

  4. paoding.dic.home.config-fisrt=this  io

  5. #dictionary home (directory)   class

  6. #"classpath:xxx" means dictionary home is in classpath.   配置

  7. #e.g "classpath:dic" means dictionaries are in "classes/dic" directory or any other classpath directory   程序

  8. #paoding.dic.home=dic   

  9. paoding.dic.home=classpath:dic   

  10. #seconds for dic modification detection   

  11. #paoding.dic.detector.interval=60  

 

修改paoding .dic .home .config-fisrt=this ,使得程序知道該配置文件

修改paoding .dic .home =classpath:dic ,指定字典的所在路徑。絕對路徑也能夠,可是很差。

http://code.google.com/p/paoding/downloads/list

相關文章
相關標籤/搜索