爲Nutch 1.0添加JE中文分詞
文章來源網絡 屬於java 分類 電腦編程網整理 20091223
簡介:這是爲Nutch 1.0添加JE中文分詞的詳細頁面,介紹了和java,有關的知識,加入收藏請按鍵盤ctrl+D,謝謝你們的觀看!要查看更多有關信息,請點擊此處
先下載Nutch 1.0的源文件:
svn co http://svn.apache.org/repos/asf/lucene/nutch/tags/release-1.0 ./nutch-1.0
更改查詢語法解析部分:
改變tokenize的方式(原來爲中文單字識別)
modify 「src/java/org/apache/nutch/analysis/NutchAnalysis.jj」line 130:
| >
change to:
| )+ >
run 「javacc」
cd nutch-1.0/src/java/org/apache
![](http://static.javashuo.com/static/loading.gif)