Nutch 初體驗 爬行企業內部網

前些日子琢磨着想搭建一個搜索引擎,自己寫成本有點高,雖然以前寫過爬蟲,但是索引排序估計要煩得多 nutch   是一個開源的、Java 實現的搜索引擎。它提供了我們運行自己的搜索引擎所需的全部工具。是一個應用程序,可以以 Lucene 爲基礎實現搜索引擎應用。 選定nutch之後,開始着手學習使用nutch,英文水平還不夠,只能看看nutch的簡單的tutorial,但是真正當教程,我還是選擇了中
相關文章
相關標籤/搜索