使用nutch搭建相似百度/谷歌的搜索引擎

Nutch是基於Lucene實現的搜索引擎。包括全文搜索和Web爬蟲。Lucene爲Nutch提供了文本索引和搜索的API。css 1.有數據源,須要爲這些數據提供一個搜索頁面。最好的方式是直接從數據庫中取出數據並用Lucene API 創建索引,由於你不須要從別的網站抓取數據。 2.沒有本地數據源,或者數據源很是分散的狀況下,就是須要抓別人的網站,則使用Nutch。html 1.安裝 1.安裝t
相關文章
相關標籤/搜索