Nutch搜索引擎(第1期)_ Nutch簡介及安裝

1、Nutch簡介   Nutch是一個由Java實現的,開放源代碼(open-source)的web搜索引擎。主要用於收集網頁數據,然後對其進行分析,建立索引,以提供相應的接口來對其網頁數據進行查詢的一套工具。其底層使用了Hadoop來做分佈式計算與存儲,索引使用了Solr分佈式索引框架來做,Solr是一個開源的全文索引框架,從Nutch 1.3開始,其集成了這個索引架構。   Nutch目前最
相關文章
相關標籤/搜索