開發基於 Nutch 的集羣式搜索引擎

簡介 Nutch 是一個基於 Java 實現的開源搜索引擎,其內部使用了高性能全文索引引擎工具 Lucene。從 nutch0.8.0開始,Nutch 完全構建在 Hadoop 分佈式計算平臺之上。Hadoop 除了是一個分佈式文件系統外,還實現了 Google 的 GFS 和 MapReduce 算法。因此基於 Hadoop 的 Nutch 搜索引擎可以部署在由成千上萬計算機組成的大型集羣上。由
相關文章
相關標籤/搜索