Hadoop生態圈簡單介紹

網絡瀏覽器:可以理解爲海量數據源。 Nutch:一個開源Java 實現的搜索引擎。它提供了我們運行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬蟲。 HDFS:分佈式文件系統(Hadoop Distributed File System),設計有着爲大數據處理「私人訂製」的意思,提供高吞吐量的數據訪問,非常適合大規模數據集上的應用。並且他是一個高度容錯的系統,適合部署在廉價的機器上。 搜索出
相關文章
相關標籤/搜索