Hadoop生態圈簡單介紹

Hadoop生態地圖   網絡瀏覽器:能夠理解爲海量數據源。java Nutch:一個開源Java 實現的搜索引擎。它提供了咱們運行本身的搜索引擎所需的所有工具。包括全文搜索和Web爬蟲。算法 HDFS:分佈式文件系統(Hadoop Distributed File System),設計有着爲大數據處理「私人訂製」的意思,提供高吞吐量的數據訪問,很是適合大規模數據集上的應用。而且他是一個高度容錯的
相關文章
相關標籤/搜索