Hadoop與Spark技術入門

1 Hadoop系統概述 1.1 Hadoop簡介 Hadoop最初起源於搜索引擎子項目Nutch,是Apache基金會的開源大數據計算平臺,其核心組件設計包含有分佈式文件系統HDFS及分佈式計算框架MapReduce。隨着Hadoop項目的開源發展,逐漸擴展成爲一個包含Zookeeper、Hive等衆多子系統的大數據生態系統。 1.2 分佈式文件系統HDFS HDFS採用Master/Slave
相關文章
相關標籤/搜索