【Hadoop】Hadoop生態圈基本組件介紹

1. HDFS HDFS(Hadoop分佈式文件系統)源於Google在2003年10月發表的GFS論文,HDFS是GFS的實現。HDFS通過流式數據訪問,適合大數據集訪問的應用程序。HDFS有一次寫入多次讀取的機制,數據已塊的形式,同時分佈在集羣的不同物理機器上。 2. MapReduce MapReduce(分佈式計算框架)源於Google在2004年12月發表的MapReduce論文,Had
相關文章
相關標籤/搜索