大數據學習筆記(二):Hadoop2.x概述

點擊有驚喜 什麼是Hadoop 開源的 可靠的:可以通過備份的數據恢復 可擴展:機器動態的增加或減少不會影響數據的存儲和計算 分佈式計算:多臺機器並行的處理 Hadoop能做什麼 海量數據的存儲——HDFS 存儲海量數據 動態的添加機器 備份 當數據收到損壞時,快速自動恢復 海量數據分析——mapreduce 核心理念:分而治之 處理海量的數據獲得有價值的信息 mapreduce原理: 假設有海量
相關文章
相關標籤/搜索