Hadoop2.X知識點筆記

Hadoop是分佈並行的任務處理的系統框架,擁有獨特的存儲方式,用於處理數據的工具通常在於數據相同的服務器上,通過分發數據可以是數據所在的節點並行的處理,非常高效。 MapReduce是離線計算框架,Spark是內存計算的實時計算框架,Storm是流式計算框架。 Federation的應用場景,超大數據中,把大數據分類成不同的模塊,每個模塊數據分爲不同的namenode來存儲。每個namenode
相關文章
相關標籤/搜索