分佈式計算框架Mapreduce

概念:     Mapreduce是一種編程模型,編程方法,採用「分而自治」思想 優點:海量數據離線處理,易開發,易運行。 缺點:實時流式計算 MapReduce編程模型之執行步驟:    輸入一個大文件,通過Split之後,將其分爲多個片    每個文件分片由單獨的機器去處理,這就是map方法    將各個機器計算的結果進行彙總並得到最終的結果,這就是reduce方法 MapReduce的四個階
相關文章
相關標籤/搜索