MapReduce分佈式計算框架

    MapReduce是Hadoop系統核心組件之一,是一種可用於大數據並行處理的計算模型、框架和平臺,主要解決海量數據的計算,是目前分佈式計算模型中應用較爲廣泛的一種。 MapReduce核心思想:分而治之。 使用MapReduce操作海量數據時: 每個MapReduce程序被初始化爲一個工作任務 每個工作任務可以分爲Map和Reduce l兩個階段 Map階段:負責將任務分解,即把負責的任
相關文章
相關標籤/搜索