Hadoop實戰之MapReduce_01

什麼是MapReduce MapReduce是一個用於處理海量數據的分佈式計算框架,這個框架解決了 數據分佈式存儲(數據存在HDFS上) 作業調度 機器間通信 容錯 MapReduce使用分治方式(分解,求解,合併),通過Map切分,Reduce合併進行數據處理,如圖 理解上面這幅圖非常重要,普遍情況下,大部分開發人員進行MapReduce開發任務時,只需要關注灰色部分。 運行MapReduce程
相關文章
相關標籤/搜索