Hadoop的MapReduce之maptask和reducetask

mapreduce就是一個分佈式程序的通用框架:一個完整的mapreduce程序在分佈式運行時有三類實例進程:(根據hadoop2.0以後版本進行講述) 1、MRAppMaster:負責整個程序的過程調度及狀態協調; 2、mapTask:負責map階段的整個數據處理流程; 3、ReduceTask:負責reduce階段的整個數據處理流程; 具體流程解析如下: 1. 一個MapReduce程序啓動的
相關文章
相關標籤/搜索