Hadoop系列——MapRdecude工作流程;MapTask,Shuffle,ReduceTask過程詳解

一、MapTask過程 MapTask階段主要是分爲read-Map-Collect-Spill四個過程 Read階段:MapTask通過用戶編寫的RecordReader,從輸入InputSplit中解析出一個個Key/Value對。 Map階段:將解析出來的Key-value交給map()方法進行處理,產生新的Key-Value對。 Collect階段:map()處理完數據以後會調用Outpu
相關文章
相關標籤/搜索