MapReduce計算任務的步驟

第一步:inputformat inputformat 到HDFS上讀取數據 將數據傳給split 第二步:split split將數據進行邏輯切分, 將數據傳給RR 第三步:RR RR:將傳入的數據轉換成一行一行的數據,輸出行首字母偏移量和偏移量對應的數據 將數據傳給MAP 第四步:MAP MAP:根據業務需求實現自定義代碼 將數據傳給shuffle的partition 第五步:partitio
相關文章
相關標籤/搜索