MapReduce十步執行流程 (詳細介紹)

第一步:InputFormat InputFormat 在HDFS文件系統中讀取要進行計算的數據 輸出給Split 第二步:Split Split 將數據進行邏輯切分,切分成多個任務。 輸出給RR 第三步:RR RR 將切分後的數據轉換成key value進行輸出 key : 每一行行首字母的偏移量 value: 每一行數據 輸出給Map 第四步:Map 接收一條一條的數據(有多少行數據Map運行
相關文章
相關標籤/搜索