MR處理數據內部流程圖文字說明

1. 客戶端有一個文件,讀取文件(textInputFormat),生成新的的k v,開始一行一行的讀取數據, 任務被讀取之後,開始計算任務切片(就是Maptask個數,maptask的個數是根據文件的個數和文件的大小來決定的), 然後kv(k代表 行偏移量,v代表行內容)交給maptask(),之後kv不斷地往maptask輸入,kv交給map()方法,一個kv執行一次map方法,然後可以子啊m
相關文章
相關標籤/搜索