12,maptask工作機制與maptask並行度與決定機制

1.準備數據 200MB 2.提交任務程序drive maptask通過inputformat讀取,通過spilt切分了原文件,spilt=blocksize 3.mapper->map(k,v,context)->outputcollector 4.向環形緩衝區寫入數據,默認大小爲100MB,超過80%開始溢寫 5.進行默認的分區排序 6.merge歸併排序
相關文章
相關標籤/搜索