MapReduce框架原理

MapReduce框架原理 3.1 InputFormat數據輸入 3.1.1 切片與MapTask並行度決定機制   1.問題引出   MapTask的並行度決定Map階段的任務處理併發度,進而影響到整個Job的處理速度。   思考:1G的數據,啓動8個MapTask,可以提高集羣的併發處理能力。那麼1K的數據,也啓動8個MapTask,會提高集羣性能嗎?MapTask並行任務是否越多越好呢?哪
相關文章
相關標籤/搜索