Shuffle機制

完整地從map task端讀取數據到reduce 端。 在跨節點讀取數據時,儘可能地減少對帶寬的不必要消耗。 減少磁盤IO對task執行的影響。   計算切片大小方法: FileInputFormat 類280行 切片公式   MapReduce 統計單詞過程
相關文章
相關標籤/搜索