Spark之Mapper端和Reduce端調優

Spark在shuffle分爲兩部分,Mapper端和Reduce端 一、Mapper端調優 假設Mapper端有3個Task,task1,task2,task3,Reducer有兩個Task,task1,task2 數據傳輸到Reducer端的時候首先進行Mapper端的處理,Mapper端的處理很簡單,Mapper端有一個Cache寫入文件,Mapper端的緩衝層根據Reducer端的需要,將
相關文章
相關標籤/搜索