Spark 的兩種 Shuffle

文章目錄 1. HashShuffle 1. 優化前 2. 優化後 2. SortShuffle 1. 普通運行機制 2. bypass運行機制 1. HashShuffle 1. 優化前 1. shuffle write階段,主要就是在一個stage結束計算以後,爲了下一個stage能夠執行shuffle類的算子(好比reduceByKey), 而將每一個task處理的數據按key進行「劃分」。
相關文章
相關標籤/搜索