關於spark shuffle過程的理解

shuffle過程:由ShuffleManager負責,計算引擎HashShuffleManager(Spark 1.2)—>SortShuffleManager spark根據shuffle類算子進行stage的劃分,當執行某個shuffle類算子(reduceByKey、join)時,算子之前的代碼被劃分爲一個stage,之後的代碼被劃分爲下一個stage。當前stage開始執行時,它的每個t
相關文章
相關標籤/搜索