Spark的Shuffle原理(一):HashShuffle

01.HashShuffle相關知識     Spark Shuffle類似於MapReduce的過程,在Spark 的1.0版本以前,Spark採用的是Hash Shuffle,與MapReduce不同的是,Hash Shuffle沒有排序過程。Shuffle階段主要發生在寬依賴階段,什麼是寬依賴呢?     上圖中,可以很好的理解寬依賴和窄依賴,對於一般的join、groupByKey等算子都
相關文章
相關標籤/搜索