Spark Shuffle原理與源碼解析

一、普通的shuffle過程緩存 ①假設節點上有4個ShuffleMapTask,節點上有2個cup core併發 ②ShuffleMapTask的輸出,稱爲shuffle過程的第一個rdd,即MapPartitionRDDapp ③每一個ShuffleMapTask會爲每個task建立一份bucket內存緩存,以及對應的ShuffleBlockFile磁盤文件dom ④ShuffleMapTas
相關文章
相關標籤/搜索