大數據:Spark Shuffle(一)ShuffleWrite:Executor如何將Shuffle的結果進行歸併寫到數據文件中去

1. 前序 關於Executor如何運行算子,請參考前面博文:大數據:Spark Core(四)用LogQuery的例子來講明Executor是如何運算RDD的算子,當Executor進行reduce運算的時候,生成運算結果的臨時Shuffle數據,並保存在磁盤中,被最後的Action算子調用,而這個階段就是在ShuffleMapTask裏執行的。算法 前面博客中也提到了,用什麼ShuffleWr
相關文章
相關標籤/搜索