大數據：Spark Shuffle（一）ShuffleWrite:Executor如何將Shuffle的結果進行歸併寫到數據文件中去

時間 2019-12-05

標籤數據 spark shuffle shufflewrite executor 如何結果進行歸併寫到文件中去欄目 Spark 简体版

原文原文鏈接

1. 前序關於Executor如何運行算子，請參考前面博文：大數據：Spark Core（四）用LogQuery的例子來講明Executor是如何運算RDD的算子，當Executor進行reduce運算的時候，生成運算結果的臨時Shuffle數據，並保存在磁盤中，被最後的Action算子調用，而這個階段就是在ShuffleMapTask裏執行的。算法前面博客中也提到了，用什麼ShuffleWr

>>阅读原文<<