對比 Hadoop MapReduce 和 Spark 的 Shuffle 過程

時間 2021-08-15

原文原文鏈接

如果熟悉 Hadoop MapReduce 中的 shuffle 過程，可能會按照 MapReduce 的思路去想象 Spark 的 shuffle 過程。然而，它們之間有一些區別和聯繫。從 high-level 的角度來看，兩者並沒有大的差別。都是將 mapper（Spark 裏是 ShuffleMapTask）的輸出進行 partition，不同的 partition 送到不同的 redu

>>阅读原文<<