Spark原理之SortShuffle

介紹: 在Spark 1.2以前,默認的shuffle計算引擎是HashShuffleManager。HashShuffleManager採用的hashShuffle機制很大的問題就是產生大量的中間磁盤文件,產生的大量磁盤IO操作會有性能問題。 在Spark 1.2以後的版本中,默認的ShuffleManager改成了SortShuffleManager。SortShuffleManager相較於
相關文章
相關標籤/搜索