Spark的Shuffle之BypassMergeSortShuffleWriter

    來介紹一下最後一種Shuffle的方式ByPassMergeSortShuffleWriter,它和已經廢棄的HashShuffleWriter類似,區別在於map端的多個文件會被彙總成一個文件,這樣就大大減少了磁盤IO的壓力。   ByPassMergeSortShuffleWriter流程示例如下: 使用這種Shuffle方式需要滿足兩個條件: 沒有定義mapSideCombine(m
相關文章
相關標籤/搜索