對未經優化的HashShuffleManager產生小文件數的驗證。

入:HDFS讀數據:partiton=task split 出: map端最後一個rdd的partiton數做爲ResultStage的partition reduceByKey(func, X) X就是ResultStage的partitionweb ShuffleManager val shortShuffleMgrNames = Map( "hash" -> "org.apache.s
相關文章
相關標籤/搜索