Spark部分:重新分區(repartition和coalesce)

coalesce def coalesce(numPartitions:Int,shuffle:Boolean=false):RDD[T]  該函數用於將RDD進行重分區,使用HashPartitioner。  第一個參數爲重分區的數目,第二個爲是否進行shuffle,默認爲false。 repartition def repartition(numPartitions: Int): RDD[T]
相關文章
相關標籤/搜索