Spark中repartition和coalesce的用法

repartition(numPartitions:Int):RDD[T]和coalesce(numPartitions:Int,shuffle:Boolean=false):RDD[T]函數 他們兩個都是RDD的分區進行從新劃分,repartition只是coalesce接口中shuffle爲true的簡易實現,(假設RDD有N個分區,須要從新劃分紅M個分區)性能 1)、N<M。通常狀況下N個分
相關文章
相關標籤/搜索