Spark RDD coalesce()方法和repartition()方法

時間 2019-12-05

標籤 spark rdd coalesce 方法 repartition 欄目 Spark 简体版

原文原文鏈接

在Spark的RDD中，RDD是分區的。java 有時候須要從新設置RDD的分區數量，好比RDD的分區中，RDD分區比較多，可是每一個RDD的數量比較小，須要設置一個比較合理的分區。或者須要把RDD的分區數量調大。還有就是經過設置一個RDD的分區來達到設置生成的文件的數量。有這兩種方法是能夠重設RDD分區：分別是coalesce()方法和repartition()。這兩個方法有什麼區別，看看源

>>阅读原文<<

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。