Spark會產生shuffle的算子

Spark會產生shuffle的算子 去重 def distinct() def distinct(numPartitions: Int) 聚合 def reduceByKey(func: (V, V) => V, numPartitions: Int): RDD[(K, V)] def reduceByKey(partitioner: Partitioner, func: (V, V) => V
相關文章
相關標籤/搜索