Spark之reduceByKey詳解

Spark算子reduceByKey詳解 reduceByKey與groupByKey 不同之處 相同之處 reduceByKey與groupByKey 不同之處 reduceByKey,多了一個rdd,MapPartitionsRDD,存在於stage0的,主要是代表了進行本地數據規約之後的rdd,網絡傳輸的數據量,以及磁盤IO等,會減少,性能更高 相同之處 後面進行shuffle read和聚
相關文章
相關標籤/搜索