144、Spark核心編程進階之aggregateByKey以及單詞計數案例

時間 2021-01-17

原文原文鏈接

reduceByKey可以認爲是aggregateByKey的簡化版 aggregateByKey，分爲三個參數，，多提供了一個函數，Seq Function 就是說自己可以控制如何對每個partition中的數據進行先聚合，類似於mapreduce中的，map-side combine 然後纔是對所有partition中的數據進行全局聚合第一個參數是，每個key的初始值第二個是個函數，Seq

>>阅读原文<<