144、Spark核心編程進階之aggregateByKey以及單詞計數案例

reduceByKey可以認爲是aggregateByKey的簡化版 aggregateByKey,分爲三個參數,,多提供了一個函數,Seq Function 就是說自己可以控制如何對每個partition中的數據進行先聚合,類似於mapreduce中的,map-side combine 然後纔是對所有partition中的數據進行全局聚合 第一個參數是,每個key的初始值 第二個是個函數,Seq
相關文章
相關標籤/搜索