spark算子reducebykey和groupbykey的對比

一、場景 reducebykey和groupbykey作爲經常使用的算子,都會觸發shuffle操作 1.reducebykey返回的k-v的tuple的rdd 2.groupbykey返回的k-iterable的tuple的rdd 二、源碼解讀 這兩個方法的底層都調用了combineByKeyWithClassTag這個方法 groupbykey 調用   reducebykey調用   第五個
相關文章
相關標籤/搜索