PySpark算子處理空間數據全解析(16): reduceByKey算子簡介(1)

前面的文章,講了各種map,同學也都發現了,map後面老是跟着一個叫做reduceByKey的算子,是幹嘛的呢?或者說,如何去理解它的運行原理呢? 正如名稱所言:MapReduce算法,reduceByKey也是始祖級的算法。那麼今天來說說這個reduceByKey算子的運行原理。 reduce從名字上看,就知道,主要是用來做聚合,比如下面的例子: 看看代碼: reduceByKey,做核心的操作
相關文章
相關標籤/搜索