spark 優化算子選擇

摘要html    1.使用reduceByKey/aggregateByKey替代groupByKey   2.使用mapPartitions替代普通map   3.使用foreachPartitions替代foreach   4.使用filter以後進行coalesce操做   5.使用repartitionAndSortWithinPartitions替代repartition與sort類操
相關文章
相關標籤/搜索