spark1.x-spark-sql-數據傾斜解決方案

時間 2019-12-06

標籤 spark1.x spark sql 數據傾斜解決方案欄目 Spark 简体版

原文原文鏈接

聚合源數據java 過濾致使傾斜的key where條件web 提升shuffle並行度 spark.sql.shuffle.partitionssql sqlContext.setConf("spark.sql.shuffle.partitions","1000") // 默認的並行度爲 200 reducetask只有200 雙重group by 改寫SQL 改爲兩次Group byj

>>阅读原文<<