spark之shuffle

shuffle:groupByKey、reduceByKey、countByKey、部分join 遇到寬依賴就會產生shuffle,切分出新的stage。 數據傾斜:相同key的數據會分發到同一個task中執行。 調優:代碼、資源、skew、shuffle shuffle的類型 hash:HashShuffleManager ( < spark1.2) sort:SortShuffleManage
相關文章
相關標籤/搜索