Spark SQL有關broadcast join的不生效問題

大數據計算一般會存在大表join小表的狀況,若是相對較小的表容許廣播到各個executor的話,可使用廣播方式mapjoin,這樣還能夠避免數據傾斜。html 平時看文檔記着有個參數是:node spark.sql.autoBroadcastJoinThreshold 10485760 (10 MB) Configures the maximum size in bytes for a table
相關文章
相關標籤/搜索