Spark 3.0 自適應查詢優化介紹,在運行時加速 Spark SQL 的執行性能

多年以來,社區一直在努力改進 Spark SQL 的查詢優化器和規劃器,以生成高質量的查詢執行計劃。最大的改進之一是基於成本的優化(CBO,cost-based optimization)框架,該框架收集並利用各種數據統計信息(如行數,不同值的數量,NULL 值,最大/最小值等)來幫助 Spark 選擇更好的計劃。這些基於成本的優化技術很好的例子就是選擇正確的 Join 類型(broadcast
相關文章
相關標籤/搜索