認識SparkSQL的Catalyst

SparkSQL的優化器系統Catalyst和大多數當前的大數據SQL處理引擎設計基本相同(Impala、Presto、Hive(Calcite)等),因此通過本文的學習也可以基本瞭解所有其他SQL處理引擎的工作原理。 SQL優化器核心執行策略主要分爲兩個大的方向:基於規則優化(RBO)以及基於代價優化(CBO),基於規則優化是一種經驗式、啓發式地優化思路,更多地依靠前輩總結出來的優化規則,簡單易
相關文章
相關標籤/搜索