SparkSQL – Catalyst

Catalyst Catalyst是SparkSQL的優化器系統,其設計思路基本都來自於傳統型數據庫,而且和大多數當前的大數據SQL處理引擎設計基本相同。 SQL優化器核心執行策略主要分爲兩個大的方向:基於規則優化(RBO)以及基於代價優化(CBO),基於規則優化是一種經驗式、啓發式地優化思路,更多地依靠前輩總結出來的優化規則,簡單易行且能夠覆蓋到大部分優化邏輯,但是對於核心優化算子Join卻顯得
相關文章
相關標籤/搜索