Spark Catalyst的實現分析

Spark SQL是Spark內部最核心以及社區最爲活躍的組件,也是將來Spark對End-User最好的接口,支持SQL語句和類RDD的Dataset/DataFrame接口。相比在傳統的RDD上進行開發,Spark SQL的業務邏輯在執行前和執行過程當中都有相應的優化工具對其進行自動優化(即Spark Catalyst以及Tungsten兩個組件),所以將來Spark SQL確定是主流。git
相關文章
相關標籤/搜索