spark sql 執行流程

本文我們通過源碼,來介紹下spark sql的執行流程。   Spark sql是spark內部最核心,也是社區最活躍的組件。Spark SQL支持在Spark中執行SQL,或者HiveQL的關係查詢表達式。列式存儲的類RDD(DataSet/DataFrame)數據類型以及對sql語句的支持使它更容易上手,同時,它對數據的抽取、清洗的特性,使它廣泛的用於etl,甚至是機器學習領域。因此,sapr
相關文章
相關標籤/搜索