sparksql執行流程分析

    Spark sql是spark內部最核心,也是社區最活躍的組件。Spark SQL支持在Spark中執行SQL,或者HiveQL的關係查詢表達式。列式存儲的類RDD(DataSet/DataFrame)數據類型以及對sql語句的支持使它更容易上手,同時,它對數據的抽取、清洗的特性,使它普遍的用於etl,甚至是機器學習領域。所以,saprk sql較其餘spark組件,得到了更多的使用者。s
相關文章
相關標籤/搜索