Spark SQL 簡介

是什麼? image Spark 1.0 推出 Spark SQL,是 Spark 生態系統中最活躍的組件之一。能夠利用 Spark 進行結構化的存儲和操作。結構化數據可以來自外部源:Hive/Json/parquet,1.2開始支持 JDBC等,也可以對已有 RDD 增加 Schema 的方式獲得。 當前 Spark SQL 使用 Catalyst 優化器對 SQL 語句進行優化,從而得到更好的
相關文章
相關標籤/搜索