關於SparkSQL那些事(一)

SparkSQL概述 Spark爲數據化出力引入了一個稱爲SparkSql的編程模塊。它提供了DataFrame的編程抽象,並且可以充當分佈式SQL查詢引擎。 SparkSQL的前身是Shark。它是伯克利實驗室Spark生態環境的組件之一,它基於hive做了一些改進,比如引入煥春管理,改進和優化執行器等,並使之能夠運行在spark引擎上,雖然使得sql的查詢速度得到大幅度提升,但是它對於hive
相關文章
相關標籤/搜索