SparkSQL--基礎知識點

什麼是SparkSQL SparkSQL是Spark用於處理結構化數據的一個模塊,他將數據抽象爲DataFrame和DataSet,並且SparkSQL也是OLAP數據引擎。 Hive將SQL轉換爲MR提交給集羣執行,那麼SparkSQL就將SQL轉換爲RDD提交給集羣執行。 SparkSQL兼容HiveQL。 什麼是DataFrame DataFrame和RDD類似,都是一個用來存儲數據的集合,
相關文章
相關標籤/搜索