Spark系列3 - Spark SQL

1 從Shark到Spark SQL Spark SQL的前生是Shark,即Hive on Spark。Shark本質是通過Hive的HQL進行解析,將HiveQL翻譯成Spark上對應的RDD操作,然後通過Hive的Metadata獲取數據數據庫裏的元數據,並根據元數據從HDFS上讀取文件,最後由Shark將獲取的數據放到Spark上運算。 Shark提供了類似Hive的功能,區別是Hive將
相關文章
相關標籤/搜索