大數據Spark企業級實戰版【學習筆記】----Spark Shark& Spark SQL

4. Spark Shark        Shark即Hive on Spark,本質上是通過Hive的HQL解析,Shark在Spark1.0.0由於整合度和性能等原因,已被Spark官方團隊停止開發。Shark在實現上是把HQL翻譯成Spark上的RDD操作,然後通過Hive的metadata獲取數據庫裏的表信息,Shark獲取HDFS上的數據和文件並放到Spark上運算。Shark的最大特
相關文章
相關標籤/搜索