走進Spark SQL

從Shark說起: Shark即Hive on Spark,爲了實現與Hive兼容,Shark在HiveQL方面重用了Hive中HiveQL的解析、邏輯執行計劃翻譯、執行計劃優化等邏輯,可以近似認爲僅將物理執行計劃從MapReduce作業替換成了Spark作業,通過Hive的HiveQL解析,把HiveQL翻譯成Spark上的RDD操作。Shark的出現,使得SQL-on-Hadoop的性能比Hi
相關文章
相關標籤/搜索