SparkSQL簡介

1、SparkSQL的發展歷程 1.1 Hive and Shark SparkSQL的前身是Shark,給熟悉RDBMS但又不理解MapReduce的技術人員提供快速上手的工具,Hive應運而生,它是當時唯一運行在Hadoop上的SQL-on-Hadoop工具。但是MapReduce計算過程中大量的中間磁盤落地過程消耗了大量的I/O,降低的運行效率,爲了提高SQL-on-Hadoop的效率,大量
相關文章
相關標籤/搜索