Shark簡介、部署及編譯小結

Shark簡介html Shark即Hive on Spark,本質上是經過Hive的HQL解析,把HQL翻譯成Spark上的RDD操做,而後經過Hive的metadata獲取數據庫裏的表信息,實際HDFS上的數據和文件,會由Shark獲取並放到Spark上運算。Shark的特色就是快,徹底兼容Hive,且能夠在shell模式下使用rdd2sql()這樣的API,把HQL獲得的結果集,繼續在sca
相關文章
相關標籤/搜索