SparkSQL簡介及入門

SparkSQL簡介及入門 一、概述     Spark爲結構化數據處理引入了一個稱爲Spark SQL的編程模塊。它提供了一個稱爲DataFrame(數據框)的編程抽象,DF的底層仍然是RDD,並且可以充當分佈式SQL查詢引擎。 1、SparkSQL的由來     SparkSQL的前身是Shark。在Hadoop發展過程中,爲了給熟悉RDBMS但又不理解MapReduce的技術人員提供快速上手
相關文章
相關標籤/搜索