Spark總結(SparkSQL)

  什麼是SaparkSQL? SaprkSQL是spark用來處理結構化數據的一個模塊,它提供了一個編程抽象叫做DataSet並且作爲分佈式SQL查詢引擎的作用。   SparkSQL的由來 我們學過Hive,它是將Hive SQL轉化爲MapReduce然後提交集羣上去運行,大大簡化了編寫MapReduce的程序的複雜性,但是由於計算的時候效率比較慢。所以SparkSql應運而生(剛開始的時候
相關文章
相關標籤/搜索