第1章 Spark SQL概述

1、什麼是Spark SQL Spark SQL是Spark用來處理結構化數據的一個模塊,它提供了2個編程抽象:DataFrame和DataSet,並且作爲分佈式SQL查詢引擎的作用。 我們已經學習了Hive,它是將Hive SQL轉換成MapReduce然後提交到集羣上執行,大大簡化了編寫MapReduc的程序的複雜性,由於MapReduce這種計算模型執行效率比較慢。所有Spark SQL的應
相關文章
相關標籤/搜索