Spark-SQL概述、特點|DataFrame簡介|DataSet簡介|SparkSession

Spark-SQL Spark SQL是Spark用於結構化數據(structured data)處理的Spark模塊。 與基本的Spark RDD API不同,Spark SQL的抽象數據類型爲Spark提供了關於數據結構和正在執行的計算的更多信息。 在內部,Spark SQL使用這些額外的信息去做一些額外的優化,有多種方式與Spark SQL進行交互,比如: SQL和DatasetAPI。 當
相關文章
相關標籤/搜索