Apache SparkSQL 數據抽象

Spark SQL數據抽象 DataFrame DataFrame是一種以RDD爲基礎的帶有Schema元信息的分佈式數據集 類似於傳統數據庫的二維表格 。 DataSet DataSet是保存了更多的描述信息,類型信息的分佈式數據集。 與RDD相比,保存了更多的描述信息,概念上等同於關係型數據庫中的二維表。 與DataFrame相比,保存了類型信息,是強類型的,提供了編譯時類型檢查, 調用Dat
相關文章
相關標籤/搜索