SparkSql:數據抽象(DataFrame與DataSet詳解)

DataFrame 什麼是DataFrame DataFrame是一種以RDD爲基礎的帶有Schema元信息的分佈式數據集,類似於傳統數據庫的二維表格 。 DataSet 什麼是DataSet DataSet是保存了更多的描述信息,類型信息的分佈式數據集。 與RDD相比,保存了更多的描述信息,概念上等同於關係型數據庫中的二維表。 與DataFrame相比,保存了類型信息,是強類型的,提供了編譯時類
相關文章
相關標籤/搜索