RDD和DataFrame和DataSet三者間的區別

RDD vs DataFrames vs DataSet 在SparkSQL中Spark爲我們提供了兩個新的抽象,分別是DataFrame和DataSet。他們和RDD有什麼區別呢?首先從版本的產生上來看: RDD (Spark1.0) —> Dataframe(Spark1.3) —> Dataset(Spark1.6) 如果同樣的數據都給到這三個數據結構,他們分別計算之後,都會給出相同的結果。
相關文章
相關標籤/搜索