Spark學習之路【SparkSQL入門解析】

【3.2】 在SparkSQL中Spark爲我們提供了兩個新的抽象,分別是DataFrame和DataSet;他們和RDD有什麼區別呢?首先從版本的產生上來看:RDD (Spark1.0) —> Dataframe(Spark1.3) —> Dataset(Spark1.6) 如果同樣的數據都給到這三個數據結構,他們分別計算之後,都會給出相同的結果。不同是的他們的執行效率和執行方式 注意:在後期的
相關文章
相關標籤/搜索