RDD、DataFrame、DataSet對比與相互轉換

RDD (Spark1.0) —> Dataframe(Spark1.3) —> Dataset(Spark1.6)  三者的共性 1、RDD、DataFrame、Dataset 全都是 spark 平臺下的分佈式彈性數據集,爲處理超大型數據提供便利 2、三者都有惰性機制,在進行創建、轉換,如 map 方法時,不會立即執行,只有在遇到 Action 如 foreach 時,三者纔會開始遍歷運算。
相關文章
相關標籤/搜索