spark筆記之DataFrame

1.1. 什麼是DataFrame DataFrame的前身是SchemaRDD,從Spark 1.3.0開始SchemaRDD更名爲DataFrame。與SchemaRDD的主要區別是:DataFrame不再直接繼承自RDD,而是自己實現了RDD的絕大多數功能。你仍舊可以在DataFrame上調用rdd方法將其轉換爲一個RDD。 在Spark中,DataFrame是一種以RDD爲基礎的分佈式數據
相關文章
相關標籤/搜索