RDD和DataFrame的區別

spark3.0版本可能不太公佈底層的RDD,以後使用dataframe將成爲趨勢,現在大都數公司也多使用dataframe來處理數據 RDD、DataFrame和DataSet是容易產生混淆的概念,必須對其相互之間對比,纔可以知道其中異同。 RDD和DF的區別 上圖直觀地體現了DataFrame和RDD的區別。左側的RDD[Person]雖然以Person爲類型參數,但Spark框架本身不瞭解P
相關文章
相關標籤/搜索