【大數據學習】SparkSQL 之 DataFrame與RDD的區別

DataFrame與RDD的區別 看上圖,左側的RDD[Person]雖然以Person爲類型參數,但Spark框架本身不瞭解Person類的內部結構,而右側的DataFrame就不一樣了,它更像是一個二維表格,在這個二維表格裏面,有行有列。使得Spark SQL可以清楚地知道該數據集中包含哪些列,每列的名稱和類型各是什麼。DataFrame多了數據的結構信息,即不僅可以知道里面的數據,而且它還可
相關文章
相關標籤/搜索