RDD和DataFrame的區別

結構信息: 左側的RDD[Person]雖然以Person爲類型參數,但Spark框架本身不瞭解Person類的內部結構。而右側的DataFrame卻提供了詳細的結構信息 提升執行效率 RDD API是函數式的,強調不變性,在大部分場景下傾向於創建新對象而不是修改老對象。這一特點雖然帶來了乾淨整潔的API,卻也使得Spark應用程序在運行期傾向於創建大量臨時對象 參考: https://www.j
相關文章
相關標籤/搜索