Spark2.x學習筆記(轉載)

Spark2.x學習筆記:1四、 Spark SQL程序設計 14.1 RDD的侷限性 RDD僅表示數據集,RDD沒有元數據,也就是說沒有字段語義定義。 RDD須要用戶本身優化程序,對程序員要求較高。 從不一樣數據源讀取數據相對困難。 合併多個數據源中的數據也較困難。 14.2 DataFrame和Dataset (1)DataFrame 因爲RDD的侷限性,Spark產生了DataFrame。
相關文章
相關標籤/搜索