dateSet 、rdd 和dateframe 區別

三種數據結構出現的版本順序 RDD (Spark1.0) --> Dataframe(Spark1.3) --> Dataset(Spark1.6) RDD  rdd的五大特性 這個用了很多,但是當突然被問到五大特性時,竟然一時卡殼,只記得彈性可分區和容錯 ,而血統、依賴和數據本地化並沒有歸併到特性中,重新查看資料後,發現自己錯在把rdd當成一種數據集合,   可分區列表:可以創建指定分區數目,可
相關文章
相關標籤/搜索