spark(二) rdd具體介紹

spark(二) rdd具體介紹 看完這篇 你可以學到一下內容 1:掌握RDD的原理 2:熟練使用RDD的算子完成計算任務 3:掌握RDD的寬窄依賴 4:掌握RDD的緩存機制 5:掌握劃分stage 6:掌握spark的任務調度流程 rdd是什麼呢? RDD(Resilient Distributed Dataset)叫做彈性分佈式數據集,是Spark中最基本的數據抽象,它代表一個不可變、可分區、
相關文章
相關標籤/搜索