Spark的認識(二)

Spark的認識(二) 1、主要內容 1、掌握RDD底層原理 2、掌握RDD常用的算子操作 3、掌握RDD的依賴關係 4、掌握RDD的緩存機制 5、掌握劃分stage 6、掌握spark任務調度流程 2、RDD概述 2.1 RDD是什麼 RDD(Resilient Distributed Dataset)叫做彈性分佈式數據集,是Spark中最基本的數據抽象,它代表一個不可變、可分區、裏面的元素可並
相關文章
相關標籤/搜索