Spark核心RDD及相關算子

目錄 1. RDD是什麼 2. RDD的五大屬性 3.RDD圖及相關理解  4.RDD的創建方式(共三種) 5.RDD的算子分類 6.cache ,persist ,checkpoint 區別 1. RDD是什麼 RDD(Resilient Distributed Dataset)叫做彈性分佈式數據集,是Spark中最基本的數據抽象,它代表一個不可變、可分區、裏面的元素可並行計算的集合。 Data
相關文章
相關標籤/搜索