Spark中RDD的理解,以及RDD與DataFormat、DataSet間的關係

## 三者轉換關係 什麼是RDD RDD(Resilient Distributed Dataset)叫做彈性分佈式數據集,是Spark中最基本的數據抽象。 在代碼中是一個抽象類,它代表一個彈性的、不可變、可分區、裏面的元素可並行計算的集合。RDD支持兩種類型的操作,轉化操作(transform)和行動操作(action)。 一個 RDD 可以簡單的理解爲一個分佈式的元素集合. RDD 表示只讀的
相關文章
相關標籤/搜索