Spark學習-一文了解RDD

什麼是RDD RDD(Resilient Distributed Dataset)彈性分佈式數據集,RDD從字面理解,分爲三個層面:彈性、分佈式、數據集。web RDD是一種數據集,是Spark對於要處理的數據的抽象,就像Java等高級編程語言中的List、HashMap等集合;編程 分佈式是由於咱們一般是以集羣形式進行分佈式計算,RDD中的數據並不是存在一個節點,而是分佈於集羣各個節點,便於調用
相關文章
相關標籤/搜索