走近RDD

  RDD(Resilient Distributed Datasets)彈性分佈式數據集。RDD可以看成是一個簡單的"數組",對其進行操作也只需要調用有限的"數組"中的方法即可,但它與一般數組的區別在於:RDD是分佈式存儲,可以跟好的利用現有的雲數據平臺,並在內存中進行。此處的彈性指的是數據的存儲方式,及數據在節點中進行存儲的時候,既可以使用內存也可以使用磁盤。此外,RDD還具有很強的容錯性,在
相關文章
相關標籤/搜索