Spark之RDD的概念及其五大特性

  RDD,彈性分佈式數據集,是spark的底層數據結構。RDD是一個容錯的,能夠被並行操做的數據集合。RDD的特色之一是分佈式存儲,它的好處就是數據存儲在不一樣的節點上,當須要數據進行計算的時候能夠在這些節點上並行操做。彈性表如今節點在存儲RDD數據的時候,既能夠存儲在內存中,也能夠存儲在磁盤上,也能夠二者結合使用。RDD還有個特色就是延遲計算,當是transformation算子的時候,並不執
相關文章
相關標籤/搜索