spark RDD編程

RDD,也就是 彈性分佈式數據集 的簡稱,它是spark處理的分佈式元素集合。 對於RDD的操作包括: 創建RDD(從外部數據或者內存中的數據),轉化RDD(利用篩選條件等),調用RDD操作求值。 **注意:RDD的操作分爲兩種:一種是 「轉化操作」,這種操作相當於只是定義了RDD,例如從一個RDD篩選出另一個RDD。轉化操作的特點就是:返回結果仍然是一個RDD對象,轉化操作並不會立刻執行,而是會
相關文章
相關標籤/搜索