Spark經常使用函數講解之鍵值RDD轉換

摘要: RDD:彈性分佈式數據集,是一種特殊集合 ‚ 支持多種來源 ‚ 有容錯機制 ‚ 能夠被緩存 ‚ 支持並行操做,一個RDD表明一個分區裏的數據集 RDD有兩種操做算子:html         Transformation(轉換):Transformation屬於延遲計算,當一個RDD轉換成另外一個RDD時並無當即進行轉換,僅僅是記住       了數據集的邏輯操做          Ati
相關文章
相關標籤/搜索