Spark 的transformation和action操作

1.前言: RDD:彈性分佈式數據集,是一種特殊集合、支持多種來源、有容錯機制、可以被緩存、支持並行操作,一個RDD代表多個分區裏的數據集 RDD有兩種操作算子: Transformation(轉換):Transformation屬於延遲計算,當一個RDD轉換成另一個RDD時並沒有立即進行轉換,僅僅是記住了數據集的邏輯操作 Action(執行):觸發Spark作業的運行,真正觸發轉換算子的計算 2
相關文章
相關標籤/搜索