理解Spark的RDD算子

什麼是Spark的算子呢?說簡單一些就是Spark內部封裝了一些處理RDD數據的函數方法。   其中算子又分爲兩部分:   Transformation 與 Actions Transformation(轉換):Transformation屬於延遲計算,當一個RDD轉換成另一個RDD時並沒有立即進行轉換,僅僅是記住了數據集的邏輯操作 Action(執行):觸發Spark作業的運行,真正觸發轉換算子
相關文章
相關標籤/搜索