Spark常用算子總結

Spark的算子的分類    從大方向來說,Spark 算子大致可以分爲以下兩類:      1)Transformation 變換/轉換算子:這種變換並不觸發提交作業,完成作業中間過程處理。      Transformation 操作是延遲計算的,也就是說從一個RDD 轉換生成另一個 RDD 的轉換操作不是馬上執行,需要等到有 Action 操作的時候纔會真正觸發運算。      2)Acti
相關文章
相關標籤/搜索