Spark系列--SparkCore(三)RDD基本操做

前言 RDD的基本操做分爲兩種,一種是轉換Transformation,一種是行動Actionweb RDD中的全部轉換都是延遲加載的,也就是說,它們並不會直接計算結果。相反的,它們只是記住這些應用到基礎數據集(例如一個文件)上的轉換動做。只有當發生一個要求返回結果給Driver的動做時,這些轉換纔會真正運行。這種設計讓Spark更加有效率地運行。shell 各算子的詳細代碼示例,參考以下: Sp
相關文章
相關標籤/搜索