跟天齊老師學Spark(6)--Spark的經常使用算子介紹

spark的經常使用算子介紹: Resilient(彈性且可復原) Distributed(分佈式) Datasets(數據集) (RDDs) 咱們之前學的scala的原生方法都是數組或者集合上定義的,它只能操做單機。 而spark中的方法都是定義在RDD上的,它們操做的是集羣。 spark的方法有兩類操做: 一種是:Transformations,它是lazy的,不會觸發任務的執行,是一種轉換
相關文章
相關標籤/搜索