Spark系列二: RDD編程

Spark系列一: 介紹及入門   Spark對數據對核心抽象----彈性分佈式數據集(Resilient Distributed Dataset,簡稱RDD) RDD其實就是分佈式對元素集合。 一個不可變對分佈式對象集合,每個RDD都被分爲多個分區,這些分區運行在集羣的不同節點上。 在Sprak中,對數據對所有操作不外乎:創建RDD,轉化已有RDD,調用RDD操作進行求值。 在一切對背後,Spa
相關文章
相關標籤/搜索