RDD基本操做

定義 RDD是彈性分佈式數據集(Resilient Distributed Dataset), RDD 其實就是分佈式的元素集合。就像List,Array,Set,Map集合。在 Spark 中,對數據的全部操做不外乎建立 RDD、 轉化已有 RDD 以及調用 RDD 操做進行求值。而在這一切背後, Spark 會自動將RDD中的數據分發到集羣上,並將操做並行化執行。java 用戶可使用兩種方法建
相關文章
相關標籤/搜索