Spark2.x基礎學習之RDD理解

一、RDD介紹 RDD:Resilient Distributed Datasets彈性分佈式數據集——對於內存集羣運算(In-Memory Cluster Computing)的一個容錯(Fault-Tolerant)抽象 Spark是一個函數式編程的範例(functional programming paradigm),函數式編程的一個關鍵概念是不變的(immutable)對象,RDD也是一個
相關文章
相關標籤/搜索