Spark2.x學習筆記:三、 Spark核心概念RDD

Spark學習筆記:三、Spark核心概念RDD 3.1 RDD概念 彈性分佈式數據集(Resilient Distributed Datasets,RDD) ,能夠分三個層次來理解:java 數據集:故名思議,RDD 是數據集合的抽象,是複雜物理介質上存在數據的一種邏輯視圖。從外部來看,RDD 的確能夠被看待成通過封裝,帶擴展特性(如容錯性)的數據集合。 分佈式:RDD的數據可能在物理上存儲在多
相關文章
相關標籤/搜索