Spark基礎學習(一)

Spark核心概念 – RDD(彈性分佈式數據集) 1、分佈在集羣中的只讀對象集合(由多個Partition構成) 2、可以存儲在磁盤或是內存 3、通過並行「轉換」構成 4、失效後自動重構 基本操作 transformations 1、可以通過scala集合和hadoop數據集構成新的RDD 2、通過已有的RDD產生新的RDD action 3、通過RDD計算得到一個值或是一組值
相關文章
相關標籤/搜索