Spark深刻解析(四):SparkCore之RDD概述

學習目標 什麼是RDD RDD的主要屬性 小結!!! RDD的特色 什麼是RDD RDD(Resilient Distributed Dataset)叫作彈性分佈式數據集,是Spark中最基本的數據抽象。代碼中是一個抽象類,它表明一個不可變、可分區、裏面的元素可並行計算的集合。web 彈性分佈式數據集(保存在內存中)算法 彈性:RDD中的數據能夠保存在內存中或者磁盤裏面。 分佈式:分佈式存儲的,能
相關文章
相關標籤/搜索