Spark之RDD

Spark之RDD RDD的概述: 1.1什麼是RDD RDD(Ressilient Distributed Dataset)名爲彈性(容錯)分佈式數據集,是一個邏輯上的概念,實際上沒有數據,是Spark中最基本的數據抽象。它代表一個不可變,可分區,元素能夠用於並行計算的的集合。該類包含所有rdd上可用的基本操作,如:」map」, 」filter」****。 什麼是彈性: \1. RDD可以再內存
相關文章
相關標籤/搜索