Spark部分:RDD的五大特性【大數據開發面試】

Spark核心RDD         1).RDD(Resilient Distributed Dateset),彈性分佈式數據集。Spark底層操作數據都是基於RDD。         2).RDD五大特性:             a).RDD由一系列Partition組成。             b).函數(算子)是作用在partition上的。             c).RDD之間有
相關文章
相關標籤/搜索