Spark常問面試點總結

一、彈性分佈式數據集(RDD) 1、RDD介紹 簡介:(存放數據的集合,數據是分佈式存儲的,可以保存在內存或磁盤中。是spark中最基本的數據抽象) RDD(Resilient Distributed Dataset)彈性分佈式數據集。 Resilient: 彈性的(可保存在內存或磁盤) Distributed:數據是分佈式存儲的,便於分佈式計算 Dataset: 一個集合,存放數據的 2、RDD
相關文章
相關標籤/搜索