Spark面試問題收集

Spark面試問題 spark面試問題 1、spark中的RDD是什麼,有哪些特性 RDD(Resilient Distributed Dataset)叫做分佈式數據集,是Spark中最基本的數據抽象,它代表一個不可變、可分區、裏面的元素可並行計算的集合。 Dataset:就是一個集合,用於存放數據的 Distributed:分佈式,可以並行在集羣計算 Resilient:表示彈性的 彈性表示 1
相關文章
相關標籤/搜索