spark相關面試題

spark面試問題收集 spark面試問題 一、spark中的RDD是什麼,有哪些特性 RDD(Resilient Distributed Dataset)叫作分佈式數據集,是Spark中最基本的數據抽象,它表明一個不可變、可分區、裏面的元素可並行計算的集合。 Dataset:就是一個集合,用於存放數據的 Distributed:分佈式,能夠並行在集羣計算 Resilient:表示彈性的 彈性表示
相關文章
相關標籤/搜索