Spark精選面試題一

一、spark中的RDD是什麼,有哪些特性 RDD(Resilient Distributed Dataset)叫作彈性分佈式數據集,是Spark中最基本的數據抽象,它表明一個不可變、可分區、裏面的元素可並行計算的集合。java Dataset:就是一個集合,用於存放數據的mysql Distributed:分佈式,能夠並行在集羣計算redis Resilient:表示彈性的sql 彈性表示數據庫
相關文章
相關標籤/搜索