spark中的RDD是什麼,有哪些特性

RDD(Resilient Distributed Dataset)叫作分佈式數據集,是Spark中最基本的數據抽象,它表明一個不可變、可分區、裏面的元素可並行計算的集合。分佈式 Dataset:就是一個集合,用於存放數據的函數 Distributed:分佈式,能夠並行在集羣計算內存 Resilient:表示彈性的ci 彈性表示hash 一、RDD中的數據能夠存儲在內存或者是磁盤it ​ *RDD
相關文章
相關標籤/搜索