Spark 算子

==> RDD是什麼?     ---> RDD(Resilient Distributed Dataset) 彈性分佈式數據集 , 是 Spark 中最基本的數據抽象,它代表一個不可變,可分區,裏面的元素可並行計算的集合     ---> 特點:         ---- 自動容錯         ---- 位置感知性高度         ---- 可伸縮性         ---- 允許用戶在
相關文章
相關標籤/搜索