Resilient Distributed Dataset的一些小回顧

Resilient Distributed Dataset 理解什麼是RDD RDD:彈性分佈式數據集,RDD其實就是分佈式的元素集合,是一個不可變的分佈式對象集合 引用自Spark快速大數據分析-P21 惰性計算模式 Spark採用的是惰性計算模式,RDD只有第一次在行動操作中用到的時候,纔會真正的計算.Spark可以優化整個 計算過程.默認情況下,Spark的RDD會在你每次對它們進行行動操作
相關文章
相關標籤/搜索