Spark核心編程-RDD持久化詳解

1、不使用RDD持久化 2、使用RDD持久化 3、持久化對於性能調優的原則 儘可能去複用RDD,差很少的RDD,能夠抽取稱爲一個共同的RDD,供後面的RDD計算時,反覆使用。 公共RDD必定要實現持久化,對於要屢次計算和使用的公共RDD,必定要進行持久化。 持久化,也就是說,將RDD的數據緩存到內存中/磁盤中,之後不管對這個RDD作多少次計算,都是直接取這個RDD的持久化的數據,好比從內存中或者磁
相關文章
相關標籤/搜索