Spark 持久化(cache和persist的區別)

個人原創地址:https://dongkelun.com/2018/06/03/sparkCacheAndPersist/java 一、RDD 持久化 Spark 中一個很重要的能力是將數據持久化(或稱爲緩存),在多個操做間均可以訪問這些持久化的數據。當持久化一個 RDD 時,每一個節點的其它分區均可以使用 RDD 在內存中進行計算,在該數據上的其餘 action 操做將直接使用內存中的數據。這樣
相關文章
相關標籤/搜索