Spark中RDD 持久化操做 cache與persist區別

環境/背景 Spark 2.3.0 Scala 2.11 Java 1.8java 在進行RDD操做的時候,咱們須要在接下來多個行動中重用同一個RDD,這個時候咱們就能夠將RDD緩存起來,能夠很大程度的節省計算和程序運行時間。node 接下來能夠經過查看Spark的源碼對比RDD.cache()與RDD.persist()的差異。web cache 與 persist 對比 首先從JavaRDD類
相關文章
相關標籤/搜索