Spark中cache和persist的做用以及存儲級別

在Spark中有時候咱們不少地方都會用到同一個RDD, 按照常規的作法的話,那麼每一個地方遇到Action操做的時候都會對同一個算子計算屢次,這樣會形成效率低下的問題html 例如:python val rdd1 = sc.textFile("xxx") rdd1.xxxxx.xxxx.collect rdd1.xxx.xxcollect 上面就是兩個代碼都用到了rdd1這個RDD,若是程序執行的
相關文章
相關標籤/搜索