Spark中cache和persist的做用以及存儲級別

時間 2020-06-11

標籤 spark cache persist 以及存儲級別欄目 Spark 简体版

原文原文鏈接

在Spark中有時候咱們不少地方都會用到同一個RDD, 按照常規的作法的話,那麼每一個地方遇到Action操做的時候都會對同一個算子計算屢次,這樣會形成效率低下的問題html 例如:python val rdd1 = sc.textFile("xxx") rdd1.xxxxx.xxxx.collect rdd1.xxx.xxcollect 上面就是兩個代碼都用到了rdd1這個RDD,若是程序執行的

>>阅读原文<<