spark從入門到放棄二十一:Spark 性能優化(4)對多次使用的RDD進行持久化或者checkpoint

文章地址:http://www.haha174.top/article/details/254892 如圖在這裏可以很清楚的看到對一個RDD前後進行了兩次操作。在第一次的時候先計算出一個RDD然後計算出第二個RDD繼續往後計算。 但是對第二次RDD操作在執行的時候,由於RDD數據在執行完成之後很有可能會被立即丟棄那麼這個時候就需要重新計算第一個和第二個RDD了 我們可以把第二個RDD的計算結果進行
相關文章
相關標籤/搜索