Spark架構原理-Cache原理剖析和源碼分析

原文地址:https://blog.csdn.net/zhanglh046/article/details/78486318java Task運行的時候是要去獲取Parent的RDD對應的Partition的數據的,即它會調用RDD的iterator方法把對應的Partition的數據集給遍歷出來,而後寫入存儲,這個存儲多是磁盤或者內存,取決於StorageLevel是什麼。緩存 若是當前RDD的
相關文章
相關標籤/搜索