關於spark中cache和廣播變量的區別

RDD分爲多個分區。這些分區自己充當整個RDD的不可變子集。當Spark執行圖的每一個階段時,每一個分區都會被髮送給一個工做在該數據子集上的工做者。反過來,若是RDD須要從新迭代,每一個工做人員能夠緩存數據。html 廣播變量用於向每一個工做人員發送一次不可變狀態。當你想要一個變量的本地副本時使用它們。程序員 這兩個操做彼此徹底不一樣,每一個操做表明一個不一樣問題的解決方案。算法 當持久化 RDD
相關文章
相關標籤/搜索