【Spark】sparkSQL中cache的若干問題

摘要 sparkSQL在使用cache緩存的時候,有時候緩存可能不起作用,可能會發出緩存是假的吧的感慨。現在我們就把這個問題說道說道。 問題 場景描述 當我們通過spark進行統計和處理數據時,發現他是延遲計算的,如果一個應用中出現多個action,而這多個action處理同一個數據源數據時,數據源用時間來過濾數據時,由於有多個action操作,遇到每個action就是一個job,每一個actio
相關文章
相關標籤/搜索