spark性能優化----緩存清除

spark是一款優秀的框架,計算性能至關優異,已經發展成大數據主流計算引擎,在spark開發過程當中有不少優化的點。其中去除重複計算是很是重要的。通常操做調用cache/persist,來緩存中間結果,避免重複計算。其中cache是persist的一個特列(cache至關於persist())。persist擁如下幾個級別的緩存:程序員 NONE 默認配置(不緩存) DISK_ONLY 數據緩存到
相關文章
相關標籤/搜索