Spark性能優化總結

總結一下我的看了一些Spark性能調優文章以後的理解,主要框架來自於meituantech,會在此框架上加入我的關注點,目錄以下,html 0. Overview 1. 開發調優 - 避免建立重複的RDD - 儘量複用同一個RDD - 對屢次使用的RDD進行持久化 - 儘可能避免使用shuffle類算子 - 使用map-side預聚合的shuffle操做 - 使
相關文章
相關標籤/搜索