Spark-Shuffle機制詳解

Shuffle機制詳解 什麼是Shuffle? shuffle中文翻譯爲洗牌,需要shuffle的關鍵性原因是某種具有共同特徵的數據需要最終匯聚到一個計算節點上進行計算。   發生在map方法之後,reduce方法之前。 Shuffle一般包含兩階段任務: 第一階段:產生shuffle數據的階段(map階段)        補充:是ShuffleManager中的getWriter來寫數據(數據可
相關文章
相關標籤/搜索