大話Spark(4)-一文理解MapReduce Shuffle和Spark Shuffle

Shuffle本意是 混洗, 洗牌的意思, 在MapReduce過程中需要各節點上同一類數據彙集到某一節點進行計算,把這些分佈在不同節點的數據按照一定的規則聚集到一起的過程成爲Shuffle. 在Hadoop的MapReduce框架中, Shuffle是連接Map和Reduce之間的橋樑, Map的數據要用到Reduce中必須經過Shuffle這個環節. 由於Shuffle涉及到磁盤的讀寫和網絡的
相關文章
相關標籤/搜索