Hadoop Shuffle運行原理

Shuffle hadoop的核心思想是MapReduce,而MapReduce的核心思想又是Shuffle。shuffle的主要工作是從Map結束到Reduce開始之間的過程,所以瞭解shuffle的運行原理也是必要的階段。首先來看下面一張圖。 shuffle階段又可以分爲Map端的shuffle和Reduce端的shuffle。 Map階段的Shuffle 1、map端(有多個map,這裏只詳
相關文章
相關標籤/搜索