深入理解 MapReduce 過程 (針對新人)

背景 看了網上的教程,很多用的是這個WordCount的圖,我無力吐槽,並不是說這個圖不對,只是覺得站在新手的角度上來說: 最核心的Shuffle過程,這個圖沒有講。 Reduce過程有4個,容易讓新手以爲Reduce的數量和單詞有關。 分析: 下面的圖更細緻一些,但是還是有對新手不瞭解的地方,我用最平實的語言來敘述。 還是統計單詞,例如統計《莎士比亞全集》。 第一階段 split: 假設這個文件
相關文章
相關標籤/搜索