Hadoop-MapReduce粗略理解(一)

本文不做任何商業用途,僅僅用於知識分享。如有侵權行爲,請聯繫我謝謝。 通過閱讀書籍查閱相關資料總結得出 本人片面理解: map 相當於數據準備階段,主要負責從HDFS中讀取分塊,因爲每個分塊的大小近乎相等,所以通過集羣調度任務將數據採集到map中。實現讀取效率最大化 reduce。處理各個節點上map的值(利用網絡傳輸)傳輸到reduce節點。由reduce 完成 聚合,排序等一系列處理。最終寫入
相關文章
相關標籤/搜索