Hadoop之MapReduce架構

一、MapReduce簡介 MapReduce是一種分佈式計算模型,是Google提出的,主要用於搜索領域,解決海量數據的計算問題。 MR有兩個階段組成:Map和Reduce,用戶只需實現map()和reduce()兩個函數,即可實現分佈式計算。 MapReduce計算模型主要由三個階段構成:Map、Shuffle(不需要我們操作,框架已實現)、Reduce。Map是映射,負責數據的過濾分類,將原
相關文章
相關標籤/搜索