理解MapReduce執行過程

1. MapReduce簡介 (1)MapReduce是一種分佈式計算模型,是Google提出的,主要用於搜索領域,解決海量數據的計算問題。 (2)MR有兩個階段組成:Map和Reduce,用戶只需實現map()和reduce()兩個函數,即可實現分佈式計算。 2. MapReduce的執行過程 上述圖示過程描述如下: 1、Map任務處理 1.1 讀取HDFS中的文件。每一行解析成一個<k,v>。
相關文章
相關標籤/搜索