MapReduce的原理及執行過程

MapReduce簡介 1.MapReduce是一種分佈式計算模型,是Google提出的,主要用於搜索領域,解決海量數據的計算問題。 2.MR由兩個階段組成:Map和Reduce,用戶只需實現map()和reduce()兩個函數,便可實現分佈式計算。 MapReduce執行流程 MapReduce原理 MapReduce的執行步驟: 1.Map任務處理 1.1讀取HDFS中的文件。每一行解析成一個
相關文章
相關標籤/搜索