Hadoop入門——MapReduce

  (1)簡介 MapReduce是一種分佈式計算模型,由Google提出,主要用於搜索領域,解決海量數據的計算問題. MR由兩個階段組成:Map和Reduce,用戶只需要實現map()和reduce()兩個函數,即可實現分佈式計算,非常簡單。 這兩個函數的形參是key、value對,表示函數的輸入信息。 (2)原理   (3)執行步驟 1. map任務處理 1.1 讀取輸入文件內容,解析成key
相關文章
相關標籤/搜索