MapReduce原理簡介

一、MapReduce是什麼 MapReduce是一種分佈式計算框架 ,以一種可靠的,具有容錯能力的方式並行地處理上TB級別的海量數據集。主要用於搜索領域,解決海量數據的計算問題。 MR有兩個階段組成:Map和Reduce,用戶只需實現map()和reduce()兩個函數,即可實現分佈式計算。 二、MapReduce做什麼 MapReduce框架由Map和Reduce組成。 Map()負責把一個大
相關文章
相關標籤/搜索