分佈式MapReduce原理詳解

MapReduce原理 一、什麼是MapReduce?        MapReduce是一個基於 java 的並行分佈式計算框架,使用它來編寫的數據處理應用可以運行在大型的商用硬件集羣上來處理大型數據集中的可並行化問題,數據處理可以發生在存儲在文件系統(非結構化)或數據庫(結構化)中的數據上。MapReduce 可以利用數據的位置,在存儲的位置附近處理數據,以最大限度地減少通信開銷。      
相關文章
相關標籤/搜索