MapReduce理論筆記

一 介紹 MapReduce是一個用於處理海量數據的分佈式計算框架這個框架解決了: (1) 數據分佈式存儲 (2) 作用調度 (3) 容錯 (4) 機器間通信等複雜問題   MapReduce只負責數據計算,不負責存儲,數據是存儲在HDFS上,因爲HDFS: 系統可靠、可擴展、可併發處理   MapReduce 採用多進程的併發方式,優點:多進程的併發方式這種模型便於每個任務佔用資源進行控制調配,
相關文章
相關標籤/搜索