Mapreduce分佈式編程

一、本質 MapReduce是一個基於分治思想,用於處理海量數據的分佈式計算框架。  Mapreduce框架的主要程序分爲三種即Master,Map和Reduce 二、mapreduce解決了什麼問題 1.數據分佈式存儲-HDFS 2.作業調度 3.容錯 4.機器間通信等複雜問題 三、分佈式計算vs單機計算 四、MapReduce執行流程 1.四個階段 Input到map: ①file:HDFS中
相關文章
相關標籤/搜索