MapReduce計算框架各個步驟詳解（主要是Shuffle）

時間 2021-01-12

標籤大數據 hadoop 分佈式計算 mapreduce hdfs 欄目 Hadoop 简体版

原文原文鏈接

Hadoop的分佈式計算框架（MapReduce）-- 適合離線計算核心思想：移動計算而不移動數據。 MR是計算來自HDFS上的數據，可以看到，HDFS是大數據的存儲，MR是大數據的計算。 MapReduce流程：input->Splitting->Mapping->Shuffling->Reducing-> result MapReduce程序讀取的數據，都是存儲在HDFS的數據，最後的結果

>>阅读原文<<