大數據總結【第七章：MapReduce】

時間 2020-06-11

原文原文鏈接

簡答 MapReduce模型簡介 MapReduce將複雜的、運行於大規模集羣上的並行計算過程高度地抽象到了兩個函數：Map和Reduce 編程容易，不須要掌握分佈式並行編程細節，也能夠很容易把本身的程序運行在分佈式系統上，完成海量數據的計算 MapReduce採用「分而治之」策略，一個存儲在分佈式文件系統中的大規模數據集，會被切分紅許多獨立的分片（split），這些分片能夠被多個Map任務並行處

>>阅读原文<<