MapReduce shuffle原理

Hadoop是一個開發和運行處理大規模數據的軟件平臺,是Apache的一個用java語言實現開源軟件框架,實現在大量計算機組成的集羣中對海量數據進行分佈式計算。Hadoop框架中最核心設計就是:MapReduce和HDFS。MapReduce提供了對數據的計算,HDFS提供了海量數據的存儲。 MapReduce MapReduce的思想是由Google的一篇論文所提及而被廣爲流傳的,簡單的一句話解
相關文章
相關標籤/搜索