大數據MapReduce總結

MapReduce簡介 MapReduce定義: Hadoop MapReduce是一個軟件框架,基於該框架能夠容易地編寫應用程序,這些應用程序能夠運行在由上千個商用機器組成的大集羣上,並以一種可靠的,具有容錯能力的方式並行地處理上TB級別的海量數據集。 MapReduce主要思想: 分久必合 MapReduce兩個階段: Map端、Reduce端 MapReduce核心思想:「相同」的key爲一
相關文章
相關標籤/搜索