分佈式處理之 MapReduce

方法介紹 MapReduce 是一種計算模型,簡單的說就是將大批量的工作(數據)分解(map)執行,然後再將結果合併成最終結果(reduce)。這樣做的好處是可以在任務被分解後,通過大量機器進行分佈式並行計算,減少整個操作的時間。也就是說,MapReduce 的原理就是一個歸併排序。 它的適用範圍爲數據量大,但是數據種類小可以放入內存的場景。基本原理及要點是將數據交給不同的機器去處理,數據劃分,結
相關文章
相關標籤/搜索