MapReduce

  參考資料:html

  1. "MapReduce: Simplified Data Processing on Large Clusters" by Den & Ghemawat, 2004git

  2. 上邊論文的中文版:http://www.cnblogs.com/fuzhe1989/p/3413457.html程序員

  3. C++ MapReducegithub

  4. 用通俗易懂的大白話講解Map/Reduce原理編程

  5. 用通俗易懂的話說下hadoop是什麼,能作什麼分佈式

 

  

  知識點:oop

  ● MapReduce是一種編程模型,是關於處理和產生大數據集的一種實現。Map(映射)方法用來處理鍵/值對,並生成中間鍵/值對集。Reduce(歸約)方法整合全部擁有相同中間鍵的中間值。按照這種方式寫出的程序會自動並行,運行在一個大的商業計算機集羣上。運行時系統負責具體的輸入數據的劃分、在大集羣中的計算機上的程序的執行調度、計算機運行失敗的處理以及對所中間計算機通訊進行管理。所以,這不要求程序員擁有並行和分佈式系統的經驗,就能容易地使用一個大的分佈式系統中的資源。大數據

相關文章
相關標籤/搜索