參考資料:html
1. "MapReduce: Simplified Data Processing on Large Clusters" by Den & Ghemawat, 2004git
2. 上邊論文的中文版:http://www.cnblogs.com/fuzhe1989/p/3413457.html程序員
3. C++ MapReduce庫github
5. 用通俗易懂的話說下hadoop是什麼,能作什麼分佈式
知識點:oop
● MapReduce是一種編程模型,是關於處理和產生大數據集的一種實現。Map(映射)方法用來處理鍵/值對,並生成中間鍵/值對集。Reduce(歸約)方法整合全部擁有相同中間鍵的中間值。按照這種方式寫出的程序會自動並行,運行在一個大的商業計算機集羣上。運行時系統負責具體的輸入數據的劃分、在大集羣中的計算機上的程序的執行調度、計算機運行失敗的處理以及對所中間計算機通訊進行管理。所以,這不要求程序員擁有並行和分佈式系統的經驗,就能容易地使用一個大的分佈式系統中的資源。大數據