大數據--MapReduce學習筆記

一、MapReduce簡介 MapReduce:2004年 Google paper中提出。 一個用於分佈式數據處理的編程模型和運行環境。適合處理各種結構化和非結構化的數據。 HDFS(hadoop 分佈式文件系統)是MapReduce的基礎。 分佈式系統的設計原則 moving computation is more cheaper than moving data。(現場辦公) Map 示例:
相關文章
相關標籤/搜索