Hadoop的初步理解

1、總體思惟導圖

Hadoop

2、HDFS(Hadoop分佈式文件系統)

MapReduce

說明分佈式

  1. NameNode:保存整個文件系統的目錄信息、文件信息及分塊信息,這是由惟一一臺主機專門保存,固然這臺主機若是出錯,NameNode就失效了。在Hadoop2.*開始支持activity-standy模式----若是主NameNode失效,啓動備用主機運行NameNode。
  2. DataNode:分佈在廉價的計算機上,用於存儲Block塊文件。
  3. Block:將一個文件進行分塊,一般是64M。

3、MapReduce

HDFS

說明oop

首先數字是分佈存儲在不一樣塊中的,以某幾個塊爲一個Map,計算出Map中最大的值,而後將每一個Map中的最大值作Reduce操做,Reduce再取最大值給用戶。blog

相關文章
相關標籤/搜索