1、總體思惟導圖
![Hadoop Hadoop](http://static.javashuo.com/static/loading.gif)
2、HDFS(Hadoop分佈式文件系統)
![MapReduce MapReduce](http://static.javashuo.com/static/loading.gif)
說明分佈式
- NameNode:保存整個文件系統的目錄信息、文件信息及分塊信息,這是由惟一一臺主機專門保存,固然這臺主機若是出錯,NameNode就失效了。在Hadoop2.*開始支持activity-standy模式----若是主NameNode失效,啓動備用主機運行NameNode。
- DataNode:分佈在廉價的計算機上,用於存儲Block塊文件。
- Block:將一個文件進行分塊,一般是64M。
3、MapReduce
![HDFS HDFS](http://static.javashuo.com/static/loading.gif)
說明oop
首先數字是分佈存儲在不一樣塊中的,以某幾個塊爲一個Map,計算出Map中最大的值,而後將每一個Map中的最大值作Reduce操做,Reduce再取最大值給用戶。blog