1. MapReduce使用編程
MapReduce是Hadoop中的分佈式運算編程框架,只要按照其編程規範,只須要編寫少許的業務邏輯代碼便可實現併發
一個強大的海量數據併發處理程序框架
2. 運行Hadoop自帶的MapReduce程序(word count單詞統計功能)
分佈式
1.在HDFS中建立層級目錄,而且上傳文件到指定目錄:hadoop fs -mkdir -p /wordcount/inputoop
2.上傳文件到HDFS指定目錄:hadoop fs -put a.txt b.txt /wordcount/inputspa
3.運行MapReduce程序的自帶jar包:cd /usr/local/src/hadoop-2.6.4/share/hadoop/mapreduce/.net
運行:hadoop jar hadoop-mapreduce-examples-2.6.4.jar wordcount /wordcount/input /wordcount/outputcode
wordcount:jar包中須要運行的主類blog
/wordcount/input:wordcount主類須要的參數,指定數據文件目錄,統計裏面的數據文件hadoop
/wordcount/output:統計文件後的結果保存目錄,必需要求改目錄不存在
4.查看輸出文件統計結果:hadoop fs -cat /wordcount/output/part-r-00000
本身寫MapReduce程序可參考這篇用MapReduce計算Pi的文章http://blog.csdn.net/mrbcy/article/details/61455917