Hadoop_05_運行 Hadoop 自帶 MapReduce程序

時間 2020-05-03

標籤 hadoop 運行自帶 mapreduce 程序欄目 Hadoop 简体版

原文原文鏈接

1. MapReduce使用編程

　　MapReduce是Hadoop中的分佈式運算編程框架，只要按照其編程規範，只須要編寫少許的業務邏輯代碼便可實現併發

一個強大的海量數據併發處理程序框架

2. 運行Hadoop自帶的MapReduce程序（word count單詞統計功能）
分佈式

　　1.在HDFS中建立層級目錄，而且上傳文件到指定目錄：hadoop fs -mkdir -p /wordcount/inputoop

　　2.上傳文件到HDFS指定目錄：hadoop fs -put a.txt b.txt /wordcount/inputspa

　　3.運行MapReduce程序的自帶jar包：cd /usr/local/src/hadoop-2.6.4/share/hadoop/mapreduce/.net

　　運行：hadoop jar hadoop-mapreduce-examples-2.6.4.jar wordcount /wordcount/input /wordcount/outputcode

　　　　wordcount：jar包中須要運行的主類blog

　　　　/wordcount/input：wordcount主類須要的參數，指定數據文件目錄，統計裏面的數據文件hadoop

　　　　/wordcount/output：統計文件後的結果保存目錄，必需要求改目錄不存在

　　4.查看輸出文件統計結果：hadoop fs -cat /wordcount/output/part-r-00000

本身寫MapReduce程序可參考這篇用MapReduce計算Pi的文章http://blog.csdn.net/mrbcy/article/details/61455917

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。