Hadoop Local（本地）模式搭建

時間 2020-05-08

原文原文鏈接

1. 下載壓縮包

2. 配置環境變量

3. 配置Hadoop的JAVA_HOME路徑

4. WordCount

1. 下載壓縮包

下載Hadoop binary二進制壓縮包 https://hadoop.apache.org/releases.html

上傳到Linux並解壓html

2. 配置環境變量

提早先配置好java環境變量，編輯 vi /etc/profilejava

export HADOOP_HOME=/usr/soft/hadoop-2.7.2
PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

export PATH USER LOGNAME MAIL HOSTNAME HISTSIZE HISTCONTROL

運行 source /etc/profile 使配置生效apache

3. 配置Hadoop的JAVA_HOME路徑

進入Hadoop解壓目錄，vi ./etc/hadoop/hadoop-env.sh
設置JAVA_HOME路徑oop

export JAVA_HOME=/usr/soft/jdk1.8.0_144

4. WordCount

單機版Hadoop環境已經搭建完成，運行一個統計單詞數量的Demo來了解一下Hadoop的運行機制spa

複製一些xml文件

mkdir /usr/soft/input
cp ./hadoop/*.xml /usr/soft/inputcode

執行Hadoop命令

格式: hadoop jar <jar包> <類> <輸入文件夾> <輸出文件夾> <條件>xml

hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount /usr/soft/input /usr/soft/outputhtm

注意，保證以前沒有這個output目錄,成功以後會產生2個文件blog

[root@localhost output]# ll
total 8
-rw-r--r--. 1 root root 5552 Jan  2 17:20 part-r-00000
-rw-r--r--. 1 root root    0 Jan  2 17:20 _SUCCESS

part-r-00000 結果文件
_SUCCESS 成功標誌

查看結果

[root@localhost output]# more part-r-00000 
"*"     17
"AS     6
--More--(1%)

查看hdfs文件列表

hdfs dfs -ls /hadoop

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。