hadoop在linux上單機安裝過程心得

時間 2019-11-19

原文原文鏈接

昨天我在個人一臺linux上安裝了一下hadoop的1.1.2版本，並簡單的使用了一下，感受hadoop就向一個linux虛擬機，能夠在上面建立文件夾、放文件，刪除文件夾、刪除文件，只是它NB的地方是能夠幫你把文件分佈式存儲在多臺子節點上，而使用者不要關心；另外，它對文件在不一樣子節點上有備份功能，因此你也不擔憂某臺子節點壞了而致使文件損壞這種狀況。由於我是開發者，因此我想裝一臺單機的hadoop練手，下面是個人安裝過程的一些步驟記錄（如下步驟我都是用root用戶操做）： java

一、安裝JDK node

jdk版本最好是1.6以上，可使用執行命令java -version查看當前JAVA版本號，若是報命令不存在或版本比較低，則須要安裝一個高版本的JDK，並在/etc/profile的文件末尾，根據本機JDK實際的安裝位置加上如下幾行： linux

export JAVA_HOME=/usr/java/jdk1.7.0_25
export PATH=$JAVA_HOME/bin:$JAVA_HOME/jre:$PATH
export CLASSPATH=$JAVA_HOME/lib:$JAVA_HOME/lib/tools.jar web

二、下載hadoop並解壓、移動 apache

上http://www.apache.org/dyn/closer.cgi/hadoop/common/能夠選擇本身想要的版本，我是用wget命令直接將hadoop下載下來：安全

wget http://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-1.1.2/hadoop-1.1.2.tar.gz ssh

--解壓文件，並將解壓的文件夾重命名爲/opt/hadoop，執行如下命令：分佈式

tar -xvf hadoop-1.1.2.tar.gz oop

mv hadoop-1.1.2 /opt/hadoop 測試

三、修改/opt/hadoop/conf文件夾下的4個配置文件

a) hadoop-env.sh ，在該文件的末尾根據JDK安裝目錄增長如下幾行：

export JAVA_HOME=/usr/java/jdk1.7.0_25
export HADOOP_HOME=/opt/hadoop
export PATH=$PATH:/opt/hadoop/bin

b）core-site.xml ，用如下配置替換文件內容

<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
  <property>
  <name>hadoop.tmp.dir</name>
  <value>/tmp/hadoop/hadoop-${user.name}</value>
</property>
</configuration>

c) hdfs-site.xml，用如下配置替換文件內容，由於單機，因此設置文件只要保存1份，系統默認是3份：

<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>

d) mapred-site.xml，用如下配置替換文件內容

<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>

四、執行hadoop環境設置，並格式化hadoop文件系統，執行如下命令

cd /opt/hadoop

source conf/hadoop-env.sh

hadoop namenode -format

五、最後一步：設置ssh免密登錄本機，執行如下命令：

ssh-keygen -t rsa -P "" 輸入這個命令後一直回車就能夠了

cat /root/.ssh/id_rsa.pub >> /root/.ssh/authorized_keys

安全起見，你能夠退出linux再以root登錄進來一下，我是沒作這個步驟