Hadoop學習--僞分佈式部署--day01

1.僞分佈式安裝準備工做java

   上傳hadoop-2.7.3.tar.gz  /softnode

   虛擬機Java安裝完畢linux

        卸載原有的openjdk的版本web

        # java -version若是看到有openjdk的字樣就是說明是系統帶的openjdk版本bash

        # rpm -qa|grep jdk網絡

        用相似以下的方法刪除上面的rpm包ssh

           #rpm -e --nodeps   java-1.6.0-openjdk-1.6.0.0-1.66.1.13.0.el6.x86_64分佈式

        檢查是否還有jdk1.5的版本,有就刪除ide

        #rpm -e --nodeps java-1.5.0-gcj-1.5.0.0-29.1.el6.x86_64oop

        #解壓新下載的jdk的安裝包

        配置環境變量

2.解壓hadoop

   $tar -xzvf hadoop-2.7.3.tar.gz

3.配置環境變量

   編輯/etc/profile,添加以下內容

   export JAVA_HOME=/soft/jdk1.8.0_111

   export HADOOP_HOME=/soft/hadoop-2.7.3

   export PATH=$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

   而且把以上的內容寫到/home/hadoop/.bashrc中

4.配置SSH免密碼登錄

   $ssh-keygen -t rsa (四個回車)

   執行完這個命令後,會生成兩個文件id_rsa(私鑰)、id_rsa.pub(公鑰)

   將公鑰拷貝到要免登錄的機器上

   $cd /home/hadoop/.ssh

   $cat id_rsa.pub >> ~/.ssh/authorized_keys

   $chmod 600 authorized_keys  

   

   mkdir ./ssh

   chmod 700 ~/.ssh cd ~/.ssh

   ssh-keygen -t rsa 

   cd ~/.ssh

   cat /root/.ssh/id_rsa.pub > authorized_keys

   chmod 600 ~/.ssh/authorized_keys

   scp authorized_keys userB:/root/.ssh/

   注:A 爲管理主機,B爲被管理主機。

5.修改core-site.xml

   添加以下信息

<configuration>

<!-- 指定HADOOP所使用的文件系統schema(URI),HDFS的老大(NameNode)的地址 -->

<property>

<name>fs.defaultFS</name>

<value>hdfs://localhost/</value>

</property>

</configuration>

6.修改hdfs-site.xml

<!-- 指定HDFS副本的數量 -->

<property>

<name>dfs.replication</name>

<value>1</value>

</property>  

7.修改mapred-site.xml

<!-- 指定mr運行在yarn上 -->

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

8.修改yarn-site.xml

<!-- 指定YARN的老大(ResourceManager)的地址 -->

<property>

<name>yarn.resourcemanager.hostname</name>

<value>localhost</value>

</property>

<!-- reducer獲取數據的方式 -->

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

9.格式化namenode(是對namenode進行初始化

  $hdfs namenode -format (hadoop namenode -format)

10.啓動hadoop

  先啓動HDFS

  $start-dfs.sh 

  $start-yarn.sh

  關閉的順序最好相反

11.目錄操做

  $hadoop fs -mkdir -p /user/hadoop

  $hadoop fs -ls /

  $hadoop fs -ls -R /

  $hadoop fs -lsr /

  上傳

  $hadoop fs -put <linux上文件>  <hdfs上的路徑>

  $hadoop fs -put local.txt /user/hadoop/xx.txt   //將本地文件put到hdfs文件系統

  查看文件內容

  $hadoop fs -cat <hdfs上的路徑>

  下載文件

  $hadoop fs -get <hdfs上的路徑> <linux上的文件>

12.查看幫助

  $hadoop fs  //直接回車

  $hadoop fs -help put //查看put的具體信息

13.查看namenode和datanode在本地

  $cd /tmp/hadoop-hadoop/dfs/name/...   //第一個hadoop是hadoop用戶登錄啓動建立的

  $cd /tmp/hadoop-hadoop/dfs/data/...

14.查看log文件

  $ $HADOOP_HOME/logs

15.經過webui查看日誌或者集羣狀況

  http://localhost:500070/    //namenode web server port

  http://localhost:8088/      //resourceManager,只有在本機訪問才能夠。hadoop集羣信息

  http://localhost:19888/     //historyServer 

16.經過netstat查看網絡端口占用狀況

  $netstat  -lnpt  //l:listener  u:udp  p:program  name

相關文章
相關標籤/搜索