HADOOP2單機版

時間 2019-12-04

原文原文鏈接

Hadoop有三種模式單機模式、僞分佈模式和徹底分佈模式
這裏先簡單介紹單機模式，默認狀況下，Hadoop被配置成一個非分佈式模式，獨立運行JAVA進程，適合開始作調試工做。 java

下載地址：http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-2.0.2-alpha/hadoop-2.0.2-alpha.tar.gz
下載的版本是hadoop-2.0.2-alpha 分佈式

安裝前肯定java安裝略 oop

1、拷貝到/usr/local 解壓 hadoop 測試

1	cp hadoop-2.0.2-alpha.tar.gz /usr/local

2	cd /usr/local

3	tar -zxvf hadoop-2.0.2-alpha.tar.gz

目錄結構和配置文件這裏就省略（） spa

2、修改配置文件 hadoop-env.sh
Hadoop的配置文件都在 hadoop-2.0.2-alpha/etc/hadoop下，因爲默認狀況下是單機模式，通常不用作修改就能夠直接作第三步測試實例，下面只是安裝實際狀況修改。 .net

一、在hadoop中配置JAVA_HOME
默認的是export JAVA_HOME=${JAVA_HOME} 若是原來在環境變量中配置過，就可用使用默認的，不需修改調試

1	export JAVA_HOME=/opt/java

/opt/java 也就是jdk安裝的路徑

二、修改java虛擬機的類存
原來啓動JVM時配置的最大內存是128m，當運行hadoop的一些自帶的實例會報內存溢出，其實這裏是能夠修改內存大小
若是不須要也沒必要修改。
export HADOOP_CLIENT_OPTS="-Xmx128m $HADOOP_CLIENT_OPTS" 進程

1	export HADOOP_CLIENT_OPTS="-Xmx512m $HADOOP_CLIENT_OPTS"

3、運行實例 Hello Hadoop 內存

切換到該安裝目錄下，創建要上傳到hadoop的兩個文件 test1.txt、test2.txt

1	mkdir input

2

 cd input 

3	echo "hello world" > test1.txt

4	echo "hello hadoop" > test2.txt

5

 cd .. 

運行hadoop自帶的wordcount實例能夠統計一批文本文件中單詞出現的次數

1	$bin/hadoop jar /usr/local/hadoop-2.0.2-alpha/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.0.2-alpha.jar wordcount input output

bin/hadoop jar /usr/local/hadoop-2.0.2-alpha/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.0.2-alpha.jar wordcount input output

查看結果

1	$cat output/*

hadoop 1
hello 2
world 1

OK，Hadoop單機模式就OK了

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。