/usr/local/hadoop/etc/hadoop/core-site.xml 包含了hadoop啓動時的配置信息。html
編輯器中打開此文件node
sudo gedit /usr/local/hadoop/etc/hadoop/core-site.xmlapache
在該文件的<configuration></configuration>之間增長以下內容:瀏覽器
<property>框架
<name>fs.default.name</name>編輯器
<value>hdfs://localhost:9000</value>oop
</property>spa
保存、關閉編輯窗口。3d
最終修改後的文件內容以下:orm
/usr/local/hadoop/etc/hadoop/yarn-site.xml包含了MapReduce啓動時的配置信息。
編輯器中打開此文件
sudo gedit yarn-site.xml
在該文件的<configuration></configuration>之間增長以下內容:
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
保存、關閉編輯窗口
最終修改後的文件內容以下
默認狀況下,/usr/local/hadoop/etc/hadoop/文件夾下有mapred.xml.template文件,咱們要複製該文件,並命名爲mapred.xml,該文件用於指定MapReduce使用的框架。
複製並重命名
cp mapred-site.xml.template mapred-site.xml
編輯器打開此新建文件
sudo gedit mapred-site.xml
在該文件的<configuration></configuration>之間增長以下內容:
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
保存、關閉編輯窗口
最終修改後的文件內容以下
/usr/local/hadoop/etc/hadoop/hdfs-site.xml用來配置集羣中每臺主機均可用,指定主機上做爲namenode和datanode的目錄。
建立文件夾,以下圖所示
你也能夠在別的路徑下建立上圖的文件夾,名稱也能夠與上圖不一樣,可是須要和hdfs-site.xml中的配置一致。
編輯器打開hdfs-site.xml
在該文件的<configuration></configuration>之間增長以下內容:
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/usr/local/hadoop/hdfs/name</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:/usr/local/hadoop/hdfs/data</value>
</property>
保存、關閉編輯窗口
最終修改後的文件內容以下:
hdfs namenode -format
只須要執行一次便可,若是在hadoop已經使用後再次執行,會清除掉hdfs上的全部數據。
通過上文所描述配置和操做後,下面就能夠啓動這個單節點的集羣
執行啓動命令:
sbin/start-dfs.sh
執行該命令時,若是有yes /no提示,輸入yes,回車便可。
接下來,執行:
sbin/start-yarn.sh
執行完這兩個命令後,Hadoop會啓動並運行
執行 jps命令,會看到Hadoop相關的進程,以下圖:
瀏覽器打開 http://localhost:50070/,會看到hdfs管理頁面
瀏覽器打開http://localhost:8088,會看到hadoop進程管理頁面
dfs上建立input目錄
bin/hadoop fs -mkdir -p input
把hadoop目錄下的README.txt拷貝到dfs新建的input裏
hadoop fs -copyFromLocal README.txt input
運行WordCount
hadoop jar share/hadoop/mapreduce/sources/hadoop-mapreduce-examples-2.4.0-sources.jar org.apache.hadoop.examples.WordCount input output
能夠看到執行過程
運行完畢後,查看單詞統計結果
hadoop fs -cat output/*