Hadoop安裝及WordCount運行

時間 2020-07-06

標籤 hadoop 安裝 wordcount 運行欄目 Hadoop 简体版

原文原文鏈接

決定參照這個教程來安裝https://blog.csdn.net/zp8126/article/details/78249741html

CentOS6.5 +JDK 1.8環境，用MobaXterm_v11.1操做node

1.首先檢查jdk安裝狀況linux

2.下載hadoop(hadoop版本選擇？)web

使用rz上傳命令找不到的話要先下載，下面是成功了shell

MobaXterm使用rzhttps://blog.csdn.net/kq1983/article/details/95262378centos

貌似上傳仍是不行，但直接進入目錄這樣上傳就能夠了，以下：瀏覽器

你看，兩種方式都能看到這個安裝包ssh

這裏已經有了感受oop

<property>
<name>fs.default.name</name>

<value>hdfs://hadoop001:9000</value>
</property>
<property>
<name>fs.defaultFS</name>
<value>hdfs://hadoop001:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>

<value>/usr/hadoop/temp/</value>
</property>ui

格式化後

配置一直有點小問題，以前start-all.sh而後jps查看到的進程列表都只有DateNode和Jps

不懈努力地理解修改配置文件後，看下圖都好了，但我不記得最後到底改的哪裏弄好了。。。

hadoop web管理頁面打不開，先試試http://www.javashuo.com/article/p-buexodvi-eb.html

我說我怎麼一直打不開web管理頁面，太傻了，是要用虛擬機中centos6.5的瀏覽器打開，我一本正經在那兒用Window瀏覽器打開。。。

我先把兩文件這裏改爲了這樣匹配的樣子

瞧！

開啓yarn，這裏的意思是已經開啓了，要再開啓得先關閉，因此如今直接瀏覽器打開就行

結束！（那個ssh免密碼登陸再弄吧）

關於hadoop集羣啓動後datanode沒有啓動問題，即jps後沒有DataNodehttps://blog.csdn.net/huguihua2002/article/details/100079564

先保證hadoop集羣是正確啓動的，而後運行WordCount程序 https://blog.csdn.net/u012366219/article/details/78781382

上面警告的處理http://www.javashuo.com/article/p-hgenyqsb-gs.html

查看到結果

如今用IntelliJ Idea打包wordcount的mapreduce程序，而後傳到裝有hadoop的虛擬機系統上運行

參照此教程https://www.cnblogs.com/airnew/p/9540982.html，到要建立shell文件那裏我開始有點迷糊了

而後到運行的時候又有這個問題

嘗試用這個方法解決https://blog.csdn.net/weixin_34194317/article/details/86360351又有新問題

根據網友的問題解決方案，hadoop fs -rm -r /input刪除這個文件夾，將執行命令反覆再嘗試了好幾遍也不行，我執行的命令以下

 hadoop fs -mkdir /input
 hadoop fs -put test.txt /input
 hadoop jar /usr/hadoop/hadoop-2.10.0/bin/WordCount.jar WordCount /input /output

放棄後繼續查找經驗https://blog.csdn.net/ASN_forever/article/details/81066282看到這裏忽然靈感一現：路徑一致+輸入輸出更名

確保WordCount.jar包與輸入輸出文件在同一層次路徑下後，而後我只輸入下面代碼，便成功了

hadoop jar WordCount.jar /input/test.txt /output4

代碼改了下，又跑了下，感受理解更深了些。

我把改後生成的WordCount.jar上傳到了linux 的/wcdata文件夾中，原本這裏面還又建了一個test.txt文檔，但經過[root@hadoop001 wcdata]# hadoop jar WordCount.jar /input/test.txt /output命令後發現jar包雖然是使用的wcdata該文件夾中的，可是使用的輸入文本卻仍是/usr/hadoop/hadoop-2.10.0/test.txt這裏的，而不是/wcdata/test.txt這個，有點納悶。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。