Hadoop Eclipse開發環境搭建

時間 2019-11-14

原文原文鏈接

This document is from my evernote, when I was still at baidu, I have a complete hadoop development/Debug environment. But at that time, I was tired of writing blogs. It costs me two day’s spare time to recovery from where I was stoped. Hope the blogs will keep on. Still cherish the time speed there, cause when doing the same thing at both different time and different place(company), the things are still there, but mens are no more than the same one. Talk too much, Let’s go on.html

在Hadoop集羣搭建，已經搭建好了一個用於開發/測試的haoop集羣，在這篇文章中，將介紹如何使用eclipse做爲開發環境來進行程序的開發和測試。java

1.) 在這個地址http://download.csdn.net/detail/uestczhangchao/8409179 下載， hadoop-eclipse-plugin-1.0.3.jar的eclipse插件，本文使用 Eclipse Java EE IDE for Web Developers. Version: Luna Release (4.4.0) 做爲IDE工具，將下載好的hadoop-eclipse-plugin-1.0.3.jar文件放到eclipse的plugin目錄中（若是是MyEclispe則放到：D:\program_files\MyEclipse\MyEclipse 10\dropins\svn\plugins 目錄中）linux

2.) 在Eclipse的Windows->Preferences中，選擇Hadoop Map/Reduce,設置好Hadoop的安裝目錄，這裏，我直接從linux的/home/hadoop/hadoop-1.0.3拷貝過來的，點擊OK按鈕：apache

3.) 新建一個Map/Reduce Projectapp

4.) 新建Map/Reduce Project後，會生成以下的兩個目錄， DFS Locations和suse的Java工程，在java工程中，自動加入對hadoop包的依賴：eclipse

5.）是用該插件創建的工程，有專門的視圖想對應：svn

6.）在Map/Reduce Locations中，選擇Edit Hadoop Location…選項，Map/Recuce Master和 DFS Master的設置：工具

7.）在Advanced parameters中，設置Hadoop的配置選項，將dfs.data.dir設置成和linx環境中的同樣，在Advanced parameters中，將全部與路徑相關的都設置成對應的Linux路徑便可：oop

8.）將Hadoop集羣相關的配置設置好後，能夠在DFS location中看到Hadoop集羣上的文件，能夠進行添加和刪除操做：測試

9.）在生成的Java工程中，添加Map/Reduce程序，這裏我添加了一個WordCount程序做爲測試：

10.）在Java工程的Run Configurations中設置WordCount的Arguments，第一個參數爲輸入文件在hdfs的路徑，第二個參數爲hdfs的輸出路徑：

11.）設置好Word Count的RunConfiguration後，選擇Run As-> Run on Hadoop:

12.) 在Console中能夠看到Word Count運行的輸出日誌信息：

13.）在DFS Location中能夠看到，Word Count在result目錄下生成的結果：

14.）進行Word Count程序的調試，在WordCount.java中設置好斷點，點擊debug按鈕，就能夠進行程序的調試了：

至此， Hadoop+Eclipse的開發環境搭建完成。

15.）搭建環境的異常狀況處理，在搭建環境的過程當中，遇到的比較棘手的問題以下，提示widows上的用戶沒有權限，這個異常的處理在修改hadoop FileUtil.java，解決權限檢查的問題文章中進行介紹，須要經過修改hadoop的源代碼，從新編譯進行修復：

15/01/30 10:08:17 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
15/01/30 10:08:17 ERROR security.UserGroupInformation: PriviledgedActionException as:zhangchao3 cause:java.io.IOException: Failed to set permissions of path: \tmp\hadoop-zhangchao3\mapred\staging\zhangchao3502228304\.staging to 0700
Exception in thread "main" java.io.IOException: Failed to set permissions of path: \tmp\hadoop-zhangchao3\mapred\staging\zhangchao3502228304\.staging to 0700
    at org.apache.hadoop.fs.FileUtil.checkReturnValue(FileUtil.java:689)
    at org.apache.hadoop.fs.FileUtil.setPermission(FileUtil.java:662)
    at org.apache.hadoop.fs.RawLocalFileSystem.setPermission(RawLocalFileSystem.java:509)
    at org.apache.hadoop.fs.RawLocalFileSystem.mkdirs(RawLocalFileSystem.java:344)
    at org.apache.hadoop.fs.FilterFileSystem.mkdirs(FilterFileSystem.java:189)
    at org.apache.hadoop.mapreduce.JobSubmissionFiles.getStagingDir(JobSubmissionFiles.java:116)
    at org.apache.hadoop.mapred.JobClient$2.run(JobClient.java:856)
    at org.apache.hadoop.mapred.JobClient$2.run(JobClient.java:850)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:415)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1121)
    at org.apache.hadoop.mapred.JobClient.submitJobInternal(JobClient.java:850)
    at org.apache.hadoop.mapreduce.Job.submit(Job.java:500)
    at org.apache.hadoop.mapreduce.Job.waitForCompletion(Job.java:530)
    at org.apache.hadoop.examples.WordCount.main(WordCount.java:68)