見前文apache
這裏以2.7.7版本爲例,將文件剪切到/usr/local裏面並更更名字爲hadoop方便後續配置bash
設置
hadoop
目錄下的env
文件,hadoop/etc/hadoop-env.sh
文件,注意這裏的etc
是在hadoop
目錄下的etc
,你們注意命令執行的路徑,在裏面定義jdk
目錄,建議將hadoop_home
和path
也定義一下oop
這裏直接設置
~/.bashrc
,設置相關配置便可,HADOOP_HOME
是個人hadoop
文件路徑,你們根據我的狀況更改便可,最後的PATH
由於我在bashrc裏面同時配置了jdk
、hadoop
和hbase
,因此若是有和我狀況相同的小夥伴建議將PATH下在一塊兒,像註釋那樣測試
配置
hosts
文件,爲主機增長IP映射3d
通常咱們測試的時候都會使用
hadoop
或者hduser一類的用戶,當測試的時候切換到對應用戶並進行操做,也可使用其餘用戶(主機用戶),可是記得對用戶進行受權,不然當後面操做的時候會由於不能訪問文件而致使錯誤。code
進入
hadoop
目錄,創建input
文件夾,複製幾個文件看成輸入數據源(這裏採用的是hadoop/etc/*.xml
),而後執行haddop
自帶的關鍵字提取方法進行檢驗,將結果輸出到output
文件當中,__注意:__二次實驗時須要事先刪除output
文件cdn
執行完畢後目錄下會出現output
文件夾,查看裏面的文件的內容便可xml