hadoop集羣搭建

時間 2020-01-10

標籤 hadoop 集羣搭建欄目 Hadoop 简体版

原文原文鏈接

1、目的

本文描述瞭如何安裝、配置和管理有實際意義的Hadoop集羣，其規模可從幾個節點的小集羣到幾千個節點的超大集羣。java

若是你但願在單機上安裝Hadoop玩玩，從這裏能找到相關細節。node

2、先決條件

確保在你集羣中的每一個節點上都安裝了全部必需軟件。web
獲取Hadoop軟件包。服務器

3、安裝

安裝Hadoop集羣一般要將安裝軟件解壓到集羣內的全部機器上。網絡

一般，集羣裏的一臺機器被指定爲 NameNode，另外一臺不一樣的機器被指定爲JobTracker。這些機器是masters。餘下的機器即做爲DataNode也做爲TaskTracker。這些機器是slaves。app

咱們用HADOOP_HOME指代安裝的根路徑。一般，集羣裏的全部機器的HADOOP_HOME路徑相同。框架

4、配置

接下來描述瞭如何配置Hadoop集羣。分佈式

一、配置文件

對Hadoop的配置經過conf/目錄下的兩個重要配置文件完成：ide

hadoop-default.xml - 只讀的默認配置。oop
hadoop-site.xml - 集羣特有的配置。

要了解更多關於這些配置文件如何影響Hadoop框架的細節，請看這裏。

此外，經過設置conf/hadoop-env.sh中的變量爲集羣特有的值，你能夠對bin/目錄下的Hadoop腳本進行控制。

二、集羣配置

要配置Hadoop集羣，你須要設置Hadoop守護進程的運行環境和Hadoop守護進程的運行參數。

Hadoop守護進程指NameNode/DataNode 和JobTracker/TaskTracker。

2.一、配置Hadoop守護進程的運行環境

管理員可在conf/hadoop-env.sh腳本內對Hadoop守護進程的運行環境作特別指定。

至少，你得設定JAVA_HOME使之在每一遠端節點上都被正確設置。

管理員能夠經過配置選項HADOOP_*_OPTS來分別配置各個守護進程。下表是能夠配置的選項。

守護進程	配置選項
NameNode	HADOOP_NAMENODE_OPTS
DataNode	HADOOP_DATANODE_OPTS
SecondaryNamenode	HADOOP_SECONDARYNAMENODE_OPTS
JobTracker	HADOOP_JOBTRACKER_OPTS
TaskTracker	HADOOP_TASKTRACKER_OPTS

例如，配置Namenode時,爲了使其可以並行回收垃圾（parallelGC），要把下面的代碼加入到hadoop-env.sh :
export HADOOP_NAMENODE_OPTS="-XX:+UseParallelGC ${HADOOP_NAMENODE_OPTS}"

其它可定製的經常使用參數還包括：

HADOOP_LOG_DIR - 守護進程日誌文件的存放目錄。若是不存在會被自動建立。
HADOOP_HEAPSIZE - 最大可用的堆大小，單位爲MB。好比，1000MB。這個參數用於設置hadoop守護進程的堆大小。缺省大小是1000MB。

2.二、配置Hadoop守護進程的運行參數

這部分涉及Hadoop集羣的重要參數，這些參數在conf/hadoop-site.xml中指定。

參數	取值	備註
fs.default.name	NameNode的URI。	hdfs://主機名/
mapred.job.tracker	JobTracker的主機（或者IP）和端口。	主機:端口。
dfs.name.dir	NameNode持久存儲名字空間及事務日誌的本地文件系統路徑。	當這個值是一個逗號分割的目錄列表時，nametable數據將會被複制到全部目錄中作冗餘備份。
dfs.data.dir	DataNode存放塊數據的本地文件系統路徑，逗號分割的列表。	當這個值是逗號分割的目錄列表時，數據將被存儲在全部目錄下，一般分佈在不一樣設備上。
mapred.system.dir	Map/Reduce框架存儲系統文件的HDFS路徑。好比/hadoop/mapred/system/。	這個路徑是默認文件系統（HDFS）下的路徑，須從服務器和客戶端上都可訪問。
mapred.local.dir	本地文件系統下逗號分割的路徑列表，Map/Reduce臨時數據存放的地方。	多路徑有助於利用磁盤i/o。
mapred.tasktracker.{map\|reduce}.tasks.maximum	某一TaskTracker上可運行的最大Map/Reduce任務數，這些任務將同時各自運行。	默認爲2（2個map和2個reduce），可依據硬件狀況更改。
dfs.hosts/dfs.hosts.exclude	許可/拒絕DataNode列表。	若有必要，用這個文件控制許可的datanode列表。
mapred.hosts/mapred.hosts.exclude	許可/拒絕TaskTracker列表。	若有必要，用這個文件控制許可的TaskTracker列表。

一般，上述參數被標記爲 final 以確保它們不被用戶應用更改。

2.三、現實世界的集羣配置

這節羅列在大規模集羣上運行sort基準測試(benchmark)時使用到的一些非缺省配置。

運行sort900的一些非缺省配置值，sort900即在900個節點的集羣上對9TB的數據進行排序：

參數	取值	備註
dfs.block.size	134217728	針對大文件系統，HDFS的塊大小取128MB。
dfs.namenode.handler.count	40	啓動更多的NameNode服務線程去處理來自大量DataNode的RPC請求。
mapred.reduce.parallel.copies	20	reduce啓動更多的並行拷貝器以獲取大量map的輸出。
mapred.child.java.opts	-Xmx512M	爲map/reduce子虛擬機使用更大的堆。
fs.inmemory.size.mb	200	爲reduce階段合併map輸出所需的內存文件系統分配更多的內存。
io.sort.factor	100	文件排序時更多的流將同時被歸併。
io.sort.mb	200	提升排序時的內存上限。

運行sort1400和sort2000時須要更新的配置，即在1400個節點上對14TB的數據進行排序和在2000個節點上對20TB的數據進行排序：

參數	取值	備註
mapred.job.tracker.handler.count	60	啓用更多的JobTracker服務線程去處理來自大量TaskTracker的RPC請求。
mapred.reduce.parallel.copies	50
tasktracker.http.threads	50	爲TaskTracker的Http服務啓用更多的工做線程。reduce經過Http服務獲取map的中間輸出。
mapred.child.java.opts	-Xmx1024M	使用更大的堆用於maps/reduces的子虛擬機

2.四、Slaves

一般，你選擇集羣中的一臺機器做爲NameNode，另一臺不一樣的機器做爲JobTracker。餘下的機器即做爲DataNode又做爲TaskTracker，這些被稱之爲slaves。

在conf/slaves文件中列出全部slave的主機名或者IP地址，一行一個。

2.五、日誌

Hadoop使用Apache log4j來記錄日誌，它由Apache Commons Logging框架來實現。編輯conf/log4j.properties文件能夠改變Hadoop守護進程的日誌配置（日誌格式等）。

2.六、歷史日誌

做業的歷史文件集中存放在hadoop.job.history.location，這個也能夠是在分佈式文件系統下的路徑，其默認值爲${HADOOP_LOG_DIR}/history。jobtracker的web UI上有歷史日誌的web UI連接。

歷史文件在用戶指定的目錄hadoop.job.history.user.location也會記錄一份，這個配置的缺省值爲做業的輸出目錄。這些文件被存放在指定路徑下的「_logs/history/」目錄中。所以，默認狀況下日誌文件會在「mapred.output.dir/_logs/history/」下。若是將hadoop.job.history.user.location指定爲值none，系統將再也不記錄此日誌。

用戶可以使用如下命令在指定路徑下查看歷史日誌彙總
$ bin/hadoop job -history output-dir
這條命令會顯示做業的細節信息，失敗和終止的任務細節。
關於做業的更多細節，好比成功的任務，以及對每一個任務的所作的嘗試次數等能夠用下面的命令查看
$ bin/hadoop job -history all output-dir

一但所有必要的配置完成，將這些文件分發到全部機器的HADOOP_CONF_DIR路徑下，一般是${HADOOP_HOME}/conf。

5、Hadoop的機架感知

HDFS和Map/Reduce的組件是可以感知機架的。

NameNode和JobTracker經過調用管理員配置模塊中的APIresolve來獲取集羣裏每一個slave的機架id。該API將slave的DNS名稱（或者IP地址）轉換成機架id。使用哪一個模塊是經過配置項topology.node.switch.mapping.impl來指定的。模塊的默認實現會調用topology.script.file.name配置項指定的一個的腳本/命令。若是topology.script.file.name未被設置，對於全部傳入的IP地址，模塊會返回/default-rack做爲機架id。在Map/Reduce部分還有一個額外的配置項mapred.cache.task.levels，該參數決定cache的級數（在網絡拓撲中）。例如，若是默認值是2，會創建兩級的cache－一級針對主機（主機 -> 任務的映射）另外一級針對機架（機架 -> 任務的映射）。