hadoop集羣中主要進程有 master: NameNode, ResourceManager, slaves: DataNode, NodeManager, RunJar, MRAppMaster,YarnChild 其中 RunJar, MRAppMaster,YarnChild與隨着某個job的建立而建立,隨着job的完成而終止。它們的做用分別是: RunJar:完成job的初始化,包括獲取jobID,將jar包上傳至hdfs等。 MRAppMaster:每一個job一個進程,主要跟蹤job的運行狀況,向RM申請資源等。 YarnChild:運行具體的map/reduce task。 job啓動過程: ResourceManage,NodeManager->RunJar->MRAppMaster->YarnChild job退出過程: YarnChild->MRAppMaster->RunJar 即全部的map/reduce均完成後,MRAppMaster才退出,最後RunJar退出,job完成。 網上找到的一些示意圖: 圖1 圖2