Hadoop執行任務過程

用戶從client端提交一個任務,此任務指定了運行的jar包,除java jre外依賴的jar包,待處理的數據文件以及輸出文件夾的位置和名稱 client端首先檢查此任務輸出的文件夾是否存在,而後向JobTracker爲此任務申請一個id,而後在hdfs中建立一個對應此任務的文件夾,將這個任務依賴的外部jar包以及任務要運行的jar包放入此任務的文件夾中;而後調用任務的InputFormat中的g
相關文章
相關標籤/搜索