java程序員的大數據之路(8):MapReduce的工作機制

概述 Hadoop運行作業時的整個過程如果所示。 包含如下4個獨立的實體。 客戶端:提交MapReduce作業。 jobtracker:協調作業的運行。它的主類是JobTracker。 tasktracker:運行作業劃分後的任務。它的主類是TaskTracker。 分佈式文件系統(一般爲HDFS):用來在其他實體間共享作業文件。 作業的提交 JobClient的runJob()方法是用於新建Jo
相關文章
相關標籤/搜索