MapReduce運行全流程

MapReduce運行全流程: Nodemanager從Resourcemanager那裏拿到Task之後,就啓動一個規定cpu、內存的container用來運行MapTask。   那麼MapTask就開始工作了,MapTask通過Inputformat組件,從任務所指定路徑(如:HDFS)上開始讀取數據。需注意的是,他一次只讀一行,讀完一行調一次用戶寫的Map方法,數據格式爲<K,V>,其中K
相關文章
相關標籤/搜索