MapReduce運行流程和Yarn處理流程

1.首先從代碼說起, MapTask類中有四個方法可以被重寫,cleanup,map,run,setup setup的主要作用是加載一些資源,或者是在map階段只需要一次運行的東西。 map主要負責處理數據 cleanup負責清理資源,釋放資源 run負責調度這三個方法。 ReduceTask類中也類似。 2.MapReduce運行流程 可能文件的內容比較大,所以先將文件切割,這裏就假設切割成兩塊
相關文章
相關標籤/搜索