MAPREDUCE的JOB提交流程

時間 2021-01-15

原文原文鏈接

在hadoop1.0版本以前我們的Mapreduce是被當作資源調度和計算框架來使用的，成爲了hadoop運行生態圈的瓶頸，所以在hadoop2.0版本以上引入了yarn的概念，使Mapreduce完全成爲分佈式計算框架，而Yarn成爲了分佈式資源調度。雖然mapreduce處理速度很慢，IO操作會很多，不過這是我們步入Spark的必經之路，也是瞭解大數據生態圈不可缺少的成分。下面就是針對job

>>阅读原文<<