MAPREDUCE的JOB提交流程

在hadoop1.0版本以前我們的Mapreduce是被當作資源調度和計算框架來使用的,成爲了hadoop運行生態圈的瓶頸,所以在hadoop2.0版本以上引入了yarn的概念,使Mapreduce完全成爲分佈式計算框架,而Yarn成爲了分佈式資源調度。雖然mapreduce處理速度很慢,IO操作會很多,不過這是我們步入Spark的必經之路,也是瞭解大數據生態圈不可缺少的成分。 下面就是針對job
相關文章
相關標籤/搜索