【每週論文】Apollo: Scalable and Coordinated Scheduling for Cloud-Scale Computing

依舊是關於集羣作業調度的文章,發表在OSDI 2014,是微軟的工作。與之前看的中心化調度工作不同,Apollo與Sparrow一樣採用了分佈式框架,並且和Omega一樣採用了共享集羣狀態的方式讓每個調度器都擁有全局視角。最重要的是Apollo已經部署在微軟的生產環境上了,每天都要對數十億個作業進行合理的調度,其性能肯定沒得說了。 以微軟當時的並行計算的生產環境爲例,每個集羣有超過2萬臺服務器,有
相關文章
相關標籤/搜索