【每週論文】Apollo: Scalable and Coordinated Scheduling for Cloud-Scale Computing

時間 2020-12-30

原文原文鏈接

依舊是關於集羣作業調度的文章，發表在OSDI 2014，是微軟的工作。與之前看的中心化調度工作不同，Apollo與Sparrow一樣採用了分佈式框架，並且和Omega一樣採用了共享集羣狀態的方式讓每個調度器都擁有全局視角。最重要的是Apollo已經部署在微軟的生產環境上了，每天都要對數十億個作業進行合理的調度，其性能肯定沒得說了。以微軟當時的並行計算的生產環境爲例，每個集羣有超過2萬臺服務器，有

>>阅读原文<<