LinkedIn開源Cruise Control:一個Kafka集羣自動化運維新利器

Kafka近年來日漸流行,LinkedIn的1800臺Kafka服務器每天處理2萬億個消息。雖說Kafka運行得十分穩定,但要大規模運行Kafka,在運維方面仍然面臨巨大的挑戰。每天都會有broker崩潰,導致集羣工作負載不均衡。SRE團隊需要花費大量的時間和精力來重分配分區,以便讓集羣重新恢復均衡。 自動化因此變得十分重要,這也就是爲什麼我們要開發Cruise Control:持續監控Kafka
相關文章
相關標籤/搜索