實時告警架構優化實戰

簡介 線上有一個告警服務採用sparkstreaming+kafka的模式實時處理數據進行布控告警,10s一個批次,34個executor,每個4core,kafka有260個分區,採用直讀的方式並且打開了慢執行推測。 運行一段時間後,都沒有延遲,目前布控任務有1000個左右,每天4000萬的數據需要處理,昨晚業務突然添加了2000個布控任務,導致任務有積壓,導致告警延遲兩個多小時,經過排查,發現
相關文章
相關標籤/搜索