記Flink Metrics時斷時續問題排查

文章目錄 1. 背景 2. 問題分析 2.1 實驗設計 2.2 源碼分析 3. 解決方法 1. 背景 用prometheus+pushgateway+grafana監控體系對flink的各項metrics進行監控,出現如下圖所示狀況: 可以發現,指標每過一些時間就會消失,然後又出現。 2. 問題分析 2.1 實驗設計 存在三種可能,1:prometheus有bug導致拉不到數據;2:pushgat
相關文章
相關標籤/搜索