記一次線上CPU持續飆升的問題排查

最近公司的事務多了很多,都很少有時間來更新了。上週六項目上剛剛發生了一次CPU持續飆高,導致服務不可用的線上事故,在此也簡單做下記錄。 問題排查的過程大概是這樣的: 查看業務日誌中最開始報錯的信息,發現數據庫連接超時,redis也連接超時,而且出現了大量的連接超時。所以一開始懷疑數據庫掛了導致業務線程一直積壓。 DBA排查了數據庫的情況,發現數據庫並沒有壓力,也運行正常。redis的存儲是滿的。
相關文章
相關標籤/搜索