【故障公告】阿里雲 RDS 數據庫突發 CPU 近 100% 引起全站故障

今天晚上9點咱們收到阿里雲的告警通知:html

【阿里雲監控】華東1(杭州)-雲數據庫RDS版<cnblogsdb> [instanceId=xxx] 於21:00 發生告警, 前往診斷 CPU使用率平均值(98.25>=80 ), 持續時間4分鐘, rds_CpuUsage數據庫

收到通知後,咱們當即登陸阿里雲 RDS 控制檯進行主備庫切換,等主備庫完成切換後一看並無切換過來,趕忙再次進行切換,第2次切換成功了,切換完成後 CPU 馬上降至正常水平,全站恢復正常。post

此次故障發生時間是8月20日20:55~21:14,由此給您帶來麻煩,請您諒解。優化

上次發生一樣故障是6月24日,詳見 【故障公告】阿里雲 RDS 實例 CPU 100% 故障引起全站沒法正常訪問阿里雲

阿里雲數據庫專家分析後懷疑是「LINQ 生成的 SQL 存在問題,致使機率性 SQL Server 出現參數嗅探問題」。url

咱們會進一步分析並優化此次引起參數嗅探問題的 SQL 語句。3d

相關文章
相關標籤/搜索