記一次線上服務假死問題(MongoDB超時和OOM兩個坑)

事件的背景是:一個老系統,功能模塊很多,包含兩個團隊的職責(最開始只有一個團隊),所以要將這個系統拆分成兩個服務,各自團隊負責自己的服務,由於業務影響,這次上線只能在23點後通宵進行。 問題一:ECS自建Mongo數據表數據量大,沒有建索引,導致查詢巨慢,CPU打滿。 問題發生在第二天下午,提供給APP的接口響應變慢,後來應用假死(CPU、內存、帶寬都檢查過沒有異常)。因爲接口邏輯並不複雜,推斷主
相關文章
相關標籤/搜索