近幾日生產環境老是偶發的出現數據庫鏈接失敗的錯誤,一開始並未引發重視,由於反饋的人不多,並且應用服務器與數據庫服務器都處在同一機房的內網環境,相互之間的訪問應該是很穩定的。直到早上有幾分鐘的時間裏出現的機率很大(基本上每10次請求就有一次出錯),檢查數據庫情況是良好的,負載並不高,監控了user conection計數器的值也很低,還不到150。爲了應急,先嚐試了一下切換故障羣集的活躍節點,誰料想竟然就正常了。後面看羣集日誌,發現有持續的錯誤:數據庫
能夠看到,該錯誤每15分鐘發生一次。自切換活躍節點後再也不出現。很惋惜的是,負責基礎架構的同事也未能查明是什麼緣由,做爲嘗試的解決方案,在網絡適配器設置中添加了多個備用DNS服務器。服務器