生產Docker應用重啓排查經歷

一、現象描述         近期,生產雲平臺監控發生Docker應用重啓次數過多事故報警,經觀察發現某些Docker應用不定期地出現重啓現象,已嚴重影響服務正常提供 生產應用重啓的判斷條件:健康檢查連續3次檢查不通過  生產健康檢查間隔時間設置爲:5s,也就是說如果應用對健康檢查請求在15s內未返回結果,則雲平臺自動重啓應用 二、重啓現象分析 2.1、線程池泄漏問題 (1)、方法一:pstree
相關文章
相關標籤/搜索