雲計算之路-阿里雲上:14:20-14:55博客後臺2臺服務器都CPU 100%引起的故障

2017年6月20日更新:今天咱們最終發現,CPU 100%問題是博客後臺程序所引用的開源組件 HtmlSanitizer 在處理特定html字符串時引發的,升級至最新版3.4.156可解決這個問題。html

很是抱歉,今天下午14:20-14:55期間,因爲同一個負載均衡中的2臺服務器都出現CPU 100%問題,形成博客後臺沒法正常訪問,由此給您帶來了很大很大的麻煩,請您諒解。git

博客後臺是CPU消耗很低的應用,這2臺服務器一般CPU佔用在5%左右,以前歷來沒有出現CPU 100%的問題(因此連雲監控都沒添加CPU監控報警)。此次問題很忽然,咱們發現問題後,遠程鏈接不上服務器,只能經過阿里雲控制檯重啓服務器,重啓後立馬恢復正常。github

對於問題的具體緣由,目前還沒找到,咱們正在進一步排查,也反饋給了阿里雲,阿里雲也在排查。服務器

對於此次故障,咱們會吸收教訓,採起改進措施:負載均衡

1)增強監控阿里雲

2)採用 Docker 進行容器化部署:在更多服務器上用更多容器運行,避免2臺服務器同時出問題引起故障,但這要等咱們完成博客後臺向 ASP.NET Core 的遷移。htm

相關文章
相關標籤/搜索