很是抱歉,今天下午 16:55~17:05 左右,因爲 docker swarm 集羣的突發不穩定問題形成新版博客後臺(目前處於灰度發佈階段)沒法正常使用,由此給您帶來麻煩,請您諒解。node
出故障期時,新版博客後臺的2個容器都沒法正常啓動。web
AME NODE DESIRED STATE CURRENT STATE i_web.1 prod-swarm-w3 Running Assigned 5 minutes ago i_web.2 prod-swarm-w4 Running Assigned 2 hours ago
發現問題後,咱們進行了刪除 stack 並從新部署的操做。docker
docker stack rm i ./deploy-production.sh 2.0.6
NAME NODE DESIRED STATE CURRENT STATE i_web.1 prod-swarm-w3 Running Assigned 42 seconds ago i_web.2 prod-swarm-w7 Running Starting 42 seconds ago
從新部署後發現 prod-swarm-w7 節點上的容器能夠正常啓動,而 prod-swarm-w3 節點上的容器問題依舊,由此確認是 prod-swarm-w3 節點出了問題,因而當即卸載該節點。code
docker node update --availability drain prod-swarm-w3
卸載後,新版博客後臺很快恢復了正常。blog
咱們已經決定用 k8s 取代 docker swarm ,但目前 k8s 集羣還沒部署好,在這即將與 docker swarm 說 88 的時刻,又被 docker swarm 坑了一次,都怪咱們當時貪圖省事,選對了集裝箱(docker 容器)卻上錯了船(docker swarm),咱們會深入吸收此次上錯船的教訓。部署