今天下午在公司,收到zabbix的告警郵件,發現有一批機器同時告警,說機器ping不通。而這批機器都是在經過wmare安裝的虛擬機,當時就感受,多是這臺虛擬化的物理機有問題,立刻查找該機器的IP地址,發現果真ping不通。機器已經掛了。只有重啓。機器重啓後。linux
在鏈接vcenter,啓動該物理機上全部的虛擬機。 找到其中影響業務的192.168.45.150,192.168.45.146這兩臺機器。開機後,檢查 防火牆,selinux 是否關閉,檢查系統時間,發現系統時間不一樣步,經過docker
ntpdate ,clock -w 命令同步時間。以後啓動ambari-agent,而後就登陸ambari-server的管理地址,啓動以前受影響的機器上的服務。 而後再啓動對應192.168.45.146機器上的docker 服務。ide
經過docker ps -a 查看全部的容器id。server
docker start id 來啓動對應的容器。同步