年初時工班發現工做站和服務器都沒辦法用ntpq看時鐘同步了,以下圖所示。輸入ntpq-p 就顯示"The specified class was not found"服務器
經過排查,發現中央服務器和工做站均出現,本地工做站部分有,2臺NMS則無缺,Linux機子也顯示正常。因爲系統對時鐘要求很高,出現此狀況後馬上檢查應用服務器狀態,一樣看不到。網絡
一、但經過抓包和防火牆日誌,能夠看到與時鐘服務器通訊的包,證實不是網絡問題。線程
二、人爲調錯工做站時間(五、10分鐘),觀察在1小時後,可以同步正常時鐘,證實時鐘同步進程(ntpd)工做正常。3d
三、嘗試複製正常配置文件、重裝ntp軟件都沒法修復此問題。日誌
四、回溯先前作的操做,NMS沒有此問題,加上前一次也有ATS軟件升級致使Ruby用不了的狀況,便懷疑是ATS升級影響的,但承包商未沒法重現,給出的解決方案是重裝系統,這是不可接受的:一涉及數量多工做量太大,二未查明緣由後續仍可能再出現。blog
五、此故障在網上沒有找到相同案例,可是瞭解到process monitor軟件,爲微軟官方出品。可記錄進程行爲。利用軟件記錄ntpq出錯時段。對比發如今到winrnr.dll後,有一條不一樣,然後續不正常的機子的記錄比正常機子少了很多,說明此爲關鍵節點。進程
如上圖,異常機在查找不到services文件後不久就退出線程了,所以找到正常機的文件拷ci
貝過去,立馬就恢復了ntpq的功能,以下圖:同步