最近有個比較火的英劇叫《IT狂人》,其中比較搞笑的橋段是主角之一每次接到電腦故障問詢電話時,首先就會問:你重啓過電腦嗎?網絡
電腦故障後重啓應該是大多數人都經歷過的解決辦法,但對於IT「大蝦」們,一上來就重啓,是讓他們多麼嗤之以鼻的一件事,因而各類敲命令,各類測試,各類排障,各類「專業手段」來進行拯救。運維
但當你面對的是種類繁多的設備,複雜多變的網絡時,不知道「大蝦」們還能不能有這樣的豪情?事實上,隨着IT進程的快速推動,「手工操做」已被各類「工具」遠遠地甩在身後。ide
如今,在一個已略有規模的企業裏,單純依靠IT運維管理員的經驗或者手工排障,已愈來愈不可能,即便管理員自己技術很強,耐性足夠,能夠作到憑一己之力挽救網絡系統,但通常狀況下,耗時會較長,企業是難以容忍這種現象存在的。因此當前的各類IT運維管理工具,首先把人員從手工操做的低效率、高強度中解放了出來,讓他們的精力和能力得以更大程度的釋放。工具
那麼IT運維管理從手工走向智能,只帶來這一項改變嗎?我說,非也。測試
當愈來愈多的企業業務,甚至是核心業務須要依賴IT才能運轉時,IT運維管理所肩負的責任就再也不僅僅是保持系統運轉、網絡通暢這麼簡單。咱們更須要作到的是對業務的透明化管理,透明化監控業務系統運行狀況,事先發現可能引發系統宕機故障或者訪問質量沒法保障的問題,把可能發生故障的隱患,經過業務系統的總體監控視圖發現問題。固然這種「透過現象看本質」的大活,是須要在智能化的運維工具輔助下才可完成的。優化
還有在不少大型企業裏,是要求進行平常巡檢的,由於巡檢工做不可是網絡故障防患於未然的關鍵,也是進一步釋放IT運維管理價值和不斷創新的基礎。可是這個看似簡單的工做,若是單靠手工完成,在規模越大的企業裏越容易淪爲形式,甚至是沒法保證質量的「硬骨頭」。由於當一個企業的信息化管理者深陷入繁雜的平常運營維護工做時,有時根本記不住平常到底佈置了哪些事情,就算記住了也沒在這麼龐大的系統面前作到「及時」檢查,即便能作到「及時檢查」,也極可能會陷入到「如何檢查」的困境中去。spa
依靠管理人員天天循序漸進地對每一臺設備逐個檢查,或者從大量的紙質表單裏找數據,久而久之,這種枯燥和疲倦也許還會致使巡檢人的敷衍了事和「數據空想」,可能會形成不可估量的損失。因此自動化的運維巡檢在這裏又幫助運維人員從繁瑣手工勞動中「解救」出來。而且智能化的自動巡檢須要大量收集系統運行的監控數據,並以此爲依據創建一種可持續性的優化目標。首先要利用自動化的收集工具,肯定巡檢的範圍,進而再把整個範圍內的運維對象造成邏輯關係。經過對這些監控數據的歸集和分析,預先發現故障隱患,提早採起措施,進而變被動式管理爲主動式管理,提升IT系統服務管理水平,並引領企業的IT部門進入到BSM的時代。對象
其實我認爲:所謂「智能」的IT運維管理,固然你要能有一個體現「智能」功效的有利工具輔助,但更重要的是你要了解本身所面對的管理對象,瞭解你的企業,才能選擇適合當下的利器,發揮出最大的功效。否則,就像你雖然拿着一款智能機,但根本沒有wifi,不少功能也沒法使用同樣。blog
會使用工具爲本身服務很重要,選擇最適合的工具更爲重要。如何選擇適合本身的工具,作智能化的「IT運維」,在我之前寫的不少文章中都有涉及,你們不妨再來重溫和思索下:進程