Sourcehtml
自動化運維是指將IT運維中平常的、大量的重複性工做自動化,把過去的手工執行轉爲自動化操做。自動化是IT運維工做的昇華,自動化運維不單純是一個維護過程,更是一個管理的提高過程,是IT運維的最高層次,也是將來的發展趨勢。安全
目前許多企業的IT運維已經實現從人工運維到計算機管理,但延展諮詢在同客戶的交流中發現其中不少企業的IT運維管理還只是處在「半自動化」的運維狀態。由於這種IT運維仍然是等到IT故障出現後再由運維人員採起相應的補救措施。這些傳統式被動、孤立、半自動式的IT運維管理模式常常讓IT部門疲憊不堪,主要表如今如下三個方面:架構
運維人員被動、效率低框架
在IT運維過程當中,只有當事件已經發生並已形成業務影響時才能發現和着手處理,這種被動「救火」不但使IT運維人員終日忙碌,也使IT運維自己質量很難提升,致使IT部門和業務部門對IT運維的服務滿意度都不高。目前絕大多數的企業IT運維人員平常大部分時間和精力是處理一些簡單重複的問題,並且因爲故障預警機制不完善,每每是故障發生後或報警後纔會進行處理,,使到IT運維人員的工做常常是處於被動「救火」的狀態,不但事倍功半並且經常會出現惡性連鎖反應。
缺少一套高效的IT運維機制運維
目前許多企業在IT運維管理過程當中缺乏自動化的運維管理模式,也沒有明確的角色定義和責任劃分,使到問題出現後很難快速、準確地找到根本緣由,沒法及時地找到相應的人員進行修復和處理,或者是在問題找到後缺少流程化的故障處理機制,而在處理問題時不但欠缺規範化的解決方案,也缺少全面的跟蹤記錄。
缺少高效的IT運維技術工具工具
隨着信息化建設的深刻,企業IT系統日趨複雜,林林總總的網路設備、伺服器、中間件、業務系統等讓IT運維人員難以從容應對,即便加班加點地維護、部署、管理也常常會因設備出現故障而致使業務的中斷,嚴重影響企業的正常運轉。出現這些問題部分緣由是企業缺少事件監控和診斷工具等IT運維技術工具,由於在沒有高效的技術工具的支持下故障事件很可貴到主動、快速處理。
儘管IT運維管理的技術在不斷進步,但實際上不少IT運維人員並無真正解脫出來,緣由在於目前的技術雖然可以獲取IT設備、伺服器、網路流量,甚至資料庫的警告信息,但成千上萬條警告信息堆積在一塊兒更本無法判斷問題的根源在哪裏。另外,目前許多企業的更新管理絕大多數工做都是手工操做的。即便一個簡單的系統變動或更新每每都須要運維人員逐一登陸每臺設備進行手工變動,當設備數量達至成百上千時,其工做量之大可想而知。而這樣的變動和檢查操做在IT運維中每每天天都在進行,佔用了大量的運維資源。所以,實現運維管理工做的自動化對企業來講已迫在眉睫。性能
如今隨着IT運維管理工做的複雜度和難度的大大增長,僅靠過去幾個「運維英雄」或「技術大拿」來包打天下已經行不通了,企業開始須要運用專業化、標準化和流程化的手段來實現運維工做的自動化管理。由於經過自動化監控系統能及時發現故障隱患,主動的告訴用戶須要關注的資源,以達到防患於未然。例如,全天候自動檢測與及時報警能實現IT運維的「全天候無人值守」,大大下降IT運維人員的工做負擔。並且,經過自動化診斷能最大限度地減小維修時間,提升服務質量。所以, 對於愈來愈複雜的IT運維來講,將純粹的人工操做變爲必定程度的自動化管理是一個重要發展趨勢。優化
首先,IT運維流程自動化可以提升流程的可控性,能夠基於業務需求來制定個性化的流程,使企業領導有機會看見他們的業務流程,對企業流程有一個深入的分析和理解,進而改造和優化流程。日誌
其次,IT運維流程的自動化能提升透明度。由於隨着業務需求的變化可能會有多個版本出現,手工流程的不透明將會給流程定製和優化帶來至關大的困難,而自動化流程可使用戶可以一目瞭然的看到整個流程的各個節點運轉狀況,自動化工具潛移默化地提高業務保障能力。code
再者,運維繫統實行了自動化監控之後,經過工具自動監控對人的工做是一種減負,也是一種下降成本的表現。
IT運維已經在風風雨雨中走過了十幾個春秋,現在它正以一種全新的姿態擺在咱們面前--自動化,這是IT技術發展的必然結果。如今IT系統的複雜性已經客觀上要求IT運維必須可以實現數字化、自動化維護。所謂IT運維管理的自動化是指經過將平常IT運維中大量的重複性工做(小到簡單的平常檢查、配置變動和軟體安裝,大到整個變動流程的組織調度)由過去的手工執行轉爲自動化操做,從而減小乃至消除運維中的延遲,實現「零延時」的IT運維。
簡單的說,自動化運維是指基於流程化的框架,將事件與IT流程相關聯,一旦被監控系統發生性能超標或宕機,會觸發相關事件以及事先定義好的流程,可自動啓動故障響應和恢復機制。自動化工做平臺還可幫助IT運維人員完成平常的重複性工做(如備份、殺毒等),提升IT運維效率。同時,IT運維的自動化還要求可以預測故障、在故障發生前可以報警,讓IT運維人員把故障消除在發生前,將所產生損失減到最低。
對於企業來講,要特別關注兩類自動化工具:一是IT運維監控和診斷優化工具;二是運維流程自動化工具。這兩類工具主要應用於:
監控自動化,是指對重要的IT設備實施主動式監控,如路由器、交換機、防火牆等;
配置變動檢測自動化,是指IT設備配置參數一旦發生變化,將觸發變動流程轉給相關技術人員進行確認,經過自動檢測協助IT運維人員發現和維護配置。
維護事件提醒自動化,是指經過對IT設備和應用活動的時時監控,當發生異常事件時系統自動啓動報警和響應機制,第一事件通知相關責任人。
系統健康檢測自動化,是指按期自動地對IT設備硬體和應用系統進行健康巡檢,配合IT運維團隊實施對系統的健康檢查和監控。
維護報告生成自動化,是指按期自動的對系統作日誌的收集分析,記錄系統運行情況,並經過階段性的監控、分析和總結,定時提供IT運維的可用性、性能、系統資源利用情況分析報告。
好雨雲幫ACP · 自動化運維 https://www.goodrain.com/autoOM.html 自動化運維把週期性、重複性、規律性的工做交給平臺去處理,經過標準化、自動化、架構化、過程優化來下降運維成本、提升運維效率。雲幫ACP提供從基礎架構到應用的全棧自動化運維,安全、穩定、強大。
創建自動化運維管理平臺
自動化運維管理建設的第一步是要先創建IT運維的自動化監控和管理平臺。經過監控工具實現對用戶操做規範的約束和對IT資源進行實時監控,包括伺服器、資料庫、中間件、存儲備份、網路、安全、機房、業務應用和客戶端等內容,經過自動監控管理平臺實現故障或問題綜合處理和集中管理。例如,在自定義週期內進行自動觸發完成對IT運維的例行巡檢,造成檢查報告。包括自動運行維護,以完成對系統補丁的同步分發與升級、數據備份、病毒查殺等工做。
創建故障事件自動觸發流程,提升故障處理效率
全部IT設備在遇到問題時要會自動報警,不管是系統自動報警仍是使用人員報的故障,應以紅色標識顯示在運維屏幕上。而後IT運維人員只須要按照相關知識庫的數據,一步一步操做就能夠。所以,企業須要事先創建自動工單式流程管理,當設備或軟體發生異常或超出預警指標時會觸發相關的事件,同時觸發相關工單處理流程給相關IT運維人員。 IT運維人員必須在指定時間內完成流程所規定的環節與工做,以提升IT運維響應問題的效率。
創建規範的事件跟蹤流程,強化運維執行力度
自動化運維管理建設時,首先須要創建故障和事件處理跟蹤流程,利用表格工具等記錄故障及其處理狀況,以創建運維日誌,並按期回顧從中辨識和發現問題的線索和根源。事實上許多實踐也證實,創建每種事件的規範化處理和跟蹤指南,能夠減小IT運維操做的隨意性和強化運維的執行力度,在很大程度上可下降故障發生的機率。同時,用戶還應能夠經過自助服務檯、電話服務檯等隨時追蹤該故障請求的處理狀態。
設立IT運維關鍵流程,引入優先處理原則
設立IT運維關鍵流程,引入優先處理原則是指要求CIO定義出IT運維的每一個關鍵流程,不只僅是定義流程是什麼,還包括要指出每一個關鍵流程對企業有什麼影響和意義。同時,在設置自動化流程時還須要引入優先處理原則,例行的事按常規處理,特別事件要按優先順序次序處理,也就是把事件細分爲例行事件和例外關鍵事件。
總之,實現IT運維的自動化管理是指經過將IT運維中平常的、大量的重複性工做自動化,把過去的手工執行轉爲自動化操做。自動化是IT運維工做的昇華,自動化運維不單純是一個維護過程,更是一個管理的提高過程,是IT運維的最高層次,也是將來的發展趨勢。