疫情影響下,嘉爲藍鯨如何助力企業IT運維?

新冠肺炎疫情爆發以後,嘉爲公司在完成內部防控工做的部署同時,心繫每個客戶,時刻關注疫情對各大企業的業務影響,並積極配合客戶在防疫期間的相關運維工做要求。數據庫

以深圳某企業(如下簡稱SZ公司)爲例,早在2月2日以前,政府對各企業復工延遲計劃做出要求時,咱們便在第一時間響應客戶需求,明確將按照SZ公司新型冠狀病毒防控工做方案的相關工做要求,全力配合作好系統運維遠程支持工做直至疫情解除,確保SZ公司業務系統穩定運行。安全

SZ公司是嘉爲集團合做最深配合最默契的客戶之一,也是嘉爲藍鯨最先的深度踐行客戶之一,基於嘉爲藍鯨自動化運維平臺,雙方開展了大量實踐和探索,取得了顯著成果。那麼在疫情影響下,嘉爲藍鯨是如何助力SZ公司IT運維的?服務器


疫情對企業IT運維的影響

疫情影響下,全部企業IT運維不可避免地會受到各類影響,對於SZ公司可能會受到哪些方面的影響,簡單從如下幾個方面分析。架構


01 現場運維力量缺少運維

爲了防止疫情蔓延,該公司首先響應政府號召並宣佈延遲復工,開放遠程辦公,以最小化的標準嚴格限制到場人員。所以,對於企業IT運維,現場運維力量的大幅減弱,致使相似系統健康性巡檢、業務需求響應、變動執行和故障應急等現場工做的響應及時率和完成度受到了較大影響。ide


02 系統安全可控性難度加大工具

SZ公司在2019年採起了一系列措施,例如:創建信息安全通報中心、按期開展系統漏洞掃描及整改等,增強企業信息安全管理,下降被***的風險,確保企業不會因安全事件致使信息泄露和財產損失。然而,隨着疫情爆發,受限於遠程限制,漏洞掃描和整改等工做的開展難度和效率低下將對系統安全性產生必定影響。佈局


03 業務宕機風險增大spa

疫情影響下開展遠程辦公,針對故障的各個處理環節(例如:故障響應、故障處理和硬件維護等)將出現或多或少的延遲,對於業務系統來講,無疑增長了業務長時間宕機的風險。操作系統


04 重點專項工做延遲風險高

疫情影響下,沒法保障重點工做溝通的有效性和時效性,所以,涉及資源申請、變動審批和實施等項目工做,將沒法有效開展,極可能致使各種重點工做的進度延遲,從而對核心業務造成相當重要的影響。


疫情下企業對IT運維的廣泛需求

即使影響因素受制於客觀條件較難短時間克服,可是SZ公司數據中心仍然對於運維組提出瞭如下基本原則要求以保障業務的正常運行。


01 人員投入能夠減小,但運維效率不能下降

如上所述,疫情影響下,現場運維人員投入的被動減小是必然的。那麼,在遠程運維背景下,保障運維效率最小程度的下降,甚至不下降,是企業對於IT運維的第一需求。


02 人員能夠不在場,但系統安全必須始終在線

由信息安全的重要性所決定,防疫期間漏洞整改等工做必須保持較高的響應及時率和整改時效性。


03 運維能夠遠程,但故障響應必須及時

業務系統的穩定運維是企業正常運做的必要前提,特別是對於涉及民生資源的SZ公司,承擔着重大的社會責任,所以,防疫期間對於系統故障的支持力度必須獲得最大程度的保障。


04 復工能夠延緩,但重點工做進度不能延遲

基於遠程辦公的背景,如何提高重點工做的溝通效率,保證項目資源申請、變動審批和實施等工做可以高效開展,是IT運維須要重點解決的問題。


疫情下企業IT運維的重點工做內容

運維班組根據數據中心的要求,經過對本階段的必要工做梳理進行分類,並與嘉爲支撐團隊溝通相關工具和方法造成如下工做內容。


01 系統健康性巡檢

利用SZ公司遠程辦公工具和嘉爲藍鯨平臺遠程開展天天的巡檢工做,巡檢範圍涉及數據庫、中間件、操做系統、服務器、存儲和光纖交換機等多個核心領域和組件。


02 信息安全保障

根據SZ公司信息安所有門工做要求,藉助嘉爲藍鯨平臺遠程開展漏洞管理工做,涉及漏洞的全過程管控,整改範圍包括操做系統、數據庫和中間件等多個專業。


03 系統故障處理

主要分爲常見故障的遠程預處理和重大故障的現場處理。常見故障包括磁盤空間不足、CPU或內存使用率太高、物理設備磁盤故障等,可在收到提早預警下,利用嘉爲藍鯨平臺進行遠程預處理;重大故障包括數據庫故障、存儲故障和物理設備宕機等,通常須要到現場進行處理。


04 重點業務需求處理

重點業務需求包括但不限於如下:

  • 業務架構擴展,須要新出庫資源以支撐。

  • 業務數據激增,要求數據存儲擴容。

  • 業務運維中常見的用戶登陸受權,密碼重置等,須要後臺操做。

  • 業務IT配置管理數據庫信息維護等。


疫情下嘉爲如何助力企業IT運維

根據以上工做範圍的定義和梳理分類,嘉爲藍鯨服務團隊響應要求,經過嘉爲藍鯨平臺提供的一系列工具軟件和自助化流程配置輕鬆實現了SZ公司的高效運維。


01 嘉爲藍鯨自動化巡檢系統:提升系統健康性巡檢效率

藉助自動化巡檢系統的每日定時巡檢任務,天天只須要1名運維人員遠程查看巡檢結果彙總表,IDC設備及系統健康狀況便一目瞭然,將巡檢問題提交至系統,反饋給相關專業進行預處理便可。


各種巡檢APP展現:

圖片1.png

自定義巡檢任務:

圖片2.png

巡檢結果彙總:

圖片3.png

圖片4.png


02 現場運維力量缺少

經過嘉爲藍鯨漏洞全過程管理系統進行漏洞掃描,能夠第一時間獲取漏洞清單、整改對象和受影響的業務清單,再借助補丁管理平臺,實現補丁一鍵修復,最後經過漏洞全過程管理平臺進行漏洞複覈,實現漏洞整改閉環,將漏洞整改的時間週期由以往的1~2周縮短至1~3天,極大提高整改時效性,使疫情下信息安全防禦工做的遠程支撐效率不減。


嘉爲藍鯨漏洞全過程管理系統:

圖片5.png


圖片6.png


嘉爲藍鯨補丁更新APP:

圖片7.png


圖片8.png


03 嘉爲藍鯨統一做業平臺:高效處理系統故障

對於防疫期間的常見故障和變動,可經過嘉爲藍鯨做業平臺批量執行腳本或分發文件等功能能進行預處理,無需登陸任何服務器進行操做,提升系統故障處理效率的同時,也下降了人爲誤操做的概率,更爲安全高效地保障系統的穩定運行。

批量執行腳本:

圖片9.png

批量分發文件:

圖片10.png


04 嘉爲藍鯨資源自動化交付、基礎變動自動化工具:高效應對重點專項工做

重要業務資源自動化交付

防疫期間,針對重要業務資源出庫需求,可經過嘉爲藍鯨資源自動化交付平臺,實現虛擬機、中間件、數據庫、備份和監控等一整套資源的自動化快速交付。

圖片11.png

重要系統基礎變動自動化處理

針對重要業務存儲擴容需求和用戶密碼重置等需求,都可利用嘉爲藍鯨基礎變動自動化平臺實現將平常人工處理變動請求,由運維平臺自動執行處理,並在處理完成後進行閉環反饋。

圖片12.png


圖片13.png


05 基礎條件要求——CMDB建設

要想良好地實現以上4種自動化運維場景,不可缺乏的是須要建設一套規劃完善的CMDB。對於SZ公司,嘉爲服務團隊爲該公司的CMDB作了詳細規劃和建設,針對業務IT配置管理數據庫信息維護需求,創建配置管理數據庫,對企業的IT資產進行統一管理,並聯動嘉爲藍鯨其餘功能模塊,自動同步變動信息,爲其餘系統和用戶提供可靠的數據源。


CMDB:

統一管理業務架構、主機、軟硬件等資產配置。

圖片11.png

配置管理門戶:

IT資產報表統計,一目瞭然。

圖片15.png


總結

SZ公司於2017年開始部署嘉爲藍鯨自動化運維平臺,並陸續上線了資源自動化交付、CMDB、自動化巡檢、補丁管理、安全基線管理、漏洞管控平臺和存儲監控等十幾個應用和功能模塊,極大地提高了IT數據中心的服務和運維效率,助力其自動化運維成熟度和管理體系持續處於行業領先地位。防疫期間,嘉爲藍鯨自動化運維平臺有效爲該客戶提供運維能量,助力客戶IT運維團隊高效開展工做,實現遠程安全運維。

對於廣大企業而言,隨着企業的快速發展,IT技術棧愈來愈多、IT團隊規模愈來愈大、運維場景個性化進一步加強、運維安全和敏捷性等對企業內部運維能力提出了更高的技術要求。除此以外,面臨本次重大疫情以及將來不可預測的重大影響因素,咱們建議企業應提早考慮規劃統一運維平臺+自動化運維平臺以提高自身運維效率和應對風險的能力。


做者:趙江彬

其餘優質文章

Linux | 文件的時間屬性

企業如何規劃DevOps落地與演進?

ZooKeeper | 安裝部署、應用場景、開發對接API

【銀行運維】落地平臺化管理,大步邁向銀行4.0

彈性(Flex)佈局的使用

相關文章
相關標籤/搜索