優雲新一代智能化運維管理解決方案



內容來源:2017年4月23日,優雲軟件解決方案中心總監童華權在「雲時代下的運維管理實踐」進行《優雲新一代智能化運維管理解決方案》演講分享。IT 大咖說做爲獨家視頻合做方,經主辦方和講者審閱受權發佈。
前端

閱讀字數:3981 | 6分鐘閱讀數據庫

嘉賓演講視頻回顧及PPT:suo.im/NM8OI安全

摘要

優雲軟件解決方案中心總監童華權爲咱們帶來優雲做爲國內在運維領域作得比較深入的廠商,在運維管理方面的一些看法。服務器

運維面臨的挑戰

數據中心進入「兩化轉變」

數據中心轉向「兩化轉變」,技術架構層面隨着雲計算、大數據、物聯網、微服務、容器等新技術普遍使用,呈現出「混合化」趨勢。運維模式層面上,DevOps理念快速推廣,CI/CD深刻人心,尤爲是GoogleSRE、國內BATJDevOps等互聯網實踐,運維模式上也呈現出明顯的態(Bimodal, Gartner )特徵,穩態與敏態的融合業務模式,運維模式也出現隨之變化,運維管理面臨雙態IT帶來的挑戰。網絡


軟件定義數據中心(SDDC)對運維的挑戰

軟件定義數據中心(SDDC)要求具有簡化並自動化的運維管理,並支持應用和基礎架構交付自動化。架構


上圖是軟件定義數據中心的模型。軟件數據中心對運維和管理有幾個新的訴求。它要求更加簡化和自動化的運維管理能力,還有應用和基礎架構交付自動化能力。這是在新的軟件定義數據中心環境下對運維和管理的一些新訴求。運維

互聯技術架構應用對運維的挑戰

企業信息化建設中,新型互聯網開放技術架構的普遍應用,對各種新技術的運維支持成爲當前迫切的需求。微服務

Devops對運維的挑戰

DevOps理念的快速推廣,促進了業務與技術的加速融合,及開發與運維的加速融合,對運維管理尤爲是自動化運維提出更高的要求。工具

運維業務模式轉變的挑戰

在雙態背景下,數據中心運維業務模式發生了明顯轉變,技術與業務、開發與運維加速融合。性能

在開發層面上,咱們要更加註重持續交付的能力;在運維層面上,要求更高水平的自動化管理能力和更加敏捷的運維管理過程。

由於要更好地爲業務服務,因此咱們在用戶和業務層級也要求有更好的管理和支撐能力。愈來愈注重用戶的體驗和用戶行爲的分析,這樣才能爲業務進行保障和促進業務的發展。

雙態運維管理理念

新背景下的運維管理理念分享

咱們提出了一個軟件定義運維(Software Definition Ops)的概念。把運維業務定義出來而且快速地實現,可以投入到平常的運維過程當中去。

運維軟件平臺PaaS化,是運維生命力關鍵,是雙態運維最佳技術實踐。基於可定義的範疇內的內容,經過平臺化把它們落地。基於運維PaaS平臺,實現運維場景化的梳理,運維場景標準化的確認,經過更大範疇內的自動化運維把它作出來,還有就是運維的可視化以及持續不斷提高走向智能化的方向。

雙態運維-軟件定義運維(SDO)實踐策略

雙態經過運維PaaS平臺對運維場景進行快速定義便可投入運行,實現面向多變業務的敏捷運維支撐,包括運維場景分析、場景定義、場景運營、持續優化等生命週期。

數據中心運維業務梳理

數據中心運維業務梳理是運維場景分析的依據,是標準化、規範化的前提,也是自動化的基礎。


經過上圖能夠把一個數據中心所要管理的內容都梳理出來,總結爲四個方面。

第一個就是調研評估,好比需求管理、風險分析、容量分析等一系列工做。還有就是例行操做、響應支持和優化改善。


運維場景大體能夠分爲幾個部分。資產檔案管理,資產檔案管理是如今很是火的一個CMDB的概念,理清本身到底有多少IT資產,造成運維的基礎。還有全方位監控管理、運行值班與故障處置、變動與校對管理以及巡檢與做業管理。

雙態運維平臺建設

優雲全棧互聯網+運維平臺

採用微服務、大數據的新一代互聯網技術架構,定位於運維PaaS平臺,採用統一平臺+產品APP模式,平臺提供統一採集操做層和資源庫,產品APP基於平臺服務和組件規範,可不斷豐富擴展和相互聯動。


一、資產檔案管理

資產配置管理常見問題(一)

由Excel提及的資產配置管理,信息零散、缺少全局管理,消耗大量的人力成本,及時性低。

數據容易被任意修改,缺少版本控制,數據準確性低。

資產配置管理常見問題(二)

傳統運維工具,資源管理範圍大、維護過程複雜,反倒增大的運維人員工做負擔,使用意願低。

一直處在數據維護的困局當中,從未有餘力思考如何發揮配置數據的價值。

數據中心IT資產檔案管理方案場景

系統經過全網掃描與自動化採集、社交化維護方式促進CMDB的自動化構建、敏捷化維護、場景化應用。


衆所周知,自動化掃描是很是有價值的。它能夠幫助咱們找到網絡環境中有哪些IP和資源,作到沒有遺漏。

再經過細化的配置採集,找出咱們所需的數據中內心出現的資源詳細信息,構建一個完整的配置信息。

配置數據的維護須要各自團隊去維護本身的數據,讓最熟悉的人負責本身的數據纔是合適的,這就是團隊化的維護圈。

在數據維護的過程當中還要注意反饋機制,用戶在使用過程當中作出相應的回覆,就是一個很是好的反饋機制。因此咱們採用了點評、點贊、訂閱等一些社交化的理念,使用戶以爲使用CMDB的時候不像一個上世紀的老古董,而是具備時尚化的感受。

構建一個配置數據的消費圈,消費圈裏的人能夠共享同一份數據,這份數據也能夠經過圖形化的方式展現出來,應用到各類各樣分析的場景中。

二、全方位監控管理

監控常見問題(一)

業務應用與用戶體驗出現問題,而IT基礎設施一切正常。

咱們看到的每每都是一些平常維護的視角,而用戶所看到的是咱們全部問題累積後的結果。

監控常見問題(二)

咱們沒法感知最終用戶的真實體驗,沒法瞭解咱們應當在哪些方面進行優化改善,更沒法奢望得到用戶的承認。

根據IDC的統計,大約40%的故障是由最終用戶首先發現,並通知服務檯的。

監控常見問題(三)

故障排查定位花費大量的精力,須要網絡、系統、應用、開發團隊參與,投入大量人力成本。

數據中心全方位監控方案場景

針對以上問題,咱們提供了面向基礎資源、應用後臺、應用前端的監控能力。從應用用戶體驗到應用代碼的應用端對端應用性能與故障監測,並支持業務交易與用戶體驗監測。

大規模雲監控

全面支持傳統架構與互聯網架構的監控,系統同時支持非代理方式進行資源監控。

支持萬節點資源的秒級監控;支持超過6000個指標及腳本級擴展;支持監測資源進行標籤化管理與展現;支持監控展現儀表盤的自定義。


三、運行值班與故障處置

運維值班與故障處置常見問題

運行值班是IT運行的守護者,咱們是否有真正能作到:清晰掌握運行態勢、快速分析定位故障、觸發故障處置措施。

常見問題有:運行態勢展現是否直觀、明瞭,高層、中層、執行層沒法各取所需;監控告警信息沒法集中展示與處理;不具有故障分析與定位的能力;故障處置過程不連續貫通。


告警流水式處理與故障根因分析

支持告警集中管理,具備高性能告警關聯引擎,自動化告警處置,作到報的出、報得準、找得對。

ECC大屏可視化展現

「看得清、管得住」是管理學的真諦,運維可視化是數據中心運行安全可靠的儀表盤,支持按需設計。

ECC大屏設計三模式:運行態勢展現(參觀模式)、運維指揮調度(指揮模式)、運行值班模式(值班模式)。

四、巡檢與做業管理

運維操做常見問題

在數據中心軟件定義化、技術架構互聯網化、業務快速發展、應用持續交付等背景下,尤爲是Devops理念在運維領域的全面推廣,自動化運維成爲運維管理能力提高的「點金石」。

運維壓力大、效率偏低;運維規範化難以真正落地;運維操做存在安全隱患,根據「墨菲定律」——錯誤總在發生,因此鍋就在那裏;業務變化帶來的持續交付壓力;IT服務的自動化交付水平低。

巡檢與做業管理場景分析

自動化操做的標準化、自動化,是運維規範化的關鍵,是提升運維效率、下降操做風險的關鍵,也是快速故障處置與應急響應的重要手段。


自動化巡檢管理

巡檢能力:針對Windows、Linux、AIX重要指標進行自動巡檢;支持靈活增長系統巡檢項目。

豐富巡檢項:系統參數、服務狀態、錯誤日誌、異常登陸、關鍵進程、合規檢查。

自動化運維做業

系統支持環境準備、系統補丁升級、系統參數修改、合規檢查、服務啓停、數據備份、應急切換等自動化做業場景。

應用持續交付與Devops

應用快速部署,包括環境準備、基礎軟件部署、應用部署、參數配置等部署活動,支持應用持續交付。

做業場景編排與做業調度管理

系統支持運維操做最佳實踐腳本庫,支持靈活的做業編排與做業調度能力,實現數據中心的自動化運營。運維人員由炮灰轉變成戰場指揮官。

五、變動與交付管理

變動與交付常見問題

運維部門具備明確的服務特性,但服務便利性、服務效率、服務水平等方面咱們是否能讓用戶滿意。

不清楚到底對外提供哪些服務,以及運維團隊須要如何進行支持不清晰;爲最終用戶提供的服務的途徑單一,每每依賴於電話、郵件;內部對運營效率與協做水平較低;缺少工具與方法讓對外服務自動化流轉。


運維服務流程ITSM

ITIL/DevOps流程全面支持

支持ITIL V3 / ISO20000理念相關運維流程;支持經過服務目錄梳理運維業務,以服務目錄驅動流程;支持表單、流程的拖拽式靈活設計;採用社交化、敏捷的流程交互模式,支持工單的評論、動態等。

社交化支持

提供工單關注功能;提供工單的評論功能,評論支持回覆;評論支持圈人功能;評論支持即時的站內信或其餘方式通知。

即時運維協同ChatOps

ChatOps概念定義

ChatOps是一種實時聊天驅動型的運維模型,經過將自動化機器人植入到聊天會話當中,造成了人、機器,數據的自動化、透明化的聯動,使運維團隊可以高效的溝通協做和執行任務,ChatOps是DevOps的一種實踐演進方法。


ChatOps幫助組織平滑演進到DevOps

ChatOps面向運維內外部用戶的統一運維入口,使用組織運維模式對用戶透明,能夠幫助逐步平滑演進到DevOps更高階段。

ChatOps在GitHub的起源與應用

管理Github內部的服務器,啓停,升級、打補丁;郵件管理,收發我的郵件;代碼提交通知;代碼構建,部署上線;數據庫管理,刪除數據,備份數據…

運維智能化運維平臺建設規則

優雲智能化運維管理平臺能夠幫忙各種企業用戶逐步走向運維「一體化」、「自動化」、「智能化」的運維管理更高水平。

一、一體化,傳統運維工具分散,工具間缺少有效的運維數據與場景融合,所以基於新技術架構之上運維PaaS平臺成爲主流選擇;

二、自動化,將人工運維轉變化自動化運維,逐步實現平常運維操做與應用持續交付等運維場景的自動化落地,提升運維效率與過程規範化、下降人工操做風險;

三、智能化,經過大數據分析、運維智能機器人技術實現運維智能化管理,支撐故障自愈、容量伸縮、應急保障等。


但願優雲可以幫助你們從一體化運維向自動化運維轉變,而且將來能看到自動化的曙光,謝謝你們。

我今天的分享就到這裏,謝謝你們!

相關文章
相關標籤/搜索