各行各業都開啓了數字化轉型的進程,運維團隊在這種時代的浪潮中又該何去何從?我在幫助一些企業落地了運維技術平臺以後,開始反思這個問題,並將所思所想整理成本篇文章。安全
雖然各行各業都開啓了數字化轉型的進程,但不少運維人員仍然很是辛苦,在企業中揹負着 「救火英雄」的稱號。往好的說是「救火英雄」,換一種糟糕的說法是「背鍋俠」,彷佛永遠深陷於好事不出門壞事傳千里的泥潭中。網絡
爲何會這樣?我認爲這是由生產力決定的,熟悉政治經濟學的人應該知道著名理論生產力決定生產關係,那麼什麼是運維生產力?企業數字化轉型時代下,運維人應該具有哪些生產力?架構
傳統組織中的運維職責框架
相信你們過往應該看過不少的分享、資料,有的圍繞着ITIL講述如何高瞻遠矚地去設計頂層,有的經過繁雜的技術語言講述五花八門的落地經驗,卻發如今結合自身現狀時,這些經驗有着諸多不適。運維
我在幫助幾個企業落地了運維技術平臺後,開始反思,不少人習慣將運維理解爲一個工種或一項工做,而我更傾向於將運維理解是管理和服務的組合。管理的意思是我能擁有什麼,服務的意思是我能提供什麼,我大致想表達的是:機器學習
管理是對內的,指的是對我所擁有的各類IT要素計劃、組織、協調和控制的過程,強調效率。ide
服務是對外的,指的是咱們運維團隊具有哪些能力、用何種方式夠進行對外輸出,強調敏捷。微服務
我認爲運維做爲技術團隊,其擁有的四樣核心要素是人員、流程、技術和數據。那麼數字化轉型背景下,這個四個核心要素如何發揮做用呢?工具
數字化轉型下運維核心四要素性能
一、人與技術
人是最重要的要素之一,當人與技術互動的時候就會產生創新。咱們能夠先用技術解決咱們熟悉的事情,而後打開思路,嘗試新的方法來作新的事情。
咱們須要經過專一於技術創新和利用破壞性技術的跨職能小組,在整個運維團隊中展開更多的協同,以實現更高階的運維自動化,提高平常運維管理工做效率。
咱們應確保運維人員尤爲是新加入的運維人員對掌握技術是充滿熱情的,並感覺到運維工做擁有將來職業發展的道路。咱們甚至能夠提供一些獎項,以表彰他們對運維技術建設所做出的貢獻。
二、技術與流程
在數字化轉型下,流程已經不是孤立的存在於流程系統中,更不能僅僅停留在線下的紙上,而是要與工具和技術結合起來。
流程 + 技術 = 自動化,用工具系統驅動流程的執行和落地,既能保證流程在管理活動中是被遵循的,又能夠提高運維管理的效率。
而隨着機器學習、深度學習以及無處不在的低成本雲計算出現,機器執行流程的速度比任何人夠快。一我的建立100臺虛擬機要花多長時間,機器能夠在數分鐘內完成此任務。
三、流程與人
在固有思惟中運維管理流程是影響效率的,其做用是管控和評級,是下降用戶(指的是管理員)體驗的一種存在。
經過數字化轉型,人們要轉變這種想法,實際上應該是流程+自動化=高效率。當人們可以與流程真正互動起來,咱們就能夠實現「複製」。
在流程完整的組織中,一我的可能與十我的有一樣的影響力,試想快餐公司是如何進行標準化的,例如:去北京麥當勞與去香港麥當勞的就餐過程應該大體相同。
爲了達到最佳狀態,運維團隊須要分析流程系統中留存下來的信息數據,逐步提高運維管理能力。
四、數據
數據是數字化轉型的基礎,在運維領域玩數據已經不是什麼新鮮事了,AIOps在各類行業大會中出現的頻度愈來愈高。
若是說自動化是爲了解決運維人員的執行效率問題,AIOps就是解決運維人員的決策效率問題。目前AIOps應用最廣的場景仍是監控方面,如根因定位、故障影響分析、容量預測等。
然而,我認爲運維組織手裏的數據可不只僅是運維數據,稍誇張的講是企業的全量數據,如何利用好手裏的數據,是運維團隊持續提高生產力的主要因素。
當運維團隊開始改進人、流程、技術三個方面的互動,並嘗試用數據創造價值時,咱們運維團隊就正走在數字化轉型的路上了。若是你還不知道怎麼開始行動,能夠試着考慮如下幾個問題:
咱們不夠快麼?
咱們效率不高麼?
咱們在創造價值麼?
若是咱們的速度不夠快,咱們是否是該考慮自動化了,作好技術與流程的結合。
若是咱們的效率不夠高,咱們要審視一下咱們流程與人的設計是否合理。
若是咱們的工做體現不出價值,咱們應該找找能創新的地方,充分發揮技術與流程、數據的做用。
過往咱們會認爲運維是保障性部門,職責就是爲各個IT應用系統提供可用性保障。然而,我認爲在企業數字化轉型過程當中,運維團隊還應該藉着轉型的契機讓本身可以提供更多,提高更多。
運維是幾乎一切IT資源的供給者。若是把數字化轉型比喻作一列高速行駛的列車,這趟列車的功力都是由運維團隊提供和保障。與過往不一樣的是,運維團隊應該讓其餘人獲取資源的方式更容易、更敏捷、成本更低。我想這應該是企業都在大規模地上各類雲的緣由之一吧。
運維應該成爲數字化能力的建設者。企業在數字化轉型確定是一個漸進的進程,這過程當中須要建設各類各樣的能力,好比大數據分析、人工智能、……等,企業數字化轉型進入ABC(AI、Bigdata、Cloud)時代已是必然趨勢。
那麼團隊能在其中參與到何種程度,將必定程度上決定運維團隊將來在企業中的地位。若是你的企業在考慮數字化轉型,必定要抓住機遇,擁抱將來。
我認爲還有一個重點,運維還應該成爲成爲數字化轉型過程當中的工具開發者。咱們固有觀念中,運維團隊與開發彷佛風馬牛不相及。然而,企業在數字化轉型後,將會有大量的工做須要轉爲線上處理,尤爲是IT部門與其餘部門的協做更要轉變爲線上操做,這就須要不少工具或系統須要建設。好比其餘部門找咱們申請IT基礎資源、業務部門找咱們提取業務數據、開發團隊找咱們查看應用日誌……等等,咱們不能期望全部事情都由專業開發團隊或外包開發團隊去實現,自有的開發力量是運維團隊提高地位的重要保障。
到這裏我再總結一下,運維團隊在面對數字化轉型的大勢下,須要作好的三點升級:
效率升級
提高運維自身團隊的效率,經過各種運維工具和平臺的建設,提高運維工做的效率,如自動化工具,智能監控等。在必定程度上釋放運維人的精力和時間,繼而投入到數字化轉型的思考上。
能力升級
要幹大事總要有點像樣的武器,運維團隊能夠先從自身的業務需求上着手,好比目前比較熱門的AIOps、RPA等技術,能夠結合平常的運維場景進行必定程度的探索,積累了經驗後能夠推廣到其餘業務場景。
團隊升級
若是運維團隊仍是停留傳統IOE體系架構下積累的經驗,那面臨來勢洶洶的互聯網時代就要當心了,抓緊時間提高本身的技能。不少金融行業、科技行業的企業已經組建了本身運維開發團隊,或積極嘗試開源產品,或借鑑互聯網公司經驗。
有不少企業雖已經開始行動,但轉型效果甚微。因此,我想再囉嗦另一點思考,就是如何打破固有思惟,保證轉型持久地執行下去。我將其總結爲5P。
一、目的 Purpose
在任何組織的轉型中,都但願有更多的人可以參與到轉型計劃中,由此咱們必須爲組織轉型設定有影響力的目標,這是我把Purpose放在第一位的緣由。
不少人會以爲定目標很容易,不就是給本身立個響噹噹的flag嘛,如「建設智能化運維體系」、「打造SRE團隊組織」…。事實上真的是這樣麼?你的目標須要與企業的戰略結合起來,如在我接觸到的一個銀行中,提出了「提產能、促轉型,爲打造一流數字生態銀行夯實技術基礎」的整體目標。實際上當你設定Purpose的同時,你必須爲你的Purpose回答下面幾個問題:
你爲何相信本身能轉型成功?—— 轉型須要有力量Power
你須要讓哪些人蔘與到轉型中?—— 轉型須要發動羣衆People
你打算如何影響相關的人們?—— 轉型須要制定計劃Plan
轉型後會產生什麼樣的影響?—— 轉型須要講收益Payback
也就是咱們接下來要討論的另外4P。
二、力量 Power
你爲何相信本身能轉型成功?你必須爲本身的轉型計劃找到力量源泉,並讓這種力量在團隊中可以被充分認識到,能夠嘗試從四個方向去找:
企業戰略
影響:將運維轉型目標與企業戰略關聯,從而獲得更高層領導的關注與支持。
思路:不少企業將數字化轉型定爲企業的戰略,而IT能力是數字化轉型中的重點建設內容,運維(或運營)管理又是其中不可或缺的一部分。
業務形態
影響:在業務發展過程當中,企業運營模式也會隨調整,運維也是其中一環。
思路:好比,不少企業都在發展互聯網+業務,其特色就是敏捷,從而要求運維既能適應敏態,又能兼顧穩態,也就是你們都說的雙態運維。
外部環境
影響:多瞭解同業的發展狀況,畢竟企業要面對的是市場競爭,確保本身領先不落後。
思路:據我所知金融業間常常走訪交流,對比行業領先企業的發展,保持自身競爭力。同時,也能夠多參考頂級互聯網公司的經驗,如BAT的分享。
運維現狀
影響:同時,自身現狀不可忽略,找到當前和將來工做中的切實痛點,對症下藥。
思路:運維轉型確定會有必定的內驅力,不少運維團隊都面臨着人手不足、效率不高等問題,從這些具體問題開始,制定對應的行動計劃。
另一個獲取力量的要點就是高層的支持,凡是涉及到組織轉型的項目,必不可少的須要相應的資源向其傾斜。而且從過往的經從來看,越是獲得層領導支持的項目,其得到的資源就越豐富,項目也就成功了一半。在獲得高層支持的前提下,爲了運維轉型的氣氛營造的熱烈起來,能夠採起一下行動:
讓領導參加運維轉型項目相關的重要會議
在公開場合討論運維轉型項目的進展狀況
迫使有反對意見的領導參與到運維轉型推動工做
組織更普遍的培訓學習,讓每一個人感覺到運維轉型的決心
總而言之,運維轉型必須讓全部人感覺到是有力量的,讓每一個人深入感覺到是一種大勢所趨,不能消極逃避而要積極主動。
三、人 People
人是重要的,在運維轉型項目中,項目經理必須是有力量的人,而且是有時間和精力專一推進轉型工做的人。
在過往的觀察中,有部分公司會指派專門的項目經理負責運維轉型的推進工做,並賦予項目經理很大的指揮權。而兼職的項目經理每每難以抽出足夠的精力推進項目,由於若是項目經理同時肩負運維管理工做,運維是一件瑣碎而繁雜的工做,一我的很難同時兼顧運維管理和推進項目兩件事情,這不是人的問題是客觀規律。
關於項目團隊組建,主要有線性組織結構和矩陣組織結構兩種,選擇適合本身公司的實際狀況就好。實際上,在不一樣的公司兩個組織方式都有采用,有的公司成立了專職的工具建設小組,還有的公司從不一樣的運維團隊抽人組成虛擬工做組。我過去合做過的一個客戶,他們發起了運維開發倡議,讓你們自願加入到運維開發學習中,效果也很好。
四、計劃 Plan
定計劃是很是難的,這會涉及到路線選擇的問題,是選擇全自主研發路線,仍是找合做夥伴支撐?
選擇徹底依靠自有力量的企業是很是勇敢的,須要很大的決心。這個過程須要面對不少的難題,遠遠不是簡單堆砌一些開源工具就能知足的。一旦走上了轉型這條路就很難停下來,解決了自動化的問題,還有DevOps、AIOps在前面等着,對着轉型逐漸進入深水區,須要投入的人力資源是巨大的,須要許多艱難的技術。
固然,還有部分企業選擇跟隨策略,如今如BAT這些大型互聯網公司開放出來的運維平臺都是很好可選項例如:騰訊藍鯨智雲,一套用於構建企業研發運營一體化體系的 PaaS 開發框架,提供了 aPaaS(DevOps 流水線、運行環境託管、先後臺框架)和 iPaaS(持續集成、CMDB、做業平臺、容器管理、數據平臺、AI 等原子平臺)等模塊,幫助企業技術人員快速構建基礎運營 PaaS。
羅馬不是一天建成的,轉型也不是一蹴而就的,必然是一個持續迭代的過程,每家公司的運維都涉及不少技術領域,如硬件、網絡、系統、應用、安全、……。傳統技術架構的穩態業務運維還沒有徹底解決,如今又開始面臨容器化、微服務化的敏捷業務,實在使人頭疼。ITOM、ITSM體系還沒玩轉,又出現了DevOps、AIOps等理論體系,該何去何從?
我在哪裏?要去哪裏?【自動化能力成熟度】
五、收益 Payback
轉型須要持續投入精力和成本,你必須在前期就考慮好這麼作的收益是什麼?咱們能夠從三個層面去考慮:
經濟效益:主要體現就是降本增效,每一個企業從這個層面都很類似,因路線選擇而有所不一樣,我這裏不過多討論。
能力提高:在轉型過程當中會建設不少能力,如機器學習、工具流水線等,根據每一個企業的實際狀況而不一樣,也不過多討論。
組織提高:運維團隊通過數字化轉型後,人員技能和組織模式可能會發生變化,好比在人員組成上會區分運維操做人員、運維開發人員、運維分析人員、和運維專家,而轉型的效果將會與幾種人員的比例相關。
想讓運維搭上數字化轉型的風口,首先得對團隊有清晰的瞭解,能夠從人員、流程、技術和數據的元素做爲出發點,其次讓運維團隊明確的走出原有的職責,提供更多的價值。
最後,我利用本身在實施一些項目後的體悟,爲你們總結整理了運維轉型的 5個方向:目標、力量、人、計劃、收益,確保你們在擁有轉型的認知與想法後,能夠持久地落地下去。
我想寫這樣一篇文章好久了,也花了很長時間才把思路整理清楚,然而還有不少內容仍需在實踐中完善,以後在得到新的感悟後再繼續與你們分享。
做者:邢晉