優雲蔣君偉:自動化運維成本仍然很高

9月10日-11日,上海光大國際會展中心隆重舉辦了「2017上海站CNUTCon全球運維技術大會」。本次大會的主題是「智能時代的新運維」,各個公司爲觀衆帶來了他們關於該主題的思考,並分享了他們的實踐經歷。InfoQ有幸邀請了杭州優雲軟件有限公司的產品副總裁蔣君偉老師接受咱們的採訪。談到對自動化運維將來的展望,蔣老師表示自動化運維必然是大勢所趨,可是由於相關技術債務的存在,自動化運維的成本還很高。那優雲本身的技術與產品是如何去作高效運維的呢?本次採訪帶你瞭解一二。css


優雲automation
 

InfoQ:與其它同類產品相比,優雲有哪些優點?前端

 

蔣君偉:要介紹優雲的產品優點,我想能夠簡單說明一下優雲是如何來的。優雲來自廣通,廣通公司成立於2003年,14年以來一直專一於運維領域,廣通的產品也隨着運維行業的趨勢發展,從最初的監控、CMDB、ITIL到APM,行業的客戶也深刻到政府、金融、運營商領域,咱們對用戶運維痛點與上一代運維產品的瓶頸,有深入認識。python

因此,2016年,廣通成立全資子公司,推出了新一代運維產品線優雲,與同類產品相比,咱們有如下優點:算法

1.平臺化:打通運維場景,避免運維信息孤島與運維工具碎片化的狀況shell

2.自動化:結合自動化操做編排,實現故障自愈與運維自助式服務安全

3.社交化:經過ChatOps App,由運維機器人輔助運維人員,隨時隨地完成運維工做服務器

4.大數據:內置運維數據分析算法,有效解決數據中心容量規劃難題網絡

5.分佈式:支持水平擴展,可隨資源規模增加而增長管理能力架構

 

InfoQ:優雲產品採用了哪些核心技術?運維

 

蔣君偉:優雲產品的核心技術包括:

 

一、 安全、穩定、低負載、易擴展的採集代理平臺

採集代理是運維體系中很是重要的落地工具,因爲企業用戶的環境很是複雜,因此採集代理在技術設計須要很是注意:

優雲Agent主要使用Python與Java技術平臺實現,因此在服務器的兼容性上有很大保障;

爲兼容被防火牆與網閘隔離的網絡,Agent老是單向對Server發起鏈接,拉取做業或上報結果,這種方式也可讓Agent集羣造成一個網狀級聯,兼容多級網絡;

同時Agent會主動下降進程的優先級,以下降CPU消耗,控制內存與磁盤使用,將對部署服務器的影響降到最低;

Agent使用強引擎弱腳本的設計思路,內置了ssh/wmi/snmp/ipmi等交互協議,容許用戶快速使用shell/python/groovy等腳本快速擴展Agent能力。

 

二、 可視化埋點技術

 

優雲UEM產品能夠實現用戶Web端與移動端的用戶操做體驗監控,不像傳統的用戶體驗監控產品,咱們不須要預先埋點,咱們能夠幫助產品經理生成用戶的操做熱區,並直接在產品界面上操做,決定要關注哪些用戶的操做行爲。這個埋點依賴兩個部份完成:

用戶交互數據的全量抓取技術:經過在應用端部署前端agent js, agent會監聽頁面中的相關操做,好比點擊事件,超連接等,將相關數據(好比來源、去向)所有記錄下來,並每隔1分鐘進行上報,由服務端存儲分析。

用戶界面元素標記技術:能夠直接在被監控應用端進行框選,設置頁面元素標記,這些元素會和全量採集的數據進行匹配(好比經過匹配css選擇器、文本等)。經過這種可視化標記的方式就能夠直接關注用戶須要的數據,無須開發者手動對頁面元素進行埋點。

 

三、全鏈路監控技術

 

優雲UEM與APM,已經將用戶端的操做與服務端對此操做的執行過程結合在一塊兒,經過UEM的用戶端請求染色,能夠跟蹤每個請求操做到服務端,針對服務端的經常使用RPC協議,如http/dubbo/rmi等,也能夠經過嵌入式agent進行染色與跟蹤。所以,一筆操做所通過的每個計算節點與數據存儲節點的調用堆棧,咱們均可以捕捉到,並能呈現分析其中的瓶頸節點與代碼。

 

四、 圖像質量分析算法

 

優雲VideoMon產品使用的圖像與視頻質量分析算法,能夠快速完成攝象頭成像質量的分析,其中診斷的準確性與快速是技術關鍵。使用信號波動檢查、像素灰度值分析、非灰色像素集中區域分析、圖像弱邊緣數分析等算法,來實現視頻信號丟失檢測、偏色檢測、清晰度異常檢查等功能。

 

InfoQ:談談對全棧雙態運維解決方案的具體理解?

 

蔣君偉:這裏有兩個關鍵詞:

1.全棧

全棧體現瞭解決方案的覆蓋面是完整的,運維的對象,能夠從基礎架構到業務應用;從物理資源到雲資源;從用戶端到服務端的全鏈路運維。

2.雙態

雙態則有兩層含義。從技術層上來講,雙態要求產品能同時進行傳統IOE架構的運維,以及x86架構的雲資源運維;從管理上來講,應能支撐ITIL與DevOps這兩種運維體系。

我認爲全棧雙態運維解決方案,應該能知足這兩個關鍵詞。

 

InfoQ:優雲產品解決方案已經應用到了哪些行業和哪些客戶中?具體效果如何?蔣君偉:自16年7月發佈咱們的產品後,不少用戶都很是踊躍,到目前咱們也實施了很多典型案例:

 

一、 某金融雙態方案,實現雲資源交付的服務自助化

金融目前是最典型的雙態運維場景了,一方面金融核心系統要保持很是穩定,是穩態,另外一方面移動支付渠道又要求應用的迭代與響應很是敏捷,是敏態。

經過優雲的Monitor,咱們實現了傳統業務與互聯網業務的全棧監控;而且經過ITSM實現流程自助服務,業務部門提交的資源申請工單,在審批經過時,藉助CMDB與Automation,實現業務部門的資源交付、應用部署自助化。

二、 某部委業務大數據分析監控方案

此客戶全國擁有數萬的站點須要上報業務數據,這些數據的處理要求很是高的時效性與準確性。因爲站點的規模變大、數據種類增長以及數據監控粒度的增長,舊的業務支撐保障系統已沒法知足對業務數據的實時監控需求。

優雲Store運維數據平臺具備大數據分析能力,能實現這些上報的業務數據實時流數據處理,結合CMDB中的站點基本信息,實現監控指標的多個管理維度分析,並經過Show大屏可視化呈現全國的數據質量。

三、 某海外平安城市運維項目

平安城市中存在大量的IT設備與海量的物聯網設備須要運維管理,其運維團隊對於整個城市的攝象頭故障老是頭痛不已,一直處於被動運維的狀態。

優雲VideoMon能快速完成上萬路的攝象頭圖像質量分析監控,大量減小運維團隊的巡檢成本。對存在故障的結點,優雲Alert經過告警熱圖功能,從地域、類型、業務等多個維度,爲用戶呈現故障分佈狀況,快速幫助用戶找到問題根源,縮短故障修復時間。

 

InfoQ:談談對自動化運維的展望。

 

蔣君偉:自動化運維必然是大勢所趨,而且會愈來愈快地改變咱們的運維工做,目前咱們所處的時代是一箇舊與新的過渡時代,就像集裝箱發明後的航運業同樣。

在集裝箱剛開始被髮明出來的階段,你們從心理到技術上都沒有做好準備,包括貨主、公路、鐵路、港口、吊車到輪船,都沒有爲集裝箱作好配套。但因爲幾個關鍵事件,集裝箱的標準化,以及隨之配套的操做、運輸手段,很快就改變了全世界。

咱們如今也是,雖然容器及服務、函數及服務技術已經出現,但咱們還有太多的歷史債務須要償還,因此如今的標準化與自動化的收益還不明顯,自動化運維的成本還很高。

但隨着歷史債務的解決,新的應用研發、運維手段,都會圍繞着這些新技術配套起來,到時候自動化運維就很是容易實施與得到巨大收益。

最後,咱們運維人員也會像碼頭工人同樣,須要改變咱們的技術工做內容與深度,不然就會被下崗。

 

嘉賓介紹:

 

蔣君偉,優雲產品副總裁,IT運維領域的十年老兵,前後研發了網絡管理、系統管理、CMDB、ITSM等產品,併成功建設了國內多個全國性的網絡管理與運維管理項目。現從事優雲新一代數據中心運維產品研發工做,主要負責產品線規劃、核心技術研發、研發團隊建設與運維諮詢等工做。

相關文章
相關標籤/搜索