自2006年至今,雲計算商用領域已經歷了十餘載的發展。雲也從概念普及進入到普遍應用階段,雲服務變成了像水電同樣的基礎服務,已是行業共識。web
雲發展速度快、成長空間大,監控場景複雜數據庫
最新Gartner的報告預測到2019年公有云市場將達到2062億美圓,較2018年將會增加17.3%,然而這個規模依然只佔全球範圍內IT支出的5.4%(據Gartner預測,2019年全球IT支出將達到3.8萬億美圓)。從這些數據能夠看出,將來至關長一段時間,雲計算業務還將繼續處於快速發展階段,而且有着巨大的增加空間。瀏覽器
隨着雲服務的快速發展,部署在雲上的業務系統愈來愈多,規模也愈來愈大,與此同時針對雲上業務系統的監控也就變得愈來愈重要。Gartner報告顯示,儘管已經有39%的上雲企業爲其系統定製了監控解決方案,但總體上來講,監控系統的覆蓋範圍還有不少須要完善的地方,尤爲是針對混合雲業務場景的監控。緩存
爲客戶提供完整的雲上系統監控解決方案微信
調研典型上雲客戶業務系統發現,中大型客戶更傾向於將系統構建在混合雲環境之上,並依賴公有云提供的計算、網絡、存儲等服務,來實現自身業務的彈性,而小型客戶則更多的直接將業務系統部署到雲上,而且出於運維和研發成本的考慮,所依賴的雲服務種類和數量愈來愈多。網絡
對於一個典型的雲系統的監控來講,除了要關注雲系統的模塊架構組成外,還要關注其依賴的雲服務,同時從業務價值的角度出發,還要關注服務的連通性和性能,當有故障的時候,須要可以提供對應的手段去定位和分析產生問題的緣由。架構
經過分析,能夠得出雲上客戶對監控的需求以下:運維
支持雲上服務監控,如雲磁盤、對象存儲、數據庫、大數據等雲服務監控。編輯器
支持跨雲主機或與用戶自建環境組成的混合雲場景監控。
性能
支持客戶業務系統以及客戶業務價值監控,支撐客戶平常運維與運營行爲。
預留擴展能力,提供相應機制或開放API接口,供其它故障處理系統、變動管理系統感知監控目標的狀態變化,並依此構建完整的運維體系。
實現思路: 服務模型屏蔽差別
標準組件提高系統能力
構建服務模型屏蔽服務間模型差別
雲由服務提供商提供的一系列計算、存儲、AI應用類服務組成,每種服務的業務模型都不盡相同。如虛機、塊存儲的實例模型,數據庫、緩存、容器服務的集羣模型。語音識別、語音合成、人臉識別服務提供的API或API集合模型。構建在這些雲服務資源之上的系統,因爲業務場景不一樣,也會呈獻出或繁或簡的架構形態。
爲了應對結構複雜、模型多變的雲上需求,提供可擴展、適應性強的監控能力,就須要定製出一套標準的模型出來,對上屏蔽不一樣雲服務資源模型與客戶業務系統資源模型的差別,對下支撐標準監控能力建設,這就是服務管理模型。服務模型要解決以下兩個問題:
抽象實體模型特徵,針對雲服務資源或客戶業務系統按功能、結構劃分出來的具備一致性功能的實體。
刻畫模型間關係,用於描述或定義不一樣類型的實體間層級或關聯關係,支撐不一樣實體間指標數據計算。
圍繞服務模型構建可伸縮監控能力
因爲服務模型屏蔽掉了業務模型的差別,在監控能力建設方面,就能夠圍繞服務模型構建標準化的採集、計算、存儲、異常檢測、告警、可視化等能力。經過形式多樣的採集手段實現監控對象指標的收集,再經過計算和模型間關係實現業務指標的轉換,並將對應結果存儲起來,供後續的異常檢測分析與可視化使用。
打造從雲資源到客戶業務系統到終端
用戶價值的全棧監控產品
在標準化的監控能力建設完成以後,要作的是細分客戶監控場景,並針對性的打造細分場景監控子產品。
用戶在使用雲系統的整個過程能夠簡化爲上圖所示模型。用戶經過公共網絡鏈接到服務,對應的用戶請求經過入口服務完成轉發,由具體的部署在容器、虛機或物理機上應用服務進程完成處理並返回給用戶,固然在處理的過程當中一般會涉及到不一樣應用服務進程間調用和對雲服務資源的調用。根據監控的場景,將監控的場景細分爲如下幾個場景:
站點監控,監測客戶服務的連通性與可用性,監測分佈在不一樣地理位置或網絡的用戶的訪問服務的狀態和性能。
應用(系統)監控,監控應用或系統的資源使用狀況及健康狀態,經過進程、日誌、腳本、Http、端口、語義等多種手段。
主機監控,監測應用進程運行的主機/容器等宿主環境的資源使用狀況與健康狀態。
雲服務監控,監測雲上業務系統依賴的雲服務資源狀態和性能。
業務監控,從業務價值的角度去分析對應變化以及追蹤致使這些變化的可能誘因。
結束語: 擴展監控生態,護航雲上業務
經過雲監控提供的實時異常檢測機制和可視化效果,不只可讓客戶對自身業務現狀、以及支撐業務的系統狀態瞭然於胸,還能夠在問題發生時幫助客戶快速定位故障,保障業務價值的連續穩定。同時,經過監控系統經過預留的接口能夠方便實現與外部自系統對接,與其它自動化系統共同構建監控運維生態,爲雲上客戶業務系統的穩定保駕護航。
本文介紹了咱們雲上監控產品的願景與設計思路,接下來,咱們還會深刻的介紹如何使用百度雲上的監控、運維管理產品來定製構建本身的解決方案,敬請期待!
Mason 百度資深研發工程師
負責百度智能運維(Noah)雲監控平臺的架構設計與研發工做,致力於推動監控能力在公有云及私有云場景落地。
本文分享自微信公衆號 - 百度智能雲(baidu_cloud)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。