VMware雲管平臺運維管理



內容來源:2018年1月30日,VMware大中華區高級技術講師姚泉在「VMware官方在線直播」進行《VMware雲管平臺運維管理》演講分享。IT 大咖說做爲獨家視頻合做方,經主辦方和講者審閱受權發佈。數據庫

閱讀字數:4068 | 6分鐘閱讀安全

嘉賓演講視頻地址: suo.im/4yXcMj

摘要

跨 SDDC 和多雲環境從應用到基礎架構的智能 IT 運維管理。與 vRealize Log Insight 和 vRealize Business for Cloud 集成的 VMware vRealize Operations 經過統一監控、自動執行的性能管理、雲計算規劃和容量優化,可幫助規劃、管理和擴展 SDDC 和多雲環境。服務器

VMware雲管平臺

全部的雲管平臺底層都是要基於軟件定義的數據中心。VMware專門提到了軟件定義數據中心,就是用軟件的方式對底層的基礎架構進行虛擬化,包括服務器虛擬化、存儲虛擬化和網絡虛擬化,分別由不一樣的產品去實現。網絡

有了這些基礎架構以後,對整個數據中心都作了軟件定義。那麼在上層如何作高效的管理呢?VMware就推出了一個雲管平臺,叫作vRealize。在這個套件中有不少核心組件,來共同實現平臺的自動化管理。其中有三大塊內容,一個是自動化部署的vRA,一個是作智能運維的vR Ops,以及作成本分析的vRB,這三塊共同支撐起了雲管平臺。架構

這期咱們重點來介紹vR Ops。負載均衡

當咱們面對一個雲計算平臺的時候會發現,在雲平臺中最大的特色就是用戶羣很是大,尤爲是公有云,成千上萬甚至有可能會過億的用戶都有可能會請求一些虛擬機去使用。用戶在請求這些資源的時候若是要後臺的管理員按照傳統虛擬機的部署去作批量部署的話,時間會很長,效率也很低。運維

有了雲管平臺以後,能夠經過特定的組件讓用戶自助式地請求機器,而平臺就會把流程自動化部署出來。這就是經過vRA作機器的自動化部署,使得性能更加高效。工具

當環境規模很大的時候,機器很是多,如何進行性能的分析、監控,以及故障的管理呢?這就須要一個高智能的軟件,這個軟件就是vR Ops。性能

經過vR Ops能夠對大規模雲平臺裏的機器進行智能的性能分析。可是做爲租戶來講,在使用這些雲平臺資源的時候,每一個人用的資源和服務是不同的,最終成本也有所不一樣。學習

爲了對用戶使用的資源進行智能的成本分析,因而咱們作了vRB,讓用戶知道本身的錢花在了什麼地方。

vRealize Operations——雲運維智能化

在整個平臺中,vRealize Operations實現了性能的管理、容量管理、成本管理、配置管理以及合規性管理。

vRealizeOperations能夠對底層的不一樣平臺進行鏈接,它能夠管理虛擬平臺、物理平臺,甚至能夠管理一些雲平臺。換句話說,整個雲管平臺實際上是跨平臺兼容的。

vRealize Operations Manager控制檯

咱們從6.6開始改版後的一個全新界面,咱們引入了一個全新的基於HTML5的用戶管理界面。

登陸以後若是選擇任何一個對象,好比選擇一個主機,就能看到這個主機相關的一些性能參數指標。這裏有很是重要的三個指標,一個是健康,一個是風險,還有一個就是效率。

登陸首頁

若是是首次登陸Operations Manager,能夠看到首頁與以前的首頁略有不一樣。

在頁面頂部有五個選項卡,分別表明五塊核心功能。左側有一些簡單的導航欄,中間則是一些具體的參數信息顯示,尤爲是當前須要採起的一些行動,這對用戶來講是很是關鍵的。右上角是一些簡單的菜單。在這樣的界面中用戶能獲得一個全新的體驗。

預約義儀表盤

打開第二個選項卡,就能看到一些核心的功能,也就是預約義儀表盤。在整個環境中,儀表盤很是重要。由於每個儀表盤裏面都會顯示出不一樣的內容、指標和參數。

頁面左側有一些系統自定義的儀表盤,一樣能夠對這些儀表盤進行管理,好比編輯、新建甚至設爲默認頁。

警報

在Operations Manager裏面,警報是一個智能警報。智能警報不只能夠告訴用戶出現了什麼問題,還能告知出現問題的緣由,甚至能給出解決問題的方案。經過智能警報能讓用戶直觀地瞭解到系統出現的問題。

環境

在環境中,用戶能夠針對不一樣的對象去看到全部的核心指標。在頁面右側有三列綠色圖標分別表明着健康、風險和效率,它們的圖標形狀各不同。

在Operations Manager中,圖標的顏色有四種,綠色、黃色、橘黃色和紅色。綠色就表示當前狀態一切正常,紅色則表明着出現了嚴重的問題。用戶能夠經過顏色判斷當前環境哪個業務須要及時進行調整。

查看相關對象

用戶能夠經過某些特定的對象查看到相關聯的對象。在界面中,經過一個對象的點擊,就能夠看到該對象的其它相關聯對象。

查看對象細節

好比點擊一個主機,就能夠看到該主機關聯的虛擬機、存儲、網絡等等,很是方便地讓用戶對這些對象有一個初步的瞭解和認識。點擊任何對象,頁面右側就會顯示出該虛擬機的參數信息,用戶能夠經過這些參數信息獲取到本身所需的信息。

查看對象關聯關係

也能夠經過拓補圖查看到對象彼此間的關聯關係,都是很是智能的。並且不少圖表均可以根據用戶自身的需求去進行選擇。

管理頁面

在用戶管理的時候能夠選擇一些具體的參數,管理員可以作到一些集中化的管理。

數據流結構

vRealizeOperations實例包含若干個組件用來收集和傳輸數據。

vRealize Operations數據庫

vRealizeOperations 包含如下數據庫:文件系統數據庫、集中式vPostgres、警報/症狀vPostgres、HIS vPostgres和Cassandra。

安裝和配置

第一步要部署一個OVF,由於Operations Manager自己就是一個封裝好的OVF模版,把虛擬機下載好直接部署到環境裏就能夠了。

部署完OVF以後,能夠進行一些初始的配置。在配置的時候須要打開相應界面作一些初始化的工做。若是規模比較大,可能會涉及到須要建立數據節點、數據的遠程收集節點等等。由於規模大或者要進行跨棧點數據採集的話,只用一個節點不能知足咱們的需求,這樣就須要一個主節點和備節點,也可能須要一個遠程的數據採集節點。

只要部署一個Operations Manager的節點,其實從理論上來講就已經足夠了。以後就會進入產品的用戶界面去作一些初次的嘗試和使用。整個部署過程相對來講並不複雜。

集羣規模

在部署的時候可能會涉及到一些集羣規模。好比Operations Manager的一個主棧點根據它所管理的對象數量不一樣,CPU內存的配置也不同。用戶能夠根據自身的需求進行選擇。

vRealize Operations 6.6 的新特性

更易於使用同時加速產生價值

更簡單更易用。新的HTML5的用戶界面提供了一個更簡單的和一致的體驗。

更快捷的導航。全新「入門」儀表盤讓你快速定位到須要的地方。

加速診斷恢復,人性化的儀表盤可在一個地方集中提供答案。儀表板被分紅類別,如操做、容量和利用率,性能測試、負載平衡、配置和合規。

加速產生價值。開箱即用的集成,例如存儲(vSAN), 日誌(vRLI), 業務(vRBC) 和自動化(vRA)。

內嵌vSAN管理

完成的vSAN管理。容許集中管理在延伸集羣,完整的存儲管理能力,包括管理績效、能力、日誌、配置和健康。

從單個控制檯確認vSAN準備就緒,完整可視性讓vSAN部署更有信心。經過性能和容量監控運維vSAN環境。

SDDC健康概覽儀表盤

單一控制檯監控整個SDDC的狀態。

擴展支持。SDDC-應用-運維-視圖及針對每一個產品的健康分類;SDDC-應用-組件關聯到底層基礎設施的健康狀態(部署實例及虛機健康一致性);加強的開箱即用;健康和合規,報警與改進建議。

熱圖

在Operations Manager中有一個很是重要的功能叫作熱圖。熱圖能夠實時對比所選虛擬機指標的性能,它通常包含一個或兩個指標,一個指標定義圖中方塊大小,另外一個指標定義圖中方塊顏色。

Project

Project在以前的版本中叫作「what if」。「what if」能夠翻譯爲「假設」,假設未來添加或刪除了若干對象,那麼資源還可以用多久。

容量模型預測

經過project 功能, 能夠快速預測將來資源變化帶來的影響。

原始告警-- >智能告警

在原始告警中,只是根據系統的運行狀態作一個簡單的監控,而後作一些靜態的警報觸發,這裏有一個參數叫作靜態閥值。靜態閥值指的就是設定一個固定的參數,當監控系統發現這個指標超過閥值的時候就會機械地發出警報。這時用戶可能會收到沒必要要的警報。

動態閥值會智能地分析過去一段時間的歷史趨勢,並告訴用戶在什麼時間段達到怎樣的峯值狀態是正常現象,在其它時間段達到怎樣的峯值是不正常現象。這是一個智能的表現。

靜態閥值引會起過分告警,而動態閥值可以逐漸學習並識別高負載但健康的狀態。閥值根據負載狀況和時間段不一樣會有相應的波動。

減小調查和解決問題的時間

Alerts減小調查問題的平均時間,Recommendations減小解決問題的平均時間。

動態閥值對發現故障有什麼意義

傳統監控只能設置靜態閥值,每每具備誤導性。業務高峯期間,VM的資源使用率處於很高的水平是正常的。靜態閥值會顯得過於敏感,會生成沒必要要的告警。業務非高峯期間,即便VM資源使用只達到50%,也多是異常狀況,而靜態閥值會忽略這類異常。

靜態閥值僅考慮上限,而不考慮下限也是不夠的。當CPU或RAM的使用率忽然降到5%如下,有多是嚴重事故的前兆。例如存儲延遲忽然增大引發的應用響應速度急劇降低,或整個存儲的IOPS忽然全面降低可能意味着存儲機頭的嚴重問題。監控工具也不會作任何提示。

智能工做負載放置

智能工做負載放置功能能夠藉助DRS決定工做負載放置的最好位置。重平衡功能建議工做負載的遷移位置。

DRS 管理–完成DRS 控制

確保DRS配置。查看DRS設置,知足業務需求。經過參數設置是否激進以及是否徹底自動化,能夠從vROps中進行修改。

查看vMotion趨勢記錄有多少是生成環境,以及是否符合預期。

加強了自身負載均衡功能

徹底自動化的工做負載平衡。

保證性能,橫跨數據中心的全自動工做負載均衡能力。跨集羣(Cluster)和數據存儲(Datastore)來進行負載均衡;更方便地根據業務須要來控制負載均衡的程度;三種方法來激活負載均衡功能:手動、自動、定時;能強大的儀表盤:監控和調節關於負載均衡的狀態和參數;

確保DRS配置,查看和設置DRS設置以得到更好的平衡。

避免爭用。在資源爭用發生前,產生可預見的DRS 動做。

最佳初始部署。使用vRA,利用運維分析優化工做負載的初始部署位置。

應用案例及經常使用使用場景

雲平臺特色

負載動態變遷,運行環境不固定,狀態難以跟蹤。

配置變化更快,資產生命週期短,統計分析難。

資源動態分配,虛擬機之間既共享又競爭,資源邊界彈性化。

新技術,新特性,安全管理新要求。

系統高度融合,組件之間依賴性更高,影響分析難。

用戶痛點

1.因爲Cloud環境的資源共享和動態配置特性,雲環境下的資源管理變得更加複雜難控,資源的驚人浪費和局部資源的緊張狀況同時存在存在。

2.安全管理上基本無針對虛擬化環境的管理規範,手段及工具,安全短板問題較明顯。

3.資產配置信息缺少深刻及時準確的統計分析,基本靠手工,信息與實際環境誤差較大。

4.缺少相關分析報表和麪板視圖,對於雲環境較大規模的環境缺少全局管理能力。

5.虛擬化環境缺少有效的監控措施,管理被動,問題沒法及時發現,出現沒法有效分析。

6.缺少自動化工具,對大規模高度動態環境缺少足夠的響應和控制管理能力。

容量優化

優化資源配置,提升現有資源利用率。發現並回收低效、未使用的容量,發現容量不足和超額配置狀況,以便合理調整虛擬機大小、回收閒置資源,在不影響性能的狀況下優化整合率和虛擬機密度。

容量規劃

vROps藉助VMware對vSphere和雲計算環境的深刻理解,提供了智能的容量分析和規劃能力,包括對vSphere虛擬化環境的CPU, 內存, 存儲以及網絡等資源的現有容量使用狀況統計, 容量使用趨勢, 進而幫助運維管理人員合理規劃虛擬化環境的資源, 避免資源耗盡及資源浪費, 提升虛擬化效率。

配置管理

提供詳盡而持續的配置數據收集、配置評估和更改審覈,提供統一配置數據報告,幫助用戶及時掌握虛擬化環境資產信息。

運行分析

專家報表:提供多種類型的針對虛擬化環境的分析報表。

專家面板:1.從健康,風險,效率等角度綜合展現虛擬化環境的總體運行態勢;2.提供多指標對比分析熱圖;3.提供綜合虛擬機,網絡,存儲的拓撲面板展現。

故障管理

全面的指標覆蓋:vSphere,NSX,vSAN,結構化數據及非結構化數據,綜合指標。

故障分析:動態閾值,綜合分析,專家知識。

故障解決:自動化故障處理。

對於Operations Manager,咱們還提供了多達100+種擴展管理包,涵蓋網絡、存儲、數據庫、中間件和企業應用等多種類型組件。

相關練習資源

vROPsHOL資源訪問:http://labs.hol.vmware.com/HOL/catalogs/

視頻資源

服務質量管理:http://v.youku.com/v_show/id_XMTQ2MDE3OTYzMg==

vSphere合規性:http://v.youku.com/v_show/id_XMTQ2MDAzNTQ0OA==

容量規劃:http://v.youku.com/v_show/id_XMTQ1OTUyNjM1Ng==

運營管理:http://v.youku.com/v_show/id_XMTQ1OTk3Nzk3Mg==

我今天的分享就到這裏,謝謝你們

相關文章
相關標籤/搜索