阿里雲性能監控 ARMS 全真3D拓撲揭祕

摘要: 微服務架構下,各種服務之間存在着錯綜複雜的依賴關係。一旦業務出現問題,追查問題源頭就比如大海撈針,沒有頭緒。但業務不等人,此時,在最短的時間內定位問題根源是開發和運維人員對微服務監控產品的核心訴求。 傳統的監控產品提供了表格(table)、表單(form)和儀表盤(dashboard)三種展示形式,因其侷限性,並沒有法完整和直觀的提供監控詳情,以快速定位問題。前端

微服務架構下,各種服務之間存在着錯綜複雜的依賴關係。一旦業務出現問題,追查問題源頭就比如大海撈針,沒有頭緒。但業務不等人,此時,在最短的時間內定位問題根源是開發和運維人員對微服務監控產品的核心訴求。前端框架

傳統的監控產品提供了表格(table)、表單(form)和儀表盤(dashboard)三種展示形式,因其侷限性,並沒有法完整和直觀的提供監控詳情,以快速定位問題。阿里雲性能監控 ARMS 新推出的全真3D拓撲功能給這個問題帶來了完美的解決方案。ARMS 3D拓撲功能,創新地採用三維立體的方式展現系統中真實的架構層級和關係,利用ThreeJS的前端框架創建一個立體的監控空間,讓用戶一目瞭然地看到系統的結構與狀態。架構

傳統監控方式的不足

在傳統的監控產品中,咱們最多見的界面就是表格、表單和儀表盤這三種,但這三種界面皆有其侷限性。框架

  • 表格:一般用於展現大量數據,信息密集,頻繁翻頁,大部份內容爲數值和文字,不夠直觀。
  • 表單:用於展現某個實例的詳細內容,涉及大量文字和圖表的閱讀。缺點是一次只能聚焦一個實例,若有下層信息,須要跳轉到更深層級。
  • 儀表盤:以圖表形式對信息的聚合展現,更直觀和生動。但一個版面展現信息有限,通常下層信息閱讀量就不多。

由於這種界面形式上的限制,咱們經常不得不面對讓人頭昏眼花的大量表格,爲了定位一個問題反覆跳轉,一不留神就迷失在茫茫數據中,想要理解數據之間的關係只能靠經驗和記憶。運維

ARMS的監控創新

ARMS 經過使用全真3D的方式(簡稱 ARMS 3D拓撲)去展現系統的立體性,幫助用戶快速理解和追蹤系統節點中的關係。微服務

首先,咱們將系統從底到上抽象爲 主機-應用-服務 這三個層級,這也是咱們在傳統監控方式中關注最多的三層信息。在這三個層級上的模塊分別表明系統中真實存在的主機(ECS/物理機)- 應用 - 服務。縱向的連線表明主機對應用的支持,以及服務在應用上的歸屬。性能

用戶除了能夠從全局視角看到本身的整個系統,也能夠單獨縮放和旋轉某一層級,詳細查看主機的集羣和負載狀況,應用之間的調用關係,以及服務的調用量、錯誤率等。下面咱們來一一介紹各層級展現的內容。阿里雲

應用層

應用層展示內容有四個部分:spa

  • 中心應用
  • 中心應用依賴的應用
  • 使用中心應用服務的應用
  • 中心應用依賴的中間件

總的來講,就是展現服務自身、服務被誰調用以及服務間的依賴關係。點擊應用,會彈出右側面板,應用的QPS、RT、ERROR的信息都在上面展現。同時,動態的連線關係讓咱們更清楚地看到應用之間的調用關係,以及中間件組件對系統的支持,甚至底層、主機層每一個主機的健康狀況。3d

服務層

服務層就是展現各個應用提供的服務詳情信息,鼠標滑過就有服務名展現,顏色表示這個服務的響應時長超過閾值(可配置),須要關注。

主機層

主機層展示的是各個應用的主機詳情,點擊每一個主機能夠看到主機的CPU、MEM、Load信息,超過閾值的指標會標記顏色。另外還會展示主機的靜態信息,好比主機所隸屬的機房、單元、主機名稱、JVM、Tomcat版本信息等。

以往咱們從出錯的服務到應用,再定位到具體的機器,可能須要十幾回頁面跳轉,而在 ARMS 3D拓撲 的三維世界中,咱們在一個頁面中就能夠完成這些動做。三維世界的交互方式—拉近、拉遠、轉換視角和摺疊展開,代替了頁面的跳轉。用戶不管拉近到哪一個機器或應用,均可以快速的理解本身在系統中所處的位置以及和其餘層級的關係,不會由於操做鏈路過長而迷失本身。

接入方式

當前,ARMS 3D拓撲功能已經上線,用戶只要成功接入ARMS的探針,就能以3D的方式去查看本身的系統狀態,不須要額外的操做與費用。

總結

ARMS 3D拓撲功能提供了一種全新的交互方式,擴充了和應用溝通的維度,實現了360度全方位診斷性能瓶頸和故障節點,以甄別故障出現時,哪些應用和哪些關聯的主機出現了問題等,今後,應用離咱們如此之近。

原文連接

相關文章
相關標籤/搜索