織雲 Metis:看騰訊怎麼作智能運維

歡迎你們前往騰訊雲+社區,獲取更多騰訊海量技術實踐乾貨哦~

做爲企業智能運維門戶,業界早已關注織雲的智能運維體系。咱們很榮幸地宣佈織雲 Metis 智能運維體系正式發佈。自此,織雲家族已發佈:織雲企業版,織雲社區版(Lite),織雲 Metis 智能運維。企業版和社區版區別請戳數據庫

Metis 是騰訊內部落地實踐的智能運維場景的集合,具有多種核心能力,如智能監控、智能分析、智能決策等。這些核心能力已在多元化、多樣化的運維場景中獲得落地實踐。Metis 是從騰訊QQ、Qzone 等海量業務的一體化運維體系中孵化產生的,是織雲 AIOps 的最佳實踐。負載均衡

織雲 Metis 應用場景

業務高質量保障

利用機器學習技術,進行異常檢測、故障定位、瓶頸分析等,可在無人工干預下,智能地保障業務高質量運行。例如時間序列異常檢測、DLP 生死指標監控、多維下鑽、關聯分析、ROOT 根源分析等場景都是Metis在質量保障方面的典型應用。運維

運維效率提高

利用天然語言處理、機器學習技術,深挖智能問答、智能變動、智能決策,顯著地提高運維人員的效率。例如智能客服機器人、輿情監控、智能負載均衡、數據庫調參、極限調度等場景都是 Metis 在提高運維效率上的典型應用。機器學習

成本優化管理

利用大數據智能分析技術,進行資源(設備、帶寬、存儲)管理,可迅速分析資源使用的明細,並經過橫向大數據對比挖掘可優化點。織雲團隊在 GOPS2018 全球運維大會--騰訊運維體系專場分享的《十億元背後的價值》中歸納了Metis成本管理挖掘的衆多優化項。學習

織雲 Metis 智能化優點

智能分析決策, 取代繁瑣重複的人工診斷

在平常運維過程當中,運維人員積累了大量的人工經驗,同時大部分故障都是重複的、需人工定位的。重複性的分析會損耗人力,並且人工確認存在滯後性。織雲Metis能夠把豐富的運維經驗固化下來,對常見問題實現分鐘級內自動診斷,可直接給出故障定位的結果信息。大數據

  • 對於已知的故障:織雲 Metis 可以綜合故障數據和人工經驗自動提取故障特徵,以故障特徵庫的形式,自動匹配定位故障;
  • 對於未知場景:織雲 Metis 可根據故障特徵推算出可能的緣由,並在人工確認後加入故障特徵庫。

智能精準預測,取代人工粗略預估

爲了保障產品的正常運營,容量預留過多或過少都會存在一些問題。而傳統的基於運維經驗容量預測手段不是十分有效,織雲 Metis 根據業務目標的需求,結合服務數據,整合業務運維人員的業務經驗,創建精準容量規劃模型,從而精確預測各個業務的容量,讓資源使用率達到最優。優化

開放預定體驗--時間序列異常檢測

時間序列異常檢測是 Metis 組成部分之一,承載了海量業務的監控告警功能。其優越性體如今三點:ui

無閾值智能判決

運維人員無需設置告警閾值,檢測模型可對數據異常智能判決,直觀告訴你們檢測結果是正常仍是異常;spa

通用檢測模型

智能檢測的模型由海量的業務樣本數據訓練而成,適合複用在時間序列類數據的檢測中;資源

可成長業務反饋

實踐過程當中也會遇到較個性的業務場景,這裏支持用戶標註反饋檢測結果,異常檢測系統能夠自動化地根據用戶反饋信息進行進階學習、優化模型,增強對業務的理解,變得愈來愈懂業務。

 

當即預定

織雲 Metis--時間序列異常檢測誠邀您體驗智能運維場景。

猛戳此連接預定 https://wj.qq.com/s/2024612/b6d1
 

 

此文已由做者受權騰訊雲+社區發佈,原文連接:https://cloud.tencent.com/developer/article/1114222?fromSource=waitui

相關文章
相關標籤/搜索