做爲企業智能運維門戶,業界早已關注織雲的智能運維體系。咱們很榮幸地宣佈織雲 Metis 智能運維體系正式發佈。自此,織雲家族已發佈:織雲企業版,織雲社區版(Lite),織雲 Metis 智能運維。企業版和社區版區別請戳。數據庫
Metis 是騰訊內部落地實踐的智能運維場景的集合,具有多種核心能力,如智能監控、智能分析、智能決策等。這些核心能力已在多元化、多樣化的運維場景中獲得落地實踐。Metis 是從騰訊QQ、Qzone 等海量業務的一體化運維體系中孵化產生的,是織雲 AIOps 的最佳實踐。負載均衡
利用機器學習技術,進行異常檢測、故障定位、瓶頸分析等,可在無人工干預下,智能地保障業務高質量運行。例如時間序列異常檢測、DLP 生死指標監控、多維下鑽、關聯分析、ROOT 根源分析等場景都是Metis在質量保障方面的典型應用。運維
利用天然語言處理、機器學習技術,深挖智能問答、智能變動、智能決策,顯著地提高運維人員的效率。例如智能客服機器人、輿情監控、智能負載均衡、數據庫調參、極限調度等場景都是 Metis 在提高運維效率上的典型應用。機器學習
利用大數據智能分析技術,進行資源(設備、帶寬、存儲)管理,可迅速分析資源使用的明細,並經過橫向大數據對比挖掘可優化點。織雲團隊在 GOPS2018 全球運維大會--騰訊運維體系專場分享的《十億元背後的價值》中歸納了Metis成本管理挖掘的衆多優化項。學習
在平常運維過程當中,運維人員積累了大量的人工經驗,同時大部分故障都是重複的、需人工定位的。重複性的分析會損耗人力,並且人工確認存在滯後性。織雲Metis能夠把豐富的運維經驗固化下來,對常見問題實現分鐘級內自動診斷,可直接給出故障定位的結果信息。大數據
爲了保障產品的正常運營,容量預留過多或過少都會存在一些問題。而傳統的基於運維經驗容量預測手段不是十分有效,織雲 Metis 根據業務目標的需求,結合服務數據,整合業務運維人員的業務經驗,創建精準容量規劃模型,從而精確預測各個業務的容量,讓資源使用率達到最優。優化
時間序列異常檢測是 Metis 組成部分之一,承載了海量業務的監控告警功能。其優越性體如今三點:ui
運維人員無需設置告警閾值,檢測模型可對數據異常智能判決,直觀告訴你們檢測結果是正常仍是異常;blog
智能檢測的模型由海量的業務樣本數據訓練而成,適合複用在時間序列類數據的檢測中;資源
實踐過程當中也會遇到較個性的業務場景,這裏支持用戶標註反饋檢測結果,異常檢測系統能夠自動化地根據用戶反饋信息進行進階學習、優化模型,增強對業務的理解,變得愈來愈懂業務。
織雲 Metis--時間序列異常檢測誠邀您體驗智能運維場景。
問答相關閱讀
此文已由做者受權騰訊雲+社區發佈,原文連接:https://cloud.tencent.com/developer/article/1114222?fromSource=waitui