問題管理——交互機器人

簡介:封神-問題管理 | 交互機器人

image.png

1. 項目背景

平臺運維過程當中,平臺用戶必然會產生一些問題。在最初運維階段均是由用戶直接與平臺運維人員進行溝通,反饋問題或提出一些疑問,如此勢必會增長大量的溝通成本,如圖1所示。在長期運維過程當中會暴露出以下問題。數據庫

圖片1.jpg
圖1架構

1.1 用戶痛點

①不清楚有問題該去找誰解決或找不到人;
②沒法感知問題處理進度;
③溝通成本較高,重要問題沒法及時處理;運維

1.2 運維痛點

①內部信息不能有效共享;
②問題管理多入口,問題跟蹤混亂,重複解決相同問題;
③問題處理週期長,交接過程繁瑣易遺漏問題;工具

2. 業務架構

2.1 架構說明

問題管理機器人是用於幫助運維人員與用戶創建各類類型的問題處理流程,管理全部的問題並跟蹤記錄這些問題的處理方法,同時爲用戶提供一個分配、流轉和協做處理問題的工做平臺。
問題管理機器人以解決問題爲導向,經過對問題入口的統一,用戶側/運維側業務入口均爲釘釘羣。釘釘羣分爲妲己(用戶側)/紂王(運維側),客戶問題在妲己羣中提出並流轉至紂王羣,由運維人員進行接單處理,如圖2所示。阿里雲

圖片2.jpg
圖2spa

2.2 功能特色

  1. 依賴釘釘機器人集中管理全部的問題,手機、電腦多終端適配;
  2. 記錄全部問題,保證它們被及時處理並最終解決,避免問題被忽略、拖延或遺忘,並不斷累積;
  3. 從問題被錄入開始,便一直有人對其負責,直至問題被關閉;
  4. 記錄問題處理過程的所有信息(如處理人、處理時長、處理內容等);
  5. 減小大量詢問、督促、報告等溝通工做;

2.3 功能分組

用戶側羣
  1. 問題錄入:規範化錄入模板,由用戶直接@機器人進行問題錄入;
  2. 問題查詢:隨時查詢問題,獲知問題當前處理進度;
  3. 問題修改:用戶可對問題進行指定問題處理人、評價問題、打回問題、加急問題等操做;
  4. 問題導出:我的維度支持多種導出選項並將問題導出爲Excel,方便進行總結匯報;

3.jpg
圖3設計

運維側羣
  1. 問題查詢:多種查詢模式,按照自身需求對問題進行查詢;
  2. 問題修改:運維人員能夠對問題進行暫掛、標記、變動狀態、更新進度、轉交問題等操做;
  3. 問題導出:全局維度支持多種導出選項並將問題導出爲Excel,方便進行總結匯報;
  4. 進度監控:問題處理時長超時提醒,加快問題處理進度;
  5. 問題播報:按期播報未解決的問題列表,及時發現其中重要問題;

4.jpg
圖4日誌

問題大盤
  1. 數據可視化:按照問題分佈平臺、產品、處理人員、數量分佈等維度生成報表。
  2. 問題詳情:能夠搜索問題詳情、處理時長等。

1618995758503-3560f015-4bb2-4d14-9bd3-ef544e8f8c5b.png
圖5圖片

3. 問題處理

3.1 處理流程

圖片6.jpg
圖6開發

3.2 流程說明

環節 釘釘羣 角色 說明 處理狀態變動
1.1 客戶羣 用戶 @妲己,機器人自動回覆須要下一步操做選項。
1.2 客戶羣 用戶 @妲己機器人,選擇錄入問題,問題錄入成功後,自動將問題推送到駐場羣,等待接手。 待處理
1.3 客戶羣 妲己(機器人) @妲己機器人,選擇查詢問題。
1.4 客戶羣 用戶 機器人自動分配問題ID,並推送問題錄入詳情,如要修改問題,需關閉從新提交。
1.5 客戶羣 用戶 回覆目前未解決問題,點擊問題能夠查看詳情。
1.6 客戶羣 用戶 選擇是否修改問題狀態,否/臨時關閉/已解決。
1.7 客戶羣 用戶 選擇「臨時關閉」-此問題暫掛,問題不會經過「查詢問題未解決」查詢到,但能夠經過「查詢問題所有」中顯示,經過@妲己修改問題,從新啓動問題。 處理中->臨時關閉
1.8 客戶羣 妲己(機器人) 選擇「已解決」-問題關閉,可經過@妲己查詢所有問題查看。 處理中->已解決
1.9 客戶羣 用戶 收到駐場「問題處理更新」消息推送,進行處理狀態選擇操做。
2.1 駐場羣 運維人員 收到用戶問題錄入推送通知。
2.2 駐場羣 運維人員 接手用戶錄入的問題。 待處理->處理中
2.3 駐場羣 運維人員 選擇是否轉交問題到其餘駐場。
2.4 駐場羣 運維人員 ①不轉交-處理問題。②問題驗證未解決,修改「問題處理狀態」爲「處理中」。 已解決待客戶驗證->處理中
2.5 駐場羣 運維人員 @紂王,修改問題處理進度,修改爲功自動推送到客戶羣並@問題提出人。
2.6 駐場羣 運維人員 選擇是否「修改問題處理狀態」,如已解決更改狀態爲「已解決待客戶驗證」。 處理中->已解決待客戶驗證
2.7 駐場羣 運維人員 @紂王轉交問題ID。支持主動轉交接手人和主動轉交其餘運維人員。
2.8 駐場羣 運維人員 播報-天天10點、14點、18點、20點自動播報問題處理狀況(累計處理狀況、今日解決狀況)。超時-①每10分鐘推送提醒未接手問題,②從問題錄入成功開始4h/8h/12h/24h/48h推送超時提醒並@TAM。

4. 結語

本期爲你們介紹了問題管理機器人的設計初衷及目前達到的效果。目前問題管理機器人已服務於數個混合雲項目,項目問題跟蹤效率明顯提高,用戶體驗提高,大幅下降問題處理過程產生的溝通成本。
接下來會陸續給你們介紹封神的其餘模塊,包括運維大盤、報表分析、時序數據庫等相關知識,敬請期待!

參考文檔

[1] 釘釘機器人:https://developers.dingtalk.com/document/tutorial

相關內容

[1] 封神-運維大腦 | 日誌檢測工具
[2] 封神-核心功能 | 釘釘告警+數據網關

咱們是阿里雲智能全球技術服務-SRE團隊,咱們致力成爲一個以技術爲基礎、面向服務、保障業務系統高可用的工程師團隊;提供專業、體系化的SRE服務,幫助廣大客戶更好地使用雲、基於雲構建更加穩定可靠的業務系統,提高業務穩定性。咱們指望可以分享更多幫助企業客戶上雲、用好雲,讓客戶雲上業務運行更加穩定可靠的技術,您可用釘釘掃描下方二維碼,加入阿里雲SRE技術學院釘釘圈子,和更多雲上人交流關於雲平臺的那些事。

本文內容由阿里雲實名註冊用戶自發貢獻,版權歸原做者全部,阿里雲開發者社區不擁有其著做權,亦不承擔相應法律責任。具體規則請查看《阿里雲開發者社區用戶服務協議》和《阿里雲開發者社區知識產權保護指引》。若是您發現本社區中有涉嫌抄襲的內容,填寫侵權投訴表單進行舉報,一經查實,本社區將馬上刪除涉嫌侵權內容。
相關文章
相關標籤/搜索