grafana----alert

Alert只有grafana V4.0以上。

Introduction(介紹)

Grafana中的alert容許在dashboard panels你附加一些規則。當你保存儀表板Grafana將提取的報警規則到一個單獨的報警規則庫和安排評審它們。sql

在"graph」面板的「Alert」選項卡中,您能夠配置應該評估警報規則的頻率以及警報須要更改狀態並觸發通知的條件。數據庫

Execution

警報規則在Grafana後端的一個調度程序和查詢執行引擎中被評估,這是Grafana核心的一部分。如今只支持一些數據源。他們包括Graphite, Prometheus, InfluxDB and OpenTSDB。後端

Clustering

當前警報支持配置高可用性。從v4.2.0開始,當運行多個服務器時,警報通知會快速去除重複的。這意味着全部的警告在每一個服務器上執行,但沒有重複的警告通知發送(deduping logic)。將來將引入適當的警報負載平衡。服務器

Rule Config

目前只有graph面板支持報警規則但這將被添加到singlestat和錶板以及在將來的版本。函數

 

Name & Evaluation interval

在這裏,您能夠指定警報規則的名稱,以及調度器應該多長時間對警報規則進行評估。測試

Conditions

目前惟一存在的條件類型是一個查詢條件,容許您指定查詢字母(metric裏查詢語句的字母,表明哪一個查詢語句)、時間範圍和聚合函數。this

Query condition example

例:avg() OF query(A, 5m, now) IS BELOW 14:
 從如今開始,往前的5分鐘Metric那條sql查出來數據的平均值 小於14
  • avg() :控制如何將每一個serie 值下降到一個能夠與閾值比較的值。 點擊該功能能夠選擇另外一個聚合函數。
  • query(A, 5m, now) :字母A表明從Metrics頁籤查詢A查詢條件語句。第二個參數定義了時間範圍, 5m, now 意思從如今到如今的5分鐘。這是有用的,若是你想忽略最後2分鐘的數據。
  • IS BELOW 14:定義的閾值和閾值的類型。你能夠點擊IS BELOW 改變閾值的類型

警報規則中使用的查詢不能包含任何模板變量。目前,咱們只支持條件之間的AND\OR操做。
例如,咱們有如下3個條件:條件:A(計算爲true)或條件:B(計算爲false)和條件:C(計算爲:true),因此結果將被計算爲((真或假)和true)= true。lua

咱們計劃在未來添加其餘的條件類型,像其餘警報同樣,您能夠在您的條件和時間中包含另外一個警報的狀態。spa

Multiple Series

若是一個查詢返回多個series,那麼將對每一個series進行聚合函數和閾值檢查。Grafana目前沒有作的是每系列的跟蹤警報規則。這一點在下面的場景中有詳細的含義。調試

  • 報警條件查詢,返回2系列:Server1和Server2
  • server1系列致使警報規則消防開關狀態Alerting
  • 通知發送消息:load peaking (server1)
  • 在一個相同的報警規則Server2序列的子序列評價也引發火災預警規則
  • 因爲警報規則已經處於狀態Alerting,因此沒有發出新通知。

因此你能夠看到從上面的場景,當其餘系列引發警戒火災若是規則已經在狀態報警,Grafana不會發出通知時,。爲了改進對返回多個系列的查詢的支持,咱們計劃在未來的版本中跟蹤每一個序列的狀態。

No Data / Null values

下面的條件,你能夠配置返回沒有數據或空數據,規則評估引擎應該如何處理查詢。

No Data Option:If no data or all values are nul

NoData:設置警報規則狀態爲空

Alerting:將警報規則狀態設置爲報警

 keep Last state:保持當前的警報規則狀態。

Execution errors or timeouts

下面的選項,若是處理超時錯誤:If execution error or timeout

Alerting:將警報規則狀態設置爲報警

 keep Last state:保持當前的警報規則狀態。

若是一個不可靠的 time series存儲,當查詢超時或隨機失敗時,您能夠設置這個選項Keep Last State基本上忽略它們。

 

Notifications

在警告選項卡中,還能夠指定警報規則通知,以及關於警報規則的詳細信息。這個消息能夠包含任何信息,關於如何解決這個問題的信息,連接到runbook等。

實際的通知被配置並在多個警報之間共享。閱讀 notifications指南,瞭解如何配置和設置通知。

Alert State History & Annotations

警惕狀態的變化都被記錄在內部註釋Grafana的數據庫表。狀態更改可視爲警報規則的圖形面板中的註釋。你也能夠去alert的子State history中查看和clear history(清除歷史狀態)。

Troubleshooting

 

您能夠作的第一級故障排除是點擊Test Rule按鈕。您將獲得結果,您能夠擴展到能夠看到從查詢返回的原始數據的點。

進一步的診斷也能夠經過檢查grafana服務器日誌。若是不是錯誤,或者因爲某種緣由,日誌什麼也不說,您能夠爲某些相關組件啓用調試日誌記錄。這是在Grafana的INI配置文件了。

 

Alert List Panel

這個新面板容許您顯示警報規則或警報規則狀態更改的歷史記錄。您能夠根據您感興趣的狀態進行篩選。這個面板式儀表盤是很是有用的概述。

   show

    current state:當前的狀態。

    recent state changes:最近的狀態。

  Max items:顯示警告數目

  Alerts form this dashboard:選擇只顯示當前dashboard的警告;不選擇顯示全部dashboard的警告。

state filter:顯示狀態變動的類型,不選擇,所有顯示。 

 

 

Alert Notifications

當警報改變狀態時,它發出通知。每一個警報規則能夠有多個通知。但爲了添加通知警報規則首先須要添加和配置通知渠道(能夠是電子郵件,Pagerduty或其餘集成)。這是從通知通道頁面完成的。

Notification Channel Setup

在Notification Channels上,單擊New Channel按鈕,轉到能夠配置和設置新通知通道的頁面。
指定name和type,以及指定特定選項。您還能夠測試通知以確保它正確地工做和安裝。

Send on all alerts

選中後,該選項將使該通知用於全部警報規則,現有的和新的。

Supported Notification Types

Grafana有下列通知類型:

Email

啓用電子郵件通知你在grafana配置設置SMTP設置。電子郵件通知會將警報圖像的圖像上傳到外部圖像目的地,若是可用的話,或者在電子郵件中附加圖像的後退。

相關文章
相關標籤/搜索
本站公眾號
   歡迎關注本站公眾號,獲取更多信息