基於InfluxDB+Grafana打造大數據監控利器--轉

時間 2019-11-11

標籤基於 influxdb+grafana influxdb grafana 打造數據監控利器简体版

原文原文鏈接

這是一個大數據爆發的時代。面對信息的激流、多元化數據的涌現，咱們在獲取、存儲、傳輸、理解、分析、應用、維護大數據時，無疑須要一種便捷的信息交流通道，以便快速、有效、準確地理解和駕馭這個過程。本文將經過時序數據庫(InfluxDB)+Grafana的實踐，來介紹如何將數據便捷地展示出來。web

1、InfluxDB算法

開源的分佈式時序、時間和指標數據庫，使用Go語言編寫，無需外部依賴。其中，時間序列數據庫是數據格式裏包含Timestamp字段的數據，好比某一時間用戶上網流量、通話詳單等。可是，有什麼數據不包含Timestamp呢？幾乎全部的數據均可以打上一個Timestamp字段。時間序列數據更重要的一個屬性是如何去查詢它，包括數據的過濾、計算等。數據庫

它有三大特性：編程

時序性（Time Series）：與時間相關的函數的靈活使用（例如最大、最小、求和等）；api
度量（Metrics）：對實時大量數據進行計算；跨域
事件（Event）：支持任意的事件數據，換句話說，任意事件的數據咱們均可以作操做。安全

我的認爲InfluxDB的幾個優勢：負載均衡

無特殊依賴，幾乎開箱即用（如ElasticSearch須要Java）運維
自帶數據過時功能；curl
自帶權限管理，精細到「表」級別；
原生的HTTP支持，內置HTTP API
強大的類SQL語法，支持min, max, sum, count, mean, median 等一系列函數，方便統計。
自帶管理界面(以下圖)，免插件配置。

InfluxDB基本概念

一、與傳統數據庫中的名詞作比較

InfluxDB中的名詞	傳統數據庫中的概念
database	數據庫
measurement	數據庫中的表
points	表裏面的一行數據

二、InfluxDB中特有的概念

1）Point

Point由時間戳（time）、數據（field）、標籤（tags）組成。

Point至關於傳統數據庫裏的一行數據，以下表所示：

Point屬性	傳統數據庫中的概念
time	每一個數據記錄時間，是數據庫中的主索引(會自動生成)
fields	各類記錄值（沒有索引的屬性）也就是記錄的值：溫度，溼度
tags	各類有索引的屬性：地區，海拔

2）series

全部在數據庫中的數據，都須要經過圖表來展現，而這個series表示這個表裏面的數據，能夠在圖表上畫成幾條線：經過tags排列組合算出來。

以下所示：

3、InfluxDB相關API

InfluxDB 支持http api 方式寫入數據。使用curl這個工具來模擬HTTP 請求，在實際使用中，能夠將請求寫入代碼中，經過其餘編程語言來模擬HTTP請求。

例如：經過HTTP API向Internet_users這張表添加數據

curl -v –XPOST "http:// localhost:8086/write?db=Internet&u=user&p=password" --data-binary "Internet_users,users=小區上網用戶,mobile=移動端上網用戶,users_num=56,

mobile_num=21 1493571600000000000"

說明：

db=Interne是指使用Interne數據庫；
--data-binary後面是需插入數據，其中：

Internet_users：表名（measurement）
tag字段：users和mobile,值分別爲：小區上網用和移動端上網用戶
field key字段：users_num和mobile_num，值分別爲56和21
時間戳（timestamp）：1493571600000000000

這樣，就向Interne數據庫的Internet_users表中插入了一條數據。

須要注意，DB參數必須指定一個數據庫中已經存在的數據庫名，數據體的格式聽從InfluxDB規定格式，首先是表名，後面是tags，而後是field，最後是時間戳。tags、field和時間戳三者之間以空格相分隔。

InfluxDB 數據可視化工具

InfluxDB 用於存儲基於時間的數據，好比監控數據，由於InfluxDB自己提供了Http API，因此可使用InfluxDB很方便的搭建了個監控數據存儲中心。對於InfluxDB中的數據展現，這裏不得不提數據展現利器-Grafana。

2、Grafana

一個純粹的HTML/JS應用，其功能很是強大，訪問InfluxDB時不會有跨域訪問的限制。只要配置好數據源爲InfluxDB以後就能夠，剩下的工做就是配置圖表。

配置數據源：

設置查詢條件：

展現數據：

Grafana告警功能

沒有比」可視化「更好的一個詞能來歸納運維的本質，我想Grafana也是深知廣大運維人員的痛處：如何用可視化數聽說話？因此Grafana在 4.0之後版本：新增報警功能（Alerting），根據官網介紹，Grafana報警方式也有不少種，常見的Email、Slack即時通信、webhook等。

下圖爲目前集羣Grafana監控界面，主要包含對集羣主機CPU、內存配合Grafana的閾值預警功能：

主機內存和CPU使用率監控：

經過規則配置，可配置相關監控規則，包含相關邏輯與時間跨度以及監控告警條件。目前，僅支持一種條件類型—— Query 。能夠指定Query字母，時間跨度和聚合函數。字母指定你在Metrics tab裏設置的聚合函數。Query的結果和聚合函數將會是一個單一的值，用於後面判斷是否超過了閾值。

規則配置完成後可在報警列表裏統一查看報表狀態：

3、實踐案例

一、數據採集規劃

目前採集數據主要來源於Hadoop的jmx監控，獲取相關Cluster、Queue等Metrics信息以及部分Oracle日誌信息，經過相關接口寫入InfluxDB數據庫，根據來源及日誌信息從數據庫層進行獨立管理設計，以便後續維護。

2、InfluxDB數據庫權限配置

InfluxDB自帶權限控制，權限分別爲：

ADMIN：全部者
READ :只讀（精確到庫與表）
WRITE：只寫（精確到庫與表）
ALL (READ 和 WRITE ) ：讀和寫

鑑於源數據流，目前只會用到三個角色，對於這三個角色分工以下：

ADMIN：維護人員
READ：數據展現與後臺查詢（Grafana上設置的Influnxdb爲只讀）
WRITE：外部程序（插入數據至Influnxdb）

配置數據庫權限需開啓相關認證，操做以下：

vi /etc/InfluxDB/InfluxDB.conf

把 [http] 標籤下的 auth-enabled 選項值改成 true

[http]

enabled = true

bind-address = ":8086"

auth-enabled = true

log-enabled = true

write-tracing = false

pprof-enabled = false

https-enabled = false

https-certificate = "/etc/ssl/InfluxDB.pem"

3、Influnxdb和Grafana高可用配置

本次實踐爲了不因主機通斷而致使Influnxdb和Grafana服務沒法使用的狀況，因此在部署應用時用了2臺虛擬機，2臺虛擬機安裝的服務以下：

主機	服務
Localhost-01	InfluxDB+Grafana
Localhost-02	InfluxDB+Grafana

在系統層方面又作了以下設置：

主機域名設置

將兩臺主機設置爲主備模式，共用同一個域名http://xxx.xxx.com

域名	主機	主備模式
http://xxx.xxx.com	Localhost-01	主
http://xxx.xxx.com	Localhost-02	備

負載均衡設置

負載均衡設置即VIP主用與容災端域名+端口與的Localhost-01～02主備節點域名+端口映射。你們都知道InfluxDB和Grafana端口以下圖展現：

服務	端口
InfluxDB	8083
InfluxDB	8086
InfluxDB	8088
Grafana	3000

因此映射關係可設計成這樣：

VIP：主用ip、容災ip
VPORT：8083
均衡算法：pi 32 rr
健康檢查：tcp
實例IP及端口：

Localhost-01的ip 8083

Localhost-02的ip 8083

其它端口均按此設置，負載均衡設置完成後，這裏不得不提Grafana配置，若是要作到可視化展現的高可用，那麼Grafana配置數據源就必須採用域名+端口的方式：

至此數據安全設置完畢。

4、Grafana界面配置

完成以上環境配置，根據相關需求進行Grafana界面配置以及監控配置，具體操做能夠參照官網操做教程，這裏再也不贅述。

HDFS目錄配額監控：

HDFS空間使用率監控：

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。