這是一個大數據爆發的時代。面對信息的激流、多元化數據的涌現,咱們在獲取、存儲、傳輸、理解、分析、應用、維護大數據時,無疑須要一種便捷的信息交流通道,以便快速、有效、準確地理解和駕馭這個過程。本文將經過時序數據庫(InfluxDB)+Grafana的實踐,來介紹如何將數據便捷地展示出來。web
1、InfluxDB算法
開源的分佈式時序、時間和指標數據庫,使用Go語言編寫,無需外部依賴。其中,時間序列數據庫是數據格式裏包含Timestamp字段的數據,好比某一時間用戶上網流量、通話詳單等。可是,有什麼數據不包含Timestamp呢?幾乎全部的數據均可以打上一個Timestamp字段。時間序列數據更重要的一個屬性是如何去查詢它,包括數據的過濾、計算等。數據庫
它有三大特性:編程
時序性(Time Series):與時間相關的函數的靈活使用(例如最大、最小、求和等);api
度量(Metrics):對實時大量數據進行計算;跨域
事件(Event):支持任意的事件數據,換句話說,任意事件的數據咱們均可以作操做。安全
我的認爲InfluxDB的幾個優勢:負載均衡
無特殊依賴,幾乎開箱即用(如ElasticSearch須要Java)運維
自帶數據過時功能;curl
自帶權限管理,精細到「表」級別;
原生的HTTP支持,內置HTTP API
強大的類SQL語法,支持min, max, sum, count, mean, median 等一系列函數,方便統計。
自帶管理界面(以下圖),免插件配置。
InfluxDB基本概念
一、與傳統數據庫中的名詞作比較
InfluxDB中的名詞 |
傳統數據庫中的概念 |
database |
數據庫 |
measurement |
數據庫中的表 |
points |
表裏面的一行數據 |
二、InfluxDB中特有的概念
1)Point
Point由時間戳(time)、數據(field)、標籤(tags)組成。
Point至關於傳統數據庫裏的一行數據,以下表所示:
Point屬性 |
傳統數據庫中的概念 |
time |
每一個數據記錄時間,是數據庫中的主索引(會自動生成) |
fields |
各類記錄值(沒有索引的屬性)也就是記錄的值:溫度, 溼度 |
tags |
各類有索引的屬性:地區,海拔 |
2)series
全部在數據庫中的數據,都須要經過圖表來展現,而這個series表示這個表裏面的數據,能夠在圖表上畫成幾條線:經過tags排列組合算出來。
以下所示:
3、InfluxDB相關API
InfluxDB 支持http api 方式寫入數據。使用curl這個工具來模擬HTTP 請求,在實際使用中,能夠將請求寫入代碼中,經過其餘編程語言來模擬HTTP請求。
例如:經過HTTP API向Internet_users這張表添加數據
curl -v –XPOST "http:// localhost:8086/write?db=Internet&u=user&p=password" --data-binary "Internet_users,users=小區上網用戶,mobile=移動端上網用戶,users_num=56,
mobile_num=21 1493571600000000000"
說明:
db=Interne是指使用Interne數據庫;
--data-binary後面是需插入數據,其中:
Internet_users:表名(measurement)
tag字段:users和mobile,值分別爲:小區上網用和移動端上網用戶
field key字段:users_num和mobile_num,值分別爲56和21
時間戳(timestamp):1493571600000000000
這樣,就向Interne數據庫的Internet_users表中插入了一條數據。
須要注意,DB參數必須指定一個數據庫中已經存在的數據庫名,數據體的格式聽從InfluxDB規定格式,首先是表名,後面是tags,而後是field,最後是時間戳。tags、field和時間戳三者之間以空格相分隔。
InfluxDB 數據可視化工具
InfluxDB 用於存儲基於時間的數據,好比監控數據,由於InfluxDB自己提供了Http API,因此可使用InfluxDB很方便的搭建了個監控數據存儲中心。對於InfluxDB中的數據展現,這裏不得不提數據展現利器-Grafana。
2、Grafana
一個純粹的HTML/JS應用,其功能很是強大,訪問InfluxDB時不會有跨域訪問的限制。只要配置好數據源爲InfluxDB以後就能夠,剩下的工做就是配置圖表。
配置數據源:
設置查詢條件:
展現數據:
Grafana告警功能
沒有比」可視化「更好的一個詞能來歸納運維的本質,我想Grafana也是深知廣大運維人員的痛處:如何用可視化數聽說話? 因此Grafana在 4.0之後版本:新增報警功能(Alerting),根據官網介紹,Grafana報警方式也有不少種,常見的Email、Slack即時通信、webhook等。
下圖爲目前集羣Grafana監控界面,主要包含對集羣主機CPU、內存配合Grafana的閾值預警功能:
主機內存和CPU使用率監控:
經過規則配置,可配置相關監控規則,包含相關邏輯與時間跨度以及監控告警條件。目前,僅支持一種條件類型—— Query 。能夠指定Query字母,時間跨度和聚合函數。字母指定你在Metrics tab裏設置的聚合函數。Query的結果和聚合函數將會是一個單一的值,用於後面判斷是否超過了閾值。
規則配置完成後可在報警列表裏統一查看報表狀態:
3、實踐案例
一、數據採集規劃
目前採集數據主要來源於Hadoop的jmx監控,獲取相關Cluster、Queue等Metrics信息以及部分Oracle日誌信息,經過相關接口寫入InfluxDB數據庫,根據來源及日誌信息從數據庫層進行獨立管理設計,以便後續維護。
2、InfluxDB數據庫權限配置
InfluxDB自帶權限控制,權限分別爲:
ADMIN:全部者
READ :只讀 (精確到庫與表)
WRITE:只寫 (精確到庫與表)
ALL (READ 和 WRITE ) :讀和寫
鑑於源數據流,目前只會用到三個角色,對於這三個角色分工以下:
ADMIN:維護人員
READ:數據展現與後臺查詢(Grafana上設置的Influnxdb爲只讀)
WRITE:外部程序(插入數據至Influnxdb)
配置數據庫權限需開啓相關認證,操做以下:
vi /etc/InfluxDB/InfluxDB.conf
把 [http] 標籤下的 auth-enabled 選項值改成 true
[http]
enabled = true
bind-address = ":8086"
auth-enabled = true
log-enabled = true
write-tracing = false
pprof-enabled = false
https-enabled = false
https-certificate = "/etc/ssl/InfluxDB.pem"
3、Influnxdb和Grafana高可用配置
本次實踐爲了不因主機通斷而致使Influnxdb和Grafana服務沒法使用的狀況,因此在部署應用時用了2臺虛擬機,2臺虛擬機安裝的服務以下:
主機 |
服務 |
Localhost-01 |
InfluxDB+Grafana |
Localhost-02 |
InfluxDB+Grafana |
在系統層方面又作了以下設置:
主機域名設置
將兩臺主機設置爲主備模式,共用同一個域名http://xxx.xxx.com
域名 |
主機 |
主備模式 |
http://xxx.xxx.com |
Localhost-01 |
主 |
http://xxx.xxx.com |
Localhost-02 |
備 |
負載均衡設置
負載均衡設置即VIP主用與容災端域名+端口與的Localhost-01~02主備節點域名+端口映射。你們都知道InfluxDB和Grafana端口以下圖展現:
服務 |
端口 |
InfluxDB |
8083 |
InfluxDB |
8086 |
InfluxDB |
8088 |
Grafana |
3000 |
因此映射關係可設計成這樣:
VIP:主用ip、容災ip
VPORT:8083
均衡算法:pi 32 rr
健康檢查:tcp
實例IP及端口:
Localhost-01的ip 8083
Localhost-02的ip 8083
其它端口均按此設置,負載均衡設置完成後,這裏不得不提Grafana配置,若是要作到可視化展現的高可用,那麼Grafana配置數據源就必須採用域名+端口的方式:
至此數據安全設置完畢。
4、Grafana界面配置
完成以上環境配置,根據相關需求進行Grafana界面配置以及監控配置,具體操做能夠參照官網操做教程,這裏再也不贅述。
HDFS目錄配額監控:
HDFS空間使用率監控: