自動化與監控運維日誌

監控體系

自動化與監控運維日誌

1、grafana界面顯示無數據展現

自動化與監控運維日誌

排錯流程:

一、找到錶盤所顯示的數據源
二、登錄到數據源所在機器,查看數據庫是否在運行
2.一、未運行,則運行數據庫
2.二、運行中,則登錄數據庫
2.2.一、influxdb直接在系統中influx登錄,
2.2.二、prometheus直接登錄主機IP:9090
三、查看無數據顯示的數據庫中有無數據
3.一、庫中有數據,檢查數據源與grafana之間鏈接
3.二、庫中無數據,檢查數據源與採集軟件(腳本)之間鏈接
四、查看採集組件(node_exporter或採集腳本)是否運行
4.一、未運行,則運行採集組件
4.二、運行中,檢查採集組件是否存在問題node

現狀:

一、influxdb庫中數據到昨天下午截止
二、手動運行採集腳本(經過curl的-X POST方式上傳)
自動化與監控運維日誌python

報錯:influxdb-error:max-values-per-tag limit 100000
influxdb官網對於這條配置的解釋:
https://docs.influxdata.com/enterprise_influxdb/v1.7/administration/config-data-nodes/#max-values-per-tag-100000linux

處理方法1:清除舊數據

influx數據庫

use DATABASES;
show measurements 查看錶
drop measurement TABLES;運維

處理方法2:修改influxdb配置,將max-values-per-tag的值改成0,意思是不限制數據條數

配置文件:influxdb.conf
自動化與監控運維日誌python2.7

2、ansible報錯

ERROR! Unexpected Exception, this is probably a bug: (cryptography 0.8.2 (/usr/lib64/python2.7/site-packages), Requirement.parse('cryptography>=1.1'))curl

緣由:cryptography模塊版本太低
處理方法:pip安裝
一、下載pip
https://pypi.org/project/pip/#files
pip-19.1.tar.gz
wheel-0.33.1-py2.py3-none-any.whlide

二、安裝
tar xzvf pip-19.1.tar.gz
cd pip-19.1/
python setup.py install
pip install wheel-0.33.1-py2.py3-none-any.whlui

三、安裝cryptography
https://pypi.org/project/cryptography/#files
cryptography-2.6.1-cp27-cp27mu-manylinux1_x86_64.whlthis

pip install cryptography-2.6.1-cp27-cp27mu-manylinux1_x86_64.whl

3、grafana界面展現數據中斷

自動化與監控運維日誌

現狀:

一、grafana數據源配置鏈接正常
二、數據源influxdb數據中斷
自動化與監控運維日誌
三、懷疑是telegraf問題

處理:重啓telegraf

systemctl restart telegraf
數據入庫正常
自動化與監控運維日誌grafana界面顯示正常

相關文章
相關標籤/搜索