Zabbix 3.0入門到企業實戰一(介紹監控的目的需求)

zabbix監控 

一:爲何要監控

  • 首先咱們從如下幾點分析監控的目的?

1.1運維職責

  • 1.保障企業數據的安全的可靠
  • 2.爲客戶端提供7*24小時服務(保證7*24小時提供訪問)
  • 3.不斷提高用戶體驗

 1.2網站的可用性

所謂網站可用性(availability)也即網站正常運行時間的百分比,業界用 N 個9 來量化可用性, 最常說的就是相似 「4個9(也就是99.99%)」 的可用性。node

描述mysql

通俗叫法sql

可用性級別緩存

年度停機時間安全

基本可用性網絡

2個9運維

99%socket

87.6小時測試

較高可用性網站

3個9

99.9%

8.8小時

具備故障自動恢復能力的可用性

4個9

99.99%

53分鐘

極高可用性

5個9

99.999%

5分鐘

    1個9:(1-90%)*365=36.5天,表示該軟件系統在連續運行1年時間裏最多可能的業務中斷時間是36.5天
    2個9:(1-99%)*365=3.65天 , 表示該軟件系統在連續運行1年時間裏最多可能的業務中斷時間是3.65天 3個9:(1-99.9%)*365*24=8.76小時,表示該軟件系統在連續運行1年時間裏最多可能的業務中斷時間是8.76小時。 4個9:(1-99.99%)*365*24=0.876小時=52.6分鐘,表示該軟件系統在連續運行1年時間裏最多可能的業務中斷時間是52.6分鐘。 5個9:(1-99.999%)*365*24*60=5.26分鐘,表示該軟件系統在連續運行1年時間裏最多可能的業務中斷時間是5.26分鐘。 6個9:(1-99.9999%)*365*24*60*60=31秒, 示該軟件系統在連續運行1年時間裏最多可能的業務中斷時間是31秒

 1.3經常使用的系統監控命令

 1.31查看cpu相關命令

lscpu、uptime、top、htop vmstat mpstat

#經常使用的幾個cpu相關命令:
[root@node1 ~]# lscpu Architecture: x86_64 CPU op-mode(s): 32-bit, 64-bit Byte Order: Little Endian CPU(s): 4 On-line CPU(s) list: 0-3 Thread(s) per core: 1 Core(s) per socket: 4 Socket(s): 1 NUMA node(s): 1 Vendor ID: GenuineIntel CPU family: 6 Model: 79 Model name: Intel(R) Xeon(R) CPU E5-26xx v4 Stepping: 1 CPU MHz: 2394.446 BogoMIPS: 4788.89 Hypervisor vendor: KVM Virtualization type: full L1d cache: 32K # 這兩個都是一級緩存 L1i cache: 32K L2 cache: 4096K #二級緩存 NUMA node0 CPU(s): 0-3

[root@node1 ~]# top
top - 15:50:05 up 14 days,  3:45,  2 users,  load average: 0.00, 0.01, 0.05 Tasks: 87 total, 2 running, 85 sleeping, 0 stopped, 0 zombie %Cpu(s): 0.5 us, 0.0 sy, 0.0 ni, 99.5 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st KiB Mem : 8010528 total, 330152 free, 738124 used, 6942252 buff/cache KiB Swap: 0 total, 0 free, 0 used. 6945896 avail Mem PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 1 root 20 0 188596 3728 2424 S 0.0 0.0 0:17.39 systemd 2 root 20 0 0 0 0 S 0.0 0.0 0:00.00 kthreadd 3 root 20 0 0 0 0 S 0.0 0.0 0:03.80 ksoftirqd/0 5 root 0 -20 0 0 0 S 0.0 0.0 0:00.00 kworker/0:0H 6 root 20 0 0 0 0 S 0.0 0.0 0:00.00 kworker/u8:0 7 root rt 0 0 0 0 S 0.0 0.0 0:04.76 migration/0 8 root 20 0 0 0 0 S 0.0 0.0 0:00.00 rcu_bh 9 root 20 0 0 0 0 S 0.0 0.0 4:05.34 rcu_sched

 #說明

task: 系統多少個進程

cpu 使用率   0.0%us, 用戶使用的  0.3%sy 系統使用改的  99.7%id 系統空閒

mem 內存的使用率  

swap

 

top 命令默認是經過cpu使用率來排序的

經常使用的參數

z  加顏色

x排序列高亮

shift +>  有毅力排序

shift +p #cpu排序 

shift +m #mem排序 內存

[root@m01 tools]# yum -y install htop
htop系統默認沒有裝,咱們須要經過yum來下載安裝,安裝依賴與epel源。
htop 支持鼠標能夠操做 能夠刪除等

 

 

 1.32內存相關命令

free 

-h  人類可讀
-m 使用兆顯示 -g 使用G方式顯示

[root@node1 ~]# free -h
total used free shared buff/cache available
Mem: 7.6G 720M 313M 376K 6.6G 6.6G
Swap: 0B 0B 0B
[root@node1 ~]# free -m
total used free shared buff/cache available
Mem: 7822 721 313 0 6788 6782
Swap: 0 0 0
[root@node1 ~]# free -g
total used free shared buff/cache available
Mem: 7 0 0 0 6 6
Swap: 0 0 0

 1.33磁盤相關的命令

df dd iotop  

hdparm -t /dev/sda #用來測試磁盤的讀寫速度

[root@node1 ~]# df -h
Filesystem      Size  Used Avail Use% Mounted on
/dev/vda1        50G   22G   25G  47% /
devtmpfs        3.9G     0  3.9G   0% /dev
tmpfs           3.9G     0  3.9G   0% /dev/shm
tmpfs           3.9G  372K  3.9G   1% /run
tmpfs           3.9G     0  3.9G   0% /sys/fs/cgroup
tmpfs           783M     0  783M   0% /run/user/0
#系統磁盤使用率達到百分百,可是還有一些剩餘空間,是留給咱們超級管理員進行操做
#主要監控磁盤的使用率大小
[root@node1 ~]# dd if=/dev/zero of=./test,data bs=100M count=2
2+0 records in
2+0 records out
209715200 bytes (210 MB) copied, 0.330058 s, 635 MB/s
#用來測試咱們磁盤的io寫入速度
if input 從哪裏輸入  of  output  輸出
[root@node1 ~]# iotop
Total DISK READ :    0.00 B/s | Total DISK WRITE :      27.62 K/s
Actual DISK READ:    0.00 B/s | Actual DISK WRITE:     102.59 K/s
  TID  PRIO  USER     DISK READ  DISK WRITE  SWAPIN     IO>    COMMAND                                                                                      
  286 be/3 root        0.00 B/s   15.78 K/s  0.00 %  0.09 % [jbd2/vda1-8]
28035 be/4 root        0.00 B/s    3.95 K/s  0.00 %  0.00 % systemd-journald
28049 be/4 root        0.00 B/s    3.95 K/s  0.00 %  0.00 % rsyslogd -n [rs:main Q:Reg]
 7093 be/3 root        0.00 B/s    3.95 K/s  0.00 %  0.00 % auditd
    1 be/4 root        0.00 B/s    0.00 B/s  0.00 %  0.00 % systemd --switched-root --system --deserialize 21
    2 be/4 root        0.00 B/s    0.00 B/s  0.00 %  0.00 % [kthreadd]
    3 be/4 root        0.00 B/s    0.00 B/s  0.00 %  0.00 % [ksoftirqd/0]
 1540 be/4 mysql       0.00 B/s    0.00 B/s  0.00 %  0.00 % mysqld --basedir=/usr/local/mysql-5.6.38 --data~-pid-file=/usr/local/mysql-5.6.38/data/node1.pid
    5 be/0 root        0.00 B/s    0.00 B/s  0.00 %  0.00 % [kworker/0:0H]
    6 be/4 root        0.00 B/s    0.00 B/s  0.00 %  0.00 % [kworker/u8:0]

#io 越小最好

#io大 就佔用的比較大

1.34網絡監控命令

iftop nethogs

iftop 監控主機間流量 -i 指定監控網卡

nethogs 監控進程流量

小總結:

  • 監控一切須要監控的東西,只要可以想到,能夠經過命令實現都能監控 
  • 監控的範疇
相關文章
相關標籤/搜索