重要性能監測工具:top、vmstat、w、uptime、ps、free、iostat、netstat、/proc等php
須要監視Linux服務器的性能?大多數Linux發行版都集成了一些監視工具。這些工具能夠獲取有關係統活動的信息的詳細指標。經過這些工具,你能夠發現產生系統性能問題可能存在緣由。下面討論的是一些最基本的命令,它涉及到系統分析和調試服務器等一些問題,如:
1. 找出系統瓶頸問題.
2. 磁盤 (儲存) 瓶頸問題.
3. CPU和內存瓶頸問題.
4. 網絡瓶頸問題.
# 1: top – 查看活動進程的命令########################################html
TOP工具可以實時顯示系統中各個進程的資源佔用情況。默認狀況下,它將顯示系統中CPU最「敏感」的任務列表.該命令能夠按CPU/內存的使用狀況和執行時間對任務進行排序,並每五秒鐘更新一次。node
經常使用的快捷鍵mysql
Top命令爲咱們提供了不少有用的快捷鍵,如:linux
快捷鍵 用法ios
t 切換顯示進程和CPU狀態信息。web
m 切換顯示進程和CPU狀態信息。redis
A 分類顯示各類系統資源的消耗狀況。可用於快速識別系統的性能要求極高的任務。sql
o 改變顯示項目的順序。apache
r 從新設置進程的優先級別。(系統提示用戶輸入須要改變的進程PID以及須要設置的優先級值。)
k 終止一個進程。(系統將提示用戶輸入須要終止的進程PID)
s 改變刷新的時間間隔。
u 查看指定用戶的進程。
# 2: vmstat – 系統活動、硬件以及系統信息
這個命令用來報告關於內核線程、虛擬內存、磁盤、陷阱和CPU活動的統計信息。
# vmstat 3 輸出樣例: procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu------ r b swpd free buff cache si so bi bo in cs us sy id wa st 0 0 0 2540988 522188 5130400 0 0 2 32 4 2 4 1 96 0 0 1 0 0 2540988 522188 5130400 0 0 0 720 1199 665 1 0 99 0 0 0 0 0 2540956 522188 5130400 0 0 0 0 1151 1569 4 1 95 0 0 0 0 0 2540956 522188 5130500 0 0 0 6 1117 439 1 0 99 0 0 0 0 0 2540940 522188 5130512 0 0 0 536 1189 932 1 0 98 0 0 0 0 0 2538444 522188 5130588 0 0 0 0 1187 1417 4 1 96 0 0 0 0 0 2490060 522188 5130640 0 0 0 18 1253 1123 5 1 94 0 0
顯示內存使用狀況:
# vmstat –m
# 3: w – 找到已登錄的用戶而且查看他們作了什麼操做
W命令用來顯示機器上最近登錄的用戶信息以及他們的進程信息。
# 4: uptime – 系統已運行的時間
Uptime命令能夠查看系統已經運行了多長時間。截止當前時間日期,系統已經運行了多長時間,當前登陸的用戶有哪些,已經在過去的1,5,15分鐘,系統的平均負載值狀況。
# uptime 18:02:41 up 41 days, 23:42, 1 user, load average: 0.00, 0.00, 0.00
一般被認爲是最佳的負載值。系統負載值根據系統的不一樣而不一樣。對於單CPU的系統,負載值在1-3爲正常,SMP的系統,負載值在6-10之間也是能夠接受的。
# 5: ps – 顯示進程
ps命令用來報告當前進程的快照。要選擇全部進程,使用-ef選項:
只顯示lighttpd的進程樹:
# pgrep lighttpd
Or
# pgrep -u vivek php-cgi
顯示pid爲55977的進程名:
# ps -p 55977 -o comm=
找出最耗費內存的前10個進程:
# ps -auxf | sort -nr -k 4 | head -10
找出最耗費CPU的前10個進程:
# ps -auxf | sort -nr -k 3 | head -10
# 6: free – 查看內存的使用狀況
free指令會顯示內存的使用狀況,包括實體內存,虛擬的交換文件內存,共享內存區段,以及系統核心使用的緩衝區.
free的輸出一共有四行,第四行爲交換區的信息,分別是交換的總量(total),使用量(used)和有多少空閒的交換區(free)。
第二行和第三行是比較讓人迷惑的。這兩行都是說明內存使用狀況的。第一列是總量(total),第二列是使用量(used),第三列是可用量(free)。第一行的輸出時從操做系統(OS)來看的。
# 7: iostat – 監視CPU平均負載值,I/O狀態
該命令用於報告CPU和輸入/輸出設備,分區和網絡文件系統(NFS)的詳細統計數據。
基本使用以下:
參數 -d 表示,顯示設備(磁盤)使用狀態;-k某些使用block爲單位的列強制使用Kilobytes爲單位;1 10表示,數據顯示每隔1秒刷新一次,共顯示10次。
# 8: mpstat – 實時系統監視工具
mpstat是MultiProcessor Statistics的縮寫,是實時系統監控工具。其報告與CPU的一些統計信息,這些信息存放在/proc/stat文件中。在多CPUs系統裏,其不但能查看全部CPU的平均情況信息,並且可以查看特定CPU的信息。
下面只介紹mpstat與CPU相關的參數,mpstat的語法以下:
Usage: mpstat [ options... ] [ <interval> [ <count> ] ]
Options are:
[ -P { <cpu> | ALL } ] [ -V ]
顯示每一個進程對CPU的平均利用率:
# mpstat -P ALL
#9: pmap – 查看進程使用內存的狀況
pmap命令用來報告進程使用對於的相應內存的狀況。使用下面命令能夠查出某些內存瓶頸問題的緣由。
# pmap -d PID
顯示進程號爲47394的進程所用內存的信息,最後一行很是重要。
# pmap -d 47394
#11 & #12 : netstat 和 ss – 查看網絡狀況
netstat命令顯示網絡鏈接,路由表,網絡接口統計,假裝鏈接,組播成員身份。ss命令相似netstat命令的信息。
#13: iptraf – 實時網絡情況監視工具
iptraf是一款彩色的交互式的IP局域網監控工具。這是一個基於ncurses的IP LAN監視工具,它會統計網絡中產生的各類數據,包括TCP信息,UDP鏈接數,ICMP和OSPF信息,以太網負載信息,節點統計,IP校驗和錯誤,以及其餘信息。而且提供:
Network traffic statistics by TCP connection
IP traffic statistics by network interface
Network traffic statistics by protocol
Network traffic statistics by TCP/UDP port and by packet size
Network traffic statistics by Layer2 address
#14: tcpdump – 網絡情況分析工具
tcpdump用來抓包的一個的簡單命令。可是,要使用該工具,你需熟悉TCP /IP協議。例如:顯示網絡中有關DNS的信息,請輸入:
# tcpdump -i eth1 'udp port 53'
顯示去往202.54.1.5的全部ftp會話信息:
# tcpdump -i eth1 'dst 202.54.1.5 and (port 21 or 20'
顯示去往192.168.1.5的全部HTTP會話信息:
# tcpdump -ni eth0 'dst 192.168.1.5 and tcp and port http'
使用Wireshark查看tcpdump抓包文件的詳細信息,輸入:
# tcpdump -n -i eth1 -s 0 -w output.txt src or dst port 80
#15: strace – 系統調用工具
strace是Linux環境下的一款程序調試工具,用來監察一個應用程序所使用的系統呼叫及它所接收的系統信息。strace是一個有用的小工具,它能夠經過跟蹤系統調用來讓你知道一個程序在後臺所作的事情。Strace是一個基礎的調試工具,在大多數 Linux系 統上默認已經安裝;可是即使你不是在跟蹤一個問題的時候它也是一個極好的軟件。它能告訴你不少關於一個Linux程序怎樣工做的信息。
#16: /Proc 文件系統
Linux 內核提供了一種經過 /proc 文件系統,在運行時訪問內核內部數據結構、改變內核設置的機制。幾個例子:
# cat /proc/cpuinfo
# cat /proc/meminfo
# cat /proc/zoneinfo
# cat /proc/mounts
#17: Nagios – 服務器和網絡信息監視工具
Nagios是一款很流行的開源系統和網絡監控應用軟件。你能夠很輕鬆地用它監控全部的主機,網絡設備和服務。在系統或服務狀態異常時會第一時間通知網站運維人員(發出郵件或短信報警),在狀態恢復正常後發出郵件或短信通知。
#18: Cacti -基於WEB的監視工具
Cacti是經過 snmpget來獲取數據,使用 RRDtool繪畫圖形,並且你徹底能夠不須要了解RRDtool複雜的參數。它提供了很是強大的數據和用戶管理功能,能夠指定每個用戶能查看樹狀結構、host以及任何一張圖,還能夠與LDAP結合進行用戶驗證,同時也能本身增長模板,功能很是強大完善。界面友好。CACTI軟件Cacti 的發展是基於讓 RRDTool 使用者更方便使用該軟件,除了基本的 Snmp 流量跟系統資訊監控外,Cacti 也可外掛 Scripts 及加上 Templates 來做出各式各樣的監控圖。
#19: KDE System Guard – 圖形化的系統監視工具
KDE System Guard (KSysguard)是KDE的任務管理和性能監控工具。它採用client/server架構,能夠監控本機也能夠監控遠端主機。
一篇51CTOblog博文,對KDE System Guard的介紹很詳細:http://linuxshow.blog.51cto.com/1572053/371657
#sar - 收集和報告系統狀態信息
使用 sar -d 能夠獲得當天磁盤活動的狀況彙總
sar -n DEV 則能給出網絡接口的統計信息
sar -A 能夠報告全部的信息
sar 適用於快速粗略瞭解歷史信息。
sar 命令行的經常使用格式: sar [options] [-o file] t [n]
options 爲命令行選項,sar命令的選項不少,下面只列出經常使用選項:
-A:全部報告的總和。
-u:CPU利用率
-v:進程、I節點、文件和鎖表狀態。
-d:硬盤使用報告。
-r:沒有使用的內存頁面和硬盤塊。
-g:串口I/O的狀況。
-b:緩衝區使用狀況。
-a:文件讀寫狀況。
-c:系統調用狀況。
-R:進程的活動狀況。
-y:終端設備活動狀況。
-w:系統交換活動。
能夠參考:http://linuxtools-rst.readthedocs.org/zh_CN/latest/tool/sar.html
其餘工具:
nmap – 掃描主機的端口開放狀況.
lsof - 列出系統當前打開的文件,網絡鏈接以及更多信息。
ntop web based tool – Ntop是一款監控網絡流量工具,它顯示的網絡情況更加直觀、詳細。Ntop甚至能夠列出每一個節點計算機的網絡帶寬利用率。它是一個靈活的、功能齊全的,用來監控和解決局域網問題的工具;能夠自動從網絡中識別有用的信息;將截獲的數據包轉換成易於識別的格式;對網絡環境中通訊失敗的狀況進行分析;探測網絡通訊的時間和過程等。
Conky - Conky是x-window下,一款免費的,輕量級系統監控的工具。它可以監控許多系統環境的狀態,其中包括的CPU,內存,交換空間,磁盤存儲,溫度,進程,網絡接口,電池電量,系統消息,電子郵件收件箱等。
GKrellM – 它來用於監測CPU狀態,內存,硬盤,網絡接口,本地和遠程郵箱,以及其餘的東西等。
vnstat – vnstat是一個基於控制檯的網絡流量監控軟件,它會保持每個月,天天,每小時,監視並記錄所選定網絡接口的網絡通訊情況。
htop – htop是一個加強版本的top,同時也是一個交互式進程查看器,它能夠以樹狀結構來顯示進程列表。
mtr – mtr在單一的網絡診斷工具上,結合了traceroute和ping程序的功能。
性能監控腳本
[root@testredis scripts]# cat performance.sh #!/bin/bash #監控cpu系統負載 IP=`ifconfig eth0 | grep "inet addr" | cut -f 2 -d ":" | cut -f 1 -d " "` cpu_num=`grep -c 'model name' /proc/cpuinfo` count_uptime=`uptime |wc -w` load_15=`uptime | awk '{print $'$count_uptime'}'` average_load=`echo "scale=2;a=$load_15/$cpu_num;if(length(a)==scale(a)) print 0;print a" | bc` average_int=`echo $average_load | cut -f 1 -d "."` load_warn=0.70 if [ $average_int -gt 0 ] then echo "$IP服務器單個核心15分鐘的平均負載爲$average_load,超過警惕值1.0,請當即處理!!!$(date +%Y%m%d/%H:%M:%S)" >>/usr/monitor/performance/performance_$(date +%Y%m%d).log echo "$IP服務器單個核心15分鐘的平均負載爲$average_load,超過警惕值1.0,請當即處理!!!$(date +%Y%m%d/%H:%M:%S)" | mail -s "$IP服務器系統負載嚴重告警" XXXX@qq.com else echo "$IP服務器單個核心15分鐘的平均負載值爲$average_load,負載正常 $(date +%Y%m%d/%H:%M:%S)">>/usr/monitor/performance/performance_$(date +%Y%m%d).log fi #監控cpu使用率 cpu_idle=`top -b -n 1 | grep Cpu | awk '{print $5}' | cut -f 1 -d "."` if [ $cpu_idle -lt 20 ] then echo "$IP服務器cpu剩餘$cpu_idle%,使用率已經超過80%,請及時處理。">>/usr/monitor/performance/performance_$(date +%Y%m%d).log echo "$IP服務器cpu剩餘$cpu_idle%,使用率已經超過80%,請及時處理!!!" | mail -s "$IP服務器cpu告警" XXXX@qq.com else echo "$IP服務器cpu剩餘$cpu_idle%,使用率正常">>/usr/monitor/performance/performance_$(date +%Y%m%d).log fi
進程監控
[root@testredis scripts]# cat process.sh #!/bin/bash IP=`ifconfig eth0 | grep "inet addr" | cut -f 2 -d ":" | cut -f 1 -d " "` tomcat_dir="/opt/apache-tomcat-7.0.8" mysql_dir="/usr/local/mysql/bin/mysqld_safe" vsftp_dir="/usr/sbin/vsftpd" ssh_dir="/usr/sbin/sshd" for dir in $tomcat_dir $mysql_dir $vsftp_dir $ssh_dir do process_count=$(ps -ef | grep "$dir" | grep -v grep | wc -l) for service in tomcat mysql vsftp ssh do echo "$dir" |grep -q "$service" if [ $? -eq 0 ] then if [ $process_count -eq 0 ] then echo "$service is down at $(date +%Y%m%d%H:%M:%S)" >>/usr/monitor/process/process_$(date +%Y%m%d).log echo "$service is down at $(date +%Y%m%d%H:%M:%S)" | mail -s "$IP服務器 $service服務關閉告警" XXXX@qq.com else echo "$service is running at $(date +%Y%m%d%H:%M:%S)" >>/usr/monitor/process/process_$(date +%Y%m%d).log fi else continue fi done done
流量監控
#!/bin/bash # R1=`cat /sys/class/net/eth0/statistics/rx_bytes` T1=`cat /sys/class/net/eth0/statistics/tx_bytes` sleep 1 R2=`cat /sys/class/net/eth0/statistics/rx_bytes` T2=`cat /sys/class/net/eth0/statistics/tx_bytes` TBPS=`expr $T2 - $T1` RBPS=`expr $R2 - $R1` TKBPS=`expr $TBPS / 1024` RKBPS=`expr $RBPS / 1024` echo "上傳速率 eth0: $TKBPS kb/s 下載速率 eth0: $RKBPS kb/s at $(date +%Y%m%d%H:%M:%S)" >>/usr/monitor/network/network_$(date +%Y%m%d).log
流量分析統計
[root@testredis scripts]# cat tongji.sh #!/bin/bash TX=0; RX=0; MAX_TX=0; MAX_RX=0; while read line do a=`echo $line | grep "eth0" |awk '{print $3}'` if [ $a -ge 0 ] then TX=$a if [ $TX -ge $MAX_TX ] then MAX_TX=$TX fi fi b=`echo $line | grep "eth0" |awk '{print $7}'` if [ $b -ge 0 ] then RX=$b if [ $RX -ge $MAX_RX ] then MAX_RX=$RX fi fi done < /usr/monitor/network/network_$(date +%Y%m%d).log echo "最高上傳速度爲 $MAX_TX kb/s at $(date +%Y%m%d)">>/usr/monitor/network/tongji.log echo "最高下載速度爲 $MAX_RX kb/s at $(date +%Y%m%d)">>/usr/monitor/network/tongji.log
內存硬盤登陸用戶數監控
[root@Test scripts]# cat sys-warning.sh #!/bin/bash #監控系統負載與CPU、內存、硬盤、登陸用戶數,超出警惕值則發郵件告警。 #提取本服務器的IP地址信息 IP=`ifconfig eth0 | grep "inter addr" | cut -f 2 -d ":" | cut -f 1 -d " "` # 一、監控系統負載的變化狀況,超出時發郵件告警: #抓取cpu的總核數 cpu_num=`cat /proc/cpuinfo | grep -c "model name"` #抓取當前系統15分鐘的平均負載值 load_15=`uptime | awk '{print $12}'` #計算當前系統單個核心15分鐘的平均負載值,結果小於1.0時前面個位數補0。 average_load=`echo "scale=2;a=$load_15/$cpu_num;if(length(a)==scale(a)) print 0;print a" | bc` #取上面平均負載值的個位整數 average_int=`echo $average_load | cut -f 1 -d "."` #設置系統單個核心15分鐘的平均負載的告警值爲0.70(即便用超過70%的時候告警)。 load_warn=0.70 #當單個核心15分鐘的平均負載值大於等於1.0(即個位整數大於0) ,直接發郵件告警;若是小於1.0則進行二次比較 if [ $average_int > 0 ]; then echo "$IP服務器單個核心15分鐘的系統平均負載爲$average_load,超過警惕值1.0,請當即處理." | mutt -s "$IP 服務器系統負載嚴重告警." fuquanjun@9kpoker.com else #當前系統15分鐘平均負載值與告警值進行比較(當大於告警值0.70時會返回1,小於時會返回0) load_now=`expr $average_load \> $load_warn` #若是系統單個核心15分鐘的平均負載值大於告警值0.70(返回值爲1),則發郵件給管理員 if [ $load_now == 1 ]; then echo "$IP服務器單個核心15分鐘的系統平均負載爲$average_load,超過警惕值0.70,請及時處理." | mutt -s "$IP 服務器系統負載告警" fuquanjun@9kpoker.com fi fi # 二、監控系統cpu的狀況,當使用超過80%的時候發告警郵件: #取當前空閒cpu百份比值(只取整數部分) cpu_idle=`top -b -n 1 | grep Cpu | awk '{print $5}' | cut -f 1 -d "."` #設置空閒cpu的告警值爲20%,若是當前cpu使用超過80%(即剩餘小於20%),當即發郵件告警 if (($cpu_idle < 20)); then echo "$IP服務器cpu剩餘$cpu_idle%,使用率已經超過80%,請及時處理。" | mutt -s "$IP服務器CPU告警" fuquanjun@9kpoker.com fi # 三、監控系統交換分區swap的狀況,當使用超過80%的時候發告警郵件: #系統分配的交換分區總量 swap_total=`free -m | grep Swap | awk '{print $2}'` #當前剩餘的交換分區free大小 swap_free=`free -m | grep Swap | awk '{print $4}'` #當前已使用的交換分區used大小 swap_used=`free -m | grep Swap | awk '{print $3}'` if (($swap_used != 0)); then #若是交換分區已被使用,則計算當前剩餘交換分區free所佔總量的百分比,用小數來表示,要在小數點前面補一個整數位0 swap_per=0`echo "scale=2;$swap_free/$swap_total" | bc` #設置交換分區的告警值爲20%(即便用超過80%的時候告警)。 swap_warn=0.20 #當前剩餘交換分區百分比與告警值進行比較(當大於告警值(即剩餘20%以上)時會返回1,小於(即剩餘不足20%)時會返回0 ) swap_now=`expr $swap_per \> $swap_warn` #若是當前交換分區使用超過80%(即剩餘小於20%,上面的返回值等於0),當即發郵件告警 if (($swap_now == 0)); then echo "$IP服務器swap交換分區只剩下 $swap_free M 未使用,剩餘不足20%,使用率已經超過80%,請及時處理。" | mutt -s "$IP 服務器內存告警" | fuquanjun@9kpoker.com fi fi # 四、監控系統硬盤根分區使用的狀況,當使用超過80%的時候發告警郵件: #取當前根分區(/dev/sda3)已用的百份比值(只取整數部分) disk_sda3=`df -h | grep /dev/sda3 | awk '{print $5}' | cut -f 1 -d "%"` #設置空閒硬盤容量的告警值爲80%,若是當前硬盤使用超過80%,當即發郵件告警 if (($disk_sda3 > 80)); then echo "$IP 服務器 /根分區 使用率已經超過80%,請及時處理." | mutt -s "$IP 服務器硬盤告警" fuqunajun@9kpoker.com fi #五、監控系統用戶登陸的狀況,當用戶數超過3個的時候發告警郵件: #取當前用戶登陸數(只取數值部分) users=`uptime | awk '{print $6}'` #設置登陸用戶數的告警值爲3個,若是當前用戶數超過3個,當即發郵件告警 if (($users >= 3)); then echo "$IP 服務器用戶數已經達到$users個,請及時處理。" | mutt -s "$IP 服務器用戶數告警" fuquanjun@9kpoker.com fi
系統初始化腳本
[root@Test scripts]# cat check_linux.sh #!/bin/bash os_check() { if [ -e /etc/redhat-release ]; then REDHAT=`cat /etc/redhat-release |cut -d' ' -f1` else DEBIAN=`cat /etc/issue |cut -d' ' -f1` fi if [ "$REDHAT" == "CentOS" -o "$REDHAT" == "Red" ]; then P_M=yum elif [ "$DEBIAN" == "Ubuntu" -o "$DEBIAN" == "ubutnu" ]; then P_M=apt-get else Operating system does not support. exit 1 fi } if [ $LOGNAME != root ]; then echo "Please use the root account operation." exit 1 fi if ! which vmstat &>/dev/null; then echo "vmstat command not found, now the install." sleep 1 os_check $P_M install procps -y echo "-----------------------------------------------------------------------" fi if ! which iostat &>/dev/null; then echo "iostat command not found, now the install." sleep 1 os_check $P_M install sysstat -y echo "-----------------------------------------------------------------------" fi while true; do select input in cpu_load disk_load disk_use disk_inode mem_use tcp_status cpu_top10 mem_top10 traffic quit; do case $input in cpu_load) #CPU利用率與負載 echo "---------------------------------------" i=1 while [[ $i -le 3 ]]; do echo -e "\033[32m 參考值${i}\033[0m" UTIL=`vmstat |awk '{if(NR==3)print 100-$15"%"}'` USER=`vmstat |awk '{if(NR==3)print $13"%"}'` SYS=`vmstat |awk '{if(NR==3)print $14"%"}'` IOWAIT=`vmstat |awk '{if(NR==3)print $16"%"}'` echo "Util: $UTIL" echo "User use: $USER" echo "System use: $SYS" echo "I/O wait: $IOWAIT" i=$(($i+1)) sleep 1 done echo "---------------------------------------" break ;; disk_load) #硬盤I/O負載 echo "---------------------------------------" i=1 while [[ $i -le 3 ]]; do echo -e "\033[32m 參考值${i}\033[0m" UTIL=`iostat -x -k |awk '/^[v|s]/{OFS=": ";print $1,$NF"%"}'` READ=`iostat -x -k |awk '/^[v|s]/{OFS=": ";print $1,$6"KB"}'` WRITE=`iostat -x -k |awk '/^[v|s]/{OFS=": ";print $1,$7"KB"}'` IOWAIT=`vmstat |awk '{if(NR==3)print $16"%"}'` echo -e "Util:" echo -e "${UTIL}" echo -e "I/O Wait: $IOWAIT" echo -e "Read/s:\n$READ" echo -e "Write/s:\n$WRITE" i=$(($i+1)) sleep 1 done echo "---------------------------------------" break ;; disk_use) #硬盤利用率 DISK_LOG=/tmp/disk_use.tmp DISK_TOTAL=`fdisk -l |awk '/^Disk.*bytes/&&/\/dev/{printf $2" ";printf "%d",$3;print "GB"}'` USE_RATE=`df -h |awk '/^\/dev/{print int($5)}'` for i in $USE_RATE; do if [ $i -gt 90 ];then PART=`df -h |awk '{if(int($5)=='''$i''') print $6}'` echo "$PART = ${i}%" >> $DISK_LOG fi done echo "---------------------------------------" echo -e "Disk total:\n${DISK_TOTAL}" if [ -f $DISK_LOG ]; then echo "---------------------------------------" cat $DISK_LOG echo "---------------------------------------" rm -f $DISK_LOG else echo "---------------------------------------" echo "Disk use rate no than 90% of the partition." echo "---------------------------------------" fi break ;; disk_inode) #硬盤inode利用率 INODE_LOG=/tmp/inode_use.tmp INODE_USE=`df -i |awk '/^\/dev/{print int($5)}'` for i in $INODE_USE; do if [ $i -gt 90 ]; then PART=`df -h |awk '{if(int($5)=='''$i''') print $6}'` echo "$PART = ${i}%" >> $INODE_LOG fi done if [ -f $INODE_LOG ]; then echo "---------------------------------------" rm -f $INODE_LOG else echo "---------------------------------------" echo "Inode use rate no than 90% of the partition." echo "---------------------------------------" fi break ;; mem_use) #內存利用率 echo "---------------------------------------" MEM_TOTAL=`free -m |awk '{if(NR==2)printf "%.1f",$2/1024}END{print "G"}'` USE=`free -m |awk '{if(NR==3) printf "%.1f",$3/1024}END{print "G"}'` FREE=`free -m |awk '{if(NR==3) printf "%.1f",$4/1024}END{print "G"}'` CACHE=`free -m |awk '{if(NR==2) printf "%.1f",($6+$7)/1024}END{print "G"}'` echo -e "Total: $MEM_TOTAL" echo -e "Use: $USE" echo -e "Free: $FREE" echo -e "Cache: $CACHE" echo "---------------------------------------" break ;; tcp_status) #網絡鏈接狀態 echo "---------------------------------------" COUNT=`netstat -antp |awk '{status[$6]++}END{for(i in status) print i,status[i]}'` echo -e "TCP connection status:\n$COUNT" echo "---------------------------------------" ;; cpu_top10) #佔用CPU高的前10個進程 echo "---------------------------------------" CPU_LOG=/tmp/cpu_top.tmp i=1 while [[ $i -le 3 ]]; do #ps aux |awk '{if($3>0.1)print "CPU: "$3"% -->",$11,$12,$13,$14,$15,$16,"(PID:"$2")" |"sort -k2 -nr |head -n 10"}' > $CPU_LOG ps aux |awk '{if($3>0.1){{printf "PID: "$2" CPU: "$3"% --> "}for(i=11;i<=NF;i++)if(i==NF)printf $i"\n";else printf $i}}' |sort -k4 -nr |head -10 > $CPU_LOG #循環從11列(進程名)開始打印,若是i等於最後一行,就打印i的列並換行,不然就打印i的列 if [[ -n `cat $CPU_LOG` ]]; then echo -e "\033[32m 參考值${i}\033[0m" cat $CPU_LOG > $CPU_LOG else echo "No process using the CPU." break fi i=$(($i+1)) sleep 1 done echo "---------------------------------------" break ;; mem_top10) #佔用內存高的前10個進程 echo "---------------------------------------" MEM_LOG=/tmp/mem_top.tmp i=1 while [[ $i -le 3 ]]; do #ps aux |awk '{if($4>0.1)print "Memory: "$4"% -->",$11,$12,$13,$14,$15,$16,"(PID:"$2")" |"sort -k2 -nr |head -n 10"}' > $MEM_LOG ps aux |awk '{if($4>0.1){{printf "PID: "$2" Memory: "$3"% --> "}for(i=11;i<=NF;i++)if(i==NF)printf $i"\n";else printf $i}}' |sort -k4 -nr |head -10 > $MEM_LOG if [[ -n `cat $MEM_LOG` ]]; then echo -e "\033[32m 參考值${i}\033[0m" cat $MEM_LOG > $MEM_LOG else echo "No process using the Memory." break fi i=$(($i+1)) sleep 1 done echo "---------------------------------------" break ;; traffic) #查看網絡流量 while true; do read -p "Please enter the network card name(eth[0-9] or em[0-9]): " eth #if [[ $eth =~ ^eth[0-9]$ ]] || [[ $eth =~ ^em[0-9]$ ]] && [[ `ifconfig |grep -c "\<$eth\>"` -eq 1 ]]; then if [ `ifconfig |grep -c "\<$eth\>"` -eq 1 ]; then break else echo "Input format error or Don't have the card name, please input again." fi done echo "---------------------------------------" echo -e " In ------ Out" i=1 while [[ $i -le 3 ]]; do #OLD_IN=`ifconfig $eth |awk '/RX bytes/{print $2}' |cut -d: -f2` #OLD_OUT=`ifconfig $eth |awk '/RX bytes/{print $6}' |cut -d: -f2` OLD_IN=`ifconfig $eth |awk -F'[: ]+' '/bytes/{if(NR==8)print $4;else if(NR==5)print $6}'` #CentOS6和CentOS7 ifconfig輸出進出流量信息位置不一樣,CentOS6中RX與TX行號等於8,CentOS7中RX行號是5,TX行號是5,因此就作了個判斷. OLD_OUT=`ifconfig $eth |awk -F'[: ]+' '/bytes/{if(NR==8)print $9;else if(NR==7)print $6}'` sleep 1 NEW_IN=`ifconfig $eth |awk -F'[: ]+' '/bytes/{if(NR==8)print $4;else if(NR==5)print $6}'` NEW_OUT=`ifconfig $eth |awk -F'[: ]+' '/bytes/{if(NR==8)print $9;else if(NR==7)print $6}'` IN=`awk 'BEGIN{printf "%.1f\n",'$((${NEW_IN}-${OLD_IN}))'/1024/128}'` OUT=`awk 'BEGIN{printf "%.1f\n",'$((${NEW_OUT}-${OLD_OUT}))'/1024/128}'` echo "${IN}MB/s ${OUT}MB/s" i=$(($i+1)) sleep 1 done echo "---------------------------------------" break ;; quit) exit 0 ;; *) echo "---------------------------------------" echo "Please enter the number." echo "---------------------------------------" break ;; esac done done
http://linuxtools-rst.readthedocs.org/zh_CN/latest/base/index.html