1 CPU負載 # cat /proc/loadavg 檢查前三個輸出值是否超過了系統邏輯CPU的4倍。 邏輯CPU的個數能夠經過如下命令得到: # cat /proc/cpuinfo | grep 「^processor」 | wc -l 另外,也能夠用命令uptime取得CPU負載信息 2 CPU負載 #mpstat 1 1 檢查%idle是否太低(好比小於5%) 3 內存空間 # free 檢查free值是否太低 也能夠用 # cat /proc/meminfo 4 swap空間 # free 檢查swap used值是否太高 若是swap used值太高,進一步檢查swap動做是否頻繁: # vmstat 1 5 觀察si和so值是否較大 5 磁盤空間 # df -h 檢查是否有分區使用率(Use%)太高(好比超過90%) 如發現某個分區空間接近用盡,能夠進入該分區的掛載點,用如下命令找出佔用空間最多的文件或目錄: # du -cks * | sort -rn | head -n 10 6 磁盤I/O負載 # iostat -x 1 2 檢查I/O使用率(%util)是否超過100% 7 網絡負載 # sar -n DEV 檢查網絡流量(rxbyt/s, txbyt/s)是否太高 8 網絡錯誤 # netstat -i 檢查是否有網絡錯誤(drop fifo colls carrier) 也能夠用命令:# cat /proc/net/dev 9 網絡鏈接數目 # netstat -an | grep -E 「^(tcp)」 | cut -c 68- | sort | uniq -c | sort -n 10 進程總數 # ps aux | wc -l 檢查進程個數是否正常 (好比超過250) 11 可運行進程數目 # vmwtat 1 5 r列給出的是可運行進程的數目,檢查其是否超過系統邏輯CPU的4倍 12 線程數目 13 進程 # top -id 1 觀察是否有異常進程出現 14 網絡狀態 檢查DNS, 網關等是否能夠正常連通 15 用戶 # who | wc -l 檢查登陸用戶是否過多 (好比超過50個) 也能夠用命令:# uptime 16 系統日誌 # cat /var/log/rflogview/*errors 檢查是否有異常錯誤記錄 也能夠搜尋一些異常關鍵字,例如: # grep -i error /var/log/messages # grep -i fail /var/log/messages 17 核心日誌 # dmesg 檢查是否有異常錯誤記錄 18 系統時間 # date 檢查系統時間是否正確 19 打開文件數目 # lsof | wc -l 檢查打開文件總數是否過多 20 日誌 # logwatch –print 配置/etc/log.d/logwatch.conf,將 Mailto 設置爲本身的email 地址,啓動mail服務 (sendmail或者postfix),這樣就能夠天天收到日誌報告了。 缺省logwatch只報告昨天的日誌,能夠用# logwatch –print –range all 得到全部的日誌分析結果。 能夠用# logwatch –print –detail high 得到更具體的日誌分析結果(而不單單是出錯日誌)。