系統負載命令觀察


1  CPU負載  # cat /proc/loadavg 檢查前三個輸出值是否超過了系統邏輯CPU的4倍。  邏輯CPU的個數能夠經過如下命令得到: # cat /proc/cpuinfo | grep 「^processor」 | wc -l 另外,也能夠用命令uptime取得CPU負載信息 2  CPU負載  #mpstat 1 1 檢查%idle是否太低(好比小於5%) 3  內存空間  # free 檢查free值是否太低  也能夠用 # cat /proc/meminfo 4  swap空間  # free 檢查swap used值是否太高  若是swap used值太高,進一步檢查swap動做是否頻繁: # vmstat 1 5 觀察si和so值是否較大 5  磁盤空間  # df -h 檢查是否有分區使用率(Use%)太高(好比超過90%)  如發現某個分區空間接近用盡,能夠進入該分區的掛載點,用如下命令找出佔用空間最多的文件或目錄: # du -cks * | sort -rn | head -n 10 6  磁盤I/O負載  # iostat -x 1 2 檢查I/O使用率(%util)是否超過100% 7  網絡負載  # sar -n DEV 檢查網絡流量(rxbyt/s, txbyt/s)是否太高 8  網絡錯誤  # netstat -i 檢查是否有網絡錯誤(drop fifo colls carrier)  也能夠用命令:# cat /proc/net/dev 9  網絡鏈接數目  # netstat -an | grep -E 「^(tcp)」 | cut -c 68- | sort | uniq -c | sort -n 10  進程總數  # ps aux | wc -l 檢查進程個數是否正常 (好比超過250) 11  可運行進程數目  # vmwtat 1 5 r列給出的是可運行進程的數目,檢查其是否超過系統邏輯CPU的4倍 12  線程數目 13  進程  # top -id 1 觀察是否有異常進程出現 14  網絡狀態  檢查DNS, 網關等是否能夠正常連通 15  用戶  # who | wc -l 檢查登陸用戶是否過多 (好比超過50個)  也能夠用命令:# uptime 16  系統日誌  # cat /var/log/rflogview/*errors 檢查是否有異常錯誤記錄  也能夠搜尋一些異常關鍵字,例如: # grep -i error /var/log/messages # grep -i fail /var/log/messages 17  核心日誌  # dmesg 檢查是否有異常錯誤記錄 18  系統時間  # date 檢查系統時間是否正確 19  打開文件數目  # lsof | wc -l 檢查打開文件總數是否過多 20  日誌  # logwatch –print  配置/etc/log.d/logwatch.conf,將 Mailto 設置爲本身的email 地址,啓動mail服務 (sendmail或者postfix),這樣就能夠天天收到日誌報告了。 缺省logwatch只報告昨天的日誌,能夠用# logwatch –print –range all 得到全部的日誌分析結果。 能夠用# logwatch –print –detail high 得到更具體的日誌分析結果(而不單單是出錯日誌)。
相關文章
相關標籤/搜索