apache日誌分析及系統cpu,內存,負載狀況監控

1.根據Apache Log,獲取當天秒併發數最多的記錄nginx

tail -10000 ./demo.fdipzone.com_access_log.2014-01-16_01 | cut -d"[" -f 2 | awk '{print $1;}' | sort | uniq -c | sort -nr | head

tail -10000 ./demo.fdipzone.com_access_log.2014-01-16_01 | awk -F"[" '{print $2;}' | awk '{print $1;}' | sort | uniq -c | sort -nr | head
運行結果:

fdipzone@ubuntu:~$ tail -100000 ./demo.fdipzone.com_access_log.2014-01-16_01 | cut -d"[" -f 2 | awk '{print $1;}' | sort | uniq -c | sort -nr | head 
    109 16/Jan/2014:22:51:16
     95 16/Jan/2014:22:46:56
     87 16/Jan/2014:23:56:30
     87 16/Jan/2014:22:48:27
     80 16/Jan/2014:23:55:52
     79 16/Jan/2014:23:51:29
     74 16/Jan/2014:23:00:33
     72 16/Jan/2014:23:28:04
     72 16/Jan/2014:23:17:35
     70 16/Jan/2014:23:05:38

tail -10000 爲access log 最大行數,此處請根據實際設置,如access log最大行數是500000 則使用tail -500000web

head 默認會顯示頭10行,如要修改則能夠加 -n 參數,例如 head -n 100 會顯示頭100行內容
apache


更多查詢
ubuntu

每分鐘最高訪問數
awk '{print $4}' access_log |cut -c 14-18|sort|uniq -c|sort -nr|head

每小時最高訪問數
awk '{print $4}' access_log |cut -c 14-15|sort|uniq -c|sort -nr|head -n 24

指定某分鐘的每秒訪問數
grep '01/Nov/2013:15:59' access.log | cut -d"[" -f 2 | awk '{print $1;}' | sort | uniq -c | sort -nr | head -60


2.記錄cpu與內存使用到Log緩存

vmstat命令是最多見的Linux/Unix監控工具,能夠展示給定時間間隔的服務器的狀態值,包括服務器的CPU使用率,內存使用,虛擬內存交換狀況,IO讀寫狀況。
bash

vmstat 共有兩個參數,一個是每次採集的時間間隔,另外一個是採集的次數。
服務器

vmstat 1 11 表示每次採集時間爲1秒,共採集11次。由於vmstat第一次採集的記錄是不正確的,因此若是要採集10次,請設置次數爲11,這樣才能夠獲取到10條有用的記錄。
併發

fdipzone@ubuntu:~$ vmstat 1 11
procs -----------memory---------- ---swap-- -----io---- -system-- ----cpu----
 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa
 0  0      0 335240  52072 241320    0    0   689    42  234  460  4 13 80  3
 1  0      0 335860  52072 241320    0    0     0     0  352  528  2  2 97  0
 2  0      0 336364  52072 241320    0    0     0     0  564  692  4  3 94  0
 0  0      0 336992  52072 241320    0    0     0     0  316  483  1  2 97  0
 2  0      0 336432  52076 241476    0    0   156     0  332  554  2  6 91  2
 0  0      0 336928  52084 241480    0    0     0    84  349  494  1  3 96  0
 0  0      0 337564  52084 241476    0    0     0     0  263  437  0  2 98  0
 0  0      0 338068  52084 241476    0    0     0     0  299  456  1  2 97  0
 0  0      0 338696  52084 241476    0    0     0     0  321  473  1  3 96  0
 1  0      0 339200  52084 241476    0    0     0     0  271  461  0  2 98  0
 0  0      0 339828  52084 241476    0    0     0     0  255  429  1  2 96  0

vmstat 1 >> vmstat.log 每秒採集,寫入vmstat.log

vmstat 輸出的每一個參數說明:
函數

r 表示運行隊列(就是說多少個進程真的分配到CPU),當這個值超過了CPU數目,就會出現CPU瓶頸了。這個也和top的負載有關係,通常負載超過了3就比較高,超過了5就高,超過了10就不正常了,服務器的狀態很危險。top的負載相似每秒的運行隊列。若是運行隊列過大,表示你的CPU很繁忙,通常會形成CPU使用率很高。
工具

b 表示阻塞的進程。

swpd 虛擬內存已使用的大小,若是大於0,表示你的機器物理內存不足了,若是不是程序內存泄露的緣由,那麼你該升級內存了或者把耗內存的任務遷移到其餘機器。

free   空閒的物理內存的大小,個人測試機器內存總共1G,剩餘330M。

buff   Linux/Unix系統是用來存儲,目錄裏面有什麼內容,權限等的緩存,我本機大概佔用500多M

cache cache直接用來記憶咱們打開的文件,給文件作緩衝,(這裏是Linux/Unix的聰明之處,把空閒的物理內存的一部分拿來作文件和目錄的緩存,是爲了提升 程序執行的性能,當程序使用內存時,buffer/cached會很快地被使用。)

si  每秒從磁盤讀入虛擬內存的大小,若是這個值大於0,表示物理內存不夠用或者內存泄露了,要查找耗內存進程解決掉。

so  每秒虛擬內存寫入磁盤的大小,若是這個值大於0,同上。

bi  塊設備每秒接收的塊數量,這裏的塊設備是指系統上全部的磁盤和其餘塊設備,默認塊大小是1024byte。

bo 塊設備每秒發送的塊數量,例如咱們讀取文件,bo就要大於0。bi和bo通常都要接近0,否則就是IO過於頻繁,須要調整。

in 每秒CPU的中斷次數,包括時間中斷

cs 每秒上下文切換次數,例如咱們調用系統函數,就要進行上下文切換,線程的切換,也要進程上下文切換,這個值要越小越好,太大了,要考慮調低線程或者進程的數目,例如在apache和nginx這種web服務器中,咱們通常作性能測試時會進行幾千併發甚至幾萬併發的測試,選擇web服務器的進程能夠由進程或者線程的峯值一直下調,壓測,直到cs到一個比較小的值,這個進程和線程數就是比較合適的值了。系統調用也是,每次調用系統函數,咱們的代碼就會進入內核空間,致使上下文切換,這個是很耗資源,也要儘可能避免頻繁調用系統函數。上下文切換次數過多表示你的CPU大部分浪費在上下文切換,致使CPU幹正經事的時間少了,CPU沒有充分利用,是不可取的。

us 用戶CPU時間,高於70%則表示CPU有壓力。

sy 系統CPU時間,若是過高,表示系統調用時間長,例如是IO操做頻繁。

id  空閒 CPU時間,通常來講,id + us + sy = 100,通常我認爲id是空閒CPU使用率,us是用戶CPU使用率,sy是系統CPU使用率。

wt 等待IO CPU時間。


3.記錄Load Average 到Log

#!/bin/bash

load_average_file='/home/fdipzone/logs/load_average.log'

touch $load_average_file

while :
do

    #load average and cpu
    load=`uptime`

    printf "$load $(date '+%Y-%m-%d-%T')\n" >> $load_average_file

    sleep 0.2

done

exit 0
load_average.log 記錄:
 13:28:20 up 17 min,  2 users,  load average: 0.08, 0.17, 0.27 2014-02-16-13:28:20
 13:28:20 up 17 min,  2 users,  load average: 0.08, 0.17, 0.27 2014-02-16-13:28:20
 13:28:20 up 17 min,  2 users,  load average: 0.08, 0.17, 0.27 2014-02-16-13:28:21
 13:28:21 up 17 min,  2 users,  load average: 0.08, 0.17, 0.27 2014-02-16-13:28:21
 13:28:21 up 17 min,  2 users,  load average: 0.08, 0.17, 0.27 2014-02-16-13:28:21
 13:28:21 up 17 min,  2 users,  load average: 0.08, 0.17, 0.27 2014-02-16-13:28:21
 13:28:21 up 17 min,  2 users,  load average: 0.08, 0.17, 0.27 2014-02-16-13:28:21
 13:28:22 up 17 min,  2 users,  load average: 0.08, 0.17, 0.27 2014-02-16-13:28:22
 13:28:22 up 17 min,  2 users,  load average: 0.08, 0.17, 0.27 2014-02-16-13:28:22
 13:28:22 up 17 min,  2 users,  load average: 0.08, 0.16, 0.27 2014-02-16-13:28:22
 13:28:22 up 17 min,  2 users,  load average: 0.08, 0.16, 0.27 2014-02-16-13:28:22
 13:28:23 up 17 min,  2 users,  load average: 0.08, 0.16, 0.27 2014-02-16-13:28:23
 13:28:23 up 17 min,  2 users,  load average: 0.08, 0.16, 0.27 2014-02-16-13:28:23
 13:28:23 up 17 min,  2 users,  load average: 0.08, 0.16, 0.27 2014-02-16-13:28:23
相關文章
相關標籤/搜索