1. 在線日誌分析
1.1 日誌分析經常使用命令
1.2 日誌分析腳本
2.集羣監控
1.1 監控指標
1.1.1 Load
1.1.2 CPU利用率
在Linux操做系統中,CPU的時間消耗主要在如下幾個方面:用戶進程、內核進程、中斷處理、I/O等待、Nice時間、丟失時間、空閒等。而CPU的利用率則爲這些時間所佔總的百分比。經過CPU的利用率,可以客觀的反映出CPU的使用和消耗狀況。性能優化
能夠經過top命令來查看Linux的CPU消耗狀況:網絡
top | grep Cpu併發
其中,CPU後面的各個列即是各類狀態下CPU所消耗的時間佔比高併發
- 用戶時間(us): 表示CPU執行用戶進程所佔用的時間,一般狀況下但願us的佔比越高越好。
- 系統時間(sy): 表示CPU內核所花費的時間,sy的佔比較高,一般意味着系統在某些方面設計不合理,好比果頻繁的系統調用致使用戶態與內核態的頻繁切換。
- 調整時間(ni): 表示系統在調整進程優先級的時候所花費的時間。
- 空閒時間(id): 表示系統處於空閒期,等待進程運行這個過程所佔用的時間,id佔比越低越好。
- 等待時間(wa): 表示CPU在等待I/O操做所花費的時間,系統不該花費大量的時間來進行等待,不然便表示可能某些地方設計不合理。
- 硬件中斷處理時間(hi): 表示系統處理硬件中斷所佔用的時間。
- 軟件中斷處理時間(si): 表示系統處理硬件中斷所佔用的時間。
- 丟失時間(st): 是在硬件虛擬化技術開始流行後操做系統新增的一列,表示強制等待虛擬CPU時間,此時正在爲另外一個虛擬處理器服務。若是st佔比較高,則表示當前虛擬機與該宿主上的其它虛擬機間的CPU競爭較爲頻繁。
1.1.3 磁盤剩餘空間
1.1.4 網絡traffic(流量)
1.1.5 磁盤I/O
1.1.6 內存使用
1.1.7 QPS
1.1.8 RT
1.1.9 Slect/PS
1.1.10 Update/ps,Delete/ps
1.1.11 GC
1.2 心跳檢測
1.3 容量評估及應用
3.流程控制
1.1 流量控制實施
1.2 服務穩定性
1.3 高併發系統設計
4.性能優化
1.1 如何尋找性能瓶頸
1.2 性能測試工具
1.3 性能優化措施
5.Java應用故障排查
1.1 經常使用的工具
1.2 典型案例分析