系統穩定性

1. 在線日誌分析

    1.1 日誌分析經常使用命令

    1.2 日誌分析腳本

2.集羣監控

    1.1 監控指標

        1.1.1 Load

        1.1.2 CPU利用率

            在Linux操做系統中,CPU的時間消耗主要在如下幾個方面:用戶進程、內核進程、中斷處理、I/O等待、Nice時間、丟失時間、空閒等。而CPU的利用率則爲這些時間所佔總的百分比。經過CPU的利用率,可以客觀的反映出CPU的使用和消耗狀況。性能優化

            能夠經過top命令來查看Linux的CPU消耗狀況:網絡

            top | grep Cpu併發

            

            其中,CPU後面的各個列即是各類狀態下CPU所消耗的時間佔比高併發

  • 用戶時間(us): 表示CPU執行用戶進程所佔用的時間,一般狀況下但願us的佔比越高越好。
  • 系統時間(sy): 表示CPU內核所花費的時間,sy的佔比較高,一般意味着系統在某些方面設計不合理,好比果頻繁的系統調用致使用戶態與內核態的頻繁切換。
  • 調整時間(ni): 表示系統在調整進程優先級的時候所花費的時間。
  • 空閒時間(id): 表示系統處於空閒期,等待進程運行這個過程所佔用的時間,id佔比越低越好。
  • 等待時間(wa): 表示CPU在等待I/O操做所花費的時間,系統不該花費大量的時間來進行等待,不然便表示可能某些地方設計不合理。
  • 硬件中斷處理時間(hi): 表示系統處理硬件中斷所佔用的時間。
  • 軟件中斷處理時間(si): 表示系統處理硬件中斷所佔用的時間。         
  • 丟失時間(st): 是在硬件虛擬化技術開始流行後操做系統新增的一列,表示強制等待虛擬CPU時間,此時正在爲另外一個虛擬處理器服務。若是st佔比較高,則表示當前虛擬機與該宿主上的其它虛擬機間的CPU競爭較爲頻繁。

        1.1.3 磁盤剩餘空間

        1.1.4 網絡traffic(流量)

        1.1.5 磁盤I/O

        1.1.6 內存使用

        1.1.7 QPS

        1.1.8 RT

        1.1.9 Slect/PS

        1.1.10 Update/ps,Delete/ps

        1.1.11 GC

    1.2 心跳檢測

    1.3 容量評估及應用

3.流程控制

    1.1 流量控制實施

    1.2 服務穩定性    

    1.3 高併發系統設計

4.性能優化

    1.1 如何尋找性能瓶頸

    1.2 性能測試工具

    1.3 性能優化措施    

5.Java應用故障排查

    1.1 經常使用的工具

    1.2 典型案例分析

相關文章
相關標籤/搜索