排錯思路

1.服務器遇到故障如何排除?ios

     http://blog.jobbole.com/36375/web

必須先搞清楚故障的具體狀況:數據庫

o    故障的表現是什麼?無響應?報錯?瀏覽器

o    故障是何時發現的?服務器

o    故障是否可重現?架構

o    有沒有出現的規律(好比每小時出現一次)ide

o    最後一次對整個平臺進行更新的內容是什麼(代碼、服務器等)?工具

o    故障影響的特定用戶羣是什麼樣的(已登陸的, 退出的, 某個地域的…)?spa

o    基礎架構(物理的、邏輯的)的文檔是否能找到?日誌

o    是否有監控平臺可用? (好比Munin、Zabbix、 Nagios、 … 什麼均可以)

o    是否有日誌能夠查看?(日誌管理工具好比Loggly、ELK、 Graylog…)

    w 、last、 history查看有哪些用戶在線,作過哪些操做。

    ps查看有哪些進程、分辨出哪些該有的和不應有的。

    netstat查看相關端口。

    free、 uptime 、top查看一下cpu、內存。

    日誌!


2.服務器宕機了怎麼辦?

針對服務器可能發生的宕機狀況,咱們確定要先設立應急預案。

財力容許的狀況下,最好是爲每一臺服務器配備物理冗餘。同步更新數據,故障發生及時切換。

故障發生後,第一位是恢復業務,第二位是排查。

首先,啓動服務器,看是否可以登陸,若是能夠,能夠經過以下方式進行檢查。

a、是不是應用程序致使內存溢出或者泄露,out of memory致使;

b、是不是進程過多或者不斷建立,耗盡資源致使;

c、是不是數據庫程序死鎖,鏈接數過多致使;

d、是不是應用程序異常致使;

e、是不是流量負載過大致使;

f、是不是遭受*********致使;

g、是不是誤操做致使;

  能夠經過查看系統日誌來查看是否有異常登陸現象的發生。固然了,若是連登陸都沒法完成,或者經過如上的處理方法都沒能處理,那麼,您就聯繫客服人員進行排查。固然了,瞭解具體問題所在,也就不成問題了。

 


3、web訪問慢的,如何定位問題解決?

·        是否廣泛較慢?檢測先環節:單個瀏覽器的問題?電腦問題?電信運行商?

·        查看服務器的同時鏈接數,是否是同時鏈接人數太多,已經超過服務器的正常負載。

·        查看服務器的TCP鏈接狀況,是否是被DDOS了。

·        查看服務器的內存使用量,是否是某個應用出現問題,形成內存泄漏了。

·        經過iostat、vmsta查看cpu的io,磁盤的讀寫速率。

·        查看各類日誌。

·        數據庫的連接狀況。

·        程序自己。

層層檢測,步步排查

相關文章
相關標籤/搜索