1.服務器遇到故障如何排除?ios
http://blog.jobbole.com/36375/web
必須先搞清楚故障的具體狀況:數據庫
o 故障的表現是什麼?無響應?報錯?瀏覽器
o 故障是何時發現的?服務器
o 故障是否可重現?架構
o 有沒有出現的規律(好比每小時出現一次)ide
o 最後一次對整個平臺進行更新的內容是什麼(代碼、服務器等)?工具
o 故障影響的特定用戶羣是什麼樣的(已登陸的, 退出的, 某個地域的…)?spa
o 基礎架構(物理的、邏輯的)的文檔是否能找到?日誌
o 是否有監控平臺可用? (好比Munin、Zabbix、 Nagios、 … 什麼均可以)
o 是否有日誌能夠查看?(日誌管理工具好比Loggly、ELK、 Graylog…)
w 、last、 history查看有哪些用戶在線,作過哪些操做。
ps查看有哪些進程、分辨出哪些該有的和不應有的。
netstat查看相關端口。
free、 uptime 、top查看一下cpu、內存。
日誌!
2.服務器宕機了怎麼辦?
針對服務器可能發生的宕機狀況,咱們確定要先設立應急預案。
財力容許的狀況下,最好是爲每一臺服務器配備物理冗餘。同步更新數據,故障發生及時切換。
故障發生後,第一位是恢復業務,第二位是排查。
首先,啓動服務器,看是否可以登陸,若是能夠,能夠經過以下方式進行檢查。
a、是不是應用程序致使內存溢出或者泄露,out of memory致使;
b、是不是進程過多或者不斷建立,耗盡資源致使;
c、是不是數據庫程序死鎖,鏈接數過多致使;
d、是不是應用程序異常致使;
e、是不是流量負載過大致使;
f、是不是遭受*********致使;
g、是不是誤操做致使;
能夠經過查看系統日誌來查看是否有異常登陸現象的發生。固然了,若是連登陸都沒法完成,或者經過如上的處理方法都沒能處理,那麼,您就聯繫客服人員進行排查。固然了,瞭解具體問題所在,也就不成問題了。
3、web訪問慢的,如何定位問題解決?
· 是否廣泛較慢?檢測先環節:單個瀏覽器的問題?電腦問題?電信運行商?
· 查看服務器的同時鏈接數,是否是同時鏈接人數太多,已經超過服務器的正常負載。
· 查看服務器的TCP鏈接狀況,是否是被DDOS了。
· 查看服務器的內存使用量,是否是某個應用出現問題,形成內存泄漏了。
· 經過iostat、vmsta查看cpu的io,磁盤的讀寫速率。
· 查看各類日誌。
· 數據庫的連接狀況。
· 程序自己。
層層檢測,步步排查