[原創]淺談互聯網企業故障定級

[原創]淺談互聯網企業故障定級安全

  相信各位所在的互聯網企業,都會有對故障級別的定義,無論是作金融,電信,遊戲,仍是社交等,故障這個詞永遠不陌生,今天來談下對故障定級應如何去考慮。遊戲

首先,來談談什麼是故障?系統上線後,通常都會正常運營,若是出現一些非不可抗拒因素形成的對系統服務中斷或是發生非預期的行業,均可以稱爲故障。一般多數公司都會按嚴重性來區分故障定級,雖然是一個很好的方法,但有時技術人員會絕得,我很短期就恢復了,並無形成很大的損失,因此我的絕得故障也要有時間維度,總結如上所說,咱們就將按嚴重性危害和時間二個大的維度來定義。互聯網

  故障定級,通常咱們會去定義5級,具體以下:方法

1級 系統中斷2小時以上  形成大範圍影響使用(通常出現主要的領導是要背責的);技術

2級 系統中斷30分鐘-2小時之間    形成大範圍影響使用;總結

3級 系統重要模塊出現問題,影響大量用戶投訴;時間

4級 系統次要模塊出現問題,影響部分用戶投訴;思考

5級 系統資要模塊出現問題,有少量影響形成投訴;行業

  一般各公司故障定級大同小異,與我上面描述都差不了多少,只是具體的邊界限定各公司標準不同,我的認爲一個成熟的公司至少都應有上面如述要求;可是咱們發現沒這個定義去偏偏少了一些重要考慮因素,是什麼呢?錢,若是出了故障很小範圍,影響面小,但會給公司形成損失,難道不考慮嗎?因此在互聯網金融系統中,對故障尤爲是資金安全也會作爲一條衡量系統故障級別的考察點,通常咱們定義以下:系統

  若是給公司或用戶形成50000元損失,將認定爲1級嚴重故障或是事故(通常出現主要的領導是要背責的);其它各級別定義,我就不在詳述,基本上大同小異,重要的考考慮問題及思考的角度。

相關文章
相關標籤/搜索