RTO與RPO

在災難恢復方面,目前業界公認有三個目標值得努力。一是恢復時間,企業能忍受多長時間沒有 IT,處於停業狀態;二是網絡多長時間可以恢復;三是業務層面的恢復。整個恢復過程當中,最關鍵的衡量指標有兩個:一個是 RTO,另外一個是 RPO。html


所謂 RTO,Recovery Time Objective,它是指災難發生後,從 IT 系統當機致使業務停頓之時開始,到 IT 系統恢復至能夠支持各部門運做、恢復運營之時,此兩點之間的時間段稱爲 RTO。網絡


所謂 RPO,Recovery Point Objective,是指從系統和應用數據而言,要實現可以恢復至能夠支持各部門業務運做,系統及生產數據應恢復到怎樣的更新程度。這種更新程度能夠是上一週的備份數據,也能夠是上一次交易的實時數據。ide

 

選擇標準

 

對災難恢復而言, RTO 與 RPO 哪一個衡量指標更合適呢?
在考慮採用哪一個指標以前,IT 人首先要弄清楚一個基本概念,企業的容災系統預防的是什麼災害,是多少年一遇的,能忍受多少損失,須要算出一個大概的成本,固然不必定很精確。
其次,不管企業容災系統是採用冷備、熱備、溫備、仍是磁盤備份,幾分鐘恢復業務和幾天恢復業務效果是徹底不同的。企業須要明確對恢復時間的容忍底限是多少。
再從災備自己的意義來說,不管採用哪一種衡量指標,最終目的是要可以很好地檢驗災備系統的實用性能,不然就失去創建災備的意義了。而災備最核心的做用就是確保災難發生後業務可以連續運行,交易中的數據完整保存,丟失越少越好。所以業務層面的恢復,企業要有一個底限。
參考世界範圍內一系列災難恢復經驗,國家之間的差異很是大。好比在美國,政府是第一位的,警察局對數據的恢復要求特別高。而在中國,不管什麼性質,銀行始終是排在第一位的。性能

 

綜合平衡

 

做爲銀行,除開展自身業務以外,更多數據來自上下級銀行間的財務匯兌與結算。站在管理者的位置上,一旦災難發生,最重要的是在儘量短的時間內排除障礙,恢復業務,保證系統作到連續運行。所以,從這個角度出發,銀行允許系統停滯的時間應當越短越好。選擇 RTO 恰好合適。htm

 

可是,RTO 對成本要求過高,與回報彷佛不成正比。企業資金不可能無限制地投入到一個災備系統中。對於銀行證券這樣的聯機交易事故處理很是緊密的金融機構而言,可能每一筆、每一單、每一分錢都很重要,因此都須要恢復。RPO 顯然更爲合適。對象

 

許多時候進行選擇並不意味着非此即彼,這與現實婚姻中一夫一妻的限制仍是有差異的。RTO 和 RPO 對銀行來說都很重要。RTO 越短、RPO 越新,銀行面臨的損失就越小,但這也意味着系統開發成本將會急劇上升。許多時候,最佳的容災解決方案卻不必定是效益最好的。反之亦是。如何去平衡這中間的關係,不只是門學問,更像是藝術。
根據國際經驗,在選擇「你」仍是「她」的時候,企業應當考慮災難發生後會在多大層面上衝擊業務,這涉及到企業形象,商業機密,信譽評級,品牌競爭力等等方面,各個企業的狀況不一樣,要根據本身的狀況選擇合適的「對象」。災難恢復的目的是業務連續進行,所以不管採用 RTO 仍是 RPO,都要朝着這個核心靠攏。blog


本文轉載自:http://blog.sina.com.cn/s/blog_59388e440100oq52.html
開發

相關文章
相關標籤/搜索