在6月上旬舉行的雲棲大會上海峯會上,阿里雲發佈了國內首個大數據集羣雙活容災產品-混合雲容災服務下的混合雲大數據容災服務(HDR for Big Data, 簡稱 HDR-BD),並已經在7月份開始邀測。HDR-BD採用業界領先的數據雙向實時複製技術,能夠實現Hadoop集羣雙活和準0 RPO容災,爲大數據災備制定了全新的標準。服務器
常見Hadoop災備技術的挑戰架構
當前比較常見的Hadoop集羣災備方式是用distcp將數據按期複製到一個備用集羣作容災用途,或者將數據複製到只讀集羣、二級存儲做爲多恢復點的備份。這些方案都有明顯弱點。運維
RPO和RTO是衡量災備方案的兩個重要指標,RPO-恢復點目標,決定了丟失多少數據,RTO-恢復時間目標,決定了業務中斷了多長時間。因爲傳統的Hadoop集羣災備方式使用的是distcp來作容災,也就意味着數據複製不是實時的,所以用戶必須承受至少小時級到天級的RPO。而且主站宕機後,將只讀集羣或二級存儲中的數據恢復出來會佔用大量時間,而拉起standby集羣從新啓動業務依然是一個耗時的操做。所以,傳統的Hadoop集羣災備方式在RPO和RTO方面都有較大挑戰。tcp
除此以外,因爲災備集羣平時處於備用狀態,不能用於運行業務,對於用戶來講也屬於資源浪費。oop
以上這些問題長期困擾着Hadoop集羣的用戶和管理員們,如何突破RPO和RTO瓶頸,大數據集羣的災備領域亟需一種全新的技術來完全解決目前的困境。大數據
HDR- BD這次帶來的雙向實時複製技術能夠在兩個Hadoop集羣之間創建雙活架構,RPO接近0;RTO由於數據隨時可讀寫而極大壓縮;雙活架構可讓兩個集羣運行不一樣的應用,避免資源浪費。這些特性將Hadoop災備標準提升到了一個全新的高度,爲Hadoop用戶帶來了極高的價值。阿里雲
HDR-BD引入大數據雙向複製技術,知足高要求的大數據災備場景對象
阿里雲這次推出的Hadoop雙活容災方案HDR-BD引入了業界領先的大數據雙向複製技術,結合強大的公共雲基礎設施,能夠知足極高要求的大數據災備場景,爲企業Hadoop集羣數據保護提供了全新的選擇。
HDR-BD的優點在於:blog
在自建數據中心和阿里雲之間部署HDR-BD服務器配對,用戶就能夠將自建Hadoop集羣與阿里雲無縫集成,充分利用阿里雲EMR和OSS創建極爲高效的Hadoop災備,遷移系統。HDR-BD能夠知足的核心場景包括資源