【公測中】阿里雲發佈國內首個大數據雙活容災服務,知足高要求大數據災備場景

在6月上旬舉行的雲棲大會上海峯會上,阿里雲發佈了國內首個大數據集羣雙活容災產品-混合雲容災服務下的混合雲大數據容災服務(HDR for Big Data, 簡稱 HDR-BD),並已經在7月份開始邀測。HDR-BD採用業界領先的數據雙向實時複製技術,能夠實現Hadoop集羣雙活和準0 RPO容災,爲大數據災備制定了全新的標準。服務器

常見Hadoop災備技術的挑戰架構

當前比較常見的Hadoop集羣災備方式是用distcp將數據按期複製到一個備用集羣作容災用途,或者將數據複製到只讀集羣、二級存儲做爲多恢復點的備份。這些方案都有明顯弱點。運維

RPO和RTO是衡量災備方案的兩個重要指標,RPO-恢復點目標,決定了丟失多少數據,RTO-恢復時間目標,決定了業務中斷了多長時間。因爲傳統的Hadoop集羣災備方式使用的是distcp來作容災,也就意味着數據複製不是實時的,所以用戶必須承受至少小時級到天級的RPO。而且主站宕機後,將只讀集羣或二級存儲中的數據恢復出來會佔用大量時間,而拉起standby集羣從新啓動業務依然是一個耗時的操做。所以,傳統的Hadoop集羣災備方式在RPO和RTO方面都有較大挑戰。tcp

除此以外,因爲災備集羣平時處於備用狀態,不能用於運行業務,對於用戶來講也屬於資源浪費。oop

以上這些問題長期困擾着Hadoop集羣的用戶和管理員們,如何突破RPO和RTO瓶頸,大數據集羣的災備領域亟需一種全新的技術來完全解決目前的困境。大數據

HDR- BD這次帶來的雙向實時複製技術能夠在兩個Hadoop集羣之間創建雙活架構,RPO接近0;RTO由於數據隨時可讀寫而極大壓縮;雙活架構可讓兩個集羣運行不一樣的應用,避免資源浪費。這些特性將Hadoop災備標準提升到了一個全新的高度,爲Hadoop用戶帶來了極高的價值。阿里雲

HDR-BD引入大數據雙向複製技術,知足高要求的大數據災備場景對象

阿里雲這次推出的Hadoop雙活容災方案HDR-BD引入了業界領先的大數據雙向複製技術,結合強大的公共雲基礎設施,能夠知足極高要求的大數據災備場景,爲企業Hadoop集羣數據保護提供了全新的選擇。
HDR-BD的優點在於:blog

  1. 極低RPO:數據的實施複製決定了每個寫操做都會實時複製到配對集羣,RPO幾乎爲0
  2. 極高資源利用率:數據雙向複製確保兩個集羣共享一份數據但運行不一樣應用,不會出現一個集羣必須處於只讀會備用狀態的問題,計算資源能夠充分利用
  3. 運維複雜度極低: HDR-BD實現了數據的全自動實時雙向複製,無需特定時間窗口,也無需擔憂對業務的影響

1

在自建數據中心和阿里雲之間部署HDR-BD服務器配對,用戶就能夠將自建Hadoop集羣與阿里雲無縫集成,充分利用阿里雲EMR和OSS創建極爲高效的Hadoop災備,遷移系統。HDR-BD能夠知足的核心場景包括資源

  1. 近0 RPO Hadoop雲容災
    將自建Hadoop集羣的數據實時複製到阿里雲EMR集羣,實現接近0 RPO的Hadoop集羣容災。
  2. Hadoop集羣與阿里雲EMR集羣雙活
    在自建Hadoop集羣和阿里雲EMR集羣之間創建數據雙向複製。兩個集羣共享一份數據,可是運行不一樣的應用,實現集羣雙活,達到資源的最大化利用。
  3. Hadoop數據實時備份,遷移上雲 雲上HDR-BD服務器能夠直連至阿里雲對象存儲OSS。在無需EMR集羣的狀況下,HDR for Big Data能夠將Hadoop數據實時複製到阿里雲OSS,實現接近0 RPO的雲備份;同時這個機制也能夠做爲Hadoop數據遷移上雲的理想方案。利用這個機制作Hadoop集羣遷移上雲,在遷移過程當中無需啓動EMR集羣;同時遷移過程無需複雜定製化腳本開發或者複雜的業務停機規劃。
相關文章
相關標籤/搜索