超融合基礎架構與同城災備建設實踐

如何基於超融合及相應的 CDP 軟件建設一個高可用、高穩定、高處理能力、低成本的災備中心,進而知足監管要求,同時下降 IT 部門的 TCO?數據庫

2012 年監管單位發出 《關於增強基金管理公司信息系統備份能力建設工做》 的通知,通知裏面明確了公募基金公司須要按照《證券期貨經營機構信息系統備份能力標準》執行落實各業務系統備份能力建設目標和等級。2018 年末,監管單位發佈的《證券基金經營機構信息技術管理辦法》再次提到備份系統建設要求,即證券基金經營機構應當確保備份系統與生產系統具有同等的處理能力。服務器

公募基金容災方案面臨的挑戰
今年來,建設同城或者異地災備機房,爲核心生產系統建設同等處理能力的備份系統成爲基金公司較爲廣泛的需求,但傳統方案給 IT 部門帶來較大的壓力和挑戰:網絡

1.高昂的採購成本。傳統架構須要購置大量服務器、同等性能的磁盤陣列而且對應的存儲須要經過複製技術(例如 EMC VPLEX )保證數據冗餘,應用系統層面須要經過負載均衡保證應用的高可用,才能構建同等處理能力災備環境,這樣的架構無疑須要高昂的預算才能知足。架構

2.複雜的運維工做。因爲存儲屬於專業硬件設備,使用存儲雙活架構更是加大了存儲運維複雜度,用戶沒法快速掌握產品運維能力,長期須要依賴原廠服務支持。併發

3.災備演練流程繁瑣。採用傳統 SAN 架構建設災備環境,沒法高效完成災備切換演練,須要多部門、多人員配合完成。負載均衡

超融合架構配合基於虛擬化的CDP爲容災方案成本與效率帶來重要突破
近些年隨着虛擬化普及度不斷提高,愈來愈多的生產應用都在虛擬化平臺(例如 VMware )上部署,甚至包括 Oracle 、 SQL 等數據庫應用也開始向虛擬化平臺轉移。在此基礎上,進一步產生了基於超融合虛擬化架構(HCI)以及專門配合虛擬化的持續數據保護(CDP)產品。運維

超融合架構以融合部署方式在單個節點內提供了虛擬化和分佈式塊存儲,除了繼承虛擬化的優點之外,還經過分佈式塊存儲帶來以下好處:異步

1.軟件定義的架構基於 x86 服務器,配合融合部署模式,大大下降運維難度,同時減小了機架空間;分佈式

2.副本和自動恢復技術解決了硬件單點故障問題並進一步下降故障帶來的人工運維成本和風險;ide

3.分佈式的架構帶來良好的可擴展性和併發性能,用戶可真正作到按需投資並得到遠高於傳統架構的存儲性能。

另外一方面,新一代基於虛擬化的持續數據保護產品經過 VM 的複製(同步/異步)保證備份虛擬機裏的配置和生產集羣虛擬機一致,並帶來了以下優點:

1.自動化回滾;

2.分鐘級故障切換;

3.可在幾分鐘內完成回滾;

4.可進行無中斷災難恢復測試。

如下是 SmartX 超融合和 Zerto CDP 容災產品的架構圖示意:

超融合基礎架構與同城災備建設實踐

國內某基金公司基於超融合+虛擬機CDP技術建設同城災備機房實踐
1、前期需求要點:
1.生產集羣數據存儲在一臺中端存儲,設備使用近 3 年,存儲系統存在單點故障,須要解決存儲單點故障問題;

2.考慮建設基於數據中心故障級別容災中心,但預算有限,但願性價比最高的解決方案;

3.因爲 IT 部門人員有限,所以但願數據中心的容災切換足夠簡單,能夠實現一鍵式切換演練;

4.現階段 Oracle RAC 還部署在 IBM 小型機上,設備陳舊,考慮設備風險問題及運維複雜問題,但願儘快淘汰 IBM 小機;

5.生產和災備中心基礎架構性能方面須支撐核心數據庫系統的平常業務壓力,且須要擁有同等業務處理能力;

6.災備機房計劃租用 IDC 機房,空間有限,但願設備越少越好,同時要保證後續擴展便捷。

超融合基礎架構與同城災備建設實踐
原生產中心基礎架構(變革前)

2、方案建議:
1.結合本次機房改造+災備中心建設需求,推薦採用兩套 SmartX 超融合集羣+ CDP 災備軟件 (第三方軟件) ,建設數據中心故障級別容災中心;

2.經過 P2V 、 V2V 方法將小型機上 Oracle 數據庫及核心生產應用遷移到超融合平臺,淘汰老舊設備,經過超融合冗餘技術(副本技術、機架感知技術等)解決集羣硬件單點故障;

3.硬件均爲標準 x86 服務器及以太網交換機;

4.經過超融合架構, 構建統一的存儲池,提高總體系統性能,提高擴展能力,下降難度;

5.經過 CDP 災備軟件實現秒級的 RPO 和分鐘級的切換。

3、方案成效
基於上述方案建設思路,方案實現後的架構和效果以下:

超融合基礎架構與同城災備建設實踐

1.核心業務全支撐。完成兩個數據中心的建設,所有生產系統均遷移至超融合平臺,包括 O32 系統、估值系統、TA 系統、直銷系統、各種 Oracle 數據庫 (投資、TA、估值、風控、數據中心)、行情、報盤等;

2.多套機制保障業務連續性和數據可靠性。核心生產數據由 1 份數據增長到存放 3 份,即生產集羣數據 + 災備集羣數據 + 利舊服務器搭建的 Oracle 服務器集羣數據。其中,Oracle 服務器集羣使用數據庫 DG 功能進行復制,生產集羣和災備集羣都採用雙副本技術進一步保障;

3.統一爲 x86 架構軟件數據中心。生產集羣由小型機 + x86 服務器 + 集中存儲變爲分佈式 x86 服務器加軟件構建的雙超融合集羣,並經過超融合管理界面,輕鬆管理生產、災備集羣,大幅下降運維工做量;

4.實現持續容災保護。打通生產集羣及災備集羣網絡二層架構,經過 CDP 工具實現 RPO 秒級、RTO 分鐘級容災能力,兩個集羣上虛擬機互相備份,一鍵切換,極大的下降災切演練複雜度;

5.首次投入成本大幅節省,將來實現真正的按需投資。兩個集羣都可水平擴展,按需投資,基礎資源投入可知足 1-2 年需求便可。不使用專業硬件,首次採購成本降低明顯;

6.機櫃空間縮減 83% , IDC 租賃費用大幅下降。 IDC 使用超融合高密一體機,將此前生產基礎架構全部硬件設備使用的 12 個機櫃縮減到 2 個機櫃,下降了 IDC 租賃費用;

超融合基礎架構與同城災備建設實踐

  1. 網絡架構大幅簡化。以太網+ SAN 網絡的複雜網絡架構轉變爲簡單的以太網絡架構;

升級以前

超融合基礎架構與同城災備建設實踐

公募基金公司升級前的網絡架構圖

升級以後
超融合基礎架構與同城災備建設實踐

公募基金公司超融合架構升級後的網絡架構圖
8.性能大幅提高。超融合極大提高了存儲 IO 性能,經過測試驗證投資管理平臺訂單處理效率提高明顯,其中委託下單含成交回報可達 130筆/s ; TA 系統完成跑批執行時間相比此前縮短超過 5 倍。

總結
經過超融合基礎架構以及基於虛擬化的 CDP 容災技術構建的新一代 IT 基礎架構,較爲快速的完成了數據中心級容災方案的建設,符合 「穩態+敏態」 IT 建設規劃,同時簡化基礎架構運維工做,極大的提高了運維效率,下降了採購成本,使得信息技術部門可將更多的精力投入到公司業務發展層面上,但願以上方案和實踐能夠爲業內帶來有價值的參考。

瞭解更多金融行業解決方案,請點擊:https://www.smartx.com/solution/finance/

相關文章
相關標籤/搜索