數棧運維案例:雲上RAC部署、運維及實踐案例

數據庫產品愈來愈多,各家雲廠商也都推出基於開源MySQL、Postgre等的關係型數據庫產品,多副本、高可用、讀寫分離、分庫分表等功能更是集成在各種產品中,下降了機房建設和運維成本,助力更多的客戶上雲。html

惟獨鮮見Oracle的雲產品輸出,除非是Oracle Cloud。git

對於當前業務系統基於Oracle系統開發,且改造難度較大,如OA、ERP等系統;或對數據庫要求較高,必須使用Oracle數據庫的場景,如訂單流水、金融交付系統,袋鼠雲能夠提供阿里、華爲、騰訊公有云,阿里、Zstack專有云上完善的雲上Oracle RAC實施部署、運維方案,協助客戶無縫上雲。github

雲上單機仍是集羣,Oracle的部署都遵循官方的指導文檔,沒有差異。數據庫

可是在基礎配置上面,雲環境將網絡、服務器、磁盤等以產品化輸出,有其特殊性:服務器

  • 雲交換機:建議雲環境中全部的業務系統運行在專有網絡VPC中,建立不一樣網段交換機,供給RAC集羣、業務系統使用;同一個VPC網絡默認互通
  • 雲服務器:雲環境有地域/可用區一說,同一地域不一樣可用區相似於同城不一樣機房,集羣計算節點須要在同一個可用區中,購買在同地域不一樣可用區或不一樣地域的機器可用於部署業務/數據庫災備環境
  • 雲盤:一樣須要根據規劃購買與RAC計算節點同地域同可用區的雲盤,並掛載到計算節點上;

不一樣雲環境對一臺雲服務器上掛載磁盤個數的有不一樣限制,在集羣規劃階段須要考慮預估數據量大小以及雲盤大小。網絡

雲服務器規格能夠升配或減配,對於集羣計算節點,能夠逐一進行,下降對業務的影響。架構

1、雲上RAC規劃一覽

2節點RAC資源配置


主機 cloudrac01 Centos7.6 8C16G
cloudrac02 Centos7.6 8C16G
雲盤 3*20G OCRDG 1*100G GIMRDG 2*500G DATADG
1*500G ARCHDG 1*200G FRADG 1*500G /backup
IP信息 Public IP 192.168.33.151 192.168.33.150
Private IP 192.168.22.213 192.168.22.214
VIP 192.168.33.55 192.168.33.56
Scan IP 192.168.33.57

2、穩定高效運行

一、標準壓力測試併發

Swingbench能夠構建真實OLTP事務場景,好比訂單類業務、新建客戶、訂購、下單等流程操做,經過大批量增刪改查操做,測試不一樣併發場景下數據庫性能趨勢和穩定性,同時結合其餘監控工具,觀察服務器內存、負載、磁盤等的性能趨勢和穩定性;根據壓測結果及早發現和優化問題,評估數據庫的最佳使用方式。運維

依據袋鼠雲的集羣運維經驗,短期、低併發的壓測沒法驗證集羣的穩定性,因此在雲上集羣部署以後,會進行長時間(4小時以上)、高併發的持續壓測;ide

同時對壓測出來的集羣性能問題進行分析,優化集羣參數配置,並主動提供雲服務器、存儲資源優化建議,以期交付一個穩定、高性能的數據庫環境。

阿里雲2節點12.2.0.1RAC壓測舉例:

二、業務回放測試

DBReplay的測試方法,抓取生產環境某一時間段業務負載,單次capture能夠屢次replay,更接近於正式的生產負載,更直觀有效。主要用於數據庫升級、遷移,應用程序部署等的預演,量化評估出變動實施後對現有的性能的影響程度。

對於日常壓力較大的業務系統,在遷移割接以前有必要進行此類測試。

3、案例分享

一、某日企客戶

(1)需求分析

  • 業務總體上雲,須要部署雲上Oracle RAC 12C/11G各1套
  • 知足高可用、容災等需求

(2)架構規劃

  • 規劃20G*3雲盤作OCR/Voting組、60G*2雲盤作REDODG1/2組、200G*1雲盤作ARCHDG組、規劃500G*1雲盤作DATADG組、100G*1雲盤作MGMTDG組
  • 規劃雲服務32C64G*2做爲計算節點
  • 建議客戶採用業務分離的模式訪問數據庫

2. 某國企招聘網站

(1) 需求分析

  • 須要同時知足1w人在線訪問,併發事務2000以上
  • 自行搭建雲上Oracle單機數據庫,預計很快到達瓶頸
  • 須要高可用、容災的架構保障業務的持續運行

(2) 架構規劃

  • 新購高規格雲ECS做爲計算節點,保證充足的計算資源
  • 原單機數據庫割接後做爲DG備庫運行
  • 配置合理備份策略,上傳備份集到OSS對象存儲,異地保存

三、某省級專有云交管平臺

彙總全省交管數據,並提供查詢、分析平臺。

(1)需求分析

  • 自建機房,部署在Windows服務器單機Oracle11.2.0.1
  • 18T數據,並在逐步上漲中
  • 業務調試須要和部裏對接、調整,實際沒有測試的可能
  • 可維護時間短

(2)架構規劃

  • 專有云環境部署,2節點RAC集羣,並搭建容災備庫
  • 經過ADG實時同步機房數據,進行DBRelay壓測
  • 繼續使用備份一體機備份生產數據

數棧是雲原生—站式數據中臺PaaS,咱們在github和gitee上有一個有趣的開源項目:FlinkX,FlinkX是一個基於Flink的批流統一的數據同步工具,既能夠採集靜態的數據,也能夠採集實時變化的數據,是全域、異構、批流一體的數據同步引擎。你們喜歡的話請給咱們點個star!star!star!

github開源項目:https://github.com/DTStack/flinkx

gitee開源項目:https://gitee.com/dtstack_dev_0/flinkx

相關文章
相關標籤/搜索