Amazon新一代雲端關係數據庫Aurora（下）

時間 2019-11-21

原文原文鏈接

本文由網易雲發佈。mysql

做者：郭憶算法

本篇文章僅限內部分享，如需轉載，請聯繫網易獲取受權。sql

故障恢復

MySQL基於Check point的機制，週期性的創建redo log與數據頁的一致點。一旦數據庫重啓，從記錄的Check point開始，根據redo log，對相應的數據頁進行更新，對於已經提交的事務則確保事務更新持久化到硬盤的數據頁中，對於未提交事務，利用數據頁對應的roll pointer指針找到對應的undo log，進行回滾。MySQL 通常5分鐘一個check point，在故障恢復過程當中，由一個線程負責redo log的回放，整個過程數據庫實例徹底是停服的。數據庫

與MySQL 相同的是Aurora 在故障恢復過程時，首先也必需要找到一個一致性點，可是與MySQL不一樣的時，這個一致不要求全部的數據頁是一致的，Aurora只要求找到VDL，確保日誌的一致性。網絡

基於read quorum機制，Aurora能夠確保對於每個PG，讀到知足writer quorum的redo log record，從而創建VDL。對於每一個存儲節點，大於VDL的redo log記錄將被刪除。另外，雖然論文中並無提，可是因爲Aurora的Cache是獨立於數據庫進程的，因此當僅是數據庫實例重啓時，Cache內Page LSN大於VDL的數據頁一樣也須要被清理掉，由於這部分數據頁對應的redo log並無持久化到存儲系統中。數據結構

創建VDL後，數據庫便可以開始進行正常的讀寫訪問。對於沒有被提交的事務，因爲undo寫入的同時也會寫redo，而且存在在同一個MTR中，因此undo也是完整的，根據undo能夠完成對事務的回滾。可是與MySQL不一樣的是未提交事務的回滾是後臺異步在存儲節點完成的。同時，Aurora的redo log的更新是根據page待修改記錄的多少來按需進行合併的，而且因爲底層存儲系統redo log和數據頁分散在多個存儲節點的segment上，因此能夠並行進行數據頁的合併。架構

通過AWS 官方的測試，Aurora在10W 寫QPS的壓力下，故障恢復只須要10秒。另外值得一提的是，與MySQL Buffer Cache是進程內分配的內存空間不一樣，Aurora的Buffer Cache是獨立於數據庫進程的，這樣作的一個好處就是數據庫宕機之後，不會丟失熱點，固然這也僅限於數據庫實例宕機，若是是系統宕機，就沒用了。併發

性能異步

測試對象爲Aurora，MySQL 5.6，MySQL5.7,分別在5種規格下（最大規格爲32 vcpus，244G內存，最小的規格爲2 vcpu，15G 內存，每種規格爲前一個規格的一半vcpu和內存）的sysbench 純讀和純寫的壓測。測試數據量爲1G，因此是全內存的測試。ide

性能對比仍是很明顯的，得益於大幅減小的跨網絡IO以及基於log-structured storage的數據結構，Aurora在r3.8xlarge規格下寫能夠達到每秒12W。因爲Aurora能夠建立多個只讀實例，因此Aurora在r3.8xlarge規格下讀能夠達到60W（文章中並無說起是否使用了Aurora，可是在全內存場景下，筆者猜想，應該是基於多個replica達到的）

總結

作架構設計的人有一個共識，沒有最完美的架構設計，只有最適合的架構設計。Aurora 應該說就是這種理念最完美的詮釋。在計算與存儲分離的雲基礎設施之上，經過僅傳輸redo log，大幅減小跨網絡的IO數據傳輸，將產生大量IO的數據頁合併和持久化交由本地存儲來解決，大幅減緩了網絡延遲對數據庫性能的影響。

另外，基於log-structured storage的數據頁合併，相比Check point，能夠更加高效的合併針對同一個數據頁的更新，這些無疑提升了數據庫的寫入性能。多個replica共享同一個storage volume，多副本併發讀取，大幅提升了數據庫的讀性能。整體來講，

Aurora 對於雲端數據庫的架構設計具備劃時代的意義，充分利用了雲基礎設施的架構特性，將數據庫性能作到極致。