RDB 和 AOF 持久化的原理是什麼?我應該用哪個?它們的優缺點?

Redis 提供了 RDB 和 AOF 兩種持久化方案:html

RDB:生成指定時間間隔內的 Redis 內存中數據快照,是一個二進制文件 dumpr.rdbredis

AOF:記錄 Redis 除了查詢之外的全部寫命令,並在Redis 服務啓動時,經過從新執行這些命令來還原數據。數據庫

RDB 持久化

默認 Redis 會以 RDB 快照的形式將一段時間內的數據持久化到硬盤,保存成一個 dumpr.rdb 二進制 文件。緩存

工做原理簡單介紹一下安全

當 Redis 須要作持久化時,Redis 會 fork 一個子進程,子進程將數據寫到磁盤上一個臨時 RDB 文件中。當子進程完成寫臨時文件後,將原來的 RDB 替換掉,這樣的好處就是能夠 copy-on-write服務器

固然咱們也能夠手動執行 save 或者 bgsave(異步)生成 RDB 文件。app

redis.conf 默認配置異步

save 900  1
save 300  10
save 60  10000
  • 900秒以內,若是超過1個key被修改,則發起快照保存;
  • 300秒以內,若是超過10個key被修改,則發起快照保存;
  • 60秒以內,若是1萬個key被修改,則發起快照保存;

RDB 快照命令

在默認狀況下, Redis 將數據庫快照保存在名字爲 dump.rdb 的二進制文件中。函數

你能夠對 Redis 進行設置, 讓它在「 N 秒內數據集至少有 M 個改動」這一條件被知足時, 自動保存一次數據集。工具

你也能夠經過調用 SAVE 或者 BGSAVE , 手動讓 Redis 進行數據集保存操做。

好比說, 如下設置會讓 Redis 在知足「 60 秒內有至少有 1000 個鍵被改動」這一條件時, 自動保存一次數據集:

save 60 1000

這種持久化方式被稱爲快照(snapshot)。

RDB 建立原理

當 Redis 須要保存 dump.rdb 文件時, 服務器執行如下操做:

  • Redis 調用 fork() ,同時擁有父進程和子進程。
  • 子進程將數據集寫入到一個臨時 RDB 文件中。
  • 當子進程完成對新 RDB 文件的寫入時,Redis 用新 RDB 文件替換原來的 RDB 文件,並刪除舊的 RDB 文件。

這種工做方式使得 Redis 能夠從寫時複製(copy-on-write)機制中獲益。

RDB 的優勢

RDB 是一個比較緊湊的文件,它保存了 Redis 在某個時間點的數據,這種數據比較適合作備份和用於災難恢復。

好比說,你能夠在最近的 24 小時內,每小時備份一次 RDB 文件,而且在每月的每一天,也備份一個 RDB 文件。 這樣的話,即便趕上問題,也能夠隨時將數據集還原到不一樣的版本。

RDB 的缺點

若是你須要儘可能避免在服務器故障時丟失數據,那麼 RDB 不適合你。 雖然 Redis 容許你設置不一樣的保存點來控制保存 RDB 文件的頻率, 可是, 由於 RDB 文件須要保存整個數據集的狀態, 因此它並非一個輕鬆的操做。 所以你可能會至少 5 分鐘才保存一次 RDB 文件。 在這種狀況下, 一旦發生故障停機, 你就可能會丟失好幾分鐘的數據。

AOF 持久化

使用 AOF 作持久化,每個寫命令都經過 write 函數追加到 appendonly.aof 文件中。

AOF 就能夠作到全程持久化,只須要在配置文件中開啓(默認是 no ),appendfsync yes 開啓 AOF 以後,Redis 每執行一個修改數據的命令,都會把它添加到 AOF 文件中,當 Redis 重啓時,將會讀取 AOF 文件進行「重放」以恢復到 Redis 關閉前的最後時刻。

AOF 的配置

你能夠配置 Redis 多久纔將數據 fsync 到磁盤一次。

redis.conf 默認配置

appendfsync yes
appendfsync always     #每次有數據修改發生時都會寫入AOF文件。
appendfsync everysec   #每秒鐘同步一次,該策略爲AOF的缺省策略。

有三個選項:

1,每次有新命令追加到 AOF 文件時就執行一次 fsync :很是慢,也很是安全。
2,每秒 fsync 一次:足夠快(和使用 RDB 持久化差很少),而且在故障時只會丟失 1 秒鐘的數據。
3,從不 fsync :將數據交給操做系統來處理。更快,也更不安全的選擇。

推薦(而且也是默認)的措施爲每秒 fsync 一次, 這種 fsync 策略能夠兼顧速度和安全性。

AOF 建立原理

AOF 重寫和 RDB 建立快照同樣,都巧妙地利用了寫時複製機制。

如下是 AOF 重寫的執行步驟

Redis 執行 fork() ,如今同時擁有父進程和子進程。

子進程開始將新 AOF 文件的內容寫入到臨時文件。

對於全部新執行的寫入命令,父進程一邊將它們累積到一個內存緩存中,一邊將這些改動追加到現有 AOF 文件的末尾: 這樣即便在重寫的中途發生停機,現有的 AOF 文件也仍是安全的。

當子進程完成重寫工做時,它給父進程發送一個信號,父進程在接收到信號以後,將內存緩存中的全部數據追加到新 AOF 文件的末尾。

搞定!如今 Redis 原子地用新文件替換舊文件,以後全部命令都會直接追加到新 AOF 文件的末尾。

AOF 的優勢

1,使用 AOF 作持久化,能夠設置不一樣的 fsync 策略,好比無 fsync ,每秒鐘一次 fsync ,或者每次執行寫入命令時 fsync 。

AOF 的默認策略爲每秒鐘 fsync 一次,在這種配置下,Redis 仍然能夠保持良好的性能,而且就算髮生故障停機,也最多隻會丟失一秒鐘的數據。

fsync 會在後臺線程執行,因此主線程能夠繼續努力地處理命令請求。

2,AOF 文件是一個只進行追加操做的日誌文件,不是生成新的以後替換掉那種,即便日誌由於某些緣由而包含了未寫入完整的命令(好比寫入時磁盤已滿,寫入中途停機,等等), redis-check-aof 工具也能夠輕易地修復這種問題。

3,Redis 能夠在 AOF 文件體積變得過大時,自動地在後臺對 AOF 進行重寫: 重寫後的新 AOF 文件包含了恢復當前數據集所需的最小命令集合。

整個重寫操做是絕對安全的,由於 Redis 重寫是建立新 AOF 文件,重寫的過程當中會繼續將命令追加到現有舊的 AOF 文件裏面,即便重寫過程當中發生停機,現有舊的 AOF 文件也不會丟失。 而一旦新 AOF 文件建立完畢,Redis 就會從舊 AOF 文件切換到新 AOF 文件,並開始對新 AOF 文件進行追加操做。

4,AOF 文件有序地保存了對數據庫執行的全部寫入操做, 這些寫入操做以 Redis 協議的格式保存, 所以 AOF 文件的內容很是容易被人讀懂, 對文件進行分析(parse)也很輕鬆。 導出(export) AOF 文件也很是簡單: 舉個例子, 若是你不當心執行了 _FLUSH ALL_(清空整個 Redis 服務器的數據(刪除全部數據庫的全部 key )。) 命令, 但只要 AOF 文件未被重寫, 那麼只要中止服務器, 移除 AOF 文件末尾的 FLUSHALL 命令, 並重啓 Redis , 就能夠將數據集恢復到 FLUSHALL 執行以前的狀態。

AOF 的缺點

對於相同的數據集來講,AOF 文件的體積一般要大於 RDB 文件的體積。

根據所使用的 fsync 策略,AOF 的速度可能會慢於 RDB。 在通常狀況下, 每秒 fsync 的性能依然很是高, 而關閉 fsync 可讓 AOF 的速度和 RDB 同樣快, 即便在高負荷之下也是如此。

不過在處理巨大的寫入載入時,RDB 能夠提供更有保證的最大延遲時間(latency)。

RDB 和 AOF 兩者的區別

RDB持久化是指在指定的時間間隔內將內存中的數據集快照寫入磁盤,實際操做過程是fork一個子進程,先將數據集寫入臨時文件,寫入成功後,再替換以前的文件,用二進制壓縮存儲。

AOF持久化以日誌的形式記錄服務器所處理的每個寫、刪除操做,查詢操做不會記錄,以文本的方式追加記錄,能夠打開文件看到詳細的操做記錄。

RDB 和 AOF 我應該用哪個?

若是你很是關心你的數據,但仍然能夠承受數分鐘之內的數據丟失,那麼你能夠只使用 RDB 持久。

AOF 將 Redis 執行的每一條命令追加到磁盤中,處理巨大的寫入會下降 Redis 的性能,不知道你是否能夠接受。

數據庫備份和災難恢復:

定時生成 RDB 快照(snapshot)很是便於進行數據庫備份, 而且 RDB 恢復數據集的速度也要比 AOF 恢復的速度要快。

Redis 支持同時開啓 RDB 和 AOF,系統重啓後,Redis 會優先使用 AOF 來恢復數據,這樣丟失的數據會最少。

AOF BGREWRITEAOF 重寫

由於 AOF 的運做方式是不斷地將命令追加到文件的末尾, 因此隨着寫入命令的不斷增長, AOF 文件的體積也會變得愈來愈大。

舉個例子

若是你對一個計數器調用了 100 次 INCR , 那麼僅僅是爲了保存這個計數器的當前值, AOF 文件就須要使用 100 條記錄(entry)

然而在實際上, 只使用一條 SET 命令已經足以保存計數器的當前值了, 其他 99 條記錄實際上都是多餘的。

爲了處理這種狀況, Redis 支持一種有趣的特性: 能夠在不打斷服務客戶端的狀況下, 對 AOF 文件進行重建(rebuild)。

執行 BG REWRITE AOF 命令, Redis 將生成一個新的 AOF 文件, 這個文件包含重建當前數據集所需的最少命令。

Redis 2.2 須要本身手動執行 BGREWRITEAOF 命令; Redis 2.4 則能夠自動觸發 AOF 重寫, 具體信息請查看 2.4 的示例配置文件。

備份 Redis 數據

磁盤故障, 節點失效, 諸如此類的問題均可能讓你的數據消失不見, 不進行備份是很是危險的。

Redis 對於數據備份是很是友好的, 由於你能夠在服務器運行的時候對 RDB 文件進行復制: RDB 文件一旦被建立, 就不會進行任何修改。 當服務器要建立一個新的 RDB 文件時, 它先將文件的內容保存在一個臨時文件裏面, 當臨時文件寫入完畢時, 程序才使用 rename(2) 原子地用臨時文件替換原來的 RDB 文件。

這也就是說, 不管什麼時候, 複製 RDB 文件都是絕對安全的。

如下是咱們的建議

1,建立一個按期任務(cron job), 每小時將一個 RDB 文件備份到一個文件夾, 而且天天將一個 RDB 文件備份到另外一個文件夾。
2,確保快照的備份都帶有相應的日期和時間信息, 每次執行按期任務腳本時, 使用 find 命令來刪除過時的快照: 好比說, 你能夠保留最近 48 小時內的每小時快照, 還能夠保留最近一兩個月的每日快照。
3,至少天天一次, 將 RDB 備份到你的數據中心以外, 或者至少是備份到你運行 Redis 服務器的物理機器以外。

圖片描述

相關文章
相關標籤/搜索