10分鐘完全理解Redis的持久化機制：RDB和AOF

時間 2019-11-05

標籤 10分完全理解 redis 持久機制 rdb aof 欄目 Redis 简体版

原文原文鏈接

原創做者，公衆號【程序員讀書】，歡迎關注公衆號，轉載文章請註明出處哦。程序員

在這篇文章，咱們繼續有關Redis方面知識的學習，一塊兒瞭解一下其中一個很是重要的內容：Redis的持久化機制。redis

什麼是Redis持久化?

Redis做爲一個鍵值對內存數據庫(NoSQL)，數據都存儲在內存當中，在處理客戶端請求時，全部操做都在內存當中進行，以下所示：數據庫

這樣作有什麼問題呢？緩存

其實，只要稍微有點計算機基礎知識的人都知道，存儲在內存當中的數據，只要服務器關機(各類緣由引發的)，內存中的數據就會消失了，不只服務器關機會形成數據消失，Redis服務器守護進程退出，內存中的數據也同樣會消失。安全

對於只把Redis當緩存來用的項目來講，數據消失或許問題不大，從新從數據源把數據加載進來就能夠了，但若是直接把用戶提交的業務數據存儲在Redis當中，把Redis做爲數據庫來使用，在其放存儲重要業務數據，那麼Redis的內存數據丟失所形成的影響也許是毀滅性。bash

爲了不內存中數據丟失，Redis提供了對持久化的支持，咱們能夠選擇不一樣的方式將數據從內存中保存到硬盤當中，使數據能夠持久化保存。服務器

Redis提供了RDB和AOF兩種不一樣的數據持久化方式，下面咱們就來詳細介紹一下這種不一樣的持久化方式吧。架構

RDB

RDB是一種快照存儲持久化方式，具體就是將Redis某一時刻的內存數據保存到硬盤的文件當中，默認保存的文件名爲dump.rdb，而在Redis服務器啓動時，會從新加載dump.rdb文件的數據到內存當中恢復數據。app

開啓RDB持久化方式

開啓RDB持久化方式很簡單，客戶端能夠經過向Redis服務器發送save或bgsave命令讓服務器生成rdb文件，或者經過服務器配置文件指定觸發RDB條件。異步

1. save命令

save命令是一個同步操做。

# 同步數據到磁盤上
> save 
複製代碼

當客戶端向服務器發送save命令請求進行持久化時，服務器會阻塞save命令以後的其餘客戶端的請求，直到數據同步完成。

若是數據量太大，同步數據會執行好久，而這期間Redis服務器也沒法接收其餘請求，因此，最好不要在生產環境使用save命令。

2. bgsave

與save命令不一樣，bgsave命令是一個異步操做。

# 異步保存數據集到磁盤上
> bgsave
複製代碼

當客戶端發服務發出bgsave命令時，Redis服務器主進程會forks一個子進程來數據同步問題，在將數據保存到rdb文件以後，子進程會退出。

因此，與save命令相比，Redis服務器在處理bgsave採用子線程進行IO寫入，而主進程仍然能夠接收其餘請求，但forks子進程是同步的，因此forks子進程時，同樣不能接收其餘請求，這意味着，若是forks一個子進程花費的時間過久(通常是很快的)，bgsave命令仍然有阻塞其餘客戶的請求的狀況發生。

3. 服務器配置自動觸發

除了經過客戶端發送命令外，還有一種方式，就是在Redis配置文件中的save指定到達觸發RDB持久化的條件，好比【多少秒內至少達到多少寫操做】就開啓RDB數據同步。

例如咱們能夠在配置文件redis.conf指定以下的選項：

# 900s內至少達到一條寫命令
save 900 1
# 300s內至少達至10條寫命令
save 300 10
# 60s內至少達到10000條寫命令
save 60 10000
複製代碼

以後在啓動服務器時加載配置文件。

# 啓動服務器加載配置文件
redis-server redis.conf
複製代碼

這種經過服務器配置文件觸發RDB的方式，與bgsave命令相似，達到觸發條件時，會forks一個子進程進行數據同步，不過最好不要經過這方式來觸發RDB持久化，由於設置觸發的時間過短，則容易頻繁寫入rdb文件，影響服務器性能，時間設置太長則會形成數據丟失。

rdb文件

前面介紹了三種讓服務器生成rdb文件的方式，不管是由主進程生成仍是子進程來生成，其過程以下：

生成臨時rdb文件，並寫入數據。
完成數據寫入，用臨時文代替代正式rdb文件。
刪除原來的db文件。

RDB默認生成的文件名爲dump.rdb，固然，我能夠經過配置文件進行更加詳細配置，好比在單機下啓動多個redis服務器進程時，能夠經過端口號配置不一樣的rdb名稱，以下所示：

# 是否壓縮rdb文件
rdbcompression yes

# rdb文件的名稱
dbfilename redis-6379.rdb

# rdb文件保存目錄
dir ~/redis/
複製代碼

RDB的幾個優勢

與AOF方式相比，經過rdb文件恢復數據比較快。
rdb文件很是緊湊，適合於數據備份。
經過RDB進行數據備，因爲使用子進程生成，因此對Redis服務器性能影響較小。

RDB的幾個缺點

若是服務器宕機的話，採用RDB的方式會形成某個時段內數據的丟失，好比咱們設置10分鐘同步一次或5分鐘達到1000次寫入就同步一次，那麼若是還沒達到觸發條件服務器就死機了，那麼這個時間段的數據會丟失。
使用save命令會形成服務器阻塞，直接數據同步完成才能接收後續請求。
使用bgsave命令在forks子進程時，若是數據量太大，forks的過程也會發生阻塞，另外，forks子進程會耗費內存。

AOF

聊完了RDB,來聊聊Redis的另一個持久化方式：AOF(Append-only file)。

與RDB存儲某個時刻的快照不一樣，AOF持久化方式會記錄客戶端對服務器的每一次寫操做命令，並將這些寫操做以Redis協議追加保存到之後綴爲aof文件末尾，在Redis服務器重啓時，會加載並運行aof文件的命令，以達到恢復數據的目的。

開啓AOF持久化方式

Redis默認不開啓AOF持久化方式，咱們能夠在配置文件中開啓並進行更加詳細的配置，以下面的redis.conf文件：

# 開啓aof機制
appendonly yes

# aof文件名
appendfilename "appendonly.aof"

# 寫入策略,always表示每一個寫操做都保存到aof文件中,也能夠是everysec或no
appendfsync always

# 默認不重寫aof文件
no-appendfsync-on-rewrite no

# 保存目錄
dir ~/redis/
複製代碼

三種寫入策略

在上面的配置文件中，咱們能夠經過appendfsync選項指定寫入策略,有三個選項

appendfsync always
# appendfsync everysec
# appendfsync no
複製代碼

1. always

客戶端的每個寫操做都保存到aof文件當，這種策略很安全，可是每一個寫請注都有IO操做，因此也很慢。

2. everysec

appendfsync的默認寫入策略，每秒寫入一次aof文件，所以，最多可能會丟失1s的數據。

3. no

Redis服務器不負責寫入aof，而是交由操做系統來處理何時寫入aof文件。更快，但也是最不安全的選擇，不推薦使用。

AOF文件重寫

AOF將客戶端的每個寫操做都追加到aof文件末尾，好比對一個key屢次執行incr命令，這時候，aof保存每一次命令到aof文件中，aof文件會變得很是大。

incr num 1
incr num 2
incr num 3
incr num 4
incr num 5
incr num 6
...
incr num 100000
複製代碼

aof文件太大，加載aof文件恢復數據時，就會很是慢，爲了解決這個問題，Redis支持aof文件重寫，經過重寫aof，能夠生成一個恢復當前數據的最少命令集，好比上面的例子中那麼多條命令，能夠重寫爲：

set num 100000
複製代碼

aof文件是一個二進制文件，並非像上面的例子同樣，直接保存每一個命令，而使用Redis本身的格式，上面只是方便演示。

兩種重寫方式

經過在redis.conf配置文件中的選項no-appendfsync-on-rewrite能夠設置是否開啓重寫，這種方式會在每次fsync時都重寫，影響服務器性以，所以默認值爲no，不推薦使用。

# 默認不重寫aof文件
no-appendfsync-on-rewrite no
複製代碼

客戶端向服務器發送bgrewriteaof命令，也可讓服務器進行AOF重寫。

# 讓服務器異步重寫追加aof文件命令
> bgrewriteaof
複製代碼

AOF重寫方式也是異步操做，即若是要寫入aof文件，則Redis主進程會forks一個子進程來處理，以下所示：

重寫aof文件的好處

壓縮aof文件，減小磁盤佔用量。
將aof的命令壓縮爲最小命令集，加快了數據恢復的速度。

AOF文件損壞

在寫入aof日誌文件時，若是Redis服務器宕機，則aof日誌文件文件會出格式錯誤，在重啓Redis服務器時，Redis服務器會拒絕載入這個aof文件，能夠經過如下步驟修復aof並恢復數據。

備份如今aof文件，以防萬一。
使用redis-check-aof命令修復aof文件，該命令格式以下：

# 修復aof日誌文件
$ redis-check-aof -fix file.aof
複製代碼

重啓Redis服務器，加載已經修復的aof文件，恢復數據。

AOF的優勢

AOF只是追加日誌文件，所以對服務器性能影響較小，速度比RDB要快，消耗的內存較少。

AOF的缺點

AOF方式生成的日誌文件太大，即便經過AFO重寫，文件體積仍然很大。
恢復數據的速度比RDB慢。

選擇RDB仍是AOF呢？

經過上面的介紹，咱們瞭解了RDB與AOF各自的優勢與缺點，到底要如何選擇呢？

經過下面的表示，咱們能夠從幾個方面對比一下RDB與AOF,在應用時，要根本本身的實際需求，選擇RDB或者AOF，其實，若是想要數據足夠安全，能夠兩種方式都開啓，但兩種持久化方式同時進行IO操做，會嚴重影響服務器性能，所以有時候不得不作出選擇。

當RDB與AOF兩種方式都開啓時，Redis會優先使用AOF日誌來恢復數據，由於AOF保存的文件比RDB文件更完整。

小結

上面講了一大堆Redis的持久化機制的知識，其實，若是你只是單純把Redis做爲緩存服務器，那麼能夠徹底不用考慮持久化，可是，在現在的大多數服務器架構中，Redis的單單只是扮演一個緩存服務器的角色，還能夠做爲數據庫，保存咱們的業務數據，此時，咱們則須要好好了解有關Redis持久化策略的區別與選擇。

你的關注，是我寫做路上最大的鼓勵！