原創做者,公衆號【程序員讀書】,歡迎關注公衆號,轉載文章請註明出處哦。程序員
在這篇文章,咱們繼續有關Redis
方面知識的學習,一塊兒瞭解一下其中一個很是重要的內容:Redis
的持久化機制。redis
Redis
做爲一個鍵值對內存數據庫(NoSQL
),數據都存儲在內存當中,在處理客戶端請求時,全部操做都在內存當中進行,以下所示:數據庫
這樣作有什麼問題呢?緩存
其實,只要稍微有點計算機基礎知識的人都知道,存儲在內存當中的數據,只要服務器關機(各類緣由引發的),內存中的數據就會消失了,不只服務器關機會形成數據消失,Redis
服務器守護進程退出,內存中的數據也同樣會消失。安全
對於只把Redis
當緩存來用的項目來講,數據消失或許問題不大,從新從數據源把數據加載進來就能夠了,但若是直接把用戶提交的業務數據存儲在Redis
當中,把Redis
做爲數據庫來使用,在其放存儲重要業務數據,那麼Redis
的內存數據丟失所形成的影響也許是毀滅性。bash
爲了不內存中數據丟失,Redis
提供了對持久化的支持,咱們能夠選擇不一樣的方式將數據從內存中保存到硬盤當中,使數據能夠持久化保存。服務器
Redis
提供了RDB
和AOF
兩種不一樣的數據持久化方式,下面咱們就來詳細介紹一下這種不一樣的持久化方式吧。架構
RDB
是一種快照存儲持久化方式,具體就是將Redis
某一時刻的內存數據保存到硬盤的文件當中,默認保存的文件名爲dump.rdb
,而在Redis
服務器啓動時,會從新加載dump.rdb
文件的數據到內存當中恢復數據。app
開啓RDB
持久化方式很簡單,客戶端能夠經過向Redis
服務器發送save
或bgsave
命令讓服務器生成rdb
文件,或者經過服務器配置文件指定觸發RDB
條件。異步
save
命令是一個同步操做。
# 同步數據到磁盤上
> save
複製代碼
當客戶端向服務器發送save
命令請求進行持久化時,服務器會阻塞save
命令以後的其餘客戶端的請求,直到數據同步完成。
若是數據量太大,同步數據會執行好久,而這期間Redis服務器也沒法接收其餘請求,因此,最好不要在生產環境使用
save
命令。
與save
命令不一樣,bgsave
命令是一個異步操做。
# 異步保存數據集到磁盤上
> bgsave
複製代碼
當客戶端發服務發出bgsave
命令時,Redis
服務器主進程會forks
一個子進程來數據同步問題,在將數據保存到rdb文件以後,子進程會退出。
因此,與save
命令相比,Redis
服務器在處理bgsave
採用子線程進行IO寫入,而主進程仍然能夠接收其餘請求,但forks
子進程是同步的,因此forks
子進程時,同樣不能接收其餘請求,這意味着,若是forks一個子進程花費的時間過久(通常是很快的),bgsave命令仍然有阻塞其餘客戶的請求的狀況發生。
除了經過客戶端發送命令外,還有一種方式,就是在Redis
配置文件中的save
指定到達觸發RDB持久化的條件,好比【多少秒內至少達到多少寫操做】就開啓RDB
數據同步。
例如咱們能夠在配置文件redis.conf指定以下的選項:
# 900s內至少達到一條寫命令
save 900 1
# 300s內至少達至10條寫命令
save 300 10
# 60s內至少達到10000條寫命令
save 60 10000
複製代碼
以後在啓動服務器時加載配置文件。
# 啓動服務器加載配置文件
redis-server redis.conf
複製代碼
這種經過服務器配置文件觸發RDB的方式,與bgsave命令相似,達到觸發條件時,會forks一個子進程進行數據同步,不過最好不要經過這方式來觸發RDB持久化,由於設置觸發的時間過短,則容易頻繁寫入rdb文件,影響服務器性能,時間設置太長則會形成數據丟失。
前面介紹了三種讓服務器生成rdb文件的方式,不管是由主進程生成仍是子進程來生成,其過程以下:
RDB默認生成的文件名爲dump.rdb,固然,我能夠經過配置文件進行更加詳細配置,好比在單機下啓動多個redis服務器進程時,能夠經過端口號配置不一樣的rdb名稱,以下所示:
# 是否壓縮rdb文件
rdbcompression yes
# rdb文件的名稱
dbfilename redis-6379.rdb
# rdb文件保存目錄
dir ~/redis/
複製代碼
RDB
的方式會形成某個時段內數據的丟失,好比咱們設置10分鐘同步一次或5分鐘達到1000次寫入就同步一次,那麼若是還沒達到觸發條件服務器就死機了,那麼這個時間段的數據會丟失。聊完了RDB
,來聊聊Redis
的另一個持久化方式:AOF(Append-only file)
。
與RDB
存儲某個時刻的快照不一樣,AOF
持久化方式會記錄客戶端對服務器的每一次寫操做命令,並將這些寫操做以Redis
協議追加保存到之後綴爲aof
文件末尾,在Redis服務器重啓時,會加載並運行aof
文件的命令,以達到恢復數據的目的。
Redis默認不開啓AOF持久化方式,咱們能夠在配置文件中開啓並進行更加詳細的配置,以下面的redis.conf文件:
# 開啓aof機制
appendonly yes
# aof文件名
appendfilename "appendonly.aof"
# 寫入策略,always表示每一個寫操做都保存到aof文件中,也能夠是everysec或no
appendfsync always
# 默認不重寫aof文件
no-appendfsync-on-rewrite no
# 保存目錄
dir ~/redis/
複製代碼
在上面的配置文件中,咱們能夠經過appendfsync
選項指定寫入策略,有三個選項
appendfsync always
# appendfsync everysec
# appendfsync no
複製代碼
客戶端的每個寫操做都保存到aof
文件當,這種策略很安全,可是每一個寫請注都有IO操做,因此也很慢。
appendfsync
的默認寫入策略,每秒寫入一次aof
文件,所以,最多可能會丟失1s的數據。
Redis
服務器不負責寫入aof
,而是交由操做系統來處理何時寫入aof
文件。更快,但也是最不安全的選擇,不推薦使用。
AOF將客戶端的每個寫操做都追加到aof
文件末尾,好比對一個key屢次執行incr命令,這時候,aof
保存每一次命令到aof文件中,aof文件會變得很是大。
incr num 1
incr num 2
incr num 3
incr num 4
incr num 5
incr num 6
...
incr num 100000
複製代碼
aof文件太大,加載aof文件恢復數據時,就會很是慢,爲了解決這個問題,Redis支持aof文件重寫,經過重寫aof,能夠生成一個恢復當前數據的最少命令集,好比上面的例子中那麼多條命令,能夠重寫爲:
set num 100000
複製代碼
aof文件是一個二進制文件,並非像上面的例子同樣,直接保存每一個命令,而使用Redis本身的格式,上面只是方便演示。
經過在redis.conf配置文件中的選項no-appendfsync-on-rewrite能夠設置是否開啓重寫,這種方式會在每次fsync時都重寫,影響服務器性以,所以默認值爲no,不推薦使用。
# 默認不重寫aof文件
no-appendfsync-on-rewrite no
複製代碼
客戶端向服務器發送bgrewriteaof命令,也可讓服務器進行AOF重寫。
# 讓服務器異步重寫追加aof文件命令
> bgrewriteaof
複製代碼
AOF重寫方式也是異步操做,即若是要寫入aof文件,則Redis主進程會forks一個子進程來處理,以下所示:
壓縮aof文件,減小磁盤佔用量。
將aof的命令壓縮爲最小命令集,加快了數據恢復的速度。
在寫入aof日誌文件時,若是Redis服務器宕機,則aof日誌文件文件會出格式錯誤,在重啓Redis服務器時,Redis服務器會拒絕載入這個aof文件,能夠經過如下步驟修復aof並恢復數據。
備份如今aof文件,以防萬一。
使用redis-check-aof命令修復aof文件,該命令格式以下:
# 修復aof日誌文件
$ redis-check-aof -fix file.aof
複製代碼
AOF只是追加日誌文件,所以對服務器性能影響較小,速度比RDB要快,消耗的內存較少。
AOF方式生成的日誌文件太大,即便經過AFO重寫,文件體積仍然很大。
恢復數據的速度比RDB慢。
經過上面的介紹,咱們瞭解了RDB與AOF各自的優勢與缺點,到底要如何選擇呢?
經過下面的表示,咱們能夠從幾個方面對比一下RDB與AOF,在應用時,要根本本身的實際需求,選擇RDB或者AOF,其實,若是想要數據足夠安全,能夠兩種方式都開啓,但兩種持久化方式同時進行IO操做,會嚴重影響服務器性能,所以有時候不得不作出選擇。
當RDB與AOF兩種方式都開啓時,Redis會優先使用AOF日誌來恢復數據,由於AOF保存的文件比RDB文件更完整。
上面講了一大堆Redis
的持久化機制的知識,其實,若是你只是單純把Redis
做爲緩存服務器,那麼能夠徹底不用考慮持久化,可是,在現在的大多數服務器架構中,Redis
的單單只是扮演一個緩存服務器的角色,還能夠做爲數據庫,保存咱們的業務數據,此時,咱們則須要好好了解有關Redis
持久化策略的區別與選擇。
你的關注,是我寫做路上最大的鼓勵!