1 RDB和AOF兩種持久化機制的介紹
- RDB持久化就是對redis中的數據執行週期性的數據快照備份,這個週期能夠本身配置。
- AOF持久化機制對每條寫入命令都以append-only的模式寫入一個日誌文件中,在redis重啓的時候,能夠經過回放AOF日誌中的寫入指令來從新構建整個數據集,append-only能夠配置異步或同步。
- 若是咱們想要redis僅僅做爲純內存的緩存來用,那麼能夠禁止RDB和AOF全部的持久化機制。
- 經過RDB或AOF,均可以將redis內存中的數據給持久化到磁盤上面來,而後能夠將這些數據備份到別的地方去,好比說阿里雲,雲服務,若是redis掛了,服務器上的內存和磁盤上的數據都丟了,能夠從雲服務上拷貝回來以前的數據,放到指定的目錄中,而後從新啓動redis,redis就會自動根據持久化數據文件中的數據,去恢復內存中的數據,繼續對外提供服務。
- 若是同時使用RDB和AOF兩種持久化機制,那麼在redis重啓的時候,會使用AOF來從新構建數據,由於AOF中的數據更加完整,因此要想使用RDB快照恢復數據,必須先把AOF關閉。
2 RDB持久化的優勢
-
RDB會生成多個數據文件,每一個數據文件都表明了某一個時刻中redis的數據,這種多個數據文件的方式,很是適合作冷備,能夠將這種完整的數據文件發送到一些遠程的安全存儲上去,好比說Amazon的S3雲服務上去,在國內能夠是阿里雲的ODPS分佈式存儲上,以預約好的備份策略來按期備份redis中的數據。redis
- RDB也能夠作冷備,生成多個文件,每一個文件都表明了某一個時刻的完整的數據快照
- AOF也能夠作冷備,只有一個文件,可是你能夠,每隔必定時間,去copy一份這個文件出來
- RDB作冷備,優點在哪兒呢?1、由redis去控制固定時長生成快照文件的事情,比較方便; AOF,還須要本身寫一些腳本去作這個事情,各類定時。2、RDB數據作冷備,在最壞的狀況下提供數據恢復的速度也比AOF快。
-
RDB對redis對外提供的讀寫服務,影響很是小,可讓redis保持高性能,由於redis主進程只須要fork一個子進程,讓子進程執行磁盤IO操做來進行RDB持久化便可。算法
- RDB,每次寫,都是直接寫redis內存,只是在必定的時候,纔會將數據寫入磁盤中
- AOF,每次都是要寫文件的,雖然能夠快速寫入os cache中,可是仍是有必定的時間開銷的,速度確定比RDB略慢一些
-
相對於AOF持久化機制來講,直接基於RDB數據文件來重啓和恢復redis進程,更加快速。shell
- AOF,存放的指令日誌,作數據恢復的時候,實際上是要回放和執行全部的指令日誌,來恢復出來內存中的全部數據的
- RDB,就是一份數據文件,恢復的時候,直接加載到內存中便可
3 RDB持久化的缺點
-
若是想要在redis故障時,儘量少的丟失數據,那麼RDB沒有AOF好。通常來講,RDB數據快照文件,都是每隔5分鐘,或者更長時間生成一次,這個時候就得接受一旦redis進程宕機,那麼會丟失最近5分鐘的數據。緩存
這個問題,也是rdb最大的缺點,就是不適合作第一優先的恢復方案,若是你依賴RDB作第一優先恢復方案,會致使數據丟失的比較多安全
-
RDB每次在fork子進程來執行RDB快照數據文件生成的時候,若是數據文件特別大,可能會致使對客戶端提供的服務暫停數毫秒,或者甚至數秒。服務器
通常不要讓RDB的間隔太長,不然每次生成的RDB文件太大了,對redis自己的性能可能會有影響的app
4 AOF持久化的優勢
- AOF能夠更好的保護數據不丟失,通常AOF會每隔1秒,經過一個後臺線程執行一次fsync操做,最多丟失1秒鐘的數據
- AOF日誌文件以append-only模式寫入,因此沒有任何磁盤尋址的開銷,寫入性能很是高,並且文件不容易破損,即便文件尾部破損,也很容易修復
- AOF日誌文件即便過大的時候,出現後臺重寫操做,也不會影響客戶端的讀寫。由於在rewrite log的時候,會對其中的指令進行壓縮,建立出一份須要恢復數據的最小日誌出來。再建立新日誌文件的時候,老的日誌文件仍是照常寫入。當新的merge後的日誌文件ready的時候,再交換新老日誌文件便可。
- AOF日誌文件的命令經過很是可讀的方式進行記錄,這個特性很是適合作災難性的誤刪除的緊急恢復。好比某人不當心用flushall命令清空了全部數據,只要這個時候後臺rewrite尚未發生,那麼就能夠當即拷貝AOF文件,將最後一條flushall命令給刪了,而後再將該AOF文件放回去,就能夠經過恢復機制,自動恢復全部數據
5 AOF持久化的缺點
- 對於同一份數據來講,AOF日誌文件一般比RDB數據快照文件更大
-
AOF開啓後,支持的寫QPS會比RDB支持的寫QPS低,由於AOF通常會配置成每秒fsync一第二天志文件,固然,每秒一次fsync,性能也仍是很高的異步
若是你要保證一條數據都不丟,也是能夠的,AOF的fsync設置成沒寫入一條數據,fsync一次,那就完蛋了,redis的QPS大降分佈式
-
之前AOF發生過bug,就是經過AOF記錄的日誌,進行數據恢復的時候,沒有恢復如出一轍的數據出來。因此說,相似AOF這種較爲複雜的基於命令日誌/merge/回放的方式,比基於RDB每次持久化一份完整的數據快照文件的方式,更加脆弱一些,容易有bug。不過AOF就是爲了不rewrite過程致使的bug,所以每次rewrite並非基於舊的指令日誌進行merge的,而是基於當時內存中的數據進行指令的從新構建,這樣健壯性會好不少。性能
- AOF惟一的比較大的缺點就是作數據恢復的時候會比較慢,還有作冷備,按期的備份,不太方便,可能要本身手寫複雜的腳本去作,作冷備不太合適
6 RDB和AOF到底該如何選擇
- 不要僅僅使用RDB,由於那樣會致使你丟失不少數據
- 也不要僅僅使用AOF,由於那樣有兩個問題,第一,你經過AOF作冷備,沒有RDB作冷備,來的恢復速度更快; 第二,RDB每次簡單粗暴生成數據快照,更加健壯,能夠避免AOF這種複雜的備份和恢復機制的bug
- 建議同時使用AOF和RDB兩種持久化機制,用AOF來保證數據不丟失,做爲數據恢復的第一選擇; 用RDB來作不一樣程度的冷備,在AOF文件都丟失或損壞不可用的時候,還可使用RDB來進行快速的數據恢復
7 RDB持久化的配置
redis.conf文件,也就是/etc/redis/6379.conf,去配置持久化
save 60 1000
- 上面配置的意思是:每隔60s,若是有超過1000個key發生了變動,那麼就生成一個新的dump.rdb文件,就是當前redis內存中完整的數據快照,這個操做也被稱之爲snapshotting。
- 快照也能夠手動調用save或者bgsave命令,同步或異步執行rdb快照生成
- save能夠設置多個,就是多個snapshotting檢查點,每到一個檢查點,就會去check一下,是否有指定的key數量發生了變動,若是有,就生成一個新的dump.rdb文件
8 RDB持久化機制的工做流程
- redis根據配置本身嘗試去生成rdb快照文件
- fork一個子進程出來
- 子進程嘗試將數據dump到臨時的rdb快照文件中
- 完成rdb快照文件的生成以後,就替換以前的舊的快照文件
9 AOF持久化的配置
- AOF持久化默認是關閉的(默認是打開RDB持久化),能夠經過appendonly yes配置打開AOP持久化
- 在生產環境裏面,通常來講AOF都是要打開的,除非你說隨便丟個幾分鐘的數據也無所謂
- 打開AOF持久化機制以後,redis每次接收到一條寫命令,就會寫入日誌文件中,固然是先寫入os cache的,而後每隔必定時間再fsync一下
- 即便AOF和RDB都開啓了,redis重啓的時候,也是優先經過AOF進行數據恢復的,由於aof數據比較完整
- 能夠配置AOF的fsync策略,有三種策略能夠選擇,一種是每次寫入一條數據就執行一次fsync; 一種是每隔一秒執行一次fsync; 一種是不主動執行fsync
always: 每次寫入一條數據,當即將這個數據對應的寫日誌fsync到磁盤上去,性能很是很是差,吞吐量很低; 確保說redis裏的數據一條都不丟,那就只能這樣了
everysec: 每秒將os cache中的數據fsync到磁盤,這個最經常使用的,生產環境通常都這麼配置,性能很高,QPS仍是能夠上萬的
no: 僅僅redis負責將數據寫入os cache就撒手無論了,而後後面os本身會時不時有本身的策略將數據刷入磁盤,不可控了
10 AOF rewrite
- redis中的數據其實有限的,不少數據可能會自動過時,可能會被用戶刪除,可能會被redis用緩存清除的算法清理掉,redis中的數據會不斷淘汰掉舊的,就一部分經常使用的數據會被自動保留在redis內存中,因此可能不少以前的已經被清理掉的數據,對應的寫日誌還停留在AOF中,AOF日誌文件就一個,會不斷的膨脹,到很大很大,因此AOF會自動在後臺每隔必定時間作rewrite操做,好比日誌裏已經存放了針對100w數據的寫日誌了,redis內存只剩下10萬,基於內存中當前的10萬數據構建一套最新的日誌,到AOF中; 覆蓋以前的老日誌,確保AOF日誌文件不會過大,保持跟redis內存數據量一致
- redis 2.4以前,還須要手動,開發一些腳本,crontab,經過BGREWRITEAOF命令去執行AOF rewrite,可是redis 2.4以後,會自動進行rewrite操做
- 在redis.conf中,能夠配置rewrite策略
auto-aof-rewrite-percentage 100
auto-aof-rewrite-min-size 64mb
上面配置的解釋:好比說上一次AOF rewrite以後,是128mb,而後就會接着128mb繼續寫AOF的日誌,若是發現增加的比例,超過了以前的100%,256mb,就可能會去觸發一次rewrite,可是此時還要去跟min-size,64mb去比較,256mb > 64mb,纔會去觸發rewrite
10 AOF rewrite的工做流程
- redis fork一個子進程
- 子進程基於當前內存中的數據,構建日誌,開始往一個新的臨時的AOF文件中寫入日誌
- redis主進程,接收到client新的寫操做以後,在內存中寫入日誌,同時新的日誌也繼續寫入舊的AOF文件
- 子進程寫完新的日誌文件以後,redis主進程將內存中的新日誌再次追加到新的AOF文件中
- 用新的日誌文件替換掉舊的日誌文件
11 AOF破損文件的修復
若是redis在append數據到AOF文件時,機器宕機了,可能會致使AOF文件破損
用redis-check-aof –fix命令來修復破損的AOF文件
12 AOF和RDB同時工做的狀況
- 若是RDB在執行snapshotting操做,那麼redis不會執行AOF rewrite; 若是redis再執行AOF rewrite,那麼就不會執行RDB snapshotting
- 若是RDB在執行snapshotting,此時用戶執行BGREWRITEAOF命令,那麼等RDB快照生成以後,纔會去執行AOF rewrite
- 同時開啓RDB和AOF,那麼redis重啓的時候,只會使用AOF文件進行數據恢復,若是找不到AOF文件,redis就會認爲沒有數據可恢復,會形成數據丟失,因此若是要使用RDB文件進行數據恢復,要先關閉AOF。
13 企業級的Redis持久化