Redis內核原理及讀寫一致企業級架構深刻剖析3-綜合組件環境實戰

本套技術專欄是做者(秦凱新)平時工做的總結和昇華,經過從真實商業環境抽取案例進行總結和分享,並給出商業應用的調優建議和集羣環境容量規劃等內容,請持續關注本套博客。QQ郵箱地址:1120746959@qq.com,若有任何學術交流,可隨時聯繫。mysql

1 持久化機制

  • 企業級redis集羣架構:海量數據、高併發、高可用。持久化主要是作災難恢復,數據恢復,也能夠歸類到高可用的一個環節裏面去。redis

  • 悖論:重啓redis,儘快讓它對外提供服務,可是若是你沒作數據備份,這個時候redis啓動了,數據都沒了,這個時候,大量的請求過來,緩存所有沒法命中,在redis里根本找不到數據,出現緩存雪崩問題,全部請求,沒有在redis命中,就會去mysql數據庫這種數據源頭中去找,一會兒mysql承接高併發,致使最終Mysql集羣崩潰。sql

  • 措施:儘可能把redis的持久化作好,備份和恢復方案作到企業級的程度,那麼即便你的redis故障了,也能夠經過備份數據,快速恢復,一旦恢復當即對外提供服務。數據庫

2 RDB和AOF兩種持久化機制

  • RDB持久化機制:對redis中的數據執行週期性的持久化緩存

  • AOF機制:對每條寫入命令做爲日誌,以append-only的模式寫入一個日誌文件中,在redis重啓的時候,能夠經過回放AOF日誌中的寫入指令來從新構建整個數據集。安全

  • 若是咱們想要redis僅僅做爲純內存的緩存來用,那麼能夠禁止RDB和AOF全部的持久化機制。經過RDB或AOF,均可以將redis內存中的數據給持久化到磁盤上面來,而後能夠將這些數據備份到別的地方去,好比說阿里雲,雲服務,若是redis掛了,服務器上的內存和磁盤上的數據都丟了,能夠從雲服務上拷貝回來以前的數據,放到指定的目錄中,而後從新啓動redis,redis就會自動根據持久化數據文件中的數據,去恢復內存中的數據,繼續對外提供服務服務器

  • 若是同時使用RDB和AOF兩種持久化機制,那麼在redis重啓的時候,會使用AOF來從新構建數據,由於AOF中的數據更加完整架構

3 RDB 持久化機制優缺點

3.1 RDB 持久化機制優勢

  • RDB會生成多個數據文件,每一個數據文件都表明了某一個時刻中redis的數據,這種多個數據文件的方式,很是適合作冷備,能夠將這種完整的數據文件發送到一些遠程的安全存儲上去,好比說Amazon的S3雲服務上去,在國內能夠是阿里雲的ODPS分佈式存儲上,以預約好的備份策略來按期備份redis中的數據併發

  • RDB對redis對外提供的讀寫服務,影響很是小,可讓redis保持高性能,由於redis主進程只須要fork一個子進程,讓子進程執行磁盤IO操做來進行RDB持久化便可app

  • 相對於AOF持久化機制來講,直接基於RDB數據文件來重啓和恢復redis進程,更加快速。

3.2 RDB 持久化機制缺點

  • 若是想要在redis故障時,儘量少的丟失數據,那麼RDB沒有AOF好。通常來講,RDB數據快照文件,都是每隔5分鐘,或者更長時間生成一次,這個時候就得接受一旦redis進程宕機,那麼會丟失最近5分鐘的數據

  • RDB每次在fork子進程來執行RDB快照數據文件生成的時候,若是數據文件特別大,可能會致使對客戶端提供的服務暫停數毫秒,或者甚至數秒。

4 AOF 持久化機制優缺點

4.1 AOF 持久化機制優勢

  • AOF能夠更好的保護數據不丟失,通常AOF會每隔1秒,經過一個後臺線程執行一次fsync操做,最多丟失1秒鐘的數據

  • AOF日誌文件以append-only模式寫入,因此沒有任何磁盤尋址的開銷,寫入性能很是高,並且文件不容易破損,即便文件尾部破損,也很容易修復

  • AOF日誌文件即便過大的時候,出現後臺重寫操做,也不會影響客戶端的讀寫。由於在rewrite log的時候,會對其中的指導進行壓縮,建立出一份須要恢復數據的最小日誌出來。再建立新日誌文件的時候,老的日誌文件仍是照常寫入。當新的merge後的日誌文件ready的時候,再交換新老日誌文件便可。

  • AOF日誌文件的命令經過很是可讀的方式進行記錄,這個特性很是適合作災難性的誤刪除的緊急恢復。好比某人不當心用flushall命令清空了全部數據,只要這個時候後臺rewrite尚未發生,那麼就能夠當即拷貝AOF文件,將最後一條flushall命令給刪了,而後再將該AOF文件放回去,就能夠經過恢復機制,自動恢復全部數據。

4.2 AOF 持久化機制缺點

  • 對於同一份數據來講,AOF日誌文件一般比RDB數據快照文件更大

  • AOF開啓後,支持的寫QPS會比RDB支持的寫QPS低,由於AOF通常會配置成每秒fsync一第二天志文件,固然,每秒一次fsync,性能也仍是很高的

  • 之前AOF發生過bug,就是經過AOF記錄的日誌,進行數據恢復的時候,沒有恢復如出一轍的數據出來。因此說,相似AOF這種較爲複雜的基於命令日誌/merge/回放的方式,比基於RDB每次持久化一份完整的數據快照文件的方式,更加脆弱一些,容易有bug。

  • 不過AOF就是爲了不rewrite過程致使的bug,所以每次rewrite並非基於舊的指令日誌進行merge的,而是基於當時內存中的數據進行指令的從新構建,這樣健壯性會好不少。

5 RDB和AOF選擇問題

  • 不要僅僅使用RDB,由於那樣會致使你丟失不少數據

  • 不要僅僅使用AOF,由於那樣有兩個問題,第一,你經過AOF作冷備,沒有使用RDB作冷備恢復數據速度更快; 第二,RDB每次簡單粗暴生成數據快照,更加健壯,能夠避免AOF這種複雜的備份和恢復機制的bug

  • 綜合使用AOF和RDB兩種持久化機制,用AOF來保證數據不丟失,做爲數據恢復的第一選擇; 用RDB來作不一樣程度的冷備,在AOF文件都丟失或損壞不可用的時候,還可使用RDB來進行快速的數據恢復。

6 總結

在此感謝石杉的講義,結合大數據在咱們工業大數據平臺的實踐,總結成一篇實踐指南,方便之後查閱反思,後續我會根據本篇博客進行代碼技術實踐實現。

凱新雲技術社區

相關文章
相關標籤/搜索