Redis查漏補缺：最易錯過的技術要點大掃盲

時間 2019-12-09

標籤 redis 補缺最易錯過技術要點掃盲欄目 Redis 简体版

原文原文鏈接

考慮到絕大部分寫業務的程序員在實際開發中使用Redis時，只會Setvalue和Getvalue兩個操做，對Redis總體缺少一個認知。又恰逢筆者有同事下週要去培訓Redis，因此筆者斗膽以Redis爲主題，對Redis常見問題作一個總結，但願可以掃除你們的知識盲點。程序員

本文圍繞如下幾點進行闡述：面試

一、爲何使用Redis數據庫

二、使用Redis有什麼缺點緩存

三、單線程的Redis爲何這麼快數據結構

四、Redis的數據類型，以及每種數據類型的使用場景併發

五、Redis的過時策略以及內存淘汰機制dom

六、Redis和數據庫雙寫一致性問題異步

七、如何應對緩存穿透和緩存雪崩問題分佈式

八、如何解決Redis的併發競爭問題函數

1、爲何使用Redis

筆者認爲，在項目中使用Redis，主要是從兩個角度去考慮：性能和併發。固然，Redis還具有可作分佈式鎖等功能的其它功能，但若是隻是爲了分佈式鎖這些其它功能，徹底還有其它中間件（如Zookpeer等）能夠代替，並非非要使用Redis。

所以，這個問題主要從性能和併發兩個角度去答：

一、性能

以下圖所示，咱們在碰到須要執行耗時特別久、且結果不頻繁變更的SQL時，就特別適合將運行結果放入緩存。這樣，後面的請求就去緩存中讀取，使得請求可以迅速響應。

題外話：突然想聊一下這個迅速響應的標準——其實根據交互效果的不一樣，這個響應時間沒有固定標準。不過曾經有人這麼告訴我：「在理想狀態下，咱們的頁面跳轉須要在瞬間解決，對於頁內操做則須要在剎那間解決。另外，超過一彈指的耗時操做要有進度提示，而且能夠隨時停止或取消，這樣才能給用戶最好的體驗。」

那麼瞬間、剎那、一彈指具體是多少時間呢？

根據《摩訶僧祗律》記載：一剎那者爲一念，二十念爲一瞬，二十瞬爲一彈指，二十彈指爲一羅預，二十羅預爲一須臾，一日一晚上有三十須臾。

那麼，通過周密的計算，一瞬間爲0.36秒,一剎那有0.018秒，一彈指長達7.2秒。

二、併發

以下圖所示，在大併發的狀況下，全部的請求直接訪問數據庫，數據庫會出現鏈接異常。這個時候，就須要使用Redis作一個緩衝操做，讓請求先訪問到Redis，而不是直接訪問數據庫。

2、使用Redis有什麼缺點

你們用Redis這麼久，這個問題是必需要了解的，基本上使用Redis都會碰到一些問題，常見的主要是四方面的問題：

一、緩存和數據庫雙寫一致性問題

二、緩存雪崩問題

三、緩存擊穿問題

四、緩存的併發競爭問題

這四個問題，筆者我的以爲在項目中比較常碰見。

3、單線程的Redis爲何這麼快

這個問題實際上是對Redis內部機制的一個考察。其實根據筆者的面試經驗，不少人其實都不知道Redis是單線程工做模型。因此，這個問題仍是應該要複習一下的。主要是如下三點：

一、純內存操做

二、單線程操做，避免了頻繁的上下文切換

三、採用了非阻塞I/O多路複用機制

咱們如今仔細地說一說I/O多路複用機制，由於這個說法實在是太通俗了，通俗到通常人都不懂是什麼意思。打一個比方：小曲在S城開了一家快遞店，負責同城快送服務。小曲由於資金限制，僱傭了一批快遞員，而後小曲發現資金不夠了，只夠買一輛車送快遞。

經營方式一：

客戶每送來一份快遞，小曲就讓一個快遞員盯着，而後快遞員開車去送快遞。慢慢的小曲就發現了這種經營方式存在不少問題，幾十個快遞員基本上時間都花在了搶車上了，大部分快遞員都處在閒置狀態，誰搶到了車，誰就能去送快遞。

隨着快遞的增多，快遞員也愈來愈多，小曲發現快遞店裏愈來愈擠，沒辦法僱傭新的快遞員了，快遞員之間的協調很花時間，大部分時間花在搶車上。綜合上述缺點，小曲痛定思痛，提出了下面的經營方式↓

經營方式二：

小曲只僱傭一個快遞員，客戶送來的快遞，小曲按送達地點標註好，而後依次放在一個地方。最後，那個快遞員依次去取快遞，一次拿一個，開着車去送快遞，送好了就回來拿下一個快遞。

上述兩種經營方式對比，是否是明顯以爲第二種，效率更高、更好呢？在上述比喻中：

一、每一個快遞員→每一個線程

二、每一個快遞→每一個Socket(I/O流)

三、快遞的送達地點→Socket的不一樣狀態

四、客戶送快遞請求→來自客戶端的請求

五、小曲的經營方式→服務端運行的代碼

六、一輛車→CPU的核數

因而咱們有以下結論：

一、經營方式一就是傳統的併發模型，每一個I/O流(快遞)都有一個新的線程(快遞員)管理。

二、經營方式二就是I/O多路複用。只有單個線程(一個快遞員)，經過跟蹤每一個I/O流的狀態(每一個快遞的送達地點)，來管理多個I/O流。

下面類比到真實的Redis線程模型，如圖所示：

參照上圖，簡單來講就是，咱們的Redis-client在操做的時候，會產生具備不一樣事件類型的Socket。在服務端，有一段I/O多路複用程序，將其置入隊列之中。而後文件事件分派器依次去隊列中取，轉發到不一樣的事件處理器中。

須要說明的是，這個I/O多路複用機制，Redis還提供了Select、Epoll、Evport、Kqueue等多路複用函數庫，你們能夠自行去了解。

4、Redis的數據類型及各自使用場景

看到這個問題，是否是以爲它很基礎？其實筆者也這麼以爲。然而根據面試經驗發現，至少80%的人答不上這個問題。建議在項目中用到後，再類比記憶，體會更深，不要硬記。基本上，一個合格的程序員五種類型都會用到：

一、String

這個其實沒什麼好說的，最常規的Set/Get操做，Value能夠是String也能夠是數字，通常作一些複雜的計數功能的緩存。

二、Hash

這裏Value存放的是結構化的對象，比較方便的就是操做其中的某個字段。筆者在作單點登陸的時候，就是用這種數據結構存儲用戶信息，以CookieId做爲Key，設置30分鐘爲緩存過時時間，能很好地模擬出相似Session的效果。

三、List

使用List的數據結構，能夠作簡單的消息隊列的功能。另外還有一個就是，能夠利用Lrange命令，作基於Redis的分頁功能，性能極佳，用戶體驗好。

四、Set

由於Set堆放的是一堆不重複值的集合，因此能夠作全局去重的功能。

爲何不用JVM自帶的Set進行去重？由於咱們的系統通常都是集羣部署，使用JVM自帶的Set比較麻煩，難道爲了作一個全局去重，再起一個公共服務？太麻煩了。

另外，就是利用交集、並集、差集等操做，能夠計算共同喜愛、所有的喜愛、本身獨有的喜愛等功能。

五、Sorted Set

Sorted Set多了一個權重參數Score，集合中的元素可以按Score進行排列。能夠作排行榜應用，取TOP N操做。另外，Sorted Set還能夠用來作延時任務。最後一個應用就是能夠作範圍查找。

5、Redis的過時策略及內存淘汰機制

這個問題其實至關重要，從這個問題就能夠看出來到底Redis有沒有用到位。好比，你Redis只能存5G數據，但是你寫了10G，那會刪5G的數據。怎麼刪的？這個問題思考過麼？還有，你的數據已經設置了過時時間，可是時間到了，內存佔用率仍是比較高，有思考過緣由麼?

Redis採用的是按期刪除+惰性刪除策略。

爲何不用定時刪除策略？

**定時刪除，**用一個定時器來負責監視Key，過時則自動刪除。雖然內存及時釋放，可是十分消耗CPU資源。在大併發請求下，CPU要將時間應用在處理請求，而不是刪除Key，所以沒有采用這一策略。

按期刪除+惰性刪除是如何工做的呢？

**按期刪除，**Redis默認每一個100ms檢查是否有過時的Key，有過時Key則刪除。須要說明的是，Redis不是每一個100ms將全部的Key檢查一次，而是隨機抽取進行檢查（若是每隔100ms，所有Key進行檢查，Redis豈不是卡死）。所以，若是隻採用按期刪除策略，會致使不少Key到時間沒有刪除。

因而，惰性刪除派上用場。也就是說在你獲取某個Key的時候，Redis會檢查一下，這個Key若是設置了過時時間，那麼是否過時了？若是過時了此時就會刪除。

採用按期刪除+惰性刪除就沒其餘問題了麼？

不是的，若是按期刪除沒刪除Key。而後你也沒及時去請求Key，也就是說惰性刪除也沒生效。這樣，Redis的內存會愈來愈高，那麼就應該採用內存淘汰機制。

在Redis.conf中有一行配置：

maxmemory-policy volatile-lru

該配置就是配內存淘汰策略的：

**Noeviction：**當內存不足以容納新寫入數據時，新寫入操做會報錯。應該沒人使用吧；

**Allkeys-lru：**當內存不足以容納新寫入數據時，在鍵空間中，移除最近最少使用的Key。推薦使用，目前項目在用這種；

**Allkeys-random：**當內存不足以容納新寫入數據時，在鍵空間中，隨機移除某個key，應該也沒人使用吧；

**Volatile-lru：**當內存不足以容納新寫入數據時，在設置了過時時間的鍵空間中，移除最近最少使用的Key。這種狀況通常是把Redis既當緩存又作持久化存儲的時候才用。不推薦；

**Volatile-random：**當內存不足以容納新寫入數據時，在設置了過時時間的鍵空間中，隨機移除某個Key。依然不推薦；

**Volatile-ttl：**當內存不足以容納新寫入數據時，在設置了過時時間的鍵空間中，有更早過時時間的Key優先移除。不推薦。

PS：若是沒有設置Expire的Key，不知足先決條件（Prerequisites）；那麼Volatile-lru、Volatile-random和Volatile-ttl策略的行爲，和Noeviction（不刪除）基本上一致。

6、Redis和數據庫雙寫一致性問題

一致性問題是分佈式常見問題，還能夠再分爲最終一致性和強一致性。數據庫和緩存雙寫，就必然會存在不一致的問題，想要回答這個問題，就要先明白一個前提：若是對數據有強一致性要求，就不能放緩存。咱們所作的一切，只能保證最終一致性。

另外，咱們所作的方案其實從根本上來講，只能說下降不一致發生的機率，沒法徹底避免。所以，有強一致性要求的數據不能放緩存。

給出了詳細的分析，在這裏簡單地說一說：首先，採起正確更新策略，先更新數據庫，再刪緩存；其次，由於可能存在刪除緩存失敗的問題，提供一個補償措施便可，例如利用消息隊列。

7、應對緩存穿透和緩存雪崩問題

關於「如何應對緩存穿透和緩存雪崩」這兩個問題，說句實在話，通常中小型傳統軟件企業很難碰到。若是有大併發的項目，流量有幾百萬左右，這兩個問題必定要深入考慮：

一、應對緩存穿透

緩存穿透，即黑客故意去請求緩存中不存在的數據，致使全部的請求都懟到數據庫上，從而數據庫鏈接異常。

解決方案：

利用互斥鎖，緩存失效的時候，先去得到鎖，獲得鎖了，再去請求數據庫，沒獲得鎖，則休眠一段時間重試；

一、採用異步更新策略，不管Key是否取到值，都直接返回。Value值中維護一個緩存失效時間，緩存若是過時，異步起一個線程去讀數據庫，更新緩存，須要作緩存預熱（項目啓動前，先加載緩存）操做；

二、提供一個能迅速判斷請求是否有效的攔截機制，好比利用布隆過濾器，內部維護一系列合法有效的Key，迅速判斷出，請求所攜帶的Key是否合法有效，若是不合法，則直接返回。

二、應對緩存雪崩

緩存雪崩，即緩存同一時間大面積的失效，這個時候又來了一波請求，結果請求都懟到數據庫上，從而致使數據庫鏈接異常。

解決方案：

一、給緩存的失效時間加上一個隨機值，避免集體失效；

二、使用互斥鎖，可是該方案吞吐量明顯降低了；

三、雙緩存。咱們有兩個緩存，緩存A和緩存B。緩存A的失效時間爲20分鐘，緩存B不設失效時間，本身作緩存預熱操做。

而後細分如下幾個小點：

a. 從緩存A讀數據庫，有則直接返回；

b. A 沒有數據，直接從B讀數據，直接返回，而且異步啓動一個更新線程；

c. 更新線程同時更新緩存A和緩存B。

8、如何解決Redis併發競爭Key問題

這個問題大體就是同時有多個子系統去Set一個Key。這個時候要注意什麼呢？本人提早百度了一下，發現你們思考的答案基本都是推薦用Redis事務機制。但本人不推薦使用Redis的事務機制。由於咱們的生產環境，基本都是Redis集羣環境，作了數據分片操做。你一個事務中有涉及到多個Key操做的時候，這多個Key不必定都存儲在同一個Redis-Server上。所以，Redis的事務機制，十分雞肋。

解決方法以下：

若是對這個Key操做不要求順序

這種狀況下，準備一個分佈式鎖，你們去搶鎖，搶到鎖就作Set操做便可，比較簡單。

若是對這個Key操做要求順序

假設有一個Key1，系統A須要將Key1設置爲ValueA，系統B須要將Key1設置爲ValueB，系統C須要將Key1設置爲ValueC。指望按照Key1的Value值按照 ValueA→ValueB→ValueC的順序變化。這種時候咱們在數據寫入數據庫的時候，須要保存一個時間戳。假設時間戳以下：

一、系統A Key 1 {ValueA 3:00}

二、系統B Key 1 {ValueB 3:05}

三、系統C Key 1 {ValueC 3:10}

那麼，假設這會系統B先搶到鎖，將Key1設置爲{ValueB 3:05}。接下來系統A搶到鎖，發現本身的ValueA的時間戳早於緩存中的時間戳，那就不作Set操做了。以此類推。

其餘方法，好比利用隊列，將Set方法變成串行訪問也能夠。總之，靈活變通。