緩存世界中的三大問題及解決方案

時間 2019-11-06

標籤緩存世界三大問題解決方案简体版

原文原文鏈接

目前的IO設備遠不能知足互聯網應用海量的讀寫請求。因而便出現了緩存，利用內存的高速讀寫性能來應付海量的查詢請求。然而內存資源很是寶貴，將全量數據存儲在內存中顯然是不切合實際的。所以目前採用內存和IO結合的方式，內存只存儲熱點數據，而IO設備存儲全量數據。
緩存的設計包含不少技巧，設計不當將會致使嚴重的後果。本文將介紹緩存使用中常見的三大問題，並給出相應的解決方案。

1. 緩存穿透

在大多數互聯網應用中，緩存的使用方式以下圖所示：
程序員

當業務系統發起某一個查詢請求時，首先判斷緩存中是否有該數據；
若是緩存中存在，則直接返回數據；
若是緩存中不存在，則再查詢數據庫，而後返回數據。

瞭解了上述過程後，下面說說緩存穿透。數據庫

1.1 什麼是緩存穿透？

業務系統要查詢的數據根本就存在！當業務系統發起查詢時，按照上述流程，首先會前往緩存中查詢，因爲緩存中不存在，而後再前往數據庫中查詢。因爲該數據壓根就不存在，所以數據庫也返回空。這就是緩存穿透。segmentfault

綜上所述：業務系統訪問壓根就不存在的數據，就稱爲緩存穿透。緩存

1.2 緩存穿透的危害

若是存在海量請求查詢壓根就不存在的數據，那麼這些海量請求都會落到數據庫中，數據庫壓力劇增，可能會致使系統崩潰（你要知道，目前業務系統中最脆弱的就是IO，稍微來點壓力它就會崩潰，因此咱們要想種種辦法保護它）。分佈式

1.3 爲何會發生緩存穿透？

發生緩存穿透的緣由有不少，通常爲以下兩種：工具

惡意攻擊，故意營造大量不存在的數據請求咱們的服務，因爲緩存中並不存在這些數據，所以海量請求均落在數據庫中，從而可能會致使數據庫崩潰。
代碼邏輯錯誤。這是程序員的鍋，沒啥好講的，開發中必定要避免！

1.4 緩存穿透的解決方案

下面來介紹兩種防止緩存穿透的手段。性能

1.4.1 緩存空數據

之因此發生緩存穿透，是由於緩存中沒有存儲這些空數據的key，致使這些請求全都打到數據庫上。spa

那麼，咱們能夠稍微修改一下業務系統的代碼，將數據庫查詢結果爲空的key也存儲在緩存中。當後續又出現該key的查詢請求時，緩存直接返回null，而無需查詢數據庫。設計

1.4.2 BloomFilter

第二種避免緩存穿透的方式即爲使用BloomFilter。blog

它須要在緩存以前再加一道屏障，裏面存儲目前數據庫中存在的全部key，以下圖所示：

當業務系統有查詢請求的時候，首先去BloomFilter中查詢該key是否存在。若不存在，則說明數據庫中也不存在該數據，所以緩存都不要查了，直接返回null。若存在，則繼續執行後續的流程，先前往緩存中查詢，緩存中沒有的話再前往數據庫中的查詢。

1.4.3 兩種方案的比較

這兩種方案都能解決緩存穿透的問題，但使用場景卻各不相同。

對於一些惡意攻擊，查詢的key每每各不相同，並且數據賊多。此時，第一種方案就顯得提襟見肘了。由於它須要存儲全部空數據的key，而這些惡意攻擊的key每每各不相同，並且同一個key每每只請求一次。所以即便緩存了這些空數據的key，因爲再也不使用第二次，所以也起不了保護數據庫的做用。
所以，對於空數據的key各不相同、key重複請求機率低的場景而言，應該選擇第二種方案。而對於空數據的key數量有限、key重複請求機率較高的場景而言，應該選擇第一種方案。

2. 緩存雪崩

2.1 什麼是緩存雪崩？

經過上文可知，緩存其實扮演了一個保護數據庫的角色。它幫數據庫抵擋大量的查詢請求，從而避免脆弱的數據庫受到傷害。

若是緩存因某種緣由發生了宕機，那麼本來被緩存抵擋的海量查詢請求就會像瘋狗同樣涌向數據庫。此時數據庫若是抵擋不了這巨大的壓力，它就會崩潰。

這就是緩存雪崩。

2.2 如何避免緩存雪崩？

2.2.1 使用緩存集羣，保證緩存高可用

也就是在雪崩發生以前，作好預防手段，防止雪崩的發生。
PS：關於分佈式高可用問題不是今天討論的重點，套路就那些，後面會有高可用的相關文章，盡請關注。

2.2.2 使用Hystrix

Hystrix是一款開源的「防雪崩工具」，它經過熔斷、降級、限流三個手段來下降雪崩發生後的損失。

Hystrix就是一個Java類庫，它採用命令模式，每一項服務處理請求都有各自的處理器。全部的請求都要通過各自的處理器。處理器會記錄當前服務的請求失敗率。一旦發現當前服務的請求失敗率達到預設的值，Hystrix將會拒絕隨後該服務的全部請求，直接返回一個預設的結果。這就是所謂的「熔斷」。當通過一段時間後，Hystrix會放行該服務的一部分請求，再次統計它的請求失敗率。若是此時請求失敗率符合預設值，則徹底打開限流開關；若是請求失敗率仍然很高，那麼繼續拒絕該服務的全部請求。這就是所謂的「限流」。而Hystrix向那些被拒絕的請求直接返回一個預設結果，被稱爲「降級」。

更多Hystrix的介紹請參閱：https://segmentfault.com/a/11...