【大廠面試01期】高併發場景下，如何保證緩存與數據庫一致性？

時間 2020-06-02

原文原文鏈接

PS:本文已收錄到1.1K Star數開源學習指南——《大廠面試指北》，若是想要了解更多大廠面試相關的內容及獲取《大廠面試指北》離線PDF版，請掃描下方二維碼碼關注公衆號「大廠面試」，謝謝你們了！項目地址：github.com/NotFound9/i…html

《大廠面試指北》項目截圖：git

獲取《大廠面試指北》離線PDF版，請掃描下方二維碼關注公衆號「大廠面試」github

面試題：高併發場景下，如何保證緩存與數據庫一致性？

問題分析

咱們平常開發中，對於緩存用的最多的場景就像下圖同樣，可能僅僅是對數據進行緩存，減輕數據庫壓力，縮短接口響應時間。面試

這種方案在不須要考慮高併發得去寫緩存，高併發得讀寫緩存時，是不會有問題，可是若是是在高併發場景下，要保證緩存和數據庫的一致性，至少須要解決如下問題：

高併發寫時的數據不一致問題

高併發讀寫時，請求執行各步驟的順序是不可控的。假設此時有一個請求A，B都在在執行寫流程，請求A是須要將某個數據改爲1，請求B是須要將某個數據改成2，執行操做以下時就會致使數據不一致的問題：數據庫

1.請求A執行操做1.1刪除緩存。緩存

2.請求A執行操做1.2更新數據庫，將值改成1。安全

3.請求B執行操做1.1刪除緩存。服務器

4.請求B執行操做1.2更新數據庫，將值改成2網絡

5.假設說請求B所在服務器網絡延遲比較低，請求B先更新緩存，此時緩存中的key對應的value是2。併發

6.請求A更新緩存，將緩存中B更新的數據進行覆蓋，將key對應的值改成1。

此時數據庫中是B修改後的數據，值爲2，而緩存中的數據是1，這樣在緩存過時錢，用戶讀到的都是髒數據，與數據庫不一致。

高併發讀寫時的數據不一致的問題

高併發讀寫時，請求執行各步驟的順序是不可控的。假設此時有一個請求A在執行寫流程，將原值由1改爲2，請求B執行讀流程，執行操做以下時就會致使數據不一致的問題：

1.寫請求A執行1.1操做刪除緩存key，value是原值1。

2.讀請求B執行2.1操做發現緩存中沒有數據，就去執行2.2操做讀數據庫，讀到舊數據，值爲1。

3.寫請求A執行1.2操做更新數據庫，將數據由1改成2。

4.寫請求A執行1.3操做更新緩存，此時緩存中的數據key對應的value是2。

5.讀請求B執行2.3操做更新緩存，將以前讀到的舊數據1設置到緩存中，此時緩存中的數據key對應的value是1。

因此若是說讀請求B所在服務器網絡延遲比較高，去執行2.3操做比寫請求A晚，就會致使寫請求A更新完緩存後，讀請求B使用以前讀到的舊數據去更新緩存，此時緩存中數據就與數據庫中的不一致。

解決方案

保證數據一致性，網上有不少種方案，例如：

1.先刪除緩存，再更新數據庫。

2.先更新數據庫，再刪除緩存。

3.先刪除緩存，再更新數據庫，而後異步延遲一段時間再去刪一次緩存。

可是這些方案都是存在各類各樣的問題，這裏篇幅有限，只給出目前相對正確的三套方案，目前的這些方案也有本身的侷限性。

方案1.寫請求串行化

寫請求

1.寫請求更新以前先獲取分佈式鎖，得到以後才能去數據庫更新這個數據，獲取不到就進行等待，超時後就返回更新失敗。

2.更新完以後去刷新緩存，若是刷新失敗，放到內存隊列中進行重試（重試時取數據庫最新數據更新緩存）。

讀請求

讀請求發現緩存中沒有數據時，直接去讀取數據庫，讀完更新緩存。

總結

這種技術方案經過對寫請求的實現串行化來保證數據一致性，可是會致使吞吐量變低。比較適合銀行相關的業務，由於對於銀行項目來講，保證數據一致性比可用性更加劇要，就像是去存款機存錢，取錢時，爲了保證帳戶安全，都是會讓用戶執行操做後，等待一段時間才能得到反饋，這段時間其實取款機是不可用的。

方案2.先更新數據庫，異步刪除緩存，刪除失敗後重試

1.先更新數據庫

2.異步刪除緩存（若是數據庫是讀寫分離的，那麼刪除緩存時須要延遲刪除，不然可能會在刪除緩存時，從庫尚未收到更新後的數據，其餘讀請求就去從庫讀到舊數據而後設置到緩存中。）

3.刪除緩存失敗時，將刪除的key放到內存隊列或者是消息隊列中進行異步重試

發散思考

在更新完數據庫後，咱們爲何不直接更新，而是採用刪除緩存呢？

這是由於直接更新緩存的話，在高併發場景下，有多個更新請求時，難以保證後更新數據庫的請求會後更新緩存，也就是上面的高併發寫問題。若是採用刪除緩存，可讓下次讀時讀取數據庫，更新緩存，保證一致性。

方案3.業務項目更新數據庫，其餘項目訂閱binlog更新

1.業務項目直接更新數據庫。

2.cannal項目會讀取數據庫的binlog，而後解析後發消息到kafka。

3.而後緩存更新項目訂閱topic，從kafka接收到更新數據庫操做的消息後，更新緩存，更新緩存失敗時，新建異步線程去重試或者將操做發到消息隊列，後續再進行處理。

總結：

可是這種方案在更新數據庫後，緩存中仍是舊值，必須等緩存更新項目消費消息後，更新緩存，緩存中才是最新值。因此更新操做完成與更新生效之間會有必定的延遲。

最後

你們有了解其餘的技術方案，歡迎進羣一塊兒討論！

參考連接：

www.cnblogs.com/-wenli/p/11…

www.cnblogs.com/rjzheng/p/9…

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。