在以前的文章中你應該知道的緩存進化史介紹了愛奇藝的緩存架構和緩存的進化歷史。俗話說得好,工欲善其事,必先利其器,有了好的工具確定得知道如何用好這些工具,本篇將介紹如何利用好緩存。java
在使用緩存以前,須要確認你的項目是否真的須要緩存。使用緩存會引入的必定的技術複雜度,後文也將會一一介紹這些複雜度。通常來講從兩個方面來個是否須要使用緩存:git
若是並無上述兩個問題,那麼你沒必要爲了增長緩存而緩存。github
緩存又分進程內緩存和分佈式緩存兩種。不少人包括筆者在開始選緩存框架的時候都感到了困惑:網上的緩存太多了,你們都吹噓本身很牛逼,我該怎麼選擇呢?面試
首先看看幾個比較經常使用的緩存的比較,具體原理能夠參考你應該知道的緩存進化史:正則表達式
比較項 | ConcurrentHashMap | LRUMap | Ehcache | Guava Cache | Caffeine |
---|---|---|---|---|---|
讀寫性能 | 很好,分段鎖 | 通常,全局加鎖 | 好 | 好,須要作淘汰操做 | 很好 |
淘汰算法 | 無 | LRU,通常 | 支持多種淘汰算法,LRU,LFU,FIFO | LRU,通常 | W-TinyLFU, 很好 |
功能豐富程度 | 功能比較簡單 | 功能比較單一 | 功能很豐富 | 功能很豐富,支持刷新和虛引用等 | 功能和Guava Cache相似 |
工具大小 | jdk自帶類,很小 | 基於LinkedHashMap,較小 | 很大,最新版本1.4MB | 是Guava工具類中的一個小部分,較小 | 通常,最新版本644KB |
是否持久化 | 否 | 否 | 是 | 否 | 否 |
是否支持集羣 | 否 | 否 | 是 | 否 | 否 |
總結一下:若是不須要淘汰算法則選擇ConcurrentHashMap,若是須要淘汰算法和一些豐富的API,這裏推薦選擇Caffeine。算法
這裏選取三個比較出名的分佈式緩存來做爲比較,MemCache(沒有實戰使用過),Redis(在美團又叫Squirrel),Tair(在美團又叫Cellar)。不一樣的分佈式緩存功能特性和實現原理方面有很大的差別,所以他們所適應的場景也有所不一樣。sql
比較項 | MemCache | Squirrel/Redis | Cellar/Tair |
---|---|---|---|
數據結構 | 只支持簡單的Key-Value結構 | String,Hash, List, Set, Sorted Set | String,HashMap, List,Set |
持久化 | 不支持 | 支持 | 支持 |
容量大小 | 數據純內存,數據存儲不宜過多 | 數據全內存,資源成本考量不宜超過100GB | 能夠配置全內存或內存+磁盤引擎,數據容量可無限擴充 |
讀寫性能 | 很高 | 很高(RT0.5ms左右) | String類型比較高(RT1ms左右),複雜類型比較慢(RT5ms左右) |
總結:若是服務對延遲比較敏感,Map/Set數據也比較多的話,比較適合Redis。若是服務須要放入緩存量的數據很大,對延遲又不是特別敏感的話,那就能夠選擇Tair。在美團的不少應用中對Tair都有應用,在筆者的項目中使用其存放咱們生成的支付token,支付碼,用來替代數據庫存儲。大部分的狀況下二者均可以選擇,互爲替代。數據庫
不少人一想到緩存立刻腦子裏面就會出現下面的圖:數組
Redis用來存儲熱點數據,Redis中沒有的數據則直接去數據庫訪問。緩存
在以前介紹本地緩存的時候,不少人都問我,我已經有Redis了,我幹嗎還須要瞭解Guava,Caffeine這些進程緩存呢。我基本統一回復下面兩個答案:
因此若是僅僅是使用Redis,能知足咱們大部分需求,可是當須要追求更高的性能以及更高的可用性的時候,那就不得不瞭解多級緩存。
對於進程內緩存,其原本受限於內存的大小的限制,以及進程緩存更新後其餘緩存沒法得知,因此通常來講進程緩存適用於:
俗話說得好,世界上沒有什麼是一個緩存解決不了的事,若是有,那就兩個。
通常來講咱們選擇一個進程緩存和一個分佈式緩存來搭配作多級緩存,通常來講引入兩個也足夠了,若是使用三個,四個的話,技術維護成本會很高,反而有可能會得不償失,以下圖所示:
利用Caffeine作一級緩存,Redis做爲二級緩存。
對於Caffeine的緩存,若是有數據更新,只能刪除更新數據的那臺機器上的緩存,其餘機器只能經過超時來過時緩存,超時設定能夠有兩種策略:
對於Redis的緩存更新,其餘機器立馬可見,可是也必需要設置超時時間,其時間比Caffeine的過時長。
爲了解決進程內緩存的問題,設計進一步優化:
通常來講緩存的更新有兩種狀況:
對於一個更新操做簡單來講,就是先去各級緩存進行刪除,而後更新數據庫。這個操做有一個比較大的問題,在對緩存刪除完以後,有一個讀請求,這個時候因爲緩存被刪除因此直接會讀庫,讀操做的數據是老的而且會被加載進入緩存當中,後續讀請求所有訪問的老數據。
對緩存的操做不論成功失敗都不能阻塞咱們對數據庫的操做,那麼不少時候刪除緩存能夠用異步的操做,可是先刪除緩存不能很好的適用於這個場景。
先刪除緩存也有一個好處是,若是對數據庫操做失敗了,那麼因爲先刪除的緩存,最多隻是形成Cache Miss。
若是咱們使用更新數據庫,再刪除緩存就能避免上面的問題。可是一樣的引入了新的問題,試想一下有一個數據此時是沒有緩存的,因此查詢請求會直接落庫,更新操做在查詢請求以後,可是更新操做刪除數據庫操做在查詢完以後回填緩存以前,就會致使咱們緩存中和數據庫出現緩存不一致。
爲何咱們這種狀況有問題,不少公司包括Facebook還會選擇呢?由於要觸發這個條件比較苛刻。
對比上面4.1的問題來講這種問題的機率很低,何況咱們有超時機制保底因此基本能知足咱們的需求。若是真的須要追求完美,可使用二階段提交,可是其成本和收益通常來講不成正比。
固然還有個問題是若是咱們刪除失敗了,緩存的數據就會和數據庫的數據不一致,那麼咱們就只能靠過時超時來進行兜底。對此咱們能夠進行優化,若是刪除失敗的話 咱們不能影響主流程那麼咱們能夠將其放入隊列後續進行異步刪除。
你們一聽到緩存有哪些注意事項,確定首先想到的是緩存穿透,緩存擊穿,緩存雪崩這三個挖坑的小能手,這裏簡單介紹一下他們具體是什麼以及應對的方法。
緩存穿透是指查詢的數據在數據庫是沒有的,那麼在緩存中天然也沒有,因此,在緩存中查不到就會去數據庫取查詢,這樣的請求一多,那麼咱們的數據庫的壓力天然會增大。
爲了不這個問題,能夠採起下面兩個手段:
對於某些key設置了過時時間,可是其是熱點數據,若是某個key失效,可能大量的請求打過來,緩存未命中,而後去數據庫訪問,此時數據庫訪問量會急劇增長。
爲了不這個問題,咱們能夠採起下面的兩個手段:
緩存雪崩是指緩存不可用或者大量緩存因爲超時時間相同在同一時間段失效,大量請求直接訪問數據庫,數據庫壓力過大致使系統雪崩。
爲了不這個問題,咱們採起下面的手段:
緩存污染通常出如今咱們使用本地緩存中,能夠想象,在本地緩存中若是你得到了緩存,可是你接下來修改了這個數據,可是這個數據並無更新在數據庫,這樣就形成了緩存污染:
要想避免這個問題須要開發人員從編碼上注意,而且代碼必須通過嚴格的review,以及全方位的迴歸測試,才能從必定程度上解決這個問題。
序列化是不少人都不注意的一個問題,不少人忽略了序列化的問題,上線以後立刻報出一下奇怪的錯誤異常,形成了沒必要要的損失,最後一排查都是序列化的問題。列舉幾個序列化常見的問題:
//jdk 7
class A{
int a;
int b;
}
//jdk 8
class A{
int b;
int a;
}
複製代碼
序列化的問題必須獲得重視,解決的辦法有以下幾點:
對於大量使用本地緩存的應用,因爲涉及到緩存淘汰,那麼GC問題一定是常事。若是出現GC較多,STW時間較長,那麼一定會影響服務可用性。這一塊給出下面幾點建議:
不少人對於緩存的監控也比較忽略,基本上線以後若是不報錯而後就默認他就生效了。可是存在這個問題,不少人因爲經驗不足,有可能設置了不恰當的過時時間,或者不恰當的緩存大小致使緩存命中率不高,讓緩存就成爲了代碼中的一個裝飾品。因此對於緩存各類指標的監控,也比較重要,經過其不一樣的指標數據,咱們能夠對緩存的參數進行優化,從而讓緩存達到最優化:
上面的代碼中用來記錄get操做的,經過Cat記錄了獲取緩存成功,緩存不存在,緩存過時,緩存失敗(獲取緩存時若是拋出異常,則叫失敗),經過這些指標,咱們就能統計出命中率,咱們調整過時時間和大小的時候就能夠參考這些指標進行優化。
一個好的劍客沒有一把好劍怎麼行呢?若是要使用好緩存,一個好的框架也必不可少。在最開始使用的時候你們使用緩存都用一些util,把緩存的邏輯寫在業務邏輯中:
上面的代碼把緩存的邏輯耦合在業務邏輯當中,若是咱們要增長成多級緩存那就須要修改咱們的業務邏輯,不符合開閉原則,因此引入一個好的框架是不錯的選擇。
推薦你們使用JetCache這款開源框架,其實現了Java緩存規範JSR107而且支持自動刷新等高級功能。筆者參考JetCache結合Spring Cache, 監控框架Cat以及美團的熔斷限流框架Rhino實現了一套自有的緩存框架,讓操做緩存,打點監控,熔斷降級,業務人員無需關心。上面的代碼能夠優化成:
想要真正的使用好一個緩存,必需要掌握不少的知識,並非看幾個Redis原理分析,就能把Redis緩存用得爐火純青。對於不一樣場景,緩存有各自不一樣的用法,一樣的不一樣的緩存也有本身的調優策略,進程內緩存你須要關注的是他的淘汰算法和GC調優,以及要避免緩存污染等。分佈式緩存你須要關注的是他的高可用,若是其不可用瞭如何進行降級,以及一些序列化的問題。一個好的框架也是必不可少的,對其若是使用得當再加上上面介紹的經驗,相信能讓你很好的駕馭住這頭野馬——緩存。
最後這篇文章被我收錄於JGrowing,一個全面,優秀,由社區一塊兒共建的Java學習路線,若是您想參與開源項目的維護,能夠一塊兒共建,github地址爲:github.com/javagrowing… 麻煩給個小星星喲。
若是你以爲這篇文章對你有文章,能夠關注個人技術公衆號,最近做者收集了不少最新的學習資料視頻以及面試資料,關注以後便可領取,你的關注和轉發是對我最大的支持,O(∩_∩)O