上週在工做中遇到了一個問題場景,即查詢商品的配件信息時(商品:配件爲1:N的關係),如若商品並未配置配件信息,則查數據庫爲空,且不會加入緩存,這就會致使,下次在查詢一樣商品的配件時,因爲緩存未命中,則仍舊會查底層數據庫,因此緩存就一直未起到應有的做用,當併發流量大時,會很容易把DB打垮。算法
緩存穿透是指查詢一個根本不存在的數據,緩存層和存儲層都不會命中,一般出於容錯的考慮,若是從存儲層查不到數據則不寫入緩存層。
通常對於未命中的數據咱們是按照以下方式進行處理的:數據庫
1.緩存層不命中。
2.存儲層不命中,不將空結果寫回緩存。
3.返回空結果。後端
/** * 緩存穿透問題: * 在數據庫層沒有查到數據,未存入緩存, * 則下次查詢一樣的數據時,還會查庫。 * * @param id * @return */ private Object getObjectById(Integer id) { // 從緩存中獲取數據 Object cacheValue = cache.get(id); if (cacheValue != null) { return cacheValue; } // 從數據庫中獲取 Object storageValue = storage.get(id); // 若是這裏按照id查詢DB爲空,那麼便會出現緩存穿透 if (storageValue != null) { cache.set(id, storageValue); } return storageValue; }
緩存穿透將致使不存在的數據每次請求都要到存儲層去查詢,失去了緩存保護後端存儲的意義。
緩存穿透問題可能會使後端存儲負載加大,因爲不少後端存儲不具有高併發性,甚至可能形成後端存儲宕掉。數組
/** * 緩存空對象: * 此種方式存在漏洞,不通過判斷就直接將Null對象存入到緩存中, * 若是惡意製造不存在的id那麼,緩存中的鍵值就會不少,惡意攻擊時,極可能會被打爆,因此需設置較短的過時時間。 * * @param id * @return */ public Object getObjectInclNullById(Integer id) { // 從緩存中獲取數據 Object cacheValue = cache.get(id); // 緩存爲空 if (cacheValue == null) { // 從數據庫中獲取 Object storageValue = storage.get(key); // 緩存空對象 cache.set(key, storageValue); // 若是存儲數據爲空,須要設置一個過時時間(300秒) if (storageValue == null) { // 必須設置過時時間,不然有被攻擊的風險 cache.expire(key, 60 * 5); } return storageValue; } // 緩存不爲空則直接返回 return cacheValue; }
緩存空對象會有一個必須考慮的問題:緩存
空值作了緩存,意味着緩存層中存了更多的鍵,須要更多的內存空間(若是是攻擊,問題更嚴重),比較有效的方法是針對這類數據設置一個較短的過時時間,讓其自動剔除。數據結構
概念:併發
布隆過濾器(英語:Bloom Filter)是1970年由布隆提出的。它其實是一個很長的二進制向量和一系列隨機映射函數。布隆過濾器能夠用於檢索一個元素是否在一個集合中。它的優勢是空間效率和查詢時間都遠遠超過通常的算法,缺點是有必定的誤識別率和刪除困難。運維
若是想判斷一個元素是否是在一個集合裏,通常想到的是將集合中全部元素保存起來,而後經過比較肯定。鏈表、樹、散列表(又叫哈希表,Hash table)等等數據結構都是這種思路。可是隨着集合中元素的增長,咱們須要的存儲空間愈來愈大。同時檢索速度也愈來愈慢,上述三種結構的檢索時間複雜度分別爲 O(n),O(log n),O(n/k)函數
布隆過濾器的原理是,當一個元素被加入集合時,經過K個散列函數將這個元素映射成一個位數組中的K個點,把它們置爲1。檢索時,咱們只要看看這些點是否是都是1就(大約)知道集合中有沒有它了:若是這些點有任何一個0,則被檢元素必定不在;若是都是1,則被檢元素極可能在。這就是布隆過濾器的基本思想。高併發
示例:
google guava包下有對布隆過濾器的封裝,BloomFilter。
import com.google.common.hash.BloomFilter; import com.google.common.hash.Funnels; public class BloomFilterTest { // 初始化一個可以容納10000個元素且容錯率爲0.01布隆過濾器 private static final BloomFilter<Integer> bloomFilter = BloomFilter.create(Funnels.integerFunnel(), 10000, 0.01); /** * 初始化布隆過濾器 */ private static void initLegalIdsBloomFilter() { // 初始化10000個合法Id並加入到過濾器中 for (int legalId = 0; legalId < 10000; legalId++) { bloomFilter.put(legalId); } } /** * id是否合法有效,便是否在過濾器中 * * @param id * @return */ public static boolean validateIdInBloomFilter(Integer id) { return bloomFilter.mightContain(id); } public static void main(String[] args) { // 初始化過濾器 initLegalIdsBloomFilter(); // 誤判個數 int errorNum=0; // 驗證從10000個非法id是否有效 for (int id = 10000; id < 20000; id++) { if (validateIdInBloomFilter(id)){ // 誤判數 errorNum++; } } System.out.println("judge error num is : " + errorNum); } }
設置過時時間,讓其自動過時失效,這種在不少時候不是最佳的實踐方案。
咱們能夠提早將真實正確的商品Id,在添加完成以後便加入到過濾器當中,每次再進行查詢時,先確認要查詢的Id是否在過濾器當中,若是不在,則說明Id爲非法Id,則不須要進行後續的查詢步驟了。
/** * 防緩存穿透的:布隆過濾器 * * @param id * @return */ public Object getObjectByBloom(Integer id) { // 判斷是否爲合法id if (!bloomFilter.mightContain(id)) { // 非法id,則不容許繼續查庫 return null; } else { // 從緩存中獲取數據 Object cacheValue = cache.get(id); // 緩存爲空 if (cacheValue == null) { // 從數據庫中獲取 Object storageValue = storage.get(id); // 緩存空對象 cache.set(id, storageValue); } return cacheValue; } }
參考書籍:《Redis開發與運維》