關於位圖與布隆過濾器

情境引入 一個文件有100億個字符串(不重複),每個字符串爲64個字節,現在要實現一個黑名單系統,該文件所有字符串加載到該黑名單中,當輸入一個字符串時,系統需給出該字符串是否在黑名單上。 (類似應用場景:爬蟲去重,比如開一定數量的爬蟲,需要爬蟲爬取不同的內容,即每個爬蟲爬之前都要去名單上查詢該地址是否爬過,沒爬過就爬取並將其記錄到名單上。) 分析: (1)若單純用哈希表,那麼100*64 = 64
相關文章
相關標籤/搜索