布隆過濾器 過程詳解

布隆過濾器是用來處理爬蟲去重問題或者黑名單問題的。 爬蟲去重問題:將訪問過的URL存儲在數據庫中,對於新進的URL,判斷數據庫中是否存在這個URL。(URL的量很大) 黑名單問題:假設給定100億個URL是黑名單,用戶輸入一個URL,判斷這個URL是否在黑名單中存在。 我們以黑名單問題舉例: 布隆過濾器: 1:首先準備一個比特類型的數組,數組的大小爲m。 如何準備呢? 我們知道,一個整型的大小是四
相關文章
相關標籤/搜索