Redis應用-HyperLogLog

時間 2019-11-08

原文原文鏈接

系列文章算法

Redis應用-分佈式鎖

Redis應用-異步消息隊列與延時隊列

Redis應用-位圖

Redis應用-HyperLogLog

Redis應用-布隆過濾器

Redis應用-限流

Redis應用-Geo

若是你要統計網站的PV，你可使用Redis計數器就行了，每來一個請求，調用一次incrby便可。可是若是要統計UV就沒那麼簡單呢，它須要去重，固然你確定想到了Redis中的去重的Set集合，當一個請求過來使用sadd添加用戶ID,經過scard取出集合的大小。可是若是上千萬的UV，使用集合來統計，就很是浪費空間了。而Redis提供的HyperLogLog數據結構正是來解決這類統計問題的，固然在數據量很大的狀況下，他會有必定的偏差。微信

HyperLogLog算法是一種很是巧妙的近似統計海量去重元素數量的算法。它內部維護了 16384 個桶（bucket）來記錄各自桶的元素數量。當一個元素到來時，它會散列到其中一個桶，以必定的機率影響這個桶的計數值。由於是機率算法，因此單個桶的計數值並不許確，可是將全部的桶計數值進行調合均值累加起來，結果就會很是接近真實的計數值。數據結構