解讀Cardinality Estimation算法(第四部分:HyperLogLog Counting)

在前一篇文章中,我們瞭解了LogLog Counting。LLC算法的空間複雜度爲O(log2(log2(Nmax))),並且具有較高的精度,因此非常適合用於大數據場景的基數估計。不過LLC也有自己的問題,就是當基數不太大時,估計值的誤差會比較大。這主要是因爲當基數不太大時,可能存在一些空桶,這些空桶的ρmaxρmax爲0。由於LLC的估計值依賴於各桶ρmax的幾何平均數,而幾何平均數對於特殊值(
相關文章
相關標籤/搜索