解讀Cardinality Estimation算法(第三部分:LogLog Counting)

上一篇文章介紹的Linear Counting算法相較於直接映射bitmap的方法能大大節省內存(大約只需後者1/10的內存),但畢竟只是一個常係數級的降低,空間複雜度仍然爲O(Nmax)O(Nmax)。而本文要介紹的LogLog Counting卻只有O(log2(log2(Nmax)))O(log2(log2(Nmax)))。例如,假設基數的上限爲1億,原始bitmap方法需要12.5M內存,
相關文章
相關標籤/搜索