解讀Cardinality Estimation算法(第二部分:Linear Counting)

在上一篇文章中,我們知道傳統的精確基數計數算法在數據量大時會存在一定瓶頸,瓶頸主要來自於數據結構合併和內存使用兩個方面。因此出現了很多基數估計的概率算法,這些算法雖然計算出的結果不是精確的,但誤差可控,重要的是這些算法所使用的數據結構易於合併,同時比傳統方法大大節省內存。 在這一篇文章中,我們討論Linear Counting算法。 簡介 Linear Counting(以下簡稱LC)在1990年
相關文章
相關標籤/搜索