大數據統計之基數估計(Cardinality Estimation)

一、解讀Cardinality Estimation算法(第一部分:基本概念)html

http://blog.codinglabs.org/articles/cardinality-estimation.htmlgit

二、解讀Cardinality Estimation算法(第二部分:Linear Counting)github

http://blog.codinglabs.org/articles/algorithms-for-cardinality-estimation-part-ii.html算法

三、解讀Cardinality Estimation算法(第三部分:LogLog Counting)大數據

http://blog.codinglabs.org/articles/algorithms-for-cardinality-estimation-part-iii.htmlthis

四、解讀Cardinality Estimation算法(第四部分:HyperLogLog Counting及Adaptive Counting).net

http://blog.codinglabs.org/articles/algorithms-for-cardinality-estimation-part-iv.htmlorm

五、大數據計數:如何僅用1.5KB內存爲十億對象計數htm

http://www.csdn.net/article/2012-12-21/2813063-big-data-counting-how-to-count-對象

六、基數估值算法在TDW中的應用

http://mta.qq.com/mta/bigdata/?p=567

七、上述算法的開源庫:stream-lib

https://github.com/addthis/stream-lib

八、Java使用極小的內存完成對超大數據的去重計數,用於實時計算中統計UV

http://lxw1234.com/archives/2015/09/516.htm

九、基於Storm的Nginx log實時監控系統:基數計數

http://tech.uc.cn/?p=2866#more-2866

十、大數據計數原理1+0=1這你都不會算(八)No.60

http://bit.ly/2yEPxns

相關文章
相關標籤/搜索