面試系列:十個海量數據處理方法大總結

本文將簡單總結下一些處理海量數據問題的常見方法。當然這些方法可能並不能完全覆蓋所有的問題,但是這樣的一些方法也基本可以處理絕大多數遇到的問題。下面的一些問題基本直接來源於公司的面試筆試題目,方法不一定最優,如果你有更好的處理方法,歡迎討論。 一、Bloom filter 適用範圍:可以用來實現數據字典,進行數據的判重,或者集合求交集 基本原理及要點: 對於原理來說很簡單,位數組+k個獨立hash函
相關文章
相關標籤/搜索