海量數據面試題(位圖、布隆過濾器、哈希切割)

對於處理海量數據,內存中放不下的數據通常有兩種方法: 1.考慮特殊數據結構(位圖、布隆過濾器) 2.切割(哈希切割、平均切割) 對於這類問題能夠畫圖+文字+僞代碼說明問題。 一:哈希切割topK問題: 給一個超過100G大小的log file,log中存放着IP地址,設計算法找到出現次數最多的IP地址?如何找到top K的IP? 對於本題採用哈希切割: 二:位圖應用: **給定100億個整數,設計
相關文章
相關標籤/搜索