給定a、b兩個文件,各存放50億個url,每個url各佔64字節

  給定a、b兩個文件,各存放50億個url,每個url各佔64字節,內存限制是4G,讓你找出a、b文件共同的url? 兩種方法: 一、採用Bloom filter,假設布隆過濾器的錯誤率爲0.01,則位數組大小m約爲輸入元素個數n的13倍,此時需要的哈希函數k約爲8個。 元素個數:n = 5G 位數組大小:m = 5G * 13 = 65G = 650億 即需要650億個bit位才能達到錯誤率0
相關文章
相關標籤/搜索