測試面試

給定a、b兩個文件,各存放50億個url,每個url各佔用64字節,內存限制是4G,如何找出a、b文件共同的url? 方法2: 分別掃描A,B兩個文件,根據hash(url)%k(k爲正整數,比如k = 1000,那麼每個小文件只佔用300M,內存完全可以放得下)將url劃分到不同的k個文件中,比如a0,a1,…a999;b0,b1,…b999; 這樣處理後相同的url肯定在對應的小文件中(a0
相關文章
相關標籤/搜索