阿里算法面試題--兩個大文件中找出共同記錄

1.題目 給定a、b兩個文件,各存放50億個url,每個url各佔64字節,內存限制是4G,讓你找出a、b文件共同的url? 解題思路 2.解題思路 1)首先我們最常想到的方法是讀取文件a,建立哈希表(爲什麼要建立hash表?因爲方便後面的查找),然後再讀取文件b,遍歷文件b中每個url,對於每個遍歷,我們都執行查找hash表的操作,若hash表中搜索到了,則說明兩文件共有,存入一個集合。 (2)
相關文章
相關標籤/搜索