算法之海量數據處理

1.散列分治或MapReduce 這種題目很多,大多都相似一通,針對數據特別多的情況下,一般可以選擇MapReduce或者散列分治這兩種方式其實思想很相似的只有些許不同;針對數據量不大的情況下可是直接加載進內存來的可以使用Trie樹,紅黑樹這一套,hash表都可以使用。 尋找共同的URL 給定兩個a和b文件,各存放50億個URL,每個URL佔64字節,內存限制4GB,請找出a和b文件中共同的URL
相關文章
相關標籤/搜索