海量數據處理

1. 給定一個大小超過 100G 的文件, 其中存在 IP 地址, 找到其中出現次數最多的 IP 地址(hash文件切分)  參考哈希表知識:>哈希表(開散列)<          >哈希表(閉散列)<    解:顯然我們是不可能將這100G內存直接加載到內存中去處理的,所以我們可以對大文件進行劃分,將相同的IP地址會被劃分在一塊。假定將這個文件分爲1000份,那麼一個文件的大小大概爲100M,然
相關文章
相關標籤/搜索