大數據(2)

案例3 有一個包含20億個全是32位整數的大文件,在其中找到出現次數最多的數,但內存限制只有2G 解決思路 下再用哈希表依次處理各個文件,統計每種數出現的次數,此時肯定不會溢出。 案例4 先分析哈希表思路: bitmap思路: 找到這個技術不足的區間,假設爲a 再遍歷一次40億個數,此時只關注區間a上的數,並用bitmap統計區間a上的數的出現情況。 佔用差不多8m空間 案例5 機器數n取決於面試
相關文章
相關標籤/搜索