海量數據面試題分析

海量面試題的條件一般都要求我們處理一批計算機內存放不下的數據。當我們遇到這種面試題時,常有以下幾種思想: 哈希切分  哈希切分就是將一個大文件,利用哈希的原理,將其分爲若干個小文件。相同的數據都被分到同一個文件裏。例如我有一個存放着100億個整數的大文件,將其分爲100個小文件。將每個數都模100,結果相同的數存放到一個文件裏。如果這100億個數理想均勻,則每個小文件大約爲1億個數。 位圖(Bit
相關文章
相關標籤/搜索