大數據處理問題

常見海量數據處理的關鍵 1、分而治之。通過哈希函數將大人物分流到機器,或分流成小文件 2、常用的hashMap或bitMap 難點:通訊、時間、空間的估算 哈希函數: 哈希函數又叫散列表,哈希函數的輸入可以使非常大的範圍,但是輸出與是固定範圍。假設爲S。 性質: 典型的哈希函數都擁有無限的輸入值域 輸入值相同時,返回值一樣 輸入值不同時,返回值可能一樣,也可能不一樣 不同輸入值得到的哈希值,整體均
相關文章
相關標籤/搜索