關於某日訪問次數最多的IP的topK問題的三種解法

題目描述 在july大神的博客中,看到這樣兩道題:html 1. 海量日誌數據,提取出某日訪問百度次數最多的那個IP。 2. 假設目前有一千萬個記錄(這些查詢串的重複度比較高,雖然總數是1千萬,但若是除去重複後,不超過3百萬個。一個查詢串的重複度越高,說明查詢它的用戶越多,也就是越熱門。),請你統計最熱門的10個查詢串,要求使用的內存不能超過1G。 如今我將兩題結合一下:python 假若有1千萬
相關文章
相關標籤/搜索