編程之法之海量數據處理:尋找Top K的熱詞

題目: 有100萬個關鍵字,長度小於50個字節。用有效的算法找出Top 10的熱詞,要求對內存的佔用不超過1 MB。 分析: 這是大家面試中都被問道的問題,可以直接使用map-reducer直接解決這個問題。如果不能使用這個架構,我們手動實現,也是採用的這個思想,只是這個用文件代替節點。 1 0 6 ∗ 50 B = 50 ∗ 1 0 6 B = 50 M B 10^6 * 50B = 50 *
相關文章
相關標籤/搜索