Top K問題詳解

一、Top K問題的概述        在大規模數據處理中,經常會遇到的一類問題:在海量數據中找出出現頻率最好的前k個數,或者從海量數據中找出最大的前k個數,這類問題通常被稱爲top K問題。例如在搜索引擎中,統計搜索最熱門的10個查詢詞;在歌曲庫中統計下載最高的前10首歌等。針對top K類問題通常比較好的方案是分治+Trie樹/hash+小頂堆,即先將數據集按照Hash方法分解成多個小數據集,
相關文章
相關標籤/搜索