Top K問題-海量元素取最大的前k個元素

在大規模數據處理中,經常會遇到的一類問題:在海量數據中找出出現頻率最高的前k個數,或者從海量數據中找出最大的前k個數,這類問題通常被稱爲top K問題。例如,在搜索引擎中,統計搜索最熱門的10個查詢詞;在歌曲庫中統計下載最高的前10首歌等。 eg:有1億個浮點數,如果找出期中最大的10000個? 該題目解法有很多,以下逐個闡述    最容易想到的方法是將數據全部排序,然後在排序後的集合中進行查找,
相關文章
相關標籤/搜索