Java最小堆解決TopK問題

時間 2021-01-20

原文原文鏈接

2019獨角獸企業重金招聘Python工程師標準>>> www.toutiao.im 其實我們與大數據並不遙遠，比如要從海量數據中按大小或頻率挑出top k，假定機器是多核的內存有限的，我們採用多線程分塊處理數據，最後合併處理。那麼，處理每一塊數據的top k(i)可以採用哪些算法呢？ TopK問題是指從大量數據（源數據）中獲取最大（或最小）的K個數據。 TopK問題是個很常見的問題：例如學校

>>阅读原文<<