用Hadoop中MapReduce進行TopN排序

數據格式: 10,3333,10,100 11,9321,1000,293 12,3881,701,20 13,6974,910,30 14,8888,11,39 訂單ID 用戶ID 資費 業務ID 在所有訂單數據中計算出資費最高的N個訂單,按降序排列 算法思想:在大量的數據中計算出資費最高的N個訂單,爲了節省資源和提高計算效率:在衆多的Mapper的端,首先計算出自己的TopN,然後在將每一個M
相關文章
相關標籤/搜索