MapReduce高級編程2

MapReduce Top N 、二次排序,MapJoin: TOP N 對於一組輸入List(key,value),我們要創建一個Top N 列表,這是一種過濾模式,查看輸入數據特定子集,觀察用戶的行爲。 解決方案 key是唯一鍵,需要對輸入進行額外的聚集處理,先把輸入分區成小塊,然後把每個小塊發送到一個映射器中。每個映射器會創建一個本地Top N 列表發送到一個規約器中,即最終由一個規約其產生
相關文章
相關標籤/搜索