一次Hadoop開發思路分享

困擾了自己1周的一個問題終於得到解決了,感謝給我幫助的同學,同時記錄下來分享給大家. 問題簡化描述: HDFS存在這樣格式的文件:用戶ID    主題ID    用戶對此主題的偏好分數score。 現在要求實現對給定的幾個主題T1,T2,T3,...TN,每個主題要求篩選出指定數量的用戶ID是M1,M2,M3,...MX。 希望儘可能根據score來選出偏好的用戶ID,並且主題之間的用戶ID不可以
相關文章
相關標籤/搜索