協同過濾

  1. 協同過濾簡介
    協同過濾就是將物品或者人組織成鄰居,這些鄰居有相同類似的屬性,則維護這些鄰居的一個關係矩陣,矩陣的值就是他們的關係的值了,再乘以一個個體的列矩陣或者行矩陣,他們的推薦關係就出來了。 俗話說「物以類聚、人以羣分」,拿看電影這個例子來講,若是你喜歡《蝙蝠俠》、《碟中諜》、《星際穿越》、《源代碼》等電影,另外有我的也都喜歡這些電影,並且他還喜歡《鋼鐵俠》,則頗有可能你也喜歡《鋼鐵俠》這部電影。因此說,當一個用戶 A 須要個性化推薦時,能夠先找到和他興趣類似的用戶羣體 G,而後把 G 喜歡的、而且 A 沒有據說過的物品推薦給 A,這就是基於用戶的系統過濾算法。協同過濾是在海量數據中挖掘出小部分與你品味相似的用戶,在協同過濾中,這些用戶成爲鄰居,而後根據他們喜歡的東西組織成一個排序的目錄推薦給你。因此就有以下兩個核心問題
  • 如何肯定一個用戶是否與你有類似的品味?
  • 如何將鄰居們的喜愛組織成一個排序目錄?
  1. 協同過濾詳解
    參考:協同過濾算法
  2. 協同過濾例子
  • 噹噹網的買過此書的人還買過?首先系統維護一個書的相關度的矩陣,這個矩陣A以下圖,描述的就是書籍之間的關係矩陣,關係是:同時買過x,y這兩本書出現的次數,也叫同現度。好比說同時買103和102這兩本書出現的次數是4。用這個關係矩陣乘上用戶購買此書的矩陣,購買過此書的矩陣是一個列矩陣,在此書上是1,別的都是0,就能夠算出最後的值了。參考:mahout機器學習平臺->0二、推薦系統算法與架構剖析。這一小節課程。
    輸入圖片說明
  • 電影推薦系統,根據評分推薦,也是基於itemCF的 經過維護一張電影之間的同現矩陣*用戶評分矩陣,同現矩陣同上面噹噹網的用戶購買矩陣,意思差很少,都是一個用戶同時看過這兩部電影的次數,用戶對電影的評分矩陣,用戶的評分就至關於權重了,把他們相乘就出來了一點電影分數排名。參考:mahout機器學習平臺->0二、推薦系統算法與架構剖析。這一小節課程。
相關文章
相關標籤/搜索