推薦算法-餘弦類似度

1、餘弦類似度:算法

餘弦值越接近1,就代表夾角越接近0度,也就是兩個向量越類似,這就叫"餘弦類似性"spa

二維向量的餘弦類似度:3d

多維向量的餘弦類似度(類比)blog

 

協同過濾(Collaborative Filtering, 簡稱 CF):it

  • 收集用戶行爲
  • 減噪與歸一化處理
  1. 減噪:用戶行爲數據是用戶在使用應用過程當中產生的,它可能存在大量的噪音和用戶的誤操做,咱們能夠經過經典的數據挖掘算法過濾掉行爲數據中的噪音,這樣能夠是咱們的分析更加精確
  2. 歸一化:將各個行爲的數據統一在一個相同的取值範圍中,從而使得加權求和獲得的整體喜愛更加精確。

2、基於物品的協同過濾推薦算法(itemCF):數據挖掘

算法思想:給用戶推薦那些和他們以前喜歡的物品類似的物品class

用戶行爲與權重:點擊-一、搜索-三、收藏-5 、付款-10file

用戶 A、B、C搜索

商品 1、2、3、4、5、6im

  • 根據用戶行爲列表計算用戶、物品的評分矩陣
  • 根據用戶、物品的評分矩陣計算物品、物品的類似矩陣 
  • 類似度矩陣x評分矩陣=推薦列表
  • 推薦列表中用戶以前已經有過行爲的元素置爲0

3、基於用戶的協同過濾推薦算法(UserCF)

算法思想:給用戶推薦和他興趣類似的其餘用戶喜歡的物品

用戶行爲與權重:點擊-一、搜索-三、收藏-5 、付款-10

用戶 A、B、C、D、E、F  

商品 1、2、3、4、5、6

  • 根據用戶行爲列表計算物品、用戶的評分矩陣
  • 根據物品、用戶的評分矩陣計算用戶、用戶的類似矩陣
  • 類似度矩陣X評分矩陣=推薦列表
  • 將推薦列表中用戶已有行爲的元素置0

4、基於內容推薦算法

算法思想:給用戶推薦和他們以前喜歡的物品在內容上類似的其餘物品

1表示電影具備某個特徵  0表示電影不具備某個特徵

物品特徵建模:Item Profile

  • 構建Item Profile矩陣(電影的特徵項矩陣)
  • 構建Item User評分矩陣(用戶電影的評分矩陣)
  • Item User x Item Profile = User Profile (用戶對電影的喜好程度)
  • 對Item Profile和User Profile求餘弦類似度

5、基於物品的協同過濾推薦算法(itemCF)說明:

一、根據用戶行爲列表計算用戶、物品的評分矩陣

 

二、根據用戶物品的評分矩陣計算物品、物品的類似矩陣

三、類似度矩陣x評分矩陣=推薦列表

四、推薦列表中用戶以前已經有過行爲的元素置爲0

相關文章
相關標籤/搜索