機器學習：推薦算法之基於用戶、基於物品和Slope One

時間 2019-11-18

標籤機器學習推薦算法基於用戶物品 slope 简体版

原文原文鏈接

引言 git

以前有段時間研究過推薦算法，倒不是科研須要，是以爲很想弄明白天天淘寶的時候那些猜你喜歡的東西是怎麼冒出來的，還有最近很火的網易雲音樂以及蝦米音樂的推薦算法，這裏很高興的就是網易雲音樂已經被我調教的很棒了，真開心 github

後來瞭解到那些企業作的推薦算法可能是混合推薦，而我只瞭解了基礎的三種，不過相信萬變不離其宗，不少基礎的東西仍是很重要的，因此對這三種推薦算法進行了整理，最後由於以前本身用Python參照着github上一我的的代碼本身也嘗試着實現了一下該推薦系統，主要是基於用戶的推薦，這裏貼出來供你們一塊兒學習算法

三種推薦算法數組

推薦算法主要有：User-based Recommender, Item-based Recommender和Slope-One Recommender。數據結構

1. User-based Recommender app

該算法的主要思想是：與用戶u最類似的用戶喜歡的商品有很大可能也是用戶u喜歡的商品。 oop

1 對於用戶u的每個沒有preference的商品i
2 對於每個對商品i有preference的用戶v
3 計算用戶u與v的類似性s//實際上無需在線計算，能夠事先計算好存儲起來
4 將用戶v對於商品i的preference，乘以s，加到用戶u對商品i的預測preference的平均值
5 返回用戶u的平均值最高的幾個商品做爲推薦商品。學習

上述算法須要窮舉每一個商品i，致使計算很是很是慢。能夠實現計算好某個用戶u的全部的鄰居(記爲集合n)，而後，再爲用戶u作推薦時，只須要考慮用戶u的鄰居的全部有preference的商品便可，而無需考慮全部商品，算法以下：測試

1 對於每一個其餘的用戶w
2 計算用戶u與用戶w之間的類似度s
3 返回用戶u的類似度最高的幾個用戶，記爲用戶u的鄰居n
4 //上述步驟能夠離線完成，相似於索引
5 對於用戶u的每一個u自己沒有preference，可是u的鄰居n中某個用戶有preference的商品i
6 對於每一個對商品i有preference的用戶u的鄰居v
7 計算用戶u與v的類似度//其實無需在線計算，能夠提早計算好，存儲起來
8 將用戶v對於商品i的preference，乘以s，加到用戶u對商品i的預測preference的平均值 spa

2. Item-based Recommender

該算法的主要思想是：喜歡商品i的用戶u，有很大可能性會喜歡和商品i很類似的其餘商品

1 對於用戶u的每一個沒有preference的商品i
2 對於每一個用戶u有preference的商品j
3 計算商品i與j的類似度s
4 把用戶u對商品j的preference，乘以s，加到用戶u對商品i的preference的平均值
5 返回用戶u的平均值最高的幾個商品做爲推薦商品

3. Slope-One Recommender

首先Slope one是一種基於項目的協同過濾算法（Item-based Recommendation）

首先計算每兩個商品之間preference差值的平均值

1 對於某個商品i
2 對於某個商品j
3 對於每一個對商品i和j都有preference的用戶u
4 將用戶u對商品i和商品j的preference的差值加到全部用戶對商品i和商品j的差值的平均值當中去