機器學習算法學習---推薦系統的經常使用算法(一)

歸納分類:
1) 基於內容的推薦:這一類通常依賴於天然語言處理NLP的一些知識,經過挖掘文本的TF-IDF特徵向量,來獲得用戶的偏好,進而作推薦。這類推薦算法能夠找到用戶獨特的小衆喜愛,並且還有較好的解釋性。這一類因爲須要NLP的基礎,本文就很少講,在後面專門講NLP的時候再討論。

2)協調過濾推薦:本文後面要專門講的內容。協調過濾是推薦算法中目前最主流的種類,花樣繁多,在工業 界已經有了不少普遍的應用。它的優勢是不須要太多特定領域的知識,能夠經過基於統計的機器學習算法來獲得較好的推薦效果。最大的優勢是工程上容易實現,可 以方便應用到產品中。目前絕大多數實際應用的推薦算法都是協同過濾推薦算法。html

3)混合推薦:這個相似咱們機器學習中的集成學習,博才衆長,經過多個推薦算法的結合,獲得一個更好的 推薦算法,起到三個臭皮匠頂一個諸葛亮的做用。好比經過創建多個推薦算法的模型,最後用投票法決定最終的推薦結果。混合推薦理論上不會比單一任何一種推薦 算法差,可是使用混合推薦,算法複雜度就提升了,在實際應用中有使用,可是並無單一的協調過濾推薦算法,好比邏輯迴歸之類的二分類推薦算法普遍。算法

4)基於規則的推薦:這類算法常見的好比基於最多用戶點擊,最多用戶瀏覽等,屬於大衆型的推薦方法,在目前的大數據時代並不主流。網絡

5)基於人口統計信息的推薦:這一類是最簡單的推薦算法了,它只是簡單的根據系統用戶的基本信息發現用戶的相關程度,而後進行推薦,目前在大型系統中已經較少使用。機器學習

一、概念學習

協同過濾包括在線的協同和離線的過濾。在線協同是指經過在線數據找到用戶可能喜歡的物品;離線過濾是指過濾掉一些不值得推薦的數據。大數據

 

咱們的問題是這樣的m個物品,m個用戶的數據,只有部分用戶和部分數據之間是有評分數據的,其它部分評分是空白,此時咱們要用已有的部分稀疏數據來預測那些空白的物品和數據之間的評分關係,找到最高評分的物品推薦給用戶。 

 

分類:htm

(1)基於用戶的協同過濾。考慮用戶之間的類似度,經過類似用戶得到評價高分物品,將其推薦給目標用戶。blog

(2)基於項目的協同過濾。考慮物品之間的類似度,經過目標用戶對某些物品的評分,將類似物品推薦給他。get

(3)基於模型的協同過濾。目前最主流的,下面詳細介紹。產品

二、基於模型的協同過濾

 

用機器學習的思想來建模解決,主流的方法能夠分爲:用關聯算法,聚類算法,分類算法,迴歸算法,矩陣分解,神經網絡,圖模型以及隱語義模型來解決。

詳情可見:

http://www.javashuo.com/article/p-bkloqygg-kq.html

相關文章
相關標籤/搜索