這是對近年來基於深度學習的推薦系統的內容的一份綜述,具體來講,大部份內容來自 Deep Learning based Recommender System: A Survey and New Perspectives,我翻譯和總結了其中的一些內容。同時,我有時也會閱讀該survey提到的工做的原文,並對某些更具體的內容作一些補充。算法
深度學習近年來在各個領域都被普遍應用,推薦系統也不例外,那麼,深度學習算法是如何與推薦系統聯繫起來的呢?文章旨在全面回顧最近基於深度學習的推薦系統的研究成果,並展望將來的趨勢。markdown
推薦系統是對信息爆炸的防線,對於用戶的選擇起到相當重要的做用。一般,咱們基於用戶偏好,項目特徵,用戶歷史以及時序數據和空間數據的一些其餘附加信息來生成推薦列表。咱們把推薦系統分爲協同過濾,content-based推薦系統和混合推薦系統。最近,基於深度學習的推薦系統經過克服傳統模型的一些問題和實現高推薦質量而得到了顯著的進步。深度學習可以有效地捕獲非線性和非平凡的用戶-項目關係,而且可以將數據表示爲更復雜的抽象的編碼。此外,它還從豐富的可訪問數據源(如上下文,文本和可視信息)中捕獲數據自己的錯綜複雜的關係。網絡
近年來,基於深度學習的推薦方法的研究出版物數量呈指數增加,深度學習成爲推薦系統研究中不可避免的部分。推薦系統領域領先的國際會議RecSys自2016年起開始按期進行深度學習推薦系統研討會。該研討會旨在促進研究並鼓勵基於深度學習的推薦系統的應用。咱們應該瞭解學術界和工業界的深度學習模型的優缺點和應用場景。這篇survey調查的文章主要來自NIPS, ICML, ICLR, KDD, WWW, SIGIR, WSDM, RecSys等頂級會議,具備至關程度的表明性。該調查的目的是爲從業人員提供一個快速查詢的目錄。該survey彷佛到目前爲止還在不斷更新,我這個系列只包括截止到2018.10.08的該survey中的內容。架構
首先,在討論問題以前,咱們須要肯定咱們討論的範圍,並作一些預約義。框架
推薦系統估計user對item的偏好,並推薦user可能喜歡的item。咱們把推薦系統分爲協同過濾,content-based推薦系統和混合推薦系統。 協做過濾從user-item 交互歷史中進行學習並做出推薦,其中交互行爲包括顯式反饋(例如,user對item的先前評分)或隱式反饋(例如,用戶的瀏覽歷史)。 基於內容的推薦主要基於一些item和user的輔助信息,經過比較這些輔助信息能得出一些推薦結果。 能夠考慮各類輔助信息,例如文本,圖像和視頻。 混合模型是指整合兩種或更多種推薦策略的推薦系統機器學習
咱們設定以下討論情景:咱們有個user和個item,是交互矩陣,是預測的交互矩陣。表明用戶對item 的偏好,是模型預測的用戶對item 的偏好。的某一行表明一個用戶的偏好行爲,表示爲。的某一列表明一個item的被用戶偏好行爲,表示爲。和分別表明被觀察到和未被觀察到的交互行爲。咱們另外使用和來表明user和item的latent factor(隱藏特徵)。是隱特徵的維數。模塊化
深度學習一般被認爲是機器學習的子領域。 深度學習的典型定義是它學習深層表徵,即從數據中學習多層次的表示和抽象。 出於實際緣由,咱們將任何可分解爲神經網絡的架構視爲「深度學習」,只要它使用隨機梯度降低(SGD)的變體優化可微的目標函數。 神經網絡架構在監督和非監督學習任務中都取得了巨大的成功。 在本小節中,咱們闡明瞭與本survey密切相關的各類架構範式。函數
咱們總結了基於深度學習的推薦模型的優點:工具
爲了提供這個領域的鳥瞰,咱們根據所採用的深度學習技術的類型對現有模型進行分類。 咱們進一步將基於深度學習的推薦模型分爲如下兩類。 下圖總結了分類方案。 oop
表1列出了全部已被調查的模型,咱們按照上述分類方案對其進行組織。 此外,咱們還從表2中的任務角度總結了一些publications。咱們調查的publications涉及各類推薦任務。 因爲使用深度神經網絡(例如基於會話的推薦,圖像,視頻推薦),一些原來不常見的任務已開始受到關注。 一些任務對於推薦研究領域可能並不新穎,但DL提供了更多找到更好解決方案的可能性。 例如,若是沒有深度學習技巧的幫助,處理圖像和視頻將是一項艱鉅的任務。 而深度神經網絡的序列建模功能能夠輕鬆捕獲用戶行爲的順序模式。
咱們將在以後的博客中討論這些方法的具體細節。這個survey目前的參考文獻列表以下,感興趣的讀者能夠本身索引文章: