乾貨 | 個性化推薦系統五大研究熱點之深度學習(一)

【編者按】在這個科技高速發展、信息爆炸的時代,絕不誇張地說,推薦系統已經徹底融入了咱們的生活。咱們去哪一家餐館、買哪一件衣服、瀏覽哪一類信息、觀看哪種視頻,很大程度上都取決於背後的推薦系統。網絡

在本文中,微軟亞洲研究院社會計算組的研究員們從深度學習、知識圖譜、強化學習、用戶畫像、可解釋性推薦等五個方面,展望了將來推薦系統發展的方向。全文已得到微軟研究院AI頭條(ID:MSRAsia)受權轉載。文章乾貨較多,建議收藏!
ide

「猜你喜歡」、「購買過此商品的用戶還購買過……」對於離不開社交平臺、電商、新聞閱讀、生活服務的現代互聯網用戶來講,個性化推薦已經不是什麼新鮮事兒。學習

隨着信息技術和互聯網行業的發展,信息過載成了人們處理信息的挑戰。對於用戶而言,如何在以指數增加的資源中快速、準確地定位到本身須要的內容是一個很是重要且極具挑戰的事情。對於商家而言,如何把恰當的物品及時呈現給用戶,從而促進交易量和經濟增加,也是一件頗具難度的事情。推薦系統的誕生極大地緩解了這個困難。網站

推薦系統是一種信息過濾系統,能根據用戶的檔案或者歷史行爲記錄,學習出用戶的興趣愛好,預測出用戶對給定物品的評分或偏好。它改變了商家與用戶的溝通方式,增強了和用戶之間的交互性。搜索引擎


據報道,推薦系統給亞馬遜帶來了35%的銷售收入,給Netflix帶來了高達75%的消費,而且Youtube主頁上60%的瀏覽來自推薦服務。編碼

所以,如何搭建有效的推薦系統意義深遠。咱們將從深度學習的應用、知識圖譜的應用、強化學習的應用、用戶畫像和可解釋推薦等幾個方面,一塊兒看看推薦系統的將來。本文將圍繞深度學習在推薦系統中的應用展開討論。設計

推薦系統與深度學習

近幾年深度學習的技術應用在語音識別、計算機視覺和天然語言理解等領域,取得了巨大的成功,如何將其應用到推薦系統是當前的研究熱點。深度推薦系統現階段的應用主要體如今以下三個層面:cdn

  1. 提高表徵學習能力。深度神經網絡的優點在於其強大的表徵學習能力。所以,一種最直接的應用是,利用深度學習技術從複雜的內容數據中學習出有效的隱因子特徵表示,從然後續能夠很方便地爲推薦系統所用。
  2. 深度協同過濾。經典的矩陣分解模型能夠被描述爲一種很是簡單的神經網絡。咱們能夠經過拓展其中的結構,引入更多的非線性單元來增強推薦模型的功能。例如,在WWW 2017論文Neural collaborative filtering中,做者提出了增強版的矩陣分解模型。一方面,它彌補了兩個隱向量的樸素點積操做不能區分各維度之間重要性差異的弱點;另外一方面,它額外引入了一個多層感知機模塊,用來引入更多的非線性操做。除此以外,自動編碼機、卷積神經網絡、記憶網絡、注意力網絡等深度學習相關技術也分別被應用在改進傳統的協同過濾模型中,取得了不錯的效果。
  3. 特徵間的深度交互。企業級的推薦系統爲了儘可能提升模型的準確性,每每會使用豐富的、甚至異構的內容數據。這些特徵從不一樣的維度展示了不一樣的信息,並且特徵間的組合一般是很是有意義的。傳統的交叉特徵是由工程師手動設計的,這有很大的侷限性,成本很高,而且不能拓展到不曾出現過的交叉模式中。所以學者們開始研究用神經網絡去自動學習高階的特徵交互模式,彌補人工特徵工程帶來的種種侷限性。這個層面相關的模型包括Wide&Deep、PNN、DeepFM、DCN、以及咱們近期提出的xDeepFM模型(《xDeepFM: Combining Explicit and Implicit Feature Interactions for Recommender Systems》,KDD 2018)等。

深度學習技術在推薦系統中的應用前景很廣闊。下面簡要介紹幾個將來可能的研究方向:視頻

1. 效率與可拓展性

對於工業界推薦系統而言,不只須要考慮模型的準確度運行效率可維護性也是很是重要 的方面。效率指的是當用戶發來一個請求時,推薦系統可以以接近實時的速度返回結果,而不需讓用戶等待;可維護性指系統的部署簡便,可以支持按期更新,或者增量式更新。衆所周知,複雜神經網絡的計算量是龐大的,如何將它們更高效地應用在超大規模的推薦平臺上,是亟需解決的技術難點。blog

2. 多樣化數據融合

現實平臺中,用戶或者物品的數據每每是複雜多樣的。物品的內容能夠包括文本、圖像、類別等數據;用戶的行爲數據能夠來自多個領域,例如社交網絡、搜索引擎、新聞閱讀應用等;用戶的行爲反饋也能夠是豐富多樣的,例如電商網站中,用戶的行爲可能有搜索、瀏覽、點擊、收藏、購買等。不只如此,在這些不一樣的維度中,不一樣用戶或物品的數據分佈也千差萬別;用戶在不一樣的行爲反饋上的數據量也不一樣,點擊行爲的數據量每每遠大於購買行爲的數據量。所以,單1、同構的模型是不能有效地處理這些多樣化的數據的。如何深度融合這些複雜數據是一個技術難點。

3. 捕捉用戶長短時間偏好

用戶的偏好大體能夠分爲長期和短時間兩類。長期偏好每每指用戶的興趣所在,例如她是五月天的歌迷,那麼將來很長時間她都會對五月天的歌曲、演唱會門票感興趣;短時間偏好指的是用戶在當前環境下的即時興趣,例如最近一週用戶比較喜歡聽抖音上的熱門歌曲,那麼推薦系統也應該捕捉到用戶的這個興趣,或者用戶在將來一個月有搬家的打算,那麼推薦系統能夠適當地推送一些搬家公司的廣告。目前一些流行的作法是,將循環神經網絡與深度協同過濾技術結合,從而達到兼顧長短時間記憶的功能。如何結合情境因素的影響,將用戶的長期偏好與短時間需求更緊密、有效地結合起來,也是一個研究熱點。


下一篇文章咱們將圍繞「推薦系統與知識圖譜」的研究展開討論。想要了解關於推薦系統的更多研究熱點,還請持續關注,歡迎分享與收藏!

相關文章
相關標籤/搜索