2019年的推薦系統大會(Recsys) 於今年的9月份在丹麥哥本哈根舉行,來自世界各地的909位專家、學者參與了這次會議,迄今爲止規模最大的一次。大會涵蓋了與推薦系統相關的主題,從推薦系統的社會影響到搭建推薦系統所用的算法。git
今年,除了從算法和方法的角度來看待「推薦系統」這一領域外,咱們還經過發現、解決推薦系統中存在的問題來進一步認識這一領域的發展。此次會議的參會人員中還出現了社會科學家的身影。這在提醒咱們,推薦系統這種技術正在影響着咱們的生活,影響着人們的信息互動、娛樂消費。有句話說得好,「能力越大,責任越大」。做爲技術人員,咱們不只要對用戶負責,還要對和咱們一塊兒共事的同事負責。接下來的章節咱們會詳細地介紹這些問題,以及一些算法和應用程序。算法
今年的大會特別強調了推薦系統的綜合性和社會影響。第一位主題演講人Mireille Hildebrandt談到了GDPR如何改變經營者的動機,即誰能決定廣告商或發佈者等人的處理目的和處理方式,讓其除了從盈利的角度出發進行優化外,還要考慮透明度和更好的方法。(注:GDPR,General Data Protection Regulation,即《通用數據保護條例》,2018年5月由歐盟出臺,目的在於遏制我的信息被濫用,保護我的隱私)微信
第二位主題演講者Eszter Hargittai談到了人們的在線行爲,不一樣平臺之間人們在線行爲的差別以及人們的在線行爲是如何致使算法出現誤差的。最後,小組討論瞭如何創建對社會負責的推薦系統的問題。網絡
可重現性早已成爲當前困擾推薦系統領域的重要話題。可是,讓人人均可以使用某段代碼還不夠,還須要解決的一個基本問題是,如何進行試驗以及如何衡量改進辦法的好壞:基線有時調得不夠準,數據集和任務集的選擇有時也不夠嚴謹,測試改進措施有時也沒什麼意義。架構
A Worrying Analysis of Recent Neural Recommendation Approaches一文,比較了幾種較爲複雜的神經CF變體方法,而且重現了這幾種方法呈現的結果,還擊敗了其餘調好的簡單基線。這篇文章被評爲「最佳論文」,這釋放出的信號是,咱們還須要在該領域投入更多,須要更加努力。app
推薦系統的使用一般涉及多個目標,爲了解決此問題,能夠在多任務設置中表達問題。框架
優化運維
愈來愈多的推薦系統尋求針對多個目標進行優化的方法。例如,不只要針對視頻的播放量進行優化,還要對視頻的點贊數和評論數也進行優化。爲此,系統將具備多個損失函數,每一個目標一個。在某些必要時刻,咱們須要把這些損失合併爲一個,所以,須要爲每一個損失分配一個權重。例如,iview
視頻的瀏覽量與用戶對視頻留言評論相比,前者的重要性多是後者的兩倍。當處理許多目標時,手動設置這些權重既不是最佳選擇,也可能很麻煩。得到「最佳論文」提名的另外一篇論文A Pareto-Efficient Algorithm for Multiple Objective Optimization in E-Commerce Recommendation(《電商推薦中多目標優化的帕累託效率算法》,譯者注),介紹了一種自動計算權重的方法,從而達到犧牲某一目標來改變某一權重的狀態(帕累託效率狀態,在不犧牲其餘目標的狀況下沒法改善單個目標)。爲了達到帕累託最佳效率,一般作法是這樣的:ide
•進化啓發法:沒法保證帕累託效率
•標量化方法:將全部目標合併爲一個目標,即損失的加權總和。一般,標量權重由人工肯定。
•在本文中,做者考慮了標量方法,並提出了兩步算法,在理論保證的狀況下學習標量權重。更新權重的步驟等於解決具備約束的二次方問題。
Google發表了兩篇論文,展現了用於視頻檢索和排名的多目標架構。其中一篇是: Recommending what video to watch next: a multitask ranking system。這篇文章建議使用複雜的框架處理複雜的互動,從而學習如何推薦視頻:
•多個目標:參與度、滿意度
•多種嵌入:圖像、文本
•使用專家模型的多門混合實現上述目標
以後推出的兩門課程仍圍繞這個主題展開,你們對此興趣盎然。
推薦系統一般不直接衡量用戶滿意度,而是創建在隱式反饋信號(如點擊次數、觀看次數等)上。許多論文提出了更好地利用隱式反饋的方法。
Relaxed Softmax for PU Learning提出了一種處理否認採樣的新方法,這是無標記學習中常見的步驟(從隱式反饋中學習與該任務密切相關),大多數方法都假設從固態分佈中採樣否認。本文提出了一種基於boltzmann分佈的新的負採樣方案,其中選擇的負採樣更接近算法的決策邊界,從而可以提供更多信息。
Leveraging Post-click Feedback for Content Recommendations這篇文章解決了點擊後信息反饋的問題。他們關注具備點擊後信息(便是否收聽或跳過了歌曲)的現實世界中的音樂和視頻數據集,並在點對和成對模型上顯示了AUC的改進(分別爲18.3%和2.5%)。
做者提出了一個通用的機率框架,用於融合三組不相交的觀察結果:點擊完成、點擊而後跳過或不點擊。每種類型反饋的置信度都是經過高斯分佈的方差建模,而後執行最大似然估計。
在展現廣告中,特徵分佈多是不固定的,預測點擊的模型須要按期更新。挑戰之一是沒法當即得到最新的用戶反饋。在 Addressing Delayed Feedback for Continuous Training with Neural Networks in CTR prediction一文中,做者解決了延遲反饋的問題。
在相關的工做中,使用的損耗是延遲的反饋損耗(假定使用單獨的模型來肯定反饋延遲)和PU損耗(將偏置數據中的全部負樣本視爲未標記)。做者提出了兩種損失函數,這些函數能夠帶來最佳的離線性能,並能夠在特定模型上轉化爲在線收益:
•基於重要性抽樣的FN加權(FN weighted )。樣品首先被標記爲陰性,用戶參與後當即顯示確定標籤。
•FN校準(FN calibration)損耗的校準版本
在反饋很明確的狀況下(例如購買),即便沒有推薦,用戶也可能已經購買了該商品。提高(也稱爲增量)在此定義爲由推薦引發的用戶操做的增長。 Uplift-based Evaluation and Optimization of Recommenders一文提出了一種新的離線評估協議和基於提高的推薦的優化方法。
From Preference into Decision Making: Modeling User Interactions in Recommender Systems 一文引入了頁面級RNN,除了能夠獨立考慮每一個項目和操做外,還解決了頁面上多個項目相互影響、多個不一樣操做及不一樣種類的操做等問題。
基於內容的推薦
基於內容的方法對於解決冷啓動問題有很大幫助:某些項目的視圖不多,某些項目則是全新的。
CB2CF: A Neural Multiview Content-to-Collaborative Filtering Model for Completely Cold Item Recommendations 經過生成僅包含如下內容的CF嵌入來解決此問題:
•分類特徵
•連續特徵
•詞嵌入
而後,使用簡單的CNN將上述特徵映射到CF嵌入。結果代表,CB2CF不如CF,但優於單獨的CB,並解決了冷啓動問題。
HybridSVD: When Collaborative Information is Not Enough提出了一種方法,經過擴展傳統的基於SVD的方法,同時使用協同信息和基於內容的類似性來構建產品和用戶嵌入。關鍵思想是將用戶輔助矩陣或由內容構建的類似項參數化,得出雙線性形式,替換交互表中Gram矩陣中的標量乘積項。
如欲申請產品試用,歡迎添加先薦小助手微信號(ID:recsysfc)。
本帳號爲第四範式智能推薦產品先薦的官方帳號。帳號立足於計算機領域,特別是人工智能相關的前沿研究,旨在把更多與人工智能相關的知識分享給公衆,從專業的角度促進公衆對人工智能的理解;同時也但願爲人工智能相關人員提供一個討論、交流、學習的開放平臺,從而早日讓每一個人都享受到人工智能創造的價值。