乾貨|個性化推薦系統五大研究熱點之用戶畫像(四)

【編者按】微軟亞洲研究院社會計算組的研究員們從深度學習、知識圖譜、強化學習、用戶畫像、可解釋性推薦等五個方面,展望了將來推薦系統發展的方向。微信

在前三篇文章中,咱們分別介紹了深度學習、知識圖譜、強化學習在推薦系統中的應用以及將來可能的研究方向。在今天的文章中,咱們將介紹推薦系統中的用戶畫像網絡

推薦系統中的用戶畫像

構建推薦系統的核心任務之一在於如何準確地分析出用戶的興趣特色,也就是咱們常說的用戶畫像。機器學習

簡單說來,用戶畫像是指從用戶產生的各類數據中挖掘和抽取用戶在不一樣屬性上的標籤,如年齡、性別、職業、收入、興趣等。完備且準確的屬性標籤將有力地揭示用戶本質特徵,於是極大地促進精準的個性化推薦。post

乾貨|個性化推薦系統五大研究熱點之用戶畫像(四)

用戶畫像研究的現狀和挑戰

目前,主流用戶畫像方法通常是基於機器學習尤爲是有監督學習的技術。這類方法從用戶數據中抽取特徵來做爲用戶的表示向量,並利用有用戶屬性標籤的數據做爲有標註數據來訓練用戶畫像預測模型,從而對更多的沒有標籤的用戶的屬性進行預測。學習

儘管目前的用戶畫像方法已經取得了不錯的效果並被普遍應用於實際推薦系統中,這些方法仍然存在必定的問題和挑戰:網站

首先,這些已有的方法大多數都基於手工抽取的離散特徵,這些特徵沒法刻畫用戶數據的上下文信息,所以對於用戶的表徵能力較爲有限。搜索引擎

其次,現有的用戶畫像方法一般基於簡單的線性迴歸或分類模型,沒法從用戶數據中自動學習高層次抽象特徵,也沒法對特徵之間的交互關係進行建模。另外,已有的用戶畫像方法每每基於單一類型和單一來源的數據,這些數據對於用戶的表徵不夠豐富。而實際上,用戶數據每每是多來源和多類型的。人工智能

最後,已有的用戶畫像方法大都沒有考慮用戶屬性標籤的時效性,所以很難刻畫用戶動態變化的屬性如興趣等。設計

乾貨|個性化推薦系統五大研究熱點之用戶畫像(四)

從多源異構用戶數據中構建深度、統一和動態的用戶畫像

爲了應對上述挑戰,咱們認爲應該從如下方面展開用戶畫像研究:日誌

1. 構建具備更強表徵能力的用戶表示模型。

隨着深度學習技術的發展和成熟,利用深層神經網絡從用戶原始數據中自動抽取深層次的、有信息量的特徵來構建用戶的特徵表示可以有助於更加充分地利用用戶數據並有效提高用戶畫像的精度。

使用基於深層神經網絡的用戶表示模型可以有效克服目前已有的基於特徵工程和線性模型的用戶畫像方法的不足。咱們提出的HURA模型(

Neural Demographic Prediction using Search Query
, WSDM 2019)基於多層注意力機制和神經網絡結構,有效地經過搜索日誌預測了用戶我的屬性。

2. 基於多源和異構數據的用戶畫像。用戶產生的數據每每分佈在不一樣的平臺,而且具備不一樣的結構(如無結構的社交媒體文本數據和有結構的電商網站購買記錄等)和不一樣的模態(如文本數據和圖像數據),給用戶畫像帶來了很大的挑戰。

如何設計一個深度信息融合模型來利用不一樣來源、不一樣結構和不一樣模態的用戶數據進行用戶建模,是將來用戶畫像領域的一個重要方向。

基於深度神經網絡的協同窗習和多通道模型多是值得嘗試的技術。

                乾貨|個性化推薦系統五大研究熱點之用戶畫像(四)

3. 不一樣平臺用戶畫像數據的共享和用戶隱私保護。目前不少用戶數據存在於不一樣的平臺當中,例如搜索引擎擁有用戶的搜索和網頁瀏覽記錄,電商網站擁有用戶的商品瀏覽、購物、收藏和購買信息。這些不一樣平臺的用戶數據對於用戶畫像都具備重要的價值,互相之間能夠提供互補信息,有助於構建更加豐富全面的用戶表示。

然而,平臺之間直接共享用戶信息可能會使得用戶的隱私受到泄露和損害。如何在不轉移和不共享用戶數據的狀況下,充分利用不一樣平臺的用戶信息實現協同用戶畫像和建模是值得研究的一個方向。

4. 面向用戶畫像的統一用戶表示模型。已有的用戶畫像方法在實際的應用中每每會涉及大量模型的訓練、存儲和調用,時間和空間的複雜度都比較高,使用起來也比較繁瑣。另外,不一樣的用戶屬性之間潛在的聯繫也沒法充分挖掘。

如何基於多源異構的用戶數據構建一個統一的用戶表示模型,使得該模型能夠儘量全面而準確地包含一個用戶在不一樣屬性和維度的特徵信息並可以應用於多個用戶畫像任務是一個很是值得研究的方向。

基於深層神經網絡的多任務學習技術和相似詞嵌入的用戶嵌入技術有但願可以應用於這個問題。

乾貨|個性化推薦系統五大研究熱點之用戶畫像(四)

下一篇文章咱們將圍繞「推薦系統中的用戶畫像」的研究展開討論。想要了解關於推薦系統的更多研究熱點,還請持續關注。

相關閱讀:

乾貨|個性化推薦系統五大研究熱點之強化學習(三)

乾貨|個性化推薦系統五大研究熱點之知識圖譜(二)

乾貨 | 個性化推薦系統五大研究熱點之深度學習(一)

搭建推薦系統快速入門,只需五步!

歡迎你們點贊、收藏,將更多技術知識分享給身邊的好友。

本帳號爲第四範式智能推薦產品先薦的官方帳號。本帳號立足於計算機領域,特別是人工智能相關的前沿研究,旨在把更多與人工智能相關的知識分享給公衆,從專業的角度促進公衆對人工智能的理解;同時也但願爲人工智能相關人員提供一個討論、交流、學習的開放平臺,從而早日讓每一個人都享受到人工智能創造的價值。

第四範式每一位成員都爲人工智能落地貢獻了本身的力量,在這個帳號下你能夠閱讀來自計算機領域的學術前沿、知識乾貨、行業資訊等。

如欲瞭解更多,歡迎搜索關注官方微博、微信(ID:dsfsxj)公衆號。

相關文章
相關標籤/搜索