AutoPLP在偏好標籤中的生產與應用

案例介紹

偏好標籤行業運營、搜索推薦、廣告投放等應用中都發揮着舉足輕重的作用,以下圖「Cartier/卡地亞」品牌廣告爲例,需要準確捕捉卡地亞奢品的偏好人羣。在這個場景中,它不單純是品牌的偏好,也不單純是一個商品或品類的偏好,更像是對該品牌下跨品類的某些商品簇的偏好。AutoPLP基於品牌熱詞(Cartier/手鐲/腕錶/戒指/珠寶/磚石/JUSTE UN CLOU/Love ring…)的生產方式靈活實現品牌->品類->商品(或品類->品牌->商品)中間模糊地帶的偏好標籤生產,可助力卡地亞完成成交目標。

在這裏插入圖片描述

什麼是偏好標籤?

在上個場景中,"卡地亞奢品"就是一個偏好標籤,那什麼標籤算偏好標籤。

我們優先從電商領域的消費者偏好標籤入手,以品所屬的行業品牌層次關係爲主軸,將電商域的消費者偏好標籤重點劃分7類:行業偏好、品牌偏好、商家偏好、商品偏好、行業屬性偏好、品牌屬性偏好、商品屬性偏好。其中xx屬性偏好:屬性指的是一些關鍵熱詞/賣點詞/趨勢詞等,包括如功能、功效、材質、風格、顏色、面料、膚質、段位、版型、款式等的描述詞。考慮商家偏好、商品偏好、商品屬性偏好在應用中與品牌偏好、品牌屬性偏好有一定重合之處,所以我們優先以構建類目偏好、品牌偏好、類目屬性偏好、品牌屬性偏好標籤爲重點目標。
在這裏插入圖片描述

AutoPLP是什麼

AutoPLP,全稱Automatic Preference Label Production System,又名AutoDM-Zero,是AutoDM基於無樣本挖掘的一個分支。定位爲基於多模態輸入的開放式偏好標籤生產系統,目標是生產基於多模態輸入(文本、圖片、視頻、音頻)的多實體(消費者、商品、企業、POI等)偏好標籤。消費者偏好標籤是行業運營、搜索推薦、廣告投放普遍應用的一類標籤,如:消費者手機品牌偏好、裝修風格偏好、美妝防曬/保溼/美白功效偏好等等。偏好標籤通常可歸納爲對於一個實體(如消費者U),預測其對某個關鍵詞label的偏好度。如消費者手機品牌偏好,指U對每個手機品牌label的偏好,label可定義爲華爲、蘋果、小米、魅族、一加、OPPO…,業務物理含義指消費者對華爲品牌的偏好度、對蘋果品牌的偏好… 。所以偏好標籤往往非常離散、個性化,理論上任何有明確語義信息的名詞/形容詞都可以作爲一種偏好標籤,它可以來自商品標題、商品屬性、潮流詞、趨勢熱詞、或業務自定義等等。爲滿足這種靈活多變多樣的特性,AutoPLP的核心能力之一是滿足便捷性,實現「定義即生產」。

爲什麼需要AutoPLP

1)「靈活便捷生產系統」的重要性:隨着企業經濟體業務的不斷髮展,我們需要具備結合越來越多源多態的數據來識別愈多實體的能力。以消費者爲例,首先消費者的定義在被不斷擴大,我們不僅關注他的衣食住行、吃喝玩樂,還關心他在權益、知識、福利、財富、健康等等上的消費。其次消費者的喜好本身在不斷變化,畢竟多彩的世界促使每個人都在活出自己想要的Faces Of Girl。所以如何應對這種數據量及內容的時序變化,離不開一套靈活、高產的標籤生產系統。

2)「精細化運營」的迫切性:精細化運營不算一個新概念,但當前仍處於一個「人人都知道要做精細化運營,但很多時候往往無能爲力」的階段。以消費者精細化運營爲例,類比商品的CPV,我們始終缺失一個相對完整的消費者層次標籤體系,也缺失一套快速、靈活的標籤生產系統。可以想象,如果我們有了消費者的CPV,一定會是消費者健康度運營,品牌人羣資產運營,以及包括像搜索推薦、廣告投放等各應用非常重要的「儀表盤」。

3)數據底料的豐富催使」精細化」成爲可能:當前時代用戶信息數據的豐富和多樣,促使精細化成爲可能。

AutoPLP技術框架

在這裏插入圖片描述
AutoPLP定位於實現基於多模態輸入(文本、圖片、視頻、音頻)的多實體(消費者、商品、企業、POI等)偏好標籤生產系統。整體技術框架如上圖,着重解耦爲3層:預訓練網絡、實體embedding以及交互層。圍繞這3層,目前我們探索了多種偏好標籤生產方式,包括以語義匹配爲基礎的通用偏好標籤生產、面向特定屬性商品的偏好標籤生產、基於異構圖模型的偏好標籤生產。

先挖個坑,如果這個文章得到了10個收藏和200閱讀量,就來分享下以語義匹配爲基礎的偏好標籤生產實踐。