揭祕阿里巴巴的客羣畫像

阿里巴巴一直在面向將來探索B類新電商模式,並從2019年開始重點構建「新供給、新連接、新營銷」三新體系。買家是三新體系的核心,缺乏買家維度的數字化經營體系是不完整的。平臺場景目標羣體及場景間買家差別性尚不明確,客羣矩陣就是爲場景中控解決這一業務痛點、提升場貨分發效能而專門設置的算法研究主題。同時,客羣矩陣也是用戶增加和算法特徵的核心數據。鑑於客羣矩陣如此重要且擁有諸多應用,其構建迫在眉睫。算法

阿里巴巴意在將客羣矩陣打形成平臺的一個風向標,以便業務有目標、有層次、有差別、高效地選品和進行場景運營及商家運營,爲用戶增加和算法模型優化提供動力,爲數字化運營提供依據。咱們主要圍繞人、貨、場、商4個維度構建,客羣矩陣概況如圖1所示。優化

客羣矩陣同場景矩陣疊加,在構建場景目標用戶、衡量場景差別性的同時,也能提升場景效能,有效引導目標流量,進而爲各種業務場景的算法建模提供底層數據基礎。網站

1 採購力

B類買家不像C類買家有明確的年齡、性別等基礎座標維度,B類用戶可能是企業或者批發商,如何刻畫B類特點的客羣矩陣,這對於B類電商很是重要,也是B類電商「小二」一直在思考的問題。spa

既然B類用戶羣體主要是企業和批發商,那麼如何準確地描述客羣矩陣呢?採購力就是突出的表徵,採購力包含採購金額和採購頻率,從採購力能夠看出用戶的經營規模和消耗能力。所以,咱們將採購力做爲基礎座標維度,分層提供精準差別化服務。操作系統

採購金額主要是必定週期內用戶採購的金額。爲了規避不一樣品類價格差別較大帶來的分層干擾,首先分類目對採購金額劃檔,而後再按照金額檔不分類目看,佔比最多的金額檔就是此用戶的採購金額檔層。3d

採購頻率是必定週期內用戶的採購頻次。將用戶按照採購時間排序,而後計算用戶在必定時間週期內採購的頻次。將全部用戶按照高斯分佈比例劃分出高、中、低檔,做爲採購頻率的分層檔次。blog

2 生命週期

包括新裝機、新用戶、低活、中活、中高活、高活、沉睡、流失等階段,該生命週期主要是按照用戶在電商平臺的活躍度來劃分的,其中也融入了部分業務知識。例如,新裝機用戶是指剛裝機的用戶,新用戶是指成交在2單之內的用戶,低活是指一個月訪問天數在2天之內的用戶等。排序

從交易週期分析用戶生命週期,如圖2所示,包括新裝機激活用戶、登陸用戶、首單用戶、活躍買家(高採購力買家、潛力買家)、潛睡買家、深睡買家等階段,各個生命週期階段之間的轉換關係在圖中也有直觀呈現。精準化用戶運營根據買家生命週期階段不一樣而調整目標,所採起的策略也會相應調整。生命週期

瞭解了用戶生命週期,就能夠有針對性地作用戶拉新、促活、留存,以提升用戶黏性:對於新裝機和新用戶,主要是提升他們的用戶體驗,培養用戶的消費習慣,作留存轉化;對於中低活用戶,主要是促活、留存;對於中高活用戶,主要是維持用戶的習慣,增強黏性;對於沉睡和流失用戶,主要是經過紅包權益等方式促活。用戶生命週期的維護對於電商持續用戶增加發揮着相當重要的做用。rem

3 核心主營

CBU做爲B2B電商平臺的典型表明,一直致力於服務全球億萬B類買家用戶。用戶覈實身份與主營類目(如進口母嬰店店主、精品女裝店店主、微商兼職、小超市店主等)做爲B類用戶畫像最爲核心的屬性之一,不只表明着用戶的線下實體身份,還直接影響着用戶在電商平臺上的行爲偏好、採購週期及對商家服務能力的訴求等,所以一直是B類電商平臺致力於深耕與運營的核心用戶畫像屬性之一。

大多數C類用戶畫像屬性能夠直接基於用戶在網站上的歷史行爲進行建模,但B類用戶畫像則不一樣。由於要覈實用戶核身身份以及對主營類目有精準性的要求,通常B類電商平臺主要以用戶自填表單的形式進行用戶覈實身份的肯定。這種用戶自填方式結果準確度較高,但位置隱蔽、鏈路冗長、沒有利益點的引導,不只用戶填寫率低,並且與場景結協力不足。

爲解決原表單式核身用戶操做成本高的問題,阿里巴巴CBU電商平臺經過用戶核身組件借力算法模型對用戶核身進行預測,依據置信度排序,爲用戶推出Top K個選項供用戶點選。總體算法解決方案以下。

01 數據源

1)用戶站內行爲

用戶站內行爲是用戶需求與偏好的第一反饋基地,是算法須要着重去挖掘的數據源。相對其餘偏好類畫像屬性來講,用戶核身是一個相對穩定和長期的用戶屬性,所以在算法應用中,咱們選取了用戶最近半年的站內全域行爲做爲底層數據。定義半年的長時間窗口選取主要有兩方面考慮:一是目前網站商品豐富、優質,搜索與推薦算法日漸精進,用戶瀏覽各種商品的成本較低,因此B類用戶在網站上的注意力難以保持專一,用戶B類/C類的需求與行爲混雜,數據較髒,較長的時間窗口有利於濾除干擾,捕獲用戶更爲長期和穩定的需求;二是用戶行爲數據,特別是採購行爲,相對稀疏,然而B類用戶的採購行爲是反映用戶核身身份最爲核心的特徵之一,且用戶採購行爲又具備必定的週期性,所以長期的時間窗口可以幫助算法更加全面地認識用戶。

2)用戶站外上下游身份

不一樣於不少偏好類用戶畫像屬性,用戶核身身份可以與用戶在現實中的身份產生真實的映射關係,如奶茶店店主—喜茶店主、烘焙店店主—寶島金典店主、精品女裝店店主—淘寶女裝店店主等。所以,用戶站外上下游的身份映射關係,可以輔助咱們進一步完善用戶核身身份的預測,提升覆蓋率和準確率。

3)行業知識

鑑於用戶在網站上B類/C類行爲混雜,噪聲較多,B類用戶核身偏好易受網站熱門類目與商品的干擾,所以咱們也引入了大量行業知識做爲指導來協助完成B類用戶核身身份的預測,並基於此沉澱下來一份核身偏好類目數據。

02 算法方案

利用以上用戶站內行爲、站外上下游身份和行業知識的數據,算法端能夠經過如下幾個步驟實現用戶核身身份的預測工做,預測流程如圖3所示。

圖3 用戶核身預測流程圖

1)種子用戶圈選

種子用戶主要定義爲站內已核身用戶及站外上下游有映射關係的核身信息的用戶。

2)行業知識指導

咱們基於種子用戶最近一段時間的站內行爲數據,挖掘識別顯著性特徵,提供給運營同事,對種子用戶再進行一輪劃撥,把平常核心行爲與行業偏好明顯不符合的用戶排除,優化種子用戶的圈選。

3)種子商品圈選

以行業偏好類目做爲門檻,篩選出種子用戶在門檻下最近半年內採購過的商品做爲種子商品。

4)種子商品擴展

基於團隊沉澱現有商品的I2I表,利用種子商品做爲trigger觸發Key,對種子商品進行擴展,擴展種子商品的偏好分等於商品I2I類似分與trigger種子商品偏好分的乘積。

5)用戶核身預測

對於一個用戶的核身預測,咱們選取其最近半年的行爲數據進行建模打分。而後基於打好分的用戶行爲商品計算用戶對每個可能的核身身份的偏好置信度,並用以區分用戶的我的採購行爲和B類採購行爲,下降用戶的我的採購行爲對預測結果的影響,加大用戶的B類採購行爲的權重。

本文摘編於《阿里巴巴B2B電商算法實戰》經出版商受權發佈。

本書是阿里巴巴CBU技術部(1688.com)深耕B2B電商15年的經驗總結。阿里巴巴B2B在戰略形態上經歷了信息平臺、交易平臺和營銷平臺的升級迭代,本書聚焦營銷平臺商業形態背後的算法和技術能力,試圖從技術和商業互爲驅動的視角闡述技術如何賦能業務,並結合阿里巴巴集團在基礎設域和算法創新上的沉澱,打造出智能B2B商業操做系統。

阿里巴巴B2B電商算法實戰
做者:阿里集團,新零售技術事業部,CBU技術部

推薦閱讀

《用戶畫像:方法論與工程化解決方案》

這是一本從技術、產品和運營3個角度講解如何從0到1構建用戶畫像系統的著做,同時它還爲如何利用用戶畫像系統驅動企業的營收增加給出瞭解決方案。

用戶畫像:方法論與工程化解決方案
做者:趙宏田

關注「實時流式計算」 後臺回覆 「0814」 參與抽獎

將於8月15號中午12:00開獎 共送出兩本圖書 歡迎你們參與~

相關文章
相關標籤/搜索