導讀:本文主要介紹以手淘促活爲目的的全鏈路智能投放算法框架,該框架目前接入以 Pagani 爲核心的全鏈路運營平臺,首先使用用戶意圖識別算法圈選出目標人羣,而後藉助物料智能推薦和權益動態面額等算法實現全鏈路上用戶的個性化觸達干預。本文以 2019 年春節期間手淘促活項目爲例,具體地介紹權益智能投放框架的設計思路和實際應用。算法
因爲快遞物流、商家打烊等因素,春節是電商的淡季。對於手淘來講,在春節期間,用戶的活躍程度有明顯的下滑, DAU 出現一段時間的低谷。經過算法提早預測春節期間活躍度會發生降低的預警人羣,配合不一樣階段的用戶運營幹預(在節前預熱期結合春節「吃喝玩樂」的場景,算法個性化推薦相應的虛擬權益;春節期間經過 PUSH 消息每日推送提高來訪率),能夠有效地促進用戶回訪、扼制用戶活躍度的下降。框架
如圖,經過對近兩年春節先後的 DAU 的變化趨勢進行統計分析,咱們發現,春節對 DAU 的影響持續以除夕爲中心的近一個月的時間(從臘月十六到正月十五左右),而傳統春節放假的 7 天是 DAU 的最低谷( 18 年除夕晚有春晚紅包加持除外)。機器學習
根據以上分析結果,可定義出模型預測的關鍵的時間節點。在節前,經過算法預測,從臘月十六到正月十五的春節30天期間,活躍度會發生降低的「降級預警人羣」,在整個活動期對「降級預警人羣」進行有針對性的用戶運營幹預,而在進行干預時,又能夠經過推薦算法,結合用戶的意圖識別,進行權益的個性化承接。異步
如圖所示,權益智能投放算法框架,主要包括意圖識別、權益推薦兩個功能模塊:ide
意圖識別:性能
解決「是否發」的問題,側重點在於「圈人」,給什麼樣的用戶發放權益;學習
對於春節促活項目的具體訴求,經過用戶的來訪意圖模型,提早預測無來訪的用戶,在站內經過支付成功頁等場景的權益觸達提早干預,站外經過PUSH消息等渠道進行權益觸達和召回。測試
權益推薦:大數據
解決「發什麼」的問題,給用戶發放什麼樣的權益;優化
拿到圈選的人羣后,須要對人進行「千人千面」的權益個性化承接。
3.1 意圖識別
意圖識別,根據用戶畫像和歷史行爲,預測用戶將來某一時間段內、某種行爲(如用戶的來訪、點擊、收藏、加購、購買等)的發生的機率。
對於用戶增加來講,大部分狀況下,運營的干預目標每每不是單一的,而是「既要、又要、還要、也要「的。對於運營的一個干預策略,目標是多樣性的,須要考慮來訪率、第二天留存率、瀏覽轉化率、成交轉化率、ROI等不一樣的目標如何權衡和綜合優化。
針對不一樣的干預目標,構造樣本數據和搭建多意圖的訓練體系:
LABEL選取和樣本構造:
根據不一樣的優化目標,加工數據,選用不用的LABEL和抽取樣本,如領取率LABEL對應權益是否領取,覈銷率LABEL對應權益是否覈銷,成交轉化率對應用戶是否有下單支付等;
用戶意圖體系構建:
訓練用戶來訪、點擊、收藏、加購、購買等不一樣的意圖評分模型;
**意圖模型平常評估:
**
具體到春節用戶無來訪的預測問題來講,核心就是用戶來訪意圖的預測。以 2017 年春節期的數據做爲訓練集, 2018 年春節期的數據做爲測試集,評估數據以下:
3.2 權益推薦
權益推薦,解決用戶的權益個性化承接的問題,綜合考慮用戶的權益偏好和敏感度、各種權益的目標人羣和庫存量、平臺的補貼成本等,實現用戶、商家、平臺的三方雙贏。
手淘春節促活項目,是全鏈路智能投放框架首次應用於購後發放權益,因爲初次上線且投放時間較短,算法須要快速迭代和提高效果。推薦算法通過冷啓動、引入CTR模型、 Thompson Sampling 調權等 3 輪迭代,快速優化和提高了點擊率和核銷率。
▶ 3.2.1 冷啓動策略
冷啓動的策略設計主要包含兩部分:
一、ε-Greedy算法
解決冷啓動問題和優化系統 E&E 問題的最基礎、簡捷的方法。其基本思路爲:在 (0, 1) 之間選擇一個較小的ε值,而後以ε的機率選擇流量,從權益底池中進行隨機推薦,即完成勘探Exploration的功能,以 1 - ε 的機率選擇流量,基於先驗信息設計的決策樹推送權益,即利用如今已有的先驗信息完成開發Exploitation的功能。
**二、基於先驗信息設計決策樹
**
在上線初期,權益底池中的各種優惠券尚未曝光、點擊信息時,能夠根據用戶的基礎畫像信息,以及用戶在站內已有的瀏覽、加購、購買等行爲的信息,做爲設計決策樹時的一部分先驗信息。
▶ 3.2.2 CTR模型
權益推薦模塊,相比於用戶意圖識別,增長了「權益」這個實體,所以在特徵的設計上須要更多的考慮權益維度、用戶和權益的交叉特徵等。能夠說用戶意圖識別是一個偏用戶洞察理解的問題,而權益個性化則是一個典型的推薦問題。
如圖所示,在特徵的設計上,主要包括用戶維度特徵、權益維度特徵,以及用戶和權益的交叉特徵:
用戶維度特徵的設計,與用戶意圖識別模塊基本相似,能夠複用用戶的基礎特徵、行爲特徵。而在權益維度,則須要更多地考慮權益自己的差別,經過標題、面額、所屬二方業務、權益所映射的類目 ID ,以及歷史的領取率、覈銷率更細緻地刻畫不一樣權益的差別性。同時,將用戶的特徵與權益的特徵進行交叉,來學習不一樣畫像的用戶在指定權益上的偏好。
點擊率預估模型選取的是 XFTRL 。XFTRL 是基於阿里的 eXtreme Parameter Server 平臺開發的高性能異步 ASGD FTRL 算法,可以支持千億規模的特徵和長時間連續增量訓練。
2017年,阿里巴巴推薦算法團隊和計算平臺 PAI 團隊合做打造了 eXtremeParameter Sever 機器學習平臺(XPS),普遍全流量運行在手機淘寶的猜你喜歡、生活研究所、飛豬旅行和天貓推薦等大數據場景,取得了較好的效果。
FTRL 是一種 Online Learning Optimizer ,原始的 FTRL 的具體資料能夠參考論文: Mcmahan, H. Brendan , et al. "Ad click prediction: a view fromthe trenches." Proceedings of the 19th ACM SIGKDD internationalconference on Knowledge discovery and data mining ACM, 2013.
XFTRL 算法是對經典線性算法 FTRL 的擴展,是爲了解決大規模數據下 FTRL 的一些缺點而提出的。集團內的多數場景對於用戶行爲時效性要求很高,實時/準實時學習能夠充分利用實時日誌數據,快速更新模型來適應用戶最新行爲,更好地強調近期樣本的重要性,能夠實時快速迭代,快速反應線上變化。
利用上線初期積累的3天的樣本訓練模型,測試集評估 AUC 僅達 0.61 。另外,在分析時發現各個二方權益的曝光量差別較大,且長尾的二方權益的量很小,所以在短期內優化算法, E&E 機制的設計就相當重要。
▶ 3.2.3 E&E 優化
長尾 item 在推薦系統中不多或沒機會展現,致使 CTR 預估不許,須要探索性給他們創造一些機會,但不能給系統帶來太大損失,這就是 E&E 問題。針對 E&E 的問題,咱們選取了比較經典的 Thompson Sampling 算法進行 explore 。
湯普森採樣(Thompson Sampling)基於貝葉斯思想,所有用機率分佈來表達不肯定性。
湯普森採樣算法的核心在於肯定 Beta 分佈的參數,以表徵後驗的 ctr ,以下圖所示,爲湯普森採樣擬合後驗 ctr 的分佈曲線:
湯普森採樣代碼實現比較簡單,在 Java 中能夠基於 math3.distribution.BetaDistribution 包快速實現。在計算廣告和推薦領域應用的效果與 UCB(Upper Confidence Bound ,一種基於估計的置信區間設計的E&E優化策略)相比 competitive to or better ,且對於數據延遲反饋、批量數據反饋更 robust 。
整個春節促活項目,包括意圖識別「圈人」 和權益推薦的 「個性化承接」兩部分, 所以AB實驗設計上,包括圈人的干預桶與空桶的對比(衡量干預帶來的活躍度提高和DAU增量),和權益個性化承接算法桶與隨機桶的對比(衡量權益個性化算法的效能)。
手淘促活總體AB指標 (干預桶對比空桶)
權益個性化AB指標(算法桶對比隨機桶)
更完備的數據鏈路:
引入」供需平衡「的分配機制:
沉澱用戶生命期有效算法干預策略:
原文連接 本文爲雲棲社區原創內容,未經容許不得轉載。