![](http://static.javashuo.com/static/loading.gif)
做者:秦路
算法
原文很長,乾貨不少,爲了便於理解,我把文章拆分爲了三期微信
今天介紹第二期:正確使用用戶畫像機器學習
用戶畫像首先是基於業務模型的。業務部門連業務模型都沒有想好,數據部門只能巧婦難爲無米之炊。數據部門也別關門造車,這和作產品同樣,連用戶需求都沒有理解透徹,匆匆忙忙上線一個APP,結果無人問津。工具
理解消費者的決策,考慮業務場景,考慮業務形態,考慮業務部門的需求…這些概念說得很虛,可是一個好的用戶畫像離不開它們。本文沒有說數據、模型和算法,是我認爲,它們比技術層面更重要。學習
咱們從一個故事開始設立用戶畫像吧。spa
老王是一家互聯網創業公司的核心人員,產品主營綠色健康沙拉,老王和綠色比較搭嘛。這家公司推出了APP專賣各式各樣的沙拉,如今須要創建用戶畫像指導運營。.net
公司現階段在業務層面,更關注營銷和銷售:如何將沙拉賣得更好。3d
下圖是老王簡單梳理的運營流程。code
![](http://static.javashuo.com/static/loading.gif)
老王將顧客按是否購買過沙拉,劃分紅潛在用戶和新客。潛在用戶是註冊過APP但尚未下單,新客是隻購買過一次沙拉的用戶,除此之外還有老客,即消費了兩次及以上的人羣。orm
爲了便於你們理解,我用JSON
格式表示一個簡易的用戶畫像。
![](http://static.javashuo.com/static/loading.gif)
爲何獨立出新客標籤?由於老王的沙拉針對未消費用戶會有新人紅包引導消費,萬事開頭難。這也帶來新客一次後再也不消費的問題,因此須要潛在、新客、老客的劃分。
做爲一個有追求的運營人員,劃分老客也是不夠,這裏繼續用戶分層。
傳統的分層用RFM三個維度衡量,沙拉的客單價比較固定,F和M取一個就夠用了。老王如今計算不一樣消費檔次的用戶留存度差別,譬如某時間段內消費達XX元的用戶,在將來時間段是否依舊消費。
RFM模型是衡量客戶價值和客戶創利能力的重要工具和手段
最近一次消費 (Recency)
消費頻率 (Frequency)
消費金額 (Monetary)
沙拉這類餐飲是高頻消費,XX應該選擇一個較窄的時間窗口,統計365天內的消費意義不大。還有一點須要注意的是,沙拉不一樣季節的銷量是有差別的,冬天沙拉確定賣的不如夏天,要綜合考慮消費分佈。
這裏姑且定義,30天內消費200元以上爲VIP用戶。老王的生意若是特別好,也能夠繼續劃分超級VIP。這種標籤每每配合業務,譬如VIP有贈送飲料,優先配送的權益。非VIP人羣,也須要激勵往VIP發展。
畫像的人口統計屬性,老王靠用戶填寫訂單上的收貨人姓名搞定。籍貫年齡這幾個,對沙拉生意沒有特別大的幫助,難道爲四川籍用戶提升麻辣沙拉?
用戶地址,能夠經過收貨地設立規則判斷,好比某個地址出現X次,能夠將其認爲經常使用地地址。再依據送貨地在寫字樓仍是學校,推算用戶是白領仍是學生。
老王針對不一樣屬性的人羣,採起了特殊的運營策略。像學生羣體,由於7,8月份是暑假,因此老王提早預估到校園地區的銷售額降低。當9月開學季,又能對返校學生進行召回。
白領相關的羣體,更關注消費體驗,對價格敏感是次要的。若是平臺女用戶的消費佔比高,老王就主打減肥功能的沙拉,而且以包月套餐的形式提升銷量。
![](http://static.javashuo.com/static/loading.gif)
以一家沙拉店來看,老王的用戶畫像已經不錯了,但他仍是焦頭爛額,由於用戶流失率開始上升。用戶流失有各類各樣的緣由:對手老李沙拉的競爭、沙拉的口味、用戶以爲性價比不高、老王不夠帥等。
流失是一個老大難的預測問題。老王對流失用戶的定義是30天沒有消費。想要準確預測,這裏得嘗試用機器學習建模,技術方面先這裏略過。所謂建模,最好要找到用戶開始不消費的時間點以前的關鍵因素,但是是行爲,能夠是屬性。
用戶歷史窗口內消費金額少,有可能流失;用戶歷史窗口內消費頻次低,有可能流失;用戶歷史窗口內打開APP次數少,有可能流失;用戶給過差評,有可能流失;用戶等餐時間長,有可能流失;用戶的性別差別,有可能流失;餐飲的季度因素,有可能流失…
老王依據業務,挑選了可能影響業務的特徵,提交給數據組嘗試預測流失。須要注意的是,這些用戶行爲不能反應真實的狀況。你們不妨想一下,流失用戶的行爲,是否是一個動態的變化過程?
我曾經消費過不少次,可是忽然吃膩了,因而減小消費次數,再以後不怎麼消費,最終流失。單位時間段內的消費忠誠度是梯度降低的,爲了更好的描述變化過程,將時間窗口細分紅多個等距段。前30-20天、前20~10天、前10天內,這種切分比前30天內能夠更好地表達降低趨勢,也更好的預測流失。
從老王的思路看,所謂流失,能夠經過用戶行爲的細節預判。機器學習的建模雖然依賴統計手段,也離不開業務洞察。這裏再次證實,用戶畫像創建在業務模型上。
流失機率解決了老王的心頭之患,經過提早發現下降流失用戶。挽回流失推行一段時間後,老王發現雖然流失用戶減小了,可是成本提升了,由於挽回用戶也是要花錢的呀。虧本可不行,老王心頭又生一計,他只挽回有價值的,那種拿了紅包才消費的用戶老王他不要了!老王要的是真愛粉。因而他配合消費檔次區別對待,雖然流失用戶的數量沒有控制好,可是利潤提升了。
上述的用戶畫像,沒有一個標籤脫離於業務以外。基於業務場景,咱們還能想象不少用戶畫像的玩法。沙拉有不一樣的口味,蔬果雞肉海鮮。用戶的口味偏好,能夠用矩陣分解、模糊聚類或者多分類的問題計算,也以0~1之間的數字表示喜愛程度,類似的,還有價格偏好,即價格敏感度。
![](http://static.javashuo.com/static/loading.gif)
再深刻想一下業務場景,若是某個辦公地點,天天都有五六筆的訂單,分屬不一樣的客戶不一樣的時間段,外賣小哥得送個五六次,對人力成本是多大的浪費呀。運營能夠在後臺分析相關的數據,以團購或拼單的形式,促成訂單合併,或許銷售額的利潤會降低,可是外賣的人力成本也節約了。這也是用畫像做爲數據分析的依據。
老王的運營故事說完了,如今對用戶畫像的創建有一套想法了吧。
本文分享自微信公衆號 - SQL數據分析(dianwu_dw)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。