構建用戶評分體系

做者介紹面試

@貓耳朵app

數據產品經理萌新,ide

開發經驗豐富,專一於數據產品。工具


—————— BEGIN ——————學習

花花是某電商公司的一名產品運營,若是新上線一款產品他的一向作法都是作活動、蹭熱點、作營銷等等。可是,這些作法引來了大量的羊毛黨,獲取的真實客戶倒是屈指可數。ui


正在花花爲此事頭疼之際,同組的前輩豆豆給他支個招,運用 AHP 和 RFM 構建用戶評分體系,精細化運營,能帶來很好的效果。開心之餘,花花趕忙使用度娘搜索,AHP 和 RFM 到底是什麼東西?又怎麼運用呢?接下來做者就給你嘮叨嘮叨。spa



1  AHP制定權重3d



1.1   AHP是什麼?blog


層次分析法(Analytic Hierarchy Process)簡稱 AHP,20 世紀 70 年代中期由美國運籌學家托馬斯·塞蒂(T·L·Saaty)提出。
排序


AHP 是指將與決策有關的元素分解成目標、準則、方法等層次,主要用於定性的問題進行定量化分析決策。


好比,某電商平臺根據用戶行爲數據對用戶作綜合評分模型,找出忠誠用戶、活躍用戶、沉默用戶等等,進而對各種用戶進行精細化運營。


1.2   AHP基本原理


AHP 的思路是密切的和決策者的主觀判斷以及推理聯繫起來,也就是對決策者的推理或者判斷過程進行量化,從而避免決策者在結構複雜或方案較多時邏輯推理失誤。具體步驟以下:

22fbee0aa1ff199147415b2746598e83.png

1)創建評分體系

構建用戶價值評分體系,對各種用戶進行精細化運營。


設定目標,列出影響目標的全部元素。採用專家打分、用戶問卷等方式,逐一列出全部的影響因素,好比活躍度、忠誠度、購買力等。


2)構建層次結構、判斷矩陣

列出影響因素的指標或方案。

判斷影響用戶活躍度的指標有瀏覽頁面次數、停留時長、瀏覽商品次數、下單次數。

判斷影響用戶忠誠度的指標有最近訪問時間、訪問頻率、主動評價次數。

判斷影響用戶購買力的指標有單筆最高金額、平均訂單金額、購買次數。


3)算出權重係數

分別算出各個指標層、準則層的指標權重,而後再算出決策公式(以下圖)。

867379dd3173a215945ccede652659a8.png


4)一致性校驗

若一致性指標 CR<0.1,就進入下一環節;不然,對各指標權重從新賦值(即,從新構建判斷矩陣)。


5)層次排序

層次排序分爲層次單排序和層次總排序。所謂層次單排序,指對於上一層某因素而言,本層次各因素的重要性的排序;所謂層次總排序,指肯定某層全部因素總目標相對重要性的排序權值過程。


層次排序是從最高層到最底層依次進行的。對於最高層次而言,其層次單排序的結果也是總排序的結果。


1.3   肯定權重


1.3.1 構建判斷矩陣

在肯定各層次各因素間的權重時,若是僅是定性的結果,則一般不容易被其餘人接受,於是 Saaty 提出一致性矩陣法,即兩兩因素相互比較,採用標度,儘量減小不一樣因素相互比較的困難,以提升準確度。


運用專家打分將全部因素兩兩比較肯定合適的標度。創建層次結構後,比較因子及下屬指標的各個比重,實現定性向定量轉化。


好比,採用 1-9 分標度法,構建決策層的打分矩陣 A,以下圖。

4e9aae7ccd59edaad30bb6c8d6d9a039.png

dd88bfc24c44081a8faa1387f4298fdc.png

實際上,上述打分矩陣就是層次分析法中的判斷矩陣。


1.3.2 一致性檢驗

一致性檢驗是爲了檢驗各元素重要程度之間的協調性,避免出現 A 比 B 重要,B 比 C 重要,而 C 又比 A 重要,這樣的矛盾狀況。


1)相關理論

(1)一致性矩陣

b15134d56a62a278cabb87eb2503772c.png

(2)判斷矩陣是否爲一致性矩陣

818ecb37e2540febce9899853f829c99.png


在判斷矩陣的構造中,並不要求判斷矩陣必定具備一致性,這是由客觀事物的複雜性和人的認識多樣性決定的。但判斷矩陣是計算排序權向量的依據,所以要求判斷矩陣應該知足大致上的一致性。

5b93d8a56fdf02bc7467f4df34fb22d6.png


2)對判斷矩陣一致性校驗

先求解特徵向量,採用手工計算方法——和積法:

5758a550c83acb3e91ee077b8d1ba920.png


手工計算矩陣 A 的特徵值:

(1)求特徵向量

eef80d5159e8a07e50940d9b1659be55.png


(2)求最大特徵值

f7e4fa6857cfbf4f2496d37d001d9e7a.png

手工求解精確度較低,只是求得最大特徵值的近似值。通常狀況下,能夠採用在線計算工具 Matlab,連接地址:https://wis-ai.com/tools/ahp


(3)一致性校驗

bb5b6988700537dd7733032302c2e2dc.png

0ce93924b9408bd2bdbfa1388f42e23b.png


1.3.3 計算指標層權重

1)計算活躍度的權重

a1d8ad3f4095019b43ee1679b32339b3.png

所以,準則層相對活躍度的權重依次爲:

  • 瀏覽頁面次數的權重:b1=0.63231

  • 停留時長的權重:b2=0.21452

  • 瀏覽商品次數的權重:b3=0.10961

  • 下單次數的權重:b4=0.04357


2)計算忠誠度的權重

9e14696ddb149a08ccb21235642e3b76.png

所以,準則層相對忠誠度的權重依次爲:

  • 最近訪問時間的權重:c1=0.61935

  • 訪問頻率的權重:c2=0.28423

  • 主動評價次數的權重:c3=0.09642


3)計算購買力的權重

ee963947eb3382e796ce94ebade77c9b.png


所以,準則層相對購買力的權重依次爲:

  • 單筆最高金額的權重:d1=0.70706

  • 平均訂單金額的權重:d2=0.20141

  • 購買次數的權重:d3=0.09153

4)列出所有權重

12e376dbee2956c2accbef90b147dc31.png


5)若是一致性校驗沒有經過,怎麼辦?

做者在實際構建評分矩陣時,發生了好幾回一致性校驗不經過(如 CR>=0.1)。這可能因爲一些主觀因素致使,也多是因爲構建模型不合理致使。因此須要專家從新構建打分矩陣,甚至須要從新構建層次分析模型。


(1)構建模型影響

因素是否合理、含義是否清晰、要素間是否重疊,這都會有影響。建議每層要素儘可能不超過 7 個;若是元素之間的強度相差很大,儘可能不要放在同一個層級。


(2)計算精度影響

特徵值求解方法的不一樣(好比和積法、方根法等)、Excel 計算值的偏差、計算工具的偏差等,均可能致使一致性校驗結果有些誤差,可使用 Matlab 等精度更高的計算工具(https://wis-ai.com/tools/ahp),以下圖。

df659fc428feb25f8d039bf28ed74fbc.jpeg


6)結論

運用 AHP 模型得出和公式:

  • 活躍度=b1*瀏覽頁面次數+b2*停留時長+b3*瀏覽商品次數+b4*下單次數;

  • 忠誠度=c1*最近訪問時間+c2*訪問頻率+c3*主動評價次數;

  • 購買力=d1*單筆最高金額+d2*平均訂單金額+d3*購買次數;

  • 用戶價值評分=0.64339*活躍度+0.28284*忠誠度+0.07377*購買力。


AHP 方法使用較少的定量數據,就能夠構建模型,最終的結論只能代表因素的重要程度,不能得出用戶價值的評分值是多少。


所以,將 RFM 模型和 AHP 模型相結合,算出各個因素的分值,得出每一個用戶的評分。



2   RFM計算分值


2.1   RFM是什麼?


RFM 模型是衡量客戶價值和客戶創利能力的重要工具和手段。該模型經過一個客戶的近期購買行爲(Recency)、購買的整體頻率(Frequency)以及消費金額(Monetary)3 項指標切分出多類客戶,最後根據不一樣類型客戶(以下圖)佔比狀況來評估客戶的總體分佈,並針對不一樣類型的客戶進行有針對性的營銷。

67e1f3473905092cbf7c31bcd0d353f1.png


一個 RFM 用戶分層模型,重要發展客戶到底多少分?通常價值客戶多少分?做者將用某電商公司 2018 年 11 月 1 日-2019 年 4 月 30 日共 5 個月的交易數據來說述,爲了保護隱私,數據通過脫敏處理。


2.2   構建RFM模型的步驟


2.2.1 獲取與清洗數據

RFM 模型主要用於分析用戶購買行爲,一般得到的數據包含付款時間、實付金額、訂單狀態等等信息的數據,部分數據以下圖。

3467d1a9287423b1ae9e08f9f4914415.png


得到數據後,其中可能存在空值、異常值等狀況,這類髒數據沒法進行分析,須要經過簡單的數據清洗去除。數據清洗的方式有兩類:異常值處理,如刪除、均值補差等;異常值識別,如按業務規則查找、語義衝突等。


好比,做者得到交易數據後,發現 「發貨時間」 爲空,是髒數據,須要剔除;對應 「訂單狀態」 的值是 「付款之後用戶退款成功,交易自動關閉」,退款用戶數據不應歸入模型,須要去除。


清洗完以後,分別對 「發貨時間」、「訂單狀態」 進行篩選,這時發現 「發貨時間」 爲空或訂單狀態爲 「付款之後用戶退款成功,交易自動關閉」 這類數據已經不存在了,說明已經篩選乾淨了。


2.2.2 創建模型

接下來,做者須要提取 R、F、M 的值:R(最近一次購買距今天的天數)、F(購買了幾回)和 M(平均購買金額)。


構建一張透視表,將 「買家暱稱」 分別拖到行位置和值位置,對 「買家暱稱」 進行計數彙總,也就是得出買家的消費次數,即 F 值。將 「付款時間」 拖到值位置,設爲最大值,將 「實付金額」 拖到值位置,設爲平均值,即 M 值,以下圖。

e610fb023f9105fe607ca1262fea48b0.png


將初步透視好的數據複製到一張新的表格(選擇性粘貼「值和數字格式」)。接着處理 R 的值,因爲訂單截止日期是 2019 年 4 月 30 日,做者將建模時間設爲 2019 年 5 月 1 日,求距離 5 月 1 日這一天客戶最近一次付款時間的間隔天數,就是求每一個客戶的 R 值,以下圖。

6d511f91fc7d54b284beb20f72fcf783.png


用 RFM 的計算方式,對全部因素(R、F、M)進行 0-5 評分區段的映射。

4c60197ab5b0da8b44976421e4f749cf.png


或者用下面的公式歸一化處理(以下圖),正相關使用第一個公式,負相關使用第二個公式,R 屬於負相關,由於最近一次購買時間距越小,那麼越重要。F 和 M 都是正相關。

edecb89f1aeee0b12ba5da346d0fa59b.png


規範化計算也可使用 (X-Xmin)/均值(X) 和 (Xmax-X)/均值(X) ,須要注意的是,若是真實數據分佈不平均的話,均值就可能出現誤差,好比有人消費 100 萬元,有人消費 1000 元,平均數的誤差就很大。因此,可使用三分位、中位數或者(Xmax-Xmin)等方式進行歸一化。

ec895137d93a89aa7477e6a78958b015.png


因爲獲取的數據字段有限,沒法經過指標層獲得準則層的權重,因此直接使用 AHP 算出活躍度、忠誠度和購買力的權重,依次分別是 0.6433九、0.2828四、0.07377。得出標準化的數據以及必定權重的用戶價值,以下圖。

d0f3442068780ff430a0226954734dda.png


把 R、F、M、用戶價值按照 0、1 區分,若是大於均值爲 1,不然爲 0,獲得 16 種用戶類型,以下圖。

75ff2b1fe496ba99136a72e78331dd28.png


將用戶類型代入數據中,得出的部分結果,以下圖。

e4653d0f35bc12828cc23bae01840459.png


2.3   模型可視化


2.3.1 分析各種客戶佔比

對剛剛完成 RFM 模型表格進行透視,將 「客戶類型」 拖至行區域,再把 「客戶類型」 拖至值區域兩次,第一次是爲了計數,第二次是爲了查看客戶佔比,以下圖。

5397a88b9e8efb155548f2b12b65f3ba.png


繪圖,更清晰的查看不一樣客戶類型的用戶數佔比,以下圖。

3782142168a1095b8e7a56150b606f8d.png


2.3.2 分析客戶金額佔比

對 RFM 模型表格進行透視,將 「客戶類型」 拖至行區域,再把 「累計金額」 拖至值區域兩次,第一次是爲了計算每類客戶的累計消費金額,第二次是爲了查看每類客戶的金額佔比,以下圖。

d4e13b1c2a427fffd9dd55d92218087d.png


繪圖,更清晰的查看不一樣客戶類型的金額佔比,以下圖。

d300dc6cc466e11d9dce1798b70d3a0b.png



3   總結與建議


1)從各種客戶佔比圖中看出,次通常挽留客戶(0000)的人數最高,竟達 8725 人,人數佔比 34.52%,此類客戶近期沒有購買,購買頻次低於平均值,下單平均金額比較低,而且用戶價值也較低,大約在 2018 年 雙11 下的單,屬於價格敏感性客戶,因此能夠在促銷活動(如國慶節、六一等)時試着喚醒他們。


2)次重要挽留客戶(0010),最近沒有購買商品,消費頻率較低,消費金額較大的一類客戶,有 6905 人,人數佔比 27.16%,支付金額佔比最高。換句話說,對於該商家銷售額貢獻率最高的一批客戶,下單時間遠,購買次數低,已經處於流失的邊緣,可是不一樣於次通常挽留客戶,這類客戶的平均銷售額較高。


對於這類客戶,運營人員須要獲取他們的聯繫方式,進行回訪,詢問客戶沉睡的緣由;或者說商品自己就屬於復購率低、消費金額佔比高的商品;或者從商品自己入手,試着比較客戶購買時間與商品的回購日期,是否是上次購買的商品尚未用完。


3)重要發展客戶(1011),最近購買,購買頻次低,消費金額大,用戶價值大的客戶有 2614 人,佔總人數的 20.28%,支付金額相對較高。這類客戶大體是新客戶。


對於這類客戶,運營人員近期適當的進行短信推送,優惠券發放等形式,來提升他們的購買頻率,爭取提升這類用戶的忠誠度,最終將他們轉變成重要價值客戶。




一個數據人的自留地是一個助力數據人成長的你們庭,幫助對數據感興趣的夥伴們明確學習方向、精準提高技能。關注我,帶你探索數據的神奇奧祕


一、回「數據產品」,獲取<大廠數據產品面試題>

二、回「數據中臺」,獲取<大廠數據中臺資料>

三、回「商業分析」,獲取<大廠商業分析面試題>;

四、回「交個朋友」,進交流羣,認識更多的數據小夥伴。

相關文章
相關標籤/搜索