構建用戶評分體系

時間 2021-03-13

標籤面試 app ide 工具學習 spa 3d blog 排序欄目快樂工作简体版

原文原文鏈接

做者介紹面試

@貓耳朵app

數據產品經理萌新，ide

開發經驗豐富，專一於數據產品。工具

—————— BEGIN ——————學習

花花是某電商公司的一名產品運營，若是新上線一款產品他的一向作法都是作活動、蹭熱點、作營銷等等。可是，這些作法引來了大量的羊毛黨，獲取的真實客戶倒是屈指可數。ui

正在花花爲此事頭疼之際，同組的前輩豆豆給他支個招，運用 AHP 和 RFM 構建用戶評分體系，精細化運營，能帶來很好的效果。開心之餘，花花趕忙使用度娘搜索，AHP 和 RFM 到底是什麼東西？又怎麼運用呢？接下來做者就給你嘮叨嘮叨。spa

1 AHP制定權重3d

1.1 AHP是什麼？blog

層次分析法（Analytic Hierarchy Process）簡稱 AHP，20 世紀 70 年代中期由美國運籌學家托馬斯·塞蒂（T·L·Saaty）提出。
排序

AHP 是指將與決策有關的元素分解成目標、準則、方法等層次，主要用於定性的問題進行定量化分析決策。

好比，某電商平臺根據用戶行爲數據對用戶作綜合評分模型，找出忠誠用戶、活躍用戶、沉默用戶等等，進而對各種用戶進行精細化運營。

1.2 AHP基本原理

AHP 的思路是密切的和決策者的主觀判斷以及推理聯繫起來，也就是對決策者的推理或者判斷過程進行量化，從而避免決策者在結構複雜或方案較多時邏輯推理失誤。具體步驟以下：

1）創建評分體系

構建用戶價值評分體系，對各種用戶進行精細化運營。

設定目標，列出影響目標的全部元素。採用專家打分、用戶問卷等方式，逐一列出全部的影響因素，好比活躍度、忠誠度、購買力等。

2）構建層次結構、判斷矩陣

列出影響因素的指標或方案。

判斷影響用戶活躍度的指標有瀏覽頁面次數、停留時長、瀏覽商品次數、下單次數。

判斷影響用戶忠誠度的指標有最近訪問時間、訪問頻率、主動評價次數。

判斷影響用戶購買力的指標有單筆最高金額、平均訂單金額、購買次數。

3）算出權重係數

分別算出各個指標層、準則層的指標權重，而後再算出決策公式（以下圖）。

4）一致性校驗

若一致性指標 CR<0.1，就進入下一環節；不然，對各指標權重從新賦值（即，從新構建判斷矩陣）。

5）層次排序

層次排序分爲層次單排序和層次總排序。所謂層次單排序，指對於上一層某因素而言，本層次各因素的重要性的排序；所謂層次總排序，指肯定某層全部因素總目標相對重要性的排序權值過程。

層次排序是從最高層到最底層依次進行的。對於最高層次而言，其層次單排序的結果也是總排序的結果。

1.3 肯定權重

1.3.1 構建判斷矩陣

在肯定各層次各因素間的權重時，若是僅是定性的結果，則一般不容易被其餘人接受，於是 Saaty 提出一致性矩陣法，即兩兩因素相互比較，採用標度，儘量減小不一樣因素相互比較的困難，以提升準確度。

運用專家打分將全部因素兩兩比較肯定合適的標度。創建層次結構後，比較因子及下屬指標的各個比重，實現定性向定量轉化。

好比，採用 1-9 分標度法，構建決策層的打分矩陣 A，以下圖。

實際上，上述打分矩陣就是層次分析法中的判斷矩陣。

1.3.2 一致性檢驗

一致性檢驗是爲了檢驗各元素重要程度之間的協調性，避免出現 A 比 B 重要，B 比 C 重要，而 C 又比 A 重要，這樣的矛盾狀況。

1）相關理論

（1）一致性矩陣

（2）判斷矩陣是否爲一致性矩陣

在判斷矩陣的構造中，並不要求判斷矩陣必定具備一致性，這是由客觀事物的複雜性和人的認識多樣性決定的。但判斷矩陣是計算排序權向量的依據，所以要求判斷矩陣應該知足大致上的一致性。

2）對判斷矩陣一致性校驗

先求解特徵向量，採用手工計算方法——和積法：

手工計算矩陣 A 的特徵值：

（1）求特徵向量

（2）求最大特徵值

手工求解精確度較低，只是求得最大特徵值的近似值。通常狀況下，能夠採用在線計算工具 Matlab，連接地址：https://wis-ai.com/tools/ahp

（3）一致性校驗

1.3.3 計算指標層權重

1）計算活躍度的權重

所以，準則層相對活躍度的權重依次爲：

瀏覽頁面次數的權重：b1=0.63231
停留時長的權重：b2=0.21452
瀏覽商品次數的權重：b3=0.10961
下單次數的權重：b4=0.04357

2）計算忠誠度的權重

所以，準則層相對忠誠度的權重依次爲：

最近訪問時間的權重：c1=0.61935
訪問頻率的權重：c2=0.28423
主動評價次數的權重：c3=0.09642

3）計算購買力的權重

所以，準則層相對購買力的權重依次爲：

單筆最高金額的權重：d1=0.70706
平均訂單金額的權重：d2=0.20141
購買次數的權重：d3=0.09153

4）列出所有權重

5）若是一致性校驗沒有經過，怎麼辦？

做者在實際構建評分矩陣時，發生了好幾回一致性校驗不經過（如 CR>=0.1）。這可能因爲一些主觀因素致使，也多是因爲構建模型不合理致使。因此須要專家從新構建打分矩陣，甚至須要從新構建層次分析模型。

（1）構建模型影響

因素是否合理、含義是否清晰、要素間是否重疊，這都會有影響。建議每層要素儘可能不超過 7 個；若是元素之間的強度相差很大，儘可能不要放在同一個層級。

（2）計算精度影響

特徵值求解方法的不一樣（好比和積法、方根法等）、Excel 計算值的偏差、計算工具的偏差等，均可能致使一致性校驗結果有些誤差，可使用 Matlab 等精度更高的計算工具（https://wis-ai.com/tools/ahp），以下圖。

6）結論

運用 AHP 模型得出和公式：

活躍度=b1*瀏覽頁面次數+b2*停留時長+b3*瀏覽商品次數+b4*下單次數；
忠誠度=c1*最近訪問時間+c2*訪問頻率+c3*主動評價次數；
購買力=d1*單筆最高金額+d2*平均訂單金額+d3*購買次數；
用戶價值評分=0.64339*活躍度+0.28284*忠誠度+0.07377*購買力。

AHP 方法使用較少的定量數據，就能夠構建模型，最終的結論只能代表因素的重要程度，不能得出用戶價值的評分值是多少。

所以，將 RFM 模型和 AHP 模型相結合，算出各個因素的分值，得出每一個用戶的評分。

2 RFM計算分值

2.1 RFM是什麼？

RFM 模型是衡量客戶價值和客戶創利能力的重要工具和手段。該模型經過一個客戶的近期購買行爲（Recency）、購買的整體頻率（Frequency）以及消費金額（Monetary）3 項指標切分出多類客戶，最後根據不一樣類型客戶（以下圖）佔比狀況來評估客戶的總體分佈，並針對不一樣類型的客戶進行有針對性的營銷。

一個 RFM 用戶分層模型，重要發展客戶到底多少分？通常價值客戶多少分？做者將用某電商公司 2018 年 11 月 1 日-2019 年 4 月 30 日共 5 個月的交易數據來說述，爲了保護隱私，數據通過脫敏處理。

2.2 構建RFM模型的步驟

2.2.1 獲取與清洗數據

RFM 模型主要用於分析用戶購買行爲，一般得到的數據包含付款時間、實付金額、訂單狀態等等信息的數據，部分數據以下圖。

得到數據後，其中可能存在空值、異常值等狀況，這類髒數據沒法進行分析，須要經過簡單的數據清洗去除。數據清洗的方式有兩類：異常值處理，如刪除、均值補差等；異常值識別，如按業務規則查找、語義衝突等。

好比，做者得到交易數據後，發現「發貨時間」爲空，是髒數據，須要剔除；對應「訂單狀態」的值是「付款之後用戶退款成功，交易自動關閉」，退款用戶數據不應歸入模型，須要去除。

清洗完以後，分別對「發貨時間」、「訂單狀態」進行篩選，這時發現「發貨時間」爲空或訂單狀態爲「付款之後用戶退款成功，交易自動關閉」這類數據已經不存在了，說明已經篩選乾淨了。

2.2.2 創建模型

接下來，做者須要提取 R、F、M 的值：R（最近一次購買距今天的天數）、F（購買了幾回）和 M（平均購買金額）。

構建一張透視表，將「買家暱稱」分別拖到行位置和值位置，對「買家暱稱」進行計數彙總，也就是得出買家的消費次數，即 F 值。將「付款時間」拖到值位置，設爲最大值，將「實付金額」拖到值位置，設爲平均值，即 M 值，以下圖。

將初步透視好的數據複製到一張新的表格（選擇性粘貼「值和數字格式」）。接着處理 R 的值，因爲訂單截止日期是 2019 年 4 月 30 日，做者將建模時間設爲 2019 年 5 月 1 日，求距離 5 月 1 日這一天客戶最近一次付款時間的間隔天數，就是求每一個客戶的 R 值，以下圖。

用 RFM 的計算方式，對全部因素（R、F、M）進行 0-5 評分區段的映射。

或者用下面的公式歸一化處理（以下圖），正相關使用第一個公式，負相關使用第二個公式，R 屬於負相關，由於最近一次購買時間距越小，那麼越重要。F 和 M 都是正相關。

規範化計算也可使用 (X-Xmin)/均值(X) 和 (Xmax-X)/均值(X) ，須要注意的是，若是真實數據分佈不平均的話，均值就可能出現誤差，好比有人消費 100 萬元，有人消費 1000 元，平均數的誤差就很大。因此，可使用三分位、中位數或者（Xmax-Xmin）等方式進行歸一化。

因爲獲取的數據字段有限，沒法經過指標層獲得準則層的權重，因此直接使用 AHP 算出活躍度、忠誠度和購買力的權重，依次分別是 0.6433九、0.2828四、0.07377。得出標準化的數據以及必定權重的用戶價值，以下圖。

把 R、F、M、用戶價值按照 0、1 區分，若是大於均值爲 1，不然爲 0，獲得 16 種用戶類型，以下圖。

將用戶類型代入數據中，得出的部分結果，以下圖。

2.3 模型可視化

2.3.1 分析各種客戶佔比

對剛剛完成 RFM 模型表格進行透視，將「客戶類型」拖至行區域，再把「客戶類型」拖至值區域兩次，第一次是爲了計數，第二次是爲了查看客戶佔比，以下圖。

繪圖，更清晰的查看不一樣客戶類型的用戶數佔比，以下圖。

2.3.2 分析客戶金額佔比

對 RFM 模型表格進行透視，將「客戶類型」拖至行區域，再把「累計金額」拖至值區域兩次，第一次是爲了計算每類客戶的累計消費金額，第二次是爲了查看每類客戶的金額佔比，以下圖。

繪圖，更清晰的查看不一樣客戶類型的金額佔比，以下圖。

3 總結與建議

1）從各種客戶佔比圖中看出，次通常挽留客戶（0000）的人數最高，竟達 8725 人，人數佔比 34.52%，此類客戶近期沒有購買，購買頻次低於平均值，下單平均金額比較低，而且用戶價值也較低，大約在 2018 年雙11 下的單，屬於價格敏感性客戶，因此能夠在促銷活動（如國慶節、六一等）時試着喚醒他們。

2）次重要挽留客戶（0010），最近沒有購買商品，消費頻率較低，消費金額較大的一類客戶，有 6905 人，人數佔比 27.16%，支付金額佔比最高。換句話說，對於該商家銷售額貢獻率最高的一批客戶，下單時間遠，購買次數低，已經處於流失的邊緣，可是不一樣於次通常挽留客戶，這類客戶的平均銷售額較高。

對於這類客戶，運營人員須要獲取他們的聯繫方式，進行回訪，詢問客戶沉睡的緣由；或者說商品自己就屬於復購率低、消費金額佔比高的商品；或者從商品自己入手，試着比較客戶購買時間與商品的回購日期，是否是上次購買的商品尚未用完。

3）重要發展客戶（1011），最近購買，購買頻次低，消費金額大，用戶價值大的客戶有 2614 人，佔總人數的 20.28%，支付金額相對較高。這類客戶大體是新客戶。

對於這類客戶，運營人員近期適當的進行短信推送，優惠券發放等形式，來提升他們的購買頻率，爭取提升這類用戶的忠誠度，最終將他們轉變成重要價值客戶。

一個數據人的自留地是一個助力數據人成長的你們庭，幫助對數據感興趣的夥伴們明確學習方向、精準提高技能。關注我，帶你探索數據的神奇奧祕

一、回「數據產品」，獲取<大廠數據產品面試題>

二、回「數據中臺」，獲取<大廠數據中臺資料>

三、回「商業分析」，獲取<大廠商業分析面試題>；

四、回「交個朋友」，進交流羣，認識更多的數據小夥伴。