零售數據觀(一):如何花30分鐘成爲一個標籤設計「達人」

做者簡介:鐵叫獸,10年+數據相關經驗,曾在電信、阿里從事過DBA,數倉,解決方案,目前從事零售行業的解決方案。算法

序言:是否碰到大量的人力投入基於流程管理的信息化系統建設,也運行了好幾年了,同時大數據也熱了好幾年了,但企業IT部門仍是無從下手,既不確信大數據是否能夠真的帶來業務價值也不清楚從哪着手更容易推進大數據項目落地,本文就是經過「標籤」,一種基於具體業務場景但同時又是業務人員看的懂的數據的方式,幫助企業從點作起,按部就班,讓大數據真正落地。數據庫

1、什麼是OLP

  1. 什麼是OLP模型

OLP是Object-Link-Perperty的縮寫,Object表明業務場景中的實體,能夠是「人」(如會員、零售商)也能夠是「物」(如商品、店鋪);Link 是表明業務場景中的「關係」,關係分爲行爲關係和事實關係,用戶「購買」商品,其中「購買」就是一種行爲關係,貨架「屬於」門店,其中「屬於」是一種事實關係;而Perperty則表明實體和關係上的屬性,如「會員」(人)有年齡、手機號、性別等屬性,「門店」(物)有地址、所在城市等屬性,「購買」(關係)有支付時間,支付形式等屬性。大數據

!優化

企業每每能夠根據自身業務系統的建設狀況逐步完善OLP模型,它是識別大數據場景和標籤設計的基礎。設計

2、如何識別大數據場景

  1. 什麼是大數據場景

大數據場景目前分兩類,一類是優化原來的業務流程,提升效率,變得更加智能(如讓信息推送變爲「智能」,作到個性化推送,從而提高ROI),第二類是創造新的業務流程,讓之前不敢嘗試的業務能夠實現(如小額貸款,之前是由於風險沒法得知從而不敢嘗試,經過採購商或零售商的數據化而後建模就能夠逐步嘗試)。此篇文章中的大數據場景識別僅針對第一類狀況。blog

  1. 如何識別

既然是優化原來的業務流程,那就重點關注能夠產生變化的「關係」(人和物沒法改變),主要判斷OLP模型的「行爲關係」看是否能從時間或空間維度用大數據的能力進行優化,如上圖中所描述的「購買」和「上架」行爲關係。那「購買」是不是大數據場景,答案是「否」,由於從時間維度能夠經過對商品經過RFID的技術作到無人門店從而改善用戶的購買效率,但所用技術並非大數據範疇。但,是否讓「上架」變的更加智能,答案是「是」,從時間維度,不一樣城市,不一樣門店類型,對於什麼商品什麼時間上架徹底能夠基於大數據的智能決策,是能夠幫助門店或零售商合理的安排庫存結構,同時還能夠對「上架」進行空間維度的優化,如商品的擺放位置,具體這裏就不展開了。接下來咱們讓上圖的OLP模型變的更加複雜一點。get

(OLP示意圖)社區

咱們找出行爲關係,從時間和空間維度上考慮是否能夠是大數據場景:效率

1)購買:不是基礎

2)上架:是,用數據來決策什麼時候上架

3)推送:是,不一樣用戶推送不一樣的信息,智能推送

4)點擊:不是

5)存儲:不是

6)入庫:是,什麼商品什麼時候入庫從而優化庫存結構

可是須要注意一點,脫離業務場景討論「關係」,看是不是大數據場景是不合理的,好比購買,如一服裝加盟商因某些緣由,須要再次購買(採購)商品(中央庫存足夠的狀況下),那何時購買,就能夠用上大數據的能力。有了數據場景,接下來討論下如何構建「標籤」。

3、如何構建標籤

  1. 什麼是標籤

標籤是業務人員看的懂的數據,可分爲原始標籤、統計標籤和算法標籤。

  1. 如何構建

第一個原則,標籤設計是面向大數據場景的,好比上文提到中的「推送」,那如今就對「推送」關係相關聯的「活動」和「用戶」作爲維度進行標籤設計, 這裏主要介紹以「用戶」作爲舉例。實體和關係上的屬性是標籤設計的基礎。

(簡化後的示意圖)

經過用戶的屬性所生成的標籤:性別、手機號;根據購買關係所生成的標籤:支付形式偏好、購買時間段偏好,消費金額,消費筆數;根據商品屬性所生成的標籤:風格偏好、材質偏好、顏色偏好;根據展架屬性所生成的標籤:商品擺放位置偏好;根據線下門店屬性所生成的標籤:所屬城市,在上面標籤設計過程,其實引入了第二個原則,實體和關係的屬性是可傳遞的,好比實體「線下門店」的屬性是能夠來描述實體「用戶」的,這很關鍵,這樣的思惟方式能夠保證在設計標籤時,被描述的實體維度會足夠的完整。你們還會發現爲啥標籤「商品擺放位置偏好」標註爲灰色,由於根據原則一,它對「推送」場景沒有意義(目前是否有用,仍是靠經驗,你們若是有其餘想法能夠一塊兒來探討),有了這類標籤後,就能夠對標籤進行業務上的「衍生」,好比,平均消費金額(消費金額/消費筆數)、消費水平(參考因子:所屬城市、消費金額、消費筆數等),最後在業務衍生的基礎上考慮時間維度:好比最新3個月消費金額,工做日消費金額,這是第三原則,可對標籤在業務上和時間上進行「衍生」。

各位還記得標籤的分類,那上面所描述的「性別」、」手機號「和「所屬城市」就屬於原始標籤(和業務數據庫存的同樣),「支付形式偏好」、「消費筆數」和「材質偏好」等就屬於統計標籤,「消費水平」就屬於算法標籤。

4、如何使用

在上文討論的「推送」場景下,店長就能夠自由選擇標籤,經過設置各類標籤值範圍人羣圈選,進行個性化推送,好比,最近上線幾款全棉的高端上衣,店長就能夠在系統中設置條件(最近三個月消費金額>’2000’ and 材質偏好=‘棉’),可定義爲"全棉高端消費人羣」,而後進行短信或者公衆號對這類人羣進行推送。業務人員經過標籤設置各類標籤值範圍咱們常把這種操做爲人羣洞察。

5、總結

經過以上的介紹,相信各位對如何標籤設計有了個大體的理解(建議讀兩遍),但標籤設計很是考驗對業務的理解和對數據的感受,須要日積月累,固然也能夠加速這個過程,好比選擇數瀾科技的數據諮詢服務。

想了解更多內容可訪問數瀾社區——國內首個數據中臺交流社區(https://bbs.dtwave.com/)

相關文章
相關標籤/搜索