用戶畫像知識

用戶畫像相關知識點算法

一、用戶畫像是什麼?架構

用戶畫像(User Profile),用戶信息標籤化大數據

用戶畫像有不少的的標籤組成,每一個標籤都規定了觀察、認識、描述用戶的角度。標籤根據企業業務的發展狀況,或多或少,對外而言都是一個總體,這個總體稱之爲用戶畫像。搜索引擎

 

二、爲何須要用戶畫像?url

用戶畫像的核心工做是爲用戶打標籤,打標籤的重要目的之一是爲了讓人可以理解而且方便計算機處理。spa

大數據處理,離不開計算機的運算,標籤提供了一種便捷的方式,使得計算機可以程序化處理與人相關的信息,甚至經過算法、模型可以「理解」 人。當計算機具有這樣的能力後,不管是搜索引擎、推薦引擎、廣告投放等各類應用領域,都將能進一步提高精準度,提升信息獲取的效率。設計

用戶畫像的本質就是從業務角度出發對用戶進行分析,瞭解用戶需求,尋找目標客戶。3d

 

三、用戶畫像怎麼設計?blog

一個標籤一般是人爲規定的高度精煉的特徵標識索引

三、1 數據源分析

構建用戶畫像是爲了還原用戶信息,所以數據來源於:全部用戶相關的數據。

對於用戶相關數據的分類,引入一種重要的分類思想:封閉性的分類方式

這樣的分類方式,有助於後續不斷枚舉並迭代補充遺漏的信息維度。沒必要擔憂架構上對每一層分類沒有考慮完整,形成維度遺漏留下擴展性隱患。另外,不一樣的分類方式根據應用場景,業務需求的不一樣,也許各有道理,按需劃分便可。

  3.1.1 靜態信息數據     

      用戶相對穩定的信息。

  3.1.2 動態信息數據   

      用戶不斷變化的行爲信息。

      在互聯網上,用戶行爲,能夠看做用戶動態信息的惟一數據來源。

3.2 目標分析

用戶畫像的目標是經過分析用戶行爲,最終爲每一個用戶打上標籤,以及該標籤的權重。

3.3 數據建模方法

如何根據用戶行爲,構建模型產出標籤、權重一個事件模型包括:時間、地點、人物三個要素。每一次用戶行爲本質上是一次隨機事件,能夠詳細描述爲:什麼用戶,在什麼時間,什麼地點,作了什麼事

  3.3.1 什麼用戶   

      關鍵在於對用戶的標識,用戶標識的目的是爲了區分用戶、單點定位。

  3.3.2 什麼時間     

      時間包括兩個重要信息,時間戳+時間長度。

      時間戳,爲了標識用戶行爲的時間點。

      時間長度,爲了標識用戶在某一頁面的停留時間。

  3.3.3 什麼地點   

      用戶接觸點,Touch Point。對於每一個用戶接觸點。潛在包含了兩層信息:網址 + 內容。

  3.3.4 什麼內容

      每一個url網址(頁面/屏幕)中的內容。  

      對於每一個互聯網接觸點,其中網址決定了權重;內容決定了標籤。

  3.3.5 什麼事  

      用戶行爲類型,對於電商有以下典型行爲:瀏覽、添加購物車、搜索、評論、購買、點擊贊、收藏 等等。     

      不一樣的行爲類型,對於接觸點的內容產生的標籤信息,具備不一樣的權重。

 

用戶畫像的數據模型,能夠歸納爲下面的公式:用戶標識 + 時間 + 行爲類型 + 接觸點(網址+內容),某用戶由於在什麼時間、地點、作了什麼事。因此會打上**標籤。

用戶標籤的權重可能隨時間的增長而衰減,所以定義時間爲衰減因子r,行爲類型、網址決定了權重,內容決定了標籤,進一步轉換爲公式:

標籤權重=衰減因子×行爲權重×網址子權重

如:用戶A,昨天在品尚紅酒網瀏覽一瓶價值238元的長城乾紅葡萄酒信息。

標籤:紅酒,長城

時間:由於是昨天的行爲,假設衰減因子爲:r=0.95

行爲類型:瀏覽行爲記爲權重1

地點:品尚紅酒單品頁的網址子權重記爲 0.9(相比京東紅酒單品頁的0.7

假設用戶對紅酒出於真的喜歡,纔會去專業的紅酒網選購,而再也不綜合商城選購。

則用戶偏好標籤是:紅酒,權重是0.95*0.7 * 1=0.665,即,用戶A:紅酒 0.665、長城 0.665

 

四、用戶畫像怎麼開發?

 

五、用戶畫像工做堅持的原則(金融企業)

金融企業是最先開始用戶畫像的行業。

事實上,用戶畫像涉及數據的緯度須要業務場景結合,既要簡單幹練又要和業務強相關,既要篩選便捷又要方便進一步操做。用戶畫像須要堅持三個原則,分別是人口屬性和信用信息爲主強相關信息爲主定性數據爲主

5.1 信用信息和人口屬性爲主

描述一個用戶的信息不少,信用信息是用戶畫像中重要的信息,信用信息是描述一我的在社會中的消費能力信息。

定位完目標客戶以後,金融企業須要觸達客戶,人口屬性信息就是起到觸達客戶的做用,人口屬性信息包含姓名、性別,電話號碼,郵件地址,家庭住址等信息。這些信息能夠幫助金融企業聯繫客戶,將產品和服務推銷給客戶。

5.2 採用強相關信息,忽略弱相關信息

強相關信息就是同場景需求直接相關的信息,其能夠是因果信息,也能夠是相關程度很高的信息。

5.3 將定量的信息歸類爲定性的信息

用戶畫像的目的是爲產品篩選出目標客戶,定量的信息不利於對客戶進行篩選,須要將定量信息轉化爲定性信息,經過信息類別來篩選人羣。

例如能夠將年齡段對客戶進行劃分,18-25歲定義爲年輕人,25-35歲定義爲中青年,36-45定義爲中年人等。能夠參考我的收入信息,將人羣定義爲高收入人羣,中等收入人羣,低收入人羣。

5.4 用戶畫像的方法介紹,不要太複雜

金融企業須要結合業務需求進行用戶畫像,從實用角度出發,咱們能夠將用戶畫像信息分紅五類信息。分別是人口屬性,信用屬性,消費特徵,興趣愛好,社交屬性。

  5.4.1 人口屬性

  5.4.2 信用屬性

  5.4.3 消費特徵

  5.4.4 興趣愛好

5.5 金融企業用戶畫像的基本步驟

  5.5.1 畫像相關數據的整理和集中

  5.5.2 找到同業務場景強相關數據

  5.5.3 對數據進行分類和標籤化(定量to定性)

  5.5.4 依據業務需求引入外部數據

  5.5.5 按照業務需求進行篩選客戶(DMP(大數據管理平臺)的做用)

相關文章
相關標籤/搜索