大數據時代,如何構建精準用戶畫像,直擊精細化運營

移動互聯網時代,精細化運營逐漸成爲企業發展的重要競爭力,「用戶畫像」的概念也應運而生。用戶畫像是指,在大數據時代,企業經過對海量數據信息進行清洗、聚類、分析,將數據抽象成標籤,再利用這些標籤將用戶形象具體化的過程。用戶畫像的創建可以幫助企業更好地爲用戶提供針對性的服務。android

與之相應,愈來愈多的第三方大數據公司,也開始依託自身的數據積累,爲客戶提供用戶畫像的服務。好比個推旗下的用戶畫像產品,可以對用戶線上和線下行爲進行大數據分析,幫助APP開發者和運營者構建全面、精準、多維的用戶畫像體系。下文將以個推用戶畫像產品爲例,詳解「用戶畫像」的技術特色和使用價值。ios

用戶畫像的造成須要經歷四個過程,數據積累、數據清洗、數據建模分析、數據產出。其中,數據清洗和數據建模統稱數據處理。在通過數據處理以後,個推產出獨特的冷、熱、溫數據維度,並分析用戶的線上興趣偏好和線下行爲場景,造成用戶畫像。算法

1、用戶畫像用了哪些技術?服務器

在數據處理階段,個推用戶畫像產品的大數據計算架構採用了Kafka分佈式發佈訂閱消息系統,具備高吞吐量、高穩定性的特色。數據清洗可利用HADOOP、SPARK來實現設備惟一性識別、行爲數據的清洗等,去除冗餘數據。這一過程支持交互計算和多種複雜算法,並支持數據實時/離線計算。架構

在數據建模的過程當中,個推用戶畫像產品主要利用了機器學習中的聚類(無監督學習)和深度學習技術,讓模型對用戶行爲數據主動學習,進行行爲判斷,由此產出用戶標籤。機器學習

通過數據的清洗和建模,個推用戶畫像會造成冷數據畫像、溫數據回溯、熱數據場景和定製化標籤四種畫像。分佈式

冷數據畫像,是指基於大數據的分析得出的用戶屬性,相對比較穩定,如用戶的年齡層次、性別、常駐地等。「溫數據」則能夠回溯用戶近期活躍的線上和線下場景,具備必定的時效性。「熱數據」是指用戶當下的場景及實時的用戶特徵,幫助APP運營者抓住稍縱即逝的營銷機會。定製化標籤是將個推數據與第三方數據結合起來,共同建模得出具備價值的特徵標籤。學習

2、如何構建用戶畫像?測試

「用戶畫像」的構建須要技術和業務人員的共同參與,以免形式化的用戶畫像。個推構建用戶畫像時流程以下:大數據

(1)標籤體系設計。開發者須要先了解自身的數據,肯定須要設計的標籤形式。

(2)多數據源數據融合。在建設用戶畫像時,個推會整合自有海量數據以及該APP自身的數據。

(3)實現用戶統一標識。多數狀況下,APP的衆多用戶分佈於不一樣的帳號體系中,個推會將其統一標識,幫助APP打通帳號,實現信息快速共享。

(4)用戶畫像特徵層構建。即將每個數據進行特徵化。

(5)畫像標籤規則+算法建模。二者缺一不可,在實際的應用中,算法難以解決的問題,利用簡單的規則也能夠達到很好的效果。

(6)利用算法對全部用戶打標籤。

(7)畫像質量監控。在實際的應用中,用戶畫像會產生必定的波動,爲了解決這個問題,個推建設了相應的監控系統,對畫像的質量進行監控。

總之,個推用戶畫像構建的總體流程,能夠歸納爲三個部分:

第一,基礎數據處理。基礎數據包括用戶設備信息、用戶的線上APP偏好以及線下場景數據等。

第二,畫像中間數據處理。處理結果包括線上APP偏好特徵和線下場景特徵等。

第三,畫像信息表。表中應有四種信息:設備基礎屬性;用戶基礎畫像,包括用戶的性別、年齡層次、相關消費水平等;用戶興趣畫像,即用戶更有興趣的方向,好比用戶更偏好拼團類APP仍是海淘類APP;用戶其它畫像等。

在個推用戶畫像構建的過程當中,機器學習佔據了較爲重要的位置。機器學習主要應用在海量設備數據整理、數據清洗、數據存儲的過程當中。

3、用戶畫像能作什麼?

用戶畫像對電商類、新聞資訊類APP的做用不言而喻,能夠幫助APP打造精準推薦系統,實現千人千面的運營。

基於用戶特徵的個性化推薦

APP的運營者能夠經過個推用戶畫像提供的性別、年齡層次、興趣愛好等標籤,分別展現不一樣的內容給用戶,以達到精準化運營的目的。

基於用戶特徵指導內容推薦

基於用戶特徵指導內容的推薦是指找到與目標羣體類似的用戶羣,並利用該類似用戶羣的行爲特徵對目標用戶進行內容推薦,具體過程以下圖:

在實現這一內容推薦的過程當中,類似性建模技術起着不可忽視的做用。類似性建模可類比於聚類建模,是無監督學習中的一種。它能夠尋找數據中的特徵,把具備相同特徵的數據彙集在一組,並賦予這些彙集在一塊兒的數據相同的特徵標籤。根據這些特徵標籤,尋找具備這些特性的用戶,給他們推送相同的內容。

這種推薦方式的優勢是,它的自有特徵是通過APP長期積澱而來,顆粒度更細,適用性更強,對用戶的認識更全面,效果能持續提高。並且它還能針對APP所處行業與自身需求,量身定製匹配算法,讓推薦更精準。

此外,個推用戶畫像可以結合第三方數據作定製化建模,經過雙方共同建模得出顯著價值和特徵標籤。這種標籤增補的方式不只能保證推送的內容更精準,同時也能夠很大程度地提高流量價值。

4、開發者如何接入?

個推用戶畫像SDK的接入主要有兩個方式:

• SDK集成:客戶端集成個推用戶畫像SDK,進行初始化SDK後,返回給客戶一個ID即GIUID(惟一身份標識), 此ID須要由客戶端提交到客戶服務器,而後服務器經過API接口傳入GIUID進行查詢用戶畫像標籤數據。

• API接口調用:客戶將應用名稱、包名及服務端出口IP提供後,返回APP ID等相關信息。客戶根據《個推用戶畫像數據服務接口文檔》及《用戶畫像編碼表》集成測試後方可調用API接口查詢畫像信息。

具體的集成文檔參見如下連接:

Android:http://docs.getui.com/gexiang/start/android/

iOS:http://docs.getui.com/gexiang/start/ios/

服務端:http://docs.getui.com/gexiang/start/server/

瞭解用戶,是爲了更好地服務用戶。正是APP開發者和運營者對用戶認知的渴求促生了用戶畫像。而APP開發者只有把用戶的需求放在最重要的位置,才能更好地優化用戶的體驗,留住用戶。接入個推畫像SDK,不只能夠幫助開發人員提升開發決策的效率,也能夠幫助APP運營人員開展精細化運營,從而提高企業的營銷效率和市場競爭力。

相關文章
相關標籤/搜索