用戶畫像,做爲一種勾畫目標用戶、聯繫用戶訴求與設計方向的有效工具,用戶畫像在各領域獲得了普遍的應用。網絡
用戶畫像最初是在電商領域獲得應用的,在大數據時代背景下,用戶信息充斥在網絡中,將用戶的每一個具體信息抽象成標籤,利用這些標籤將用戶形象具體化,從而爲用戶提供有針對性的服務。架構
還記得年末收到的支付寶年度消費帳單嗎?幫助客戶回顧一年的消費細節,包括消費能力、消費去向、信用額度等等,再根據每位客戶的消費習慣,量身定製商品推薦列表……這一活動,將數據這個量化的詞以形象生動的表現手法推到了大衆面前。框架
這就是用戶畫像在電商領域的一個應用,隨着我國電子商務的高速發展,愈來愈多的人注意到數據信息對於電商市場的推進做用。基於數據分析的精準營銷方式,能夠最大限度的挖掘並留住潛在客戶,數據統計與分析爲電商市場帶來的突破不可估量。在大數據時代,一切皆可「量化」,看似普通的小小數字背後,蘊藏着無限商機,也正在被愈來愈多的企業所洞悉。機器學習
如何從大數據中挖掘商機?創建用戶畫像和精準化分析是關鍵。工具
用戶畫像可使產品的服務對象更加聚焦,更加的專一。在行業裏,咱們常常看到這樣一種現象:作一個產品,指望目標用戶能涵蓋全部人,男人女人、老人小孩、專家小白、文青屌絲...... 一般這樣的產品會走向消亡,由於每個產品都是爲特定目標羣的共同標準而服務的,當目標羣的基數越大,這個標準就越低。換言之, 若是這個產品是適合每個人的,那麼其實它是爲最低的標準服務的,這樣的產品要麼毫無特點,要麼過於簡陋。學習
縱覽成功的產品案例,他們服務的目標用戶一般都很是清晰,特徵明顯,體如今產品上就是專一、極致,能解決核心問題。好比蘋果的產品,一直都爲有態度、追求品質、特立獨行的人羣服務,贏得了很好的用戶口碑及市場份額。又好比豆瓣,專一文藝事業十多年,只爲文藝青年服務,用戶粘性很是高,文藝青年在這裏能找到知音,找到歸宿。因此,給特定羣體提供專一的服務,遠比給普遍人羣提供低標準的服務更接近成功。 其次,用戶畫像能夠在必定程度上避免產品設計人員草率的表明用戶。代替用戶發聲是在產品設計中常出現的現象,產品設計人員常常不自覺的認爲用戶的指望跟他們是一致的,而且還總打着「爲用戶服務」的旗號。這樣的後果每每是:咱們精心設計的服務,用戶並不買帳,甚至以爲很糟糕。大數據
在產品研發和營銷過程當中,肯定目標用戶是首要任務。不一樣類型的用戶每每有不一樣甚至相沖突的需求,企業不可能作出一個知足全部用戶的產品和營銷。所以,經過大數據創建用戶畫像是必不可少的。設計
這只是用戶畫像在電商領域的應用,事實上用戶畫像已經不知不覺的滲透到了各個領域,在當前最火的抖音,直播等領域,推薦系統在大數據時代到來之後,用戶的一切行爲都是能夠追溯分析的。3d
什麼是用戶畫像?用戶畫像是根據市場研究和數據,建立的理想中客戶虛構的表示。建立用戶畫像,這將有助於理解現實生活中的目標受衆。企業建立的人物角色畫像,具體到針對他們的目標和需求,並解決他們的問題,同時,這將幫助企業更加直觀的轉化客戶。對象
用戶畫像最重要的一個步驟就是對用戶標籤化,咱們要明確要分析用戶的各類維度,才能肯定如何對用戶進行畫像。
在創建用戶畫像上,有不少個步驟:
首先,基礎數據收集,電商領域大體分爲行爲數據、內容偏好數據、交易數據,如瀏覽量、訪問時長、傢俱偏好、回頭率等等。而金融領域又有貸款信息,信用卡,各類徵信信息等等。
而後,當咱們對用戶畫像所須要的基礎數據收集完畢後,須要對這些資料進行分析和加工,提煉關鍵要素,構建可視化模型。對收集到的數據進行行爲建模,抽象出用戶的標籤。電商領域多是把用戶的基本屬性、購買能力、行爲特徵、興趣愛好、心理特徵、社交網絡大體的標籤化,而金融風控領域則是更關注用戶的基本信息,風險信息,財務信息等等。
隨後,要利用大數據的總體架構對標籤化的過程進行開發實現,對數據進行加工,將標籤管理化。同時將標籤計算的結果進行計算。這個過程當中須要依靠Hive,Hbase等大數據技術,爲了提升數據的實時性,還要用到Flink,Kafka等實時計算技術。
最後,也是最關鍵的一步,要將咱們的計算結果,數據,接口等等,造成服務。好比,圖表展現,可視化展現,
事實上,在構建用戶畫像過程當中,注重提取數據的多元性而不是單一性,譬如針對不一樣類型的客戶提取不一樣的數據,又或者針對線上線下的客戶分析其中差別。總而言之,保證數據的豐富性、多樣性、科學性,是創建精準用戶畫像的前提。
當用戶畫像基本成型後,接下來就能夠對其進行形象化、精準化的分析。此時通常是針對羣體的分析,如能夠根據用戶價值來細分出核心用戶、評估某一羣體的潛在價值空間,以此做出針對性的產品結構、經營策略、客戶引導的調整。所以,突出研發和展現此類型的產品,又在傢俱的總體搭配展現中進行相關的主題設計,以此吸引目標人羣的關注和購買。
毫無疑問,大數據在商業市場中的運用效果已經突顯,在競爭激烈的各個行業,誰能抓住大數據帶來的優點,誰才更有機會引領行業的將來。
如今大數據應用比較火爆的領域,好比推薦系統在實踐之初受技術所限,可能要一分鐘,一小時,甚至更久對用戶進行推薦,這遠遠不能知足須要,咱們須要更快的完成對數據的處理,而不是進行離線的批處理。
如今企業對於數據的實時要求愈來愈高,已經不知足於T+1的方式,有些場景下不可能間隔一天才反饋出結果。特別是推薦,風控等領域,須要小時,分鐘,甚至秒級別的實時數據響應。並且這種秒級別響應的不僅是簡單的數據流,並且通過與離線計算同樣的,複雜的聚合分析以後的結果,這種難度其實很是大。
幸虧實時計算框架的崛起足夠咱們解決這些問題,近年來Flink,Kafka等實時計算技術的框架與技術愈來愈穩定,足夠咱們支撐這些使用場景。
在實時用戶畫像的構建中,經過對實時數據的不斷迭代計算,逐漸的不斷完善出用戶畫像的全貌,這也正符合數據傳輸的本質,這總體架構中,淡化離線計算在以前特別重的做用,只留作歸檔和歷史查詢使用,更多的數據經過實時計算進行輸出,最終達到對用戶畫像的目的。
在實時計算的過程須要對數據實時聚合計算,而複雜的標籤也須要實時的進行機器學習,難度巨大,可是最終對於畫像的實時性有着重大的意義。
本文介紹了用戶畫像的簡介與實時用戶畫像的重要意義,可是用什麼技術架構能夠支撐這些想法的實現呢?
下一章,咱們將探討項目總體架構的設計與實現,未完待續~
參考文獻
《用戶畫像:方法論與工程化解決方案》
更多實時數據分析相關博文與科技資訊,歡迎關注 「實時流式計算」