數據應用場景之標籤管理體系

1、標籤簡介

標籤概念java

標籤,最初用來對實物進行分類和標記,例如標明物品的品名、重量、體積、用途等簡要信息。後來逐漸流行到數據行業,用來標記數據,對數據快速分類獲取和分析。git

標籤特色github

精確描述定位和搜索,具備生命週期的特性,能夠計算,配置和規則化處理。能夠用標籤來描述各類結構和非結構化[文檔、圖片、視頻等]的數據,從而使這些內容被高效的管理。算法

  • 描述特徵:標籤[手機顏色],特徵[紅色,白色];
  • 描述規則:標籤[活躍用戶],規則[每日登錄,產生交易];

標籤價值spring

  • 精細運營的基礎,有效提升流量精準和效率。
  • 幫助產品快速定位需求數據,進行精準分析;
  • 能幫助客戶更快切入到市場週期中;
  • 深刻的預測分析數據並做出及時反應;
  • 基於標籤的開發智能推薦系統;
  • 基於某類下的數據分析,洞察行業特徵;

標籤的核心價值,或者說最經常使用的場景:實時智能推薦,精準化數字營銷。編程

2、標籤訂義

屬性標籤設計模式

屬性標籤是描述基本特徵,不須要行爲產生,也不是基於規則引擎分析,例如基於用戶實名認證信息,獲取:性別,生日,出生日期等特徵。變更頻率極小,且精準性較高。數據結構

行爲標籤架構

經過不一樣業務渠道埋點,捕捉用戶的行爲數據,基於這些數據分析,造成結果描述的標籤,例如:分析用戶「網購平臺」,獲得的結果拼多多,淘寶,京東,天貓等。這些都是須要經過行爲數據來判斷的標籤。併發

規則標籤

規則下分析出來的標籤,更可能是基於產品或者運營角度來看,例如電商平臺須要對會員等級超過5級,且近7天活躍的會員發一次福利,這裏就涉及兩個標籤應用:1.「會員等級」基於什麼規則判斷;2.「近7天活躍」如何判斷,是基於登陸,仍是產生交易行爲,這些都要能夠動態配置,而後基於規則引擎把結果生成。基於動態的規則配置,通過計算和分析,生成描述的標籤,也就是規則標籤。

擬合標籤

擬合類標籤極具複雜性,經過對多種標籤智能組合分析,給出預測描述,或者直接給出進階定義,例如所謂的讀心術,即經過多個特徵,眼神信息,判斷人的心理活動。在機器學習中有一句話:經過長期對用戶行爲的判斷和學習,機器可能比用戶還了解用戶。

3、標籤管理體系

層級分類

標籤管理的基本手段,一般以行業來分:金融,教育,娛樂等;經過多級分類細化管理。

基礎標籤

即數據的關鍵標籤,特色精確扁平,不可再細分,用來精確的描述數據,相似元數據。當使用多個標籤組合描述數據特徵,就會造成結構化的表管理。

標籤值類型

值類型:數字,字典,布爾,日期,文本框,自定義等,是對標籤具體值的管理。例如標籤「性別」,標籤值「男.女.未知」,這種典型經過羅列字典來描述的場景。

4、標籤生產流程

一、基礎流程

數據採集

數據採集的渠道相對較多,好比同一APP內的各類業務線:購物、支付、理財、外賣、信息瀏覽等等。經過數據通道傳輸到統一的數據聚合平臺。有了這些海量日誌數據的支撐,才具備數據分析的基礎條件。不論是數據智能,深度學習,算法等都是創建在海量數據的基礎條件上,這樣才能獲取具備價值的分析結果。

數據加工

結合如上業務,經過對海量數據的加工,分析和提取,獲取相對精準的用戶標籤,這裏還有關鍵的一步,就是對已有的用戶標籤進行不斷的驗證和修復,尤爲是規則類和擬合類的相關標籤。

標籤庫

經過標籤庫,管理複雜的標籤結果,除了複雜的標籤,和基於時間線的標籤變,標籤數據到這裏,已經具備至關大的價值,能夠圍繞標籤庫開放一些收費服務,例如常見的,用戶在某電商APP瀏覽某些商品,能夠在某信息流平臺看到商品推薦。大數據時代就是這麼使人感受智能和窒息。

標籤業務

數據走了一大圈轉換成標籤,天然仍是要回歸到業務層面,經過對標籤數據的用戶的分析,能夠進行精準營銷,和智能推薦等相關操做,電商應用中能夠提升成交量,信息流中能夠更好的吸引用戶。

應用層

把上述業務開發成服務,集成到具備的應用層面,不斷提高應用服務的質量,不斷的吸引用戶,提供服務。固然用戶的數據不斷在應用層面產生,在轉到數據採集服務中,最終造成完整的閉環流程。

二、數據聚合池

  • 基於IDmapping技術,置換惟一標識[uid];
  • 基於uid關聯標籤,放入計算池;
  • 相同的uid攜帶的標籤會以貪吃蛇的方式運行;
  • 不斷豐富該uid下攜帶的標籤內容;

以此方式豐富標籤的場景,產生更大的數據價值;

5、源代碼地址

GitHub·地址
https://github.com/cicadasmile
GitEE·地址
https://gitee.com/cicadasmile

數據洞察系列文章

序號 標題
01 數據分析:基於智能標籤,精準管理數據
02 數據分析:數據可視化圖表,BI工具構建邏輯
03 數據分析:複雜業務場景下,量化評估流程

推薦閱讀:編程體系整理

序號 項目名稱 GitHub地址 GitEE地址 推薦指數
01 Java描述設計模式,算法,數據結構 GitHub·點這裏 GitEE·點這裏 ☆☆☆☆☆
02 Java基礎、併發、面向對象、Web開發 GitHub·點這裏 GitEE·點這裏 ☆☆☆☆
03 SpringCloud微服務基礎組件案例詳解 GitHub·點這裏 GitEE·點這裏 ☆☆☆
04 SpringCloud微服務架構實戰綜合案例 GitHub·點這裏 GitEE·點這裏 ☆☆☆☆☆
05 SpringBoot框架基礎應用入門到進階 GitHub·點這裏 GitEE·點這裏 ☆☆☆☆
06 SpringBoot框架整合開發經常使用中間件 GitHub·點這裏 GitEE·點這裏 ☆☆☆☆☆
07 數據管理、分佈式、架構設計基礎案例 GitHub·點這裏 GitEE·點這裏 ☆☆☆☆☆
08 大數據系列、存儲、組件、計算等框架 GitHub·點這裏 GitEE·點這裏 ☆☆☆☆☆
相關文章
相關標籤/搜索