個數是如何用大數據作行爲預測的?

「個數」是「個推」旗下面向 APP 開發者提供數據統計分析的產品。「個數」經過可視化埋點技術及大數據分析能力從用戶屬性、渠道質量、行業對比等維度對 APP 進行全面的統計分析。算法

「個數」不只能夠及時統計用戶的活躍、新增等,還能夠分析卸載用戶的成分、流向,此外還能實現流失、付費等用戶關鍵行爲的預測,從而幫助 APP 開發者實現用戶精細化運營和全生命週期管理。其中很值得一提的是,「個數」在「可視化埋點」及「行爲預測」方面的創新,爲 APP 開發者在實際運營中帶來了極大便利,因此,在下文中,咱們也將圍繞這兩點作詳細的分析。數據庫


可視化埋點

埋點是指在產品流程的關鍵部位植入相關統計代碼,以追蹤用戶行爲,統計關鍵流程的使用程度,並將數據以日誌的方式上報至服務器的過程。服務器

目前,數據埋點採集模式主要有代碼埋點、無埋點、可視化埋點等方式。工具

「代碼埋點」是指在監控頁面上加入基礎 js,根據需求添加監控代碼,它的優勢是靈活,能夠自定義設置,能夠選擇本身須要的數據來分析,但對複雜網站來講,每次修改一個頁面就得從新出一份埋點方案,成本較大。目前,採用這種埋點方案的表明產品有百度統計、友盟、騰訊雲分析、Google Analytics 等。學習

「可視化埋點」一般是指開發者經過設備鏈接用戶行爲分析工具,直接在數據接入管理界面上對可交互且交互後有效果的頁面元素(如:圖片、按鈕、連接等)進行操做實現數據埋點,下發採集代碼生效回數的埋點方式。目前,可視化埋點的表明產品有個數、Mixpanel、神策數據等。測試

「無埋點」與「全埋點」類似,它的原理是「所有采集,按需選取」,也就是說它能夠對頁面中全部交互元素的用戶行爲進行採集,它是先儘量多收集檢測頁面的內容,而後再經過界面配置決定分析哪些數據,但它是標準化採集,若是須要設置自定義的採集方式仍須要代碼埋點助力。這種方案的表明產品有 GrowingIO、數極客、百度統計等。大數據

「個數」爲何會選用可視化埋點?

當下移動互聯網正處於高速發展且發展形勢瞬息萬變的階段中,開發者須要及時根據大數據的分析、反饋,對業務功能等作出調整,在傳統的操做模式中,若是想要了解不一樣節點的數據,就要修改相應代碼裏面的埋點,而後測試發佈,以後再在應用商店審覈、上線,整個週期可能長達幾個星期,這顯然沒法知足業務的需求。因此,「個數」採用的「可視化埋點」技術就是爲了幫助開發者解決這個問題的。優化

「個數」的可視化埋點靈活、方便,不需對數據追蹤點添加任何代碼,使用者只須要經過設備鏈接管理臺,對頁面可埋點的元素圈圈點點,便可添加隨時生效的界面追蹤點,同時在數據採集模式及數據分析能力上,「個數」可以提供給開發者們準確的、有效的數據。網站

可視化埋點主要具備如下特性:spa

  • 零代碼,無需代碼,節省成本
  • 免更新,新增便捷,無需升級
  • 易測試,圈選測試,實時呈現

換而言之,可視化埋點不只能夠節約企業成本,還能夠提升開發人員和運營人員的工做效率。


行爲預測

「個數」的行爲預測主要包括流失預測、卸載預測、付費預測等,它的原理是基於 App 歷史行爲數據構建算法模型預測用戶關鍵行爲,從而幫助開發者達到用戶精細化運營和全生命週期管理的目的。

在這裏須要注意的是,「個數」的行爲預測與電商平臺經常使用的個性化推薦不一樣,後者主要是基於用戶近期的行爲,如瀏覽記錄、購買記錄而分析出用戶可能須要的東西,而「個數」是基於 App 各渠道卸載數、卸載趨勢等指標的綜合分析,更多的是對人羣的聚類分析,而非僅僅基於我的的行爲。

行爲預測的步驟

據「個推」大數據科學家朱金星介紹,「個數」的行爲預測主要分爲如下幾個步驟:

一、找樣本,主要從歷史數據庫中抽取;

二、特徵抽取,將用戶與數據庫打通,作匹配;

三、特徵篩選,保留相關性高的或有價值的特徵;

四、模型訓練,將保留下來的特徵放到模型中訓練,在模型的選用上,「個數」主要用了邏輯迴歸,邏輯迴歸的模型相對深度學習等其餘模型來講,簡單一些,並且在特徵篩選上相對好處理,獲得的結果好解釋,也相對穩定。

五、參數優化,根據效果進行調整,若是結果不理想,便可返回調整參數從新走一次以上流程。

實例分析

下面咱們以付費預測爲例,爲你們梳理一下具體的實現過程。

個數付費預測的流程主要包括如下幾點:

一、目標問題分解

明確須要進行預測的問題即付費預測,以及將來一段時間的跨度。

二、分析樣本數據

(1)提取出全部用戶的歷史付費記錄;

(2)分析付費記錄,瞭解付費用戶的構成,好比年齡層次、性別、購買力和消費的產品類別等;

(3)提取非付費用戶的歷史數據,這裏能夠根據產品的需求,添加條件、或無條件地進行提取,好比提取活躍而且非付費用戶,或者不加條件地直接進行提取;

(4)分析非付費用戶的構成。

三、構建模型的特徵

(1)原始的數據可能可以直接做爲特徵使用;

(2)有些數據在變換後,纔會有更好的使用效果,好比年齡,能夠變換成少年、中年、老年等特徵;

(3)交叉特徵的生成,好比「中年」和「女性」兩種特徵,就能夠合併爲一個特徵進行使用。

四、計算特徵的相關性

(1)計算特徵飽和度,進行飽和度過濾;

(2)計算特徵 IV、卡方等指標,用以進行特徵相關性的過濾。

五、選用邏輯迴歸進行建模

(1)選擇適當的參數進行建模;

(2)模型訓練好後,統計模型的精確度、召回率、AUC 等指標,來評價模型;

(3)若是以爲模型的表現能夠接受,就能夠在驗證集上作驗證,驗證經過後,進行模型保存和預測。

六、預測

加載上述保存的模型,並加載預測數據,進行預測。

七、監控

最後,運營人員還須要對每次預測的結果進行關鍵指標監控,及時發現並解決出現的問題,防止出現意外狀況,致使預測無效或預測結果出現誤差。

其餘場景如流失預測、卸載預測等,在流程上與付費預測相似,因此在這裏就再也不一一介紹了。

有了精準的行爲預測,運營者則能夠將運營目標進行拆分、細化,具體到每一個場景、每一個流程,針對不一樣用戶採起不一樣的推廣渠道、運營策略。例如基於流失預測,運營者可以提早洞察到用戶流失行爲,提前進行干預,經過個性化內容推薦、消息推送等運營手段對即將流失的用戶進行挽留,從而下降流失率。總的來講,在大數據行爲預測的幫助下,運營者可以更及時、更全面地瞭解用戶,從而達到精細化運營的目的。


關於將來

接下來「個數」還將在商品推薦等領域作更多的探索,例如開發精準的推薦技術等,也會不斷挖掘大數據的潛力,結合反饋的數據作進一步的優化,圍繞客戶提供的樣本數據作更深刻的訓練學習等,爲開發者提供更全面的大數據服務,你們敬請期待。

相關文章
相關標籤/搜索