網站數據分析(9)—— 流量運營分析模型

本章的分析模型圍繞流量數據化運營展開,主要包括:流量波動檢測、渠道特徵聚類、廣告整合傳播模型、流量預測模型。數組

1、流量波動檢測

在廣告流量結構中,有幾類流量是相對穩定而且效果較好的,例如導航類流量(例如360導航)、品牌專區流量(例如百度品牌區)、品 牌關鍵字(例如百度品牌關鍵字)、SEO流量(例如百度SEO流量)。這些流量雖然會受到企業廣告預算的影響,但通常狀況下只要廣告預算足夠,企業是不會主動撤銷對於這幾類流量渠道的費用支持。瀏覽器

對這幾類廣告渠道能夠經過廣告流量波動模型進行監測,該模型能夠對具備相對穩定或具備必定時間規律特徵的數據作檢測分析。在以前的異常檢測類模型中,咱們提到了監督式和非監督式兩種,這裏介紹一種相對傳統的基於時間序列的異常檢測方法。bash

基於時間序列的異常檢測方法與其餘異常檢測方法最顯著的特徵是數據之間具備明顯的時間前後次序,而且每一個數據都有時間維度且按時間排列。與時間序列分析相似,在作檢測應用時的總體流程都須要對時間週期數據作檢驗、差分並進行擬合,不一樣之處在於預測的結果數據中咱們能夠定義上下限的置信區間,若是真實值超出置信區間那麼就意味着數據波動異常。服務器

步驟實現該方法:cookie

  • 步驟1:數據讀取和預處理,主要是將字符串轉換爲時間格式。
  • 步驟2:數據穩定性、白噪聲檢驗和預處理。
  • 步驟3:時間ARIMA或ARMA對時間序列數據擬合,找到最佳PDQ或QP參數值以及對應fit(訓練時)的最佳模型結果對象。
  • 步驟4:基於最佳模型結果對象選擇應用forecast方法作預測(而不是predict方法),並設置以下關鍵參數:
    • steps:整數型,要預測的時間序列點以外的數據數,例如設置step=6的效果與predict方法中設置predict(start='2019-07-28',end='2019-08-02')的週期是相同的。
    • alpha:浮點型,設置具體置信區間範圍,置信區間值設置爲(1-alpha)%,例如設置alpha=0.05會計算在95%置信區間下的範圍值。

例如使用forecast(steps=6,alpha=0.05)後返回的結果以下:併發

(array([ 183.03624893, 124.61319468, 134.67763687, 143.22815918, 111.08688519, 113.70161409]), 
 array([ 40.80850407, 43.94083939, 46.60465652, 50.11657005, 50.13881589, 50.13929372]), 
 array([[ 103.0530507 , 263.01944716], [ 38.49073202, 210.73565733], [ 43.33418858, 226.02108516], [ 45.00148685, 241.45483152], [ 12.81661182, 209.35715855], [ 15.43040419, 211.97282398]]))
複製代碼

結果包括三個數組:工具

  • 第一個數組是預測值,跟使用predict方法獲得的結果相同。
  • 第二個數組是預測值的標準差。
  • 第三個數組是預測值的置信區間的上下限,是一個二維數組。基於第三個數組能夠定義出正常波動範圍的上下限,若是超出該範圍則能夠認定爲異常波動。

除了能夠應用到廣告流量的異常波動檢測外,該模型還能夠應用到流量運營中的網站重點內容的檢測,例如首頁、幫助中心、購物車流程頁等,這些頁面一般相對來說從流量來源結構、用戶訪問特徵等方面的特徵相對穩定,也能夠作流量波動性檢測。優化

2、渠道特徵聚類

當企業投放衆多廣告媒體時,第一次對如此衆多的媒體多特徵分析可能無從下手。此時能夠考慮對廣告渠道特徵進行聚類,而後從幾類具備比較顯著的羣體上再深刻挖掘。網站

以幾乎全部企業都會投放的SEM渠道爲例,帳戶內的關鍵字擁有上千個長尾詞是常態,大型企業過百萬的關鍵字更是「屢見不鮮」,如何針對海量關鍵字效果作分析是一個難點。以聚類方法爲例,首先可使用聚類方法將全部的關鍵字的屬性、操做和效果劃分爲多個羣組。其中:spa

  • 屬性:帳戶結構、質量度等。
  • 操做:預算、價格、黑名單、地域、匹配方式、時段、展現方式、匹配的創意、平臺等。
  • 效果:SEM排名、點擊價格等SEM指標,站外廣告曝光、點擊以及站內流量數量和轉化類指標

而後,基於劃分的羣組分析不一樣羣組間的顯著性特徵,從中找到能夠進一步分析和優化的方向。例如:

  • 某一類關鍵字的排名較差、質量度低、流量低、轉化差,這些可 能須要從新規劃關鍵字投放策略;
  • 某一類關鍵字的排名好、質量度高,可是流量低,這些可能須要重點優化展現和創意的吸引度,以得到用戶的關注和點擊;
  • 某一類關鍵字的排名好、質量度高、流量高,可是轉化差,這些關鍵字須要重點從着陸頁開始作分析,將轉化流程和步驟層層拆分,找到流失和轉化的關鍵節點。

3、廣告整合傳播模型

廣告整合傳播指全部企業的廣告和傳播活動都以統一的策略做爲指導,經過必定方式的組合來實現傳播效果的最大化目標。廣告整合傳播的概念很早就已經出現,跟這個概念相似的另外一個概念是整合營銷傳播。但整合營銷傳播涵蓋的內容幾乎涉及企業經營的方方面面,範圍太大,所以這裏咱們只討論其中的廣告整合傳播的內容。

廣告整合傳播的出現主要基於兩方面背景:

  • 當前的廣告媒體以及用戶接觸信息的渠道很是多,致使沒有一種廣告渠道能夠徹底覆蓋全部用戶羣體,所以媒體碎片化現象很是嚴重。企業要想覆蓋儘可能多的用戶,只能選擇更多的廣告媒體一塊兒投放。
  • 營銷公司(尤爲是4A公司)發現,不是全部的廣告渠道都對於企業廣告傳播具備相同的做用和貢獻,基於不一樣渠道的貢獻狀況須要在組合時使用必定的組合策略和方法。

如何選擇廣告媒體以及如何組織不一樣廣告媒體的傳播策略是廣告整合傳播關注的問題。實際上該問題在數據化運營時代以前已經開始研究,但當時受限於數據樣本、技術等問題,只能經過抽樣調查的方式開展,所以結果的參考性不大。

當前,經過數據量化的方式作廣告整合傳播模型分析,主要涉及三個數據分析方法的組合:

3.1 廣告來源路徑

廣告來源路徑能夠提供不一樣路徑所產生的轉化數量、轉化價值、平均須要時間以及轉化步長等。下圖的報告來自於Webtrekk(其餘網站分析工具也提供相似的報告),報告中的每一條廣告媒體路徑都是在轉化前提下造成的路徑。

以序號10所表明的用戶廣告媒體路徑爲例,用戶先經過Facebook後經過Direct進入網站並完成轉化的數量是21次,價值是103.4,平均須要的轉化時間是0.76天,總轉化步長是2(兩步)。

3.2 目標轉化歸因

目標轉化歸因可以解決在不一樣的歸因模式下,全部參與轉化的廣告媒體對於目標的貢獻狀況。在不一樣的歸因模型下,不一樣渠道的貢獻。不少網站分析工具能夠提供多種可選歸因模型。

Webtrekk提供的多重歸因模型,該模型能夠對於根據位置綜合歸因,權重分配一般是爲最初進入渠道和最末進入渠道訂 單貢獻較大,其餘渠道貢獻較弱。如圖中默認第一和末端渠道權重分別爲30%和40%,其餘渠道平均都是10%。

在歸因的價值度量上,能夠選擇使用多種度量指標,例如轉化數量、轉化價值等。具體以定義的轉化目標爲依據。一般狀況下,電子商務轉化中,對於訂單類的貢獻以訂單量爲衡量指標;對於非電子商務類轉化,以目標完成次數爲衡量指標(例如閱讀數、提交次數、線索數量等)。

3.3 廣告渠道的關聯訪問

關聯分析不只能夠用來作購物籃分析更能夠擴展到用戶訪問行爲、搜索行爲等多種模式的分析。將關聯分析應用 到廣告渠道的模式探索,是對用戶廣告來源路徑的進一步深化。

在對廣告來源路徑的研究中,咱們已經知道每一條用戶轉化路徑以及包含的廣告渠道,可是這種分析方法仍然有2個問題沒有解決:

  • 該路徑已轉化爲觸發點,沒有轉化就沒有路徑,這會使得那些側重於曝光的信息沒法產生路徑信息,更沒法測量其對網站的貢獻意義,哪怕僅僅是流量貢獻。
  • 在大多數狀況下,轉化路徑都會產生長尾效應,即大多數的轉化會集中在成百上千個各式各樣的轉化路徑中,僅憑觀察沒法從全部路徑中提取出關於渠道組合的有效規律。

將關聯分析應用到廣告渠道的關聯訪問,剛好能夠解決上述2個問題。下截圖爲Webtrekk的渠道關聯訪問報告。

在報表中,咱們能夠找到特定廣告媒體之間的相互關聯關係。這種關聯關係跟轉化無關,只與用戶的前後訪問行爲和模式有關。例如,序號1表明的關聯模式意味着用戶先經過Facebook再經過Daily Banner訪問網站的數量是21,支持度是0.76,提高度是1.03。其中數量對應關聯分析結果中的實例數。

綜上,咱們來總結一下如何經過這三種方法實現對廣告整合傳播模型的更好解讀:

  • 用戶廣告來源路徑能夠幫助咱們瞭解帶有轉化的用戶訪問來源的全部前後序列以及轉化步長和時間,這對於轉化過程、時間和模式的理 解很是重要。雖然每一個轉化的路徑是一個全路徑,但讀者其實能夠將其路徑做爲已經預處理好的關聯分析的源數據,直接對其作關聯分析能夠從中找到有轉化的用戶的廣告來源模式。
  • 目標轉化歸因能夠幫助咱們根據企業自身特色定義的歸因模型,有效的對參與轉化的廣告渠道作貢獻分配,從而輔助於價值評估和付費投入,尤爲對於處於轉化「前期」處於引流和輔助功能的渠道特別重要。
  • 廣告渠道的關聯訪問能夠幫助咱們瞭解全部用戶頻繁的訪問模式,尤爲對於小範圍的媒介組合尤爲有效,它能夠解決全過程(包含轉化和非轉化)的用戶關聯訪問模式的問題。

雖然上述三種方法已經相對於之前的調研問卷方式有了進一步的量化提高,但仍然有如下幾方面問題須要注意:

  • 上述方法的實現目前都是基於cookie的,而咱們知道cookie的穩定性會隨着時間、用戶操做等因素改變,這會致使數據直接發生變化。
  • 用戶應用平臺的多樣化以及多設備、多瀏覽器和多應用致使的同一個用戶識別難度增長,若是用戶沒有有效的識別方式,那麼數據會產生極大的分散性,也就沒法產生關聯效應。
  • 流量做弊的問題在廣告領域比較頻繁,在作整合分析以前的異常檢測和數據排除工做也必不可少。
  • 受限於數據採集的限制,當用戶僅僅瀏覽可是沒有點擊企業投放的廣告併到達企業網站或應用時,因爲企業沒法得到廣告曝光信息,所以沒法對非點擊或者點擊非到達類的渠道作評估。常見的此類渠道以展現類廣告爲主,例如CPM類。

4、流量預測模型

廣告流量預測幾乎是每一個營銷部門在作廣告策劃時的必要步驟。經過廣告流量預測模型能夠基於現有的流量以及廣告費用水平等因素,預測在必定條件下能夠產生多少流量。在電子商務公司中,這種流量每每基於銷售目標產生,一般思路是企業先肯定銷售任務,而後根據銷售任務反推須要的流量支持。

流量預測根據不一樣的場景有不一樣的方法:

  • 若是是沒有可控的自變量或沒法找到自變量的,例如直接流量、引薦流量、天然社交媒體流量等,能夠考慮使用時間序列分析方法。
  • 若是是費用控制類媒體,例如SEM、硬廣、導航類廣告等,可使用迴歸類模型作流量預測。

流量預測應用跟其餘數值型預測(例如銷售預測)的方法相似,但存在必定的特殊性:

  • 廣告費用的持續性。通常狀況下,廣告費用支出是持續的,但在某些狀況下,可能因爲費用到帳不及時等因素致使廣告沒法投放,此時會出現有費用無流量的狀況。這些一般是因爲溝通機制和媒介自身因素 致使。
  • 服務器併發的響應性。當企業作大型促銷活動時,流量每每呈幾倍甚至幾十倍的增加,若是企業服務器沒法支撐瞬時的高流量併發,那麼會影響整個公司的數據工做,包括流量、銷售、會員等。在數據方面的影響主要是沒有流量數據、銷售數據下跌等。
  • 廣告媒體的相互影響。廣告媒體的投放每每會產生交叉影響效應,這意味着即便某些媒體沒有投放廣告,也會受到其餘媒體或活動的影響而產生數據變化。例如投放廣告一般會增長SEM品牌關鍵字、品牌區、導航網站、直接輸入渠道的流量。
  • 做弊流量。這裏又一次提到做弊流量,緣由是做弊這一因素不少狀況下不可控而且不必定能被檢測出來。另外,不一樣類型的廣告的做弊流量規模也不一樣。一般點擊類(流量數量爲主的廣告渠道,例如硬廣)做弊較爲嚴重,SEM、導航、社交媒體等相對較好。
  • 廣告效果的持續性。當廣告中止投放以後,廣告效果仍然會持續一段時間。這種現象比較常見,尤爲是時效性較長的廣告,例如電子郵件、社交媒體等。
  • 補量。補量的意思是廣告媒介因爲某些自身因素,沒有達到預期承諾的廣告投放標準,例如展現次數不足、點擊量不足等,此時媒介會經過增長廣告位置、延長廣告時長等方式補足承諾效果。
相關文章
相關標籤/搜索