俗話說,有錢能使鬼推磨。爲了保障下載量、使用量,企業一般會在 App 推廣中投巨資給第三方渠道,用於引流買量。但在這一過程當中,內鬼、羊毛黨、刷量中介總會趁虛而入,成爲刷量造假的核心羣體。那麼,今天就根據個人經驗來談談怎麼經過數據分析,辨別流量的真實性,揪出異常渠道。分佈式
作渠道數據分析的前提是拿到靠譜的第一手數據。數據若是不夠準確,那麼基於此數據進行分析也就沒有任何意義。ide
渠道推廣比較精準的統計平臺我以 openinstall 爲例,它能程序化生成渠道包以及海量渠道推廣連接,各個渠道只需拿着對應的專屬連接便可獲取相應數據,即使是用戶個體間的社交分享傳播,也能實現自動識別渠道分享來源。工具
數據獲取只是第一步,防做弊分析纔是重中之重。目前市場上的做弊方法不少,做弊工做室可能採用分佈式人肉刷量的方式來刷量(能夠參考基於任務獎勵形式的積分牆);也有可能採用更爲智能的方式,經過編寫程序腳本,修改真機參數,驅動真機運行。這些行爲已經跟真實的用戶行爲幾乎沒有差異了,很難從技術上分辨這些數據。但咱們仍是能從數據上分析出一些蛛絲馬跡,下面就講講具體的辨別方法。大數據
第一步,先利用現成的工具和系統,從技術上將重複多餘的數據剔除,如今許多第三方基於不一樣的方案,都有一套本身的排重機制,好比 openinstall 後臺就能提供免費的排除重複功能,主要維度包括:安裝量、註冊量、1日/7日/30日留存、增加趨勢、IP 分佈、系統版本等,也能夠根據業務需求自定義目標事件,精準的排重功能能夠幫咱們作一個初步數據篩選,也爲後面的分析環節省去很多工做量。操作系統
一、留存率判斷事件
從留存率看刷量的話,最簡單的判斷是觀察1日、7日、30日這三個節點的數據波動,很多刷量工做室會選擇在這三個節點定時導入或者批量導入大量用戶數據。因此,若是在沒有外在因素影響的狀況下,數據出現太高或太低的波動,那麼該渠道就有做弊嫌疑。get
真實的用戶留存曲線應該是平滑降低的,若是一個 App 的第二天留存率能達到40%的話,那麼7日留存率達到20%,30日留存率達到10%,這個 App 的留存率就高過業內標準了,須要警戒。通常高頻類 App(如社交、外賣、工具類)留存率會大於低頻類 App(如租房、旅遊、電商類),其次,若是有簽到獎勵、沉默喚醒機制的 App 留存率或許會高一些,這些因素也要考慮進去。數據分析
二、終端設備判斷產品
用戶終端能夠準確追蹤到的包括:IP分佈、系統版本、品牌/機型等,這些都有分析技巧。it
IP分佈關係到投放策略層面,通常咱們都會根據產品調性作重點投放,好比一二線高消費城市、三四線等相對下沉城市,或者根據區域,好比華東、華南或省份等。查看數據時,若是有部分用戶來自重點投放區域外,或者過於集中在某個地區,那麼數據來源可能來自某個做弊工做室。
系統版本和操做系統佔比也能看出些貓膩。事實上不少做弊渠道都是統一採購做弊設備,畢竟若是一直換新手機做弊成本也過高了,但真實用戶不是,所以若是觀察到的版本和系統都是比較落後的版本,或者是過於集中在某個時段的版本,那可能就有問題,好比如今2019年,而來自某個渠道的用戶機型和操做系統基本都是2017年6月份發佈的新機,那就值得懷疑。
品牌機型也是同理,尤爲是 iOS 沒有模擬機,必須用真機觸發,所以刷量做坊會大量採購二手蘋果手機,安卓方面,出於成本考慮,主要的刷量也都是由低價機、二手機、冷門機型完成,這些都是能夠辨別的依據。
三、用戶行爲判斷
即使現在的做弊工做室能模擬出連繫統都沒法辨別的逼真行爲數據,但訪問頁面、使用時長、訪問間隔、使用頻率這些實際行爲是很難和真實用戶如出一轍的。
想要辨別的話,一是跟平常數據作比較,在沒有活動或重大更新之類的影響下,真實用戶的行爲數據應該是趨向平穩的,這個能從某個頁面的訪問或功能使用時長判斷;二是參考權威數據,應用寶之類的應用市場或第三方評測平臺,會根據市場大數據按期發佈用戶行爲報告,這個也是參考標準之一。
四、轉化率分析
分析一個 App 的流量轉化率,不只能幫助咱們提升投放效率,還能判斷引流渠道的價值。
一般用戶行爲都是能夠作成漏斗模型的,咱們能夠把「訪問-下載-安裝-打開-註冊-付費」等行爲步驟作成沙漏,每通過一層,做弊難度就會大幅增長,觀察每一層轉化的異常,能夠對渠道質量得出一個大體的結論。
以上這些方法在實際運用中還有不少發揮空間,能夠自行根據產品性質作出調整,跟做弊行爲鬥智鬥勇,是每一個 App 推廣中必須經歷的,這些就須要經驗積累和工具輔助運用才能實現。