互聯網的發展改變了人們的生活習慣,人們花在互聯網上的時間已經超過看電視的時間。相應的,互聯網廣告也超越傳統媒體,成爲影響力最大的廣告渠道。算法
據實力傳播發布的《2015全球三十強媒體主》報告:谷歌的廣告收入比排名第二的迪士尼高出136%,以前一年這一數字爲115%。其廣告收入甚至超過了第二和第三名(有線電視運營商康卡斯特)廣告收入總和。瀏覽器
榜單中的五家純互聯網媒體主:谷歌、Facebook、百度、雅虎及微軟,廣告收入總和達710億美圓,佔全球數字廣告收入的68%,而咱們熟悉的CCTV在榜單中只位列第20名,低於排名14的百度。安全
互聯網媒體們賺得盆滿鉢滿,廣告主們仍然在繼續增長預算。cookie
根據《2015中國互聯網數字營銷趨勢報告》,網絡廣告支出預算佔總預算六成以上,數字營銷(互聯網廣告)已經超越電視渠道成爲廣告主最爲重視的投放途徑。網絡
和傳統的電視廣告相比,互聯網廣告更加靈活,能夠和用戶互動,甚至能夠直接促成用戶點擊、註冊和下單,這些都是傳統電視廣告徹底不能比擬的。網站
互聯網廣告繁榮的同時,也滋生了一系列亂象。spa
網絡廣告行業組織交互廣告署援引的數據稱,約36%的互聯網流量被認爲是虛假的,是由黑客控制的計算機生成的。所謂的殭屍流量欺騙了廣告客戶,由於一般狀況下只要廣告顯示出來——不管是否被用戶看到,廣告客戶就須要付費。日誌
行騙者利用虛假流量哄擡網站流量,經過中間商向廣告客戶收費。安全專家指出,行騙者身份很難界定,他們一般遠程操控網站,例如他們可能人在東歐地區。視頻
根據全美廣告商協會(Association of National Advertisers)的估計,虛假點擊在今年將會給廣告主們帶來72億美圓的損失,這一數字比2015年的63億美圓增加了將近10億美圓,虛假點擊量佔整個網絡廣告點擊量的比例超過了十分之一。ci
調查者們重點監測了49個品牌的網絡廣告,包括麥當勞、PlayStation、福特、惠普、沃爾瑪、聯合利華、戴爾、IBM及萬事達。結果顯示,四分之一的品牌廣告的虛假點擊率在9%以上,廣告主們的損失平均達到了1000萬美圓。
甚至連媒體平臺也會主動造假:
原WE隊員微笑在鬥魚直播時,其顯示觀看人數居然超過「13億」!而2015年中國全國人口數量才13.6億;
2010年世界盃期間,視頻網站酷6網公佈了世界盃期間日瀏覽量(PV)峯值達到3.99億,日獨立用戶峯值爲5233萬,然後被爆出酷六首頁上竟有多達5次的PV統計;世界盃專題頁面上,打開一個日曆嵌套頁面,居然也被計入一次PV統計。
互聯網廣告做弊日益成爲一個讓廣告主們頭疼的事情。
目前數字營銷領域的廣告大體分爲兩大類:
品牌廣告以大企業的品牌宣傳爲主,多以千次曝光的形式計費,廣告主追求的是長期的品牌溢價;
效果廣告則多以單次點擊或單次行爲收費,更多關注廣告投放後短期內有沒有實際轉化和收益。
在實際投放中,廣告主每每但願投放的結果是二者兼得品效結合,但願一次投放能保證時間、曝光、點擊、地域、人羣、設備、轉化(註冊、購買、問卷等行爲)等多個指標。每一次廣告曝光都涉及媒體、投放中間平臺(DSP、adnetwork、adexchange等)和看廣告的人這三個主要環節,廣告主將一筆預算委託第三方平臺進行廣告投放後,其餘環節對他們來講就是非透明的難以掌控的,這種信息不對稱滋生了很大的數據做弊空間,其中的利益相關方可能有目的性的經過欺騙性手段實現廣告效果。曝光做弊、點擊做弊、轉化做弊的行爲並不鮮見,這也是廣告主投放廣告時的兩點核心困惑。
對廣告主而言,能夠經過簡單的數據分析方式發現一些明顯的異常點。一份疑似做弊的投放數據報告有以下特徵中的某一點或某幾點:
點擊或曝光數據中的異常峯值
點擊或曝光出現峯值時轉化數據並無增加
點擊或曝光出現峯值時到站流量反而降低
點擊或曝光出現峯值時到站跳出率增加
投放的媒體屬性和點擊的地域屬性不符(如投放某地域門戶網站但點擊數據集中於其餘城市)
點擊時間曲線和媒體的流量曲線不符
各廣告位的CTR與廣告形式的平均CTR不符(如橫幅廣告位CTR大於1%)
……
經過自動化的程序模擬點擊是最多見也是成本極低的一種點擊做弊方式,廣告主能夠經過分析點擊數據日誌區分真人點擊和機器點擊。
要肯定是不是機器點擊,一般能夠經過如下兩個維度甄別:
1. 點擊請求的Headers異常:
Hearders請求中的Referer和Useragent是最直觀判斷機器行爲的方法,在反爬蟲策略中也應用普遍。機器行爲模擬的點擊請求因爲沒有正常訪問路徑,Referer可能爲空,Useragent可能不是正常瀏覽器的Useragent。但Hearders很是容易假裝,這一策略只能甄別那些初級做弊者。
2. 點擊行爲分析:
機器點擊具備必定的連續性,能夠經過判斷同IP同設備的連續點擊、同IP段的大量點擊、同IP連續點擊間隔時間等進行判斷。段位稍高的做弊者會經過改變IP地址、改變cookie地址、低頻率點擊等方式掩蓋程序自動點擊的特徵,在這種狀況下須要結合到站後的點擊行爲軌跡進行綜合分析。
除了點擊做弊以外,如今的網絡廣告做弊甚至能作到虛假轉化。
廣告主最看重的效果數據就是點擊後的轉化效果,好比用戶註冊數、商品下單數、參與活動的人數等。轉化做弊即在註冊、激活、下單等不一樣場景下經過自動化程序有針對性的模擬真人行爲。
以轉化做弊中的機器註冊爲例,除了傳統的頻率、次數的防護之外,目前有效的分析維度有:
註冊者的URL訪問軌跡:機器註冊可能出現到站後只訪問註冊URL頻繁註冊的行爲。
註冊者是否查看了頁面上的靜態資源:機器註冊在訪問時只關心網頁上的文字,在沒有驗證碼的狀況下不會加載頁面上的CSS或JS信息。
不一樣帳號同密碼註冊
註冊者從到站到註冊間的時間間隔:真人經過點擊廣告到站後每每在註冊前會有較長
時間的瀏覽過程,而機器行爲則會在到站後直奔主題,連續兩個點擊之間時間很是短。
從以上的例子能夠看到,雖然廣告的投放帶來大量的新註冊用戶,但這批新註冊用戶可能充斥着殭屍用戶,實際的留存率極低。廣告主是數字營銷領域做弊鏈中最大的受害者,由於有各類做弊手段的存在,廣告主損失的不只是大筆的廣告預算,還有虛假轉化帶來的各類營銷活動的虛假繁榮。
網絡廣告做弊是一個很複雜又很龐大的事物,也沒有完美的解決方案。
目前,解決網絡廣告做弊的思路大體有兩種:
媒體平臺增強反做弊算法,提升機器人識別率;
廣告主本身對流量和轉化進行甄別評估。