20170428 關於headers和user_agent的文章自用

截止今天,關於精準廣告定向技術的介紹已經所有寫完。介紹的寫做初衷是總結本身的知識,將知識從片斷的、隱形的轉化爲能夠向別人講述、可以給人幫助的。在總結的過程當中本身也提高了不少,同時但願這些內容可以切實的給剛進入這個行業的同窗們以幫助。php

1、基礎知識篇:

Http Header之User-Agent

User Agent中文名爲用戶代理,是Http協議中的一部分,屬於頭域的組成部分,User Agent也簡稱UA。它是一個特殊字符串頭,是一種向訪問網站提供你所使用的瀏覽器類型及版本、操做系統及版本、瀏覽器內核、等信息的標識。經過這個標識,用戶所訪問的網站能夠顯示不一樣的排版從而爲用戶提供更好的體驗或者進行信息統計;例如用手機訪問谷歌和電腦訪問是不同的,這些是谷歌根據訪問者的UA來判斷的。UA能夠進行假裝。html

瀏覽器的UA字串的標準格式:瀏覽器標識 (操做系統標識; 加密等級標識; 瀏覽器語言) 渲染引擎標識版本信息。但各個瀏覽器有所不一樣。linux

字串說明:android

一、瀏覽器標識
出於兼容及推廣等目的,不少瀏覽器的標識相同,所以瀏覽器標識並不能說明瀏覽器的真實版本,真實版本信息在 UA 字串尾部能夠找到。es6

二、操做系統標識web

三、加密等級標識
N: 表示無安全加密
I: 表示弱安全加密
U: 表示強安全加密chrome

四、瀏覽器語言
在首選項 > 常規 > 語言中指定的語言數據庫

五、渲染引擎
顯示瀏覽器使用的主流渲染引擎有:Gecko、WebKit、KHTML、Presto、Trident、Tasman等,格式爲:渲染引擎/版本信息apache

六、版本信息
顯示瀏覽器的真實版本信息,格式爲:瀏覽器/版本信息跨域

注:
一、在廣告定向設定中,瀏覽器定向和操做系統定向均是針對User-Agent中的信息進行定向。
二、欲瞭解更多的User-Agent信息,請參考User-agent 字串史

瀏覽器User-Agent的詳細信息

PC端:

safari 5.1 – MAC
User-Agent:Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_6_8; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50

safari 5.1 – Windows
User-Agent:Mozilla/5.0 (Windows; U; Windows NT 6.1; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50

IE 9.0
User-Agent:Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0;

IE 8.0
User-Agent:Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.0; Trident/4.0)

IE 7.0
User-Agent:Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0)

IE 6.0
User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)

Firefox 4.0.1 – MAC
User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10.6; rv:2.0.1) Gecko/20100101 Firefox/4.0.1

Firefox 4.0.1 – Windows
User-Agent:Mozilla/5.0 (Windows NT 6.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1

Opera 11.11 – MAC
User-Agent:Opera/9.80 (Macintosh; Intel Mac OS X 10.6.8; U; en) Presto/2.8.131 Version/11.11

Opera 11.11 – Windows
User-Agent:Opera/9.80 (Windows NT 6.1; U; en) Presto/2.8.131 Version/11.11

Chrome 17.0 – MAC
User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_0) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.56 Safari/535.11

傲遊(Maxthon)
User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Maxthon 2.0)

騰訊TT
User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; TencentTraveler 4.0)

世界之窗(The World) 2.x
User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1)

世界之窗(The World) 3.x
User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; The World)

搜狗瀏覽器 1.x
User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Trident/4.0; SE 2.X MetaSr 1.0; SE 2.X MetaSr 1.0; .NET CLR 2.0.50727; SE 2.X MetaSr 1.0)

360瀏覽器
User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; 360SE)

Avant
User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Avant Browser)

Green Browser
User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1)

移動設備端:

safari iOS 4.33 – iPhone
User-Agent:Mozilla/5.0 (iPhone; U; CPU iPhone OS 4_3_3 like Mac OS X; en-us) AppleWebKit/533.17.9 (KHTML, like Gecko) Version/5.0.2 Mobile/8J2 Safari/6533.18.5

safari iOS 4.33 – iPod Touch
User-Agent:Mozilla/5.0 (iPod; U; CPU iPhone OS 4_3_3 like Mac OS X; en-us) AppleWebKit/533.17.9 (KHTML, like Gecko) Version/5.0.2 Mobile/8J2 Safari/6533.18.5

safari iOS 4.33 – iPad
User-Agent:Mozilla/5.0 (iPad; U; CPU OS 4_3_3 like Mac OS X; en-us) AppleWebKit/533.17.9 (KHTML, like Gecko) Version/5.0.2 Mobile/8J2 Safari/6533.18.5

Android N1
User-Agent: Mozilla/5.0 (Linux; U; Android 2.3.7; en-us; Nexus One Build/FRF91) AppleWebKit/533.1 (KHTML, like Gecko) Version/4.0 Mobile Safari/533.1

Android QQ瀏覽器 For android
User-Agent: MQQBrowser/26 Mozilla/5.0 (Linux; U; Android 2.3.7; zh-cn; MB200 Build/GRJ22; CyanogenMod-7) AppleWebKit/533.1 (KHTML, like Gecko) Version/4.0 Mobile Safari/533.1

Android Opera Mobile
User-Agent: Opera/9.80 (Android 2.3.4; Linux; Opera Mobi/build-1107180945; U; en-GB) Presto/2.8.149 Version/11.10

Android Pad Moto Xoom
User-Agent: Mozilla/5.0 (Linux; U; Android 3.0; en-us; Xoom Build/HRI39) AppleWebKit/534.13 (KHTML, like Gecko) Version/4.0 Safari/534.13

BlackBerry
User-Agent: Mozilla/5.0 (BlackBerry; U; BlackBerry 9800; en) AppleWebKit/534.1+ (KHTML, like Gecko) Version/6.0.0.337 Mobile Safari/534.1+

WebOS HP Touchpad
User-Agent: Mozilla/5.0 (hp-tablet; Linux; hpwOS/3.0.0; U; en-US) AppleWebKit/534.6 (KHTML, like Gecko) wOSBrowser/233.70 Safari/534.6 TouchPad/1.0

Nokia N97
User-Agent: Mozilla/5.0 (SymbianOS/9.4; Series60/5.0 NokiaN97-1/20.0.019; Profile/MIDP-2.1 Configuration/CLDC-1.1) AppleWebKit/525 (KHTML, like Gecko) BrowserNG/7.1.18124

Windows Phone Mango
User-Agent: Mozilla/5.0 (compatible; MSIE 9.0; Windows Phone OS 7.5; Trident/5.0; IEMobile/9.0; HTC; Titan)

UC無
User-Agent: UCWEB7.0.2.37/28/999

UC標準
User-Agent: NOKIA5700/ UCWEB7.0.2.37/28/999

UCOpenwave
User-Agent: Openwave/ UCWEB7.0.2.37/28/999

UC Opera
User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; ) Opera/UCWEB7.0.2.37/28/999

用戶追蹤之基礎技術——Cookie

前言

Cookie是如此的重要,以致於咱們後面要講到的回頭客定向、訪客頻次定向、用戶定向等等都須要基於此技術才能夠實現,而且咱們平常工做中所能見到的第三方監測工具如doubleclick、99click、秒針等也都要利用cookie技術,網站分析工具如GA、百度統計、CNZZ等也須要利用cookie。若是沒有Cookie,互聯網廣告市場將受到巨大打擊,尤爲對於目前咱們談論的精準廣告而言。若是沒有Cookie,網站分析也不從作起,遑論優化了。

Cookie是什麼

Cookie在英文中是小甜品的意思,但在計算機語言中,Cookie指的是當你瀏覽某網站時,網站存儲在你電腦上的一個小文本文件,伴隨着用戶請求和頁面在 Web 服務器和瀏覽器之間傳遞。它記錄了你的用戶ID,密碼、瀏覽過的網頁、停留的時間等信息,用於用戶身份的辨別。Cookie一般是以user@domain格式命名的,user是你的本地用戶名,domain是所訪問的網站的域名。

爲何要Cookie

由於HTTP協議是無狀態的,對於一個瀏覽器發出的請求,服務器沒法區分是否是同一個來源,沒法知道上一次用戶作了什麼。因此,須要額外的數據用於維護會話。 Cookie 正是這樣的一段隨HTTP請求一塊兒被傳遞的額外數據,用於維護瀏覽器和服務器的會話。咱們能夠想象一個場景,你沒有登陸京東時在京東上購物,選擇了3件商品放入購物車,在結算時,京東爲何還能知道這三件商品是什麼?沒錯,是Cookie!

Cookie的工做原理

Cookie利用網頁代碼中的HTTP頭信息,伴隨着用戶請求和頁面在 Web 服務器和瀏覽器之間傳遞。例如:當你在瀏覽器地址欄中鍵入了Amazon的URL,瀏覽器會向Amazon發送一個讀取網頁的請求,並將結果在顯示器上顯示。在發送以前,該網頁在你的電腦上尋找Amazon網站設置的Cookie文件,若是找到,瀏覽器會把Cookie文件中的數據連同前面輸入的URL一同發送到Amazon服務器。服務器收到Cookie數據,就會在他的數據庫中檢索你的ID,你的購物記錄、我的喜愛等信息,並記錄下新的內容,增長到數據庫和Cookie文件中去。若是沒有檢測到Cookie或者你的Cookie信息與數據庫中的信息不符合,則說明你是第一次瀏覽該網站,服務器的CGI程序將爲你建立新的ID信息,並保存到數據庫中。(此例子來源於百度百科——Cookie)

關於Cookie的一些知識點

一、Cookie是基於瀏覽器的,所以當電腦上安裝多個瀏覽器時,服務器會生成多個Cookie。雖然是同一我的,但服務器是識別爲多個用戶。
二、Cookie是基於瀏覽器的,所以當同一臺電腦有多我的使用時,服務器也只會生成一個Cookie。雖然是多我的,但服務器會認爲是一個用戶。
三、Cookie是沒法跨設備進行設置的。好比咱們在單位和家裏分別使用兩臺電腦,即便咱們使用同一種同一版本的瀏覽器,咱們仍是生成了兩個Cookie,服務器會認爲是兩個用戶。(PS:如今有些瀏覽器能夠同步數據,好比Chrome、Friefox,能夠避免這種問題)

請注意:以上所說的Cooke指的所有是Http Cookie。有一種Cookie——Flash Cookie,能夠解決多瀏覽器的問題。

關於Flash Cookie

FlashCookie是由FlashPlayer控制的客戶端共享存儲技術,鑑於目前Flash技術的廣泛性,幾乎全部的網站都採用,因此具備同Http Cookie同樣的做用。在技術上,經過使用JavaScript與ActionScript能夠將Http Cookie和Flash Cookie進行互通。

Flash cookie的優點在於:
一、跨瀏覽器
無論用戶的計算機上安裝了多少個瀏覽器或者瀏覽器的不一樣版本,使用Flash Cookie可以使全部的瀏覽器共用一個Cookie。
二、不易刪除
全部的瀏覽器均提供了清除Http Cookie的快捷方式,但Flash Cookie並無此種方式,而且其保存位置很是隱蔽,網民難以刪除。
三、容量更大
Flash Cookie能夠容納最多100千字節的數據,而一個標準的HTTP Cookie只有4千字節。

做爲網絡廣告行業的銷售人員,瞭解以上知識就已經綽綽有餘了。若是想了解更多,能夠接着往下看。

Cookie的數量

一、大多數瀏覽器支持最大爲 4096 字節的 Cookie。所以最好用 Cookie 來存儲用戶 ID 之類的標識符,用戶的詳細信息則經過用戶 ID從數據庫或其餘數據源中讀取。
二、瀏覽器還限制站點能夠在用戶計算機上存儲的 Cookie 的數量。大多數瀏覽器只容許每一個站點存儲 20 個 Cookie;當存儲更多 Cookie時,最舊的 Cookie 便會被丟棄。有些瀏覽器還會對它們將接受的來自全部站點的 Cookie 總數做出絕對限制,一般爲 300 個。

Cookie的失效時間

一、瀏覽器的Cookie設置會決定是否保存Cookie數據。若是瀏覽器不容許Cookie保存,則關掉瀏覽器後,這些數據就消失。
二、若是瀏覽器容許保存Cookie,那麼Cookie的時間由服務器的設置決定。Cookie有一個Expires(有效期)屬性,這個屬性決定了Cookie的保存時間,服務器能夠經過設定Expires字段的數值,來改變Cookie的保存時間。若是不設置該屬性,那麼Cookie只在瀏覽網頁期間有效,關閉瀏覽器,這些Cookie自動消失,絕大多數網站屬於這種狀況。一般狀況下,Cookie包含Server、Expires、Name、value這幾個字段,其中對服務器有用的只是Name和value字段,Expires等字段的內容僅僅是爲了告訴瀏覽器如何處理這些Cookies。

Cookie的樣例

一、Cookie的名稱

二、Cookie的內容

三、從頁面代碼監測工具看Cookie

Cookie的位置

一、Http Cookie的位置
Windows 9X系統 C:WindowsCookies
Windows NT/2000/XP系統 C:\Documents and Settings\用戶名\Cookies
win7系統 C:\Users\*\AppData\Roaming\Microsoft\Windows\Cookies\*
OS X系統 ~/Users/用戶名/Library/Cookies

二、Flash Cookie的位置

非Win7系統
C:\Documents and Settings\[username你的用戶名]\Application Data\Macromedia\Flash Player\#SharedObjects

Win7
C:\Users\[username你的用戶名]\Application Data\Macromedia\Flash Player
其中:Users可能顯示爲「用戶」

OS X系統
~/Users/用戶名/Library/Preferences/Macromedia/Flash Player/#SharedObjects
~/Users/用戶名/Library/Preferences/Macromedia/Flash Player/macromedia.com/support/flashplayer/sys/

第一方Cookie和第三方Cookie

大多數的第三方監測工具和網站分析工具都會採用第三方Cookie。所謂第一方和第三方的說法,是用來肯定Cookie的歸屬的,這個歸屬是指Cookie中記錄的域(domain)。第一方和第三方的惟一區別只是:Cookie中的域名是否和被訪問網站的域同樣,是就是第一方,否就是第三方。舉個例子:若是你訪問網站www.chinawebanalytics.cn的時候,網站在你的電腦上設置了一個Cookie,裏面的記錄的域名也是www.chinawebanalytics.cn,那麼這個Cookie就是第一方的,歸你訪問的網站www.chinawebanalytics.cn全部。而若是你訪問網站www.chinawebanalytics.cn時,在你的計算機中設置的Cookie的域名是www.abc.com,那麼這個Cookie就是第三方Cookie,歸www.abc.com全部。

因此,第一方Cookie並不必定須要由某個網站本身的服務器給本身創建,別的網站也能爲它創建;並且,第一方Cookie也不必定是能由某個網站本身讀取的,它徹底可能由第三方讀取。(以上內容和例子來自於捍衛Cookie——沒有Cookie,咱們什麼都沒有了)

2、定向技術介紹:

語言定向

一、語言的來源

簡單理解,語言指的是用戶的瀏覽器語言,是從瀏覽器的Http Header的Accept-Language的字段來的。

二、瀏覽器的Accept-Language是由瀏覽器的語言設置所決定的。

三、瀏覽器的默認語言設置和瀏覽器語言無關,默認繼承操做系統的語言。

瀏覽器定向

瀏覽器定向一樣須要依賴於各個瀏覽器在打開頁面時所傳輸的Http header信息中的User-Agent,關於User-Agent的說明,請參見Http header之User-Agent
User-Agent的詳細信息,請參見瀏覽器User-Agent的詳細信息

咱們來了解User-Agent中瀏覽器及版本識別的方法:

1、瀏覽器的使用率說明:


——數據來源於CNZZ數據中心

咱們針對以上的瀏覽器進行說明,另外再針對移動設備上的幾款瀏覽器進行說明。

2、瀏覽器識別

一、IE瀏覽器(以IE 9.0 爲例)

PC端:User-Agent:Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0;
移動設備:User-Agent: Mozilla/5.0 (compatible; MSIE 9.0; Windows Phone OS 7.5; Trident/5.0; IEMobile/9.0; HTC; Titan)

因爲遨遊、世界之窗、360瀏覽器、騰訊瀏覽器以及搜狗瀏覽器、Avant、Green Browser均採用IE的內核,所以IE瀏覽器判斷的標準是」MSIE「字段,MSIE字段後面的數字爲版本號,但同時還須要判斷不包含」Maxthon「、」The world「、」360SE「、」TencentTraveler「、」SE「、」Avant「等字段(Green Browser沒有明顯標識)。移動設備還須要判斷IEMobile+版本號。

二、360瀏覽器

PC端:User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Trident/4.0; InfoPath.2; .NET4.0C; .NET4.0E; .NET CLR 2.0.50727; 360SE)
移動設備:暫無

360瀏覽器的判斷標準是」360SE」字段,沒有版本表示。

三、搜狗瀏覽器

PC端:User-Agent:Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Trident/4.0; SE 2.X MetaSr 1.0; SE 2.X MetaSr 1.0; .NET CLR 2.0.50727; SE 2.X MetaSr 1.0)
移動設備:暫無

搜狗瀏覽器的判斷標準是」SE「、」MetaSr「字段,版本號爲SE後面的數字。

四、Chrome

PC端:Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_0) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.56 Safari/535.11

移動設備:User-Agent: Mozilla/5.0 (Linux; U; Android 2.2.1; zh-cn; HTC_Wildfire_A3333 Build/FRG83D) AppleWebKit/533.1 (KHTML, like Gecko) Version/4.0 Mobile Safari/533.1

PC端chrome瀏覽器的判斷標準是chrome字段,chrome後面的數字爲版本號;移動端的chrome瀏覽器判斷」android「、」linux「、」mobile safari「等字段,version後面的數字爲版本號。

五、Safari

PC端:User-Agent:Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_6_8; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50

移動設備:User-Agent:Mozilla/5.0 (iPhone; U; CPU iPhone OS 4_3_3 like Mac OS X; en-us) AppleWebKit/533.17.9 (KHTML, like Gecko) Version/5.0.2 Mobile/8J2 Safari/6533.18.5

因爲Chrome及Nokia’s Series 60 browser也使用WebKit內核,所以Safari瀏覽器的判斷必須是:包含safari字段,同時不包含chrome等信息,肯定後」version/「後面的數字即爲版本號。在以上條件下包含Mobile字段的即爲移動設備上的Safari瀏覽器。

六、騰訊瀏覽器

PC端:User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Trident/4.0; TencentTraveler 4.0; .NET CLR 2.0.50727)

移動設備:User-Agent: MQQBrowser/26 Mozilla/5.0 (Linux; U; Android 2.3.7; zh-cn; MB200 Build/GRJ22; CyanogenMod-7) AppleWebKit/533.1 (KHTML, like Gecko) Version/4.0 Mobile Safari/533.1

騰訊瀏覽器的判斷標準是」TencentTraveler「或者」QQBrowser「,TencentTraveler或QQBrowser後面的數字爲版本號。

七、Firefox

PC端:User-Agent:Mozilla/5.0 (Windows NT 6.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1

移動設備:User-Agent: Mozilla/5.0 (Androdi; Linux armv7l; rv:5.0) Gecko/ Firefox/5.0 fennec/5.0

Firefox的判斷標準是Firefox字段,firefox後面的數字爲版本號。

八、The world

PC端:User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; The World)

移動設備:暫無

Theworld瀏覽器的判斷標準是」The world「字段,沒有標示版本號。

須要注意的是:The world 2.x版本的User-Agent中沒有」The world「的字段。

九、遨遊

PC端:User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Maxthon 2.0)

移動設備:暫無

遨遊瀏覽器的判斷標準是」Maxthon「,Maxthon後面的數字爲版本號。

十、Opera

PC端:User-Agent:Opera/9.80 (Windows NT 6.1; U; en) Presto/2.8.131 Version/11.11

移動設備:User-Agent: Opera/9.80 (Android 2.3.4; Linux; Opera mobi/adr-1107051709; U; zh-cn) Presto/2.8.149 Version/11.10

opera瀏覽器的判斷標準是opera字段,opera字段後面的數字爲版本號。

十一、UC瀏覽器

UC Web有多種模式瀏覽方式,對應的User-Agent爲:

UC無
User-Agent: UCWEB7.0.2.37/28/999

UC標準
User-Agent: NOKIA5700/ UCWEB7.0.2.37/28/999

UCOpenwave
User-Agent: Openwave/ UCWEB7.0.2.37/28/999

UC Opera
User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; ) Opera/UCWEB7.0.2.37/28/999

UC瀏覽器的判斷標準是」UCWEB「字段,UCWEB後面的數字爲版本號。

操做系統定向

操做系統定向依賴於各個瀏覽器在打開頁面時所傳輸的http header信息中的User-Agent,關於User-Agent的說明,請參見Http header之User-Agent
User-Agent的詳細信息,請參見瀏覽器User-Agent的詳細信息

咱們來了解User-Agent中的不一樣操做系統的識別方法。

PC端:

移動設備端:

地域定向

地域定向依賴於對IP地址的識別,而IP協議是互聯網的基礎協議,所以從網絡誕生的第一天起,地域定向就能夠被使用了。

欲詳細瞭解IP協議,請查看百度百科——TCP/IP協議。有關IP地址的詳細信息,請查看百度百科——IP

通俗來說,IP地址就是互聯網上的門牌號,接入互聯網的全部主機就是咱們的一個個住所,其中有我的的,有單位的。我的住所一家一個門牌號,單位的多家公用一個門牌號,因爲規劃的緣由,有的住所會有多個門牌號,也是規劃的緣由,門牌號有時會發生變化。IP地址也有此特色,一臺主機能夠具備多個IP地址,而多臺主機也能夠公用一個IP地址。

現實中,無論如何規劃,經過門牌號咱們能找到咱們要找的住所,也能清楚住所所在的具體位置。一樣,在網絡中,經過IP地址咱們也能定位到咱們所須要找的主機,而且清楚知道主機所在的地理位置。這樣咱們就能進行廣告的地域定向了。

從技術層面講,地域定向的工做邏輯是:

當一個請求發送給服務器時,服務器根據配置(以Apache爲例,在Apache Httpd中進行配置)記錄下請求的相關數據,組成日誌文件,日誌基本會包括請求時間、請求IP、請求的URL、請求的Reffer、請求的User-Agent以及其餘信息,將收集到的IP地址與已有的IP數據庫進行比對,便可以肯定請求者的地理位置了,好比山西省太原市。

國內目前免費的IP庫有 QQ IP數據庫 純真版,即咱們一般所說的純真IP庫,收集了包括中國電信、中國網通、長城寬帶、網通寬帶、聚友寬帶等 ISP 的最新準確 IP 地址數據,包括最全的網吧數據。IP數據庫每5天更新一次,企業能夠在此基礎上修正後使用。

目前的地域定向更多的是針對省份以及地級城市的定向,針對縣級市或者區級的定向基本上都十分不許確。

回頭客定向

隨着電商網站的火爆,從2010年開始,互聯網廣告行業出現了一種定向方式——回頭客定向。回頭客定向是隨着精準理念的發展而提出來的。顧名思義,回頭客定向是指針對到達過廣告主網站的某一個點的用戶或者發生過某一個行爲的用戶進行定向。

從概念中,咱們能夠發現回頭客定向的三個基本點:一、到達過;二、某一個點或某個行爲;三、定向投放。這三點也是回頭客定向和人羣定向的區別之處。

從營銷的角度講,針對不一樣到達深度的用戶或者不一樣行爲的用戶,咱們須要採起的營銷策略可能會有不一樣。咱們以電商網站的購物流程來舉例子。電商網站的購物流程分爲如下幾個步驟:

一、針對瀏覽過商品的人,咱們應該分析他的瀏覽記錄,發現他感興趣的商品,而後經過廣告將他感興趣的商品推送到他的面前(若是要作到很是完美,針對每一個用戶有不一樣的廣告顯示,須要有哪些條件?你們能夠評論,咱們一塊兒交流)。

二、針對已經將商品加入購物車的人,此時可能更重要的是給他一張電子優惠券,以促進其下單。

三、針對到達過註冊或者登陸界面,但未完成註冊和登陸的人,給他一個商品即將售馨或者即將漲價的倒計時更能促進其回來下單。

四、針對到過填寫配送地址頁面但沒有提交訂單的人,提示免郵遞費用或者直接告訴他「你還差一步就將完成訂單」,可能會是一個好的方法。

五、已經提交訂單的人,是咱們的老客戶了,此時應該推薦關聯的商品信息,以促進其二次消費。

因此,進行回頭客定向的投放,必定是要有如下三個步驟的:

一、設置回頭客人羣的監測。支持回頭客定向的系統必須可以支持對各個點的監測,所以提取監測代碼在此是必須的。好的系統能夠利用一個監測代碼,經過數據分析得出不一樣監測點的回頭客(你們說如何作到?);差的系統就提供不一樣監測點的設置功能,每一個監測點提取不一樣的監測代碼。

二、整理針對各個監測點用戶的獨特營銷訴求。製做針對不一樣回頭客的不一樣創意。

三、利用投放系統,對回頭客進行定向的廣告投放。

通常來說,定向越準確,能獲得的量就會越少,所以,在作回頭客定向時,不該該再選擇媒體進行投放。從另外一個角度理解,回頭客定向已是最領先精準的目標用戶定向了,此時媒介選擇的意義也大大弱化了。

以上所說的是純正意義上的回頭客定向,鑑於回頭客定向受人歡迎的精準的概念和可憐的流量,有些人或公司權衡後會將回頭客定義的很是普遍,好比到過網站的人、點過廣告的人、看過廣告的人都算做回頭客,這只是又一次的中國特點而已。這種事情多了,反而於精準廣告市場的發展不利。

人羣定向

人羣定向其實就是目標人羣定向,在營銷學中,產品定位以及人羣細分是很是重要的理念,這種理念也已經獲得了市場的承認,所以每一種產品在設計、生產之初就已經肯定了本身的目標人羣。從咱們的廣告投放、市場宣傳來說,必定是但願能給對目標人羣進行,花費在目標人羣以外的推廣都是浪費的。

但在以往的媒介中,想要徹底的識別用戶,以肯定是否目標人羣並非容易的事情,甚至從理論上說是徹底作不到的,只能經過不一樣的媒介手段去儘可能的靠近目標人羣(電視、廣播、雜誌都是如何肯定本身的受衆的呢?有人討論嘛?)。但即便這樣,也產生了一句廣告界最著名的話語——我知道廣告費浪費了一半,但我不知道究竟是哪一半。

在互聯網時代,經過技術的力量,能夠無限的接近、近乎準確的判斷每個人的屬性,從而爲廣告主目標羣體定向服務。可是,互聯網也只是無限的接近,而不是確切的能標示出我的的屬性。目前,最接近的應該是相似於羅維鄧白氏之類公司的數據 (順便說一句,央視315晚會的曝光,對羅維鄧白氏公司只能是免費的廣告,而不是打擊)。

言歸正傳,咱們來講說互聯網的人羣定向。互聯網公司一般講的人羣定向並不僅僅包括人口的天然屬性(demographic),還包括人羣興趣(interest)、人羣行爲(behavior)、購物行爲(purchasing)。


注:此處咱們說的人羣行爲指的是對廣告的行爲,好比瀏覽廣告,點擊廣告以及轉發、下載廣告等交互行爲。目前市場上常常有一些公司標榜行爲定向,但讓其展開一說,就只是說對用戶的瀏覽行爲進行定向,很是正確、毫無破綻的說法,但細問卻仍是這一句。這隻能說明這種公司忽悠而無真章的事實(你們說說爲何能說明?)。

對於真正提供定向的公司,無論各個公司都提供什麼樣的人羣定向,以上所說的4類屬性或行爲都是基於cookies技術(瞭解Cookie),經過對用戶長期的互聯網瀏覽行爲數據進行分析所得出的。因爲各公司的資源優點不一樣,所以目前沒有一個公司可以創建健全的數據。

天然屬性(demographic)

天然屬性包括性別、年齡、學歷、地域、婚姻情況、家庭情況(是否有小孩,小孩年齡等)、收入(我的收入、家庭收入)、行業、職業等信息。單純經過互聯網瀏覽行爲並不能分析到如此全面且準確的信息,目前還主要以找到真實的樣本進行建模分析爲主。天然屬性數據以艾瑞的數據最爲準確。

人羣興趣(interest)

人羣興趣在每一個公司會有不一樣的認知。目前,興趣數據屬悠易最好,悠易的數據是公開的,能夠經過悠易受衆引擎查看。

人羣行爲(behavior)

上面註解所說的人羣行爲僅僅是行爲中的一種,若是有搜索引擎的資源,則能夠加入搜索行爲的監測(如百度的搜客定向——對在百度搜索過已添加關鍵詞的人,在其瀏覽指定的投放網站時投放客戶推廣組下的創意。);若是有微博數據,則能夠加入關注與被關注的行爲(新浪有此打算嗎?),所以人羣行爲各公司的定義差別是最大的。

購物行爲(purchasing)

購物行爲指的是做爲消費者角色,互聯網用戶的消費數據。毋庸置疑,購物數據若是淘寶是第二,也沒人能夠自稱第一。

在廣告系統中,用戶的全部屬性或行爲應該是能夠進行自由組合設定的。但以上全部的屬性或行爲就能夠全方面的瞭解用戶了嗎?並非!這是一個發散性的命題,每一個人會有不一樣的看法。好比咱們還能夠加入用戶的設備(PC、Pad、移動設備等),經過用戶上網通道來描述用戶。還有其餘的角度嗎,你們留言討論吧!

併發次數

在按天售賣或者按時間售賣的時代,是不須要考慮併發次數的。只是在按照展示次數(CPM)售賣的時候,咱們纔有可能須要考慮廣告併發的設置。

在按照CPM(何爲CPM)售賣時,廣告投放的速度能夠有兩種——儘快投放和勻速投放。儘快投放很好理解,就是儘快投放完規定的量。勻速投放就是在規定的時間內均勻的投放完規定的量。舉個例子,一天以內投放1000個CPM,選擇儘快投放就意味着廣告在第x小時投放完畢,那麼(24-x)的時間內就不會再看到廣告;而勻速投放意味着咱們須要在第23小時59分時還看到廣告。這個如何作到呢?此時就須要利用併發次數的設定了。

併發次數指的是廣告某個時間週期內播放的次數,其目的是爲了保證廣告的勻速投放。併發次數的計算方法爲:廣告投放量/投放時長。注意:此處的時長根據須要,能夠按照秒、分、刻等單位來計算。併發次數的規則須要廣告投放核心的支持,當在規定的時長內,廣告未達到併發次數時,廣告能夠展示。達到設置次數後,則不予以展示。

一個思考題:若是一個廣告一天內要求投放1000CPM,而媒體的PV一天正好是1000CPM,那麼儘快投放是否可以跑完廣告的規定量?勻速投放是否可以跑完廣告規定的量?若是跑不完,咱們須要怎麼作,才能夠跑完?

時段定向

每個廣告活動,每一次宣傳活動,都會有周期的設定。在一個投放活動被制訂出來後,在每種媒介、每一個媒體上的投放週期就已經肯定了。電視、廣播、報紙雜誌是以節目的播放時間、廣告順序以及報刊雜誌的期數來決定投放的週期的。互聯網廣告則以開始日期、結束日期以及投放時段來決定投放週期的(須要注意的是:投放時間是以服務器的時間爲準的)。

說明:互聯網的時間使用的是UTC時間體系,北京時間=UTC+8。(關於UTC時間和GMT時間以及北京時間的關係

問題:在廣告系統設計時,怎樣設計可使用戶方便快捷的設置天天不一樣的投放時段?

網頁定向

網頁定向指的是針對特定的URL進行定向,使廣告投放在指定的URL上。網頁定向是互聯網廣告定向中不常使用的定向。

網頁定向最核心的技術有兩個:

一、如何獲取當前頁的URL,注意是當前頁非Http Header中的Reffer。當前頁URL須要經過加在頁面上的JS代碼得到,設計時須要考慮到若是JS代碼被放在iFrame中的狀況,甚至會被放置到好幾層嵌套的iFrame上(這樣放置代碼的媒體更多爲了做弊,能夠參見在線廣告做弊手段一覽【見下】)。

二、廣告系統在定向設置時須要考慮到URL匹配問題。左匹配、右匹配、包含、不包含、通配符等。匹配規則須要在廣告投放核心進行處理。

訪客頻次

頻次是廣告投放中一個很是重要的概念。網絡廣告的頻次和其餘媒介投放時的頻次概念是一致的。

頻次是指我的或家庭接觸廣告信息的次數。在傳統的電視媒介中,咱們不能準確的控制每個人接觸廣告信息的次數,只能是經過總收視點除以到達率計算得出。可是在網絡廣告中,一我的能夠接觸廣告信息的最高頻次是能夠嚴格控制的,實現嚴格控制的基礎技術也是cookie,可見cookie對於互聯網廣告精準投放的重要性。

在網絡廣告的投放中,頻次的控制對象比其餘媒介更普遍,頻次能夠控制廣告的瀏覽、點擊、完整瀏覽,甚至是廣告的轉發、下載等其餘的行爲,所以互聯網的頻次指的是訪客與廣告發生互動的最高次數,而互動的行爲設定則須要可以在廣告系統中進行設置。固然常常仍是對廣告的瀏覽進行頻次設置,咱們也以此舉例。

網絡廣告頻次控制的原理很是簡單。當用戶經過瀏覽器訪問頁面時,會請求放置在頁面的廣告位代碼,廣告位代碼和服務器進行交互,廣告位代碼將用戶的cookie信息(包含對廣告的訪問次數)傳給服務器(若是沒有cookie,服務器會生成一個),服務器進行頻次的匹配,超過頻次設定的廣告將不會被投放,在同時判斷了其餘定向條件後,服務器回傳適合的廣告到瀏覽器進行投放,在返回信息的同時,還會將用戶cookie上此廣告的瀏覽次數加1。經過這種方式,網絡廣告實現了精確的頻次控制。

廣告投放中,並非頻次越高越好,過少的接觸不會在接觸的用戶心中產生印象,過多的接觸反而會使接觸的用戶產生不快,厭惡。1972年,美國心理學家赫爾伯特.克魯格曼通過研究,確立了消費者接觸廣告三次的心理學關係:第一次好奇:「這是什麼?」第二次是認識:「幹什麼用的?」第三次是判斷:「對廣告產生什麼印象?」。固然,由於產品、市場、品牌、競爭、創意以及媒體等不一樣,在頻次設置上也會有所不一樣,不過,對廣告的有效接觸頻次限定通常都是以3次爲底限的。

爲了瞭解廣告的投放效果,在報表中,廣告系統通常會提供平均接觸頻次、頻次分佈圖。

討論:頻次分佈圖是什麼樣子?設計時須要注意什麼?

關鍵詞定向

咱們所講的關鍵詞定向實際上就是Google AdWords中的內容相關廣告(Contextual)。

關鍵詞定向實現必須具有如下能力:

抓取網頁內容並進行分析的能力

分析時須要考慮到頁面的結構、html標籤、連接等影響,對頁面的正文進行分析,獲得最恰當的一些關鍵詞來描述頁面所表達的內容。關鍵詞定向是否有效的瓶頸即在於此。

須要注意的是,因爲實時快速分析頁面的要求很是高,當頁面足夠多的時候,系統執行效率會很是的低下,所以必須具備提早抓取有可能出現廣告頁面的能力。

固然,實時快速分析一樣重要。

廣告系統中設置廣告投放關鍵詞的能力

須要可以確保操做人員能夠方便快捷的在系統中進行關鍵詞的設置(正向選擇、反向排除),若是可以提供對以前投放的關鍵詞效果分析及推薦更好。

投放核心快速匹配投放能力

將1的分析結果和2的投放設置進行快速匹配並進行投放,這是最根本的要求。

關鍵詞定向的效果:

3、網絡廣告反做弊:

在線廣告做弊手段一覽

如下文章的內容轉自牛人掃地老僧的blog,原文連接地址爲 URL: http://www.doyj.com/2011/11/11/在線廣告做弊手段一覽/。如下爲正文:

這裏提到的在線廣告做弊是指媒體爲了刷廣告流量而進行的做弊。他們的做弊手段不少, 這裏介紹常見的幾種。

iframe是廣告做弊最經常使用的技巧,就是在本身的網頁上嵌入iframe, 大小爲0×0或1×1,也就是用戶不可見。經過iframe打開其餘頁面,在用戶看不見的狀況下刷流量。別看iframe簡單,裏面花樣不少。

一、頁面內嵌入本站頁面的iframe

iframe打開和當前頁同樣的頁面地址,或本站的其餘頁面。 這樣用戶的一個瀏覽行爲,很輕鬆就從1個pv翻倍變成2個pv。若是嵌入iframe多點, 就能翻3倍,4倍…。

但使用這個方法很容易被發現,廣告投放方,經過分析UV,獨立IP等很容易就發現異常。 這是很老的方法,不過仍是有些網站樂此不疲。

二、兩個站點間互相嵌入對方站點頁面的iframe

這是比較巧妙的做弊技巧,UV,獨立IP等分析方法是不能發現異常的。

三、雙層iframe

做弊的iframe爲了避免讓人看見,大小隻有0×0或1×1,但有些在線廣告在顯示時會判斷瀏覽窗口大小,若是過小可能就不能顯示。這時有些網站就採用了雙層iframe技術來刷廣告流量。 第一層1×1大小的iframe中又嵌入一個iframe,這個第二層iframe是正常瀏覽窗口大小,廣告代碼很難發現異常。

這種做弊方式使用巧妙的,會讓主頁面和兩個iframe使用三個不一樣的域名,這樣由於跨域的問題, 裏面的js不可能獲得最外層真正的頁面地址, 想抓證據都抓不到。

四、IP屏蔽

有些站點在進行做弊時,會屏蔽北京,上海等大城市的訪問,你從這些地區訪問時,看不到他們的做弊代碼,一切正常。等換用其餘地方的代理訪問時,你在他們頁面裏就能看到做弊用iframe代碼。 這是由於不少IT,在線廣告公司都在這些大城市,這種屏蔽讓他們的做弊手段很難被同業發現。

五、購買垃圾流量

如今來自iframe,木馬的垃圾流量都是明碼標價在賣的,能夠用這些流量來刷頁面,刷廣告。這種也比較難以發現。

網站去刷流量目的每每比較複雜,一是刷廣告流量,賺廣告商和廣告主的錢,二是爲了alexa之類的排名,也有是爲了給投資人看所謂的「業績」。

上面談的基本都是CPM廣告方式的做弊,下面說說其餘的。

六、CPC做弊

CPC做弊實際上是很簡單的,只要用iframe打開點擊連接便可。

七、CPA做弊

有些網站廣告按CPA結算,好比註冊人數等。 這種狀況下,有的公司會作專門的自動註冊機,保證你的註冊人數瘋狂上漲。

八、CPS做弊

不少人感受CPS方式是不可能做弊的,其實這也是能夠的。 賣個關子,下次和你們介紹。

其實大多數做弊方法經過耐心細緻的分析,不難發現端倪。 但中國在線廣告的做弊仍是至關嚴重,造成這種現象的緣由是蠻有意思的,和多人都探討過, 有時間另寫個博文分析。

[轉載正文結束]

掃地老僧一直走在高精尖道路上,所以以上提到的都是比較巧妙以及難以發現的做弊方式,常常是一些流量比較大的媒體使用。不過目前還有大量的小流量媒體採用更原始的方式,那就是強制刷新頁面,在用戶看頁面時,每一個幾秒頁面就刷新一次。

相關文章
相關標籤/搜索