SEM翻譯過來叫搜索引擎營銷,我的認爲是隨着搜索引擎競價排名出現的一個行業,已經有了好多年的歷史,作sem的公司這些年裏手裏應該都積攢着大量的cookie,關鍵詞等與SEM和追蹤相關的數據,這些數據如今更可能是用來給用戶報表使用的,但其實我的認爲這些數據經過RTB便可以變現又能夠爲廣告主提供更好的解決方案,只不過如今好多SEM公司沒有找辦挖掘的辦法而已.redis
DSP(需求方平臺)是隨着RTB(實時競價)而興起的一個產業,這個東西的規則就是當一個用戶訪問了一個網頁,這個網頁上有些廣告位是給了RTB的,則rtb會將這個用戶的ID和廣告位等信息下發到在它這注冊的DSP們,而DSP須要在一段時間內(一般是100ms)返回競價信息和廣告信息,而後由rtb根據本身的競價規則(一般是出價最高的那個)來進行展現.sql
這二個東西我的感受有很強的互補性.緣由有如下幾點:mongodb
1.dsp能夠爲sem公司增長了收入來源:sem是嚴重依附於PC端的搜索引擎流量的,在國內基本能夠說是嚴重依附着百度PC端的流量的,而隨着互聯網用戶的注意力往移動端的轉移,搜索的統治力和PC端的流量的增加會放緩,甚至是見頂,這時搜索引擎的ROI應該就沒那麼有吸引力了,同時各個SEM公司之間也會陷入到刀刀見血的價格戰裏,而DSP卻能夠給sem公司另外一個收入來源.cookie
2.DSP能夠對sem的歷史數據進行有效的變現:DSP我的認爲算是一個大數據時代的產物,是嚴重依賴於用戶的歷史行爲數據的,而sem通常又有大量的用戶行爲數據(通常cookie都是億級的).同時數據的質量也還不錯(通常都會有用戶的quey信息,用戶的url信息以及用戶在廣告主那的追蹤信息),只要在dsp這作好cookie mapping, 哪怕只是經過簡單的url重定向和query重定向這種匹配方式,應該也能得到不錯的ctr和cpc.app
3.dsp能夠爲廣告主提供更個性化的定製:由於競價排名的核心規則是搜索引擎本身定的,因此sem應該是很難爲廣告主提供一些更深刻,更個性化的解決方案的.好比蘇寧須要把本身的廣告展示給京東的用戶看或者蘇寧的母嬰頻道要對老客戶作優惠活動,須要把這個信息傳送給他的老客戶,這些須要應該是sem所很難作到的,但DSP能夠作到這些.運維
4.DSP能夠補充搜索廣告過重效果的問題:搜索廣告過重效果,致使對某些偏展現性的需求知足的並很差(有人說百度有網盟,但網盟與其說是用來補充搜索廣告不足的.倒不如說是用來快速消耗廣告主未花了的bugdet的.我有個朋友開陪訓的,用百度投的廣告,基本反應就是網盟花錢根本就沒數,並且效果也沒看到有多好,相反搜索的廣告效果還不錯)機器學習
5.DSP和SEM是互動的:即若是有一個新的廣告主,可讓其先作SEM,一來能夠經過SEM來完成一部分種子數據的累積,二來能夠在這段時間來作好與廣告主的COOKIE MAPPING,來近能夠的盤活廣告主這邊的數據。nosql
技術的實現:分佈式
這裏就簡單說幾句,我的比較認同品友互動的觀點,即DSP須要有RTB能力和數據挖掘能力,學習
rtb能力:一方面是系統的構建能力,建議多用用nosql的技術(redis,mongodb),同時必定要作好cookiemapping,這樣纔可能讓每一個用戶的信息都是獨立的,不依賴於其它用戶的,另外一方面是RTB的流量預測和分配了,預測問題初期建議多分析分析日誌,簡單的count應該就成.分配問題建議參考一下以前轉的合約廣告的文章,離線算出一個server rank,而後根據server rank來分配流量
數據挖掘的能力:一方面是大規模分佈式平臺的搭建和運維能力(基本等於同於大規模離線存儲,MR,MPI)這個算是進行大規模機器學習的基礎.另外一方向就是機器學習的能力了,若是公司初期沒有好的人,建議受從定向這塊就好好弄弄query重定向和url重定向,看看效果再說.若是團隊不錯,則能夠經過爲每位廣告主訓練一個用戶的二元分類器,來幫助廣告主完成上面所說的更深刻更個性的需求,至於算是通用的ctr預估(用邏輯迴歸來作的)和網頁上下文分析(用topic moudle來作),能作就作,作不了就先拿些簡單的方案來替代吧