廣告點擊率預估中貝葉斯平滑

廣告點擊率預估是一個很是經典的轉化率預估問題,在互聯網時代,廣告做爲互聯網公司盈利的一種重要手段或方法,而廣告又分爲不少種(這部分的知識能夠課後腦補一下),今天主要講下在計算廣告當中,競價廣告涉及到的ctr預估遇到的平滑問題。這裏先解釋一下競價廣告:簡單講來就是廣告主須要在媒體投放平臺投放廣告,而媒體須要經過多個廣告主競價,價高者得的方式來獲取利潤。而這裏主要介紹兩種競價方式:一、CPM方式,二、CPC方式;函數

CPM方式是按照千次展現固定的價格來收費,這裏實際上不涉及競價。而CPC是根據廣告主出的低價,乘以ctr;再乘以1000獲得一個最終的價格。atom

因此這裏的ctr預估對於廣告主來講是很是重要的,若是ctr預估太高,致使投放成本很快用完,沒法達到預期投放目標;而ctr預估太低,就沒法獲得曝光展現機會。spa

而CTR預估中,ctr平滑就是一個很是重要的過程:下面首先來說講貝葉斯平滑是個什麼東西3d

一、貝葉斯平滑假設前提xml

當某個廣告曝光給到用戶,用戶點擊或者不點擊是服從二項分佈:(通俗的理解,所謂二項分佈就是n次伯努利機率分佈)伯努利分佈就是用戶是否點擊廣告服從伯努利分佈。即blog

因此某個廣告點擊率CTR能夠理解成,n個用戶是否點擊廣告的機率分佈,而用戶是否點擊廣告服從伯努利分佈,n個用戶,則該廣告的點擊率是符合二項分佈,轉化成最大似然估計。則是n個用戶是否點擊該廣告的機率最大即爲轉化率。class

而爲了求得這個最大似然估計,經過利用用戶的歷史數據做爲先驗機率,利用貝葉斯原理,預估出後驗機率。這裏咱們用廣告的轉化率CTR對應指望做爲目標函數,則對應損失函數以下所示:原理

r表示根據歷史獲得先驗機率指望,^r表示真實機率指望。即便得L(^r,r)最小。而後咱們就獲得這個東西互聯網

 而上式中,對於點擊次數,服從的是二項分佈,即f(C,I|r)Bin(r)f(C,I|r)∼Bin(r)。二項分佈的共軛先驗是Beta分佈。Beta分佈我理解是表示正負樣本真實機率的一個分佈,其中有兩個參數,a和b,分別表示正樣本個數,和負樣本個數。也能夠將CTR理解成是一個服從Bate分佈的。因而咱們就獲得下面的轉化率結果:方法

 

貝葉斯平滑參數計算:

相關文章
相關標籤/搜索