uplift model學習筆記

1、解決的問題:git

  一般的 Propensity Model 和 Response Model 只是給目標用戶打了個分,並無確保模型的結果可使得活動的提高最大化;它沒有告訴市場營銷人員,哪一個用戶最有可能提高活動響應;算法

  所以,須要另一個統計模型,用來定向那些能夠被營銷推廣活動明顯驅動他們偏好響應的用戶,也就是「營銷敏感」用戶;機器學習

  Uplift Model的最終目標就是找到最有可能被營銷活動影響的用戶,從而提高活動的反響(r(test)-r(control))、提高ROI、提高總體的市場響應率;學習

  所以,模型要避免推廣預算花在優化

  (一)從購買者角度來看:設計

  (1)天然反應的用戶(即不須要營銷也會來的用戶);(2)頑固不會響應的用戶;blog

  (二)從流失者的角度來講:get

  (1)確定的用戶;it

  (2)由於進行了市場推廣反而流失的用戶;io

  (3)沒有意識到是否有這個活動會有什麼影響的用戶;(即營銷不敏感的用戶)

2、什麼是uplift model ?

  直接爲treatment所帶來的影響提高建模;

3、如何進行uplift modeling?(差分響應)

方法(一):

一、創建兩個logistic模型

Logit(Ptest(response|X,treatment =1)) = a+ b*X +c*treatment

Logit(Pcontrol(response|X,treatment=0) ) = a + b*X 

二、將兩個得分相減,計算uplift score

Score = Ptest(response|X,treatment =1) - Pcontrol(response|X,treatment =0)

方法(二):

只用一個模型,可是創建兩個一樣的;

一、Logit(P(reponse|X) = a + b*X + c*treatment + d* treatment *X

二、將兩個得分相減獲得uplift score

Score = P(response|X,treatment =1) - P(response|X,treatment =0)

 方法(三):

knn modeling

方法(四):

Naive Bayes

 4、uplift model使用過程當中須要注意的問題:

一、訓練樣本

  因爲強化學習須要用到的是反饋數據,所以訓練樣本的及時及自動更新會是比較重要的方面(尤爲是label的更新和實時特徵的更新),才能體現出來強化學習優於機器學習的地方,使用用戶反饋的標註樣原本更新訓練樣本庫,可使得反饋及時地獲得學習,從而優化算法效果;

二、label設計問題

三、問題定義

  uplift的點與運營活動指標完美結合

四、冷啓動策略問題

五、抽樣訓練時樣本有偏的問題

 

 

總結:

   "Where traditional predictive modeling focuses on the outcome, uplift modeling focuses on the effectiveness of the treatment.Then, you can target resources on the cases that are likely to be positively impacted by the treatment."

  Uplift Model 的精髓是,它專一於做用以後效果的提高,所以區分出「營銷/覈銷敏感人羣」這一步特別重要,也是篩選特徵的重要考慮方面;它對ROI結果的優化,不是在於模型設計的複雜,而是在於將ROI的思惟策略融入到了模型當中。

  可是其實ROI並不只僅是提高覈銷率,從長遠的營銷價值來講,ROI最優化還須要考慮用戶的終身價值,也就是對用戶所投入的每一分錢,是否對該用戶長遠來看給企業帶來的價值是最大化的。

  Uplift Model對正負樣本的定義就是,with treatment 和 without treatment的時候,是否具備response。

  

上圖就是uplift model的建模假設矩陣。

相關文章
相關標籤/搜索