京東JData算法大賽小結(公司內部賽)

總體解決方案 本文將高潛用戶購買意向預測,抽象爲一個二分類問題。從用戶,商品,品牌,用戶-商品,用戶-品牌五個維度進行特徵提取。將觀察天未來5天有購買行爲的用戶-商品對標記爲正樣本,觀察天過去30天至未來5天有交互行爲但未購買的用戶-商品對標記爲負樣本。由於正負樣本比例極不平衡,採用了對正樣本進行重採樣及負樣本進行下采樣的方式來平衡正負樣本比例。利用xgboost進行模型訓練,最後利用LR對預測結
相關文章
相關標籤/搜索