如何理解推薦系統離線和線上auc和線上點擊率不一致的問題?

目錄 1. 特徵/數據出現穿越 2. 線上線下特徵不一致 3. 數據分佈的不一致 離線指標和線上指標不一致是個常見的問題,花了很大力氣好不容易離線auc漲了不少,上線一看效果ctr和cpm反而下降。本文例舉幾種可能的原因和解決辦法。 1. 特徵/數據出現穿越 一般就是使用了和label強相關的特徵導致的數據泄漏。這種問題一般相對好查,很多時候在離線階段就能發現。明顯的表現就是訓練集和測試集差異比較
相關文章
相關標籤/搜索