數據挖掘競賽黑科技——對抗驗證(Adversarial validation)

通常情況下,我們一般都會使用交叉驗證來作爲評估模型的標準,來選擇我們最後的模型。但是在一些數據挖掘競賽中,數據集一般分爲訓練集合測試集,國內比賽可能根據比賽階段劃分多個測試集,由於數據集採樣和分佈的原因導致訓練集和線上測試集可能存在分佈不一致的情況,這時候CV無法準確的評估模型在測試集上的效果,導致線上線下不統一,分數上不去。而緩解這一問題的黑科技,就是對抗驗證Adversarial valida
相關文章
相關標籤/搜索