數據泄露

參考:https://www.kaggle.com/alexisbcook/data-leakage Data leakage 當您的訓練數據包含有關目標的信息時,就會發生數據泄漏(或泄漏),但是當模型用於預測時,類似的數據將不可用。這將導致訓練集(甚至可能包括驗證數據)的高性能,但是模型在生產中的表現會很差。泄漏有兩種主要類型:target leakage和train-test contamin
相關文章
相關標籤/搜索