分享 :準備數據時如何避免數據泄漏

作者:Jason Brownlee   翻譯:張一然  校對:李潔 本文約5000字,建議閱讀10分鐘。 本篇文章主要介紹了幾種常用的數據準備方法,以及在數據準備的過程中如何避免數據泄露。 數據準備是將原始數據轉換爲適合建模的形式的過程。 原始的數據準備方法是在評估模型性能之前對整個數據集進行處理。這會導致數據泄漏的問題, 測試集中的數據信息會泄露到訓練集中。那麼在對新數據進行預測時,我們會錯誤地
相關文章
相關標籤/搜索