機器學習中的數據泄露(Data Leakage)

在 Kaggle競賽中出現過奇怪的現象:一隻隊伍,靠着對極個別特徵feature的充分利用(被稱爲魔法屬性),立即將對手超越,成功霸佔冠軍位置。然而,這可能是競賽方數據準備過程中出現的失誤,使模型沿着有紕漏的,甚至是顛倒的因果關係進行預測,但在測試數據中得到預測結果是極好的。 1.什麼是機器學習中的 Data Leakage ? 數據泄漏Data Leakage是在數據分析中需要解決的重要問題之一
相關文章
相關標籤/搜索