機器學習中的數據泄露(Data Leakage)

在 Kaggle競賽中出現過奇怪的現象:一隻隊伍,靠着對極個別特徵feature的充分利用(被稱爲魔法屬性),當即將對手超越,成功霸佔冠軍位置。然而,這多是競賽方數據準備過程當中出現的失誤,使模型沿着有紕漏的,甚至是顛倒的因果關係進行預測,但在測試數據中獲得預測結果是極好的。web 1.什麼是機器學習中的 Data Leakage ? 數據泄漏Data Leakage是在數據分析中須要解決的重要問
相關文章
相關標籤/搜索