如何理解數據科學的中的數據泄露(Data Leakage)

數據科學競賽中有時會出現這樣的奇特景觀:某隻隊伍,靠着對極個別feature的充分利用,當即將對手超越,成功霸佔冠軍位置,並且與第二名的差距遠超第二名與第十名的差距。然而,這些feature卻不是在因果關係上順利解釋預測值的‘因’,反而是預測值的‘果’。安全 1. Data Leakage定義 存在和利用這種倒‘因’爲‘果’的feature的現象,叫數據競賽中的Data Leakage。網絡 這裏
相關文章
相關標籤/搜索