缺失值處理知識點整理

來源《Python數據分析與數據化運營》 批註1: (丟棄)不宜採用的場景: (1)數據集總體中存在大量的數據記錄不完整情況且比例較大,例如超過10%,刪除這些帶有缺失值的記錄意味着將會損失過多有用信息。 (2)帶有缺失值的數據記錄大量存在着明顯的數據分佈規律或特徵,例如帶有缺失值的數據記錄的label主要集中於某一類或者某積累,如果刪除會導致對應的數據樣本丟失大量特徵信息,導致模型過擬合或分類不
相關文章
相關標籤/搜索