缺失數據處理-插值法

1. 前言 在數據挖掘中,原始數據中存在着大量不完整、偏離的數據。這些問題數據輕則影響數據挖掘執行效率,重則影響執行結果。所以數據預處理工做必不可少,而其中常見工做的就是數據集的缺失值處理。python 數據缺失值處理可分兩類。一類是刪除缺失數據,一類是進行數據插補。前者比較簡單粗暴,可是這種方法最大的侷限就是它是以減小歷史數據來換取數據的完備,會形成資源的大量浪費,尤爲在數據集自己就少的狀況下,
相關文章
相關標籤/搜索