機器學習之數據預處理

一. 缺失值處理 對於數據集中顯示NaN的缺失值進行處理(不同數據集缺失值顯示狀態可能不同) 1.刪除法 通過刪除包含缺失值的數據,得到一個完整的數據子集。刪除既可以刪除特徵(列),也可以刪除樣本(行)。 刪除特徵:當某個特徵缺失值較多,且該特徵對數據分析目標影響不大時,可將該特徵刪除。 刪除樣本:當某些樣本多個特徵值缺失,且存在缺失值樣本佔整個數據集樣本數量比例不高時刻刪除樣本。 2 .均值填補
相關文章
相關標籤/搜索