二、數據預處理——缺失值處理

機器學習和數據挖掘中所使用的數據,永遠不可能是完美的。很多特徵,對於分析和建模來說意義非凡,但對於實際收集數據的人卻不是如此,因此數據挖掘之中,常常會有重要的字段缺失值很多,但又不能捨棄字段的情況。因此,數據預處理中非常重要的一項就是處理缺失值。 在這裏,我們使用從泰坦尼克號提取出來的數據,這個數據有三個特徵,一個數值型,兩個字符型,標籤也是字符型。從這裏開始,我們就使用這個數據給大家作爲例子,讓
相關文章
相關標籤/搜索