決策樹-屬性缺失處理

數據集中的樣本通常在某些屬性上是缺失的,如果屬性缺失的樣本數量較少,我們可以直接簡單粗暴的把不完備的樣本刪掉。但如果有大量樣本都有屬性值缺失,那麼就不能簡單的刪除了,因爲這樣刪除了大量有用信息,模型性能會有影響。本篇博客介紹如何處理屬性缺失的樣本。 1.如何在屬性缺失的情況下進行屬性選擇(比如「色澤」這個屬性值缺失,那麼如何計算「色澤」的信息增益) 2.給定劃分屬性,若樣本在該屬性上的值是缺失的,
相關文章
相關標籤/搜索