樹模型爲什麼自然的處理缺失值

樹模型處理缺失的方法。    如圖,假設有100個樣本,針對屬性A,有20個樣本是缺失值。樹模型處理缺失樣本的時候,會先忽略屬性A缺失的樣本,然後採用某種屬性選擇度量(信息增益、增益率、基尼指數)對剩下的樣本(現在有80個)進行分裂。假設將這80個樣本分裂到圖中的三個節點,三個節點分配到的樣本數分別爲30、25、25(稱這個過程爲過程一)。然後將屬性A缺失的20個樣本均加入到這三個節點中(稱這個過
相關文章
相關標籤/搜索