缺失值處理的三種方法

  缺失值處理的三種方法:直接使用含有缺失值的特徵;刪除含有缺失值的特徵(該方法在包含缺失值的屬性含有大量缺失值而僅僅包含極少量有效值時是有效的);缺失值補全。 常見的缺失值補全方法:均值插補、同類均值插補、建模預測、高維映射、多重插補、極大似然估計、壓縮感知和矩陣補全。 (1)均值插補 如果樣本屬性的距離是可度量的,則使用該屬性有效值的平均值來插補缺失的值; 如果的距離是不可度量的,則使用該屬性
相關文章
相關標籤/搜索