機器學習算法面試題——聚類算法

【1】當數據缺失時怎麼處理,除了直接捨去還有什麼方法。如何使用聚類算法去填補缺失值。 答: 對於缺失值較多的特徵處理:我們直接將該特徵棄掉,否則可能反倒會帶入較大的noist,對結果造成不良影響。 對於缺失值較少的特徵處理: (1)把缺失值用一個數值,例如0表示; (2)均值,中值,分位數、衆數,隨機數,上下數據填充,插值法; (3)用算法擬合進行填充; 對於如何使用聚類算法去填補缺失值,我想到的
相關文章
相關標籤/搜索