機器學習算法進階(數據清洗和特徵選擇)

一、數據降維 降維就是一種對高維度特徵數據預處理方法。降維是將高維度的數據保留下最重要的一些特徵,去除噪聲和不重要的特徵,從而實現提升數據處理速度的目的。在實際的生產和應用中,降維在一定的信息損失範圍內,可以爲我們節省大量的時間和成本。降維也成爲應用非常廣泛的數據預處理方法。 降維優點: 使得數據集更易使用、降低算法的計算開銷、去除噪聲、使得結果容易理解。 二、主成分分析(PCA) 2.1 PCA
相關文章
相關標籤/搜索