特徵選擇與特徵工程初探

特徵工程是機器學習的第一步,涉及清理現有數據集、提升信噪比和下降維數的全部技術。大多數算法對輸入數據有很強的假設,當使用原始數據集時,它們的性能可能會受到負面影響。python 另外有些特徵之間高度相關,在其中一個特徵提供了足夠的信息以後,與之相關的其餘特徵每每沒法提供額外的信息。這時咱們就須要瞭解如何減小特徵數量或者僅選擇最佳特徵。web 1、scikit-learn數據集 scikit-lea
相關文章
相關標籤/搜索