NLP-數據預處理後的特徵選擇

學習筆記,,備忘錄。。。 內容來源:知乎:特徵工程究竟是什麼?python 實際應用中的數據每每不少,並存在不相關的特性,特性之間也可能存在相互依賴。 經過特徵選擇剔除不相關或冗餘的特徵,減小特徵個數,減小運行時間的目的。 數據預處理後,須要選擇有意義的特徵,而後再輸入機器學習的算法和模型進行訓練。 1、相關係數法 計算各個特徵對目標值的相關係數,選擇更加相關的特徵。 原始數據: 步驟說明:web
相關文章
相關標籤/搜索