【NLP複習】數據預處理和特徵選擇:方差、相關係數、K方檢驗、互信息、樹模型

先拿一張特徵工程的導圖鎮樓。本文主要複習特徵工程的核心——特徵處理(數據預處理,特徵選擇,降維)。 一、數據預處理 量綱不統一怎麼辦?(貓咪的身高和體重) 標準化(前提是特徵值服從正態分佈,通過算特徵的均值和標準差轉成標準正態分佈) 區間縮放法(利用兩個最值進行縮放,將特徵取值縮放到某範圍,例如[0, 1]等) 標準化與歸一化的區別(標準化按特徵值,也就是按列;歸一化按行搞成單位向量) 定量特徵信
相關文章
相關標籤/搜索