數據挖掘-特徵探索

1、基本特徵 1.1特徵量 對特徵進行一個全面的認知 1.2特徵 查看具體的特徵,可以用來判斷特徵是否獲取完全,訓練集和測試集是否特徵相同 1.2數據簡況 數據概況更深層度瞭解字段 1.3偏度和蜂度 理論上算法可以擬合所以的分佈,但是實際訓練很難做到,算法只能對一些情況下效果很好 特徵以及訓練的預測字段最好符合正態分佈,方便模型更好的收斂 1.4 缺失情況 確定缺失的字段以及數量,避免對模型造成影
相關文章
相關標籤/搜索