特徵工程:特徵生成,特徵選擇(三)

特徵生成 特徵工程中引入的新特徵,須要驗證它確實能提升預測得準確度,而不是加入一個無用的特徵增長算法運算的複雜度。html 1. 時間戳處理 時間戳屬性一般須要分離成多個維度好比年、月、日、小時、分鐘、秒鐘。可是在不少的應用中,大量的信息是不須要的。好比在一個監督系統中,嘗試利用一個’位置+時間‘的函數預測一個城市的交通故障程度,這個實例中,大部分會受到誤導只經過不一樣的秒數去學習趨勢,實際上是不
相關文章
相關標籤/搜索