特徵工程:特徵生成,特徵選擇(三)

特徵生成 特徵工程中引入的新特徵,需要驗證它確實能提高預測得準確度,而不是加入一個無用的特徵增加算法運算的複雜度。 1. 時間戳處理 時間戳屬性通常需要分離成多個維度比如年、月、日、小時、分鐘、秒鐘。但是在很多的應用中,大量的信息是不需要的。比如在一個監督系統中,嘗試利用一個’位置+時間‘的函數預測一個城市的交通故障程度,這個實例中,大部分會受到誤導只通過不同的秒數去學習趨勢,其實是不合理的。並且
相關文章
相關標籤/搜索