時間特徵.net
https://blog.csdn.net/haolexiao/article/details/85003454blog
這幾天對於時間序列的預測,須要時間這一特徵值,月份,星期等等。對於這些時間序列特徵須要怎麼去刻畫和表示嗯?ci
one-hot方法io
一個直觀想到的方法就是one-hot法,可是仔細考慮一下,one-hot真的適合表示時間序列嗎?class
one-hot適用於的特徵應該是分類特徵,並且不一樣類別之間的距離是沒有差異的,好比紅黃藍三種顏色,漢字等等用one-hot表示是很好的。可是對於時間序列,5點和6點跟18點之間的距離明顯是不一樣的,因此用one-hot來度量的話,會損失很是多的信息。變量
數字表示方法
那麼第二種能想到的方法就是用數字去表示,好比1表明1點,4表明4點等等,可是面臨的一個問題就是23點明明和0點距離很近,可是用這種方法會致使23點和0點距離太遠,形成一些偏差。error
形成上述偏差的因素在於時間序列有周期性,好比一天的24小時,一週的7天等等,那麼咱們將其作一個轉換,將其轉換成周期變量便可dict
變量週期變量週期(cos(\frac{2\pi 變量}{週期}), sin(\frac{2\pi 變量}{週期}))di
(cos(
週期
2π變量
),sin(
週期
2π變量
))
如上所示,將一個時間變量變成一個二維平面圓周上的點。這樣就能解決週期性因素。
參考文獻:
Top 6 errors novice machine learning engineers make
Use of circular predictors in linear regression