用python作時間序列預測三：時間序列分解

時間 2020-06-03

原文原文鏈接

在初始概念篇中，咱們簡單提到了時間序列由趨勢、週期性、季節性、偏差構成，本文將介紹如何將時間序列的這些成分分解出來。分解的使用場景有不少，好比當咱們須要計算該時間序列是否具備季節性，或者咱們要去除該時間序列的趨勢和季節性，讓時間序列變得平穩時都會用到時間序列分解。python

加法和乘法時間序列

時間序列的各個觀測值能夠是以上成分相加或相乘獲得：
Value = Trend + Seasonality + Error
Value = Trend * Seasonality * Errorgit

分解

下面的代碼展現瞭如何用python從時間序列中分解出相應的成分：github

from statsmodels.tsa.seasonal import seasonal_decompose
from dateutil.parser import parse

# Import Data
df = pd.read_csv('https://raw.githubusercontent.com/selva86/datasets/master/a10.csv', parse_dates=['date'], index_col='date')

# Multiplicative Decomposition 
result_mul = seasonal_decompose(df['value'], model='multiplicative', extrapolate_trend='freq')

# Additive Decomposition
result_add = seasonal_decompose(df['value'], model='additive', extrapolate_trend='freq')

# Plot
plt.rcParams.update({'figure.figsize': (10,10)})
result_mul.plot().suptitle('Multiplicative Decompose', fontsize=22)
result_add.plot().suptitle('Additive Decompose', fontsize=22)
plt.show()

# Extract the Components ----# Actual Values = Product of (Seasonal * Trend * Resid)
df_reconstructed = pd.concat([result_mul.seasonal, result_mul.trend, result_mul.resid, result_mul.observed], axis=1)
df_reconstructed.columns = ['seas', 'trend', 'resid', 'actual_values']
df_reconstructed.head()