目錄html
從若干學術論文中總結出的一些混頻數據處理技術、模型與使用案例,但願爲賣方的宏觀研究提供來自學術界的思路。爲了顧及實踐中的可操做性,忽略了一些結構過於複雜的技術或模型。git
標準的集成方法根據低頻數據的週期對高頻數據作平均或累加,另外一種方法是根據低頻數據的週期選取高頻數據的最新值。github
插值方法不經常使用,實施分兩步:框架
可能須要考慮度量增長插值數據帶來的偏差。spa
因爲統計數據的發佈有時間延遲,在實際使用預測模型時可能某些高頻數據還沒有發佈,這時就須要橋接等式補全未發佈的數據。htm
橋接等式是用於鏈接高頻數據和低頻數據的線性迴歸,橋接等式:遞歸
\[ y_{t_q} = \alpha + \sum_{i=1}^{j}\beta_i(L)x_{it_q} + u_{t_q} \]索引
其中,\(\beta_i(L)\) 是一個階數爲 \(k\) 的滯後多項式,\(x_{it_q}\) 是集成後的高頻指標。ci
橋接等式的實施分兩步:get
高頻數據上的預測模型一般是自迴歸模型。
做者針對真實 GDP(RGDP)創建了一個 ARX 預測模型,其中 X 分別是就業(EMP)和消費(CONS)。因爲外部變量的發佈頻率爲月度,模型中實際使用的數據爲月度數據的季度平均。
在使用模型作預測時,若只能得到上個季度的部分月度數據,則先對月度數據創建單變量預測模型(滾動建模,保持參數估計的樣本數一致),預測剩餘月份的數據,再將已知數據和預測數據放在一塊兒計算季度平均,最後放進 ARX 模型中。
「橋接等式」並未真正解決將高、低頻數據歸入到一個統一模型框架下的問題,數據的集成不可避免。 MIDAS 巧妙地應用「集約參數化」的手段使得高頻數據在無需集成的前提下能夠做爲低頻數據的解釋變量。在某些情形下,若選擇的高頻數據是來自金融市場的交易數據,則能夠實現對低頻數據的實時預測。
符號約定:
提早 \(h_q\) 步的預測模型:
\[ y_{t_q + h_q} = y_{t_m + mh_q} = \beta_0 + \beta_1 b(L_m;\theta)x_{t_m+w}^{(m)} + \varepsilon_{t_m+h_m} \]
\[ y_{t_q + h_q} = y_{t_m + mh_q} = \beta_0 + \sum_{i=1}^N \beta_i b(L_m;\theta_i)x_{i,t_m+w}^{(m)} + \varepsilon_{t_m+h_m} \]
其中,\(h_q=h_m/m\),\(b(L_m;\theta) = \sum_{k=0}^K c(k;\theta) L_m^k\),\(L_m^k x_{t_m}^{(m)} = x_{t_m-k}^{(m)}\),\(x_{t_m +w}^{(m)}\) 是從高頻數據 \(x_{t_m}\) 中的跳躍採樣。
預測值爲:
\[ \hat y_{T_m^y + h_m\mid T_m^x} = \hat \beta_0 + \hat \beta_1 b(L_m;\hat \theta)x_{T_m^x}^{(m)} \\ \hat y_{T_m^y + h_m\mid T_m^x} = \hat \beta_0 + \sum_{i=1}^N \hat \beta_i b(L_m;\hat \theta_i)x_{i,T_m^x}^{(m)} \]
對 \(c(k;\theta)\) 的集約參數化(Parameterization in a Parsimonious Way)是 MIDAS 的關鍵,經常使用選擇有兩個:
\[ c(k;\theta) = \frac{\exp(\theta_1 k + \cdots + \theta_Q k^Q)} {\sum_{k=1}^K \exp(\theta_1 k + \cdots + \theta_Q k^Q)} \]
\[ c(k;\theta_1,\theta_2) = \frac{f(\frac kK;\theta_1,\theta_2)} {\sum_{k=1}^K f(\frac kK;\theta_1,\theta_2)} \]
其中,\(f(x,a,b) = \frac{x^{a-1}(1-x)^{b-1}\Gamma (a+b)}{\Gamma(a)\Gamma(b)}\),\(\Gamma(a) = \int_0^\infty e^{-x}x^{a-1}dx\)
\[ c(k;\theta) = \frac 1K \]
\[ c(k;\theta) = \frac{g(\frac kK, \theta)}{\sum_{k=1}^K g(\frac kK, \theta)} \]
其中,\(g(k,\theta) = \frac{\Gamma(k+\theta)}{\Gamma(k+1)\Gamma(\theta)}\)
\[ c(k;\theta) = \frac{\theta^k}{\sum_{k=1}^\infty \theta^k}, \mid \theta \mid \le 1 \]
AR-MIDAS 中一階自迴歸模型最爲常見。
\[ y_{t_m} = \beta_0 + \lambda y_{t_m-m} + \beta_1 b(L_m;\theta)(1-\lambda L_m^m)x_{t_m+w-m}^{(m)} + \varepsilon_{t_m} \]
\[ y_{t_m} = \beta_0 + \lambda y_{t_m-h_m} + \beta_1 b(L_m;\theta)(1-\lambda L_m^{h_m})x_{t_m+w-h_m}^{(m)} + \varepsilon_{t_m} \]
做者使用月度數據工業產值(IP)、就業(EMP)和設備開工率(CU)聯合產出增速(季度數據)創建一個 AR-MIDAS 模型,預測下季度產出增速。
做者將大量來自金融市場的每日數據和許多月度統計數據(集成爲季度數據)與 GDP 增加率(季度)聯合起來創建 AR-MIDAS 模型,實施策略有兩種:
做者挑選了幾個來自金融市場的數據與其餘若干經濟指標(月度數據)聯合歐元區 HICP(調和消費者物價指數)創建起 HICP 的 AR-MIDAS 模型,並藉助金融市場的數據實現了對 HICP 的實時預測。
金融市場數據包括:
經濟指標包括: