計量經濟與時間序列_預測

1.   計量經濟學也叫數量經濟學或者叫量化經濟學,主要的過程是數據結構分析、計量模型創建和預測。所以預測這個話題在時間序列數據中至關重要。他如今還是一個很活躍的研究領域。不少的量化投資模型最重要應用也就是預測。數據結構

2.   這裏幾種研究以迴歸爲進出的預測方法。函數

3.   假定咱們的主要興趣是預測一個時間序列過程的未來值,而不必定是要估計因果性或結構型經濟模型。測試

4.   首先介紹一些與模型具體形式無關的基本預測原理。spa

  4.1   假設咱們在t 時期(當前時刻)想要預測y 變量 在t+1時期(下一個時間窗口)的結果,即yt +1orm

  4.2   所用時間單位能夠是一年、一個季度、一個月、一個星期或一天。令It 表明咱們在t 時期能夠觀測到的全部信息。這些信息叫作信息集(information set),包含yt 和 y 的先導值,經常還包括其餘變量在t 或更早時期的值。能夠用無數種方法來組合這些信息去預測yt+1。有沒有哪種方法更好呢?it

  4.3   設定與預測偏差相聯繫的損失(loss),答案即是確定的。io

  4.4   令一個函數ft 表明在t 期對yt+1所做的預測。稱ft提早一期預測(one-step-ahead forecast)。預測偏差(forecast error)是 et+1 = yt+1 - ft,常見的偏差還能夠用(et +1)2 來表示。ast

  4.5   偏差平方這種作法,對稱地處理正負偏差,越大的偏差獲得的權重也越大。還有一種叫|et+1| 的絕對值表示。這些都叫預測偏差的損失函數(loss function)。function

5.   在t 時期,並不知道et+1的值是多少,由於yt+1是一個隨機變量,因此et+1也是個隨機變量form

6.   因此在給定It 的全部信息集時,天然而然的咱們選擇使預測偏差平方的指望最小的值:所以這個損失函數能夠表示成下面這種機率表達式:

  E((et+1)2 | It) = E[(yt+1 - ft)2 | It] (解釋爲:給定信息集右側實際值和預測值的平方的指望,等於給定預測值下一時刻的偏差平方的指望,也就是說使得這個條件均值最小化,越趨近於0,越好)。

7.   第一種簡單預測:指數平滑法(exponenial smoothing),預測值經過下面的等式求出:ft = αyt + (1-α)ft-1,yt+1時期的預測值 是yt 和 在t-1時期對y預測值的加權平均。

8.   第二種簡單預測:條件預測(conditional forecast),已知一個模型的表達式:yt = β0 + β1zt + μt,那麼,E(yt+1 | It) = β0 + β1zt+1,不行的是咱們不多知道zt+1 時刻的其餘信息。除非包含時間趨勢和季節虛擬變量。

9.   第三種簡單預測:無條件預測(unconditional forescast),這個名詞多少有些用詞不當,由於咱們的預測仍然是以It中的信息爲條件。可是這一名詞在預測文獻中已經根深蒂固了(無非在用於與測試,被咱們賦予一個特定的含義罷了)。

10.   就預測而言,除非因爲某些緣由使咱們不得不用8中的模型,不然最好的設定的模型取決於y和z 的滯後值。這版省卻了一些步驟,沒必要在預測y以前還要預測右邊的變量。很容易就想到的一個模型是yt = δ0 + α1yt-1 + γ1zt-1 + μt。其中根據公式定義E(μt | It-1) = 0。若已知這些參數(估計出來)那麼在t 時期對yt+1的預測值就是這個公式:δ0 + α1yt + γ1zt

11.   提早一期預測函數能夠寫成:hat_ƒ = hat_δ0 + hat_α1yn + hat_γ1zn

12.   舉一個時間序列的預測示例(來自伍德里奇的計量經濟學)

  12.1   第一個模型,簡單的AR(1)模型:

  hat_unemt = 1.572 + 0.732 unemt-1

         (0.577)  (0.097)

  n(樣本數) = 48, R2 = 0.544, hat_σ = 1.049

  12.2   第二個模型,增長經過膨脹率的一年以後,模型以下:

  hat_unemt = 1.304 + 0.647 unemt-1 + 0.184 inft-1

         (0.577)  (0.097)                (0.041)

  n(樣本數) = 48, R2 = 0.677, hat_σ = 0.833

  12.3   全部的樣本數據都是從1948年-1996年度數據。

  12.4   預測下年,也就是1997年度數據,須要知道1996年的數據,也就是48條樣本中的最後一條以及第二個模型滯後一年(47條)的數據,分別爲:5.4 和 3.0。咱們分別把這兩個值帶入到兩個模型中,就能獲得下一年也就是1997年度的預測值,過程以下:

  模型1:1.572 + 0.732 × 5.4 = 5.52

  模型2:1.304 + 0.647 × 5.4 + 0.184 × 3.0 = 5.35

  12.5   而美國1997年的實際值爲4.9。這兩個模型都高估了數值,可是模型2相對好一些。

  12.6   而後咱們把預測區間估計出來:

13.   在實際工做中,有些專業預測員能夠固定模型參數,用每一期的預測所用的模型參數保持不變來預測;還有就是新一期數據得到後,更新模型參數,再用更新後的參數預測下一期。(第二種方法須要進行更多的運算,但增長的過作了相對來講是次要的,它可能會(雖然並不必定)更好寫,由於這些迴歸係數至少在必定程度上根據新數據而進行了調整)

14.   樣本內準則和樣本外準則。

  14.1   就預測而言,使用樣本外準則更好一些,由於預測本質上就是樣本外問題。一個模型也許在用於估計其闡述的樣本中對y擬合的比較好,但並不必定在與測試就有好的表現。一個樣本外準則的方法大體爲:用樣本前一部分取估計模型中的參數,而後用樣本剩餘下來的部分判斷它的預測能力。這就模擬了咱們在不知道變量的未來值所須要的事情。

  14.2   RMSE = 均方根誤,MAE = 絕對平均偏差。

  14.3   仍是以上面的爲例子。去固定參數,而後累計外推7次預測值,去觀察RMSE和MAE在樣本外的表現。預測期(1997-2003:7年)。

     在模型1中:RMSE = 0.962,MAE = 0.778

        在模型2中:RMSE = 0.673,MAE = 0.628

  14.4   顯然模型2在樣本外一樣獲得了比較好的結果。

  14.5   固然,還有一種方法。不去固定參數,而後每作一次預測估計一次參數。

15.   提早多期預測:過程也很是簡單,用預測出來的值,再代入方程,在預測多兩期的預測值,以此類推動行迭代便可。

相關文章
相關標籤/搜索