向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石
可有償投稿計量經濟圈,計量相關則可ide

郵箱:econometrics666@sina.cn函數

全部計量經濟圈方法論叢的do文件都放在社羣裏,能夠直接取出使用運行,也歡迎到研究小組交流訪問.學習

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

今天,咱們「面板數據研究小組」給計量經濟圈的圈友引薦一個常常用到的方法——Vector autoregressive regression(VAR)。下一次,在這個VAR基礎上,咱們會將此方法延伸到面板數據的VAR,TVP-VAR,FAVAR等前沿模型裏,這樣就能夠用在微觀面板數據和大規模宏觀數據中去了。3d

在時間序列計量中,咱們已經學習了不少關於(結構)向量自迴歸模型(VAR),由於這是諾貝爾獎得到者Sims最爲人熟知的貢獻之一。Sims常常發文反對當前在微觀計量中比較流行的因果識別策略,好比IV, Matching, Quasi-experiment等。他認爲這些都只是一股腦地在講單個方程,而不是構造一個聯立方程組,畢竟像(S)VAR這樣的模型壓根不用去看哪一個變量是外生和內生。orm

咱們只須要把全部互相影響的變量都當成內生變量來構建一個聯立方程組,而後根據Cholesky分解規則來施行一些限制,來保證咱們可以剛好識別出全部的待估參數。Blanchard & Quah在1990年對VAR模型進行修正,他們嘗試給模型加入若干結構性約束,從而能夠獲得惟一的結構關係,來解決模型對信息的識別問題,從而使脈衝響應具備必定的經濟意義。blog

下面這個方程就是VAR(P),裏面的yt向量包含了k個變量,咱們只是用了簡化的形式來展示VAR方程。Xt到Xt-s是外生變量,Ut是擾動項。所以,這就是一個有k個變量且存在P期滯後因子的通常VAR形式。他是一個reduced form(簡約式VAR),即一個變量由本身的滯後項和其餘變量的滯後項進行解釋,而不包括當期項。這個裏面的偏差項在各個方程之間極可能出現相關性。遞歸的VAR(Recursive VAR)能夠保證每一個方程的偏差項與前一個方程的偏差項不存在相關性。遞歸

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

爲了進行對比,咱們寫出結構VAR(SVAR),二者明顯的區別在於SVAR中有了其餘變量的當期值。SVAR能夠轉化成簡約式VAR,轉換過程也比較簡單。咱們把Zt方程代入Xt方程裏,而後進行簡單的移項和合並,就能夠獲得Xt的表達式,同理,咱們能夠把Xt方程代入Zt的表達式,進行相同的操做從而獲得Zt的表達式。而後,咱們就獲得了Xt和Zt關於他們各自的滯後項和對方滯後項的函數,那就是咱們想要的簡約表達式。能夠具體參見一下SVAR與VAR的區別:https://blog.stata.com/2016/09/20/structural-vector-autoregression-models/get

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

若是這個VAR系統是穩定的,也就是說咱們的那個方程組的特徵根都位於單位圓內(這個須要看咱們怎麼寫這個表達式),那咱們能夠將上面的VAR模型轉換成下面這個向量移動平均(Vector Moving Average)。如今,咱們看不到這k個變量的滯後項,裏面的ΣDi表明的是轉換方程,然後面的那個Σ表明的是脈衝響應函數。it

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

若是想要估計出來VAR系統的參數,那麼咱們須要保證yt和Xt都是協方差平穩的時間序列數據(Covariance-stationary series),注:這是弱平穩。時間序列數據要協方差恆定,有一個必要條件,就是必需要有一個均值回覆水平(mean reverting level),就是說這個數據無論怎麼變更都會有一個向均值恢復的傾向。io

對AR(1)模型,均值回覆水平=b0/(1-b1)。若是b1=1,則該AR(1)模型不存在均值回覆水平,這個時間序列數據也就不知足協方差恆定。所以,作了一個AR(1)模型以後,咱們要用Dickey-Fuller檢驗來檢驗斜率係數b1是否顯著不等於1 (b1等於1稱爲單位根)。

也就是說,在作(S)VAR模型的時候,第一前提是對裏面牽涉到的變量的開展單位根檢驗。若是這些變量都服從I(0)過程,那咱們能夠直接進行VAR建模。如若否則,咱們就須要對那些不平穩的時間序列變量進行一階差分(通常而言,數據通過一階差分以後都會趨向於平穩),而後再進行VAR建模。固然,還有一些夥伴想要對那些平穩的時間序列也差分,由於他們認爲要差分就須要對不平穩的和平穩的時間序列都差分。儘管平穩時間序列差分以後可以再次取得平穩性,但差分以後所損失的原始信息會不少,而且增長了額外的估計和解釋難度。所以,咱們並不建議對平穩時間序列再進行差分。

對因而否須要VAR系統裏的各個變量都是平穩的,這個問題如今大致的傾向是,若是咱們想要作out-of-sample預測,那麼咱們須要保證VAR裏的變量平穩,否則存在「虛假迴歸」的可能。若是咱們只是想要獲得各個變量間的脈衝響應函數,那麼咱們能夠沒必要要求VAR系統的變量是平穩的。這個在Sims的文章和後面的其餘相關文章中有說起到,不過仍然存在着一些爭議。咱們仍是但願圈友們可以在作VAR以前檢驗一下各個變量的平穩性。

若是你的VAR系統裏的變量都服從I(1)過程,那咱們仍是建議你先對這些變量作一個協整檢驗,好比用Johansen test。其結果將會告訴你,是否咱們應當創建一個VECM模型(Vector error correction model),來把他們之間的長期和短時間的關係聯動起來。那就是說,長期而言,好比兩個變量有一個穩定的關係,但短時間他們之間的關係能夠偏離長期關係,只是後面必須恢復到長期的穩態關係才行。因此,在咱們看來,若是你發現可以使用VECM模型,就優先使用VECM而不是VAR,由於他可以告訴咱們更多的關於兩個變量之間的關係。

如今,咱們來看看具體怎麼操做VAR或者SVAR模型。

1.選擇相關變量,切記根據理論模型選擇重要變量,如果變量過多,那會致使咱們待估計的參數過大而出現問題。

2.檢查你的數據和儘可能作一些合理的調整,好比對於收入或者股票指數或GDP等這些數據,咱們儘可能取log對數值。

3.檢查你的數據是否包含非平穩的部分,經常使用的單位根檢驗方法是ADF test,在這個檢驗裏面包括三種類型:沒有常數項和趨勢項,沒有常數項但有趨勢項,有常數項和趨勢項(注:這裏咱們就不區分什麼漂移項和趨勢項了)。由於這三種類型對應着各自不一樣的單位根顯著性表格,因此根據你的散點圖或者直覺看看你的數據類型符合哪一種類型。若是你想要進一步獲得覈實,可使用PP test再次檢驗數據中的單位根。

4.選擇VAR系統的滯後階數,這裏面的指標包括AIC,BIC,HQ等等,輸入指令後窗口會自動告訴你最優的滯後階數。

5.檢驗是否存在協整關係,咱們經常使用的就是Johansen test。若是存在協整關係,那麼我就選擇VECM模型進行迴歸(實際上,VECM模型與VAR模型差很少是一家人)

6.估計模型,或者VAR或者VECM。

7.迴歸後的檢驗,好比咱們用Ljung-Box test等去檢驗殘差是否存在自相關。

8.能夠進行預測,獲得脈衝響應函數IRF和方差分解函數VDF。

下面咱們來用一個具體的示例來演示VAR的操做思路和步驟。SVAR稍稍有點不一樣,但也遵循着一樣的步驟和方法。注: SVAR的下一期再細講。

咱們想要研究一個國家的真實投資、真實消費和真實收入三者之間的關係,用到的數據是從1959年第一季度到2010年第三季度總共207個季度數據。

首先咱們來看看這三者的時間趨勢圖,從圖中能夠看出三者有一個Co-movement的過程,而且隨着時間向上的趨勢是很是明顯的。咱們有了關於三者長期關係的直觀印象,同時很也認爲這個數據極可能是detrended平穩的。下面咱們會分別對三個數據進行單位根檢驗。

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

對lrgrossinv進行單位根檢驗,包括了時間趨勢項,發現這個數據是非平穩的。

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

對lrconsump進行單位根檢驗,包括了時間趨勢項,發現這個數據是非平穩的。

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

對lrgdp進行單位根檢驗,包括了時間趨勢項,發現這個數據是非平穩的。

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

如今,咱們對這三個變量進行一階差分。

對lrgrossinv進行一階差分以後,咱們發現D.lrgrossinv數據是平穩的。

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石
對lrconsump進行一階差分以後,咱們發現D.lrconsump數據是平穩的。

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

對lrgdp進行一階差分以後,咱們發現D.lrgdp數據是平穩的。

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

而後,咱們用上面這三個一階差分後的D.lrgrossinv, D.lrconsump, D.lrgdp變量組建VAR模型,而且還包括外生的真實貨幣量D.lrmbase。注:這裏只展現了第一個關於D.lrgrossinv的迴歸方程,其餘二個關於D.lrconsump和D.lrgdp的方程就沒有在這裏展現了。從迴歸方程中,咱們能夠看到,暫時性地選擇了4階滯後項。

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

經過上面的迴歸以後,咱們再來根據相關標準選擇最優的滯後階數。從下表中,咱們發現大部分信息準則都指向了1階滯後項,所以咱們在下階段迴歸中會用各變量的一階滯後。

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

選擇一階滯後項,咱們獲得了下表的結果。

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

咱們能夠經過Log-likelihood和信息準則來比較一下選擇4階滯後和1階滯後的優劣。明顯的是下方的那個迴歸結果好一些,所以1階滯後是更加好的選擇。

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

咱們再檢驗一下,是否應該把外生的D.lrmbase包括在VAR系統中來,聯合的係數顯著性檢驗代表確實應該把他包括進來。

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

檢驗各個內生變量在每一個方程和整個VAR系統中的聯合顯著性。從下表中咱們能夠看到,這裏面的內生變量在咱們選擇的最優1階滯後階數下具備聯合顯著性。

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

如今,咱們用格蘭傑因果檢驗來確認是否在這三個變量之間有因果關係。若是根據5%的顯著性水平,那咱們能夠獲得以下因果關係:D.lrconsump和D.lrgdp聯合起來是D.lrgrossinv的緣由;D.lrgdp是D.lrconsump的緣由,以及D.lrgdp和D.lrgrossinv聯合起來是D.lrconsump的緣由;最後,D.lrgrossinv, D.lrconsump是D.lrgdp的緣由。

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

如今,咱們能夠看看這個VAR系統自身是否是穩定的,由於只有穩定的系統纔可以去作預測或者脈衝響應分析。結果顯示,這個VAR系統知足平穩性假定。

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

下面咱們須要展現的是,這三個變量之間的脈衝響應函數。在這裏,咱們先集中展現當有來自其餘變量的衝擊時,另外一個變量隨着時間步數所作出的相應反應。Table是脈衝響應函數的具體數字,而Graph是脈衝響應的直觀圖形。

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

從這個脈衝響應圖形裏,咱們發現實際總投資有一個向下方反應的趨勢,即來自實際總消費和實際總收入的衝擊,在8個季度裏最終仍是恢復到平穩狀態。實際總投資的調整到位了,他消化了全部來自其餘方面的衝擊波動,而這偏偏是一個經濟系統應當有的狀態。

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

從實際總消費和實際總收入的脈衝響應圖中,咱們也獲得了相似的結論。即,來自其餘變量的外生衝擊波對本身的影響會有一個整體上而言不斷降低的過程,而且到第8個季度該變量消化吸取了全部的衝擊。

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

接下來,咱們經過方差分解Variance decomposition來看看在這個VAR系統中,究竟是哪個變量對咱們感興趣的變量的解釋力度大(這個是經過預測均方偏差表現的)。這個方差分解表和下面的方差分解圖,都很好地代表,實際總投資和總消費對本身的解釋力度最大,貢獻了預測均方偏差的90%以上。

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

從實際總收入的方差分解圖,咱們能夠看出實際總投資對實際總收入的預測偏差變更的貢獻力度甚至超過了實際總收入自己。這足以看出實際總投資在這個國家實際總收入的重要性。

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

咱們實際上也能夠作一些穩健性檢驗,好比當咱們改變Cholesky分解的順序,那咱們的脈衝響應函數是否有明顯不一樣的改變呢?

下面這個脈衝相應圖中有icy和icy2,其中icy表明咱們上面的那個Cholesky分解順序,而icy2表明另一種Cholesky分解順序。咱們發現無論使用哪一種分解順序,都獲得了相似的脈衝響應函數圖,所以咱們有理由相信這個結論是可信的。

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

方差分解圖中能夠看出,在第二種Cholesky分解中,實際總投資在實際總消費的預測偏差中佔的比重增大了。這足以看出Cholesky分解順序對VAR系統的重要性,所以咱們但願經濟理論可以在VAR系統的識別中起必定的做用。

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

獲得整個VAR系統的估計結果後,咱們能夠看看這個模型到底怎麼樣?下面這個圖就是以2006第一季度爲起點作的樣本內預測(後面8個季度的預測),藍線表明預測的值,而紅線表明實際觀測值。從這個圖中,咱們能夠看出這個模型的長期預測能力還有待改進,由於總體的趨勢有錯位,出現了早早到達尖峯或遲遲到達峯谷的情形。咱們以爲樣本內預測作得比較好,那麼樣本外的預測out-of-sample預測就會值得信賴。

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

這個模型在樣本內預測很差的緣由,極可能是因爲這個VAR系統的殘差項存在嚴重的1階自相關(5%顯著性水平)。這代表,我們的AIC,BIC等選擇的最優滯後階數是存在問題的。

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

若是咱們調整滯後階數到3,那麼這個VAR系統的殘差項就不存在自相關了,預測性可能會更好(我們沒有再一次去重複以前全部的結果)。

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

咱們如今來作VECM檢驗,首先選擇最優的滯後階數。注:這裏的滯後階數是2或者3,與以前選擇的滯後階數1是不一樣的,由於以前的那個VAR是先經過4階滯後階數迴歸以後,咱們再作的最優滯後階數選取的。
向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

而後,咱們用Johansen test來檢測這三個變量是否存在協整關係。不管咱們選擇滯後階數是2仍是3,結論都顯示這三個變量之間不存在協整關係。
向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

向量自迴歸VAR模型操做指南針,爲微觀面板VAR鋪基石

面板數據研究小組各類方法論叢的do file都放在我們的社羣,能夠直接到社羣提取使用。

SVAR模型的示例能夠參見: https://blog.stata.com/2016/09/20/structural-vector-autoregression-models/

推薦一篇文章:「Vector Autoregressions」 by James H. Stock and Mark W. Watson

相關文章
相關標籤/搜索