1 不少人已經瞭解到AR(1)這種最簡單的時間序列模型,ARMA模型包括AR模型和MA模型兩個部分,這裏要詳細介紹Box-Jenkins模型的觀念(有些資料中把ARMA模型叫作Box-Jenkins模型,都是一下子事,這裏說明一下),並說明模型。函數
2 首先現將重點放在介紹「單變數時間序列模型」(univariate time series model),也就是從模型中只有「一個」時間序列變數來開始談起,但你必須先要記住的是其實時間模型也能夠包含「多變數」的狀況。性能
3 什麼是Box-Jenkins模型?學習
這是兩我的,Jenkins應該是威爾士人,Box先生應該是英國人,不過兩位先生已經仙逝了。在網上只能找到Box的照片,具體的資料能夠參考維基的這個連接,有這兩我的的詳細介紹。spa
https://en.wikipedia.org/wiki/George_E._P._Box翻譯
https://en.wikipedia.org/wiki/Gwilym_Jenkinsblog
(George Box)遊戲
模型查到的資料是從1976年開始發展的。ARMA模型的前提假設是時間序列資料必須是定態(stationary,固然大多數教材叫穩定性,還有穩定性檢測,或者叫穩態,都一下子事兒。而後又再次進出時發明了ARIMA模型。若是你要疑問什麼是stationary?一下子會談到。另外,這篇文,但願大多數人把它當作一個哲學文來閱讀。事件
4 白噪音(白噪聲,white noise)ip
(1) 不少時候有些概念譯名都不太同樣,因此多瞭解一些這方面的東西,不要引發歧義。雖然這個名詞有點兒怪怪的,其實想表達的意思不是白的?也不是噪聲?不知道爲啥會這麼翻譯。在baidu中搜索這個名詞,在物理學裏面有這個解釋,是關於聲音的,解釋以下:「白噪音是指一段聲音中的頻率份量的功率在整個可聽範圍(0~20KHZ)內都是均勻的。因爲人耳對高頻敏感,這種聲音聽上去是很吵耳的沙沙聲。」真不知道跟這個時間序列有啥關係,另外還有不少概念,好比自由度(統計學也用這個概念),其實這個概念在物理學裏面。咱們這樣理解一下吧:「白噪聲就是知足一些「特定統計定義」的時間序列「隨機變數」。簡單地說,若是有一個時間序列變數以符號εt來表示,有的是用μt,這個注意一下就能夠。博客
(2) 我從網上找的了白噪聲的一張圖。
這樣就容易理解了,咱們在學習ARMA模型的時候,所須要的序列是否是假設也是這種的?好吧就用這個white noise這個概念吧。跟這個樣同樣的東西。
(3) 另外,咱們給白噪聲下三個定義:
第一:指望爲0;
第二:變異數未固定常數(方差爲常數);
第三:自我共變數(autocovariance,也就是自協方差)也等於0。
符合這三個條件的時間序列就叫作白噪聲,這就是咱們找這樣的序列,才能創建咱們的模型。固然這種東西有點兒難度,世界上哪有這麼好的序列?這個先不要管,後面咱們慢慢改變這個序列的結構等方式能夠基本構建這麼一種時間序列,變形金剛能夠變形的,另外,科學家和科學的特色就是準確,可是事件萬物都是複雜的,怎麼能用簡單的公式來表示事件萬物呢?簡單:假設嘛。再就是有些難以預測的東西,很難解釋的東西就是有個東西叫殘差或者偏差,把這個部分作一個加法不就等於一個完整的能表示萬物的公式了!固然,咱們衡量一個公式(叫模型也行,都一下子事兒)最簡單的一個標準就是:殘差或者偏差越小越好,模型在將來預測的過程當中也是相對越小越好,那麼這樣你就基本能夠跟上帝對話了。
5 ARMA(p,q)模型。能夠劈開兩部分,這個就不用說了,學過的都知道。另外這個模型前面有一個常數項,固然有人叫截距項,這個概念和線性迴歸是同樣的。大多數狀況下這個截距項能夠不要。由於咱們在分析模型的平穩性啦,檢測單位根等等這個亂七八糟東西,都是在看參數的狀況。這個截距項咱們根據前面的假設來說,是iid。這個部分不說太多,p什麼樣,q什麼樣變成什麼,滯後期就是慢幾步的序列,這部分能夠參照博客的其餘內容都有講解這個很簡單。
6 摘出來MA,單獨講講這個部分。咱們知道AR模型的經濟含義其實不過就是某一個時間序列的經濟變數,在結合某些經濟假設以後,就會使該變數當期的值會和變數過去的值有某種關聯性,因此當期的變數(yt)纔會設定成是改變數過去的變數值(也叫滯後期,如yt-1)函數。那也許你頗有興趣知道,什麼狀況會讓如今的yt和過去的εt-1相關呢?
(1) 固然MA模型背後也有像AR模型相似的經濟意義,只不過通常的計量書籍都直接將之視爲理所固然,而不加以說明。不少初學者的誤解,認爲ARMA模型滅有什麼經濟理論基礎的不正確觀念,進而忽視時間序列分析方法的價值,只把它當作沒有什麼理論的數字或同級遊戲。因此這裏要加以說明。
(2) 簡單說,MA模型隱含這麼一個觀念——經濟行爲體系的結構式中,含有偏差修正的特性。這個特性特別重要,讓咱們記住它!
(3) 有何經濟含義呢?借用較爲熟悉的蛛網理論模型來解釋是最方便的了,但咱們要給供給函數的設定上加入隨機變數εt來講明會比較容易懂。在供給函數中加入隨機變數,表示生產者供給量的決策仍然不是百分比掌握了,就有偏差存在啦。這裏的蛛網理論模型就是變成一些三個等式:
需求函數:D(Qt) = α0 - α1pt
供給函數:S(Qt) = β0 + β1pt* + εt
市場均衡條件:D(Qt) = S(Qt)
若是你的記憶力不差,能接的上面這組結構式,其實關鍵性的問題在於生產者對於逾期價格pt*是如何造成的。沒錯,咱們假設了生產者以上一期的價格「推想」當期的價格pt* = pt-1*,因此才能導出在縮減式中價格變數出現了AR(1)的狀況。
(4) 如今要作的就是導出所減式具備MA(1)的性質。在這裏咱們先作一個看起來也行不怎麼有說服力的經濟假設,即「生產者利用上一次生產時的失誤(經驗),加上某一權數考量後,來預期下一期的價格」。先不論你是否贊成這樣的假設,咱們將這個假設用具體的函數式表示出來。以下:
pt* = h0 + εt-1
其中,h0表示權數大小的常數項,et-1表示上一期生產時發生的失誤,這樣的模型設定,其實遺憾了所謂偏差修正的意義。咱們將這個式子帶入到上面的能夠看一下。等於:pt = α0 + εt + b1 εt-1
頗有趣吧!顯然,上式看起來就是有常數項的MA模型。
(5) 不過,不知道發現沒有,這樣對價格預期造成的假設是由缺陷的。具體說,由於若是恰巧上一次生產決策預測很早,式預期失誤若是爲0的話,那麼就會使預期價格等於0!!如此一來,這個假設就不符合市場實際可能發生的狀況,也就是說這樣的假設不盡合理,那麼沒有比較合理的預測模型呢?在計量文獻上有所謂的「適應性預期模型」(Kmenta提出的1986年),咱們只要借用適應性預期模型觀念改寫成:
pt* = pt-1* + h0εt-1
那這個對價格預期造成的假設,就變成較爲合理的適應性預期模型。
(6) AR和MA模型的缺陷用這種適應性模型是否是能夠更爲合理的估計,這個式子是否是很像.....,對!就是ARMA模型。
(7) 哲學點兒講其中εt-1就很像老子的「道」,由於不可測,可是它又發揮本身的做用;只考慮到「道」也不行,咱們還要考慮pt-1,這現實因素,就像孔子的「仁」,出世的東西+入世的東西這纔是考慮的比較全面的。
7 定態與安定條件。
(1) 正如咱們學哲學當中有一條叫:變化是絕對的,不變是相對的。在ARMA模型中,也包含這方面的因素。咱們在檢測模型的stationary的時候要有一個東西叫單位根檢測。在Eviews軟件中咱們能夠調出這麼一張圖來。
在這張圖中咱們發現沒有,像不像打靶的靶子。固然是,這個玩意兒叫單位根檢測,咱無論它具體檢測方式。若是在靶心當中是安定stationary,靶心外的化就是non-statinary,這就懂了吧。你創建的這個模型好很差。就要看是否是如今在靶心內,仍是靶心外。若是樣本內創建模型是在靶心內,在樣本外去預測的話,他的效果確定是準確度更大的,這個方面能夠經過統計機率統計的,這個問題不在此展開討論了。
8 總結:
ARMA模型也叫經濟學家的良心。不少資料上面也是這麼說的。
(1) 咱們不光要考慮可度量的部分的變化也要考慮不可度量部分的變化,這就是ARMA的全面。
(2) 將來咱們不知道,經過幾率的角度來說咱們不是去預測下刻是對是錯,咱們只須要知道,在n個之後的每一期預測屬不屬於在整個大的高几率範圍以內,若是是,那麼你作10次,錯1次,對9次,若是都是等分進行投資,你的勝率是大於90%的。固然機率學就是從研究賭博來的,賭博咱們也要科學的賭博,找到這塊兒癢癢肉!咱們使勁撓,這就是很爽!
(3) 固然,這個ARMA也有缺陷,好比穩定性或者說穩態的持續性能有多長?當誤差過大的時候如何去修正,那就衍生了其餘的模型。ARCH模型族就是一個分支。這個模型也是很是好的模型。
(4) 咱們在研究一個東西的時候必須就一個經典的模型研究透,研究深刻,只有更深更深再深的瞭解,瞭解到他的哲學層面纔能有更深的應用。而不是知之皮毛,用而棄置!