橫截面數據、時間序列數據、面板數據

面板數據(Panel Data)是將「截面數據」和「時間序列數據」綜合起來的一種數據類型。具備「橫截面」和「時間序列」兩個維度,當這類數據按兩個維度進行排列時,數據都排在一個平面上,與排在一條線上的一維數據有着明顯的不一樣,整個表格像是一個面板,因此稱爲面板數據(Panel Data)。

        實際上若是從數據結構內在含義上,應該把Panel Data稱爲「時間序列-截面數據」,更能體現數據結構本質上的特色。該數據爲也被稱爲「縱向數據(Longitudinal Data)」,「平行數據」,「TS-CS數據(Time Series-Cross Section)」。它是截面上個體在不一樣時間點的重複測量數據。面板數據從橫截面(cross section)看,是由若干個體(entity,unit,individual)在某一時點構成的截面觀測值,從縱剖面(longitudinal section)看每一個個體都是一個時間序列。

     從時空維度來看,可將計量經濟學中應用的數據分三類:

一、橫截面數據(Cross-sectional data)

  橫截面數據是指在某一時點收集的不一樣對象的數據。它對應同一時點上不一樣空間(對象)所組成的一維數據集合,研究的是某一時點上的某種經濟現象,突出空間(對象)的差別。橫截面數據的突出特色就是離散性高。橫截面數據體現的是個體的個性,突出個體的差別,一般橫截面數據表現的是無規律的而非真正的隨機變化。即計量經濟學中所謂的「沒法觀測的異質性」。在分析橫截面數據時,應主要注意兩個問題:一是異方差問題,因爲數據是在某一時期對個體或地域的樣本的採集,不一樣個體或地域自己就存在差別;二是數據的一致性,主要包括變量的樣本容量是否一致、樣本的取樣時期是否一致、數據的統計標準是否一致。


二、時間序列數據(Time-series data)

  時間序列數據是指對同一對象在不一樣時間連續觀察所取得的數據。它着眼於研究對象在時間順序上的變化,尋找空間(對象)歷時發展的規律。利用時間序列做樣本時,要注意幾個問題:一是所選擇的樣本區間內經濟行爲的一致性問題;二是樣本數據在不一樣樣本點之間不可比,須要對原始數據進行調整,消除其不可比因素;三是樣本觀測值過於集中,於是時間序列數據不適宜於對模型中反映長期變化關係的結構參數的估計;四是模型隨機偏差的序列相關問題。


三、縱向數據(Longitudinal data)或面板數據(Panel data)

  面板數據,即Panel Data,是截面數據與時間序列綜合起來的一種數據資源。 在分析時,多用PanelData模型,故也被稱爲面板數據模型. 它能夠用於分析各樣本在時間序列上組成的數據的特徵,它可以綜合利用樣本信息,經過模型中的參數,既能夠分析個體之間的差別狀況,又能夠描述個體的動態變化特徵。

舉慄一個,栗子來源於網絡!

時間序列數據:北京一年來天天的平均溫度。

截面數據:北京,上海,深圳,廣州某一天的平均溫度。

面板數據:北京,上海,深圳,廣州這一年來天天的平均溫度。  

適用範圍:

        時間序列數據:某一個個體隨時間變化產生的數據。

        截面數據:許多個個體在同一個時間下因爲個體不一樣而產生的數據。

        面板數據:前兩個的綜合——許多個個體因爲個體不一樣以及時間變化產生的數據。  

分析方法:

        時間序列數據:主要圍繞時間變化,可看整體趨勢,季節性,週期性,ARIMA(自迴歸,滑動平均,差分)等。

        截面數據:主要圍繞統計個體區別,可用線性迴歸,主元分析等。 面板數據:前兩個的綜合。

 

 

舉慄二個,栗子來源於網絡!

如:城市名:北京、上海、重慶、天津的GDP分別爲十、十一、九、8(單位億元)。這就是截面數據,在一個時間點處切開,看各個城市的不一樣就是截面數據。

如:2000、200一、200二、200三、2004各年的北京市GDP分別爲八、九、十、十一、12(單位億元)。這就是時間序列,選一個城市,看各個樣本時間點的不一樣就是時間序列。

如:2000、200一、200二、200三、2004各年中國全部直轄市的GDP分別爲:

北京市分別爲八、九、十、十一、12;

上海市分別爲九、十、十一、十二、13;

天津市分別爲五、六、七、八、9;

重慶市分別爲七、八、九、十、11(單位億元)。

這就是面板數據。

git

相關文章
相關標籤/搜索