首先咱們先對解釋變量中的定性因素和定量因素做如下闡述:spa
在實際建模中,如何對定性因素進行迴歸分析?採用「虛擬變量」對定性變量進行量化是最經常使用的一種思路。其基本思想爲:事件
虛擬變量設置的時候須要考慮如下的基本規則:數學
在計量經濟學中,一般引入虛擬變量的方式分爲加法方式和乘法方式兩種。it
實質上,加法方式引入虛擬變量改變的是截距,乘法方式引入虛擬變量改變的是斜率。table
含有虛擬變量的模型的分析手段:條件指望。class
以加法方式引入虛擬變量時,主要考慮的問題是定性因素的屬性和引入虛擬變量的個數。主要有四種狀況:基礎
以乘法方式引入虛擬變量時,是在所設立的模型中,將虛擬變量與其它解釋變量的乘積,做爲新的解釋變量出如今模型中,以達到其調整設定模型斜率係數的目的。變量
所謂虛擬變量的綜合應用是指將引入虛擬解釋變量的加法方式、乘法方式進行綜合使用。基本分析方式仍然是條件指望分析。原理
結構變化的實質是檢驗所設定的模型在樣本期內是否爲同一模型。顯然,平行迴歸、共點回歸、不一樣的迴歸三個模型均不是同一模型。方法
例:比較改革開放先後我國居民平均「儲蓄—收入」總量關係是否發生變化?
模型設定爲 :
\[Y_t=\alpha_1+\alpha_2D_t+\beta_1X_t+\beta_2(D_tX_t)+u_t \]其中:\(Y_t\) 爲儲蓄總額,\(X_t\) 爲收入總額。
\[D=\left\{\begin{array}{cl} 1 \ \ , & \text{改革開放前} \\ 0 \ \ , & \text{改革開放後} \end{array}\right. \ . \]條件指望分析:
- 改革開放後:\({\rm E}(Y_t|X_t,\,D_t=1)=\alpha_1+\alpha_2+(\beta_1+\beta_2)X_t\) ;
- 改革開放前:\({\rm E}(Y_t|X_t,\,D_t=0)=\alpha_1+\beta_1X_t\) 。
只要 \(\alpha_2\) 和 \(\beta_2\) 不一樣時爲零,上述模型就能刻畫改革開放先後我國居民平均「儲蓄—收入」模型結構是否發生變化。
交互做用:一個解釋變量的邊際效應有時可能要依賴於另外一個解釋變量。
例:研究人羣的我的收入 \(Y\) 與其教育水平 \(E\) 和所在地區 \(D\) 的關係。
模型設定爲:
\[Y=\alpha_0+\alpha_1D_1+\alpha_2D_2+\alpha_3E+\alpha_4D_1E+\alpha_5D_2E+u \ , \]其中
\[D_1=\left\{\begin{array}{cl} 1 \ \ , & \text{中部} \\ 0 \ \ , & \text{其餘} \end{array}\right. \ , \ \ \ \ D_2=\left\{\begin{array}{cl} 1 \ \ , & \text{東部} \\ 0 \ \ , & \text{其餘} \end{array}\right. \ , \ \ \ \ E=\left\{\begin{array}{cl} 1 \ \ , & \text{高等} \\ 0 \ \ , & \text{中等} \end{array}\right. \ . \]各種人員的收入表以下:
西部 \((0,\,0)\) 中部 \((1,\,0)\) 東部 \((0,\,1)\) 中等 \(E=0\) \(\alpha_0\) \(\alpha_0+\alpha_1\) \(\alpha_0+\alpha_2\) 高等 \(E=1\) \(\alpha_0+\alpha_3\) \(\alpha_0+\alpha_1+\alpha_3+\alpha_4\) \(\alpha_0+\alpha_2+\alpha_3+\alpha_5\) 差別性描述:
中部與西部差 東部與西部差 東部與中部差 中等 \(E=0\) \(\alpha_1\) \(\alpha_2\) \(\alpha_2-\alpha_1\) 高等 \(E=1\) \(\alpha_1+\alpha_4\) \(\alpha_2+\alpha_5\) \(\alpha_2-\alpha_1+\alpha_5-\alpha_4\) 各種人員的收入表以下:
西部 \((0,\,0)\) 中部 \((1,\,0)\) 東部 \((0,\,1)\) 高等與中等差 \(\alpha_3\) \(\alpha_3+\alpha_4\) \(\alpha_3+\alpha_5\)
雙重差分法,Differences-in-Differences,基本思想就是經過對政策實施先後對照組和實驗組之間差別的比較構造出反映政策效果的雙重差分統計量。首先強調一點,通常而言 DID 僅適用於面板數據模型,但並無嚴格意義上面板數據模型所須要的過多的假設,經過引入虛擬變量並經過最小二乘法便可實現參數估計。所以咱們在討論面板數據以前,先討論雙重差分模型的應用。
前提假設:
模型設定:
其中,\(Y_{it}\) 爲個體 \(i\) 在 \(t\) 期的結果值,
對 DID 模型取數學指望:
對照組+實驗前
對照組+實驗後
實驗組+實驗前
對照組+實驗前
爲了方便對比參數設定的意義,咱們用以下的表格:
對照組 | 實驗組 | |
---|---|---|
實驗前 | \(\alpha\) | \(\alpha+\alpha_1\) |
實驗後 | \(\alpha+\alpha_2\) | \(\alpha+\alpha_1+\alpha_2+\beta\) |
Difference | \(\alpha_2\) | \(\alpha_2+\beta\) |
將雙重差分的思想與上表的內容結合,咱們能夠獲得政策的淨效應:
關鍵:檢驗交叉項係數 \(\hat\beta\) 是否顯著。