計量經濟學導論15:內生解釋變量

內生解釋變量

內生性的含義

假設多元迴歸模型:工具

\[y=\beta_0+\beta_1x_1+\beta_2x_2+...+\beta_kx_k+u \ , \]

回顧零條件均值假設 MLR.4 :spa

\[{\rm E}(u|x_1,x_2,\cdots,x_k)=0 \ , \]

根據 MLR.4 咱們能夠獲得推論:it

\[{\rm Cov}(u,\,x_j)=0 \ ,\ \ \ \ j=1,2,\cdots,k \ . \]

若是 \({\rm Cov}(x_i,\,u)\neq0\) ,則稱 \(x_i\) 爲內生解釋變量;io

若是 \({\rm Cov}(x_j,\,u)=0\) ,則稱 \(x_j\) 爲外生解釋變量。class

當多元迴歸模型違背了零條件均值假設時,咱們稱模型存在內生解釋變量問題,又稱內生性問題。在截面數據中,內生性問題只存在同期內生變量的問題;在時間序列數據中,還有可能出現同期無關但異期相關的內生性問題。變量

同期內生變量問題:方法

\[{\rm Cov}(x_i,\,u_i)={\rm E}(x_iu_i)\neq0 \ . \]

同期無關,異期相關問題:im

\[{\rm Cov}(x_t,\,u_t)={\rm E}(x_tu_t)=0 \ , \]

\[{\rm Cov}(x_t,u_{t-s})={\rm E}(x_tu_{t-s})\neq0 \ . \]

所以,在時間序列模型的基本假設 TS.3 中,咱們須要對模型施加嚴格外生假設,才能保證模型不會出現內生解釋變量的問題。統計

內生性的產生緣由

創建的模型中遺漏了重要的解釋變量,而且被遺漏的解釋變量與模型中的其餘解釋變量相關:數據

例:假設真實的模型設定爲

\[\log(wage)=\beta_0+\beta_1educ+\beta_2abil+\varepsilon \ , \]

因爲 \(abil\) 不可觀測而估計的模型爲

\[\log(wage)=\beta_0+\beta_1educ+u \ , \]

其中 \(u=\beta_2abil+\varepsilon\)

此外咱們假設 \({\rm Cov}(educ,\,abil)\neq0\) ,從而 \({\rm Cov}(educ,\,u)\neq0\) ,因而形成了解釋變量的內生性問題。

解釋變量存在測量偏差:

例:假設真實的模型爲

\[y=\beta_0+\beta_1inc^*+\varepsilon \ , \]

因爲存在測量偏差而估計的模型爲

\[y=\beta_0+\beta_1inc+u \ . \]

其中 \(inc\) 是報告收入,\(inc^*\) 是真實收入,所以測量偏差爲 \(e=inc-inc^*\)

咱們將真實的模型改寫爲

\[y=\beta_0+\beta_1(inc-e)+\varepsilon=\beta_0+\beta_1inc+\varepsilon-\beta_1e \ . \]

若是報告收入 \(inc\) 與測量偏差 \(e\) 相關,就會形成內生性問題。

聯立方程模型:

  • 在一個經濟系統中,變量之間相互依存,互爲因果,而不是簡單的單向因果關係,必須用一組方程才能描述,稱爲聯繫方程模型。
  • 聯繫方程模型的每一個方程稱爲結構方程。
  • 每一個結構方程的被解釋變量是經濟系統的內生變量,而解釋變量既包括經濟系統的外生變量,也包括其餘內生變量,由經濟行爲關係決定。
  • 聯繫方程模型的每一個結構方程通常都存在內生解釋變量的問題。

(咱們在後面單獨做爲一節來詳細討論聯立方程模型)

內生性的後果

違背假設 MLR.4 ,不管樣本大小,都會形成OLS 估計量有偏非一致。不只影響內生解釋變量的參數估計,也影響其餘外生解釋變量的參數估計。

以簡單線性迴歸模型 \(y=\beta_0+\beta_1x+u\) 爲例,假設 \(x\) 是內生解釋變量:

有偏性:

\[{\rm E}(\hat\beta_1|x)=\beta_1+\frac{\displaystyle\sum_{i=1}^n(x_i-\bar{x}){\rm E}(u_i|x)}{SST_x}\neq\beta_1 \ . \]

非一致性:

\[P\lim_{n\to\infty}\hat\beta_1=\beta_1+\frac{{\rm Cov}(x,\,u)}{{\rm Var}(x)}\neq\beta_1 \ . \]

在多元線性迴歸模型中,用矩陣形式也能夠解釋:

\[\begin{aligned} {\rm E}(\hat{\boldsymbol\beta}|\boldsymbol{X})&={\rm E}\left[\left(\boldsymbol{X}^{\rm T}\boldsymbol{X}\right)^{-1}\boldsymbol{X}^{\rm T}\boldsymbol{Y}\right] \\ &={\rm E}\left[\left(\boldsymbol{X}^{\rm T}\boldsymbol{X}\right)^{-1}\boldsymbol{X}^{\rm T}\left(\boldsymbol{X}\boldsymbol{\beta}+\boldsymbol u\right)\right] \\ &=\boldsymbol\beta+{\rm E}\left[\left(\boldsymbol{X}^{\rm T}\boldsymbol{X}\right)^{-1}\boldsymbol{X}^{\rm T}\boldsymbol u\right]\\ &\neq\boldsymbol{\beta} \ . \end{aligned} \]

最後一行不等號的緣由:存在內生解釋變量,即便只有一個,也會使得 \({\rm E}\left(\boldsymbol{X}^{\rm T}\boldsymbol u\right)\neq0\)

內生性的修正措施

工具變量法

工具變量的選取

工具變量:在模型參數估計的過程當中被做爲工具使用,以替代模型中與隨機干擾項相關的內生解釋變量。注意,這裏的替代指的是矩估計中的矩條件,用工具變量 \(z\) 代替內生解釋變量,並不是是將回歸模型中的內生解釋變量所有替換。

選擇爲工具變量的變量必須知足如下條件:

假設多元迴歸模型 \(y=\beta_0+\beta_1x_1+\beta_2x_2+...+\beta_kx_k+u\) 中存在內生解釋變量 \(x_j\) ,設 \(z\) 爲內生解釋變量 \(x_j\) 的工具變量,則 \(z\) 須要知足:

(1) 相關性條件:\({\rm Cov}(z,\,x_j)\neq0\)

  • 工具變量 \(z\) 與內生解釋變量高度相關;
  • 能夠用迴歸分析的方法進行檢驗,工具變量的係數顯著,至關於兩階段法的第一階段。

(2) 排他性條件:\({\rm Cov}(z,\,u)=0\)

  • 工具變量 \(z\) 與干擾項不相關,即 \(z\) 在模型中爲外生變量,只能經過內生變量 \(x_j\) 影響 \(y\)

一元迴歸模型的 IV 估計

設一元迴歸模型以下所示,其中 \(x\) 是內生解釋變量:

\[y=\beta_0+\beta_1x+u \ . \]

\(z\)\(x\) 的工具變量,知足相關性條件和排他性條件。主要利用矩估計,咱們先對迴歸模型的兩邊同時求關於 \(z\) 的協方差:

\[{\rm Cov}(z,\,y)=\beta_1{\rm Cov}(z,\,x)+{\rm Cov}(z,\,u) \ , \]

根據相關性條件和排他性條件,寫出整體矩條件:

\[{\rm Cov}(z,\,x)\neq0\ , \ \ \ \ {\rm Cov}(z,\,u)=0 \ . \]

此時咱們稱 \(\beta_1\) 被識別了,能夠寫爲:

\[\beta_1=\frac{{\rm Cov}(z,\,y)}{{\rm Cov}(z,\,x)} \ . \]

將整體矩條件改寫爲樣本矩的形式,咱們能夠獲得 \(\beta_1\) 的 IV 估計量:

\[\hat{\beta}_1=\frac{\sum\limits_{i=1}^n(z_i-\bar z)(y_i-\bar y)}{\sum\limits_{i=1}^n(z_i-\bar z)(x_i-\bar x)} \ . \]

此時 \(\beta_0\) 的 IV 估計量爲:

\[\hat{\beta}_0=\bar y-\hat{\beta}_1\bar x \ . \]

能夠證實 IV 估計量在小樣本是有偏的估計量,可是在大樣本下是一致的估計量。

多元迴歸模型的 IV 估計

咱們用矩陣形式來解釋多元迴歸模型的工具變量法,首先寫出迴歸模型:

\[\boldsymbol{y}=\boldsymbol{x\beta}+\boldsymbol{u} \ . \]

\(x_2\) 爲內生解釋變量,咱們定義工具變量矩陣 \(\boldsymbol z\) 爲用工具變量 \(z\) 代替 \(x_2\) 以後的矩陣:

\[\boldsymbol z = \left[ \begin{array}{cccc} 1 & x_{11} & z_1 & \cdots & x_{1k} \\ 1 & x_{21} & z_2 & \cdots & x_{2k} \\ \vdots & \vdots & \vdots & \ddots & \vdots\\ 1 & x_{n1} & z_n & \cdots & x_{nk} \\ \end{array} \right] \ . \]

由整體矩條件 \({\rm E}(z_iu_i)=0\) 咱們能夠獲得樣本矩條件 \(\boldsymbol{z}^{\rm T}\boldsymbol{u}=0\) ,所以咱們在迴歸模型中左乘矩陣 \(\boldsymbol{z}^{\rm T}\)

\[\boldsymbol{z}^{\rm T}\boldsymbol{y}=\boldsymbol{z}^{\rm T}\boldsymbol x\boldsymbol\beta \ . \]

此時咱們有 \(\boldsymbol\beta\) 的 IV 估計量爲:

\[\tilde{\boldsymbol\beta}=\left(\boldsymbol{z}^{\rm T}\boldsymbol x\right)^{-1}\boldsymbol{z}^{\rm T}\boldsymbol{y} \ . \]

兩階段最小二乘法 2SLS

兩階段法適用於單個內生解釋變量,多個工具變量的情形。假設多元迴歸模型設定以下:

\[Y=\beta_0+\beta_1X_1+\cdots+\beta_kX_k+u \ , \]

假設 \(X_k\) 是內生解釋變量,其餘解釋變量均爲外生解釋變量,設 \(Z\) 是影響 \(X_k\) 且外生的工具變量。

step.1\(X_k\)\(Z,X_1,\cdots,X_{k-1}\) 作迴歸,獲得 \(X_k\) 的擬合值

\[X_k=\delta_0+\delta_1Z+\delta_2X_1+...+\delta_kX_{k-1}+v \ , \]

\[\hat{X}_k=\hat\delta_0+\hat\delta_1Z+\hat\delta_2X_1+...+\hat\delta_kX_{k-1} \ . \]

step.2\(\hat{X}_k\) 代替 \(X_k\) 進行多元迴歸:

\[Y=\beta_0+\beta_1X_1+..\beta_k\hat{X}_k+u \ . \]

若是有多個工具變量,只需在第一階段將全部工具變量放在等號右邊進行迴歸便可

此時獲得的 \(\hat\beta_k\) 被稱爲兩階段法估計量,是有偏但一致的估計量。

豪斯曼檢驗

對內生性的檢驗方法,比較經常使用的就是豪斯曼檢驗。咱們設定以下模型:

\[y_1=\beta_0+\beta_1y_2+\beta_2z_1+\beta_3z_2+u_1 \ , \]

其中咱們懷疑內生變量爲 \(y_2\),已知的外生變量爲 \(z_1\)\(z_2\),結構方程中不出現的外生變量 \(z_3\)\(z_4\)

豪斯曼建議直接比較 OLS 和 2SLS 估計值,判斷其差別是否在統計上顯著。若是全部變量都是外生的,則 OLS 和 2SLS 都是一致的。若是 2SLS 與OLS 明顯不一樣,就判定 \(y_2\) 一定是內生的。

step.1\(y_2\) 對全部外生變量回歸而估計 \(y_2\) 的約簡型方程,獲得殘差 \(\hat{\nu}_2\)

\[y_2=\pi_0+\pi_1z_1+\pi_2z_2+\pi_3z_3+\pi_4z_4+\nu_2 \ , \]

咱們認爲 \(y_2\)\(u_1\) 不相關的充要條件爲 \(\nu_2\)\(u_1\) 不相關 。

這一步起到了過濾器的做用:\(\nu_2\)\(y_2\) 中內生的部分。

step 2. 檢驗方程 \(u_1=\delta_1\nu_2+\varepsilon_1\) 中的 \(\delta_1=0\) 的假設:

\[y_1=\beta_0+\beta_1y_2+\beta_2z_1+\beta_3z_2+\delta_1\hat{\nu}_2+\varepsilon_1 \ , \]

使用 OLS 估計,根據 \(t\) 統計量檢驗 \(\delta_1=0\) 。若是 \(\delta_1\) 顯著爲 \(0\) ,則 \(y_2\) 爲同期外生變量。

聯立方程問題

英文解釋爲 Simultaneous Equations——互爲因果致使的內生性問題:

\[Y_1=\beta_0+\beta_1 Y_2+\beta_2 Z_2 +\varepsilon \ , \]

\[Y_2=\gamma_0+\gamma_1 Y_1+\gamma_2 X_2 +u \ . \]

其中 \(Z_2\)\(X_2\) 都是外生變量,\({\rm E}(\varepsilon|Z_2,\,X_2)=0\)\({\rm E}(u|Z_2,X_2)=0\) ,結構方程的因變量 \(Y_1\)\(Y_2\) 都是內生變量,有聯立方程系統(SES)決定。此時,經過 OLS 估計任何一個結構方程都得不到結構型參數的一致且無偏的估計量。

假設 \(\varepsilon\)\(u\) 相互獨立,且假設 \(\gamma_1\beta_1\neq1\) ,這意味着兩個結構方程不該該描述兩個內生變量相同的結構關係。

能夠獲得如下推論:

  • \(\gamma_1\neq0\) ,則有 \({\rm E}(\varepsilon|Y_2)\neq0\ \text{or} \ \text{constant}\) .
  • \(\beta_1\neq0\) ,則有 \({\rm E}(u|Y_1)\neq0\ \text{or} \ \text{constant}\) .

推論的證實以下:

\(Y_1\) 代入到 \(Y_2\) 的結構方程中,

\[Y_2=\gamma_0+\gamma_1(\beta_0+\beta_1Y_2+\beta_2Z_2+\varepsilon)+\gamma_2X_2+u \ , \]

求解 \(Y_2\) 獲得:

\[Y_2=\frac{\gamma_0+\gamma_1\beta_0}{1-\gamma_1\beta_1}+\frac{\gamma_1\beta_2}{1-\gamma_1\beta_1}Z_2+\frac{\gamma_2}{1-\gamma_1\beta_1}X_2+\frac{\gamma_1\varepsilon}{1-\gamma_1\beta_1}+\frac{u}{1-\gamma_1\beta_1} \ , \]

所以有

\[{\rm E}(Y_2\varepsilon)=\frac{{\rm E}(\gamma_1\varepsilon^2)}{1-\gamma_1\beta_1}=\frac{\gamma_1\sigma_\varepsilon^2}{1-\gamma_1\beta_1}\neq0\ . \]

同理能夠求解 \(Y_1\) 獲得

\[Y_1=\frac{\beta_0+\beta_1\gamma_0}{1-\gamma_1\beta_1}+\frac{\gamma_2\beta_1}{1-\gamma_1\beta_1}Z_2+\frac{\beta_2}{1-\gamma_1\beta_1}X_2+\frac{\beta_1u}{1-\gamma_1\beta_1}+\frac{\varepsilon}{1-\gamma_1\beta_1} \ , \]

\[{\rm E}(Y_1u)=\frac{{\rm E}(\beta_1u^2)}{1-\gamma_1\beta_1}=\frac{\beta_1\sigma_u^2}{1-\gamma_1\beta_1}\neq0 \ . \]

求解 \(Y_1\)\(Y_2\) 以後的方程被稱爲約簡型方程,須要注意如下兩點:

  • 約簡型方程是關於外生解釋變量的方程;
  • 約簡型方程沒有經濟學解釋。

在當前的模型設定下,\(X_2\) 能夠做爲 \(Y_2\) 的工具變量, \(Z_2\) 能夠做爲 \(Y_1\) 的工具變量。

相關文章
相關標籤/搜索