多期三重差分法和雙重差分法的操做指南

多期三重差分法和雙重差分法的操做指南

歡迎投稿(薦稿)計量經濟圈,計量相關都行數據結構

郵箱:econometrics666@sina.cnide

copyrights@計量經濟圈因果推斷研究小組, 歡迎加入交流學習, 值得青睞的博士研究羣體組織。工具

多期三重差分法和雙重差分法的操做指南

謝謝計量經濟圈社羣的這些話,來者都是緣分,咱們是互相須要的你們庭。
多期三重差分法和雙重差分法的操做指南學習

多期雙重差分法建議使用Pooled OLSui

咱們在上一篇文章裏(多期雙重差分法,政策實施時間不一樣的處理方法)講了,凡是對於政策實施時間不一致的狀況,咱們能夠考慮「多期雙重差分方法」。在那個DID模型裏,只存在DID=treated*time這個交互項了,並且咱們建議最好使用pooled最小二乘法來計算,即咱們使用reg而不是xtreg,由於咱們政策在各個地區實施的時間跨度很大,致使咱們有些用來估計DID交互項的觀測變量就不夠了。好比,上海建地鐵比較早,而長沙建地鐵比較晚,可咱們原本能蒐集到的數據就只有2007-2016這麼十年。如今若長沙是在2015年建地鐵,那麼他就只會在2015-2016這二年裏是處於treated(=1),而你xtreg須要進行組內估計,那就顯得處於1的觀測值太少了點。所以,咱們能夠把panel data這個數據結構給忽略了,直接使用相似於repeated cross section數據結構來估計DID。3d

多期三重差分法和雙重差分法的操做指南
quietly: reg y αt βi Xit BC*After , cl(id) // 沒有加協變量blog

quietly: reg y αt βi Xit BC*After Covariates , cl(id) // 加了協變量it

quietly: areg y αt βi Xit BC*After Covariates iother, a(id) cl(id) //arg: linear regression with a large dummy-variable setio

*DID交互項其餘變量能夠識別影響機制 **class

咱們上篇文章想要考察地鐵修建對城市環境污染的影響。如今,咱們能夠看看修建地鐵是不是經過影響小轎車(Car)、公共汽車(Bus)和摩托車(Motor)等三種出行方式的選擇而間接影響了城市環境污染,由於這三種方式都會形成空氣污染。此使,咱們只須要把這個城市的小轎車、公共汽車和摩托車的數量(2007-2016的時間序列)與以前的DID交互項BC*After再次交叉相乘,而且再分別把Car, Bus和Motor的數量放在迴歸方程中就能夠識別這種機制了。仔細看看下面的迴歸程序,是否是有點像DDD三重差分方法的表達式(咱們會講一講DDD)。

quietly: areg y αt βi Xit BCAfter BCAfter*Car Car Covariates i.year, a(id) cl(id)

quietly: areg y αt βi Xit BCAfter BCAfter*Bus Bus Covariates i.year, a(id) cl(id)

quietly: areg y αt βi Xit BCAfter BCAfter*Motor Motor Covariates i.year, a(id) cl(id)

注意:genicv z = BC After // 能夠自用用來產生交互項

插一句話:你若是還以爲DID也不能解決一些內生性問題,那你可使用工具變量來進行穩健性檢驗:

qui:areg y BC Covariates i.year, a(id) cl(id)

est store a

qui: xi: ivregress 2sls y BC Covariates i.year (BC = Z1 Z2)

estat overid //過渡識別檢驗看看選取的工具變量是否是外生的

est store b

hausman a b, constant sigmamore // 用hausman檢驗工具變量是否是更有效率

再稍微通俗地講解一下DDD三重差分的思路

咱們如今想要研究香港推行的針對60歲以上的老年人的醫保政策,假定該政策生效日期是2008年,那麼咱們想要知道是否這個醫保政策促進了香港老年人的健康?每當看到這個的時,候咱們首先須要問本身,這裏面出現了幾個有效信息。

從這個描述來看,咱們可以獲得三個有效信息:第一,該政策是在香港實行,第二,該政策是針對60歲以上老年人,第三,該政策生效日期是2008年。若是你發現有三個有效信息,通常而言,咱們最好採用DDD三重差分法來更好地估計該醫保政策的效果。標準的DID雙重差分法,其實是提供了兩個有效信息:香港和2008,即在2008年香港執行該項醫保政策,如今的狀況是三個有效信息。

咱們推演一下,爲何此處最好使用三重差分法來得到政策效應。若是不考慮其餘沒有執行該項政策的內陸省份的狀況,直接用2008年以後香港60歲以上的老年人健康情況與2008年以前的香港60歲以上的老年人健康情況,那誰知道健康情況的變化是否是由於金融危機形成的,因此這裏面的混淆因素就理不清楚了。這就是爲何咱們須要把其餘沒有執行該醫保政策的內陸省份包括進來做爲控制組,來控制這些大環境因素形成的健康情況變化。

另外,若是直接用香港60歲以上老年人羣體的健康情況(處理組)減去60歲如下中年人羣體的健康情況(控制組),那有什麼大的問題呢?咱們壓根分不清這個處理組與控制組健康情況差別究竟是不是因爲這個醫保政策形成的,畢竟老年人和中年人羣體的健康情況原本就存在系統性的差別。

標準的三重差分就像下面這個式子所展現的那樣,他的變異形式就比較廣了,只要有三個交互項的乘積在裏面(DID*其餘任何一個變量),那他就能夠叫作三重差分。

多期三重差分法和雙重差分法的操做指南

相關文章
相關標籤/搜索