本文在MIT在線課程《3.Data Analysis for Social Scientists》中Causality(因果關係)部分課程的課件基礎上,補充了相關信息、增長了我的理解,詳細介紹了因果關係的本質及其實踐。面試
本篇是四篇系列文章的第一篇,主要解讀因果關係定義與潛在結果分析框架。網絡
咱們常常作出的因果陳述(Causal Statements),好比:
app
▫ 由於她吃了藥,因此她頭疼好多了框架
▫ 由於她上了MIT,因此她找到了好工做dom
▫ 由於她是非裔美國人,因此她沒有得到面試機會大數據
這些因果陳述到底想表達什麼意思呢?這些陳述中暗含着一個反事實(counterfactual)的世界(相似平行宇宙的想法)。不一樣的行爲發生了,對應上面三個例子:編碼
▫ (反事實)她沒有吃藥設計
▫ (反事實)她沒有上MIT,她可能作了其它事情(可作了什麼在陳述中並無明確指出)cdn
▫ (反事實)這裏意思不徹底清楚,是改變的她的種族?仍是改變人們在作聘用決定時關於種族的見解?blog
整體來講,當咱們思考因果關係時,咱們考慮的是操做(干預)一個「因」的可能效果,假如咱們干預或不干預這個「因」,而後什麼會發生。
在經濟和社會科學領域,許多咱們想回答的問題是因果問題:移民是否下降了本地工人的工資?貿易是否增長了不平等?在美國和墨西哥之間創建隔離牆是否能阻止移民?因此在社會科學領域的許多數據科學目標是回答「因」與「果」的問題。
可是,針對一些重要但非因果問題時,因果分析沒什麼用。例如,咱們可能感興趣識別在學校兒童存在危險的早期預兆信號,這樣咱們能夠集中努力解決它們。谷歌會但願基於人們的搜索模式預測他們對什麼東西感興趣,從而向他們提供他們更可能感興趣的廣告。此時更關注的是相關關係。
統計學分析因果關係使用了因果推斷(Causal Inference),提到推斷就涉及證實問題,有學者認爲統計學不能被「證實」因果,只有「相關」是能夠被證實。
有一個頗有名的例子,叫作 Yule-Simpson’s Paradox。有文獻稱,Karl Pearson 很早就發現了這個悖論——也許這正是他反對統計因果推斷的緣由。此悖論代表,存在以下的可能性:X和Y在邊緣上正相關(處理效果爲正),可是給定另一個變量Z後,在Z的每個取值上,X和Y都負相關。下表是一個數值的例子,處理對整我的羣有 「正做用」,奇怪的是,處理對男性有 「負做用」,對女性也有 「負做用」。一個處理對男性和女性都有 「負做用」,可是他對整我的羣卻有 「正做用」:悖論產生了!
上面的例子是人工構造的,在現實中,也存在很多的實例正是 Yule-Simpson’s Paradox。好比,UC Berkeley 的著名統計學家 Peter Bickel 教授 1975 年在 Science 上發表文章,報告了 Berkeley 研究生院男女錄取率的差別。他發現,整體上,男性的錄取率高於女性,然而按照專業分層後,女性的錄取率卻高於男性(Bickel 等 1975)。
在統計上,這具備重要的意義—變量之間的相關關係能夠徹底的被第三個變量 「扭曲」。更嚴重的問題是,咱們的收集的數據可能存在侷限性,忽略潛在的「第三個變量」 可能改變已有的結論,而咱們經常卻一無所知,雖然對已知的能夠經過實驗設計以免。鑑於 Yule-Simpson 悖論的潛在可能,很多人認爲,統計不可能用來研究因果關係。
在作因果關係研究時,常常用到假設檢驗、P值以及推導出的統計學意義。通常認爲P≤0.05或者P≤0.01就有顯著性差別,研究就有統計意義。但,最新一期2019年3月份的Nature雜誌發表了三位統計學家的一封公開信,他們號召科學家放棄追求「統計學意義」,而且中止用統計學中常見的P值做爲判斷標準。統計學上無顯著的結果並不能「證實」零假設;統計上顯著的結果也沒有「證實」某些其餘假設。標題猶如戰鬥檄文同樣使人振奮。在文章發出不到24小時,就有250多人簽名支持,一週以內吸引了超過800名研究人員共同反對。
文中總結並非要拋棄P值與相關的統計方法,而是要完全理解統計因果分析的內涵,從而在證實因果方面的保持謹慎。研究人員能夠從教育本身對統計的誤解開始,最重要的是在每項研究中從多個角度考慮不肯定性。
在大數據時代,以前你們過於關注易於被證實的相關關係而忽略了因果,關於因果關係和相關關係的討論,業內已經進行好久,可是因果對於洞察和預測的價值更大,如今在大數據領域,對於因果應該被從新重視起來,瞭解因果分析對你們正確理解各類研究結果與數據分析也很是有幫助。
潛在結果框架(Potential Outcome Framework)這個模型由哈佛統計學家Donald Rubin提出。在思考隨機對照試驗(Randomized Controlled Trials, RCT)和更通常的因果關係時很是有用。這不是在社會科學中思考因果關係的惟一(或最廣泛的)方式,在社會科學中SEM(結構方程模型Structural Equation Modeling)更廣泛。可是潛在結果框架愈來愈普及,而且越熟悉它,越能在二者之間切換。
潛在結果框架又稱爲Rubin因果模型(Rubin causal model, RCM)或者Neyman–Rubin因果模型。
(參考:https://en.wikipedia.org/wiki/Rubin_causal_model)
Rubin Causal Model分析框架有三個基本的要素:
潛在結果(Potential Outcome)
個體處理穩定性假設(Stable Unit Treatment Value Assumption,SUTVA)
分配機制(Assignment Mechanism)。
(參考: https://zhuanlan.zhihu.com/p/33299957)
0一、潛在結果
潛在結果:給定一個單元,和一系列動做,咱們把一個「動做-單元」肯定爲一個潛在結果。「潛在(potential)」這個詞表達的意思是咱們並不老是能在現實中觀察到這個結果(outcome),但原則上它們可能發生。
考慮「潛在結果」這個術語迫使我思考「反事實」(counterfactual),由於咱們想知道在那個空間(Space)定義潛在的結果,從而幫助咱們提出良好定義的因果問題,或判斷怎樣纔是良好定義的因果問題。針對開頭的三個因果關係陳述的例子:
第一個例子是個比較相對清晰的例子:吃了藥對應的反事實是沒吃藥,有時咱們把「沒吃藥」做爲「控制組」而且把「吃了藥(control group)」做爲「實驗組(treatment group)」;
第二個例子相對有一點不清楚:她不去大學的替代選擇是什麼呢?
第三個例子更不清楚:若是她是另外一個種族什麼會發生,那是什麼呢?有哪些不一樣的方式?
在下一個單元介紹隨機對照試驗(RCT)設計時會第二和第三例子如何定義更易於實驗的潛在結果與具體的RCT設計。
0二、因果效應的定義
對於任何一個單元,「處理(treatment)」與「不處理(without treatment)」這兩個潛在結果之間的差異就是處理的因果效用(Causal Effect),或者說處理效果(Treatment Effect)。
因果效應定義爲:(處理)-(不處理),表達式中括弧內的是干預動做,Y表示這個動做的效果。
頭疼的例子中存在四種可能性(possibilities):(下面表達式中括弧內的是干預動做,Y表示這個動做的效果,等號後面爲效果的值)
Y(吃了阿司匹林)=不頭疼;Y(沒吃阿司匹林)=頭疼
Y(吃了阿司匹林)=頭疼;Y(沒吃阿司匹林)=頭疼
Y(吃了阿司匹林)=不頭疼;Y(沒吃阿司匹林)=不頭疼
Y(吃了阿司匹林)=頭疼;Y(沒吃阿司匹林)=不一樣頭疼
對應的治療效果是:
使頭疼消失了(即有效,證實因果關係陳述成立)
沒有效果
沒有效果
阻止頭疼消失(反效果、負效果,雖然不常見但原則上存在這種可能性)
0三、因果推斷的基礎問題
「因果推斷的基礎問題」(Holland, 1986)是對於同一個單元最多隻有一個潛在結果被實現而能被觀測到,總有一個缺失值。因果效應(Causal Effect)是在同一個時間(處理後)對同一個單元的對比,處理效果(Treatment Effect)的計算依賴於全部的潛在結果(Potential Outcomes)而不只僅依賴於實際觀測到的結果。
所以,對於處理效果的估計(Estimation),將來對咱們觀測到的結果進行對比,咱們將須要許多個單元的數據。(在這個討論中對同一我的不一樣時間的兩次不一樣測量是兩個不一樣的單元)
瞭解(或假設)一些潛在結果(而不是其它的結果)被實現的方式是很是關鍵的,這個方式會在下一單位分配機制中立刻就會被討論。
0一、引入多個單元后存在的問題
當考慮多於一個單元時,事情會很快變得複雜。假設Esther和David都在一個辦公室,而且都在爲這門課準備教案。兩我的可能同時頭疼,而且兩個均可以選擇吃(或不吃)阿司匹林。如今每一個人都有四種潛在結果:
Y(EA, DN), Y(EA,DA), Y(EN, DN), Y(EN, DA)。
(E指Esther,D指David,A指吃阿司匹林,N指不吃阿司匹林)
在這種情形下,就有種不一樣的比較,針對以上四種潛在結果的兩兩比較。當咱們添加更多的單元時,咱們就添加了更多的潛在比較:咱們將永遠不會得到足夠的數據去估計咱們想要的東西。
Esther與David各有四種潛在結果和6種比較,兩我的須要被分別編碼,這裏Y只是關於一我的的,好比Esther,也就是說會有一個表達式(好比Z替換Y)是關於David的。
爲何是四種潛在結果?爲何兩我的的行爲要一塊兒考察呢?是由於二者的行爲存在可能的相互影響。同時這個影響因素不只僅是由於治療效果,若是僅僅由於治療效果影響另外一我的是否採起吃藥的行動,那就能夠減小(狀態的)維度了,只進行Esther是否吃藥的比較就能夠了。影響的因素多是,David說「對不起,我頭疼作不了教案了」,那麼我(Esther)要作更多的工做因此我就頭疼了;或者,他(David)說他頭疼,他抱怨,因而就讓我頭疼了。
「咱們將永遠不會得到足夠的數據去估計咱們想要的東西」,這裏表達是當引入更多單元后狀況變得更糟糕了。具體是,當只有(Esther)一我的時,只須要進行一我的兩個潛在結果(吃藥與不吃藥)的一個比較,並能夠觀測到一個數據點(一我的的一個實現),狀況就是有1個數據點的1個比較,固然數據也是不夠的;當增長另一我的後,就須要進行4個潛在結果的6種比較,實際能夠觀測到兩個數據點(兩我的的各一個實現),因此狀況變成是有2個數據點的6種比較,數據就更不夠了,引入更多單元后狀況沒有改善。咱們須要解決這個問題,咱們解決這個問題的方式是用一個假設(SUTVA)。
0二、個體處理穩定性假設
也許在頭疼例子中天然的假設是:David的頭疼不影響Esther,因此天然的假設是:任何單元的潛在結果(potential outcomes)不會隨分配給其它單元的處理(treatment)而變化; 而且,對於每一個單元,沒有致使不一樣(潛在)結果的一個處理單元的不一樣形式或版本,即個體處理穩定性假設(Stable Unit Treatment Value Assumption, SUTVA)。
具體就是,首先,排除(在經濟學中被稱爲的)外部效應或溢出效應,即該效應一我的的處理(treatment)狀態直接影響另外一我的;其次,處理(treatment)被良好的定義,反事實(counterfactual)被良好的定義,例如種族的例子就不符合。若是處理A有三種形式,那麼處理(treatment)應該被從新定義爲A、B、C三種處理而不是一種。
注:SUTVA超出了獨立的概念。
https://en.wikipedia.org/wiki/Rubin_causal_model#Stable_unit_treatment_value_assumption_(SUTVA)
從如今開始假設SUTVA成立。那麼阿司匹林的例子對David和Esther就簡化爲兩種狀況:每一個人吃或不吃阿司匹林與另外一我的作什麼是不相關的。這個能夠擴展到多個單元,從而能夠作下面的定義:
假設有一我的羣,人數爲N,被編號爲i,取值1~N;
Wi表明第i我的被處理(treatment)仍是不處理(without treatment),值爲1表示被處理,值爲0表示不處理;
Yi表明第i我的的效果,上標obs表示實際被觀察到,上標miss表示實際沒有被觀察到;
那麼第i我的的效果存在下面四種可能:
同時,依定義對於第i我的因果效應爲:
若是他在被處理組(treatment),Wi = 1,那麼他這個個體不被處理狀況的效果不會被觀察到,即數據缺失;反之,若是他在不處理組(controled),Wi = 0,那麼他這個個體被處理狀況的效果不會被觀察到,即數據缺失;因此對於單個個體的因果效應定義中總有一項數據會缺失,也就是同一我的只有一種狀況被觀察到。
缺乏數據的問題:咱們只觀察到,因此咱們不能對一我的計算他的處理效果(treatment effect),咱們須要設法從咱們觀測到的數據中推斷關於的一些信息,可是爲了作到這一點,瞭解分配機制的原理是很是必要的,即爲何一些人被處理而另外一些人沒有?
下篇預告:
在下一個單元中,首先將詳細介紹如何基於觀察數據構建處理效應估計以及估計中存在的選擇性誤差原理,而後介紹如何經過隨機化解決選擇性問題以及RCT類型,並進一步說明本單元開頭三個例子的RCT具體如何進行設計。
參考資料彙總:
[1]https://prod-edxapp.edx-cdn.org/assets/courseware/v1/6b6442916a97d7afc3e9f40801085486/asset-v1:MITx+14.310x+1T2019+type@asset+block/14310x_Lecture14_New_ToUpload.pdf
[2] https://en.wikipedia.org/wiki/Rubin_causal_model
[3] https://en.wikipedia.org/wiki/Rubin_causal_model#Stable_unit_treatment_value_assumption_(SUTVA)
[4] 因果推斷,選擇偏誤與隨機試驗https://zhuanlan.zhihu.com/p/33299957
[5] 因果推斷簡介https://cosx.org/2012/03/causality1-simpson-paradox/
[6] 大學統計學白上了?800多科學家聯名反對「統計學意義」,P值該廢了
https://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA%3D%3D&chksm=f1219b03c65612150ff28a7564a8a0e738e93aea401a02858feac8e0fe0d035cb6aed52b607c&idx=2&mid=2652041202&scene=0&sn=e077f6cfa985caab7e99ebab4a15113a&xtrack=1#rd
[7]https://www.nature.com/articles/d41586-019-00857-9?from=singlemessage&isappinstalled=0#ref-CR4
注:封面圖來源於網絡,若有侵權,請聯繫刪除